• Nenhum resultado encontrado

Gerenciamento de Incidente

No documento Gerenciamento de Serviços de TI (páginas 174-181)

Um Gerenciamento de Serviços de TI está orientado para a entrega de níveis de serviços com qualidade e com a rapidez que o negócio exige. Para tanto é necessário um processo de tratamento de incidentes eficaz e eficiente, capaz de monitorar os níveis de serviços, esca- lando os incidentes quando necessário.

Este é um dos processos mais reativos, pois entrará em atuação a partir dos incidentes levantados por usuários ou ferramentas de monitoramento. Entretanto, este processo é

Ca pí tu lo 5 - O pe ra çã o d e S er vi ço

Objetivo

O processo de Gerenciamento de Incidente tem como missão restaurar os serviços o mais rápido possível com o mínimo de interrupção, minimizando os impactos negativos nas áreas de negócio.

O Processo de Gerenciamento de Incidente tem como objetivos:

q

1Resolver os incidentes o mais rápido possível, restabelecendo o serviço normal dentro do prazo acordado no Acordo de Nível de Serviço (ANS).

1Manter a comunicação do status dos incidentes com os usuários.

1Escalonar os incidentes para os grupos de atendimento para que o prazo de resolução seja cumprido.

1Fazer avaliação dos incidentes e das possíveis causas informando ao processo de Gerenciamento de Problema.

1O Gerenciamento de Incidente não é responsável por fazer o diagnóstico

identificando a causa raiz, apenas auxilia o processo de Gerenciamento de Problema, que tem este foco.

O escopo do Gerenciamento de Incidente é amplo e pode incluir aspectos que afetam os serviços, como:

1Falha de hardware;

1Erro de software;

1Solicitações de informações;

1Solicitação de mudança de equipamento;

1Troca de senha;

1Inserção de novos funcionários;

1Solicitação de suprimentos;

1Problemas de desempenho.

Descrição do processo

Como em todo processo, existem entradas e saídas. A entrada principal deste processo são os incidentes. Os incidentes podem vir de diversas fontes, como usuários, equipes de opera- ções, redes ou ferramentas de monitoramento que identificam irregularidades nos serviços. Soluções de contornos podem ser buscadas a partir de uma base de erros conhecidos, ajudando a resolver o incidente mais rápido. A Base de Dados do Gerenciamento da Confi- guração (BDGC) auxiliará na identificação do item de configuração relacionado ao incidente, incidentes anteriores, mudanças já registradas, problemas abertos e o possível impacto e itens relacionados ao incidente. Determinadas solicitações de usuários podem necessitar de um Registro de Mudança, como por exemplo uma nova regra de negócio ou instalação de um novo componente.

d e S er vi ço s d e T I

A figura abaixo mostra as principais entradas e saídas deste processo:

Procedimentos de Requisição de Serviço

Soluções

de contorno Banco de dadosde erros conhecidos

RDM Gerenciamentode Mudança BDGC Central de Serviços Operação Redes Outros Configurações Incidentes Gerenciamento de Incidente Detecção e registro de incidentes Classificação e suporte inicial Diagnóstico e resolução Recuperação Encerramento Propriedade, monitoração, acompanhamento e comunicação Regras de suporte

O primeiro nível de suporte será feito pela Central de Serviço e inclui registro, classificação, roteamento, resolução e fechamento dos incidentes.

O segundo e terceiro nível de suporte são responsáveis pela investigação, diagnóstico e recuperação dos incidentes. Os grupos de segundo nível terão conhecimento técnico mais profundo sobre o assunto, como programadores, consultores, analistas de negócio, administradores de rede. O grupo de terceiro nível poderá ser formado pelos fornecedores de software ou hardware. Obviamente estes níveis podem variar dependendo do tamanho do departamento de TI.

Detecção e

Registro Requisiçãode Serviço? Suporteinicial Resolvido?

Resolvido? Investigação Diagnóstico Resolução Recuperação Resolução Recuperação Fechamento do Incidente Procedimento de Requisição de Serviço Primeiro Nível Segundo Nível Não Sim Sim Não Sim Não Figura 5.2 Macro processo de Gerenciamento de Incidente. Figura 5.3 Fluxo de atendi- mento nos diversos níveis.

Ca pí tu lo 5 - O pe ra çã o d e S er vi ço

Diferentes tipos de escalonamento

Os incidentes podem ter dois tipos de escalonamento: funcional ou hierárquico. No funcio- nal os incidentes são escalonados para grupos com conhecimentos mais específicos sobre o assunto. No hierárquico o incidente pode ser escalonado para um chefe ou gerente da Central de Serviço, quando a situação exigir aprovação de custos ou maior poder de decisão.

Diretor

Gerente 1 Gerente 2

Desktop Aplicações Operações Rede

Atividades

As atividades do Gerenciamento de Incidente incluem:

q

1Detecção de incidentes e registro

2Registro dos incidentes por diversos meios, tanto para a solução do incidente como para identificação de problemas e extração de informações gerenciais.

1Classificação e suporte inicial

2Permite a identificação de erros conhecidos e gere informações gerenciais que permitam a identificação dos tipos de incidentes. Determinar o impacto e urgência de cada incidente para definir

sua prioridade.

1Investigação e diagnóstico

2Os níveis 2 e 3 investigam o incidente utilizando especialistas e ferramental adequado. Todas as ações devem ser registradas.

1Resolução e restauração

2Uma vez que uma solução de contorno ou definitiva para o incidente é encontrada, será implementada.

1Fechamento do incidente

2Atualização dos detalhes do incidente e comunicação ao usuário sobre a solução.

1Responsabilidade pelo incidente, monitoração, acompanhamento e comunicação

2É importante que durante todo o ciclo de vida do incidente a Central de Serviço permaneça proprietária do incidente, sendo responsável pelo seu fechamento.

Figura 5.4 Hierarquia de escalonamento.

e S er vi ço s d e T I

O diagrama abaixo mostra as atividades durante o processo de Gerenciamento de Incidente.

Sim Procedimento de requisição de serviço Não D el eg ar , M on ito ra r, Ac om pa nh ar , C om un ic ar Detecção e registro do incidente Classificação e suporte inicial RDS? Investigação e diagnóstico Solução e restauração Fechamento do incidente

Detecção de incidentes e registro

Os incidentes na maioria das vezes são oriundos de necessidades de suporte dos usuários. O contato com a Central de Serviço poderá acontecer por telefone ou e-mail. Atualmente a maioria das empresas está adotando sistemas web que permitem que o usuário abra um chamado de suporte diretamente da intranet ou website, criando menos gargalo para a central, e facilitando também a vida dos analistas de suporte, que ganham mais tempo para resolver os incidentes, ao invés de gastar o tempo no registro do chamado por telefone. É importante que todos os incidentes sejam registrados, mesmo que resolvidos por telefone. O histórico de incidentes registrados ajudará no processo de identificação de tendências de problemas e também para a extração de informações gerenciais úteis.

Classificação e suporte inicial

Os incidentes devem ser classificados para permitir a identificação de erros conhecidos e gerar informações gerenciais para identificação dos tipos de incidentes mais frequentes.

Exemplos de classificação de incidentes:

1Software: Microsoft Office;

1Hardware: CD ROM e impressoras.

É importante determinar o impacto e a urgência de cada incidente para definir a sua prioridade. A prioridade determina a ordem de execução para a resolução dos incidentes. Para determinar a prioridade, utilize como boa prática a combinação entre impacto e urgência do incidente. O impacto está na avaliação do número de pessoas ou sistemas que serão prejudicados pelo inci- dente. Já a urgência determina a velocidade com que o incidente precisa ser resolvido.

Figura 5.5 Atividades de Gerenciamento de Incidente.

Ca pí tu lo 5 - O pe ra çã o d e S er vi ço Impacto

Criticidade para o negócio

Alto Médio Baixo

Urgência Velocidade

Alta 1 2 3

Média 2 3 4

Baixa 3 4 5

A prioridade poderá ser utilizada para determinar o prazo para resolução dos incidentes.

Prioridade Descrição Tempo para

atendimento 1 Crítica 1 hora 2 Alta 4 horas 3 Média 24 horas 4 Baixa 48 horas 5 Planejada - Investigação e Diagnóstico

Uma vez registrado o incidente, a atividade de investigação e de diagnóstico será iniciada. Se a Central de Serviço não puder resolver um incidente, ele será atribuído a outros níveis de suporte, que investigarão o incidente através de um conjunto de habilidades e ferramentas disponíveis, como uma base de conhecimento de erros conhecidos. É importante que todas as partes que trabalham com os incidentes mantenham o registro de suas ações, atuali- zando o registro do incidente.

Resolução e Restauração

Uma vez que uma solução de contorno ou definitiva para o incidente é encontrada, será implementada. Se uma mudança for necessária, uma Requisição de Mudança (RMD) será submetida ao Gerenciamento de Mudança.

Fechamento do Incidente

A etapa de fechamento do incidente inclui:

1Atualização dos detalhes do incidente;

1Comunicação ao usuário sobre a solução.

Responsabilidade pelo incidente, monitoração, acompanhamento e comunicação

É importante que durante todo o ciclo de vida do incidente a Central de Serviço permaneça proprietária do incidente, sendo responsável pelo seu fechamento. Desta forma, teremos um comprometimento maior da Central de Serviço com o cumprimento dos prazos, esca- lando o incidente para o grupo disponível quando necessário. Sendo assim, sempre que o usuário entrar em contato com a Central de Serviço, terá uma pronta resposta sobre a situ- ação de suas chamadas. Não é conveniente que os usuários tenham contato direto com os solucionadores finais do incidente, porque isto fará com que os usuários comecem a entrar em contato diretamente com eles.

Figura 5.6 Mapa de urgência e impacto de incidentes. Figura 5.7 Priorização de incidentes.

e S er vi ço s d e T I

Funcional

O Gerente de Incidente deve:

q

1Buscar a eficiência e eficácia do processo.

1Produzir informações gerenciais, como relatórios de atendimento e de tipos de incidentes.

1Gerenciar o trabalho das equipes de suporte de primeiro e segundo níveis.

1Gerenciar os incidentes graves.

1Desenvolver e manter processo e procedimento.

Relacionamentos

O Gerenciamento de Incidente tem um relacionamento muito próximo com outros processos da ITIL. Alguns destes relacionamentos são descritos aqui.

q

1Gerenciamento da Configuração

1Gerenciamento de Problema

1Gerenciamento de Mudança

Gerenciamento da Configuração

Cada incidente está conectado com um Item de Configuração (IC) armazenado no BDGC. Um incidente tipicamente envolverá mais de um IC.

O BDGC fornece informações sobre os ICs e os relacionamentos de dependência entre eles. Isto ajuda a determinar a causa, a solução e o roteamento de um incidente, rastreando as falhas anteriores ao mesmo IC. Por exemplo, se um usuário não puder acessar a internet, verificando os relacionamentos de dependência daquele computador, descobrirá que um hub utilizado pelo usuário para se conectar à rede é um IC potencial que deve ser investigado.

Gerenciamento de Problema

Os incidentes com causa não conhecida são roteados para o Gerenciamento de Problema, onde serão processados. Erros conhecidos, soluções de contorno e reparos rápidos (quick fixes) são fornecidos ao Gerenciamento de Incidente pelo Gerenciamento de Problema.

Gerenciamento de Mudança

Este processo pode ser a causa dos incidentes se uma mudança não foi executada corretamente. Consequentemente é muito importante que o Gerenciamento de Incidente saiba de todas as mudanças planejadas, para assim poder relacionar os incidentes a uma mudança e notificar o processo de Gerenciamento de Mudança para que o processo de retrocesso (back out) seja execu- tado. De outra forma, alguns incidentes serão resolvidos por meio de uma mudança, como no caso de um equipamento defeituoso ser substituído.

Benefícios

Ca pí tu lo 5 - O pe ra çã o d e S er vi ço

q

1O BDGC será mais preciso e a cada incidente serão verificados os dados dos itens de configuração relacionados.

1Exportação de dados para o Gerenciamento de Problema.

1Melhora da satisfação do usuário.

1Menos interrupção da equipe de suporte.

Problemas comuns

Os problemas mais comuns na execução deste processo se relacionam com:

q

1A necessidade de aquisição de um software que possa auxiliar no registro de informações de incidentes. É inviável registrar os incidentes em papel ou em planilhas.

1Um sistema de BDGC precisa ser criado antes do Gerenciamento de Incidente ser implementado.

1Uma base de conhecimento para armazenar erros conhecidos, soluções de contorno e resoluções.

1Conhecimento pela equipe da Central de Serviço suficiente para dar o suporte inicial, não sobrecarregando os níveis de atendimento mais técnicos.

1Hierarquização organizacional, fazendo com que o Gerente da Central de Serviço possa coordenar todos os níveis de suporte, exigindo o cumprimento dos prazos estabelecidos nos ANSs.

Indicadores de desempenho

Todo processo deve ter uma forma de avaliação da sua performance. Na ITIL são sugeridos vários indicadores, entre os principais estão:

q

1Número total de incidentes, por área de negócio, departamento, natureza etc.

1Tempo médio entre falhas (MTBF).

1Tempo médio para reparo (MTTR).

1Número de incidentes resolvidos por operador.

1Redução do tempo médio de solução.

1Distribuição de solução entre os níveis de suporte.

1Porcentagem de incidentes resolvidos com a Base de Conhecimento.

No documento Gerenciamento de Serviços de TI (páginas 174-181)