cortesia de
F5 NETWORKS
Novas Tecnologias Para Recuperação de Desastres/Continuidade dos Negócios
visão
geral
Metas de Tempo de Recuperação e de Ponto de Recuperação
O Que É Preciso Saber
Meta de Tempo de Recuperação
Custo
($$$)
Continuidade dos Negócios,
Recuperação de Desastres e
Consolidação do Data Center
Hoje em dia, os gerentes de TI precisam
estar prontos para o inesperado,
especialmente considerando-se as novas
normas setoriais e governamentais de
proteção de dados e de recuperação de
desastres. Claro que há algum tempo, já
se vêem iniciativas para recuperação de
desastres; porém, várias tecnologias
novas que apareceram recentemente
estão mudando nosso modo de pensar o
planejamento da recuperação desses
desastres e da continuidade dos
negócios. Essas tecnologias têm como
foco a otimização da WAN, o
redirecionamento do tráfego, a replicação
de dados e o acesso remoto seguro.
Juntas, elas representam uma nova
metodologia para as organizações
buscarem consolidar custos e
equipamentos, reduzir o tempo de
gerenciamento e assegurar que as
aplicações estejam sempre disponíveis
quando acontecer um desastre.
A meta de tempo de recuperação (RTO, sigla em inglês) é o tempo máximo permitido de paralisação para a restauração de sistemas, aplicações e funções (veja a Figura 1). A RTO fornece a base para o desenvolvimento de estratégias de recuperação economicamente eficazes e para determinar quando e como implementar essas estratégias de recuperação durante uma situação de desastre.
Tradicionalmente, quanto mais rápido querer os dados de volta, mais terá de pagar.
Seqüência dos Serviços de Recuperação de Dados
Fonte: Network World, The New Face of Disaster Recovery (A nova face da recuperação de desastres), 8 de maio de 2006.
As soluções da F5 tornam econômicas as proteções mais rápidas Replicação Sincrônica Armazenamento Externo Back-up em Fita Back-up em Disco Proteção do Servidor de Arquivo
Imagens Proteção Contínua de Dados
Espelhamento
Minutos a Segundos Dias a Horas Horas a Minutos
Raio de Desastre
FIGURA 2
O Raio do Desastre de um Data Center
Local da RD Regional Data Center Secundário Metropolitano < 50 km Data Center Primário Local 1-2 km Data Center Primário Campus
Seqüência dos Serviços de Recuperação de Desastres - Quanto Mais Rápido Querer os Dados de Volta, Mais Terá de Pagar.
O ponto de recuperação define, por exemplo, como os dados estarão após um desastre. A
(RPO, em inglês) é um ponto no passado, para o qual os sistemas e dados precisam ser restaurados após uma paralisação. A RPO define a quantidade máxima de dados que a sua organização está disposta a sacrificar em um desastre. Ou seja, uma solução de continuidade dos negócios com uma meta RPO de zero pode sobreviver a um desastre sem perder nenhum dado.
Juntas, a RTO e a RPO fornecem um objetivo mensurável que a solução de continuidade dos negócios e a recuperação de desastre deve atingir. Melhorar a RTO e a RPO implica em aumentar seu investimento nas tecnologias e processos de rede e de armazenamento. Além disso, a distância física entre seus data centers e
meta de ponto de recuperação
A distribuição provável de um desastre, chamada de raio de desastre ou ameaça, também afeta a solução de continuidade dos negócios. A probabilidade e a extensão dos danos de terremotos, inundações, incêndios, furacões, ciclones ou ameaças terroristas variam de acordo com a região na qual o data center se localiza fisicamente. Para ser eficaz, o local de back-up não pode estar no raio de desastre (veja Figura 2).
Definir o raio de desastre pode ser mais complicado do que identificar uma região geográfica. Por exemplo, um terremoto pode destruir tanto os data centers primário e
secundário se estiverem sobre uma grande falha geológica, mesmo estando geograficamente separados. Muitas empresas adotam uma estratégia de múltiplos saltos para se protegerem, usando data centers separados por distâncias metropolitanas e um terceiro local situado fora da
Muitas empresas adotam uma estratégia de
múltiplos saltos para se protegerem, usando
data centers separados por distâncias
metropolitanas e um terceiro local situado
fora da região.
Planejamento da Continuidade dos Negócios
Tendências Que Precisam Ser Conhecidas
Os resultados de dois estudos da IDC, um de 2004 e outro com dados atuais, destacam a continuação da tendência das empresas em procurar reduzir o tempo total de paralisação e aumentar a disponibilidade geral. Por meio do planejamento da continuidade dos negócios, o tempo de paralisação caiu, no período de quatro anos, mais de 53%, passando de 20,4 horas em 2003 para uma expectativa de 9,5 horas em 2007. Isso levou a uma mudança na disponibilidade de 97,2% para 98,7% no mesmo período. Quando se analisa os impactos desses resultados nos negócios, adicionar quase 11 horas de “tempo ativo” por mês se traduz em 132 horas a mais ao ano, ou 5,5 dias completos. Esse tempo adicional pode acabar se revertendo em uma perda significativa de receita potencial se sua empresa não conseguir atingir esses altos requisitos de disponibilidade.
Além disso, quando se tenta aumentar a disponibilidade dos ambientes de TI e dos processos comerciais, é preciso integrar meios mais avançados para se atingir esses resultados. É muito provável que, para atingir essas metas de alta disponibilidade, serão necessários níveis crescentes de especialização, automação e, por fim, investimentos de capital.
Planejamento da Recuperação de Desastres
O Que o Plano Deve Incluir?
Um Plano de Recuperação de Desastre cobre os dados, o hardware e o software críticos para uma empresa reiniciar as operações no evento de um desastre, seja ele natural ou não. Ele deve também incluir planos para lidar com a perda inesperada ou repentina de pessoal chave. A fase de análise no desenvolvimento do manual de um Plano de Continuidade dos Negócios (BCP, sigla em inglês) consiste em análise de impacto, análise de ameaça e cenários de impacto, além da documentação dos requisitos do plano BCP.
Uma análise de impacto resulta na separação das funções críticas e não-críticas em uma organização. Uma função pode ser considerada crítica se as implicações de um dano nela para a organização forem consideradas
inaceitáveis pelos acionistas. A percepção de aceitabilidade da interrupção pode ser modificada pelos custos de se estabelecer e manter soluções apropriadas de
recuperação dos negócios ou técnica. Uma função também pode ser considerada crítica por força de lei. Em seguida, a análise de impacto resulta nos requisitos de
recuperação de cada função crítica. Os requisitos de recuperação consistem nas seguintes Informações:
Análise de Impacto
Análise de ameaça
Após definir os requisitos de
recuperação, aconselha-se documentar as possíveis ameaças para detalhar os passos específicos para a recuperação, no caso de um determinado desastre. Entre as ameaças comuns incluem-se:
Cenários de impacto
Todas as ameaças acima compartilham um impacto em comum: o potencial de danificar a infra-estrutura organizacional, com uma única exceção (doenças). O impacto de doenças é, inicialmente, puramente humano, e pode ser aliviado por soluções técnicas e organizacionais. Durante a epidemia de SARS em 2002-2003, algumas empresas agruparam o pessoal em diferentes equipes e mudavam as equipes entre os locais primário e secundário de trabalho na mesma freqüência do período de incubação da doença. As organizações também eliminaram o contato pessoal entre membros de equipes diferentes, dentro e fora do horário comercial. Com essa separação, as organizações aumentaram a resistência contra a ameaça de quarentena imposta pelo governo, no caso de uma pessoa em uma equipe contrair ou ficar exposta à doença.
Desastres naturais Incêndio
Falta de luz Ataques terroristas
Interrupções deliberadas ou organizadas Falhas em sistemas e/ou equipamentos Erro humano Vírus de computador Questões legais Greves de funcionários ? ? ? ? ? ? ? ? ? ?
60 por cento
dos dados
corporativos
são armazenados
em data centers,
e até 75 por cento
desses dados estão
desprotegidos.
Consolidação de Data Center/ Servidores.
Data Centers e o Dilema do Armazenamento de Dados • • • • • •
Síntese e Benefícios aos Negócios
O alto custo de manter dispositivos de fita, no que se incluem:
Execução inconsistente de back-up:
A Consolidação do Data Center é uma abordagem das tecnologias de otimização em um ou mais data centers para
economizar custos, aumentar o desempenho e minimizar riscos. Essa abordagem envolve planejamento, otimização e migração física de sistemas e aparelhos.
Um estudo recente conduzido pela Strategic Research Corporation de Santa Barbara, Califórnia, revelou que mais de 60% dos dados corporativos são armazenados em data centers externos, e 75% desses dados estão desprotegidos. Segundo o estudo, essa é uma prática arriscada, porque o “dado da ponta” pode ser tão crítico para a sobrevivência da empresa quando os dados centralizados são gerenciados mais de perto. Encontrar um modo eficaz e eficiente de proteger os dados em escritórios remotos continua sendo uma das questões mais difíceis que os gerentes de TI
enfrentam. Alguns dos principais problemas nessa área são:
O hardware e o software de fita, que variam de US$ 5.000 a US$ 20.000, ou mais
Os custos operacionais de se manter os equipamentos de back-up remoto Os serviços terceirizados para gerenciar as fitas e o processo de back-up
Funcionários de escritório remotos não são profissionais de TI
Funcionários de escritórios remotos totalmente ocupados com suas funções primárias
Funcionários de escritórios remotos
Os principais incentivos para a consolidação dos servidores são:
• • •
Melhorar o custo total de propriedade e domar a difusão de servidores
Facilitar o gerenciamento diário de atualizações, reconfigurações, correções, equilíbrio de cargas e back-up, além do uso mais eficiente das CPUs e
armazenagem
O gerenciamento das unidades comerciais também fornece um ímpeto em direção à consolidação. Muitos dos sistemas distribuídos são gerenciados, em parte, por usuários finais, gerando frustrações e afetando negativamente a produtividade deles.
Embora a redução dos custos totais de propriedade continue a ser a principal razão para a consolidação de servidor, notamos uma mudança que indica um maior interesse em consolidar para melhorar o serviço, o gerenciamento de sistema e a agilidade. O crescimento ilimitado da armazenagem, períodos crescentes de retenção e baixas taxas de utilização levaram o provisionamento de
armazenagem à vanguarda dos problemas operacionais. A consolidação da
armazenagem move o provisionamento do servidor para a aplicação ou infra-estrutura. Isso cria uma enorme oportunidade para melhorar a produtividade da equipe de gerenciamento de bens e atingir níveis de serviços acordados (SLA, sigla em inglês) e exigências legais ainda mais altos. Ela também fornece as bases para as organizações de TI evoluírem de um foco centrado na infra-estrutura para um foco mais orientado a serviços. Exteriorizar o armazenamento elimina o “trabalho pesado” associado às atualizações de servidores configurados com armazenamento interno. O resultado de tudo isso? É preciso assegurar que a principal razão do projeto de consolidação do servidor e/ou
armazenamento esteja claramente compreendida para que metas e objetivos
FIGURA 3
Somente a F5 tem a solução completa
Dispositivos Móveis Quiosque USUÁRIOS REMOTOS MATRIZ Roteadores
LOCAL DE RECUPERAÇÃO DE DESASTRES
FILIAL
Somando Tudo Isso
Continuidade dos Negócios / Recuperação de Desastres
O portfolio de produtos da F5 representa uma solução completa com a qual você pode atingir seus objetivos de Continuidade dos Negócios, Recuperação de Desastres e Consolidação.
Os produtos da F5 podem ser usados nos planos de continuidade dos negócios e recuperação de desastres. O BIG-IP Global Traffic Manager (GTM), o BIG-IP Link Controller (LC) e o BIG-IP Local Traffic Manager (LTM) da F5 são as melhores soluções no mercado para fornecer redirecionamento de sistemas paralisados. Isso cobre tanto a recuperação interna ao data center como a recuperação de desastres entre múltiplos data centers. Implementar essas soluções pode ajudar as organizações a atingirem melhores metas de Tempo de Recuperação (RTO) e de Ponto de Recuperação (RPO). Além disso, o WANJet da F5 acelera a replicação de dados entre data centers para assegurar a integridade das bases de dados e das aplicações durante os redirecionamentos, devido às falhas possíveis. E o FirePass SSL VPN da F5 fornece acesso remoto aos usuários que normalmente acessam seus locais “domésticos”, mas devido a um desastre precisam, agora, acessar
Consolidação do Data Center
A consolidação de servidores requer o balanceamento eficaz e eficiente da carga dos servidores. A F5 oferece o BIG-IP LTM para se atingir isso. Aumentar a
disponibilidade também é fundamental na consolidação. A F5 oferece produtos avançados para alta disponibilidade, incluindo o BIG-IP GTM, o BIG-IP LC e o BIG-IP LTM. Finalmente, aumentar a segurança por meio da consolidação significa proteger o aceso às aplicações. A F5 oferece o FirePass SSL VPN e o Application Security Module com esses propósitos.
Minimizar os desastres, incluindo desastres naturais, incêndios, falta de luz, ataques terroristas, erros humanos e vírus de computador, requer a implantação de aplicações de missão crítica em data centers redundantes. Ao menos dois data centers, geograficamente distribuídos (por exemplo, um nos EUA e outro na Ásia), devem ser disponibilizados. Cada data center deve ser multi-hospedado.
Geralmente, os requisitos para os produtos incluem o fornecimento de gerenciamento de tráfego global, acesso remoto seguro para usuários, proteção das aplicações expostas às redes públicas,
compartilhamento do estado da aplicação em tempo hábil (ou seja, replicação da base
Somente a F5 tem o conjunto completo e abrangente de soluções que minimizam os efeitos dos desastres sobre as redes corporativas.
As aplicações são vitais em qualquer empresa. Há várias ações que podem ser tomadas para assegurar a recuperação bem-sucedida das aplicações críticas ao seu negócio.
Inventarie suas aplicações e determine as Metas de Ponto de Recuperação e Tempo de Recuperação para cada uma delas. Considere que a resposta deve levar em conta desastres ambientais, interrupção de serviços, falhas de sistemas e de serviços públicos.
Selecione uma pessoa para administrar o plano de recuperação de desastres e de continuidade dos negócios.
Informe e treine a equipe no processo de continuidade dos negócios.
Documente o processo de continuidade dos negócios e armazene uma cópia externamente.
Teste o plano de recuperação de
desastres, de back-ups, e de restaurações para assegurar que funciona
adequadamente.
Reavalie e atualize o plano regularmente.
Passos Que Podem Ser Realizados Imediatamente • • • • • • •