• Nenhum resultado encontrado

5. Arquitetura e Infraestrutura

5.7. Alta Disponibilidade e Recuperação de Desastres

5.7.2. Clusters de Servidores

Os clusters são grupos de servidores que trabalham juntos e que, para certas características, normalmente disponibilidade e desempenho , atuam como se fossem um único servidor.

O conceito de cluster é similar ao conceito de computação multiprocessada, com a diferença de que a interconexão do cluster é realizada externamente, normalmente feita por uma rede privada, e a interconexão em sistemas de vários processadores é realizada internamente. Do ponto de vista do usuário da aplicação, quando um nó do cluster cai, o usuário só sente uma degradação temporária do serviço requisitado, mas não perde o serviço. A origem do cluster pode ser atribuída à invenção do VAXcluster para o sistema operacional VAX/VMS em meados da década de 1980.

A ideia de utilizar clusters de servidores é aumentar a disponibilidade do ambiente, aumentar o desempenho da aplicação e reduzir a complexidade do gerenciamento . Diferentes modalidades de clusters endereçam diferentes objetivos.

Os softwares de virtualização trouxeram novas opções para a realização dos clusters. Pode-se agora obter alta disponibilidade de uma máquina virtual utilizando o próprio software de virtualização.

Principais Tipos de Clusters

Os clusters podem ser classificados em:

Clusters de alta disponibilidade (High Availability – HA): endereçam redundância com capacidade de failover automático. Clusters de balanceamento de carga (Load Balancing – LB): endereçam a melhoria da capacidade para a execução da carga de trabalho (workload).

Clusters de alta performance ( HPC e HTC): endereçam o aumento da perfomance da aplicação.

Grid: endereçam o melhor dos mundos, com alta disponibilidade e alto desempenho . Podem ser globais, empresariais ou simplesmente grid clusters.

q q q q q q q

5.7.3. Backup e Restore

O backup é uma cópia dos dados de produção, criada e retida para o propósito de recuperar dados deletados ou corrompidos. O restore é o processo de recuperação dos dados.

Os serviços de backup e restore em TI são parte de um processo mais amplo que visa garantir a disponibilidade do datacenter e da infraestrutura de TI e, portanto, garantir a continuidade do negócio, conforme já mencionado.

O backup /restore necessita ser realizado por várias razões: Requisitos de negócio.

Requisitos legais.

Proteção contra falhas de hardware. Proteção contra falha da aplicação. Proteção contra erro do usuário. Recuperação de desastres.

Atingimento de níveis de serviço específicos.

O aspecto-chave para definir a forma de realizar o backup é a natureza dos dados objeto do backup. Deve-se definir também uma estratégia para recuperação dos dados do backup e testá-la antes da sua necessidade real. É comum acontecerem surpresas quando do uso do restore, ou seja, quando da tentativa de recuperar os dados. A própria forma de realizar o restore dos dados deve ser devidamente entendida e verificada com o fabricante do software de backup. A sugestão é que, quando do treinamento específico da ferramenta de backup a ser utilizada, inclua-se também o treinamento no restore do ambiente.

Normalmente pode ser feito um questionário com os donos dos dados para a realização de uma correta estratégia de backup . O questionário deve tentar descobrir quando deve ser feito o backup, quais dados devem ir para o backup, por quanto tempo devem ser mantidos e onde os backups devem ser feitos. Esse procedimento deve fazer parte de um plano mais amplo de continuidade do negócio.

q

q

q

q

Figura 5-24 – Classificação dos clusters

Independentemente do tipo, todo cluster possui:

Múltiplos nós (físicos ou virtuais): nos clusters de alta disponibilidade e nos clusters de alto desempenho um requisito especial é que os nós sejam homogêneos, possibilitando o gerenciamento como uma entidade única. Clusters do tipo load balancing e grid frequentemente possuem nós heterogêneos. Interconexão: normalmente baseada em rede Ethernet/TCP-IP, a interconexão deve permitir a comunicação entre os nós do cluster .

Acesso aos dados e ao storage: dependendo do tipo de cluster , os dados podem ser acessados por todos os nós do cluster (share- everything cluster model) ou os nós podem trabalhar isolados (share-nothing cluster model). Os clusters de alta disponibilidade e alto desempenho utilizam o modelo share-nothing. Um exemplo de share-everything cluster model é o cluster Oracle RAC.

Software de cluster : providencia o protocolo para a comunicação entre os nós do ​cluster e normalmente é considerado um serviço do sistema operacional. Os dois principais ​softwares de cluster são o Microsoft Cluster Server (MSCS) e o Red Hat Cluster Suite.

q q q q q q q q

A ideia de utilizar como parte da solução de backup também o backup em disco (disco-para-disco ou D2D) vem ganhado adeptos, permitindo combinar o que há de melhor em ambas as tecnologias (disco-para-disco-para-fita ou D2D2T). Discos e fitas apresentam as seguintes características:

Disco: velocidade, simplicidade.

Fita: robustez, menor preço, opção de recuperação de desastre. Existem muitas dúvidas sobre se realmente compensa ter uma estratégia de backup /restore que envolva discos e fitas. Um estudo realizado pelo Clipper Group comparou o custo do backup realizado em fita LTO-3 com o custo do backup em disco SATA. O estudo concluiu que o backup em disco tem um custo de aquisição 6,5 vezes maior do que o do backup em fita. Além disso, o espaço físico ocupado pelo backup utilizando discos no storage é 6,2 vezes maior do que o espaço ocupado pela unidade de fita, e o custo com energia e refrigeração é 25 vezes maior quando se utiliza backup em disco. Pode-se concluir que o backup em disco deve fazer parte de uma estratégia mais ampla de backup, onde se buscam velocidade em um primeiro momento, através do backup em disco, e robustez em um segundo momento, com a unidade de fita.

A utilização de discos de baixo custo em relação à unidade de fita para backup oferece as seguintes vantagens, segundo a CommVault:

Recuperação de dados mais rápida.

Os discos são, normalmente, mais rápidos do que as fitas, especialmente quando se leva em consideração o tempo de montagem e de busca dos dados em fitas.

Os problemas com falha nas fitas são eliminados.

Os discos têm acesso aleatório e são otimizados para pesquisas – as fitas têm acesso sequencial e podem ser muito mais lentas para buscas aleatórias de arquivos.

Múltiplos servidores podem acessar os dados simultaneamente – os discos têm várias cabeças de leitura/gravação.

O uso de discos elimina os erros humanos típicos no manuseio das fitas.

servidores, por exemplo, a menos que sofram algum tipo de patch (correção), não precisam de backup regular.

O processo de backup é ilustrado na Figura 5-25.

Figura 5-25 – Processo de backup

O aplicativo de backup , que normalmente é disponibilizado pelo fabricante, deve possibilitar uma política de backup corporativa que envolva dados dispersos geograficamente e questões específicas dos sistemas operacionais e aplicativos que serão os focos do backup. Veja, estamos falando de aplicativos para o mundo empresarial. Esqueça o improviso quando se fala de backup e restore.

A unidade de fita é o dispositivo natural para a realização do backup devido ao seu custo-benefício quando comparado a outras mídias. O padrão vigente de unidade de backup é o LTO-7, que, em unidades de quatro drivers, poderia fornecer uma taxa de 1,73 TB por hora. Um aspecto-chave do backup baseado em fitas é a definição da política de rotação das fitas e o tempo de retenção delas. Um bom parâmetro de tempo de retenção on site é trinta dias e 180 dias para off-site, não considerando aqui imposições legais.

Outro aspecto relevante é a segurança do backup . Técnicas de encriptação podem ser utilizadas, mas degradam o desempenho do backup e do restore.

q q q q

Quando se planeja uma estratégia de backup e recuperação para um ambiente de servidor virtualizado, há diversos fatores a serem considerados. É preciso levar em conta os vários tipos de ​backups que podem ser feitos e o estado da máquina virtual. Também é necessária uma estratégia para o backup das máquinas virtuais que passa pela integração de uma ferramenta de backup adequada com o aplicativo de backup disponibilizado pelo software de virtualização normalmente baseado em snapshot das máquinas virtuais.

5.7.4. Desduplicação

A desduplicação de dados é uma nova tecnologia para gerenciar o crescimento exponencial de dados e fornecer proteção. Para eliminar dados redundantes do storage, essa técnica de backup salva uma única cópia de dados idênticos e substitui todas as outras por indicadores que apontam para essa cópia. Desduplicar não é comprimir os dados.

A desduplicação examina a redundância dos dados que vão para backup . Em muitos casos é possível sair de um backup de 15 TB para 1 TB utilizando a desduplicação. A taxa de redução do backup vai depender do tipo de dado a ir para backup, dos períodos de retenção, da frequência dos backups completos e da tecnologia de desduplicação utilizada. É possível atingir reduções de até 500:1 (99,8%).

A desduplicação permite:

Economias com menor investimento em discos. Melhor utilização da capacidade.

Menos dependência de backup em fita. Recuperação mais rápida após uma pane.

Os aplicativos de backup são um componente essencial das estratégias de backup e recuperação de desastres . Da forma como era pensado o backup anteriormente, quase sempre as mídias utilizadas armazenavam cinco a dez vezes mais dados do que podia ser encontrado no armazenamento primário do mesmo datacenter . Como os dados continuam crescendo sem parar e mais atenção é dirigida à proteção eficiente dos dados e à recuperação de desastres, as abordagens tradicionais ao backup não são mais aceitáveis. As soluções

Uma opção natural hoje é utilizar uma combinação de discos e fita para backup. Esta opção é diferente da opção VTL (Virtual Tape Library) para o backup em disco. O VTL emula uma unidade de fita em uma unidade de discos. O VTL se mostrou de pouca escala pelo fato de ter uma interface isolada. Também é necessário utilizar um software adequado de gerenciamento de backup. Os discos utilizados pela VTL para o storage de backup são normalmente do tipo SATA, para reduzir o custo da solução.

Em redes SAN é natural que a unidade de backup seja inserida na própria rede SAN. Para isso é necessário verificar se a unidade de backup, normalmente uma biblioteca de fitas, possui a interface correta para ser instalada na rede SAN. Também o licenciamento do software precisa ser cuidadosamente planejado, pois os servidores da SAN devem estar devidamente licenciados para a utilização do software de backup, além do licenciamento dos agentes necessários. Cada fabricante de software de backup possui uma forma exclusiva de licenciamento e que muda constantemente.

A Figura 5-26 ilustra uma típica arquitetura de backup .

grande intervenção dos administradores de backup, pois estes precisam ser recuperados da fita, e os tempos envolvidos nessa operação são normalmente proibitivos.

A Figura 5-27 ilustra a diferença entre uma operação tradicional baseada em backup e outra baseada em archive. Observe que nem todos os dados vão para backup na opção com archive. Dados que precisam estar vivos e sofrem pouca modificação podem estar em archive on-line para serem consultados.

Na abordagem tradicional, o crescimento de dados do ambiente de produção deve ser absorvido por um dispendioso armazenamento principal baseado em storage. Conforme crescem os requisitos do storage principal, crescem os requisitos de backup e arquivamento.

Na abordagem baseada em archive, o arquivamento passa a ser uma extensão do ambiente de produção, permitindo o arquivamento mais cedo e a redução das necessidades de storage principal e de backup . As restaurações são mais rápidas e o SLA dos dados em archive em geral é melhorado.

Figura 5-27 – Archive

se somam aos backups baseados em unidades de fita . Os novos sistemas de desduplicação se integram facilmente ao ​software de backup existente, permitindo obter maior eficiência na execução e recuperação do backup.

5.7.5. Arquivamento (Archive)

As organizações atuais têm necessidades legais e regulamentares referentes a arquivos de dados que precisam estar bem organizados e armazenados. Registros específicos devem ser localizados e recuperados rapidamente e de maneira eficiente. Acontece que as aplicações de backup são concebidas para a recuperação dos dados de eventos não planejados, como uma falha acidental de um dispositivo ou mesmo a exclusão de um determinado arquivo.

Os backups são cópias secundárias da informação primária. Eles fornecem proteção de curto prazo para os dados de produção, para garantir a continuidade das atividades. Eles estão disponíveis e são gerados e substituídos sistematicamente. A principal característica do backup é a capacidade de fornecer uma cópia da informação no tempo adequado, a fim de proteger os processos empresariais críticos. Por esse motivo, o backup é a solução adequada para a continuidade empresarial e a recuperação de desastres.

O arquivamento (archive), por outro lado, trata de cópia principal das informações. As informações arquivadas são valiosas e conservadas para referências futuras e devem ter garantias de autenticidade. O archive trata de informações normalmente em sua forma final e sujeitas a pouca ou nenhuma modificação. Como passam a ser a única cópia das informações, devem ser mantidas por períodos de longo prazo (meses, anos ou décadas). O archive é focado no acesso e na recuperação de um trecho específico de informação, em vez de todo o conteúdo (como o backup ). Processos de archive costumam possuir informações específicas como prazos, incluindo a sua supressão.

Novas demandas, principalmente as regulamentadas (compliance), requerem a disponibilização de dados históricos on-line. Se o backup utilizar os meios tradicionais para esses arquivos vivos, o que acontece é que os dados são enviados para backup na unidade de fita e somem do storage. Qualquer demanda de consulta desses dados requer uma

q q q q q q q q q q

total de propriedade. Além disso, a solução de replicação deve ser flexível para se ajustar à mudança imposta pelo ambiente.

Replicação Síncrona e Assíncrona

A replicação remota pode ser classificada em dois tipos: Replicação síncrona: de acordo com a Figura 5-28 (a): 1. O servidor escreve o dado na fonte.

2. O dado da fonte é replicado para o destino no site remoto. 3. O ack do destino é enviado para a fonte.

4. O ack da fonte é enviado ao servidor.

A replicação síncrona propicia excelente integridade aos dados, mas exige alto desempenho da rede. Suas principais características são:

RPO de zero ou próximo de zero segundos. As duas imagens são idênticas.

Exige grande largura de banda de rede.

Em geral é realizada de um site principal para um ou dois secundários em distâncias menores do que 200 km.

Replicação assíncrona: de acordo com a Figura 5-28 (b): 1. O servidor escreve o dado na fonte.

2. O ack é enviado imediatamente ao servidor.

3. O dado é transmitido ao destino no site remoto mais tarde. 4. O ack do destino é enviado de volta à fonte.

A replicação assíncrona propicia menor integridade dos dados, mas possibilita o uso de redes não performáticas na conexão entre os sites. Suas principais características são:

RPO de trinta minutos a horas. Destino atualizado periodicamente. Distância ilimitada.

Cópia reinicializada no site secundário se a sessão falhar. Otimizada para pequena largura de banda.

q

q

operacionais, ambientes virtualizados, contemplar a desduplicação de arquivos e dados, aceitar diferentes mídias de armazenamento e ofertar proteção contínua local e remota. A eficiência desses serviços depende da correta integração e do conhecimento e alinhamento dos processos de backup, recuperação e arquivamento.

5.7.6. Replicação

A replicação é a tecnologia normalmente utilizada para proteção de dados e recuperação de desastres, mas também pode ser utilizada para replicação de dados dentro do mesmo ambiente físico.

Importante ressaltar que:

Replicação não é mobilidade dos dados. A mobilidade de dados trata da capacidade de mover dados de um sistema para outro. A replicação é a cópia de dados de um sistema e seus discos para outro sistema com um conjunto independente de discos.

Replicação também não é o mesmo que espelhamento, pois o espelhamento trata ambos os conjuntos de discos como um único volume lógico. O espelhamento está confinado a um único sistema e a replicação move os dados de um sistema para outro. O resultado final da replicação é a obtenção de dois conjuntos de dados consistentes e iguais em dois lugares diferentes. É importante salientar que deverá haver espaço suficiente para absorver o volume replicado e que, muitas vezes, o nível de RAID utilizado no storage nos dois conjuntos de discos é diferente.

Existem diversas formas de fazer a replicação, indo desde a replicação pelo servidor (host ​based), replicação pelo storage (array based) e até a replicação pela rede (appliance based), que permitem que as empresas desenvolvam uma abordagem coesa em relação à proteção de dados concentrada principalmente na recuperação dos dados, não apenas na realização de tarefas de backup .

A replicação pode limitar a exposição a tempos de inatividade planejados e não planejados, possibilitando operações contínuas. Normalmente uma organização precisa de uma replicação eficiente de dados para cumprir os padrões corporativos ou governamentais e, ao mesmo tempo, continuar atendendo aos requisitos de baixo custo

q

q

q

q

A infraestrutura: que equipamento adicional será necessário para dar suporte ao processo de replicação?

Os links de comunicação: qual o tamanho e o custo do link de comunicação necessário para dar suporte ao processo?

Quais são os RPO e RTO aceitáveis?

A virtualização simplifica e reduz o custo dos processos de alta disponibilidade e recuperação de desastres .

A virtualização simplifica a replicação, na medida em que permite a integração do software de virtualização com o storage , automatizando o processo. Além disso, permite grande economia na construção do site de recuperação de desastres , pois otimiza o uso de servidores e unidades de armazenamento.