• Nenhum resultado encontrado

2 Compreender o Acronis Backup & Recovery 10

2.13 Compreender a gestão centralizada

2.13.6 Desduplicação

Esta secção descreve a desduplicação, um mecanismo concebido para eliminar a repetição de dados ao arquivar dados idênticos apenas uma vez nos arquivos.

Descrição geral

A desduplicação é o processo de minimização do espaço de armazenamento ocupado pelos dados, detectando dados repetidos e armazenando dados idênticos apenas uma vez.

Por exemplo, se uma abóbada gerida com desduplicação activa contiver duas cópias do mesmo ficheiro (no mesmo arquivo ou em arquivos diferentes), o ficheiro é armazenado apenas uma vez e é armazenada uma ligação para esse ficheiro em vez do segundo ficheiro.

74 Copyright © Acronis, Inc., 2000-2010 A desduplicação também pode reduzir a carga de trabalho na rede: se, durante um backup, se detectar que um ficheiro ou um bloco de disco é um duplicado de um já armazenado, o respectivo conteúdo não é transferido na rede.

A desduplicação é efectuada em blocos do disco (desduplicação ao nível de bloco) e em ficheiros (desduplicação ao nível de ficheiro), para backups ao nível do disco e ao nível de ficheiros, respectivamente.

No Acronis Backup & Recovery 10, a desduplicação consiste em dois passos:

Desduplicação na origem

Efectuada numa máquina gerida durante o backup. O Agente do Acronis Backup & Recovery 10 utiliza o nó de armazenamento para determinar os dados que podem ser desduplicados e não transfere os dados cujos duplicados já estão presentes na abóbada.

Desduplicação no destino

Efectuado na abóbada depois da conclusão de um backup. O nó de armazenamento analisa os arquivos da abóbada e desduplica os dados na abóbada.

Ao criar um plano de backup, tem a opção de desactivar a desduplicação na origem para esse plano. Este procedimento pode originar backups mais rápidos, mas uma maior carga de trabalho na rede e no nó de armazenamento.

Abóbada de desduplicação

Uma abóbada centralizada gerida em que a desduplicação está activa denomina-se abóbada de

desduplicação. Ao criar uma abóbada centralizada gerida, pode especificar se pretende activar, ou

não, a desduplicação na mesma. Não é possível criar uma abóbada de desduplicação num dispositivo de fita.

Base de dados de desduplicação

O Nó de Armazenamento do Acronis Backup & Recovery 10 que gere uma abóbada de desduplicação mantém a base de dados de desduplicação, que contém os valores hash de todos os itens armazenados na abóbada, excepto os que não podem ser desduplicados, tais como ficheiros encriptados.

A base de dados de desduplicação é armazenada na pasta especificada pelo Caminho de base de

dados na vista Criar abóbada centralizada durante a criação da abóbada. A base de dados de

desduplicação só pode ser criada numa pasta local.

O tamanho da base de dados de desduplicação corresponde a cerca de um por cento do tamanho total dos arquivos na abóbada. Por outras palavras, cada terabyte de novos dados (não duplicados) adiciona cerca de 10 GB à base de dados.

No caso de a base de dados ficar danificada ou de se perder o nó de dados, desde que a abóbada conserve os arquivos e a pasta de serviço que contém metadados, o novo nó de armazenamento reanalisa a abóbada e recria a base de dados.

Como funciona a desduplicação

Desduplicação na origem

Ao realizar um backup para uma abóbada duplicada, o Agente do Acronis Backup & Recovery 10 lê os itens relativamente aos quais está a ser efectuado o backup (blocos do disco para backup do disco ou ficheiros para backup de ficheiros) e calcula uma impressão digital de cada bloco. Esta impressão

Copyright © Acronis, Inc., 2000-2010 75 digital, muitas vezes denominada valor hash, representa de forma exclusiva o conteúdo dos itens dentro da abóbada.

Antes de enviar o item para a abóbada, o agente consulta a base de dados de desduplicação para determinar se o valor hash do item é igual ao de um item já armazenado.

Se for, o agente envia apenas o valor hash do item; caso contrário, envia o item propriamente dito. Alguns itens, tais como ficheiros encriptados ou blocos do disco de tamanho não convencional, não podem ser desduplicados e o agente transfere sempre esses itens para a abóbada sem calcular os respectivos valores hash. Para obter mais informações sobre restrições de desduplicação ao nível do ficheiro e ao nível do disco, consulte Restrições de desduplicação (pág. 77).

Desduplicação no destino

O nó de armazenamento efectua desduplicação no alvo numa abóbada gerida executando duas tarefas: a tarefa de indexação e a tarefa de compactação.

Tarefa de indexação

Após o backup para uma abóbada de desduplicação estar concluído, o nó de armazenamento executa a tarefa de indexação para desduplicar dados na abóbada da seguinte forma:

1. Move os itens (blocos do disco ou ficheiros) dos arquivos para uma pasta especial dentro da abóbada, armazenando aí apenas uma vez os itens duplicados. Esta pasta denomina-se armazenamento de dados de desduplicação. Os itens que não podem ser desduplicados permanecem nos arquivos.

2. Nos arquivos, substitui os itens movidos com as respectivas referências aos mesmos.

Por conseguinte, a abóbada contém um número de itens desduplicados exclusivos, sendo que cada item tem uma ou mais referências ao mesmo a partir dos arquivos da abóbada.

A tarefa de indexação pode demorar um tempo considerável a concluir. Pode visualizar o estado desta tarefa na vista Tarefas no servidor de gestão.

Tarefa de compactação

Depois de um ou mais backups ou arquivos terem sido apagados da abóbada (manualmente ou durante a limpeza) a abóbada pode conter itens aos quais já nenhum arquivo se refere. Esses itens são apagados pela tarefa de compactação, que consiste numa tarefa agendada realizada pelo nó de armazenamento.

Por predefinição, a tarefa de compactação é executada todos os Domingos à noite pelas 03:00. É possível alterar a agenda da tarefa conforme descrito em Operações com nós de armazenamento (pág. 331), em "Modificar agendamento da tarefa de compactação". Pode também iniciar ou parar manualmente a tarefa a partir da vista Tarefas.

Casos em que a desduplicação é mais eficaz

Seguem-se os casos em que a desduplicação produz o máximo efeito:

Ao efectuar o backup de dados semelhantes provenientes de diferentes fontes no modo de

backup completo. É este o caso quando efectua o backup de aplicações e sistemas operativos

implementados a partir de uma única fonte na rede.

Quando realizar backups incrementais de dados semelhantes provenientes de fontes diferentes, desde que as alterações aos dados sejam também semelhantes. É o que acontece quando implementa actualizações nesses sistemas e aplica o backup incremental. Uma vez mais,

76 Copyright © Acronis, Inc., 2000-2010 recomendamos que efectue primeiro o backup de uma máquina e depois das outras, todas de uma vez ou uma a uma.

Quando realizar backups incrementais de dados que não mudam, mas que mudam de

localização. É o que acontece quando várias partes dos dados circulam na rede ou num sistema.

Sempre que uma parte dos dados muda de local, é incluída no backup incremental que aumenta de tamanho, embora não contenha novos dados. A desduplicação ajuda a resolver o problema: de cada vez que um item aparece num novo local, é guardada uma referência ao item em vez do item propriamente dito.

Desduplicação e backups incrementais

No caso de alterações aleatórias aos dados, a desduplicação no backup incremental não produzirá efeitos significativos porque:

Os itens desduplicados que não sofreram alterações não são incluídos no backup incremental.

Os itens desduplicados que sofreram alterações deixam de ser idênticos e, portanto, não serão desduplicados.

Melhores práticas para desduplicação

Siga estas recomendações ao utilizar desduplicação:

Ao criar uma abóbada de desduplicação, coloque a abóbada e a sua base de dados de

desduplicação em discos diferentes. Isto irá tornar a desduplicação mais rápida, pois a

desduplicação envolve uma utilização simultânea extensiva da abóbada e da base de dados.

A indexação de um backup requer que a abóbada tenha espaço livre com um tamanho mínimo

de 1.1 multiplicado pelo tamanho do arquivo ao qual o backup pertence. Se não existir espaço

livre suficiente na abóbada, a tarefa de indexação irá falhar e iniciar novamente após 5–10 minutos pressupondo que foi libertado algum espaço como resultado da limpeza ou de outras tarefas de indexação. Quanto mais espaço livre existir na abóbada, mais rapidamente os seus arquivos serão reduzidos para o tamanho mínimo possível.

Ao efectuar o backup de vários sistemas com conteúdo semelhante, efectue primeiro o backup

de um dos sistemas semelhantes de modo a que o Nó de Armazenamento do Acronis Backup &

Recovery 10 indexe todos os ficheiros do sistema como potenciais itens de desduplicação. Esta acção resulta em processos de backup mais rápidos e numa redução do tráfego de rede (devido à desduplicação eficaz na fonte), independentemente de os backups serem realizados em simultâneo ou não.

Antes de iniciar os backups seguintes, certifique-se de que a tarefa de indexação concluiu a desduplicação do primeiro backup e agora está inactiva. Pode visualizar o estado da tarefa de indexação na lista de tarefas no Servidor de Gestão do Acronis Backup & Recovery 10.

Taxa de desduplicação

A taxa de desduplicação mostra o tamanho dos arquivos numa abóbada de desduplicação em relação ao tamanho que ocupariam numa abóbada que não seja de desduplicação.

Por exemplo, vamos supor que está a efectuar o backup de dois ficheiros com conteúdo idêntico a partir de duas máquinas. Se o tamanho de cada ficheiro for um gigabyte, o tamanho dos backups numa abóbada que não seja de desduplicação será de aproximadamente 2 GB, mas este tamanho será apenas de cerca de 1 GB numa abóbada de desduplicação. Isto dá uma taxa de desduplicação de 2:1 ou 50%.

Pelo contrário, se os dois ficheiros tivessem conteúdo diferente, os tamanhos do backup em abóbadas de desduplicação e não desduplicação seriam os mesmos (2 GB) e a taxa de desduplicação seria de 1:1 ou 100%.

Copyright © Acronis, Inc., 2000-2010 77

Que taxa esperar

Embora, em algumas situações, a taxa de desduplicação possa ser muito elevada (no exemplo anterior, o aumento do número de máquinas levaria a taxas de 3:1, 4:1, etc.), é razoável esperar, num ambiente habitual, uma taxa entre 1,2:1 e 1,6:1.

Num exemplo mais realista, vamos supor que está a realizar um backup ao nível do ficheiro ou do disco de duas máquinas com discos semelhantes. Em cada máquina, os ficheiros comuns a todas as máquinas ocupam 50% do espaço de disco (digamos, 1 GB); os ficheiros específicos de cada máquina ocupam os restantes 50% (outro 1 GB).

Numa abóbada de desduplicação, o tamanho do backup da primeira máquina, neste caso, será de 2 GB e o da segunda máquina será de 1 GB. Numa abóbada que não seja de desduplicação, os backups ocupariam 4 GB no total. Por conseguinte, a taxa de desduplicação é 4:3, ou cerca de 1,33:1. Da mesma forma, no caso de três máquinas, a taxa passa para 1,5:1; para quatro máquinas, é de 1,6:1. A taxa aproxima-se de 2:1 à medida que vai sendo efectuado o backup de mais máquinas na mesma abóbada. Isto significa que pode comprar, digamos, um dispositivo de armazenamento de 10- TB em vez de um de 20-TB.

A quantidade real de redução de capacidade é influenciada por inúmeros factores como, por exemplo, o tipo de dados de se que está a efectuar o backup, a frequência dos backups e o período de retenção dos mesmos.

Restrições de desduplicação

Restrições de desduplicação ao nível do bloco

Durante um backup do disco para um arquivo na abóbada de desduplicação, a desduplicação dos blocos de disco de um volume não é efectuada nos seguintes casos:

Se o volume for um volume comprimido

Se o tamanho da unidade de atribuição do volume, também denominado tamanho de cluster ou tamanho de bloco, não for divisível por 4 KB

Dica: Na maioria dos volumes NTFS e ext3, o tamanho da unidade de atribuição é de 4 KB, permitindo,

assim, a desduplicação ao nível de bloco. Outros exemplos de tamanhos de unidades de atribuição para desduplicação ao nível de bloco incluem 8 KB, 16 KB e 64 KB.

Se tiver protegido o arquivo com uma palavra-passe

Dica: Se pretender proteger os dados no arquivo permitindo, ainda assim, a desduplicação dos mesmos,

não proteja o arquivo com palavra-passe e encripte a própria abóbada de desduplicação com uma palavra- passe. Pode fazê-lo durante a criação da abóbada.

Os blocos de disco que não foram desduplicados são armazenados nos arquivos, tal como o seriam numa abóbada de não desduplicação.

Restrições de desduplicação ao nível do ficheiro

Durante um backup do ficheiro para um arquivo numa abóbada de desduplicação, a desduplicação de um ficheiro não é efectuada nos seguintes casos:

Se o ficheiro estiver encriptado e a caixa de verificação Em arquivos, armazenar ficheiros

codificados em estado descodificado estiver desmarcada (desmarcada por predefinição)

Se o ficheiro for inferior a 4 KB em tamanho

78 Copyright © Acronis, Inc., 2000-2010 Os ficheiros que não foram desduplicados são armazenados no arquivo, tal como o seriam numa abóbada de não desduplicação.

Desduplicação e fluxos de dados NTFS

No sistema de ficheiros NTFS, um ficheiro pode ter um ou mais conjuntos de dados adicionais associados ao mesmo, frequentemente denominados fluxos de dados alternativos.

Quando é criado um backup de um ficheiro deste tipo, também é criado um backup de todos os respectivos fluxos de dados alternativos. Contudo, estes fluxos nunca são desduplicados, mesmo quando o próprio ficheiro o é.

Documentos relacionados