Dell Fluid Data Forum 2012
Um dia na vida de uma página de dados no Dell
Compellent: Como “Dynamic Capacity”, “Data Instant
Replay” e “Data Progression” trabalham em conjunto
Celso Bonilha
Storage para Archive em grande escala Conteúdo fixo simples e acessível DX Object Storage Platform Backup baseado em disco Confiabilidade com inovação DR4000 Storage Platform
Eficiente | Ágil | Resiliente
Dell Storage portfólio
Entregando a Arquitetura Fluid Data
Storage virtualizado, multi-protocolo Máxima Eficiência Compellent Storage Center Storage IP , virtualizado escalável Simplicidade e versatilidade EqualLogic PS & FS Disk Storage Modular Valor e desempenho PowerVault MD & NX Appliances de backup D2D e D2T Proteção e recuperação simples PowerVault DL & TL
Eficiência
• Automação inteligente otimiza performance e custo • Facilidade no gerenciamento • Tudo“Thin”: provisionamento, alocação, replicação, …Resiliência
•Proteção de dados embutida •Suporte proativo Copilot melhor da categoria •Operação 99.999% comprovada no campoAgilidade
• Virtualizaçãointegrada (“no DNA”), não adicionada
(adaptada)
• Licenciamento perpétuo, TCO otimizado
• Escale conforme seu crescimento sem atualizações
completas (“forklift upgrades”)
Dell Compellent
Arquitetura Compellent Fluid Data
Arquitetura de próxima geração com proteção do investimento embutida
• Simplifica o gerenciamento • Ideal para servidores virtuais • “Sem perda” quando armazena os dados • Compre menos discos rígidos • Movimento sofisticado dos dados • Posicionamento otimizado dos dados • Inteligência no nível de bloco • Gerencia dados dentro do volume Virtualização Inteligência Automação Utilização METADATA Dados sobre os dados. Tier 2 Tier 2 Tier 1 Tier 3 Discos não comprados
Alocação sem uso Dados Dados • Bloco e arquivo (FC, iSCSI, FCoE, NFS, CIFS) • Sem upgrade “forklift” e com licenças perpétuas Ágil + Escalável
• Move automaticamente na
granularidade blocos de dados inativos para discos de menor custo
• Armazena dados mais frequentemente acessados na porção mais externa dos
• Integra fortemente com snapshots e replicação
• Alavanca o desempenho do SSD sem quebrar a banca
Tecnologia compravada, em produção desde 2005
Compre menos discos e discos menos caros
VOCÊ SABIA?
84% das ordens de upgrade são de discos mais acessíveis em custo e de alta
SAN tradicional Dell Compellent
$$$ RAID 10 $$ RAID 10 RAID 5 ou 6 15K SAS 7.2K SAS SSD Tier 1 Tier 2 Tier 3 $ RAID 5 RAID 6
Data Progression
• Eficiente em espaço – ponteiros congelados
• Sem pre-alocação de espaço
• Replays movem-se automaticamente para camadas mais baixas de menor custo
• Apague qualquer um, mantenha qualquer um
Benefícios da arquitetura baseada em Replay
Elimina sua janela de backup
11:45 12:00 12:15 12:02
• Integração com aplicações comuns de mercado
• Ideal para teste/desenv, VMs, Boot pela SAN, Grupos de Consistência
Data Instant Replay
• Não requer pré-alocação
• Snapshots são “thin provisioned” • Migrações de dados “Thin”
• Espaço livre é automaticamente recuperado
• Sem limites para utilização pelas aplicações
Benefícios do thin provisioning
Utiliza menos discos físicos
VOCÊ SABIA QUE?
100% dos clientes Dell Compellent utilizam “thin provisioning”.
Alocação sem uso
Dados Alocação sem uso
Dados
Discos não comprados
Alocação sem uso Dados Dados Vol B Vol A Vol B Vol A Legado
SANS tradicionais Dell Compellent Vantagem do Dynamic Capacity
Dynamic Capacity
Volume
Pool de Páginas
•
Pool de páginas
– Coleções de blocos de discos alocados e não-alocados
– Mapeia as páginas aos volumes
– Mantem o metadata
– Tamanho padrão da página é de 2MB (4,096 blocos)
•
Gerenciamento Automatizado e Sofisticado dos Blocos
– Altera níveis de RAID com o re-apontamento das páginas
– O sistema gerencia mapeamento dos dados através de
múltiplos níveis de RAID
– Arquivos individuais podem se espalhar por múltiplos
discos
– Suporta múltiplos tipos de discos e níveis de RAID
– ‘Re-stripe’ dos dados na adição de discos
•
O Pool de páginas cresce/diminui conforme
a necessidade
– Auto-desfragmentação e tuning
•
O movimentador de dados do Data Progression roda uma vez por dia
– Hora de início padrão é 7 p.m.
– Dados são movimentados por página
– Páginas históricas do Replay são elegíveis a movimentar para camadas mais
baixas imediatamente
– 12 dias para baixo, 3 para cima
– Data Progression rodará para múltiplos volumes ao mesmo tempo
•
RAID re-stripe ocorre:
– Quando novos drives são adicionados
– Quando extensões de RAID estão com baixa contagem
$$$ RAID 10 $$ RAID 10 RAID 5 or 6 $ RAID 5 RAID 6 15K SAS 7.2K SAS SSD Tier 1 Tier 2 Tier 3
Data Progression
•
Os níveis de RAID que o pool de páginas criará dentro de uma camada é
definido pelo nível de redundância da camada
•
Cada camada (tier) tem seu próprio nível de redundância, que pode ser
diferente para cada uma
•
Redundância simples habilita a camada a usar RAID10, RAID 5/5, e RAID 5/9
•
Redundância dupla habilita a camada a usar RAID10DM, RAID 6/6, e RAID
6/10
•
De forma padrão, qualquer camada com drives de tamanho igual ou
superior a 900 GB será configurado para redundância dupla (novos
sistemas)
•
Nível de redundância pode ser modificado “on the fly”
•
Dois tipos de páginas: Acessíveis e Históricas (Replay)
─ Páginas acessíveis são aquelas que podem ser lidas ou escritas por um servidor
no momento atual
─ Páginas históricas são aquelas somente para leitura (read-only – configuradas
pelo Data Instant Replay)
•
Data Progression utiliza a acessibilidade para determinar a classe de
armazenamento que uma página deve usar
Arquitetura Compellent Fluid Data
A
B
C
D
E
•
Camadas
– Tier 1, Tier 2, Tier 3
•
Zonas de disco
– Rápida e Padrão
•
Níveis de RAID
– Redundância Única
› RAID 10, RAID 5-5 (4+1), RAID 5-9 (8+1)
– Redundância Dupla
› RAID10DM, RAID6-6 (4+2), RAID 6-10 (8+2)
•
Tamanhos de página
– 512KB, 2MB, 4MB
•
Como tudo isto funciona junto?!?! – Nosso exemplo !!!
– O sistema de storage tem duas camadas de discos
– Os volumes estão configurados para usar os Perfis de Armazenamento
Recomendados (Recommended Storage Profile)
– A camada 1 está com redundância única; Camada 3 está com redundância dupla
– Um único Replay ocorre diariamente às 6 p.m. e é retido por 3 dias
– O volume foi criado hoje
– O tamanho do volume é de 1TB
Ciclo de vida da página
TIER1
RAID10
TIER3
RAID6
TIER1
RAID10
TIER1
RAID5
B
C
D
A
PÁGINAS
E
Lê C
Escreve C1
Lê C1
Escreve C2
Lê E
Escreve E1
6PM Seg 6PM TerA
B
C
D
E
C1
Lê A
DADOS ReplayTIER1
RAID10
TIER3
RAID6
TIER1
RAID5
TIER1
RAID10
Histórica LeiturasA
B
C
D
E
Ativa Escritas• Dados são escritos durante o dia
• 6PM Segunda o Replay é tirado
• Leituras e escritas continuam
̶ Só alterações são escritas
• 7PM Seg Data Progression roda
• 6PM Ter Replay é tirado
• Leituras e escritas continuam
̶ Só alterações são escritas
• 7PM Ter Data Progression roda
A
B
C
D
E
C1
C2
E1
Replay Δ Alterações Δ AlteraçõesC1
E
Histórica Leituras Histórica Leituras– Acessível, Acessada Recentemente
› Estas são as páginas ativas que o volume está utilizando mais – Acessível, Não Acessada Recentemente
› Páginas de Read/Write que não têm sido usada recentemente – Histórica, Acessada Recentemente
› Páginas Read-only que o volume está utilizando mais
› Pense em Replays
– Histórica, Não Acessada Recentemente
› Páginas Read-only que não têm sido usadas recentemente – Histórica, Não-Acessível
› Páginas de dados read-only que não estão atualmente sendo acessadas pelo volume
› Ou seja, elas se tornam antigas devido às novas versões das páginas
› O sistema mantem estas páginas com o propósito de recuperação e são colocadas na porção do storage de menor custo possível
C2
E1
A
B
C
Lê E
Escreve E1
Lê E1
Escreve E2…
Lê C1
Escreve C2
Lê C2
Escreve C3…
6PM Qua 6PM Seg 6PM TerLê A
DADOS ReplayTIER1
RAID10
TIER3
RAID6
TIER1
RAID5
TIER1
RAID10
Histórica Leituras Ativa Escritas• 6PM Qua Replay é tirado
• 7PM Qua Data Progression roda
̶ 6PM Replay Seg expira
̶ 6PM Replay Ter permanece
̶ Página C é liberada de volta para o pool de páginas
C
C2
E1
Replay Δ Alterações Δ AlteraçõesC1
A
B
D
E
Histórica Leituras Histórica Leituras ReplayC2
E1
C
C2
E1
Δ Alterações Recuperação do Volume 1 -> Volume 2
Lê E1
Escreve E2
Lê C2
Escreve C3
6PM Qua 6PM TerLê A
DADOS ReplayTIER1
RAID10
TIER3
RAID6
TIER1
RAID5
TIER1
RAID10
Histórica Leituras Ativa EscritasC3
E2
ReplayC1
A
B
D
E
Histórica Leituras Histórica LeiturasC2
E1
Volume 1
• Recuperar um Replay̶ Este se torna uma nova ramificação
̶ A nova ramificação compartilha blocos read-only
Δ Alterações
Ciclo de vida da página
C3
E2
A
B
C1
D
E
6PM Ter
C2
E1
Lê A
Lê C2
Escreve C3
Replay
Lê E1
Escreve E2
6PM Qua
Tempo 3
DADOS
DADOS
C4
E3
Volume 1
Volume 2
Lê A
Lê C2
Escreve C4
Lê E1
Escreve E3
Tempo 0
Δ Alterações
Visão da Recuperação
Ciclo de vida da página
Recuperando um volume
6PM Qua
TIER1
RAID10
TIER3
RAID6
TIER1
RAID5
TIER1
RAID10
Histórica Leituas Ativa EscritasC3
E2
Replay Δ Alterações Histórica Leituras Histórica LeiturasC2
E1
Δ Alterações Desmapear DesmapearE2
C2
E1
6PM Ter DADOS ReplayC1
A
B
D
E
Ciclo de vida da página
Desmapear/
Recuperação de espaço
• Desmapear Páginas
̶ Desmpaeamento requisitado para o Replay Ativo
‹ Retornar E2 para Pool
‹ Marcar blocos como livres
• 6PM Qua expira o Replay
• C2 & E1 liberados de volta ao Pool
• Replay de 6PM Ter Permanece
•
Dell Compellent recomenda que se siga nossas melhores práticas para
maximizar a vantagem destas funcionalidades
•
Replay – Melhores Práticas
‒ Todos volumes devem ter no mínimo um replay programado por dia
‒ Exceções são volumes de log, swap e pagefile – não há necessidade para a
progressão destes dados
•
Volume – Melhores Práticas
‒ Configurar todos os volumes para o Perfil de Armazenamento Recomendado
‒ Exceções para os volumes de log, swap e pagefile – sugestão de Perfil de Alta
Prioridade (Tier1)
Perguntas &
Repostas
O Dell Fluid Data é um evento que não termina por aqui. Temos um grupo no Linkedin para debater assuntos relacionados à Fluid Data permanentemente, e todos vocês estão convidados a participar.
Para entrar, acesse o Linkedin e procure pelo grupo Dell Brazil Fluid Data Forum. A entrada é liberada para todos os participantes do evento. Participem, esperamos por vocês!
Cobertura especial do Fluid Data Forum ao longo do dia de hoje no Twitter, Linkedin e Facebook:
Copyright © 2011 by Dell, Inc.
No part of this document may be reproduced or transmitted in any form without the written permission from Dell, Inc.
This document could include technical inaccuracies or typographical errors. Dell may make improvements or changes in the product(s) or program(s) described herein at any time without notice. Any statements regarding Dell’s future direction and intent are subject to change
or withdrawal without notice, and represent goals and objectives only.
References in this document to Dell products, programs, or services does not imply that Dell intends to make such products, programs or services available in all countries in which Dell operates or does business. Any reference to an Dell Program Product in this document is not intended to state or imply that only that program product may be used. Any functionality equivalent program, that does not infringe Dell’s intellectual property rights, may be used.
The information provided in this document is distributed “AS IS” without any warranty, either expressed or implied. Dell EXPRESSLY DISCLAIMS any warranties of merchantability, fitness for a particular purpose OR INFRINGEMENT. Dell shall have no responsibility to update this information.
The provision of the information contained herein is not intended to, and does not, grant any right or license under any Dell patents or copyrights.
Dell, Inc.
300 Innovative Way Nashua, NH 03063 USA