Um Serviço Escalável e Robusto para Gerenciamento de Membros em Grades Computacionais de Grande Escala*

(1)

Um Serviço Escalável e Robusto para

Gerenciamento de Membros em Grades

Computacionais de Grande Escala*

Fernando Castor Filho

1

_{, Rodrigo Castro}

2

_,

Augusta Marques

2

_{, Francisco M. Soares-Neto}

2

_,

Raphael Y. Camargo

3

_{e Fabio Kon}

4

1

_{Universidade Federal de Pernambuco}

2

_{Universidade de Pernambuco}

3

_{Universidade Federal do ABC}

(2)

Falhas em Grades



Problema importante

−

_{Desperdício de recursos computacionais e de rede}

−

_{Perda de tempo (recursos podem precisar ser reservados}

novamente)



Escala

piora o problema

−

_{Defeitos se tornam comuns}



Grades

oportunistas

−

_{Infraestrutura de grade compartilhada}

−

_{Nós saem/falham com frequência}

(3)

Alcançando Tolerância a Falhas



Primeiro passo:

detectar

defeitos...



Então

fazer algo

sobre isso



Outros nós da grade também devem ter

consciência

da situação

−

_{Senão, o}

_progresso

_{pode ser}

_prejudicado



Cada nó deve ter uma visão atualizada dos

membros do grupo

(4)

Requisitos para Gerenciamento de

Membros em Grades

1. Escalabilidade

2. Autonomia

3. Eficiência

4. Capacidade de lidar com dinamismo

5. Independência de plataforma

6. Distribuição (Descentralização)

7. Facilidade de Configuração

(5)

Nossa Proposta



Um serviço de gerenciamento de membros que

satisfaça os requisitos mencionados

−

_{Foco em manter uma visão consistente do grupo a}

todos os processos

−

_{mesmo com}

_{falhas catastróficas}



Combina avanços recentes em

−

_{Disseminação Epidêmica}

−

_{Detectores Adaptativos}

(6)

Disseminação de Informação

Epidêmica/Baseada em Boatos



Baseada na maneira como doenças infecciosas

se espalham



Periodicamente, cada participante infecta

aleatoriamente um de seus “vizinhos”

−

_{Infecta = envia informação que}

(potencialmente)

modifica seu estado



Protocolos de consistência fraca

(7)

Arquitetura do Serviço de

Gerenciamento de Membros

Tratador de

Defeitos 1

…

Processo Monitorado

Disseminação

de Informação

Gerenciamento

de Membros

Monitor

Detector

Cumulativo

de Defeitos

Detector de Defeitos

Tratador de

Defeitos 2

Tratador de

Defeitos N

Nó1

Nó3

Nó4

Nó2

Cada nó roda uma instância do serviço

de gerenciamento de membros

(8)

Gerenciamento de Membros



Trata pedidos de inclusão ao

grupo



Dissemina informação sobre

novos membros



Informa-os sobre membros existentes



Remove membros defeituosos do grupo



Processos defeituosos podem também voltar

(9)

Detector de Defeitos



Coleta dados

sobre

K

processos

−

_{Envia heartbeats}

−

_Disseminados

_{periodicamente (}

_T

_hb

₎

−

se p

₁

monitora p

₂

então há uma conexão

TCP entre eles



Detector Cumulativo de Defeitos

(10)

Coletando Informação Suficiente



Detectores adaptativos precisam

receber informação sobre processos

monitorados

regularmente

−

_{Também se aplica a detectores}

cumulativos

−

_{Protocolos epidêmicos tradicionais não são regulares}



Solução:

relações de monitoramento persistentes

entre processos

−

_{Estabelecidas aleatoriamente}

−

_{Exibem as propriedades desejadas de protocolos}

epidêmicos

(11)

Tratadores de Defeitos



Para cada processo monitorado,

um conjunto de limiares é

configurado

−

_{Por exemplo: 85, 90, e 95%}

−

_{Um tratador é associado a cada um}



Várias estratégias de tratamento são possíveis

−

_{Cada uma é executada quando o limiar}

correspondente é alcançado

(12)

Disseminação de Informação



Responsável por espalhar a

informação

−

_{Sobre nós falhos}

_{(mensagens específicas)}



Importante para tratamento de defeitos

−

_{Sobre membros corretos}

_{(de carona em mensagens de}

heartbeat)



Velocidade de disseminação é baseada no

parâmetro

J

(13)

Implementação



Escrita em

Lua

−

_{Compacta, eficiente, extensível, e independente de}

plataforma

−

_{O serviço é empacotado como um módulo Lua}

reusável



Usa um

ORB CORBA

leve (OiL) para IPC

−

_{Também escrito em Lua}

(14)

Garantindo um Mínimo de

Processos Monitores



Caso um processo

p

detecte que um processo

q

que o monitora

falhou

−

_{Solicita a outro processo}

_s

_{que o monitore}

−

_s

_{escolhido aleatoriamente}



Caso

s

também tenha falhado

−

_{Não tenta novamente de imediato}

−

_{Poderia resultar em muitas}

_{mensagens adicionais}

(15)

Garantindo um Mínimo de

Processos Monitores



Garante que cada processo seja monitorado

por pelo menos

K

outros (parâmetro

H

)

−

_{Garante a}

_robustez

_{do grupo}

−

_{Mecanismo simples e econômico}

−

Cada processo executa a cada

T

_hb

segundos

(16)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Quantidade de nós

que monitora

A

é

igual a

K

(17)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Dado defeito em

G

,

é desfeita a relação

de monitoramento

(18)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

A

solicita a

F

que o

monitore. A união de

processos que

monitoram

A

e aos

quais ele solicitou é

igual a

K

(19)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Enquanto a união

dos conjuntos citados

não for menor que

K

,

não é possível fazer

mais solicitações

(20)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Sendo detectado

defeito em

F

,

espera

antes de fazer novos

pedidos

, de forma a

não sobrecarregar a

rede em casos de

falhas catastróficas

(21)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Após espera,

A

pode

fazer nova solicitação

de monitoramento

(22)

➔

É monitorado por

➔

Foi pedido monitoramento

Legenda:

Exemplo com K = 4

A

B

C

D

E

F

G

Sendo aceita, o

número de processos

que monitoram

A

(23)

Heartbeats informativos



O serviço proposto garante que todos

processos

são monitorados

−

_{Não garante}

_{que todos monitorem processos}

−

_{Podem haver processos que}

_{nunca recebam}

informações

sobre novos processos



Solução

−

A cada

T

_hb

segundos, envia-se um heartbeat para

um processo

p

monitorado

−

_{Função meramente}

_informativa

(24)

Heartbeats Informativos



Resultam em custo constante por processo (em

termos de mensagens enviadas por turno)



Custo pode ser significativo

−

_{Para valores baixos de}

_K

_,

_{custo alto}

_(se

_K

_{= 4,}

custo equivale a aumentar em 25%)

−

_{Para valores altos (}

_K

_{>10), custo pequeno}

−

_{Pode ser configurados para enviar HBIs com menor}

(25)

Avaliação



Meta principal: avaliar

escalabilidade

e

robustez



40-200 nós concorrentes

−

_{Distribuídos entre sete máquinas equipadas com 1GB de}

RAM, rodando Kubuntu 8.04



Rede 100Mbps Fast Ethernet



WAN Emulada

−

_{latência = 500ms e jitter = 250ms}



Parâmetros

T

hb

= 2s,

K

= 4,

J

= 6,

(26)

Robustez

●

Capacidade de criar novas relações de

monitoramento quando falhas catastróficas

ocorrem

●

Para cada processo

p

−

_{Garantir que o número de processos que o}

monitoram mais o número de processos a quem

ele pediu que o monitorassem seja igual a

K

−

_{Não deve resultar em processos isolados ou}

(27)

Falhas em Blocos Separados

100 falhas

separadas em 2 blocos

(28)

(29)

Escalabilidade



Avaliação baseada na quantidade média de

mensagens enviadas

−

_{40, 80, 120, 160, e 200 instâncias do serviço}

−

_{Cada experimento com 10000 turnos de trocas de}

(30)

(31)

Com Falhas

Usando 200 processos, com 10% de falhas injetadas, crescimento de 4,4%

Com 50% de falhas, crescimento de 11,79%

(32)

Falhas em Blocos Separados

(33)

Comparação de Uso de HBIs

Produção de mais mensagens é um trade-off válido

pela rapidez na descoberta de mudanças no grupo

(34)

Conclusões



Principal contribuição: um serviço de gerenciamento de

membros robusto e escalável

−

_{garantindo que a rede se mantém estável;}

−

_{e que a estabilidade é alcançada rapidamente;}

−

_{de maneira escalável (sem exigir muito mais mensagens}

para isso);



Trabalho atual:

−

_{Integração com plataformas de Middleware (InteGrade e}

OurGrid)

(35)

Obrigado!

Dúvidas?

Contato:

Francisco M. Soares-Neto

fmssn@dsc.upe.br