Armazenamento est´avel, checkpoints e logs

2.3 Durabilidade de dados e recuperac¸˜ao de estado

2.3.1 Armazenamento est´avel, checkpoints e logs

Tal como é mostrado da figura 2.7, a recuperação de estados pode ser feita de duas formas: para trás e para a frente. No primeiro caso, a recuperação é feita de forma a que o processo faltoso recupere para o último estado correcto que conheceu antes de falhar. Para que isto aconteça, é necessário que o estado do sistema seja armazenado periodicamente para que, na presença de falhas, seja poss´ıvel voltar a recuperá-lo. Pelo contrário, na recuperação para a frente, um processo faltoso evolui para um novo estado correcto, de onde é seguro continuar a execução normal do sistema. Aqui, o problema reside no facto de, para avançar para um novo estado, o sistema tem de conhecer todos os erros poss´ıveis de forma a conseguir corrigi-los.

Cap´ıtulo 2. Trabalhos relacionados 17

No geral, a recuperação para trás é a mais utilizada, apesar de o seu uso levantar al- guns problemas. Em primeiro lugar, é uma operação cara em termos de desempenho do sistema, devido ao uso de mecanismos de logging e checkpointing, que serão discutidos de seguida. Em segundo lugar, não nos garante que uma falta não se repetirá no futuro. Finalmente, existem estados para o quais não é poss´ıvel recuperar. Por exemplo, na mai- oria dos sistemas UNIX, é muito pouco provável conseguir-se recuperar para um estado anterior à execução da operação rm -fr * (remoção de todo o conteúdo de uma directoria).

Armazenamento estável. O armazenamento estável consiste em guardar dados no local que ofereça boas garantias de que esses dados permanecerão intactos em caso de falha. Este armazenamento é de extrema importância no âmbito da recuperação de processos faltosos, dado que o estado de um sistema precisa de ser armazenado de forma a sobreviver a paragem ou falha de processos. Também é importante que esse estado sobreviva a falhas o local onde é armazenado (p.ex., disco r´ıgido) [29, 44].

Existem três tipos de armazenamento: em memória RAM, em disco, ou armazenamento estável. O problema da memória RAM é que é apagada em caso de falha de energia ou paragem da máquina. O armazenamento em disco sobrevive a falhas da máquina mas não sobrevive a falhas no disco em si.

O armazenamento estável foi desenhado para sobreviver a quase qualquer falha, ex- cepto a desastres naturais de grande escala, como inundações e terramotos, e é bom para aplicações que requeiram um alto n´ıvel de tolerância a faltas, tal como as transacções atómicas, devido à m´ınima probabilidade de perda de dados nas operações de escrita.

Este último pode ser implementado com um par de discos r´ıgidos ligados, digamos Disco1 e Disco2. O Disco2 serve de backup do Disco1, sendo que uma modificação dos dados é efectuada em primeiro lugar no Disco1, os dados são verificados e são finalmente guardados no Disco2. No caso de os discos terem blocos com diferentes valores, pode-se assumir que os do Disco1 são os correctos, já que foi o primeiro a ser modificado. Os blocos do Disco1 podem então ser copiados para o Disco2 para que, quando o processo de recuperação iniciar, os discos estejam idênticos.

Este tipo de armazenamento é bom para aplicações que requeiram um alto n´ıvel de tolerância a faltas, tal como as transacções atómicas, devido à m´ınima probabilidade de perda de dados nas operações de escrita.

Checkpoints. O checkpointing consiste em criar uma cópia do estado actual do sistema e gravá-la para um local seguro. Esta técnica é a mais utilizada na recuperação para trás, já que permite o armazenamento estável periódico do estado do sistema [44]. Este estado do sistema é global e consistente em todos os processos, sendo denominado de snapshot. Aquando uma recuperação, os processos devem recuperar a snapshot mais recente, sendo que esta define a linha de recuperação do sistema. No entanto, encontrar a linha de

Cap´ıtulo 2. Trabalhos relacionados 18

recuperação pode não ser simples usando apenas checkpoints. Para o fazer, cada processo tem de retroceder o seu estado até ao checkpoint mais recente e, caso o estado recuperado desse checkpoint não forme uma snapshot distribu´ıda, os processos terão de retroceder ainda mais, até que isso aconteça.

Caso os checkpoints efectuados sejam independentes, i.e., se os processos realiza- rem os seus checkpoints locais e independentemente dos restantes, o cálculo da linha de recuperação torna-se ainda mais complexo. Para além disso, tem de existir também um garbage collectorque limpa periodicamente o armazenamento local de cada processo, à medida que o número de checkpoints guardados aumenta.

Para resolver os problemas dos checkpoints independentes, é preciso coordená-los entre os processos. Isto significa que todos os processos sincronizam as suas escritas para o local de armazenamento, mantendo o estado gravado consistente. Uma solução simples para implementar estes checkpoints coordenados é um protocolo de commit de duas fases e bloqueante. Um processo coordenador envia uma mensagem CHECKPOINT REQUEST

a todos os restantes processos. Ao receberem essa mensagem, criam um checkpoint local e guardam quaisquer operações posteriores para mais tarde serem executadas, ou seja, bloqueiam a sua execução. Depois, confirmam com o processo coordenador que já efec- tuaram o checkpoint. Quando o coordenador recebe todas as confirmações, envia uma mensagem CHECKPOINT DONE a todos os restantes processos que estejam bloqueados, para que estes possam continuar a execução de operações.

Muitos sistemas distribu´ıdos BFT combinam checkpoints com logging de mensagens. Um processo poderia também fazer um log das mensagens que recebe (logging baseado no receptor), antes de as entregar à aplicação. Na reprodução do estado, cada processo retrocede para o checkpoint mais recente e reproduz o log de mensagens pela respectiva ordem. Isto garante a reprodução dos eventos que ocorreram após a criação do checkpoint mais recente.

Logging de mensagens. A ideia do logging de mensagens é que, se a transmissão de mensagens pode ser repetida, então conseguimos atingir um estado globalmente consistente sem que seja necessário carregá-lo do local de armazenamento. Em vez disso, um checkpointpreviamente armazenado é considerado um ponto de partida e todas as mensagens trocadas após esse checkpoint são simplesmente retransmitidas e reprocessadas [44]. Esta abordagem funciona bem assumindo um modelo determin´ıstico, em que os processos executam eventos não deterministas (p.ex., recepção de mensagens), deterministicamente. Existem duas formas de logging poss´ıveis: pessimista e optimista. Os protocolos de logging pessimista asseguram que cada mensagem não estável m é entregue a um processo P , no máximo uma vez. As mensagens são consideradas estáveis quando são guar- dadas de forma a que não se percam (p.ex., são escritas para o armazenamento estável). No pior cenário, o processo P falha sem ter armazenado m. Para lidar com este cenário, o

Cap´ıtulo 2. Trabalhos relacionados 19

loggingpessimista faz com que P armazene m antes de enviar qualquer outra mensagem, para evitar inconsistˆencias no estado entre processos correctos e faltosos.

Figura 2.8: Logging optimista [44].

Pelo contrário, os protocolos de logging optimista, permitem que o processo R envie m2 antes de a armazenar num local seguro (ver figura 2.8). Isto significa que, após a falha de Q e a sua respectiva recuperação, R não reenvia m2 a Q, fazendo com que este processo não re-execute m2 e reenvie m3. Esta situação deixa o sistema num estado inconsistente.

Para evitar esta inconsistência, os protocolos de logging optimista fazem com que os processos correctos que dependem dos processos que falharam (R depende de Q na recepção de m3), retrocedam para um estado onde a inconsistência deixe de se verificar. No caso da figura 2.8, R recuaria até ao momento anterior à recepção de m1 e voltaria a executar m1, seguindo-se o envio de m2 que levaria à recepção de m3.

Os protocolos de logging optimista s˜ao mais complexos e portanto mais dif´ıceis de implementar, sendo os protocolos de logging pessimista os mais utilizados na pr´atica.

No documento Gestão de estado eficiente no serviço de coordenação DDS (páginas 36-39)