Melhorias no DepSpace - Gestão de estado eficiente no serviço de coordenação DDS

3.4.1 Paralelização de operações nos diversos espaços de tuplos

As primeiras versões do DepSpace [5, 35] realizam apenas uma operação de cada vez, o que se torna o sistema ineficiente se considerarmos que as operações devem ser escritas para disco (c.f., secção 3.2.1).

Este novo paradigma levou a que alterássemos o DepSpace para executar batches de operações nos seus espaços de tuplos.

Assim, quando recebe um batch de mensagens para os seus diversos espaços de tuplos, o DDS divide-o em vários batches, cada um contendo as operações relativas a um único espaço de tuplos (c.f., figura 3.4). Esses batches são depois entregues aos respectivos espaços de tuplos, que executam todas as operações e devolvem um batch com os resultados das operações executadas. O DDS ordena os resultados, pela ordem em que re- cebeu as operações, num único batch e entrega-o à camada de replicação, para que sejam encaminhados para os respectivos clientes.

Figura 3.4: Execução s´ıncrona (à esquerda) e paralela (à direita) de operações nos diversos espaços de tuplos do DepSpace.

3.4.2 Optimização das operações de leitura e remoção de tuplos

A implementação inicial do DepSpace considerava um espaço de tuplos como sendo uma lista de tuplos. Com a construção do DDS, a utilização destas listas passou a constituir um problema, já que impõem uma maior latência em operações como a remoção ou leitura de tuplos. Esta maior latência provém do facto de ser necessário percorrer todos os elementos na lista, até encontrar o tuplo que pretendemos remover ou ler.

Como um serviço de coordenação é utilizado maioritariamente para leituras de dados [11, 20], é importante que estas operações de leitura sejam rápidas, de modo a aumentar o desempenho do sistema.

Assim, criámos duas novas implementações de espaços de tuplos que utilizam n ´ındices, para facilitar a pesquisa de um tuplo. Cada ´ındice i é composto por uma lista com todos os tuplos que têm apenas i campos e por um mapa com várias entradas. Cada

Cap´ıtulo 3. DDS – Durable DepSpace 33

uma destas entradas faz a correspondência entre uma chave e um valor, como mostra a figura 3.5. A chave do mapa é h, que é o hash do i-ésimo campo de um tuplo inserido, e o valor é o mapa do ´ındice i + 1 que mapeia os (i + 1)-ésimos campos dos tuplos cujo hash do i-ésimo campo é h. A diferença entre as duas implementações reside na ordenação dos elementos dos mapas, sendo que uma das implementações utiliza ´ındices ordenados, através do uso de TreeMaps [33], e a outra utiliza ´ındices não ordenados, através do uso de HashMaps [30].

Figura 3.5: Espac¸o de tuplos com ´ındices.

Na pesquisa de um tuplo com x campos, em que x > 0, o sistema compara o campo i do tuplo com o elementos do ´ındice i do espac¸o de tuplos, at´e chegar ao ´ındice x, caso x < n, ou n, se x ≥ n.

Depois de encontrar a lista onde poder´a estar o tuplo pretendido, o sistema compara apenas os campos que n˜ao se encontram nos ´ındices (c.f. figura 3.5).

A adopção destes novos espaços de tuplos permite ao DDS obter um maior débito de operações de remoção / leitura de tuplos, em comparação com o DepSpace original, conforme os resultados apresentados no cap´ıtulo 4.

3.4.3 Locking

A biblioteca BFT-SMaRt [41], permite a execução de operações de leitura sem serem ordenadas pelo seu protocolo de ordenação de mensagens. Isto significa que, enquanto o DDS executa um batch de mensagens ordenadas (p.ex.,adição e remoção de tuplos), podem chegar várias operações de leitura ao sistema.

Cap´ıtulo 3. DDS – Durable DepSpace 34

Dado que estas operações não ordenadas têm de ser executadas em paralelo com as ordenadas, é necessário um mecanismo de controlo que mantenha a coerência do estado e que garanta que a ordem correcta de todas as operações. No caso de existir uma operação que insere um tuplo R num espaço de tuplos, qualquer operação de leitura de R que seja executada após a sua escrita deve conseguir lê-lo. Sem um mecanismo de controlo de acesso aos espaços de tuplos, uma operação de leitura de R feita concorrentemente com a sua escrita poderia não conseguir ler o tuplo, já que as operações de leitura não são ordenadas com as de escrita.

Foram ent˜ao implementados dois tipos de mecanismos de controlo (moderate e extreme locking), que oferecem diferentes tipos de garantias de controlo no DDS.

Moderate locking. Este mecanismo de controlo é implementado ao n´ıvel do espaço de tuplos. Cada ´ındice do espaço de tuplos (ver secção 3.4.2) possui um lock que pode ser adquirido para leitura, podendo ser partilhado por vários clientes do DDS, ou escrita, em que apenas um cliente adquire este lock para actualizar o espaço de tuplos.

Numa primeira fase de pesquisa, os locks são adquiridos para leitura, sendo apenas adquiridos para escrita quando existe uma escrita ou remoção de tuplos ou de elementos de um ´ındice.

O problema do moderate locking é que um tuplo pode ser lido por um cliente antes de ser escrito para disco. No entanto, na ocorrência de uma falha total no sistema antes de o tuplo ser escrito para disco, este não é recuperado quando o sistema reinicia.

Assim, um cliente tente ler um tuplos antes e depois de uma falha total, vai obter dois resultados diferentes, o que torna o sistema inconsistente.

Extreme locking. O extreme locking resolve o problema do moderate locking através do lockingdo sistema logo na recepção de mensagens. Assim, as operações não ordenadas só executam após as operações ordenadas e vice-versa.

Porém, este mecanismo faz com que o débito do sistema diminua, pois o número de operações não ordenadas que são executadas diminui.

No documento Gestão de estado eficiente no serviço de coordenação DDS (páginas 52-54)