Microbenchmarks sem replicac¸˜ao - Gestão de estado eficiente no serviço de coordenação DDS

Para avaliar o DDS sem as limitações de latência impostas pela biblioteca de replicação, foram feitas algumas experiências com o DepSpace e o DDS sem a camada de replicação. Assim, foi iniciada uma réplica numa das máquinas apresentadas na secção 4.1 e foram- lhe passados batches de operações contendo entre 1 e 1000 operações.

Nas experiências feitas, foram criados vários tuplos para inserir nos espaços de tuplos e ainda padrões (i.e., templates) para as operações de remoção e leitura. Os tuplos criados contêm 4 campos no formato String, num total de 1KB de tamanho1, ou seja, cada campo ocupa 256 bytes. Dado que cada string é representada no formato UTF-16 [32], onde cada caractere é representado por 2 bytes, os campos dos tuplos / templates são preenchidos com strings de 128 caracteres. Antes de dar in´ıcio às experiências, as strings utilizadas são obtidas de um ficheiro que contém 40000 strings diferentes, todas com 128 caracteres, e são distribu´ıdas uniformemente pelos tuplos.

Enquanto isso, os templates das operações de remoção e leitura são também repre- sentados por tuplos de 4 campos. No entanto, apenas os dois primeiros são strings do ficheiro, sendo os dois últimos compostos pela string “*”, que representa um campo não definido (ver [5] para mais detalhes).

A distribuição uniforme das strings faz com que todas elas tenham a mesma probabilidade de ser utilizadas no tuplos ou templates criados pelos clientes. Isto faz com que a probabilidade de uma operação de leitura ou remoção utilize um template com os mesmos campos de um tuplo que existe no espaço de tuplos, garantindo assim que estas operações têm alguma probabilidade de sucesso, ainda que inferior a 100%.

Para além do débito e latência dos sistemas, foram testadas duas novas concretizações dos espaços de tuplos e ainda o tempo de criação de checkpoints de vários tamanhos e o tempo de leitura de um ficheiro de log e recriação das operações contidas nesse ficheiro.

Cap´ıtulo 4. Avaliac¸˜ao 39

4.3.1 Avaliação das concretizações do espaço de tuplos

As versões iniciais do DepSpace implementam o espaço de tuplos como uma lista de tuplos, o que permite obter bons resultados de latência nas operações de out, pois apenas se insere o tuplo pretendido no final da lista. No entanto, as latências das operações inp (remoção) e rdp (leitura) são demasiado altas devido à pesquisa ineficiente no espaço de tuplos. O algoritmo de pesquisa consiste apenas em percorrer toda a lista, tuplo a tuplo, até encontrar o tuplo pretendido (complexidade linear).

De forma a optimizar estas operações, foram propostas duas novas concretizações para o espaço de tuplos, baseadas em ´ındices (ver secção 3.4.2). As concretizações di- vergem apenas na ordenação dos ´ındices implementados, sendo uma baseada em ´ındices ordenados(ou IO) e a outra em ´ındices não ordenados (ou INO), considerando dois n´ıveis de profundidade (ver figura 3.5).

Após a implementação das novas concretizações de espaços de tuplos, foi feita uma avaliação ao desempenho do DepSpace e do DDS com os 3 diferentes tipos de espaços de tuplos, para verificar qual a implementação que teria o melhor desempenho nas operações de inserção (out) e remoção (inp).

Para testar a operação inp, foi necessária a introdução de uma fase de pre-warmup onde são inseridos tuplos nos espaços de tuplos. Esta fase é necessária para garantir uma taxa de sucesso das operações realizadas nas experiências.

As tabelas 4.3 e 4.4 mostram os resultados da latência de cada operação out e inp, respectivamente, considerando batches (ver secção 3.2.1) de vários tamanhos.

Tal como previsto, a lista de tuplos é a implementação que atinge as menores latências nas operações out (cerca de 8% menores do que as conseguidas com INO e 46% menores do que as obtidas com IO, se considerarmos batches de 1000 mensagens no DepSpace), dada a simplicidade da operação em questão. As implementações com ´ındices, têm um processamento adicional de verificar se os ´ındices correspondentes àquele tuplo existem, criar os ´ındices em caso negativo e, no último n´ıvel considerado, inserir o tuplo na lista de tuplos a que corresponde. Entre as novas implementações de espaços de tuplos, os ´ındices não ordenados são ligeiramente melhores do que os ordenados.

No entanto, se considerarmos os resultados das experiências com batches de 1000 operações no DDS, podemos ver que os ´ındices ordenados superam os ´ındices não ordenados.

Em termos de remoção de tuplos, a lista é claramente ineficiente, sendo que a introdução de espaços de tuplos com ´ındices melhorou significativamente as latências destas operações (melhorias de 99% com ambos os ´ındices, comparando os resultados das latências de batchesde 1000 mensagens). Mais uma vez, os ´ındices não ordenados fazem os sistemas obterem resultados de latências ligeiramente melhores do que os ´ındices ordenados. Es- tas diferenças são mais vis´ıveis nos resultados obtidos com o DDS, onde a latência da execução de batches com 1000 operações de remoção em ´ındices não ordenados é 91%

Cap´ıtulo 4. Avaliac¸˜ao 40

inferior à latência de execução de batches semelhantes em espaços de tuplos com ´ındices ordenados.

Latˆencia (ms)

DepSpace DDS Tamanho do Batch Lista INO IO Lista INO IO

1 0,457 0,064 0,068 7,074 6,737 6,537 10 0,231 0,062 0,059 1,582 1,703 1,543 100 0,030 0,032 0,034 0,218 0,221 0,219 1000 0,024 0,037 0,040 0,069 0,089 0,069

Tabela 4.3: Latências das operações out com o processamento de batches de diferentes tamanhos no DepSpace e no DDS com diferentes concretizações dos espaços de tuplos.

Latˆencia (ms)

DepSpace DDS

Tamanho do Batch Lista INO IO Lista INO IO 1 1,141 0,232 0,216 5,963 5,004 5,193 10 2,2415 0,052 0,134 2,537 1,468 2,01 100 2,782 0,044 0,055 2,827 0,199 0,661 1000 3,213 0,041 0,047 3,494 0,063 0,694

Tabela 4.4: Latências das operações inp com o processamento de batches de diferentes tamanhos no DepSpace e no DDS com diferentes concretizações dos espaços de tuplos.

Os resultados apresentados mostram também que, com o aumento do tamanho do batchprocessado, a diferença entre as latências das operações no DepSpace e no DDS diminui, o que significa que as latências impostas pelo logging das operações diminui ao ponto de poder ser desconsiderada.

Através dos resultados resultados obtidos, podemos concluir que a implementação de espaços de tuplos com ´ındices não ordenados (INO) foi a que obteve melhores resultados nas operações de remoção de tuplos, pelo que todos os resultados apresentados nas próximas secções já consideram o uso destes espaços de tuplos.

4.3.2 DDS vs DepSpace

Ainda considerando testes locais nas máquinas Servidor, a figura 4.1(a) mostra a evolução do débito de operações out com o aumento do tamanho dos batches passados ao DepSpace e ao DDS, enquanto a figura 4.1(b) mostra a evolução da latência das operações out com o aumento da carga em ambos os serviços.

Os resultados mostram que o DDS consegue debitar quase tantas operações por segundo como o DepSpace, caso os batches de operações sejam grandes o suficiente. Com batchesde 100000 mensagens, o DepSpace debita 25000 ops/s e o DDS debita 18333 ops/s, ou seja, uma diminuição de apenas 26% do DepSpace para o DDS.

Cap´ıtulo 4. Avaliac¸˜ao 41

Em termos de latência de operações, pode observar-se um aumento das latências com o aumento do débito em ambos os serviços. Com batches de 100000 mensagens, o DDS tem uma latência de 4500 ms por cada batch, enquanto o DepSpace tem uma latência de 3500 ms, ou seja, um aumento de 1 segundo do DepSpace para o DDS. A razão das latências do DDS serem superiores às do DepSpace é a escrita das suas operações para o disco, o que não acontece neste último.

(a) Débitos do DepSpace e do DDS sem camada de replicação.

(b) Comparação entre os débitos do DDS e as latências das suas operações.

Figura 4.1: Resultados das experiências no DepSpace e no DDS sem a camada de replicação.

No entanto, se o DDS implementasse logging s´ıncrono em vez de logging paralelo à execução das suas operações e escrevesse as operações individualmente para disco em vez de batches de mensagens, a tabela 4.2 mostra que a latência de execução de 100000 operações seria de 699500 ms, o que equivale a mais de 11 minutos. Nas mesmas condições, ou seja, a executar operações individualmente, o DepSpace demoraria 40772 ms, ou seja 40 segundos, a executar as mesmas 100000 operações, enquanto o DDS optimizado com logging paralelo e batching de operações demoraria 505 ms, ou seja, 8 segundos, a executar essas mesmas operações . Com estes valores conclu´ımos que o DDS não optimizado teria uma latência superior à do DepSpace em 11 minutos e que a optimização do logging em conjunto com a execução de batches de operações melho- raram as latências do DDS em 19871%, representando melhorias muito significativas no desempenho do serviço.

4.3.3 Logging & Checkpointing

Depois de implementados os algoritmos de leitura e escrita de ficheiros de log e de checkpoint, foram realizadas experiências para avaliar os tempos de leitura de um ficheiro de loge recuperação do estado contido nele e ainda o tempo de escrita de um checkpoint

Cap´ıtulo 4. Avaliac¸˜ao 42

para disco. As expericências efectuadas consideraram leituras e escritas de ficheiros com 100, 1000, 10000 e 100000 tuplos de 4 campos e com 64, 256, 512 e 1024 bytes e ainda uma operação para a criação do espaço de tuplos.

Os resultados da escrita de checkpoints estão na figura 4.2(a) e os resultados da recuperação do estado a partir do ficheiro de log estão na figura 4.2(b).

Como era de esperar, os resultados mostram que o aumento do tamanho dos tuplos inseridos aumenta a latência da escrita dos checkpoints e da recuperação do estado do log.

(a) Latência da geração de checkpoints no DDS. (b) Latência das recuperações de estado a partir do ficheiro de log no DDS.

Figura 4.2: Resultados das experiˆencias efectuadas com as camadas de logging e check- pointingdo DDS.

Ainda em relação às escritas dos checkpoints, podemos ver que escrever checkpoints com 10000 tuplos de 1024 bytes (aproximadamente 10 MB de estado) demora 439.3 ms, ou seja, menos de meio segundo. Isto significa que, com 10000 tuplos de 1 KB no espaço de tuplos, no momento em que o sistema tem de escrever um checkpoint, a execução de operações dos clientes pára durante menos de um segundo, o que pensamos ser bastante aceitável.

A recuperação de estado a partir do log demora, no caso de existirem 10000 tuplos de 1KB no ficheiro, 5.8 segundos, ou seja, nesse intervalo de tempo o DDS lê e interpreta o log, cria o espaço de tuplos e insere lá todos os 10000 tuplos. A diferença entre recuperar 10000 tuplos com 64 e 1024 bytes é de 1.6 segundos (4.1 segundos para tuplos com 64 bytese 5.8 segundos com tuplos 1024 bytes), ou seja, um aumento de 41%, o que mostra que o tamanho dos tuplos influencia bastante a latência da recuperação do estado a partir dos ficheiros.

Cap´ıtulo 4. Avaliac¸˜ao 43

No documento Gestão de estado eficiente no serviço de coordenação DDS (páginas 58-63)