Limita¸c˜ ao de cache - Publicações do PESC DF-DTM: Explorando Redundância de Tarefas em Datafl

Este experimento avalia o comportamento do reúso para as estratégias de deteçcão implementadas em um cenário onde o tamanho da cache NRT e SRT é limitado. Come¸camos com uma cache de tamanho 100, e aumentamos a quantidade de suas entradas até chegarmos em um cenário de cache infinita. A pol´ıtica de substitui¸cão utilizada foi a LRU Least Recently Used. Cada cenário de cache foi executado 8 vezes. Os benchmarks foram utilizados com o menor grão de tarefa poss´ıvel para cada cenário. O número de workers utilizados foram 8. As figuras 7.14, 7.15 e 7.16 apresentam os resultados deste experimentos para as diferentes estratégias. O eixo

Figura 7.13: Resultados de reúso sob a influência de paralelismo para a estratégia LRQ.

x mostra o tamanho das caches utilizadas e o eixo y apresenta as taxas de reúso (máxima, real e distribui¸cão). As esquemati¸cões das barras dos gráficos seguem o mesmo modelo apresentado nas se¸cões 7.5 e 7.6.

7.7.1 Estrat´egias EM e EM+I

A figura 7.14 apresenta os resultados deste experimento para as estratégias EM e EM+I. Pode-se notar que, para estas estratégias, com uma cache de 200 entradas conseguimos atingir para o benchmark LCS um comportamento semelhante a de uma cache infinita. Isso pode ser explicado, pois o tempo necessário para que um operando seja reutilizado nesta aplica¸cão é muito curto, e depois de um determinado per´ıodo de execu¸cão, ele não é mais utilizado. Isso garante que uma cache razoavel- mente pequena, onde a deteçcão de reúso é imediata, atenda bem a localidade de valores da aplica¸cão. Analisando a SRT para a aplica¸cão LCS, vemos que a contribui¸cão desta para redundância detectada também a mesma de uma cache infinita, aproximadamente 3, 33%.

Para o benchmark 3-DES, vemos que uma cache NRT de 3.200 entradas tem os mesmos benef´ıcios de uma cache infinita. Note que para este benchmark, na figura 7.14a, vemos que a cache com 400, 800 e 1.600 entradas possuem comportamentos semelhantes. Quando a inspe¸cão é habilitada, notamos que o aumento da cache para esses três cenários aumenta a contribui¸cão da redundância detectada pelo mecanismo de inspe¸cão, conforme apresentado na figura 7.14b. Acreditamos que, mesmo que os comportamentos destes três cenários sejam semelhantes, as caches maiores permitem que mais tarefas sejam liberadas para execu¸cão simultaneamente, o que gera mais tarefas nas filas de prontos, e, consequentemente, potencializa a deteçcão por parte

da t´ecnica de inspe¸c˜ao.

(a) Estrat´egia EM.

(b) Estrat´egia EM+I.

Figura 7.14: Resultados de reúso com limita¸cão do tamanho da cache para as es- tratégias EM e EM+I.

O benchmark GoL apresenta um comportamento regular de incremento no reúso detectado tanto por inspe¸cão, quanto por acertos na NRT, conforme o tamanho das caches é incrementado. Note que com uma cache de 800 entradas apenas, temos reúso similar a uma cache infinita para ambos escalonadores. Da mesma forma o efeito da inspe¸cão é o mesmo a partir de uma cache de 800 entradas.

A aplica¸cão MapReduce não demonstrou uso de caches para a estratégias EM, pois, por conta da explosão de paralelismo desta aplica¸cão, grande parte das tarefas são colocadas na fila de prontos simultaneamente, retirando, assim, a oportunidade para o reúso. Vemos a redundância sendo detectada neste tipo de escalonador somente quando utilizamos inspe¸cão (estratégia EM+I). Neste caso, o tamanho das

caches NRT e SRT não influenciam a contribui¸cão da inspe¸cão.

7.7.2 Estrat´egias LM e LM+I

As estratégias LM e LM+I, figura 7.15a e 7.15b respectivamente, não alteram o comportamento da deteçcão de reúso dos benchmarks GoL e LCS, se comparados `

as estrat´egias EM e EM+I.

(a) Estrat´egia LM.

(b) Estrat´egia LM+I.

Figura 7.15: Resultados de reúso com limita¸cão do tamanho da cache para as es- tratégias LM e LM+I.

Para as estratégias LM e LM+I, o benchmark 3-DES apresentou uma taxa de reúso real por parte da NRT de 4, 23% e 4, 35%, respectivamente, com uma cache de 1600 entradas. Esta foi uma contribui¸cão muito inferior à avaliada nas estratégias EM e EM+I. Para este mesmo cenário de cache com 1600 entradas, mas com as

estratégias EM e EM+I, a contribui¸cão da NRT foi de 27, 62% e 13, 64%, respectivamente. Para tamanhos menores do que 1600, as estratégias LM e LM+I não alcan¸caram uma taxa de reúso acima de 1%, enquanto para as estratégias EM e EM+I, a NRT já possu´ıa uma contribui¸cão de 7, 83% e 4, 84% para o cenário com apenas 100 entradas. Esta desvantagem das estratégias LM’s em rela¸cão às EM’s é explicada pelo fato de que as estratégias LM’s processam muitos operandos antes de come¸carem a deteçcão de redundância. Portanto, quando a cache é verificada para descobrir se o resultado de uma determinada tarefa já é conhecido, os operandos daquela tarefa já não estão mais presentes na cache, pois muitos novos operandos foram inseridos e essas entradas foram descartadas. Vemos que a partir de uma cache de 3.200 entradas esse comportamento é eliminado e temos resultados semelhantes a uma cache infinita. Note também que a contribui¸cão da técnica de inspe¸cão na estratégia LM+I foi maior do que a contribui¸cão da mesma técnica na estratégia EM+I para o 3-DES. Acreditamos que, pelo fato da estratégia de deteçcão LM+I proporcionar que mais tarefas sejam disponibilizadas na fila de prontos, a inspe¸cão para este escalonador foi potencializada.

O benchmark MapReduce apresentou comportamento similar, com poucas va- ria¸cões, para os cenários de caches. Por conta deste benchmark ter pouco reúso detectado por estas estratégias, ainda que com cache infinita, é natural que uma cache pequena seja o suficiente para capturar esta pequena amostra de redundância.

7.7.3 Estrat´egia LRQ

A figura 7.16 apresenta a influência do tamanho da cache e a pol´ıtica LRU de substitui¸cão para a estratégia LRQ.

O benchmark LCS, para a estratégia LRQ, somente atingiu um comportamento semelhante a uma cache infinita a partir de 800 entradas. As demais estratégias, apresentaram um comportamento de cache infinita a partir de 200 entradas apenas. Isso ocorreu, pois a estratégia LRQ realiza deteçcão tardia, e, por conta disso, perde a oportunidade de reutilizar tarefas que possu´ıam seus resultados escritos na cache muito cedo. Vemos que a partir de 800 entradas, temos um reúso de 98, 17% para a LRQ. Este reúso real detectado é superior à redundância detectada pelas outras estratégias com caches infinitas. Vemos o mesmo comportamento para os benchmarks 3-DES e GoL. No caso do 3-DES, com uma cache NRT de 3.200 entradas conseguimos os mesmos benef´ıcios de uma cache infinita, alcan¸cando uma deteçcão de redundância de 71, 97%, muito superior à taxa alcan¸cada pelas estratégias LM’s e EM’s com caches NRT infinitas· Da mesma forma, para o GoL, o reúso alcan¸cado com uma NRT de apenas 800 entradas, aproximadamente 99, 70%, foi superior ao reúso detectado pelas demais estratégias nos cenários ilimitados sem inspe¸cão, e

semelhante às demais estratégias com inspe¸cão.

Figura 7.16: Resultados de reúso com limita¸cão do tamanho da cache para a es- tratégia LRQ.

Na aplica¸cão MapReduce, somente com a cache de tamanho máximo de 15.000 entradas, alcan¸camos uma taxa de reúso real de 54, 13%, apenas 0, 6% abaixo do reúso máximo permitido pela entrada da aplica¸cão. Isso ocorreu pelo fato de que a explosão de paralelismo que essa aplica¸cão apresenta gerou muitos operandos distin- tos em curto espa¸co de tempo, sendo necessária uma cache maior para armazenar todos esses resultados e permitir o reúso destes por tarefas posteriores.

O fato de que para os 4 benchmarks, caches relativamente pequenas proporcio- naram uma grande quantidade de reúso de nós, demonstra que essa técnica possui aspectos promissores para implementa¸cões em hardware.

No documento Publicações do PESC DF-DTM: Explorando Redundância de Tarefas em Dataflow (páginas 110-115)