Universidade de S˜ao Paulo

(1)

Instituto de Matem´ atica e Estat´ıstica Departamento de Ciˆ encia da Computa¸ c˜ ao

Relat´ orio Cient´ıfico

Per´ıodo: Mar¸co/2002 - Agosto/2002

Bolsa de Mestrado - FAPESP

Cache Comprimido em Sistemas de Mem´ oria Virtual

Bolsista

Rodrigo Souza de Castro Orientador

Prof. Dr. Alair Pereira do Lago

(2)

Resumo do Projeto

Face ao impacto no desempenho dos programas, à sua complexidade e à não optimalidade das solu¸cões existentes, o estudo da memória virtual continua recebendo a aten¸cão dos pesquisadores e desenvolvedores de sistemas operacionais. É particularmente importante o sistema de pagina¸cão em disco, que lida com uma das maiores disparidades: a diferen¸ca entre os tempos de acesso à memória principal e aos discos.

Diversos estudos foram feitos a esse respeito, e o assunto foi retomado recentemente com maior for¸ca. Os principais argumentos desses estudos foram obtidos através de simula¸cões baseadas em dados de um sistema real. Em 1999, Scott F. Kaplan [3] provou que através de um cache adaptativo de páginas comprimidas na memória principal podemos ter ganhos de desempenho, pelo fato de se diminuir a pagina¸cão em disco.

Esta técnica torna-se atraente face à perspectiva de que os custos de compressão continuem diminuindo.

Isso deve-se essencialmente `a disparidade cada vez maior entre a velocidade dos processadores e latˆencia dos discos.

Até hoje não se conhece nenhuma implementa¸cão desse sistema de cache adaptativo de páginas comprimidas proposto por Wilson e Kaplan [13, 3] tampouco um estudo que, com base em uma implementa¸cão real, caracterize cenários em que a compressão tenha um impacto particularmente positivo ou negativo. Esse projeto de pesquisa de mestrado visa um estudo rigoroso da literatura relativa ao problema e a implementa¸cão das técnicas e algoritmos estudados previamente, em especial a implementa¸cão das idéias propostas por Kaplan.

(3)

1 Plano de Trabalho (Inicial vs Realizado)

Legenda

Executado √

Parcialmente Executado ◦

A ser executado •

Atividades

1 disciplinas do programa de p´os-gradua¸c˜ao √

2 estudo de t´ecnicas de gerenciamento de mem´oria √

3 estudo do enfoque do gerenciamento de mem´oria do Linux 2.4 √

4 estudos das propostas decache comprimido √

5 estudo dos algoritmos de compress˜ao das p´aginas √

6 implementa¸cão de protótipo para a cria¸cão de estat´ısticas de compressão no Linux √ 7 estudo sobre a inclusão docache comprimido no código do Linux √ 8 estudo de parâmetros do sistema para o cache adaptativo √

9 cria¸c˜ao do projeto de implementa¸c˜ao √

10 implementa¸cão de protótipo que não leva em conta parâmetros do sistema √ 11 avalia¸cão da implementa¸cão via “micro-benchmarks” ◦

12 reda¸c˜ao da proposta da disserta¸c˜ao √

13 exame de qualifica¸c˜ao √

14 primeiro estudo do impacto dessecache comprimido estático e primitivo √ 15 inser¸cão no protótipo dos parâmetros de adaptabilidade ◦

16 segundo estudo do impacto docache comprimido ◦

17 caracteriza¸cão de workloads favoráveis e desfavoráveis ◦ 18 reda¸cão de relatórios semestrais para a Fapesp ◦

19 reda¸c˜ao de eventuais artigos •

20 reda¸c˜ao da disserta¸c˜ao ◦

21 exame de disserta¸c˜ao •

(4)

2 Cronograma (Inicial vs Realizado)

Legenda

proposto executado √

parcialmente executado ◦ a ser executado • não será executado × não proposto executado ?

a ser executado ·

2001/2002

Mar Abr Mai Jun Jul Ago Set Out Nov Dez Jan Fev

1 √ √ √ √ √ √ √ √

2 √

3 √ √ √ √

4 √

5 √

6 √

7 √

8 √ √

9 √ √

10 √ √ √

12 √

13 √

2002/2003

Mar Abr Mai Jun Jul Ago Set Out Nov Dez Jan Fev

10 √

11 ◦

14 √

15 √ √ √ √

◦

16 ◦

17 √

◦

18 ? × ? ×

19 • •

20 √ √ √

• • •

21 •

(5)

3 Principais Realiza¸ c˜ oes

3.1 Resumo

Essa se¸cão visa apresentar um detalhamento das realiza¸cões efetuadas no per´ıodo ao qual esse relatório se refere. Partindo do exame de qualifica¸cão, mostraremos sucintamente cada uma das etapas que nos levaram ao atual estado do projeto.

O projeto, iniciado em janeiro de 2001, encontra-se atualmente no estado em que contamos com uma implementa¸cão estável de um cache comprimido no kernel do sistema operacional Linux 2.4. O cache comprimido possui a caracter´ıstica de se adaptar ao comportamento do sistema, diminuindo ou aumentando o seu tamanho de acordo com a sua utilidade. Os resultados já obtidos através de testes de desempenho são bastante satisfatórios, sendo que as altera¸cões efetuadas no per´ıodo ao qual o relatório se refere exerceram uma grande influência para esses resultados. Algumas mudan¸cas visando ainda melhor desempenho estão sendo estudadas e efetuadas.

Para concluir, o nossos próximos passos são efetuar verifica¸cões e mudan¸cas finais no código, no que concerne à estabilidade e ao desempenho; execu¸cão de um conjunto de testes final; e a conclusão da escrita da disserta¸cão de mestrado.

3.2 Exame de Disserta¸ c˜ ao

No in´ıcio do per´ıodo ao qual esse relatório se refere, escrevemos a proposta de disserta¸cão como requerimento do programa de mestrado. Ela foi submetida para a comissão de pós-gradua¸cão do IME-USP, tendo sido aprovada para o exame de qualifica¸cão, que aconteceu no dia 29 de abril de 2002. Ele foi composto pela seguinte banca:

– Prof. Dr. Alair Pereira do Lago, IME - USP (orientador) – Prof. Dr. Edson Toshimi Midorikawa - Escola Polit´ecnica - USP – Prof. Dr. Fabio Kon - IME - USP

– Prof. Dr. Carlos Eduardo Ferreira - IME - USP (suplente)

A banca, após a exposi¸cão, aprovou o exame de qualifica¸cão do aluno.

3.3 Exame de Proficiˆ encia em L´ıngua Estrangeira

Outro requerimento do programa de mestrado é o exame de proficiência em l´ıngua estrangeira. A l´ıngua estrangeira escolhida foi inglês e esse exame foi feito com o Prof. Dr. Yoshiharu Kohayakawa no dia 26 de abril de 2002. O aluno foi aprovado no exame.

3.4 Semin´ arios em Sistemas de Computa¸ c˜ ao

Desde mar¸co de 2002, o aluno vem coordenando uma série de seminários de pós-gradua¸cão sobre sistemas de computa¸cão no IME - USP. Ele é responsável pela organiza¸cão dos seminários [12] e o contato com os palestrantes, tendo obtido ótimos resultados no primeiro semestre, em questão de um público muito maior que o obtido pelos seminários até então, além de seminários variados. No dia 05 de abril de 2002, o aluno deu um seminário sobre o seu projeto nessa série de seminários, apresentando todo o andamento do projeto e os resultados até aquele momento.

(6)

3.5 Algumas Defini¸ c˜ oes

Antes de descrever as realiza¸cões do projeto, é interessante relembrarmos parte da terminologia introdu- zida em etapas anteriores deste projeto e que serão utilizadas ao longo desse relatório.

Página de Memória Todo o espa¸co de endere¸camento de memória do sistema é dividido em pequenas partes conhecidas como páginas. O tamanho das páginas é dependente da arquitetura de hardware que se está utilizando. Na arquitetura i386, o tamanho de página é de 4 kilobytes.

Página de Memória Suja/Limpa Páginas de memória podem sersujas oulimpas. Páginas sujas necessitam ter os seus dados escritos em algum dispositivo que permita que esses dados possam ser recuperados.

Por sua vez, páginas limpas ¹ já se encontram armazenadas em algum dispositivo que permita ao sistema recuperá-las e não necessitam ser armazenadas novamente.

Página do Cache Comprimido Umapágina do cache comprimidoé uma página de memória²utilizada para armazenar páginas de memória comprimidas. O cache comprimido é composto por diversas páginas de memória com esse fim. Elas não são necessariamente cont´ıguas pois podem ser alocadas em momentos distintos e dependem da configura¸cão da memória do sistema no momento da aloca¸cão. Páginas de memória dispon´ıveis no sistema para os processos e para os caches do sistema de arquivos formam o que Kaplan definiu comocache não-comprimido.

Fragmento Uma página de memória armazenada em uma página do cache comprimido é conhecida como um fragmento. Portanto, uma página do cache comprimido possui um ou mais fragmentos, que podem estar comprimidos ou não. O caso em que se armazena uma página de memória no estado natural (i.e, não comprimido) acontece quando o resultado comprimido dos dados dessa página ocupam um tamanho maior que o seu tamanho original. Os fragmentos também são diferenciados por serem sujos (ou seja, a página original era considerada suja) ou limpos (a página que lhe deu origem era limpa). Caso necessite liberar espa¸co no cache comprimido, fragmentos limpos são simplesmente liberados enquanto os sujos são escritos nos seus respectivos dispositivos.

3.6 Melhoramentos

Tendo como motiva¸cão os resultados não satisfatórios obtidos no teste de compila¸cão do kernel do Linux até mar¸co de 2002, o próximo passo foi estudar qual era a causa desse mau desempenho e tentar melhorá-lo.

O primeiro problema encontrado com a análise dos dados de desempenho foi o ambiente em que os testes eram rodados. As execu¸cões iniciais eram rodadas em ambientes que simulavam uma máquina virtual, que apesar de serem bastante úteis para a descoberta de erros de programa¸cão, não eram acurados o suficiente nos seus dados de modo a permitir uma análise correta dos dados. Essas ferramentas foram abandonadas depois de nos levar a diversas dúvidas que contrariavam a teoria.

A seguir, notamos que se o kernel tivesse com recursos comoprofilingativados, o seu desempenho tamb´em sofreria altera¸c˜oes. Esses recursos foram cuidadosamente desativados.

Novas estat´ısticas foram coletadas, com separa¸cão por cache (swap cache ou page cache). Uma nova entrada (comp cache hist) no diretório /proc foi criada cuja sa´ıda era a situa¸cão do cache comprimido

1Páginas limpas podem ter tido os seus dados alterados e não se encontrar em algum dispositivo, mas nesse caso, as opera¸cões de entrada e sa´ıda são feitas através de estruturas conhecidas por buffers. Aqui desconsideramos as páginas com buffers pois nesse caso são os buffers que ficam sujos ou limpos.

2Na verdade, durante esse relatório veremos que uma das mudan¸cas efetuadas foi a possibilidade de usarmos mais páginas de memória cont´ıguas para resolver problemas como a melhor utiliza¸cão do espa¸co dentro do cache comprimido

(7)

no momento. Veja abaixo um exemplo de sa´ıda desse arquivo, que exibe o número de páginas do cache comprimido que tem determinado espa¸co livre cont´ıguo (linhas) pelo número de fragmentos que a página do cache comprimido contém (colunas). As linhas exibem faixas de valores em bytes e as colunas o número de fragmentos.

compressed cache - free space histogram (free space x number of fragments)

total 0f 1f 2f 3f 4f 5f 6f more

0: 4 0 0 0 3 0 0 0 1

1 - 400: 523 0 0 0 410 52 22 12 27

401 - 800: 41 0 0 0 36 1 0 2 2

801 - 1200: 1 0 0 0 1 0 0 0 0

1201 - 1600: 0 0 0 0 0 0 0 0 0

1601 - 2000: 118 0 0 117 0 0 0 0 1

2001 - 2400: 718 0 0 707 4 5 0 0 2

2401 - 2800: 22 0 0 22 0 0 0 0 0

2801 - 3200: 0 0 0 0 0 0 0 0 0

3201 - 3600: 0 0 0 0 0 0 0 0 0

3601 - 4000: 0 0 0 0 0 0 0 0 0

4001 - 4400: 0 0 0 0 0 0 0 0 0

4401 - 4800: 0 0 0 0 0 0 0 0 0

4801 - 5200: 0 0 0 0 0 0 0 0 0

5201 - 5600: 1 0 1 0 0 0 0 0 0

5601 - 6000: 0 0 0 0 0 0 0 0 0

6001 - 6400: 0 0 0 0 0 0 0 0 0

6401 - 6800: 0 0 0 0 0 0 0 0 0

6801 - 7200: 0 0 0 0 0 0 0 0 0

7201 - 7600: 0 0 0 0 0 0 0 0 0

7601 - 8000: 0 0 0 0 0 0 0 0 0

8001 - 8192: 0 0 0 0 0 0 0 0 0

Analisando os dados de execu¸cões e efetuando uma verifica¸cão atenciosa do código, também foi observado que eram efetuadas muito mais leituras do disco com o cache comprimido. Um dos culpados era uma falha conceitual da implementa¸cão na qual, caso uma página fosse lida do cache comprimido, era efetuado uma leitura readahead de diversas páginas armazenadas em posi¸cões subsequentes no dispositivo de armazenamento. O conceito de readahead se aplica somente a páginas armazenadas em disco, pois se faz uso da opera¸cão de leitura para ler diversos blocos ao mesmo tempo, visto que é provável que os próximos blocos sejam utilizados em um futuro recente. Esse conceito se aplica tanto a páginas lidas do swap assim como do page cache e o conserto foi certificar que essa leiturareadhead somente fosse feita para páginas que tivessem que ser lidas do disco.

Quando uma determinada página, em uma leitura dereadahead, já se encontra na memória, nada é feito.

No entanto, com o cache comprimido, durante uma leitura dereadahead, caso a página se encontrasse comprimida, ela seria descomprimida e armazenada no cache não-comprimido, alterando, portanto, a ordem LRU das páginas na memória. Como é conceitualmente errado, foi consertado esse erro ao não se descomprimir mais páginas caso fosse uma leiturareadhead.

No Linux, existem marcas d’água das páginas livres, ou seja, limites para manter um certo número de páginas livres para usos mais imediatos pelo próprio kernel. Dessa maneira, o kernel, sempre que o número de páginas livres estiver abaixo desses limites, executa o código para libera¸cão de memória. Com o cache comprimido, a quantidade de memória para o restante da memória (ou seja, o cache não-comprimido) é menor que o total de memória no sistema, no entanto, as marcas d’água eram calculadas sobre o total. A

(8)

conseqüência é que o cache não-comprimido ficava sobre uma pressão muito maior que o que seria esperado para o seu tamanho, o que ocasionava, em muitos casos, a pressão maior em todo o sistema.

Outras altera¸cões também influenciaram o desempenho do sistema, como a aloca¸cão de determinadas estruturas somente quando fossem ser utilizadas (como as estruturas do virtual swap) e a reescrita de determinados caminhos cr´ıticos do cache comprimido, notadamente o caminho executado quando precisa-se liberar espa¸co no cache.

3.7 Suporte a p´ aginas com buffers

Através de análises dos dados de execu¸cão, foi observado que, com o cache comprimido, muitas opera¸cões de entrada e sa´ıda era causadas por escrita de buffers sujos das páginas. As razões são: (1) páginas com buffers não eram armazenadas no cache comprimido; (2) o cache não-comprimido tinha uma pressão muito maior de memória em rela¸cão ao sistema sem cache comprimido (obviamente pelo fato de ser menor).

Decidimos então prover um suporte a páginas com buffers com o objetivo de diminuir a limpeza de buffers e assim diminuir as escritas durante a execu¸cão do kernel com cache comprimido. Esse suporte foi implementado, e páginas com buffers come¸caram a ser armazenadas no cache comprimido, mas sem serem comprimidas pois elas são acessadas diretamente pelo código de buffers. Comprimi-las não traria ajuda, pois elas certamente seriam escritas em breve pelo sistema de buffers, e o fato de estar comprimido levaria a uma descompressão em seguida para poder permitir a escrita (todos os buffers sujos do sistema são escritos em disco de tempos em tempos).

Testes executados mostraram uma diminui¸cão do número de escritas, mas isso não se traduzia em melhoria do desempenho. Além disso, as altera¸cões no código para a inserta¸cão desse tipo de página foram grandes e muito intrusivas, que por fim esse suporte foi removido.

3.8 Cache Comprimido de Tamanho Fixo Pr´ e-Alocado

Aplica¸cões reais têm, em geral, necessidades de memória variável durante a sua execu¸cão. Notamos isso sobretudo no teste de compila¸cão do Kernel do Linux com o aux´ılio de sa´ıdas periódicas do arquivo /proc/comp cache hist. Para determinados tamanhos do cache comprimido de tamanho fixo (pré-alocado na hora do boot) e da memória do sistema, observa-se que durante um tempo substancial da execu¸cão desse teste o cache comprimido não está completamente usado. Ou seja, as suas páginas pré-alocadas não têm utilidade durante boa parte da execu¸cão da aplica¸cão.

Aqui também é importante observar que essas páginas, além de não ter utilidade, ainda influenciam de modo bastante incisivo no desempenho do sistema. O fato de elas estarem alocadas – e não trazerem qualquer benef´ıcio para o sistema – resulta que a quantidade de memória dispon´ıvel para o cache não-comprimido

´

e menor. Isso implica que a pressão de memória é muito maior do que seria se houvesse mais páginas dispon´ıveis para o cache não-comprimido, dispendendo parte do tempo de execu¸cão das aplica¸cões no código de libera¸cão de memória do sistema de memória virtual, além de for¸car um número maior de escritas de páginas através do seu sistema de buffers.

Em termos práticos, para testes mais realistas como a compila¸cão do Kernel do Linux, notamos que o Kernel do Linux com o uso do cache comprimido não conseguia ter um desempenho melhor que o Kernel do Linux padrão. No máximo, conseguia-se ter um desempenho parecido, com pouco ou nenhum preju´ızo.

Através dessa análise chegamos à conclusão que o cache comprimido de tamanho fixo pré-alocado, apesar de ter um desempenho muito bom para determinadas aplica¸cões ³, não é a configura¸cão adequada para o seu uso de propósito geral.

3No relatório anterior exibimos algumas aplica¸cões com desempenhos muito bons com o cache comprimido de tamanho fixo pré-alocado.

(9)

3.9 Redimensionamento por “Demanda”

Tendo em vista a conclusão que o cache comprimido de tamanho fixo pré-alocado não era a configura¸cão ideal, resolvemos implementar uma pol´ıtica que não pré-alocasse o cache comprimido. A idéia consiste em ter um cache comprimido com uma pequena quantidade de páginas, somente o necessário para permitir algumas libera¸cões de páginas e evitar falhas de aloca¸cão ao crescer. A partir desse tamanho inicial, na medida em que for solicitado, ele vai crescendo até o tamanho máximo definido. O cache comprimido só cresce quando

´

e necessário, ou seja, quando o sistema de memória virtual está sob pressão e é necessário comprimir uma página, mas não há espa¸co no cache comprimido.

Uma vez o último fragmento de uma página é liberado, seja por ter sido escrito (fragmento sujo), por ter sido liberado (fragmento limpo) ou ainda por ter sido descomprimido e devolvido ao sistema, a(s) página(s) de memória usadas pela página do cache comprimido é(são) liberada(s) e o cache comprimido diminui de tamanho.

Essa pol´ıtica nos permitiu chegar a bons resultados. O teste de compila¸cão do Kernel do Linux, somente com essas mudan¸cas, come¸cou a ter tempos de execu¸cão melhores que o Kernel do Linux padrão.

3.10 Compacta¸ c˜ ao de Fragmentos

Ao longo da utiliza¸cão do cache comprimido, uma certa fragmenta¸cão da memória utilizada nas páginas do cache comprimido acontece pois fragmentos não adjacentes ao espa¸co livre cont´ıguo no final da página do cache comprimido podem ser removidos antes que o último fragmento. O espa¸co antes utilizados por estes fragmentos ficam sem uso pelo fato de haver outros fragmentos entre eles e o espa¸co livre cont´ıguo. Como o custo de movimentar os fragmentos dentro da página é muito grande se for executado a cada remo¸cão de fragmento, essa fragmenta¸cão acaba ocorrendo de qualquer forma em maior ou menor grau dependendo do tipo de acesso aos fragmentos do cache comprimido. Quanto menor a fragmenta¸cão, mais bem utilizado é o espa¸co reservado para o cache comprimido.

Oespa¸co livre cont´ıguo (em geral no final) de uma página do cache comprimido é o espa¸co não-utilizado para o armazenamento de fragmentos. À medida que fragmentos adjacentes a esse espa¸co livre são liberados, o espa¸co livre é incrementado. E assim que novos fragmentos são armazenados nessa página do cache comprimido, o espa¸co livre é decrementado. É baseado no valor de espa¸co livre que se é escolhido em qual página do cache comprimida será armazenado um fragmento. Oespa¸co livre fragmentado consiste da soma dos espa¸cos livres no página que não foram unidos ao espa¸co livre cont´ıguo para poderem ser utilizados.

Uma outra nova entrada (comp cache frag) no diretório /proc foi criada para exibir o espa¸co livre fragmentado nas páginas do cache comprimido. Abaixo está um exemplo de sa´ıda desse arquivo, que exibe o número de páginas do cache comprimido que tem determinado espa¸co livre cont´ıguo (linhas) pelo espa¸co livre fragmentado (colunas). As linhas e as colunas exibem faixas de valores em bytes.

compressed cache - fragmentation histogram (free space x fragmented space)

total <500 -1000 -1500 -2000 -2500 -3000 -3500 -4000 -4096

1 - 200: 1411 537 22 6 6 275 257 198 110 0

201 - 400: 67 33 0 0 0 3 13 18 0 0

401 - 600: 6 3 0 0 0 0 3 0 0 0

601 - 800: 3 2 0 0 0 0 0 1 0 0

801 - 1000: 1 1 0 0 0 0 0 0 0 0

1001 - 1200: 3 3 0 0 0 0 0 0 0 0

1201 - 1400: 39 39 0 0 0 0 0 0 0 0

1401 - 1600: 35 35 0 0 0 0 0 0 0 0

1601 - 1800: 56 56 0 0 0 0 0 0 0 0

1801 - 2000: 103 103 0 0 0 0 0 0 0 0

(10)

2001 - 2200: 6 6 0 0 0 0 0 0 0 0

2201 - 2400: 0 0 0 0 0 0 0 0 0 0

2401 - 2600: 0 0 0 0 0 0 0 0 0 0

2601 - 2800: 0 0 0 0 0 0 0 0 0 0

2801 - 3000: 0 0 0 0 0 0 0 0 0 0

3001 - 3200: 0 0 0 0 0 0 0 0 0 0

3201 - 3400: 0 0 0 0 0 0 0 0 0 0

3401 - 3600: 0 0 0 0 0 0 0 0 0 0

3601 - 3800: 0 0 0 0 0 0 0 0 0 0

3801 - 4000: 0 0 0 0 0 0 0 0 0 0

4001 - 4096: 0 0 0 0 0 0 0 0 0 0

Com sa´ıdas periódicas do/proc/comp cache frag durante a execu¸cão de alguns testes, verificamos que havia uma grande inutiliza¸cão do cache comprimido em determinados momentos devido à fragmenta¸cão dentro das páginas do cache (a sa´ıda acima exibe essa inutiliza¸cão). Essa inutiliza¸cão for¸cava uma desnecessária libera¸cão de fragmentos e escrita em disco, que degradava o desempenho do sistema com cache comprimido.

De modo a solucionar o problema, buscamos uma solu¸cão que não incorresse no custo de movimentar os fragmentos finais durante qualquer remo¸cão de um fragmento interno de uma página do cache comprimido.

Dessa maneira, come¸camos a controlar, além do espa¸co livre cont´ıguo na página do cache comprimido, também o espa¸co livre fragmentado nela. Quando não se encontrasse espa¸co no cache comprimidosem ter que movimentar fragmentos, procurava-se alguma página do cache comprimido que possuisse espa¸co total (i.e, fragmentado + cont´ıguo) suficiente para armazenar esse novo fragmento. Nesse caso, os fragmentos eram movimentados para que todo o espa¸co livre fosse cont´ıguo na parte final da página do cache comprimido.

Essa opera¸cão é conhecida comocompacta¸cão dos fragmentos.

3.11 P´ aginas do Cache Comprimido de Tamanhos Maiores

Através das análises de desempenho, também foi observado que em alguns casos, a taxa de compressão média não é muito grande, comprimindo uma página para valores como 50% a 60% do seu tamanho, em média. Nesses casos, uma página do cache comprimido de tamanho de uma página de memória (4096 bytes para arquitetura i386), na média, só armazena um fragmento, situa¸cão bastante desfavorável para o uso do cache comprimido pois na prática ele não oferece vantagem em rela¸cão ao sistema sem o seu uso.

Para amenizar esse problema de baixa taxa de compressão, foi implementado o suporte a páginas do cache comprimido com o dobro do tamanho da página de memória padrão (8192 bytes para a arquitetura i386) dentro do cache comprimido. Portanto, ao alocar memória para o cache comprimido, alocamos duas páginas de memória cont´ıguas (dentro do espa¸co de endere¸camento reservado às estruturas internas ao kernel).

Apesar de por um lado ser interessante ter o cache comprimido formado por páginas desse tamanho e até de tamanhos maiores, por outro lado temos o problema de aloca¸cão dessas páginas com o redimensionamento por “demanda”. Quanto maior o número de páginas cont´ıguas a serem alocadas, maior é a probabilidade de não se conseguir alocar devida à fragmenta¸cão de memória (observe que é diferente da fragmenta¸cão explanada acima). Testes com páginas do dobro do tamanho tiveram um desempenho melhor que as páginas de tamanho simples, mas ainda alguns testes precisam ser feitos para verificar qual é o melhor tamanho. É ainda necessário averiguar se páginas maiores vão ter tantos problemas de aloca¸cão conforme esperamos.

3.12 Infra-estrutura para SMPs e preempted kernels

Um novo recurso do código foi a inclusão da infra-estrutura necessária de sincroniza¸cão para sistemas SMPs (SymmetricMultiProcessor) e kernels com recursos de maior “preemp¸cão” (como os patchespreempte lockbreak, de Robert Love [11]). Esse recurso envolveu algumas altera¸cões estruturais, pois o código anterior

(11)

não estava preparado por ter sido feito com a suposi¸cão que não seria interrompido involuntariamente (a não ser no tratamento de interrup¸cões).

Foram inclu´ıdos alguns contadores atômicos e spinlocks que permitiram que o código funcionasse com kernels com “preemp¸cão”. Ele ainda não foi testado em um sistema SMP, que possui maior concorrência real, e estamos certos que essa infra-estrutura pode ser otimizada para melhor desempenho para qualquer um dos casos (SMP oupreempt kernels). Apesar disso, ele foi bem testado com os patches de Robert Love e funcionou estavelmente.

3.13 Adaptabilidade

Efetuamos profundo estudo do artigo e tese de doutorado de Scott Kaplan, chegando a algumas conclusões a respeito do cálculo de custo-benef´ıcio proposto por ele e sobre as simula¸cões que o levaram a considerar o cache comprimido interessante atualmente. Primeiramente, não há infra-estrutura atual de software nem de hardware na arquitetura i386 para a coleta dos dados necessários para esse cálculo de custo-benef´ıcio. Uma infra-estrutura somente por software (ou seja, altera¸cões no sistema operacional) não seria de modo algum eficiente pois precisaria contar, ou pelo menos estimar com médio a alto grau de confian¸ca, o número de acessos às páginas na sua ordem LRU na memória.

Nas simula¸cões efetuadas por Kaplan não é computado o custo de armazenamento na memória desses novos dados. As simula¸cões dele, na verdade, não levam em conta nenhum custo de memória para os metadados do cache comprimido. Entretanto, o uso de memória para metadados diminui a quantidade de memória dispon´ıvel para a execu¸cão de programas e notamos que, em alguns casos, o que é considerado na teoria como um custo desprez´ıvel, na prática pode exercer grande influência no desempenho do sistema.

Em um sistema real como o Linux, o número de páginas de memória para as páginas de dados na memória (in-memory data, segundo terminologia do Kaplan, ou páginas anônimas, no Linux) varia, pois o sistema operacional atribui as páginas segundo a necessidade, sejam para o próprio kernel, para cache de páginas de arquivos ou para páginas de dados na memória. Kaplan supõe que o número de páginas para dados na memória é fixo, o que é incorreto para uma análise real.

Também não é considerado o impacto que o uso de parte da memória para o cache comprimido faria sobre outros tipos de páginas, como páginas armazenando dados de arquivo. Ao se utilizar parte da memória para o cache comprimido, diminui-se o espa¸co para esses outros tipos de páginas. Como em aplica¸cões de mundo real, observa-se que é muito improvável chegarmos a 50 ou 60% de páginas com dados da memória, a diminui¸cão da memória para outros tipos de páginas, notadamente páginas de arquivos, podem ter um impacto negativo no uso do cache comprimido, que eventualmente pode ser maior que o benef´ıcio trazido pelo ele.

Overheadsinerentes à execu¸cão do cache comprimido, sobretudo da adaptabilidade, não são considerados em nenhuma simula¸cão. Esses overheads, na prática, exercem uma grande influência no desempenho do sistema. Como exemplos temos custos de aloca¸cão de memória para mudan¸ca do tamanho do cache (na adaptabilidade) e custos de gerenciamento interno do cache comprimido.

Na sua pol´ıtica de adaptabilidade, Kaplan propõe alguns tamanhos de cache comprimido para as suas simula¸cões. Se a sua pol´ıtica verifica que o cache comprimido não é interessante para o sistema, ele diminui até o seu tamanho m´ınimo (10% do tamanho da memória), mas o cache comprimido ainda é utilizado e ainda

´

e um n´ıvel no sistema de memória virtual. Em situa¸cões em que o cache comprimido tem pouca utilidade para o sistema (nenhum ou poucos fragmentos são lidos), uma grande quantidade de páginas pode ser inutilmente comprimida, o que pode adicionar um enorme overhead ao sistema. Mesmo que essas páginas não fossem comprimidas, situa¸cões como essas adicionam o overhead de copiar os dados para o cache comprimido e gerenciar a escrita dos fragmentos (ou somente libera¸cão desses, se limpos). Esse tipo de cenário não é considerado por Kaplan em suas simula¸cões.

A id´eia de adaptabilidade proposta, entretanto, foi verificada em nossos testes como sendo necess´aria

(12)

para o bom desempenho do cache comprimido. Como citado acima, observamos que, em alguns testes como a compila¸cão do kernel, o uso do cache comprimido de tamanho fixo pré-alocado na memória não trazia benef´ıcios, além de prejudicar o desempenho em diversas situa¸cões. O uso de uma pol´ıtica bastante simples de adaptabilidade, que foi o redimensionamento por “demanda”, já melhorou de maneira significativa o desempenho em rela¸cão ao cache comprimido de tamanho fixo pré-alocado.

Uma pol´ıtica mais avan¸cada de adaptabilidade que implementamos foi a divisão das páginas dentro do cache comprimido em duas listas, chamadas deativaeinativa. A primeira armazena aproximadamente as páginas mais recentemente adicionadas ao cache comprimido e que, sem o cache comprimido, estariam na memória. E na segunda, as páginas que se estão sendo armazenadas na memória devido à compressão. O tamanho de cada lista é calculado em fun¸cão da taxa de compressão efetiva, ou seja, quantos fragmentos estão armazenados no cache comprimido em fun¸cão do seu tamanho em número de páginas de memória.

O tamanho do cache se adapta de acordo com os acessos a páginas das duas listas. Se há muitos acessos a páginas da listaativae pouco a páginas da listainativa, então o cache comprimido é reduzido. Por outro lado, caso existam muitos acessos a páginas da lista inativa, então o crescimento é liberado (para crescer por “demanda”).

Os melhores parâmetros para caracterizar o que vanham a ser “muitos acessos” e como será feito a redu¸cão estão sendo decididos através de experimenta¸cões. Os resultados até o momento nos mostraram desempenhos muito bons para essa pol´ıtica, conforme se verá a seguir, nas estat´ısticas de desempenho.

3.14 Swap Comprimido

A fim de melhorar o desempenho, foi implementado o recurso de escrever as páginas no swap no formato comprimido, ao invés de descomprimi-la, como era feito até o momento. Dessa maneira, a descompressão é adiada ao máximo para que seja somente feita se necessária. Como não houve custo significativo de memória para esse suporte, visto que os metadados mais custosos são armazenados no disco, essa implementa¸cão tornou-se padrão no código do cache comprimido. É importante notar que somente páginas do swap cache podem ser armazenadas comprimidas.

Outra idéia relacionada foi a implementa¸cão da compacta¸cão dos fragmentos comprimidos no swap. O objetivo é a diminui¸cão do número de opera¸cões de escrita, mas nem sempre isso é poss´ıvel pois o custo dos metadados na memória pode ser bastante significativo. Esse custo é em fun¸cão do tamanho do swap e, dependendo da situa¸cão, a economia de escritas em disco pode não compensá-lo. Ainda não chegamos a um consenso se vale a pena a inclusão dessa implementa¸cão como padrão do cache comprimido e nem se essa idéia pode ser mais desenvolvida, por isso é uma op¸cão de configura¸cão no momento.

3.15 Caracteriza¸ c˜ ao de Workloads Desfavor´ aveis

Na etapa de caracteriza¸cão deworkloadsfavoráveis e desfavoráveis, observamos o pior caso para o uso do cache comprimido. Ele ocorre quando as páginas são pouco utilizadas – e até não utilizadas – pelo sistema.

Dessa maneira, as páginas são comprimidas e não tem nenhuma utilidade, pois não chegam a ser lidas pelo sistema enquanto estão presentes no cache comprimido. Por conseqüência, elas são liberadas e o tempo de compressão e o custo de gerenciamento, por fim afetam negativamente o desempenho do sistema.

Acreditamos que workloads com estas caracter´ısticas não sejam muito frequentes e que não há como reverter esse quadro desfavorável pois o cache comprimido se trata de um novo n´ıvel no sistema de memória virtual pelo qual as páginas de memória devem passar. Achamos que no máximo podemos diminuir o preju´ızo, possivelmente através da pol´ıtica de não comprimir páginas quando se detecta essa situa¸cão. Como em geral é mais comum acontecer com páginas limpas, estamos direcionando o estudo para tentar desenvolver pol´ıtica que diminua o preju´ızo nesse caso.

(13)

3.16 Visibilidade

O projeto continua com bastante visibilidade na comunidade de software livre e do próprio Linux. A página do projeto [6] possui uma se¸cão de estat´ısticas [2] que efetua a contabilidade de acessos edownloadsdos arquivos do projeto. Nessa página é poss´ıvel verificar que o projeto soma 49 milpage views e o código-fonte do projeto foi baixado 3100 vezes (dados até dia 06/Set/2002).

O Kernel do Linux [5], além da sua versão oficial, conhecida porvanillaoustockkernel, possui também diversos projetos que inserem novas funcionalidades ou corrigem bugs, mas que não foram inclu´ıdos na versão oficial. Esses projetos distribuem o seu código-fonte através de um arquivo que armazena altera¸cões em rela¸cão do Kernel oficial, chamados depatches. Como não são inclu´ıdos na versão oficial, são chamados depatchesnão-oficiais e muitas vezespatchesnão-oficiais interessantes são agrupados em conjuntos depatches oupatchsets.

Opatch do projeto cache comprimido ´e inclu´ıdo por dois projetos que distribuem conjuntos depatches:

Working Overloaded Linux Kernel [14], mantido por Marc-Christian Petersen, e Performance Patches [1], de Con Kolivas. A inclusão nesses projetos geram retorno por uma maior base de usuários e demonstra que há um interesse da comunidade pelo projeto.

(14)

3.17 Estat´ısticas de Desempenho

Aqui vamos apresentar algumas estat´ısticas dos testes de desempenho que foram executados ao longo do nosso desenvolvimento recente. O cache comprimido utilizado para esses testes possui as mais recentes pol´ıticas de adaptabilidade e a sua configura¸c˜ao ´e apresentada a seguir.

– Suporte aoPage Cache

– Suporte a P´aginas do Cache Comprimido de Tamanho Maior – Algoritmo de Compress˜ao: LZO

O computador em que rodamos os testes é um Pentium III 1 GHz, com 768 megabytes de memória RAM e 1 gigabyte de parti¸cão de swap. A distribui¸cão Linux é a Debian Woody 3.0. No desenvolvimento recente, procuramos focar em aplica¸cões reais para verificar o desempenho do cache comprimido. Entre elas, aqui apresentamos:

Compila¸c˜ao do Kernel do Linux

Executar a compila¸cão do Kernel do Linux [5] é amplamente usada para medir o desempenho do sistema de memória virtual e possui caracter´ısticas bastante particulares. Entre eles, um alto uso de CPU e do sistema de memória virtual, principalmente quando aumenta-se a concorrência entre as compila¸cões dos diversos arquivos. Compilamos o Kernel do Linux versão 2.4.18 [4] com a sua configura¸cão padrão para arquitetura i386. Utilizamos três n´ıveis de concorrência durante a execu¸cão desse teste que aqui expressamos pelos parâmetros passados ao GNU Make: -j1, que executa apenas um job; -j2, que executa dois jobs simultaneamente; e-j4, que executa quatrojobs simultaneamente.

Open Source Database Benchmark

OOpen Source Database Network[8] é umbenchmark que faz testes com opera¸cões de bancos de dados. O primeiro motivo pelo qual esse teste é considerado é o fato de terem sido rodados testes de banco de dados na implementa¸cão feita Fred Douglis do cache comprimido e em todos os testes Douglis obteve maus resultados. Em segundo lugar, visto que bancos de dados são comumente utilizados por diversos segmentos de usuários de sistemas operacionais, é importante verificar o impacto que o cache comprimido pode ter nesse importante tipo de aplicativo computacional.

Foi rodado aqui esse benchmark utilizando-se o gerenciador de banco de dadosPostgreSQL[10], com um banco de dados de 40 megabytes dispon´ıvel na p´agina de arquivos do projeto OSDB [9].

MUMmer

O MUMmer [7] é uma aplica¸cão cient´ıfica que produz alinhamento de genomas e faz um uso intenso de memória. Os genomas comparados nos nossos testes são de duas espécies deXanthomonas recentemente sequenciadas pelo projeto Genoma-FAPESP. Os arquivos dos genomas tem aproximadamente 5 megabytes de tamanho cada, e essa aplica¸cão utiliza entre 400 e 420 megabytes de memória durante a execu¸cão.

Gr´aficos e Conclus˜ao

Os gráficos a seguir exibem resultado muito animadores para o desempenho do nosso projeto. Em parti- cular, nota-se que a pol´ıtica de adaptabilidade implementada está obtendo desempenho bastante interessante face às aplica¸cões que experimentamos.

(15)

0 50 100 150 200 250 300 350 400 450 500

18 24 30 36 42 48

Tempo de Execucao (segundos)

Memoria do Sistema (megabytes) Compilacao do Kernel do Linux (-j1)

Pentium III 1 GHz Algoritmo de Compressao: LZO

Suporte ao Page Cache Tamanho Duplo de Pagina

Cache Comprimido 2.4.18-0.24pre4 Linux Kernel Vanilla 2.4.18

Figura 1: Teste da Compila¸c˜ao do Kernel do Linux (-j1)

Ainda temos situa¸cões em que o cache comprimido tem um desempenho pior que o Kernel do Linux padrão. Uma delas acontece na compila¸cão do Kernel do Linux com o n´ıvel de concorrência -j4 (Fig. 3), onde no caso de 48 megabytes temos uma ligeira piora do sistema (1,46%). Outra acontece na execu¸cão do Open Source Database Network (Fig. 4) onde há uma piora de 8% no caso de 48 megabytes, mesmo que tenha sido obtida melhora de 26,6% no caso de 24 megabytes.

Acreditamos que essas situa¸cões se encontrem no caso em que uma grande parte das páginas acaba sendo comprimida sem ser usada novamente pelo sistema (pelo menos não enquanto estiver no cache comprimido).

Dessa forma, o cache comprimido acaba introduzindo mais overhead do que oferecendo vantagens para o desempenho do sistema, sendo um situa¸cão próxima à caracterizada na se¸cão sobre a caracteriza¸cão de workloads desfavoráveis. Acreditamos não ser poss´ıvel reverter esse quadro desfavorável mas apenas minimizá-lo.

Observemos que a presen¸ca do cache comprimido não piora o desempenho do sistema na quase totali- dade dos casos estudados e até melhora significativamente o desempenho em um grande número deles. As melhorias chegam até 21,7%, 32,6% e 18,8% no tempo de compila¸cão do Kernel do Linux (-j1, -j2ej4, respectivamente), até 31,8% na execu¸cão do MUMmer e, como já dito acima, 26,6% no OSDB. Pol´ıticas voltadas aos casos ainda desfavoráveis estão sendo estudadas.

(16)

0 200 400 600 800 1000

18 24 30 36 42 48

0 200 400 600 800 1000 1200 1400 1600 1800

18 24 30 36 42 48

(17)

0 200 400 600 800 1000 1200 1400

24 48

Memoria do Sistema (megabytes)

Execucao do OSDB - Open Source Database Benchmark Banco de Dados: 40MiB

Figura 4: Teste de Execu¸c˜ao doOpen Source Database Benchmark

0 20 40 60 80 100 120 140

330 340 345 350 355 360 380 400 420 440 460

Memoria do Sistema (megabytes) Execucao do MUMmer

Figura 5: Teste da Execu¸c˜ao do MUMmer

(18)

4 Plano de Trabalho (Etapas Seguintes) Atividades

1 avalia¸c˜ao da implementa¸c˜ao via “micro-benchmarks”

2 inser¸cão no protótipo dos parâmetros de adaptabilidade 3 segundo estudo do impacto docache comprimido 4 caracteriza¸cão de workloads favoráveis e desfavoráveis 5 reda¸cão de relatórios semestrais para a Fapesp 6 reda¸cão de eventuais artigos

7 reda¸cão da disserta¸cão 8 exame de disserta¸cão

5 Cronograma (Etapas Seguintes) 2002/2003

Set Out Nov Dez Jan

1 •

2 •

3 •

4 •

5 •

6 • •

7 • • • •

8 •

(19)

Rodrigo Souza de Castro Bolsista

Prof. Dr. Alair Pereira do Lago Orientador

(20)

Referˆ encias

[1] P´agina de Patches de Con Kolivas. URL:<http://kernel.kolivas.net/>[Acessado em 06/Set/2002]. [2] P´agina de Estat´ısticas do Projeto Cache Comprimido. URL: <http://sourceforge.net/project/-

stats/?group id=13472>[Acessado em 06/Set/2002].

[3] S. F. Kaplan. Compressed Caching and Modern Virtual Memory Simulation. Tese de doutorado, University of Texas at Austin, 1999.

[4] 2.4.18 linux Kernel URL. URL:<http://www.kernel.org/pub/linux/kernel/v2.4/linux-2.4.18.tar.bz2>

[Acessado em 06/Set/2002].

[5] Linux Kernel URL. URL:<http://www.kernel.org/> [Acessado em 06/Set/2002].

[6] P´agina do Projeto Cache Comprimido. URL:<http://linuxcompressed.sourceforge.net/>[Acessado em 06/Set/2002].

[7] P´agina do MUMmer. URL:<http://www.tigr.org/software/mummer/>[Acessado em 06/Set/2002]. [8] P´agina do Open Source Database Benchmark. URL: <http://osdb.sourceforge.net/> [Acessado em

06/Set/2002].

[9] P´agina de Arquivos do Open Source Database Benchmark. URL: <http://sourceforge.net/- project/showfiles.php?group id=18681>[Acessado em 06/Set/2002].

[10] P´agina de PostgreSQL. URL:<http://www.postgresql.org/>[Acessado em 06/Set/2002].

[11] P´agina dos Patches de Robert Love. URL: <http://www.tech9.net/rml/linux/>[Acessado em 06/Set/- 2002].

[12] Página dos Seminários em Sistemas de Computa¸cão. URL: <http://www.ime.usp.br/~rcastro/- seminars/>[Acessado em 06/Set/2002].

[13] P. R. Wilson, S. F. Kaplan, e Y. Smaragdakis. The case for compressed caching in virtual memory systems. Em Summer 1999 USENIX Conference, p´aginas 101–116, Monterey, CA, EUA, 1999. URL:

<http://www.cs.utexas.edu/users/wilson/papers/compression.ps>[Acessado em 06/Set/2002]. [14] P´agina do Working Overloaded Linux Kernel. URL: <http://wolk.sourceforge.net/> [Acessado em

06/Set/2002].