Proposta de Escalonador - Publicações do PESC Uma Derivação do Paradigma de Reescrita de Multic

Podemos dizer que a implementa¸cão Gamma-Base foi um trabalho bem sucedido, e cumpriu sua principal aspira¸cão, que foi realizar uma implementa¸cão paralela e distribu´ıda do formalismo Gamma, com suporte a programas com mais de uma rea¸cão do tipo n-ária. Entretanto, assim como em outras implementa¸cões de Gamma realizadas, foram constatados problemas de eficiência na execu¸cão dos programas, uma vez que os modelos de escalonamento de tarefas eram muito simples, não suportando execu¸cão concomitante entre várias rea¸cões, ou ainda pelo fato de não haver, uma explora¸cão adequada do potencial paralelismo no acesso ao multiconjunto, mesmo no escopo de uma única rea¸cão.

Tendo exposto o fato acima, foi proposto em [45, 48], um novo modelo de escalonamento para Gamma, no qual levou-se em conta a existência de rea¸cões n-árias,

podendo estar presentes em qualquer número, e todas atuando sobre o mesmo multiconjunto. Nesta proposta foram discutidos três relevantes problemas relacionados a este aspecto, que são: a sele¸cão dos elementos do multiconjunto para teste das condi¸cões de rea¸cões; como distribuir esses testes entre os elementos de processamento; e como distribuir os processos no sistema f´ısico que executará os programas Gamma. A ideia era que o escalonador atuasse em tempo de compila¸cão e execu¸cão, de modo que elementos do multiconjunto pudessem ser adicionados ou removidos, incorrendo na poss´ıvel cria¸cão de novos processos em tempo de execu¸cão.

O algoritmo proposto para o novo modelo de escalonador teve como base o trabalho desenvolvido em [49], que aborda o mapeamento ótimo de sistemas com res- tri¸cões sobre a vizinhan¸ca. Este mapeamento por sua vez, utiliza como representa¸cão dos recursos compartilhados, grafos orientados finitos, além de técnicas conhecidas como SER(Scheduling by Edge Reversal ) e MCC(Minimum Clique Covering) [50]. A dinâmica básica do algoritmo consiste em partir de um grafo orientado ac´ıclico, e encontrar um nó sink3_{, o qual poder´}_{a executar. Depois, a cada passo, a revers˜}_{ao de}

arestas é aplicada, causando o surgimento de novos sinks. O número de orienta¸cões ac´ıclicas poss´ıveis do grafo, chamado per´ıodo, é finito, e por essa razão, em algum momento, tais orienta¸cões come¸cam a se repetir, fazendo com que os respectivos sinks executem novamente. Isso faz com que não ocorram problemas como dead- locks ou starvation [10], visto que fica garantida a exclusão mútua no acesso aos recursos compartilhados, e também fica a garantia de que um nó qualquer será sink, e portanto executará, ao menos uma vez dentro do per´ıodo.

A implementa¸cão deste novo escalonador poderia realmente trazer ganhos de eficiência para a execu¸cão de programas Gamma, mas por outro lado, devido a sua pol´ıtica mais elaborada, alguns custos adicionais poderiam aparecer, como por exemplo, custos de comunica¸cão e sincroniza¸cão entre os processos que representam os nós do grafo, introduzidos pela própria lógica necessária para manter a correta execu¸cão do algoritmo de reversão de arestas (SER+MCC). Para descobrir se os custos seriam superados pelo ganho de desempenho, seria preciso experimentar o escalonador, todavia, esta etapa não foi realizada, tendo o trabalho ficado somente como uma proposta para implementa¸cão futura.

E nesse contexto que surgiu a ideia da solu¸cão desenvolvida nesta disserta¸cão (Gamma-GPU ), descrita no cap´ıtulo seguinte, na qual buscamos aumentar a eficiência da execu¸cão de programas Gamma, através de uma melhor explora¸cão do paralelismo intr´ınseco ao formalismo, fazendo uso das Unidades Gráficas de Pro- cessamento (GPUs).

3_{sink ´}_{e um v´}_{ertice do grafo, onde todas as arestas que est˜}_{ao conectadas ao mesmo, s˜}_{ao direci-} onadas a seu favor.

Cap´ıtulo 5

Gamma-GPU (Solu¸c˜ao

Desenvolvida)

Após termos exposto no cap´ıtulo anterior, a implementa¸cão de Gamma chamada de Gamma-Base, dedicaremos o presente cap´ıtulo para a solu¸cão desenvolvida nesta disserta¸cão, batizada de Gamma-GPU, que estendeu a solu¸cão base, adicionando à arquitetura do modelo uma nova e poderosa unidade de processamento paralelo, a GPU.

5.1 Proposta

Podemos sintetizar a proposta deste trabalho na seguinte senten¸ca:

“Mapear e implementar o paradigma de reescrita de multiconjuntos Gamma em uma arquitetura heterogênea de processamento paralelo, baseando-se em uma implementa¸cão distribu´ıda já existente, e adicionando suporte ao uso das GPUs”.

Em outras palavras, o desafio foi estudar uma implementa¸cão já existente de Gamma, e estender a mesma, de modo que passasse a ser capaz de utilizar a capaci- dade de processamento das GPUs, visando um potencial ganho de desempenho para os programas escritos em Gamma. Adicionalmente, o trabalho almejou fornecer uma abstra¸cão para a programa¸cão de GPUs, uma vez que o programador Gamma não precisa ter nenhum conhecimento sobre os detalhes de programa¸cão das mesmas, pois esta tarefa fica a cargo do compilador Gamma-GPU, sendo transparente ao usuário.

A ideia de unificar estes dois conceitos em um mesmo escopo, ou seja, aliar o modelo computacional Gamma ao processamento das GPUs, surgiu de uma constata¸cão que remete à metáfora de rea¸cões qu´ımicas de Gamma e ao modelo de paralelismo

adotado nas GPUs. Como vimos no Cap´ıtulo 3, a computa¸cão das GPUs pode ser classificada como sendo do tipo SIMD (Single-Instruction, Multiple-Data) ou SIMT (Single-Instruction, Multiple-Threads), e consiste basicamente em aplicar um mesmo fluxo de instru¸cões sobre fluxos de dados distintos, geralmente dispostos na forma de um array. Tal abordagem nos faz pensar em uma analogia direta com o paradigma do formalismo Gamma, no qual uma mesma rea¸cão (instru¸cão) pode ocorrer simultaneamente sobre moléculas distintas (dados), de modo que a verifica¸cão da condi¸cão de rea¸cão pode ser realizada paralelamente sobre os elementos do multiconjunto (array), e aquelas que satisfizerem tal condi¸cão, poderão então executar a a¸cão, que consiste na reescrita do multiconjunto.

As demais se¸cões deste capitulo serão utilizadas para descrevermos a solu¸cão Gamma-GPU, abordando temas como sua arquitetura, as modifica¸cões realizadas no compilador Gamma, os detalhes da implementa¸cão, e a análise de complexidade. Finalizaremos com a cita¸cão de alguns trabalhos correlatos ao desenvolvido nesta disserta¸cão.

No documento Publicações do PESC Uma Derivação do Paradigma de Reescrita de Multiconjuntos Gamma para a Arquitetura GPU (páginas 71-74)