Relacionados a Abstra¸c˜ oes para Programa¸c˜ ao de GPUs

5.6 Trabalhos Correlatos

5.6.2 Relacionados a Abstra¸c˜ oes para Programa¸c˜ ao de GPUs

Do mesmo modo que nossa implementa¸cão Gamma-GPU tem uma vertente que visa prover uma abstra¸cão para o uso de GPUs, possibilitando que a programa¸cão seja expressa em uma linguagem de alto n´ıvel de forma mais natural sem a necessidade de que se conhe¸cam detalhes de baixo n´ıvel do hardware, inúmeros outros trabalhos também propõem abstra¸cões nesse sentido, visando oferecer ao programador uma interface mais amigável para acesso a estes dispositivos. Isto porque as linguagens mais tradicionais, CUDA e OpenCL, para programa¸cão de GPUs, requerem um n´ıvel considerável de conhecimento de baixo n´ıvel de técnicas para movimenta¸cão de dados entre memórias, sincroniza¸cão e escalonamento da computa¸cão. Na maioria dos casos, os trabalhos que veremos a seguir utilizam CUDA ou OpenCL somente como linguagens intermediárias, exibindo ao usuário apenas uma linguagem mais abstrata e sintaticamente mais simples, poupando-o de detalhes que não estão diretamente ligados à resolu¸cão do problema em si.

Em [56] é apresentada uma linguagem chamada CGiS, que visa aumentar a acessibilidade às GPUs através de um elevado n´ıvel de abstra¸cão. O foco principal foi permitir que programadores de problemas cient´ıficos, sem experiência em ma- nipula¸cão de GPUs, pudessem se beneficiar do ganho de desempenho oferecido de forma transparente. A linguagem permite que se escreva o algoritmo completo, que é então submetido a um compilador que gera código em C++ e diretamente em assembly para GPUs. Um programa em CGiS é composto por três se¸cões: INTER- FACE na qual são declaradas variáveis escalares e de fluxo; CODE onde definem-se as fun¸cões sobre os fluxos; e CONTROL que define a intera¸cão entre as fun¸cões.

O trabalho descrito em [57], introduz também uma nova linguagem para programa¸cão de GPUs, chamada EPGPU (Expressive Programming for GPU ), a qual utilizou OpenCL embutido no ambiente de programa¸cão de C++. Uma das princi- pais abstra¸cões providas é chamada de FILL kernel, que permite que as escritas na memória da GPU sejam feitas de modo controlado em tempo de execu¸cão, elimi- nando a chance de aparecimento de problemas como condi¸cões de disputa a regiões

de mem´oria compartilhada.

Uma linguagem de programa¸cão declarativa para GPUs foi proposta em [58], batizada de Harlan. A principal ideia é que o programador possa expressar apenas o que fazer, e não como fazer. A linguagem foi integrada com um outro trabalho prévio dos mesmos autores, possibilitando seu uso em clusters de GPUs. O compilador constru´ıdo para a linguagem traduz um programa em Harlan para código CUDA ou OpenCL, e suporta algumas facilidades sintáticas, como a determina¸cão automática da configura¸cão de blocos e threads para um certo kernel, divisão de um único kernel em Harlan para vários kernels na linguagem de mais baixo n´ıvel, além de prover um escalonamento mais eficiente entre kernels de acordo com um grafo ponderado de dependência de dados dos mesmos.

Em [59] foi criada uma linguagem para dom´ınios espec´ıficos chamada Chestnut para programa¸cão de GPUs, voltada para aplica¸cões sobre dados no formato de arrays multidimensionais (grids), como por exemplo solu¸cões finitas de equa¸cões diferenciais parciais, aplicáveis em problemas como modelagem climática, dinâmica dos fluidos e difusão de calor. O compilador Chestnut foi escrito em Python e traduz o código de alto n´ıvel para código CUDA. A sintaxe para programar em Chestnut é similar à linguagem C, e a ideia foi criar uma forma muito simples de indicar os trechos de código que devem executar em paralelo nas GPUs, bastando envolvê- los pelas declara¸cões foreach e end, que delimitam as opera¸cões a serem aplicadas sobre um conjunto de arrays em paralelo. Alguns experimentos mostraram que programas escritos em Chestnut obtiveram um desempenho bem próximo àqueles escritos diretamente em CUDA.

Na proposta contida em [60], a ideia foi criar uma abstra¸cão baseada no paradigma orientado a objetos para acesso às GPUs, através de uma nova linguagem chamada de Fusion, a qual é uma extensão sintática sobre a linguagem Java. A principal destas extensões é a possibilidade de criar objetos aceleradores, instâncias de uma classe aceleradora, os quais terão seus métodos executados pelas GPUs. O compilador Fusion gera dois códigos separados como sa´ıda, um em Java puro, que contém as chamadas aos kernels, e o outro em CUDA, contendo os kernels que são as implementa¸cões dos métodos dos objetos aceleradores.

Outros trabalhos que seguem linhas similares podem ser vistos em [61], [62], [63] e [64].

Cap´ıtulo 6

Experimentos e Resultados

Depois de termos discorrido nos cap´ıtulos anteriores sobre as solu¸cões de implementa¸cão envolvidas no trabalho, vamos agora dedicar o presente cap´ıtulo para demonstrar os experimentos práticos realizados com as mesmas, nos quais almeja- mos verificar a corretude da nova implementa¸cão Gamma-GPU, bem como analisar o desempenho do modelo quando executado em uma plataforma distribu´ıda de hardware.

6.1 Metodologia Experimental

Utilizamos uma metodologia emp´ırica para proceder os testes do trabalho, na qual foram selecionadas algumas aplica¸cões escritas em Gamma para serem executadas sobre as implementa¸cões Gamma-Base e Gamma-GPU, a fim de que pudéssemos comparar as respostas dos programas e também medir o tempo total de execu¸cão dos mesmos. A compara¸cão entre as respostas de cada programa nas duas implementa¸cões, serve para nos garantir que nossa nova implementa¸cão Gamma-GPU comporta-se de maneira adequada, emitindo resultados corretos para os problemas processados com o aux´ılio das GPUs. Já a medida dos tempos de execu¸cão, nos ajuda a proceder uma análise comparativa de desempenho entre as duas implementa¸cões, demonstrando o poder de acelera¸cão de processamento inserido com o uso das GPUs.

No documento Publicações do PESC Uma Derivação do Paradigma de Reescrita de Multiconjuntos Gamma para a Arquitetura GPU (páginas 110-112)