Evolu¸c˜ ao das GPUs - Publicações do PESC Uma Derivação do Paradigma de Reescrita de Multiconj

O surgimento da Unidade Gráfica de Processamento, do inglês Graphics Processing Unit (GPU), remete ao final da década de 1980 e in´ıcio da década de 1990, quando come¸caram a se popularizar os sistemas operacionais com interfaces gráficas, no- meadamente o sistema Windows da Microsoft, pois os usuários passaram a com- prar aceleradores gráficos 2D para seus computadores pessoais, os quais ofereciam opera¸cões de bitmap via hardware e melhoravam a usabilidade gráfica dos sistemas. Já na metade dos anos 90, a demanda dos consumidores cresceu rapidamente em rela¸cão a aplica¸cões gráficas em três dimensões (3D), liderada principalmente pelo mercado de games, com o lan¸camento de jogos imersivos em “primeira-pessoa” como

Figura 3.1: Fatia de participa¸c˜ao dos coprocessadores de acelera¸c˜ao nos 75 supercomputadores que utilizam tal tecnologia, constantes na lista do TOP500 de novembro de 2014 [38].

Doom, Duke Nukem 3D, Quake, e Wolfenstein 3D. Aliado a isso, empresas como NVIDIA e ATI Technologies lan¸cavam no mesmo per´ıodo aceleradores gráficos a pre¸cos acess´ıveis, o que atraiu grande aten¸cão e fez com que a tecnologia de gráficos 3D obtivesse destaque nos anos seguintes [4].

Nessa época, as GPUs consistiam em um hardware de fun¸cão fixa que não podia ser programado de forma genérica, e operava em uma sequência de passos reali- zando opera¸cões gráficas sobre os dados, em uma estrutura conhecida como pipeline gráfico. O acesso a estas GPUs era feito utilizando-se APIs (Application Program- ming Interface) como a DirectX da Microsoft e a OpenGL, que possibilitavam às aplica¸cões apenas enviar comandos predefinidos às GPUs para que desenhassem objetos na tela do monitor. O trabalho básico do pipeline gráfico era desenhar (ou renderizar) triângulos, de modo que a superf´ıcie de um objeto fosse representada por uma cole¸cão de triângulos, e para tanto, continha tipicamente os seguintes estágios: controle de vértices (vertex control ); ilumina¸cão, transforma¸cão e sombreamento de vértices (vertex shading, transform and lighting); configura¸cão do triângulo (triangle setup); rasteriza¸cão (raster ); sombreamento (shader ); e refinamento de rasteriza¸cão (raster operation ROP ). Maiores detalhes da dinâmica e fun¸cão dos estágios podem ser encontrados em [25].

Com o passar do tempo, a evolu¸cão das GPUs ocorreu via incremento das fun- cionalidades dos vários estágios do pipeline gráfico, através da introdu¸cão de novos recursos de hardware e novas configura¸cões. Contudo, a demanda dos desenvol-

vedores foi ficando cada vez mais sofisticada e as novas carater´ısticas requisitadas não podiam mais ser atendidas por um hardware com fun¸cões fixas, o que levou a evolu¸cão a tomar o caminho de tornar programáveis alguns estágios do pipeline. Foi então que em 2001, a NVIDIA lan¸cou a fam´ılia de GPUs chamada GeForce 3, sendo a pioneira a disponibilizar um dispositivo em que alguns dos estágios do pipeline gráfico, como o de vértices e de sombreamento, podiam ser programados pelos desenvolvedores, tendência seguida nos anos seguintes com a cria¸cão de novas fun¸cões programáveis, tanto pela própria NVIDIA quanto por outras fabricantes, como ATI e até mesmo pela Microsoft com o lan¸camento de seu console de games XBox 360 que permitia os estágios de sombreamento de vértices e pixels serem executados em um único processador gráfico [25].

O surgimento da possibilidade de programa¸cão do pipeline das GPUs atraiu mui- tos pesquisadores que compartilhavam a ideia de utilizar este tipo de processador para outras finalidades que não somente a renderiza¸cão gráfica, guiados principalmente pelo fato da alta taxa de cálculos aritméticos que estes dispositivos eram capazes de realizar (pois trabalhavam com milhões de vértices e pixels). Entretanto, a única forma de intera¸cão com as GPUs ainda era somente as APIs DirectX e OpenGL, o que complicava a expressão de problemas genéricos, visto que os mes- mos deviam ser modelados pelos programadores de forma a parecerem problemas de renderiza¸cão gráfica a fim de serem executados pelas GPUs. Para contornar este obstáculo, foi lan¸cada no ano de 2006 pela NVIDIA a GPU GeForce 8800 GTX, que foi a primeira constru´ıda com suporte à nova arquitetura criada pela corpora¸cão chamada de CUDA (será detalhada na Se¸cão 3.3), a qual tinha como objetivo expor as GPUs para programa¸cão de propósito geral sem impor as restri¸cões das anti- gas unidades gráficas. Além da cria¸cão da arquitetura em si, no in´ıcio de 2007 a NVIDIA lan¸cou também um compilador para uma nova linguagem de programa¸cão baseada em algumas extensões sobre a linguagem C, chamada de CUDA C, a fim de facilitar a explora¸cão da capacidade de processamento das novas GPUs. A partir de então, os programadores não precisaram mais ter nenhum conhecimento sobre as APIs gráficas de programa¸cão, nem tampouco necessitavam expressar seus progra- mas “disfar¸cados” de problemas de computa¸cão gráfica [4].

Devido ao in´ıcio do uso das GPUs em aplica¸cões com outras finalidades que não a computa¸cão gráfica, surgiu um novo conceito chamado de GPU Computing ou GPGPU (General Purpose Graphics Processing Unit ), que se concentrou na utiliza¸cão das GPUs para computa¸cões de propósito geral. Até mesmo a placa de hardware em si, algumas vezes passou a ser chamada de GPGPU ao invés de apenas GPU, quando utilizada neste novo contexto de aplica¸cões4. Deste momento

4_{Continuaremos utilizando o termo GPU no restante do trabalho, ainda que nosso uso tenha} sido para computa¸c˜ao de prop´osito geral.

em diante, o uso das GPUs cresceu vertiginosamente nos mais diversos campos de aplica¸cão, sendo na maioria dos casos utilizadas a tecnologia CUDA e as placas de hardware da NVIDIA, que desde então vem evoluindo e adicionando novas funciona- lidades aos seus produtos, liberando novas arquiteturas em per´ıodos de dois em dois anos aproximadamente (ver Subse¸cão 3.3.4). Exemplos de aplica¸cões que se benefi- ciaram, e ainda se beneficiam do uso das GPUs devido seu alto poder computacional são: modelagem molecular, sistemas financeiros, simula¸cão de reservatórios de óleo e gás, simula¸cão de n-corpos (n-body simulation), sistemas médicos por imagem, dinâmica dos fluidos, e sistemas de modelagem ambiental [4, 25].

O caminho natural é que as GPUs sejam cada vez mais empregadas para a resolu¸cão de muitas classes de problemas, principalmente aqueles que demandam um alto poder computacional. Conforme vimos na Subse¸cão 3.1.3, atualmente as GPUs vem de fato sendo bastante utilizadas em supercomputadores de alto desempenho na fun¸cão de coprocessadores de acelera¸cão, em ambientes que as utilizam em grande número de forma distribu´ıda e paralela, como por exemplo clusters de computadores, nos quais cada nó possui uma ou mais GPUs agregadas, levando a uma estrutura de múltiplas GPUs chamado de Multi-GPU. Desta forma, a tendência para o fu- turo é que as GPUs continuem passando por vigorosas evolu¸cões arquiteturais, com técnicas cada vez mais agressivas sendo introduzidas nas novas gera¸cões, visando aumentar a eficiência de utiliza¸cão das unidades de cálculo aritmético, permitindo assim que os desenvolvedores prossigam com novas descobertas e implementa¸cões de novas otimiza¸cões para a resolu¸cão de seus problemas [25].

No documento Publicações do PESC Uma Derivação do Paradigma de Reescrita de Multiconjuntos Gamma para a Arquitetura GPU (páginas 44-47)