• Nenhum resultado encontrado

8. CONSIDERAÇÕES FINAIS

8.1. Trabalhos Futuros

Como pôde ser observado nos resultados, os dispositivos AMD testados não ofereceram suporte a números reais com precisão dupla. Com base nisso, pretendemos realizar testes em dispositivos com poder computacional maior, podendo assim fazermos uma comparativo mais abrangente das plataformas. Além disso, há intenção de utilizar a nova arquitetura Kepler da NVIDIA e GPU’s da série FirePro, da AMD. Também se pretende realizar um comparativo entre a utilização de CUDA e OpenCL utilizando GPU’s NVIDIA, visando um comparativo entre os dois modelos de programação para GPGPU. Por fim, o desenvolvimento de um algoritmo em OpenCL capaz de rodar tanto em CPUs quanto em GPUs, e que utilize precisão simples, pode dar um ponto de vista mais claro quanto as diferenças entre estas arquiteturas.

REFERÊNCIAS BIBLIOGRÁFICAS

AMD. AMD Accelerated Parallel Processing (APP) SDK (formerly ATI Stream). AMD Accelerated Parallel Processing (APP) SDK (formerly ATI Stream),

2012. Disponivel em:

<http://developer.amd.com/TOOLS/HC/AMDAPPSDK/Pages/default.aspx>. Acesso em: 25 Setembro 2012.

AMD. AMD FirePro™ 3D Professional Graphics. AMD FirePro™ Professional

Graphics, 2012. Disponivel em: <http://www.amd.com/us/products/workstation/graphics/ati-firepro-3d/Pages/ati-

firepro-3d.aspx>. Acesso em: 14 Jan 2013.

AMD. AMD oferece aos desenvolvedores versões atualizadas da APP SDK e Catalyst. AMC, 2012. Disponivel em: <http://www.amd.com/br/press- releases/Pages/amd-opencl-app-2012jan11.aspx>. Acesso em: 14 Jan 2013.

AMD. For Consumers. AMD, 2013. Disponivel em: <http://www.amd.com/us/products/technologies/amd-

app/consumer/Pages/consumer.aspx>. Acesso em: 16 Jan 2013.

AMD. Tecnologia ATI Stream. AMD, 2013. Disponivel em: <http://www.amd.com/br/products/technologies/stream-technology/Pages/stream- technology.aspx>. Acesso em: 14 Jan 2013.

CHE, S. et al. A Characterization of the Rodinia Benchmark Suite. The University of Virginia. Virginia, p. 2. 2009.

DANALIS, A. et al. The Scalable HeterOgeneous Computing (SHOC). Oak Ridge National Laboratory, 2010. Disponivel em: <http://ft.ornl.gov/pubs- archive/shoc.pdf>. Acesso em: 3 Outubro 2012.

EDWARDS, B. Birth of a Standard: The Intel 8086 Microprocessor. PCWorld, 2008. Disponivel em: <http://www.pcworld.com/article/146957/article.html>. Acesso em: 27 Setembro 2012.

FOWLER, R. J. Eletricidade: princípios e aplicações. 2ª. ed. São Paulo: Makron Books, 1992.

FREE SOFTWARE FOUNDATION. Option Summary - Using the GNU Compiler Collection (GCC). GCC, the GNU Compiler Collection, 2010. Disponivel em: <http://gcc.gnu.org/onlinedocs/gcc/Option-Summary.html#Option-Summary>. Acesso em: 28 Setembro 2012.

GLASKOWSKY, P. N. NVIDIA’s Fermi: The First Complete. Fermi Architecture for High-Performance Computing | NVIDIA, 2009. Disponivel em: <http://www.nvidia.com/content/PDF/fermi_white_papers/P.Glaskowsky_NVIDIA

%27s_Fermi-The_First_Complete_GPU_Architecture.pdf>. Acesso em: 27 Novembro 2012.

GMU. What is CFD? Computational Fluid Dynamics, 2009. Disponivel em: <http://www.scs.gmu.edu/~rlohner/pages/menues/cfd.html>. Acesso em: 5 Outubro 2012.

GPGPU.ORG. Scalable HeterOgeneous Computing (SHOC) Benchmark Suite. General Purposes Computation on Graphics Hardware, 2010. Disponivel em: <http://gpgpu.org/2010/05/04/shoc-benchmark>. Acesso em: 3 Outubro 2012.

GPGPU.ORG. About GPGPU.org. GPGPU.org, 2012. Disponivel em: <http://gpgpu.org/about>. Acesso em: 25 Setembro 2012.

GREEN500. The Green500 List. The Green500 List, 2012. Disponivel em: <http://www.green500.org>. Acesso em: 26 Maio 2012.

GUSSOW, M. Eletricidade Básica. 2ª. ed. São Paulo: Makron Books, 1996. HALFHILL, T. R. Looking Beyond Graphics. Fermi Architecture for High- Performance Computing | NVIDIA, 2009. Disponivel em: <http://www.nvidia.com/content/PDF/fermi_white_papers/T.Halfhill_Looking_Beyo nd_Graphics.pdf>. Acesso em: 27 Novembro 2012.

HARDESTY, L. Explained: The Discrete Fourier Transform. Massachussets

Institute of Technology, 2009. Disponivel em: <http://web.mit.edu/newsoffice/2009/explained-fourier.html>. Acesso em: 26 Setembro 2012.

HERNANDEZ, M. F. G. Eliminação de Gauss e Decomposição LU.

Decomposição LU - Unicamp, 2012. Disponivel em:

<http://www.ceset.unicamp.br/~marlih/ST464%20/Elimina%E7%E3o%20de%20G auss%20e%20Decomposi%E7%E3o%20LU.ppt&usg=AFQj>. Acesso em: 26 Setembro 2012.

HEWITT, P. G. Física Conceitual. 9ª. ed. Porto Alegre: Bookman, 2002.

HWU, W.-M.; STONE, J. The OpenCL Programming Model. Illinois UPCRC Summer School. Illinois. 2010.

IDA, C. O. Benchmarks, 2000. Disponivel em: <http://www.inf.ufrgs.br/gppd/disc/cmp134/trabs/T1/001/benchmarks/Benchmarks

_p2.htm>. Acesso em: 14 Jan 2013.

INTEL. Enhanced Intel® SpeedStep® Technology for the Intel® Pentium® M

Processor, 2004. Disponivel em: <ftp://download.intel.com/design/network/papers/30117401.pdf>. Acesso em: 27

INTEL. Intel.con. Dual-Core Intel® Xeon® Processor 7000 Sequence-based

Platforms, 2012. Disponivel em: <http://www.intel.com/content/dam/www/public/us/en/documents/platform-

briefs/xeon-7000-family-platform-brief.pdf>. Acesso em: 28 Novembro 2012.

INTEL. Intel® Core™ Processor Family. Intel.com, 2012. Disponivel em: <http://www.intel.com/content/www/us/en/processors/core/core-processor-

family.html>. Acesso em: 28 Novembro 2012.

INTEL. Intel® SDK for OpenCL* Applications 2012. Intel® Developer Zone, 2012. Disponivel em: <http://software.intel.com/en-us/vcsource/tools/opencl-sdk>. Acesso em: 25 Setembro 2012.

INTEL. Intel® Xeon Phi™ Coprocessor 5110P. Intel Corporation, 2012. Disponivel em: <http://www.intel.com/content/www/us/en/processors/xeon/xeon- phi-detail.html>. Acesso em: 14 Jan 2013.

INTEL. Intel® Xeon Phi™ Coprocessor: Parallel Processing. The Intel® Xeon Phi™ Coprocessor: Parallel Processing, Unparalleled Discovery, 2012. Disponivel em: <http://www.intel.com/content/www/us/en/high-performance- computing/high-performance-xeon-phi-coprocessor-brief.html>. Acesso em: 27 Novembro 2012.

INTEL. Products (Formerly Arrandale). ARK | Your source for information on

Intel products, 2012. Disponivel em: <http://ark.intel.com/products/codename/32724/Arrandale>. Acesso em: 27

Novembro 2012.

INTEL. The Intel® Xeon Phi™ Coprocessor 5110P. Intel® Xeon Phi™ Coprocessor: Parallel Processing, 2012. Disponivel em: <http://www.intel.com/content/www/us/en/high-performance-computing/high-

performance-xeon-phi-coprocessor-brief.html>. Acesso em: 14 Jan 2013.

KARAS, P. GPU Acceleration of Image Processing Algorithms. Masaryk University. Brno, p. 42. 2010.

KERR, A.; DIOAMONS, G.; YALAMANCHILI, S. A Characterization and Analysis of PTX Kernels. School of Electrical and Computer Engineering - Georgia Institute of Technology. Atlanta, Georgia, p. 10. 2009.

KHRONOS GROUP. OpenCL - The open standard for parallel programming of heterogeneous systems. Khronos Group, 2012. Disponivel em: <http://www.khronos.org/opencl/>. Acesso em: 25 Setembro 2012.

LEE, K. S. Characterization and Explitation of GPU Memory Systems. Virginya Politechnic Institute and State University. Blacksburg, Virginia, p. 85. 2012.

LI, R. T. X. A Micro-benchmark Suite for AMD GPUs. University of Delaware. Delaware, p. 10. 2010.

LILJA, D. J. Measuring Computer Performance: A practitioner's guide. Cambridge (UK): Cambridge University Press, 2000.

LINDHOLM, E. et al. NVIDIA Tesla: A Unified Graphis And Computing Architecture. SCHOOL OF COMPUTER SCIENCE, Carnegie Mellon, 2008. Disponivel em: <http://www.cs.cmu.edu/afs/cs/academic/class/15869- f11/www/readings/lindholm08_tesla.pdf>. Acesso em: 27 Novembro 2012.

MANDL, P.; BORDOLOI, U. General-purpose Graphics Processing Units Deliver New Capabilities to the Embedded Market. amd.com, 2011. Disponivel em: <http://www.amd.com/ru/Documents/GPGPU-Embedded-May-2011.pdf>. Acesso em: 16 Jan 2013.

MARINHA DOS ESTADOS UNIDOS. Curso de Eletricidade Básica. 1ª. ed. Rio de Janeiro: Hemus, 1998.

NASA. Nas Parallel Benchmarks. NAS Advanced Supercomputing Division, 2012. Disponivel em: <http://www.nas.nasa.gov/publications/npb.html>. Acesso em: 26 Setembro 2012.

NICKOLLS, J.; DALLY, W. J. THE GPU COMPUTING ERA. IEEE MICRO, Santa Clara, Califórnia, Março - Abril 2010. 56-69.

NVIDIA. CUDA C Programming Guide. Developer Zone, 2007. Disponivel em: <http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html>. Acesso em: 14 Jan 2013.

NVIDIA. NVIDIA GF100. NVIDIA, 2010. Disponivel em: <http://www.nvidia.com/attach/3632670.html?type=support&primitive=0>. Acesso em: 16 Jan 2013.

NVIDIA. NVIDIA GeForce GTX 680. The fastest, most efficient GPU ever built.,

2012. Disponivel em:

<http://www.geforce.com/Active/en_US/en_US/pdf/GeForce-GTX-680- Whitepaper-FINAL.pdf>. Acesso em: 27 Novembro 2012.

NVIDIA. OpenCL | Nvidia Developer Zone. Nvidia Developer Zone, 2012. Disponivel em: <http://developer.nvidia.com/cuda/opencl>. Acesso em: 25 Setembro 2012.

NVIDIA. Parallel Programming and Computing Platform | CUDA | NVIDIA. Welcome to NVIDIA - World Leader in Visual Computing Technologies, 2012. Disponivel em: <http://www.nvidia.com/object/cuda_home_new.html>. Acesso em: 27 Novembro 2012.

NVIDIA. What Is CUDA. Nvidia Developer Zone, 2012. Disponivel em: <http://developer.nvidia.com/what-cuda>. Acesso em: 30 Maio 2012.

NVIDIA. What is GPU Computing? | High-Performance Computing. NVIDIA, 2012. Disponivel em: <http://www.nvidia.com/object/what-is-gpu-computing.html>. Acesso em: 25 Setembro 2012.

OANCEA, B.; ANDREI, T.; DRAGOESCU, R. M. GPGPU Computing. Challenges of the Knowledge Society. IT, Bucharest, 11-12 Mai 2012. 2070.

OBAIDAT, M. S.; BOUDRIGA, N. A. Fundamentals of performance evaluation of computer and telecomunications systems. Nova Jersey (US): John Wiley & Sons, 2010.

O'MALLEY, J. Análise de Circuitos. 2ª. ed. São Paulo: Makron Books, 1993. RAMOS, N. Avaliação e comparação de desempenho de computadores: metodologia e estudo de caso. Universidade Federal de Pernambuco. Recife, p. 60. 2008.

RAUBER, T.; RÜNGER, G. Parallel programming for multicore and cluster systems. 1ª. ed. New York: Springer, 2010.

SAPHIR, W.; WOO, A.; YARROW, M. The NAS Parallel Benchmarks 2.1 Results.

Nas Parallel Benchmarks, 1996. Disponivel em: <http://www.nas.nasa.gov/assets/pdf/techreports/1996/nas-96-010.pdf>. Acesso em: 27 Setembro 2012.

SEOUL NATIONAL UNIVERSITY. SNU NPB Suite. Center for Manycore

Programming, 2011. Disponivel em: <http://aces.snu.ac.kr/Center_for_Manycore_Programming/SNU_NPB_Suite.html

>. Acesso em: 26 Setembro 2012.

STONE, J. E.; GOHARA, D.; SHI, G. OpenCL: A Parallel Programming Standard for Heterogeneous Computing Systems. US National Library of Medicine, 2010. Disponivel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2964860/>. Acesso em: 16 Jan 2013.

SUN, E.; KAELI, D. Aggressive Value Prediction on a GPU. 23rd International Symposium on Computer Architecture and High Performance Computing , Boston - MA, 26 - 29 Out 2011. 9 - 16.

TSUKAMOTO, S. K. Arquitetura dos supercomputadores – TOP500. Universidade de São Paulo. São Paulo, p. 16. 2010.

UNIVERSITY OF VIRGINIA. Leukocyte. Leukocyte - Rodinia, 2009. Disponivel em: <https://www.cs.virginia.edu/~skadron/wiki/rodinia/index.php/Leukocyte>. Acesso em: 22 Novembro 2012.

ZUBELLI, J. P. Decomposição LU. IMPA, 2010. Disponivel em: <http://w3.impa.br/~zubelli/tutorial/node11.html>. Acesso em: 26 Setembro 2012.

ANEXOS

ANEXO A – Instalação e Configuração do OpenCL

Abaixo descreveremos os passos seguidos para instalação e configuração das bibliotecas OpenCL no Ubuntu, conforme visto em <http://www.streamcomputing.eu/blog/2011-06-24/install-opencl-on-

debianubuntu-orderly>.

Cabeçalhos (Headers)

Os headers apenas necessitam ser baixados do site do distribuidor, conforme os códigos descritos abaixo:

cd /usr/include sudo mkdir CL cd CL

sudo wget http://www.khronos.org/registry/cl/api/1.1/cl_d3d10.h \ http://www.khronos.org/registry/cl/api/1.1/cl_ext.h \ http://www.khronos.org/registry/cl/api/1.1/cl_gl_ext.h \ http://www.khronos.org/registry/cl/api/1.1/cl_gl.h \ http://www.khronos.org/registry/cl/api/1.1/cl.h \ http://www.khronos.org/registry/cl/api/1.1/cl_platform.h \ http://www.khronos.org/registry/cl/api/1.1/opencl.h \ http://www.khronos.org/registry/cl/api/1.1/cl.hpp

Bibliotecas

Para configuração das bibliotecas primeiro deve ser instalado o SDK/Driver que contém as mesmas, após deve-se configurar o sistema, conforme especificado a seguir:

Intel:

sudo cp /usr/lib/libOpenCL.so /usr/lib/OpenCL/vendors/intel/

sudo echo "/usr/lib/OpenCL/vendors/intel" > /etc/ld.so.conf.d/opencl- vendor-intel.conf

sudo ldconfig

AMD:

sudo mkdir -p /usr/lib/OpenCL/vendors/amd/ sudo cp lib/x86/* /usr/lib/OpenCL/vendors/amd/

sudo echo "/usr/lib/OpenCL/vendors/amd" > /etc/ld.so.conf.d/opencl- vendor-amd.conf

sudo ldconfig

NVIDIA:

Para configuração da NVIDIA o caminho é um pouco mais complicado, visto que pode ser necessário manter as bibliotecas no local original para que não pare de funcionar a CUDA. Faz-se o seguinte:

sudo echo "/usr/local/cuda/lib" >> /etc/ld.so.conf.d/opencl-vendor- nvidia.conf

sudo ldconfig

LibOpenCL.so

Configuração da biblioteca do OpenCL:

Intel: sudo ln -s /usr/lib/OpenCL/vendors/intel/libOpenCL.so /usr/lib/libOpenCL.so.1.1 AMD: sudo ln -s /usr/lib/OpenCL/vendors/amd/libOpenCL.so /usr/lib/libOpenCL.so.1.1

NVIDIA:

sudo ln -s /usr/local/cuda/lib/libOpenCL.so /usr/lib/libOpenCL.so.1.0

O próximo passo deve ser feito para todos, visto que vincula a biblioteca 1.1 para funcionar também como a 1.0, visto que são compatíveis:

sudo ln -s /usr/lib/libOpenCL.so.1.1 /usr/lib/libOpenCL.so.1 sudo ln -s /usr/lib/libOpenCL.so.1 /usr/lib/libOpenCL.so sudo ln -s /usr/lib/libOpenCL.so.1.1 /usr/lib/libOpenCL.so.1.0

Feitos estes procedimentos basta agora instalar os drivers de cliente, se já não foi feito anteriormente.

Anexo B Configuração Dranetz Power Platform 4300

Abaixo apresentamos três manuais sobre o aparelho utilizado nas medições de energia, sendo os manuais referentes à configuração inicial, configuração para a medição de energia e procedimentos para salvar os dados em cartão de memória, transferência dos arquivos para o computador e operações com o software Dran View.

O manual será composto pelo passo à passo formado por imagens, com observações caso necessário.

Configuração inicial

A configuração do equipamento Dranetz Power Platform 4300 foi realizada conforme o manual de usuário disponível em <http://dranetz.com/pdf/powerplatform4300-multi-daq-taskcard-

operatorsmanual>.

Figura 22 - Ligando o aparelho.

Figura 23 – Inicialização do Dranetz.

Fonte: Laboratório do DCEEng.

Após inicializar, o aparelho questiona se desejamos selecionar sondagem de corrente? Basta pressionar o botão correspondente a opção YES.

Figura 24 - Selecionando a sondagem de corrente.

Fonte: Laboratório do DCEEng.

Na tela seguinte, devemos selecionar o tipo de sonda utilizada (TR2510), em nosso caso, utilizamos apenas o canal A ignorando os demais canais. Neste caso já está correto o modelo da sonda, basta pressionar EXIT.

Figura 25 - Selecionando o tipo de sonda utilizada (TR2510).

Fonte: Laboratório do DCEEng.

Na tela principal do aparelho, pressionamos o botão SETUP para acessar as configurações necessárias antes das medições.

Figura 26 – Tela principal do aparelho (acessando a tela de configurações).

Fonte: Laboratório do DCEEng.

A sequência de imagens abaixo ilustra os passos para a configuração da escala de fatores.

Figura 27 - Acessando a opção 5: ADVANCED SETUP OPTIONS.

Fonte: Laboratório do DCEEng.

Figura 28 – Acessando a opção 1: SET INPUT CONFIGURATIONS

Fonte: Laboratório do DCEEng.

Figura 29 – Acessando a opção 3: SET SCALE FACTORS.

Fonte: Laboratório do DCEEng.

“ENTER SCALE” e pressionando o teclado numérico para a entrada dos números) que fique conforme a imagem abaixo, lembrando que utilizaremos apenas o canal A para realizar as medições.

Figura 30 – Ajuste do fator de escala dos canais.

Fonte: Laboratório do DCEEng.

Após pressionamos duas vezes o botão EXIT para retornar ao menu principal das configurações.

No menu principal de configurações, apresentamos os passos para configurar a frequência de operação para 60Hz.

Figura 31 - Acessando a opção 4: SET SYNC PARAMETERS

Fonte: Laboratório do DCEEng.

A opção “SYNC MODE” deverá ficar como “External” e a opção “NOMINAL FREQUENCY” deverá ficar com o valor “60.0” conforme figura abaixo.

Figura 32 – Ajustando a frequência da rede elétrica.

Fonte: Laboratório do DCEEng.

Após pressionamos duas vezes o botão EXIT para retornar ao menu principal das configurações.

O último ajuste necessário está no intervalo em segundos de cada medição, sendo demonstrado na sequencia de figuras abaixo.

Figura 33 - Acessando a opção 5: SET INTERVAL FOR TIMED READINGS.

Figura 34 - Ajustando o intervalo em 5 segundos de medição dos dados.

Fonte: Laboratório do DCEEng.

Após pressionamos EXIT três vezes e voltamos a tela principal do Dranetz, concluindo assim a configuração inicial do mesmo.

Realizando as medições de energia

A sequência de figuras abaixo ilustra o passo a passo realizado no aparelho em cada medição de energia, salientando que a cada medição, o aparelho era desligado para a remoção do cartão de memória para coleta dos dados.

Figura 35 - Ligando o aparelho.

Figura 36 - Inicialização do Dranetz.

Fonte: Laboratório do DCEEng.

Após inicializar, o aparelho questiona se desejamos selecionar sondagem de corrente? Basta pressionar o botão correspondente a opção YES.

Figura 37 – Confirmando a utilização de sondagem de corrente.

Fonte: Laboratório do DCEEng.

Na tela seguinte, devemos selecionar o tipo de sonda utilizada (TR2510), em nosso caso, utilizamos apenas o canal A ignorando os demais canais. Neste caso já está correto o modelo da sonda, basta pressionar EXIT.

Figura 38 – Definindo o tipo da sonda utilizada.

Fonte: Laboratório do DCEEng.

Agora vamos desativar os canais (B, C e D) que não iremos utilizar pressionando o botão SELECT CHANNEL.

Figura 39 – Acessando menu para desabilitar canais desnecessários.

Fonte: Laboratório do DCEEng.

Para desativar um canal, basta apertar o botão “NEXT CHANEL” para trocar de canal (A, B, C ou D) e após pressionar os botões “VOLTS ON/OFF” e “AMPS ON/OFF” para desativar as medições nos canais desejados (B, C e D)

Ao finalizar de desativar a medição nos canais B, C e D o resultado deverá ser conforme a imagem na sequencia. Após, basta pressionar o botão EXIT e retornar a tela principal.

Figura 40 – Canais B, C e D desativados.

Fonte: Laboratório do DCEEng.

Para acompanhar melhor a medição de energia, na tela principal pressionamos o botão “METER MODE”.

Figura 41 – Alterando a visualização da medição de energia.

Fonte: Laboratório do DCEEng.

Após pressionamos NEXT METER para a exibição da medição desejada.

Figura 42 - Alterando para a próxima visualização da medição de energia.

Fonte: Laboratório do DCEEng.

Exibição da tela de medição desejada. Para sair da tela, basta pressionar EXIT.

Figura 43 – Tela utilizada para acompanhar as medições de energia.

Fonte: Laboratório do DCEEng.

Salvando os dados e exportando para arquivo TXT

Com o equipamento já ligado e em funcionamento, na tela principal, basta acessar a opção SETUP para acessar as funções do cartão de memória.

Figura 44 – Acessando o menu de configurações.

Fonte: Laboratório do DCEEng.

Figura 45 - Acessando a opção 4: MEMORY FUNCTIONS.

Fonte: Laboratório do DCEEng.

Figura 46 - Acessando a opção 1: MEMORY CARD FUNCTIONS.

Figura 47 - Acessando a opção WRITE CARD para salvar os dados coletados.

Fonte: Laboratório do DCEEng.

Para salvar os dados no cartão, basta pressionar as opções WRITE EVENTS, WRITE SETUPS e WRITE BOTH.

Figura 48 - Salvar os dados coletados no cartão.

Fonte: Laboratório do DCEEng.

Após salvar os dados, basta desligar o aparelho para remover o cartão de memória.

Figura 49 – Removendo o cartão de memória na frontal direita do aparelho.

Fonte: Laboratório do DCEEng.

Figura 50 - Salvando os dados para o computador

Fonte: Laboratório do DCEEng.

São 3 arquivos (HCI.EVT, HCI.SET, HCI.MDB) que o Dranetz gera, os quais salvamos no computador, sendo utilizado apenas o arquivo HCI.EVT devido ao fato de ser armazenado neste arquivo os últimos 20 minutos de medição, onde a cada medição de 10 minutos, salvava-se os dados no computador, não sendo necessários os demais arquivos.

Para visualizar os dados gerados, utilizamos o software Dran-View 6.0 Entrerprise (trial). A versão do programa utilizada foi a “Enterprise” que está disponível para download em <http://dranetz.com/dran-view-6.11.02-trial-zip >.

Figura 51 - Tela principal do Dran-View.

Fonte: print do software em execução.

Para efetuarmos a exportação dos arquivos, precisamos habilitar uma barra de ferramentas (Adittional Tools), habilitamos esta barra ao clicar com o botão direito do mouse sobre alguma das barras já existentes, selecionando a opção Additional Tools ( ), a qual disponibiliza o botão properties ( ).

Após, basta abrir os arquivos salvos, clicar no botão “properties” acima citado e selecionar o que desejamos exportar, conforme pode ser visualizado na imagem abaixo.

Figura 52 - Selecionando as informações desejadas.

Fonte: print do software em execução.

Na sequencia, basta ir ao menu “FILE” opção “Save AS” e salvar o arquivo no local desejado com o formato TXT. Após o arquivo TXT salvo, efetuamos a importação do mesmo com o Microsoft Excel, convertendo o mesmo em tabela e realizando os cálculos necessários.

ANEXO C – Tabelas de Resultados de Testes

Tabela 8 - Bus Speed Download (GB/s) GPU NVIDIA GPU AMD CPU Intel

6,6460 6,2295 10,4954 6,6459 6,2254 11,1333 6,6459 6,2358 11,0989 6,6460 6,0651 10,6862 6,6460 5,9139 11,2605 6,6460 6,1792 10,0262 6,6460 6,0616 10,1543 6,6459 6,2196 11,0219 6,6436 6,1779 11,3183 6,6460 5,9585 10,9840 6,6457 6,1267 10,8179

Tabela 9 - Bus Speed ReadBack (GB/s) GPU NVIDIA GPU AMD CPU Intel

6,6450 6,7316 11,0794 6,6453 6,7359 9,8684 6,6454 6,6698 11,7086 6,6454 6,6905 10,4257 6,6452 6,6945 10,9711 6,6453 6,7144 12,0194 6,6453 6,7097 10,6183 6,6453 6,6675 10,9464 6,6451 6,6688 12,0670 6,6454 6,6959 10,3341 6,6453 6,6979 11,0038

Tabela 10 - Peak FLOPS (SP) (GFLOPS)

GPU NVIDIA GPU AMD CPU Intel

151,5270 187,2730 51,0947 151,5280 187,3290 49,5782 151,5280 187,2230 52,8964 151,7990 187,1500 52,8982 151,5290 187,3810 52,8835 151,8010 187,1500 51,6860 151,5260 187,2810 51,0778 151,7970 187,2370 52,8652 151,5270 187,1780 51,0936 151,5310 187,1860 52,8681 151,6093 187,2388 51,8942

Tabela 11 - Peak FLOPS (DP) (GFLOPS)

GPU NVIDIA GPU AMD CPU Intel

12,9508 Não Suportado 50,7741 12,9508 Não Suportado 50,8315 12,9508 Não Suportado 52,7497 12,9508 Não Suportado 52,7624 12,9508 Não Suportado 52,7635 12,9508 Não Suportado 52,7587 12,9509 Não Suportado 50,7905 12,9508 Não Suportado 52,7908 12,9508 Não Suportado 50,8408 12,9508 Não Suportado 52,0446 12,9508 Não Suportado 51,9107

Tabela 12 - Device Memory (AMD)

Global Read

Global Read

Strided Global Write

Global

Documentos relacionados