Comparativo do Tempo Total das Execu¸c˜ oes

Diferente do tempo obtido na execu¸cão do la¸co, onde foi medido o tempo entre um código paralelizado e um código sequencial, nos tempos totais é considerado todo o código ainda sequencial e todas as chamadas de métodos implementados em outra linguagem de programa¸cão(Fortran) e o código paralelizado.

Tabela 6.2: Resultados médios das 10 execu¸cões em cada computador e método de execu¸cão do la¸co para cada número de pontos da curva de luz.

Pontos i5 single i7 single i5 parallel i7 parallel 1000000 00:16,481 00:12,931 00:12,798 00:10,246

A diferen¸ca na execu¸c˜ao considerando os tempos totais, seguem um perfil semelhante entre os computadores com i5 e i7.

Isto pode ser melhor observado na Figura 6.5 e Figura 6.6, por´em os tempos obtidos s˜ao significativamente menores.

Figura 6.5: Gráfico comparativo entre versão sequencial do código utilizado em dois computadores diferentes

Na execu¸c˜ao em paralelo o resultado obtido ´e mostrado na Figura 6.6

Figura 6.6: Gráfico comparativo entre versão paralelizada do código utilizado em dois computadores diferentes

Diferente das execu¸cões em la¸co, no computador com processador i5 o tempo total teve um speedup médio de 1,29 vezes a execu¸cão sequencial com um tempo de execu¸cão de 77,72% do tempo de execu¸cão entre as versões paralela e sequencial, segue proporcional ao aumento do número de pontos, conforme mostrado nos dois próximos gráficos da próxima página.

Figura 6.7: Compara¸c˜ao entre o m´etodo sequencial e paralelo no i5

Os dados das execu¸c˜oes no i5 (Figura 6.7) e i7 (Figura 6.8) assim como nos resultados da execu¸c˜ao do la¸co, seguem um perfil semelhante entre os dois tipos de processadores, pois o ganho de performance em ambos os computadores foi proporcionalmente semelhante.

No tempo total de execu¸cão obtido no computador com processador i7 obteve um speedup médio de 1,26 e um tempo de execu¸cão correspondente a 79,19% do tempo de execu¸cão da versão sequencial.

Figura 6.8: Compara¸c˜ao entre o m´etodo sequencial e paralelo no i7

O resultado paralelizado ainda teve um aumento escalar semelhante ao resultado sequencial, por conta da parte do c´odigo em Fortran, que tomou a maior parte da execu¸c˜ao do processamento da curva de luz.

6.4 Comparativo do tempo de execu¸ c˜ ao entre vers˜ ao sequencial x paralelizada

As versões paralelizadas do la¸co escolhido tiveram um tempo de execu¸cão menor que 1 segundo, portanto ao se comparar as suas execu¸cões com os tempos no código sequencial seus valores quase não são vis´ıveis na Figura 6.9, os tempos em paralelo ficam praticamente sobrepostos na barra inferior da imagem, porém, seus tempos diferem nos m´ılésimos de segundo conforme vistos na Figura 6.4.

Figura 6.9: Gráfico comparativo das execu¸cões do FOR para diferentes computadores Ao se comparar o tempo total de todas as execu¸cões, na Figura 6.10 é poss´ıvel visualizar que o tempo de execu¸cão do código paralelizado no computador com processador de menor capacidade chega a ter um desempenho semelhante ao tempo de execu¸cão sequencial no computador com processador com maior capacidade.

Figura 6.10: Gráfico comparativo das execu¸cões totais para diferentes computadores O speedup obtido na execu¸cão do la¸co FOR no processador i5 foi de 452,04 e no processador i7 foi de 288,36. Já o aumento de desempenho no tempo de execu¸cão total foi de 1,29 na execu¸cão no notebook com processador i5 e 1,26 na execu¸cão no notebook com processador i7.

Para garantir que o resultado da paraleliza¸cão não gerasse nenhuma distor¸cão na gera¸cão de curvas de luz, foi gerada curvasd e luz tanto para a execu¸cão sequencial quanto para a execu¸cão paralela. Na Figura 6.11 é apresentada uma curva de luz com 1.000.000 pontos gerada através do modelo ellc, os demais parâmetros são os mesmos aplicados para a execu¸cão das tomadas de tempo apresentadas anteriormente.

Figura 6.11: Gera¸c˜ao de curvas de luz do modelo ELLC sequencial

Ja na imagem Figura 6.12 uma uma vers˜ao da curva de luz com 1.000.000 de pontos foi gerada pelo metodo paralelizado.

Figura 6.12: Gera¸c˜ao de curvas de luz do modelo ELLC Paralela

Conforme apresentado nas figuras Figura 6.11 e Figura 6.12 as curvas de luz geradas pelos dois modelos são semelhantes e consistentes, mostrando que mesmo com a parale-liza¸cão o código gerado não apresenta distor¸cões em rela¸cão a curva de luz gerada pelo código sequencial.

Cap´ıtulo 7

Conclus˜ oes e Trabalhos Futuros

Considerando o crescente aumento na busca por exoplanetas e na aplica¸cão do método de trânsitos planetários resultando em confirma¸cões e descobertas importantes, este trabalho buscou expor alguns modelos conhecidos para análise fotométrica, porém com principal foco o modelo ELLC, que foi proposto por Maxted (2016) para análise e gera¸cão de curvas de luz de estrelas binárias e trânsitos planetários, este modelo implementa e permite que sejam utilizados diferentes algoritmos de escurecimento de limbo conhecidos, também implementa efeitos de reflexão e manchas estelares. Maxted adicionou, na execu¸cão das simula¸cões, métodos de Monte Carlo via Cadeias de Markov através do pacote emcee do python. Apesar de ter uma parte do código escrito Fortran e necessitando sua instala¸cão para que o ELLC, seja instalado, sua execu¸cão é feita através do Python. Porém o modelo ELLC mesmo que tenha sido proposto para execu¸cão rápida, não implementa nenhum método de paraleliza¸cão em seu código. Nesta disserta¸cão, foi realizada a paraleliza¸cão do modelo ELLC, gerador de modelos fotométrico-anal´ıticos para curvas de luz de trânsitos planetários, utilizando a arquitetura OpenMP.

No primeiro momento, foi feita uma análise dos tempos de execu¸cão total e dos dois la¸cos que o método de curvas de luz (lc) do ELLC utiliza, o primeiro la¸co presente na fun¸cão lc apresentou um tempo de execu¸cão inferior ao segundo la¸co, mesmo com uma grande quantidade de pontos utilizado para gerar uma curva de luz, o segundo la¸co em contra partida, apresentou um tempo de execu¸cão proporcional ao número de pontos utilizados, por isso o segundo la¸co foi escolhido para ser implementado o OpenMP, toda a implementa¸cão foi descrita na Se¸cão 5.1.

Durante a implementa¸cão, foram estudados diversos parâmetros poss´ıveis e os métodos de aplica¸cão do OpenMP através do compilador C do Python. Dentre os parâmetros utilizados, a aloca¸cão de itera¸cões dinâmica consumiu grande parte de memória dispon´ıvel no computador, chegando a ter um uso de 100% de memória e travando a execu¸cão para

uma grande quantidade de pontos, a aloca¸cão de itera¸cões estatica para todos os processos, fez um melhor uso da memória dispon´ıvel para todo o conjunto de intera¸cões da simula¸cão.

O uso do NOGIL se mostrou essencial para melhores resultados na execu¸c˜ao do c´odigo.

Para que todo o código do la¸co não necessitasse utilizar o GIL, foi necessário a conversão das variáveis em python utilizadas no la¸co para variaveis do C, definidas com CDEF.

apresentadas.

Conclu´ıda a implementa¸cão, foram feitos diversos ajustes nos parâmetros utilizados para obter o melhor resultado e após obter o melhor ajuste, foram iniciadas as medi¸cões de execu¸cão do código paralelizado e sequencial. Para efeito de compara¸cão, foi feita a execu¸cão do mesmo código em dois computadores diferentes.

Os resultados que foram utilizáveis para a avalia¸cão do ganho de desempenho equi-valem a 10 execu¸cões para cada número de pontos definido na execu¸cão, iniciados em um milhão de pontos, sendo incrementados em um milhão, até o total de trinta milhões de pontos, totalizando 300 execu¸cões sequenciais e 300 execu¸cões paralelas que foram aproveitadas. As execu¸cões onde ocorreram erros no meio do processo, ainda não estavam no estágio final de ajuste e foram descartadas.

Desse resultado, foi calculada a média do tempo para cada número de pontos, sendo assim os tempos obtidos e com base nesses resultados foram montado os gráficos exibidos no cap´ıtulo 6 assim o ganho obtido nas execu¸cões.

Comparando os tempos de execu¸cão do la¸co (FOR) paralelizado com a sua vesão sequencial, é poss´ıvel observar que o ganho de desempenho é significativamente positivo, independente do computador utilizado os resultados ficaram abaixo de 1 segundo para execu¸cão do la¸co, como visto nas Figuras 6.2 e 6.3 , onde os tempos medidos ficam entre 0 a 1 segundos para todos os números de pontos utilizados. O ganho de desempenho obtido no computador com processador i5 e 16GB de memória, foi de 99,77% e o resultado no computador com processador i7 e 12GB de memória foi de 99,65%. Mesmo que a capacidade de processamento, maior do computador com processador i7, tenha atingido tempos menores que o outro computador, ele possui uma quantidade de memória dispon´ıvel menor que o outro computador com processador i5, como visto no Cap´ıtulo 4.

A divisão do processo é feita de acordo com a memória dispon´ıvel que é compartilhada entre os processadores, com isso o ganho obtido nesse computador foi menor.

Analisando os tempos totais da execu¸cão das simula¸cões, os ganhos de desempenho obtidos para o computador i5 e 16GB de memória foram de 22,28%, seguindo mesmo

observado na execu¸cão do la¸co, o computador com processador i7 e 12GB de memória teve um ganho de 20,80% na execu¸cão do código paralelizado em rela¸cão ao código sequencial. Foi poss´ıvel observar que um computador com processador i5, utilizando multiprocessamento, obteve uma performance semelhante a um computador de maior capacidade de processamento como o segundo computador utilizado nas simula¸cões, que possu´ıa um processador i7. Considerando o ganho da execu¸cão total em rela¸cão ao tempo de execu¸cão do la¸co desproporcional, foi medido o tempo de cada chamada a fun¸cões do Python ou Fortran do código do ELLC, constatado que o tempo de execu¸cão de uma fun¸cão do fortran (ELLC f) é equivalente a quase o tempo total da execu¸cão.

Como conclusão geral, os resultados obtidos neste trabalho apontam que a parale-liza¸cão do código utilizando OpenMP pode obter um ganho significante de desempenho na gera¸cão de curvas de alta qualidade com o modelo ELLC.

Como extensão deste trabalho, sugere-se a paraleliza¸cão da gera¸cão de curvas de velocidade radial para o Módulo ELLC. Curvas de velocidade radiais podem ser utilizadas como elementos de confirma¸cão de exoplanetas descobertos na análise de curvas de luz. As curvas de velocidades radiais do Módulo ELLC também permitem a gera¸cão de um número arbitrário de pontos e, à medida que a quantidade destes pontos aumenta, esquemas de alto desempenho com OpenMP podem acelerar a gera¸cão destas curvas.

Outra extensão interessante refere-se ao uso do código paralelizado do Módulo ELLC para processos de ajustes de parâmetros do modelo com dados observacionais. Em particular, dados de fotometria de alta qualidade futuros como os das missões TESS e PLATO poderiam utilizar o esquema eficiente de gera¸cão de curvas de luz de alta qualidade proposto nesta disserta¸cão com esquemas eficientes de ajustes de parâmetros MCMC.

Apˆ endices

Apˆ endices A

Tabelas Complementares de Execu¸ c˜ ao

Complementariamente aos resultados apresentados no 6, onde são apresentados a dura¸cão média de cada execu¸cão, nesta se¸cão estão as tabelas contendo os valores originais de cada execu¸cão do código.

Primeiro são apresentadas as tabelas referentes as execu¸cões do la¸co, tanto para o processador i5 quanto para o processador i7, em seguidão são apresentadas as tabelas contendo os tempos de execu¸cão total do código ELLC. O calculo da % corresponde a rela¸cão entre a execu¸cão sequencial e a execu¸cão paralela.

A Tabela 1.1 apresenta as execu¸cões do la¸co escolhido para paraleliza¸cão do método de gera¸cão de curvas de luz do ELLC no processador i5. Parte dos resultados não correspondiam a toda uma itera¸cão dos 30 milhoes de pontos, por não atenderem a toda a amostra necessária, esses dados não foram considerados válidos.

A Tabela 1.3 são apresentadas as tabelas contendo os valores totais da execu¸cão do código no computador com processador i5, esta tabela contém as 10 execu¸cões finais para cada numero de pontos informados.

A Tabela 1.2 apresenta as execu¸cões do la¸co escolhido para aplica¸cão do ELLC no processador i7, da mesma forma que o ocorrido no computador com processador i5, parte dos registros de execu¸cão ficaram indispon´ıveis, somente foram utilizados os registros que atendiam toda uma itera¸cão dos 30 milhões de pontos.

A Tabela 1.4 são apresentadas as tabelas contendo os valores totais da execu¸cão do código no computador com processador i7.

Tabela 1.1: Tempos de execu¸c˜ao do la¸co paralelizado x la¸co sequencial do ELLC no processador i5

Tabela 1.2: Tempos de execu¸c˜ao do la¸co paralelizado x la¸co sequencial do ELLC no processador i7

Tabela 1.3: Tempos de execu¸cão total do código paralelizado x código sequencial do ELLC no processador i5

Tabela 1.4: Tempos de execu¸cão total do código paralelizado x código sequencial do ELLC no processador i7

REFERˆ ENCIAS

Eastman, J.; Gaudi, B.; Agol, E. Exofast: A fast exoplanetary fitting suite in idl.

Publications of the Astronomical Society of Pacific, , n. 125 (23), p. 83–93, 2013.

Gazak, J. Z.; Johnson, J. A.; Tonry, J. Transit analysis package: An idl graphical user interface for exoplanet transit photometry. Advances in Astronomy, , n. 30, p. 150–162, 2012.

Gim´enez, A. Equations for the analysis of the light curves of extra-solar planetary systems. Astronomy and Astrophysics, , n. 450 (3), p. 1231–1237, 2006.

Kipping, D.; Spiegel, D. Detection of visible light from the darkest world. Monthly Notices of the Royal Astronomical Society, , n. 417 (1), p. 88–92, 2011.

Kjurkchieva, D.; Dimitrov, D.; Vladev, A.; Yotov, V. New approach for modeling of transiting exoplanets for arbitrary lim-darkening law. Monthly Notices of the Royal Astronomical Society, , n. 3, p. 1–10, 2013.

Kreidberg, L. batman: Basic transit model calculation in python. Publications of the Astronomical Society of the Pacific, , n. 127 (957), p. 100–137, 2015.

Mandel, K.; Agol, E. Analytic light curves for planetary transit searches. ApJ, v. 580, n. 118,119, p. L171–L175, 2002.

Maxted, P. Ellc-a fast, flexible light curve model for detached eclipsing binary stars and transiting exoplanets. Astronomy and Astrophysics, , n. 591, p. 1–16, 2016.

Montalto, M.; Bou´e, G.; Oshagh, M.; Boisse, I.; Bruno, G.; Santos, N. C.

Improvements on analytic modelling of stellar spots. Monthly Notices of the Royal Astronomical Society, v. 444, p. 1721–1728, 2014.

Morris, B. Oscaar: Open source differential photometry code for amateur astronomical research. 2012.

Dispon´ıvel emhttps://github.com/OSCAAR/OSCAAR.

Morris, B.; Mandell, A.; Deming, F. Kepler’s optical secondary eclipse of hat-p-7b and probable detection of planet-induced stellar gravity darkening. The Astrophysical Journal Letters, , n. 764 (2), p. 30–40, 2013.

Parviainen, H. Pytransit: Fast and easy exoplanet transit modelling in python.

Monthly Notices of the Royal Astronomical Society, v. 312, p. 1470–1482, 2015.

Perryman, M. The exoplanet handbook. Cambridge University Press, 2011.

P´al, A. Fitsh: A software package for image processing. In: Monthly Notices of the Royal Astronomical Society, v. 421 (3), p. 1825–1837, 2011.

Rauer, H.; Catala, C. nad Aerts, C. e. a. The plato 2.0 mission. Experimental Astronomy, v. 249, p. 249–230, 2014.

Ricker, G.; Winn, J.; Vanderspek, R. The transiting exoplanet survey satellite.

Journal of Astronomical Telescopes, Instruments and Systems, v. 1, p. 1–40, 2016.

Silva, A. V. R. Method for spot detection on solar-like stars. The Astrophysical Journal Letters, , n. 585, p. 147–150, 2003.

Silva-Valio, A. Estimating stellar rotation from starspot detcetion during planetary transits. The Astrophysical Journal Letters, , n. 683 (2), p. 30–42, 2008.

Southworth, J.; Smalley, B.; Maxted, P.; Etzel, P. Accurate fundamental parameters of eclipsing binary stars. Proceedings IAU Simposium 224, p. 1–15, 2004.

No documento Paraleliza¸c˜ ao OpenMP do Gerador de Modelos Fotom´ etrico-Anal´ıticos de Trˆ ansitos Planet´ arios ELLC (páginas 50-67)