• Nenhum resultado encontrado

Ferramentas da astroestatística para o estudo da velocidade radial estelar

N/A
N/A
Protected

Academic year: 2021

Share "Ferramentas da astroestatística para o estudo da velocidade radial estelar"

Copied!
94
0
0

Texto

(1)UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE FÍSICA TEÓRICA E EXPERIMENTAL PROGRAMA DE PÓS - GRADUAÇÃO EM FÍSICA. F ERRAMENTAS DA A STROESTATÍSTICA PARA O ESTUDO DA VELOCIDADE RADIAL ESTELAR. M ÁRCIO A SSUNÇÃO T EIXEIRA. NATAL - RN. J ULHO 2016.

(2) M ÁRCIO A SSUNÇÃO T EIXEIRA. F ERRAMENTAS DA A STROESTATÍSTICA PARA O ESTUDO DA VELOCIDADE RADIAL ESTELAR. Dissertação de Mestrado apresentada ao programa de pósgraduação em Física do Departamento de Física Teórica e experimental da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do grau de mestre em Física. Orientador: Daniel Brito de Freitas. NATAL - RN. 2016.

(3) i.

(4) À todos que me fizeram chegar até aqui. ii.

(5) AGRADECIMENTOS Agradeço, primeiramente, à minha família, por todo o incentivo e apoio durante o mestrado. À minha namorada, que esteve comigo durante as fases difíceis e de frustração. A todos os amigos do departamento, que sempre estiveram comigo, que compartilharam todas as dificuldades enfrentadas e que me ajudaram nos momentos difíceis. Ao meu orientador, Daniel, por ter me dado a orientação, durante esse período do mestrado, necessária para o meu desenvolvimento como pesquisador e preparação para um futuro doutorado, aprendizado que levarei comigo por toda minha vida acadêmica e profissional. A todos os professores que fizeram parte da minha formação, de forma direta ou indireta, por terem me dado o conhecimento necessário para a minha formação, tanto como estudante, quanto como futuro profissional. Por fim, agradeço ao CNPq, pelo apoio financeiro, através da concessão da bolsa de Mestrado, que permitiu a realização desse trabalho.. iii.

(6) “There are an infinite number of worlds, some like this world, others unlike it” . Epicurus. iv.

(7) Ferramentas da Astroestatística para o estudo da velocidade radial estelar por. Márcio Assunção Teixeira. R ESUMO O método da velocidade radial estelar é usada desde as descobertas dos primeiros exoplanetas. Esse método tem se mostrado bem sucedido na obtenção dos parâmetros orbitais dos exoplanetas, como, por exemplo, a excentricidade da órbita, o período de translação, a relação de massa do planeta, a distância do periastro, entre outros. A análise dos dados de velocidade radial contém vários problemas, devido a sua função matemática ser altamente não-linear e multimodal. Para a inferência desses parâmetros, métodos estatísticos adequados são necessários na análise dos dados. Nesse trabalho, desenvolvemos algoritmos que nos permite realizar inferências estatísticas. Os métodos de inferência utilizados são o método do χ2 mínimo, o método de Monte Carlo via cadeia de Markov e o Nested Sampling. Estudamos cada um dos métodos, simulando dados, com adição de ruído, e aplicando-os em dois casos: na equação linear e para funções senoidais. Por último, aplicamos os métodos estatísticos para o caso da velocidade radial estelar, fazendo uso de dados da estrela HD 187085, com o objetivo de determinar a eficácia de tais métodos, comparando os resultados com os obtidos na literatura.. v.

(8) Astrostatistical tools for the study of stellar radial velocity by. Márcio Assunção Teixeira. A BSTRACT Stellar radial velocity method has been used since the descovery of the earliest exoplanets. This method has been very successful in the obtention of exoplanets’ orbital parameters, such as, for exemple, the orbital eccentricity, the translational period, the planet’s mass relation, the periastron distance, among others. The analysis of radial velocity data has various problems due to its mathematical function, that is highly non-linear and multimodal. For parameter inference, adequated statistical methods are required, in the analysis of these datas. In this work, the development of algorithms allows the performance of statistical inference. The inference methods used are the minimum χ2 method, Markov Chain Monte Carlo method and the Nested Sampling. Each method is studied by simulating data, with noise addition, and applying these methods to two cases: a linear equation and sinusoidal functions. Finally, the statistical methods are applied in the case of the stellar radial velocity, by using the HD 187085 star’s data, aiming to determine the efficiency of such methods, by comparing the results with previously obtained results in literature.. vi.

(9) LISTA DE FIGURAS. 1.1. Redução do fluxo relativo no método de trânsito planetário . . . . . . . . . . . . .. 3. 1.2. Orientações das órbitas de exoplanetas . . . . . . . . . . . . . . . . . . . . . . . .. 4. 1.3. Desvio do espectro luminoso de uma estrela devido a presença de um planeta . . .. 5. 1.4. Esquematização dos métodos de detecção de planetas . . . . . . . . . . . . . . . .. 8. 2.1. Caracteristicas de uma órbita elíptica . . . . . . . . . . . . . . . . . . . . . . . . .. 13. 2.2. Caracteristicas de uma órbita em três dimensões . . . . . . . . . . . . . . . . . . .. 15. 2.3. Curvas de velocidade para e = 0, 05 . . . . . . . . . . . . . . . . . . . . . . . . .. 19. 2.4. Curvas de velocidade para e = 0, 5 . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 2.5. Curvas de velocidade para e = 0, 9 . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 3.1. Exemplo do método do χ2 mínimo . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 3.2. Exemplo do método de Levenberg-Marquardt . . . . . . . . . . . . . . . . . . . .. 31. 3.3. Cadeias Markovianas de parâmetros orbitais . . . . . . . . . . . . . . . . . . . . .. 38. 3.4. Distribuição posteriori de parâmetros orbitais . . . . . . . . . . . . . . . . . . . .. 38. 3.5. Algoritmo de Metropolis-Hastings em conjunto com o Amostrador de Gibbs . . . .. 40. vii.

(10) 3.6. Evidência em termos da likelihood e da massa cumulativa a priori . . . . . . . . .. 42. 3.7. Contorno de likelihood no Nested Sampling . . . . . . . . . . . . . . . . . . . . .. 44. 3.8. Nested Sampling para sistema multi-planetários . . . . . . . . . . . . . . . . . . .. 45. 4.1. Simulação do teste do χ2 mínimo com ruído uniforme . . . . . . . . . . . . . . . .. 48. 4.2. Simulação do teste do χ2 mínimo com ruído gaussiano . . . . . . . . . . . . . . .. 49. 4.3. Melhor ajuste através do MCMC para prioris uniformes . . . . . . . . . . . . . . .. 50. 4.4. Cadeias Markovianas e distribuição posteriori para equação linear - caso 1 . . . . .. 51. 4.5. Melhor ajuste através do MCMC para diferentes priori . . . . . . . . . . . . . . .. 52. 4.6. Cadeias Markovianas e distribuição posteriori para equação linear - caso 2 . . . . .. 53. 4.7. Melhor ajuste através do Nested Sampling para diferentes priori . . . . . . . . . .. 55. 4.8. Melhor ajuste através do Nested Sampling para priori gaussiana . . . . . . . . . .. 55. 4.9. Curva de melhor ajuste da função seno através do χ2 mínimo . . . . . . . . . . . .. 57. 4.10 Curva de melhor ajuste da soma de cossenos através do χ2 mínimo . . . . . . . . .. 57. 4.11 Curva de melhor ajuste da função seno através do MCMC . . . . . . . . . . . . .. 58. 4.12 Cadeias de Markov e distribuições posteriori para a função seno . . . . . . . . . .. 59. 4.13 Curva de melhor ajuste da soma de cossenos para análise MCMC . . . . . . . . . .. 60. 4.14 Cadeias de Markov e distribuições posteriori para a soma de cossenos . . . . . . .. 61. 4.15 Melhor ajuste pelo método Nested Sampling para função seno . . . . . . . . . . .. 62. 4.16 Melhor ajuste pelo método Nested Sampling para a soma de cossenos . . . . . . .. 63. 4.17 Curva de velocidade radial obtido por Balan & Lahav . . . . . . . . . . . . . . . .. 65. 4.18 Curva de velocidade radial no melhor ajuste dos parâmetros - Simulado . . . . . .. 66. 4.19 Curva de velocidade radial no melhor ajuste dos parâmetros para HD 187085 através do χ2 mínimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. viii. 67.

(11) 4.20 Cadeias Markovianas e distribuições posterioris para HD 187085 pelo método MCMC 69 4.21 Curva de velocidade radial, através do MCMC, para HD 187085 . . . . . . . . . .. 71. 4.22 Curva de velocidade radial, através do Nested Sampling, para HD 187085 . . . . .. 72. ix.

(12) LISTA DE TABELAS. 2.1. Influência de diferentes companheiras em uma estrela M2 . . . . . . . . . . . . . .. 22. 4.1. Comparação entre os melhores ajustes para ruído uniforme . . . . . . . . . . . . .. 48. 4.2. Comparação entre os melhores ajustes para ruído gaussiano . . . . . . . . . . . . .. 49. 4.3. Distribuições a priori dos parâmetros orbitais para o método MCMC. . . . . . . . .. 68. 4.4. Melhor ajuste dos parâmetros orbitais obtidos por Balan & Lahav (2008b) . . . . .. 70. 4.5. Melhor ajuste dos parâmetros orbitais obtidos para HD 187085 através do MCMC .. 70. 4.6. Melhor ajuste dos parâmetros orbitais obtidos para HD 187085 através do Nested Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.7. 72. Comparação entre os melhores ajustes dos parâmetros orbitais obtidos para HD 187085 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. x. 72.

(13) SUMÁRIO. Resumo. v. Abstract. vi. Lista de Figuras. ix. Lista de Tabelas. x. 1. Introdução. 1. 1.1. Principais técnicas de detecção de exoplanetas . . . . . . . . . . . . . . . . . . . .. 2. 1.1.1. Trânsito planetário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.1.2. Velocidade radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 1.1.3. Outros métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. Motivações e objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 1.2 2. Velocidade radial como forma de detectar exoplanetas. 11. 2.1. 12. Órbitas elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. xi.

(14) 3. 2.2. Velocidade radial e curvas de velocidade . . . . . . . . . . . . . . . . . . . . . . .. 16. 2.3. Erros das medidas e ruídos astrofísicos . . . . . . . . . . . . . . . . . . . . . . . .. 22. Métodos estatísticos e inferência 3.1. Método da máxima verossimilhança e o método do χ2 mínimo . . . . . . . . . . .. 26. 3.2. Método do mínimo quadrado não-linear . . . . . . . . . . . . . . . . . . . . . . .. 28. 3.2.1. O método do máximo declive . . . . . . . . . . . . . . . . . . . . . . . .. 29. 3.2.2. Método de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 3.2.3. Método de Levenberg-Marquardt . . . . . . . . . . . . . . . . . . . . . .. 30. 3.3. Teorema de Bayes e a inferência Bayesiana . . . . . . . . . . . . . . . . . . . . .. 32. 3.4. Método de Monte Carlo via cadeia de Markov (MCMC) . . . . . . . . . . . . . .. 34. 3.4.1. Algoritmo de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . .. 36. 3.4.2. Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 39. Nested Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 40. 3.5 4. 25. Simulações e resultados. 46. 4.1. Equação linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 47. 4.1.1. Método do χ2 mínimo . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 47. 4.1.2. Método de Monte Carlo via Cadeia de Markov . . . . . . . . . . . . . . .. 50. 4.1.3. Nested Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 54. Senos e cossenos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. 4.2.1. Método do χ2 mínimo . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. 4.2.2. Método de Monte Carlo via Cadeia de Markov . . . . . . . . . . . . . . .. 58. 4.2.3. Nested Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 62. Velocidade radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 63. 4.2. 4.3. xii.

(15) 5. 4.3.1. Método do χ2 mínimo . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 65. 4.3.2. Método de Monte Carlo via Cadeia de Markov . . . . . . . . . . . . . . .. 67. 4.3.3. Nested Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 70. Conclusões e perspectivas. 73. 5.1. Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 73. 5.2. Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 75. xiii.

(16) CAPÍTULO 1 INTRODUÇÃO. A detecção de exoplanetas teve início no final da década de 80, com o trabalho de Campbell et al. (1988). Esse trabalho consistiu em analisar dezesseis estrelas, das quais, duas estrelas, χ1 Orionis A e γ Cephei A, mostravam uma variação na velocidade radial na ordem de alguns poucos km/s. As outras 14 estrelas não mostravam variações maiores do que 50 m/s. Campbell et al. (1988) sugeriram que pudessem haver companheiras para χ1 Orionis A e γ Cephei A, porém, não haviam evidências fortes o suficiente para determinar se era, de fato, um planeta ou uma anã marrom. As companheiras de ambas só foram confirmadas, coincidentemente no mesmo ano, por König et al. (2002) e Cochran et al. (2002), respectivamente. König et al. (2002) mostraram uma companheira estelar para χ1 Orionis, com massa estimada de 15% a massa do Sol. Enquanto que Cochran et al. (2002) confirmou um planeta orbitando γ Cephei A, com massa mínima de 1, 60 ± 0, 13 massas de Júpiter. Uma vez que o trabalho de Campbell et al. (1988) não tinha evidências forte o suficiente para confirmar a existência de uma companheira planetária, a descoberta do primeiro exoplaneta é atribuída ao trabalho de Wolszczan & Frail (1992). Os resultados desse trabalho mostraram, com medidas realizadas através do radiotelescópio de Arecibo, a existência de um sistema de, no mínimo, dois planetas, orbitando o pulsar PSR B1957+12. Através do método pulsar timing, foi detectado um “bamboleio” de ±0, 7m.s−1 , causado pelo movimento orbital dos planetas, o. 1.

(17) Capítulo 1. Introdução. 2. que levou as suas detecções. Em 1994, um terceiro planeta foi descoberto orbitando o pulsar (Wolszczan 1994). O primeiro planeta descoberto orbitando uma estrela da sequência principal foi confirmado em 1995, por Mayor & Queloz (1995). O planeta em questão tem massa mínima de metade da massa de Júpiter e orbita a sua estrela, 51 Pegasi, com período aproximado de quatro dias. O planeta, chamado de 51 Pegasi b, foi descoberto através das medidas de velocidade radial da estrela, obtidas pelo Observatório de Haute-Provence. Desde a descoberta dos primeiros exoplanetas, e com o avanço da tecnologia dos telescópios e das ferramentas de análise de dados, vários outros exoplanetas têm sido descobertos e seus parâmetros orbitais inferidos. Atualmente, mais de 3400 exoplanetas foram descobertos, de acordo com a Enciclopédia de Planetas Extrassolares12 . Desses mais de 3400 exoplanetas, 677 foram descobertos através do método da velocidade radial estelar, 2650 foram detectados através do método de transito planetário e o restante foi descoberto através de outros métodos, como o de microlentes gravitacionais ou de imagem direta.. 1.1. Principais técnicas de detecção de exoplanetas Como mostrado, através dos dados da Enciclopédia de Planetas Extrassolares, dos méto-. dos de detecção de planetas, dois se destacam por seus sucessos em detectar exoplanetas e inferir seus parâmetros orbitais, o método de trânsito planetário e o método da velocidade radial. Nessa seção, será mostrado os mecanismos por trás de ambos os métodos, que permitem a detecção de exoplanetas. O método da velocidade radial é o objeto de estudo do trabalho e é detalhado no capítulo 2. 1. A enciclopédia de planetas extrassolares é um catálogo que fornece os mais recentes dados e detecções obtidos por astrônomos profissionais e é usado para facilitar o progresso na exoplanetologia. O catálogo se encontra disponível online através do site: http://exoplanet.eu 2 Acesso em: 19 de Julho de 2016.. 2.

(18) Capítulo 1. Introdução. 1.1.1. 3. Trânsito planetário O método de trânsito planetário consiste na medição da curva de luz da estrela observada,. isto é, observa-se o fluxo de luz da estrela por um período de tempo. A presença de um planeta, orbitando tal estrela, irá fazer com que, no intervalo de tempo em que o planeta esteja passando “em frente” a estrela, em relação a um observador aqui na Terra, observa-se uma queda no fluxo relativo da estrela, devido a esse eclipse causado pelo planeta, como exemplificado na figura 1.1. Essa diminuição do fluxo relativo, se observado sempre após os mesmos intervalos de tempo, pode indicar que haja um planeta orbitando aquela estrela, com período orbital igual ao período entre essas diminuições do fluxo. Esse método exige que o sistema estrela-planeta observado tenham órbitas alinhadas, de tal forma que visto da Terra, o planeta possa eclipsar a estrela. A figura 1.2 ilustra dois casos em que a órbita está alinhada e dois casos em que a órbita do planeta é de tal forma que o planeta nunca afetará a curva de luz, tornando impossível a detecção do trânsito planetário.. Figura 1.1: Redução do fluxo relativo no método de trânsito planetário. Exemplos de curvas de luz, em escalas de tempo e fluxo uniformes. Em cada caso, varia-se o tamanho da estrela e do planeta, para ilustrar o efeito causado em termos das dimensões dos objetos. A trajetória dos planetas são mostrados pelas linhas pontilhadas. O eixo horizontal representa o tempo, em horas, e o eixo vertical representa o fluxo relativo ou o raio dos objetos. (Perryman 2011). 3.

(19) Capítulo 1. Introdução. 4. Figura 1.2: Orientações das órbitas de exoplanetas. Nos dois casos acima, temos casos em que o trânsito planetário afetará a curva de luz da estrela, sendo possível a detecção do planeta. Nos dois casos abaixo, é impossível a detecção dos planetas através do método de trânsito planetário, devido ao não alinhamento da órbita, em relação ao observador. A seta, em cada figura, mostra a direção da órbita. (Imagem retirada do “Las Cumbres Observatory Global Telescope Network”, acessível através do site: https://lcogt.net). O método de trânsito planetário pode ser utilizado para obter informações que não são possíveis em outros métodos. A massa do planeta, obtida através do método de velocidade radial, depende do ângulo de inclinação da órbita, de modo que é inferido uma massa mínima. No trânsito planetário, é possível determinar esse ângulo de inclinação da órbita. A composição da atmosfera do planeta também pode ser estudado através desse método. No período em que o planeta está passando em frente a estrela, a luz da estrela atravessará a atmosfera do planeta, em que uma parte dessa luz será absorvida. Conhecendo o espectro da estrela, pode-se comparar os dados espectrais da luz antes e durante o trânsito, assim inferindo a composição atmosférica do planeta (Perryman 2011). Os instrumentos utilizados nas medições de curva de luz são tanto telescópios terrestres, quanto observatórios espaciais. Dos telescópios terrestres, podemos destacar HATNet (Hungarian Automated Telescope Network), que descobriu, até a presente data, mais de 29 exoplanetas, e o WASP (Wide Angle Search for Planets), que detectou mais de 100 exoplanetas. Dos observatórios espaciais, o CoRoT (Baglin et al. 2006), não mais em funcionamento, conseguiu encontrar 31 exoplanetas, e o Kepler (Borucki et al. 2010), da NASA, conta com 2327 exoplanetas confirmados3 . 3. Dados do Kepler fora retirados do site da NASA, disponível em: http://kepler.nasa.gov . Acesso em: 19 de Julho. 4.

(20) Capítulo 1. Introdução. 1.1.2. 5. Velocidade radial Dois corpos orbitantes, em que a única interação entre eles é dada pela gravidade, irão or-. bitar o centro de massa do sistema. No caso de um sistema estrela-planeta, o movimento da estrela em torno do centro de massa do sistema pode ser percebido, para um observador na Terra, através do desvio das linhas espectrais causado por esse movimento. Esse desvio das linhas espectrais pode ser relacionado à velocidade radial estelar, através da equação do efeito Doppler. Quando a estrela se aproxima do observador, é detectado um desvio para o azul, e quando se afasta do observador, é detectado um desvio para o vermelho, como ilustra a figura 1.3. A ordem de grandeza da variação da velocidade radial da estrela está diretamente relacionada à massa do planeta, ou planetas, que estejam orbitando a estrela, a inclinação da órbita em relação ao observador e da distância que o planeta se encontra da estrela.. Figura 1.3: Desvio do espectro luminoso de uma estrela devido a presença de um planeta. A linha vermelha representa o desvio do espectro para o vermelho e indica a recessão da estrela. A linha azul representa o desvio do espectro par o azul e indica a aproximação da estrela. A imagem não se encontra em escala, em termos de tamanhos e distâncias. (Imagem retirada do Press Kit 005 do ESO. Disponível no site: https://www.eso.org). Diferentemente do método de trânsito planetário, a velocidade radial tem uma limitação quanto a inferência de dois parâmetros. A massa do planeta e o semi-eixo maior da órbita não podem ser inferidos com precisão. O valor inferido é um valor mínimo, dado por M sin i ou a sin i, de 2016.. 5.

(21) Capítulo 1. Introdução. 6. em que i é a inclinação da órbita. Informações sobre a atmosfera planetária também não podem ser obtidas através deste método. Em alguns casos, os dois métodos podem ser utilizados para analisar a mesma estrela, a fim de complementar as limitações de cada um deles e ter valores mais precisos dos parâmetros, como, por exemplo, o planeta WASP-121 b (Delrez et al. 2014). Os instrumentos utilizados na obtenção de dados de velocidade radial são telescópios terrestres. Os dois telescópios principais, atualmente, devido as precisões de seus resultados, utilizam um tipo de rede de difração conhecida como “échelle”, em que há uma baixa dispersão. O primeiro deles, pertencente ao grupo do ESO (European Southern Observatory), o HARPS (High Accuracy Radial velocity Planet Searcher) (Mayor & Queloz 1995) é um telescópio de 3.6 metros, em funcionamento desde 2003. A precisão do HARPS, hoje, consegue medir variações na velocidade radial da ordem de grandeza de 1 m.s−1 . Em 2015, o ESO anunciou a instalação de um pente de frequência a laser (LFC, do inglês: Laser Frequency Comb), que tem uma precisão nas medidas de poucos centímetros por segundo, o que permite a detecção de planetas de baixa massa4 . O segundo, pertencente ao California Association for Research in Astronomy, é o HIRES, no observatório W. M. Keck (Vogt et al. 1994). O HIRES tem uma precisão também da ordem de grandeza de 1 m.s−1 e tem sido o telescópio mais bem sucedido na detecção de exoplanetas através da velocidade radial5 . No dia 27 de Janeiro de 2016, o Observatório Keck anunciou o uso de um pente de frequência a laser, que permitirá medições mais precisas. Uma descrição sobre o pente de frequência e demonstração da precisão nas medidas de velocidade radial podem ser encontrados no trabalho de Yi et al. (2015).6. 1.1.3. Outros métodos Além dos dois métodos explicitados, alguns outros métodos se mostraram bem sucedidos. na detecção de exoplanetas. Porém, esses métodos não são tão eficazes quanto os métodos de trânsito planetário e velocidade radial. Cada um desses métodos detectou menos de cem planetas, até a presente data desse trabalho. Alguns desses outros métodos são: 4. Informação retirada do site do ESO, disponível em: https://www.eso.org . Acesso em: 19 de Julho de 2016. Enciclopédia de Planetas Extrassolares. Acesso em: Acesso em: 19 de Julho de 2016. 6 Informações sobre o HIRES retirado do site do Observatório Keck, disponível em: http://www.keckobservatory.org . Acesso em: 19 de Julho de 2016. 5. 6.

(22) Capítulo 1. Introdução. 7. • Microlentes gravitacionais: Ocorre quando a luz de uma estrela mais distante atravessa o campo gravitacional de um sistema estrela-planeta. O campo gravitacional do sistema estrela-planeta funcionará como uma lente, convergindo a luz da estrela distante. Essa convergência é maior para um sistema estrela-planeta do que se não houvesse nenhum planeta, permitindo que o planeta possa ser detectado. Porém, esse método exige que as estrelas estejam praticamente alinhadas, para que ocorra o fenômeno de lente, fazendo com que apenas ocorra em um pequeno intervalo de tempo. A Enciclopédia de Planetas Extrassolares registrou 48 exoplanetas descobertos através das microlentes gravitacionais (Acesso em: 19 de Julho de 2016). • Pulsar Timing: Um pulsar é uma estrela de nêutrons que emite ondas de radio periodicamente devido a sua rotação. Por causa da regularidade da rotação de um pulsar, pequenas anomalias no tempo de observação dos pulsos de onda de rádio podem ser relacionadas com o movimento do pulsar. Se um ou mais planetas orbitam um pulsar, o movimento do pulsar em torno do centro de massa do sistema pode ser detectado, permitindo, assim, a detecção dos planetas. Esse foi o método utilizado por Wolszczan & Frail (1992) na descoberta do primeiro exoplaneta detectado. A Enciclopédia de Planetas Extrassolares registrou 23 exoplanetas descobertos através do Pulsar Timing (Acesso em: 19 de Julho de 2016). • Transit Timing Variation (TTV): Esse método consiste em considerar se, quando ocorre um trânsito planetário, o período do trânsito é regular ou sofre alguma variação. Se um planeta foi detectado através do método de trânsito planetário, uma variação na periodicidade desse trânsito pode indicar que existam outros planetas, em que os seus trânsitos não passam “na frente” da estrela e, portanto, seria impossível de ser detectado através apenas do método de trânsito planetário. A desvantagem desse método é a falta de informações sobre o planeta descoberto. Podendo ser inferido um valor máximo de massa ou se o objeto tem uma massa planetária. A Enciclopédia de Planetas Extrassolares registrou 7 exoplanetas descobertos através do método TTV (Acesso em: 19 de Julho de 2016). • Imagem direta: Todos os métodos citados anteriormente se baseiam na detecção indireta de exoplanetas. O método de imagem direta se baseia na luz refletida pelo planeta, no visível, ou através da emissão térmica do planeta, no infravermelho. A detecção através da observação 7.

(23) Capítulo 1. Introdução. 8. da luz diretamente, no visível, nem sempre é possível, uma vez que a intensidade da luz refletida pelo planeta é muito baixa e tende a se “perder” antes de poder ser observada aqui na Terra. Esse método tem a vantagem de que por ser direto, tem uma confiabilidade maior nos seus resultados, e é um método menos extensivo do que os métodos de velocidade radial ou trânsito planetário. A Enciclopédia de Planetas Extrassolares registrou 70 exoplanetas descobertos através do método de imagem direta (Acesso em: 19 de Julho de 2016). A figura 1.4 mostra uma esquematização dos métodos de detecção e o número de planetas detectado por cada método, com os dados do ano de 2015. No lado esquerdo, se encontra os métodos de efeitos dinâmicos, a velocidade radial e o Timing. No centro se encontra o método de microlentes gravitacionais. E, na direita, se encontra a fotometria, que, nele, se encontra o método de trânsito planetário.. Figura 1.4: Esquematização dos métodos de detecção de planetas, no ano de 2015. Cada linha na horizontal representa a massa dos planetas que os métodos conseguem detectar. A linha contínua representa métodos já existentes. A linha pontilhada representa uma projeção, para 10-20 anos no futuro. As setas pretas representam descobertas, junto com o número de planetas descobertos. Setas brancas indicam descobertas que ainda carecem de confirmação ou maiores evidências. Imagem retirada da Enciclopédia de Planetas Extrassolares. .. 8.

(24) Capítulo 1. Introdução. 1.2. 9. Motivações e objetivos Com o avanço tecnológico dos instrumentos de medição, surge cada vez mais um maior. número de dados. Esse crescente número de dados necessitam de uma análise mais detalhada, feitas através de ferramentas estatísticas robustas, capazes de nos dar resultados confiáveis. A análise de grande número de dados, também conhecido como mineração de dados, tem sido a nova tendência na astrofísica. Para tais análises, o uso de recursos computacionais é imprescindível, sendo desenvolvidos algoritmos e softwares eficientes para esse propósito. Os avanços nos telescópios também permitiram uma precisão maior nas medidas, de tal forma que, atualmente, podemos obter medidas de velocidade radial da ordem de grandeza de poucos centímetros. Esses dados mais precisos são da mesma ordem de grandeza dos ruídos astrofísicos, de modo que dificulta a detecção de um exoplaneta e a inferência de seus parâmetros orbitais. Assim, um método estatístico avançado não é somente importante, mas é necessário para a análise correta dos dados de velocidade radial. O estudo da astroestatística7 nos permite o desenvolvimento de ferramentas estatísticas e computacionais para, no escopo desse trabalho, a análise de dados de velocidade radial. Trabalhos recentes na detecção de exoplanetas e inferências de parâmetros orbitais de tais exoplanetas foram utilizados como motivação de se utilizar determinados métodos estatísticos nas análises realizadas neste trabalho, como, por exemplo, Balan & Lahav (2008a), que traz uma análise feita através do método MCMC, e Feroz et al. (2011), em que os resultados são obtidos através do método Nested Sampling. Outros trabalhos, de viés mais estatísticos, inclui Feroz & Skilling (2013), que mostra como analisar, através do método Nested Sampling, problemas com distribuições multimodais, e Andreon & Weaver (2015), um livro com uma descrição completa sobre métodos Bayesianos, com aplicações na física. Assim, no estudo da velocidade radial estelar, através de ferramentas estatísticas, temos como objetivos: • Descrição física e modulação matemática da velocidade radial estelar, explicitando sua dependência com os parâmetros orbitais; 7. A astroestatística é uma área cujo objetivo é o uso da estatística inserida nos problemas da astrofísica. 9.

(25) Capítulo 1. Introdução. 10. • Estudo breve das fontes de erros e ruídos nas medidas; • Estudo de diferentes ferramentas estatísticas para a inferência de parâmetros e os casos em que funcionam; • Desenvolvimento de ferramentas computacionais para a simulação e análise de dados, utilizando os métodos estatísticos estudados; • Realizar simulações de dados, com acréscimo de ruído aleatório, para o teste das ferramentas estatísticas e computacionais na inferência de parâmetros; • Utilizar as ferramentas desenvolvidas para um conjunto de dados reais de velocidade radial, a fim de inferir sobre os parâmetros orbitais e comparar os resultados com os da literatura. No Capítulo 2, faremos um estudo da velocidade radial estelar, sua relação com os parâmetros orbitais do planeta e a questão dos ruídos nas medidas. No Capítulo 3, demonstraremos os modelos e métodos estatísticos que podem ser utilizados na inferência de parâmetros, explicitando suas características, vantagens e desvantagens. No Capítulo 4, serão feitas simulações para o teste e análise de três dos métodos estatísticos estudados no capítulo 3, o método do χ2 mínimo, o MCMC e o Nested Sampling. Ainda no capítulo 4, utilizaremos esses métodos estatísticos para a análise de dados reais, no caso da velocidade radial estelar, em que comparamos os resultados com aqueles já obtidos na literatura. No Capítulo 5, temos a conclusão e perspectivas futuras para esse trabalho.. 10.

(26) CAPÍTULO 2 VELOCIDADE RADIAL COMO FORMA DE DETECTAR EXOPLANETAS. A detecção por velocidade radial consiste em analisar a variação da velocidade radial da estrela, devido a uma perturbação nela. Essa perturbação pode ser dada por uma companheira binária ou por um ou mais planetas. A presença de planetas ou de uma companheira binária faz com que a estrela orbite o centro de massa do sistema. Isto leva a uma variação da velocidade radial, que é perceptível através do desvio causado nas linhas espectrais destas estrelas, devido ao efeito Doppler (Kepler & Saraiva 2014). Através das medidas de velocidade radial, do modelo matemático e de uma análise estatística apropriada, podemos inferir sobre os parâmetros orbitais dos planetas, tais como a excentricidade da órbita ou o período de translação, por exemplo. Neste capítulo, iremos estudar sistemas planetários, as leis que regem e como detectar exoplanetas. Inicialmente, abordaremos as órbitas elípticas, desenvolvendo um modelo físico e matemático de um sistema planetário, explicitando os parâmetros orbitais. Em seguida, iremos modelar matematicamente a velocidade radial de uma estrela, mostrando os casos para um ou mais planetas e como a velocidade radial tem sido modelada nos testes estatísticos que se mostraram bem sucedidos na detecção de exoplanetas. Por último, será detalhada a natureza dos erros e incertezas associadas as medidas, que são devido ao movimento e ao referencial, e os ruídos astrofísicos, que 11.

(27) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 12. surgem da atividade estelar.. 2.1. Órbitas elípticas Um planeta orbitando uma estrela terá sua órbita descrita por uma elipse, em acordo com. a primeira lei de Kepler, que diz que a órbita de um planeta será uma elipse, com a estrela em um dos seus focos1 . O efeito gravitacional do planeta na estrela também faz com que a estrela orbite, numa elipse, o centro de massa do sistema estrela-planeta. A elipse tem um conjunto de propriedades que servem de base matemática para a descrição das órbitas. Iremos listar as propriedades mais importantes para o desenvolvimento do trabalho: 1. Em qualquer ponto da curva, a soma das distâncias desse ponto aos dois focos é constante e será igual a 2a, em que a é o semi-eixo maior. 2. Quanto maior a distância entre dois focos, maior é a excentricidade, e, da elipse. A equação da excentricidade pode ser dada por r e=. a2 − b 2 , a2. (2.1). em que b é o semi-eixo menor. 3. Se considerarmos um dos focos ocupado por um estrela, o ponto da órbita mais próximo desse foco será chamado de periastro, e o ponto mais distante será chamado de apoastro. A distância do periastro e do apoastro até a estrela são dadas, respectivamente, por q = a(1 − e) ,. (2.2). Q = a(1 + e) .. (2.3). e. 4. Equação da elipse em coordenadas polares: Considerando um ponto P (r, ν) sobre a elipse (o 1. O livro "Astronomia & Astrofísica"(Kepler & Saraiva 2014) traz uma descrição completa das leis de Kepler.. 12.

(28) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 13. ponto onde se encontra o planeta, na figura 2.1), em que ν é chamada de anomalia verdadeira (que equivale ao ângulo θ, nas coordenadas polares) . Pela lei dos cossenos, temos que r12 = r2 + (2ae)2 + 2r(2ae) cos ν .. (2.4). Da primeira propriedade, sabemos que r1 + r = 2a. Assim, a equação 2.4 se torna r=. a(1 + e2 ) . (1 + e cos ν). (2.5). Esta equação nos dá a distância do foco em que se encontra a estrela até um ponto qualquer na órbita. A figura 2.1 ilustra uma órbita planetária com uma estrela em um dos focos. A imagem mostra também os parâmetros trabalhados até então, tanto no sistema de coordenadas cartesiano, em que a origem é dada no centro da elipse (e temos os ponto (a, 0) e (0, b)), quanto no sistema de coordenadas polares, em que a origem é dada no foco F1 (e temos o vetor r até o planeta e o ângulo ν).. Figura 2.1: Caracteristicas de uma órbita elíptica. Os pontos da órbita podem ser descritos tanto em termos da anomalia verdadeira (em relação a elipse), ν, quanto da anomalia excêntrica (em relação ao círculo auxiliar), E (Perryman 2011).. 13.

(29) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 14. Vários ângulos no plano orbital, chamados de "anomalias", são utilizados para descrever a posição de um planeta ao longo de sua órbita, em um tempo específico (Dvorak 2008). A anomalia verdadeira, ν(t), também denotado por f (t), é o ângulo entre a direção do periastro e a posição atual do planeta. Esse é o ângulo normalmente utilizado para caracterizar uma órbita observacional. A anomalia excêntrica, E(t), é um ângulo entre a direção do periastro e um ponto acima do planeta, no círculo auxiliar. A anomalia verdadeira e a anomalia excêntrica se relacionam através das equações: cos ν(t) =. cos E(t) − e , 1 − e cos E(t). ou ν(t) tan = 2. . 1+e 1−e. 1/2 tan. E(t) . 2. (2.6). (2.7). A anomalia média, M (t), é um ângulo relacionado a um movimento médio fictício em torno da órbita, usado para calcular a anomalia verdadeira. Em uma órbita completa, na qual o planeta (ou estrela) real não se move numa velocidade angular constante, uma taxa média pode ser especificada em termos do movimento médio, tal que n = 2π/P ,. (2.8). em que P é o período orbital. A anomalia média, num tempo t − tp , após a passagem pelo periastro é definida como M (t) =. 2π (t − tp ) ≡ n(t − tp ) , P. (2.9). A anomalia média se relaciona com a anomalia excêntrica pela equação: M (t) = E(t) − e sin E(t) .. (2.10). A equação 2.10 não possui solução analítica, sendo necessário o uso de computação numérica para encontrar uma solução. Alguns métodos computacionais para a solução desta equação podem ser encontrados no trabalho de Murison (2006).. 14.

(30) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 15. Toda a descrição, até esse ponto, tem sido feita levando em consideração um sistema em duas dimensões. Ao generalizarmos para três dimensões, alguns novos parâmetros surgem, como ilustrados na figura 2.2. Esses parâmetros são ângulos usados para representar a projeção da órbita verdadeira na órbita observada. Eles dependem apenas da orientação do observador em relação a orbita (Perryman 2011).. Figura 2.2: A generalização da órbita para três dimensões causa uma dependência maior no ângulo do observador. Isso faz com que surjam três novos parâmetros (i, Ω, e ω) para a descrição completa da órbita. i é a inclinação do plano orbital. Ω define a longitude do nodo ascendente (medido no plano de referência). ω é o ângulo do nodo ascendente até o periastro. O plano de referência é tangente a esfera celeste (Perryman 2011).. i é a inclinação orbital em relação ao plano de referência, variando entre 0◦ e 180◦ . O movimento do planeta é referido como sendo prógrado (na direção do aumento do ângulo da posição) se i < 90◦ , retrógrado para i > 90◦ e projetado na linha dos nodos, se i = 90◦ . Ω é a longitude do nodo ascendente, medido no plano de referência, de forma antihorária. ω é o argumento do periastro. Ele é a coordenada angular do periastro do objeto em relação ao seu nodo ascendente, medido no plano orbital e na direção do movimento (Chobotov 2002). Para um sistema de dois corpos, ambos orbitam o centro de massa de forma elíptica, com o centro de massa nos focos das elipses. Para cada um dos corpos, a terceira lei de Kepler é dada. 15.

(31) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 16. por P2 =. 4π 2 3 a , GM. (2.11). em que M e a, respectivamente a massa do corpo e o semi-eixo maior da órbita em questão, tem diferentes valores para cada tipo de órbita medida. Com a definição dos parâmetros orbitais e de sua significância física e astronômica nos sistemas estrela-planeta, podemos agora definir a velocidade radial estelar em termos destes parâmetros.. 2.2. Velocidade radial e curvas de velocidade As medidas de velocidade radial descrevem o movimento projetado da estrela, ao longo. da linha de visada, enquanto essa orbita o centro de massa do sistema. A medida é feita através de um desvio Doppler no comprimento de onda das linhas de absorção do espectro da estrela. Se, no referencial do observador, a fonte luminosa está recedendo com velocidade v em um ângulo θ relativo a direção do observador à fonte, a variação no comprimento de onda é dada por ∆λ = λobs − λem ,. (2.12). em que λobs e λem são, respectivamente, o comprimento de onda observado e o comprimento de onda emitido pela fonte. Para v  c (sem efeitos relativísticos) e θ  π/2, a equação 2.12 toma a forma  vr = v cos θ ≈. ∆λ λem.  c,. (2.13). em que c é a velocidade da luz no vácuo. Por convenção, valores positivos indicam recessão, enquanto que valores negativos indicam que a fonte está se aproximando. Sabendo como a velocidade radial se relaciona com o desvio nas linhas do espectro, precisamos encontrar a relação entre a velocidade radial e os parâmetros orbitais. Considerando a figura 2.2 como uma representação da órbita da estrela em torno do centro de massa, a coordenada z da. 16.

(32) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 17. estrela, ao longo da linha de visão, pode ser obtida por trigonometria e é dada por z = r(t) sin i sin(ω + ν),. (2.14). em que r(t) é a distância do centro de massa. Derivando z em relação ao tempo, para encontrarmos a velocidade radial, temos que vr = z˙ = sin i[r˙ sin(ω + ν) + rν˙ cos(ω + ν)], ou vr = K[cos(ω + ν) + e cos ω] .. (2.15). K é chamado de semi-amplitude da velocidade radial e é dada por K≡. 2π a? sin i , P (1 − e2 )1/2. (2.16). em que a? é o semi-eixo maior da estrela, em relação ao foco ocupado pelo centro de massa. Considerando a terceira lei de Kepler, dada pela equação 2.11, mas para o caso da estrela orbitando o centro de massa, podemos escrevê-la como 4π 2 3 a , GM 0 ?. (2.17). Mp3 , (M? + Mp )2. (2.18). P2 = e M 0 é dado por M0 ≡. em que Mp é a massa do planeta e M? é a massa da estrela. As equações 2.16, 2.17 e 2.18 podem ser combinadas em uma expressão alternativa para K (Cumming et al. 1999)  K=. 2πG P. 1/3. Mp sin i 1 . 2/3 (M? + Mp ) (1 − e2 )1/2. (2.19). Conhecendo a massa da estrela, através do tipo espectral e da classe de luminosidade, por exemplo,. 17.

(33) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 18. podemos então determinar Mp sin i. A massa do planeta sempre estará acompanhada pelo termo sin i, assim, podemos somente inferir um limite inferior para a massa do planeta (Gregory 2005). Da mesma forma, a? também não pode ser determinado separadamente. Será inferido o valor de a? sin i. Das equações 2.15 e 2.6 - 2.10, vemos que a velocidade radial depende de cinco parâmetros livres, que são chamados de parâmetros primários (Balan & Lahav 2008a): K, ω, e, tp e P . Enquanto que os parâmetros secundários são aqueles obtidos através do valor dos parâmetros primários: Mp , a? , ap . Alguns trabalhos, como o de Feroz et al. (2011), fazem χ = tp /P um parâmetro primário, fazendo com que tp se tornasse um parâmetro secundário, e inserem um termo de fase V , que descreve a componente da velocidade radial do centro de massa do sistema relativo ao centro de massa do sistema solar, fazendo com que o número de parâmetros primários aumente para seis. A equação, neste caso, se torna vr = V − K[cos(ω + ν) + e cos ω] .. (2.20). Para sistemas com mais de um planeta, as interações gravitacionais planeta-planeta são ignoradas. Supõe-se apenas a interação de cada planeta com a estrela, de forma independente. A equação 2.15 pode ser generalizada como. vr =. N X. Ki [cos(ωi + νi ) + ei cos ωi ] ,. (2.21). i=1. em que N representa o número de planetas no sistema. Assim, teremos um conjunto de 5N (ou 5N + 1, no caso de V estar inserido na equação) parâmetros livres. Conhecendo os parâmetros livres e com um conjunto de dados das medições da velocidade radial, os parâmetros podem ser ajustados e ter seu melhor ajuste inferido através de ferramentas estatísticas. Nos casos de sistemas multi-planetários, pode-se ajustar os parâmetros do planeta com sinal dominante. Após feito isso, subtrai-se a contribuição deste planeta dos dados observados. O processo então é repetido até que os sinais significantes de todos os planetas seja analisado. No capítulo 3, são apresentadas tais ferramentas, de um modo geral, que nos permite analisar os dados. Alguns métodos que já se mostraram bem-sucedido, e que será apresentado, inclui o algoritmo de 18.

(34) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 19. Levenberg-Marquardt (Cumming 2004), o método de Monte Carlo via Cadeia de Markov (Balan & Lahav 2008a) e o Nested Sampling (Feroz et al. 2011). As figuras 2.3, 2.4 e 2.5 mostram as curvas de velocidade, obtidas através da equação 2.20, ilustrando como a forma da curva irá depender dos parâmetros e e ω, enquanto que os outros parâmetros influenciam apenas na amplitude e no período das curvas. Podemos ver que a influência de ω aumenta de acordo com o aumento da excentricidade. Nas figuras, os parâmetros e e ω serão variados, enquanto os outros serão fixados nos valores: K = 20 m.s−1 , P = 1200 dias e χ = 0, 6.. Figura 2.3: Curvas de velocidade para e = 0, 05. Podemos ver que para um baixo valor da excentricidade, o ângulo ω não influencia tanto na forma do gráfico.. 19.

(35) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 20. Figura 2.4: Curvas de velocidade para e = 0, 5. Podemos ver uma influência maior de ω na forma das curvas de velocidade.. 20.

(36) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 21. Figura 2.5: Curvas de velocidade para e = 0, 9. O valor alto da excentricidade faz com a curva apresente essas regiões de rápida queda ou subida.. 21.

(37) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 2.3. 22. Erros das medidas e ruídos astrofísicos A precisão dos instrumentos utilizados são de extrema importância para a detecção de. exoplanetas. Sistemas com planetas de pequena massa terão uma pequena variação na velocidade radial da estrela. Se o instrumento não for preciso o suficiente, a detecção de tais planetas se tornam impossíveis. Os dados obtidos através dos telescópios são contaminados por erros. O erro é algo característico do processo de medição, podendo ter vários fatores que influenciam. Os erros serão divididos, nesse trabalho, em dois tipos: o erro instrumental, que inclui também o erro devido a referenciais, e o ruído astrofísico, que é o erro devido a atividade estelar, e que não tem como ser retirado das medidas. Da mesma forma que planetas de pequena massa causarão uma pequena variação na velocidade radial, se essa variação for da ordem de grandeza dos erros das medidas, pode se tornar difícil a detecção deste planeta ou o sinal pode mimicar o sinal de um planeta. Conhecer a fonte dos erros nos ajuda a fazer uma análise mais precisa dos dados. A tabela 2.1 mostra, para uma típica estrela M2, a influência de uma companheira com diferentes massas e períodos orbitais. Podemos ver que para uma companheira estelar, a ordem de grandeza da variação da velocidade radial é muito grande, quando comparada a uma companheira planetária. Enquanto que para uma companheira com a massa da Terra, a variação é muito pequena e pode até mesmo se perder no ruído. M2 1MSol 0.08MSol 1MJupiter 1MT erra. 3d 93km/s 11km/s 140m/s 0.5m/s. 10 d 63km/s 7,5km/s 94m/s 0,3m/s. 1 ano 19km/s 2,3km/s 28m/s 0,09m/s. Tabela 2.1: Influência de diferentes tipos de companheiras para uma típica estrela M2. A primeira coluna se refere a massa das companheiras e o cabeçalho se refere ao período orbital das mesmas. Fonte: Tabela cedida pelo Astrônomo do ESO, Doutor Cláudio Melo.. A equação 2.13 não considera efeitos relativísticos. Os termos correspondentes a relatividade especial causam uma mudança na velocidade radial na ordem de vários m.s−1 . A equação também omite os efeitos do índice de refração do ar no espectrômetro, nar = 1, 000277 (em condições normais de temperatura e pressão), no qual introduz erros de aproximadamente 1 m.s−1 (Marcy & Butler 1992). 22.

(38) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 23. O movimento do observador, em torno do centro de massa do Sistema Solar, devido a rotação e translação da Terra, produz contribuições as medidas. Essas contribuições, variantes no tempo, podem chegar a até 0, 5 e 30 km.s−1 , para o movimento de rotação e de translação, respectivamente. Para detectar a variação na velocidade radial, precisamos utilizar um referencial em repouso ou em movimento uniforme. Por isso, é comum adotar o centro de massa do Sistema Solar como referencial. Ajustando os efeitos que perturbam o movimento do sistema, como a influência gravitacional dos outros planetas do Sistema Solar, os termos residuais podem ser levados a um valor menor do que 1 m.s−1 (Perryman 2011). Esses tipos de efeitos, em geral, conseguem ser compensados ou separados do conjunto de dados finais. Vários telescópios atuais possuem um pipeline que já fazem a análise e retiram os erros dados por esses efeitos (em geral, relacionados ao movimento e ao próprio instrumento), como o HARPS, por exemplo, que utiliza um método "Simultaneous Thorium"2 para obtenção de uma medida precisa da velocidade radial. O ruído astrofísico (ou ruído estelar) pode ser considerado como sendo a atividade na superfície estelar, oscilações estelares, granulação da superfície, companheiros planetários não identificados, atividade magnética da estrela ou erros sistemáticos. Todos esses fatores influenciam no bamboleio (do inglês, jitter) das medidas de velocidade radial. Esses erros são relevantes e é necessário conhecê-los. Mesmo estrelas com pouca atividade magnética ainda apresentam heterogeneidade devido a convecção magnética na superfície. Quando as bolhas de plasma sobem pela fotosfera, e, portanto, se movem em direção ao observador, elas sofrem um desvio para o azul, e quando as bolhas dispersam e caem em direção ao interior da estrela, elas sofrem um desvio para o vermelho. Esse movimento causa uma assimetria nas linhas observadas do espectro. Para estrelas do tipo Sol, o resultado total dessas variações no espectro causam desvios na velocidade radial da ordem de dezenas de cm.s−1 (Ceglar et al. 2014). Os efeitos da oscilação estelar nas medidas do efeito Doppler são geralmente menores do que os efeitos produzidos por atividade estelar, mas são mais significantes para gigantes e subgigantes. Resultados do HARPS mostraram que integrações de 15 minutos são suficientes para reduzir esse efeito para menos do que 0, 2 m.s−1 (Mayor & Udry 2008). 2. Para mais informações sobre o méotodo: < http://www.eso.org/sci/facilities/lasilla/instruments/harps/overview.html. >. 23.

(39) Capítulo 2. Velocidade radial como forma de detectar exoplanetas. 24. Apesar dos ruídos astrofísicos não serem possíveis de se retirar das medidas, alguns trabalhos, como Balan & Lahav (2008a), mostram uma modelação matemática para os dados, de modo a levar em consideração os erros. A equação para os dados tem a forma di = vi + ei +  ,. (2.22). em que di são os dados observados, vi é a velocidade radial teórica dada pela equação 2.15, ei é uma componente de incerteza, que inclui os ruídos astrofísicos e considera-se que seja normalmente distribuído, e  considera qualquer erro ou incerteza que não tenha sido previsto. Esse modelo, usado, por exemplo, em Balan & Lahav (2008a), Gregory (2005) e Feroz et al. (2011), é bastante útil na análise Bayesiana3 , ao considerar a forma como o erro se distribui. Tuomi et al. (2012) faz uma extensiva análise dos sinais que aparecem intrínsecos às medidas de velocidade radial através de comparação de modelos, utilizando estatística Bayesiana, para quantificar o número de sinais significantes e a magnitude e propriedades do ruído em excesso nos dados, para a estrela HD 10700 (τ Ceti). No trabalho, Tuomi et al. (2012) concluem que junto a um modelo de decaimento exponencial, o ruído branco4 é o que melhor se ajusta ao ruído dos conjuntos de dados. Ajustando os parâmetros do ruído, pode-se detectar sinais muito fracos, com amplitude menor do que 1 m.s−1 .. 3 4. A análise Bayesiana, e os métodos estatísticos derivadas dela, serão explorados no próximo capítulo. O ruído branco é um ruído aleatório que é dado por uma distribuição gaussiana e é não-correlacionado.. 24.

(40) CAPÍTULO 3 MÉTODOS ESTATÍSTICOS E INFERÊNCIA. A obtenção de dados, a partir das observações e experimentos, nem sempre é o suficiente para nos dar as informações que queremos extrair. Necessitamos, então, de ferramentas matemáticas que nos permitam analisar estatisticamente o conjunto de dados obtidos, para que possamos extrair tais informações. Um dos motivos para se utilizar essas ferramentas se dá devido ao fato da imprecisão ou da interferência nas medidas, que são característicos do processo de medição (Hogg & Craig 1978). No capítulo anterior, foram mostradas as causas dessas imprecisões no caso da velocidade radial (os ruídos astrofísicos). A análise estatística, em conjunto com os dados, nos permite obter informações como, por exemplo, qual modelo teórico explica melhor os dados, qual conjunto de parâmetros melhor se adequa em comparação aos dados ou quais as distribuições de probabilidade dos parâmetros ou do modelo, em seus respectivos espaços de valores. No presente trabalho, focaremos na inferência de parâmetros. Nesse capítulo, mostraremos alguns métodos e análises estatísticas, e a teoria matemática por trás delas, explicitando os casos em que funcionam e os casos em que a análise é falha. Começaremos com modelos mais simples, baseados no mínimo quadrado e máxima verossimilhança, passando pelo teorema de Bayes e a inferência Bayesiana e, por último, mostrando métodos que se utilizam da inferência Bayesiana.. 25.

(41) Capítulo 3. Métodos estatísticos e inferência. 3.1. 26. Método da máxima verossimilhança e o método do χ2 mínimo O método da máxima verossimilhança (referida, no resto do trabalho, como “likelihood”). é um método de inferência de parâmetros, que pode ser aplicado numa grande variedade de problemas estatísticos. O método é baseado na likelihood, isto é, na função de densidade de probabilidade (ou, para o caso discreto, na massa de probabilidade) vista como uma função dos dados, dado um conjunto particular de parâmetros do modelo (Rice 2007). Suponha que as variáveis aleatórias X1 , . . . , XN sejam descritas pela mesma função de densidade de probabilidade f (x1 , x2 , . . . , xN |θ), em que θ representa o conjunto de parâmetros do modelo. Se os Xi são independentes e identicamente distribuídas (i.i.d.), então a probabilidade conjunta será igual ao produto das densidades marginais, de modo que podemos escrever a likelihood L(θ) como (Feigelson & Babu 2012). L(θ) =. N Y. f (Xi |θ) .. (3.1). i=1. Ao invés de maximizarmos a própria likelihood, é mais fácil maximizar o seu logaritmo natural. Para uma amostra i.i.d., o log-likelihood é. l(θ) = lnL(θ) =. N X. lnf (Xi |θ) .. (3.2). i=1. O método da máxima likelihood, então, irá depender da forma como as variáveis se distribuem. Cada problema poderá ter uma likelihood diferente, mas se a distribuição for correta para o problema, maximizar a likelihood nos permitirá inferir sobre os parâmetros. Porém, conforme o tamanho da amostra de dados vai aumentando, a distribuição amostral da média se aproxima cada vez mais de uma distribuição normal, de acordo com o teorema do limite central1 . Isto é, para um grande número de dados, podemos aproximar a função de distribuição de probabilidade como 1. O teorema do limite central diz que para uma sequência de variáveis aleatórias independentes com a mesma distribuição, a distribuição pode ser aproximada por uma Gaussiana, no limite em que o tamanho amostral tende a infinito (Feigelson & Babu 2012). 26.

(42) Capítulo 3. Métodos estatísticos e inferência. 27. sendo uma gaussiana. Assim, a likelihood pode ser escrita como. L(θ) =. N Y i=1. ". 1 1 √ exp − 2 σ 2π. . yi − yˆ(xi , θ) σi. 2 # ,. (3.3). em que yi representa o conjunto de dados, yˆ(xi , θ) representa o modelo teórico para uma determinada grandeza xi (como o tempo, por exemplo) e o conjunto de parâmetros, θ, e σi é o erro relativo a i-ésima medida. O método da máxima likelihood é caracterizado por convergir para o verdadeiro valor dos parâmetros, na medida em que o número N de medidas vai aumentando. O método não possui tendência, isto é, para qualquer tamanho amostral, o parâmetro de interesse é calculado corretamente. A estimativa tem menor variância. A solução da máxima likelihood é única. Porém, para uma boa inferência, devemos conhecer a distribuição de probabilidade correta. Este método não funciona muito bem para modelos com equações não-lineares, uma vez que equações não-lineares podem ter mais de uma solução para elas, logo o método da máxima likelihood pode dar um resultado de falso melhor ajuste dos parâmetros (Hogg & Craig 1978). Outro método, conhecido como o método do χ2 (lê-se “qui-quadrado”) mínimo, pode ser obtido diretamente como consequência do método da máxima likelihood. A partir da equação (3.3), temos que maximizar a likelihood significa o mesmo que minimizar o termo da exponencial, que chamaremos de χ2 . Assim, temos que. 2. χ (θ) =. 2 N  X yi − yˆ(xi , θ) σi. i=1. .. (3.4). Além das características do método da máxima likelihood, temos que o método do χ2 mínimo pode dar falsos resultados caso o modelo ou o erro não seja distribuído normalmente, ou caso exista uma forte correlação entre os parâmetros do modelo (Hansen et al. 2013). Apesar disto, o método se mostrou bem sucedido em vários problemas na física e astronomia, como, por exemplo, a determinação de melhor ajuste e regiões de confiança dos parâmetros de densidade nos modelos cosmológicos ΛCDM e XCDM (Teixeira 2014), e em estimação de parâmetros em astronomia de raio-X (Lampton et al. 1976).. 27.

(43) Capítulo 3. Métodos estatísticos e inferência. 28. Um exemplo, para fins ilustrativos, da inferência através do método do mínimo quadrado, na astrofísica, pode ser encontrado na figura 3.1. O problema trata de comparação de modelo e inferência de parâmetros no estudo, através de lente gravitacional fraca, da distribuição de matéria escura numa amostra de 30 grupos de galáxias luminosas em raio-X, com desvio para o vermelho entre 0,15 e 0,3.2. Figura 3.1: Comparação da massa do virial estimada para os modelos SIS e NFW para cada um dos 30 grupos de galáxias. Os pontos representam os dados observados. A linha é obtida através do melhor ajuste dos parâmetros aplicado ao modelo teórico. O eixo horizontal representa a massa do virial no modelo SIS (do inglês: singular isothermal sphere). O eixo vertical representa a massa do virial no modelo NFW (Navarro-Frenk & White). (Okabe et al. 2010).. 3.2. Método do mínimo quadrado não-linear Na seção anterior, era necessário que os parâmetros aparecessem linearmente na equação. do modelo teórico. Se um ou mais dos parâmetros forem não-linear, a inferência pode dar falsos melhores ajustes. Nesta seção, mostraremos como tratar o caso não-linear para a inferência, no caso do mínimo quadrado. Definimos uma função não-linear, em termos de algum parâmetro, como sendo uma função f = f (α1 , . . . , αN ) tal que ∂f /∂αi = g(αi ), para pelo menos um dos parâmetros α (caso fosse linear, a derivada seria uma constante). Isto é, sua derivada parcial em relação a um, ou 2. Para informações mais detalhadas sobre o fenômeno físico e a forma como foi utilizado o método estatístico, acessar o trabalho de Okabe et al. (2010). 28.

(44) Capítulo 3. Métodos estatísticos e inferência. 29. mais, dos seus parâmetros será uma função do próprio parâmetro (Hansen et al. 2013). Para a inferência de parâmetros em tal modelo, vários métodos podem ser utilizados, como, por exemplo, o método de Newton, o método do máximo declive (em inglês, steepest descent) ou o método de Levenberg-Marquardt, que serão os três métodos abordados neste trabalho. Da equação 3.4, podemos aproximar o valor do χ2 , tal que. 2. χ (θ) =. 2 N  X yi − yˆ(xi , θ) σi. i=1. = (y − y ˆ(θ))T W(y − y ˆ(θ)),. (3.5). em que y e yˆ são vetores agora, T indica a transposta do vetor, e W é uma matriz diagonal relativo ao peso das medidas, com Wii = 1/σi2 . Se a função yˆ é não-linear em termos dos parâmetros, então a minimização do χ2 deve ser feita através de iterações. O objetivo de cada iteração é de encontrar uma perturbação h dos parâmetros θ que reduza o χ2 .. 3.2.1. O método do máximo declive O método do máximo declive é um método de minimização geral, no qual atualiza os. valores dos parâmetros na direção oposta ao gradiente da função do modelo. O método converge bem para problemas com função do modelo simples. Para problemas com milhares de parâmetros, este método é, às vezes, o único método viável (Gavin 2015). O gradiente do χ2 em relação aos parâmetros do modelo é dado por ∂ 2 ∂ χ (θ) = (y − y ˆ(θ))T W (y − y ˆ(θ)) ∂θ ∂θ ∂ˆ y(θ) = −(y − y ˆ(θ))T W ∂θ T = −(y − y ˆ(θ)) WJ ,. (3.6). em que J é a matriz Jacobiana m x n e representa a sensibilidade local da função do modelo a variação dos parâmetros. Portanto, o termo de perturbação h, que atualiza os parâmetros na direção. 29.

(45) Capítulo 3. Métodos estatísticos e inferência. 30. do máximo declive, pode ser escrito como hmd = αJT W(y − y ˆ) ,. (3.7). sendo α um escalar positivo que determina o tamanho do passo na direção do máximo declive.. 3.2.2. Método de Newton O método de Newton (também conhecido como método de Gauss-Newton) presume que. a função do modelo é aproximadamente quadrática nos parâmetros, na região próxima do melhor ajuste. Para problemas de tamanhos moderados, o método de Newton converge mais rapidamente do que o método do máximo declive (Press et al. 1997). Perturbando a função do modelo, podemos aproximá-la localmente por uma expansão de Taylor de primeira ordem, tal que y ˆ(θ + h) ≈ y ˆ(θ) +. ∂ˆ y h=y ˆ + Jh . ∂θ. (3.8). Assim, substituindo y ˆ(θ) na equação 3.5 e derivando χ2 em relação a perturbação, temos que ∂ 2 χ ≈ −2(y − y ˆ)T WJ + 2hT JT WJ . ∂h. (3.9). Minimizando χ2 , isto é, fazendo a derivada igual a zero, encontramos uma relação para o termo que atualiza os parâmetros [JT WJ]hmd = JT W(y − y ˆ) .. 3.2.3. (3.10). Método de Levenberg-Marquardt O método de Levenberg-Marquardt pode ser entendido como uma mistura do método de. Newton e o método do máximo declive. Este método consiste em variar, de acordo com a situação, a atualização dos parâmetros entre os métodos de máximo declive e de Newton. A equação é dada por (Lourakis 2005) [JT WJ + λI]hlm = JT W(y − y ˆ) , 30. (3.11).

Referências

Documentos relacionados

Mesmo com suas ativas participações na luta política, as mulheres militantes carregavam consigo o signo do preconceito existente para com elas por parte não somente dos militares,

Ainda na última parte da narrativa, outro “milagre” acontece: Grenouille apa- rece, de súbito, em meio ao povo, destampa uma pequena garrafa que trazia consi- go, borrifa-se com

As mulheres travam uma história de luta por reconhecimento no decorrer do tempo sistematicamente o gênero masculino dominava o feminino, onde prevalecia a hierarquização do sexo

Como o predomínio de consumo energético está no processo de fabricação dos módulos fotovoltaicos, sendo os impactos da ordem de 50 a 80% nesta etapa (WEISSER,

Diante disto o objetivo deste trabalho foi avaliar a extração de antocianinas a partir do repolho roxo (Brassica oleracea), em diferentes condições de pH, temperatura e

 Rendimentos de trabalho por conta própria, os quais são os auferidos no exercício, de forma independente, de profissão em que predomine o carácter

A aplicação de parafina em raízes de mandioca tem sido eficiente para prolongar o seu período de conservação.. Este efeito é atribuído à diminuição da permeabilidade ao

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial