• Nenhum resultado encontrado

Estimação Bayesiana de Parâmetros que Definem Modelos Determinísticos

N/A
N/A
Protected

Academic year: 2021

Share "Estimação Bayesiana de Parâmetros que Definem Modelos Determinísticos"

Copied!
88
0
0

Texto

(1)

Estima¸

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos Determin´ısticos

por

Josiane da Silva Cordeiro

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´etodos Estat´ısticos

2009

(2)

Estima¸

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos Determin´ısticos

Josiane da Silva Cordeiro

Disserta¸c˜ao submetida ao Corpo Docente do Instituto de Matem´atica - Departamento de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess´arios `a obten¸c˜ao do grau de Mestre em Estat´ıstica.

Aprovada por:

Profa. Alexandra M. Schmidt. PhD - IM - UFRJ - Orientadora.

Prof. Cl´audio J. Struchiner

PhD - PROCC - FIOCRUZ - Co-Orientador.

Prof. H´elio S. Migon PhD - IM - UFRJ.

Prof. Dirceu Silveira Reis Jr. PhD - DEHID - FUNCEME.

(3)

FICHA CATALOGR ´AFICA

Cordeiro, Josiane da Silva.

Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Modelos Determin´ısticos / Josiane da Silva Cordeiro.

Rio de Janeiro: UFRJ, IM, DME, 2009.

Disserta¸c˜ao - Universidade Federal do Rio de Janeiro, IM, DME. 1. Introdu¸c˜ao. 2. Modelos Determin´ısticos.

3. Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Modelos Determin´ısticos. 4. Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Equa¸c˜oes a Diferen¸cas Finitas: Uma Aplica¸c˜ao `a Modelagem de Chuva-Vaz˜ao.

5. Conclus˜oes e Trabalhos Futuros.

(Mestrado-UFRJ/IM/DME) I. Schmidt, Alexandra II. Universidade Federal do Rio de Janeiro III. T´ıtulo.

(4)
(5)

Agradecimentos

A Deus, pelo seu grande amor. Em particular, este amor tem sido revelado atrav´es do seu cuidado, das oportunidades surgidas e a clareza necess´aria para enxerg´a-las e, principalmente, o fortalecimento para prosseguir. Agrade¸co a Deus tamb´em, por cada pessoa que faz parte da minha vida.

`

A minha fam´ılia pelo amor. Aos meu pais, Josias e Maria, pelo cuidado e carinho demonstrados de forma muito peculiar, segundo o jeito de ser de cada um. Ao meu irm˜ao Welington, pela paciˆencia e por me dar a certeza de que fiz a escolha certa quanto ao meu curso de mestrado. E ao meu irm˜ao Welton, tamb´em pela paciˆencia e pelos v´arios momentos descontra´ıdos.

Ao Felipe, pelo amor e apoio. E tamb´em, por ter contribu´ıdo para que meu ano de disserta¸c˜ao fosse um ano mais feliz.

`

As minhas av´os (in memorian), pelo amor que, enquanto poss´ıvel, foi dado a mim. Aos meus tios, tias, primos e primas que de diversas maneiras me amaram e incentivaram ao longo da minha vida.

Aos meus amigos, aos atualmente presentes e aos ausentes fisicamente, mas que de maneiras distintas me apoiaram muito.

Aos meus companheiros e amigos do DME, que compartilharam comigo momentos de ang´ustia, de satisfa¸c˜ao e de alegria, nestes dois anos de intensa convivˆencia. E, ´e claro, obrigada pelos grandes momentos no laborat´orio casamenteiro, o LPGE. Em especial, a minha turma Denise, Mariana, N´ıcia, Patr´ıcia, Vera e Alexandre, e a Valm´aria, Jo˜ao, Targino e Vin´ıcius.

`

(6)

era aluna da UFRJ. Agrade¸co pela dedica¸c˜ao como orientadora e, pelo compartilhamento de conhecimento e experiˆencias cient´ıficas.

Ao meu atual co-orientador Cl´audio Struchiner, pela orienta¸c˜ao acadˆemica dada, desde o ensino m´edio, com liberaridade e, tamb´em pela transmiss˜ao de um pouco, que foi muito para mim, do seu conhecimento cient´ıfico.

Aos meus professores do DME-IM/UFRJ e do DEMAT/UFRuralRJ que, em diferen-tes etapas, foram essenciais para meu crescimento atrav´es do conhecimento passado e da constante motiva¸c˜ao.

Ao H´elio Migon e ao Dirceu Reis pela cordialidade e colabora¸c˜ao cient´ıfica.

A todos os vinculados a UFRJ, pela colabora¸c˜ao para promover um ambiente de estudo de qualidade.

A todos os profissionais do PROCC/FIOCRUZ, pelo ambiente agrad´avel e pela disponi-bilidade em diversos momentos.

`

A FUNCEME pela concess˜ao dos dados utilizados nesta disserta¸c˜ao. `

A CAPES e `a FAPERJ, pela bolsa especial, que possibilitaram o prosseguimento dos meus estudos com mais entusiasmo.

(7)

Resumo

Neste trabalho, temos interesse em investigar procedimentos de inferˆencia bayesiana de parˆametros originalmente envolvidos em modelos determin´ısticos que descrevem proble-mas reais. A fim de acoplar incerteza ao estudo determin´ıstico, assumimos que a solu¸c˜ao determin´ıstica ´e a m´edia de uma realiza¸c˜ao da distribui¸c˜ao normal. Desta forma, es-pecificamos a fun¸c˜ao de verossimilhan¸ca e, sob o paradigma bayesiano, atribu´ımos uma distribui¸c˜ao a priori para os parˆametros, assim obtendo a distribui¸c˜ao a posteriori. De-vido `a complexidade destes modelos, surge a necessidade de m´etodos computacionais para obtermos amostras desta distribui¸c˜ao. Neste contexto, escolhemos algoritmos baseados em dois m´etodos espec´ıficos, a saber, o Monte Carlo via cadeias de Markov e o Monte Carlo sequencial. Particularmente, objetivamos comparar estes m´etodos para a estima¸c˜ao dos parˆametros relacionados a um modelo determin´ıstico que descreve intera¸c˜oes entre esp´ecies de presas e de predadores. Os resultados atingidos via todos os algoritmos uti-lizados mostraram que tais procedimentos s˜ao razo´aveis neste contexto de estima¸c˜ao, embora a descri¸c˜ao da incerteza, associada `a distribui¸c˜ao a posteriori dos parˆametros, reportada por ambos os m´etodos tenham sido distintas. Outro interesse espec´ıfico neste trabalho, assumindo um modelo determin´ıstico da vaz˜ao de uma bacia hidrogr´afica, ´e ajustar o modelo estat´ıstico proposto a conjuntos de dados de trˆes bacias do estado do Cear´a, cedidos pela FUNCEME. Neste caso, obtivemos um ajuste razo´avel do modelo aos diferentes conjuntos de dados atingindo distribui¸c˜oes a posteriori informativas para os parˆametros de interesse.

Palavras Chaves: Modelos Determin´ısticos, Estima¸c˜ao Bayesiana, Monte Carlo via cadeias de Markov, Monte Carlo sequencial.

(8)

Abstract

In this work, we are interested in investigating Bayesian inference procedures of parame-ters related to deterministic models which describe real problems. In order to account for uncertainty estimation into the deterministic study, we assume the deterministic solution as the mean of a normal distribution. In this way, we specify the likelihood function and, under the Bayesian paradigm, we assign a prior distribution to the parameters, hence obtaining a posterior distribution. Due to the complexity of these models, it emerges the need of computational methods to obtain samples of the resultant posterior distribu-tion. In this context, we choose algorithms based on two specific methods, Markov chain Monte Carlo and sequential Monte Carlo algorithms. Particularly, we aim to compare these methods to estimate parameters involved in a deterministic model that describes interactions between prey species and predator species. The achieved results through all the algorithms showed that these procedures are reasonable in this context of estimation, although the description of uncertainty, associated with the posterior distribution of the parameters, reported by both methods have been distinct. Another specific aim of this work is to model the runoff of a hydrographic basin through a deterministic model. The proposed statistical model is fitted to datasets from three basins in the State of Cear´a, made available by FUNCEME. In this case, we obtained a reasonable fit of the model to the different datasets reaching informative posterior distributions to the parameters of interest.

Key Words: Deterministic Models, Bayesian Estimation, Markov Chain Monte Carlo, Sequential Monte Carlo.

(9)

Sum´

ario

1 Introdu¸c˜ao 1

2 Modelos Determin´ısticos 4

2.1 Equa¸c˜oes a Diferen¸cas Finitas . . . 4

2.2 Equa¸c˜oes Diferenciais Ordin´arias . . . 5

2.3 M´etodos Num´ericos de Aproxima¸c˜ao de Solu¸c˜ao de EDO . . . 7

2.3.1 M´etodo de Euler . . . 8

2.3.2 M´etodo de Runge-Kutta . . . 9

2.3.3 M´etodos de Passos M´ultiplos . . . 9

2.3.4 M´etodo da Coloca¸c˜ao . . . 10

2.4 Calibra¸c˜ao e Estima¸c˜ao de Parˆametros no contexto de Modelos Deter-min´ısticos . . . 11

3 Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Modelos Deter-min´ısticos 13 3.1 MCMC . . . 15

3.2 MCS . . . 17

3.2.1 CBA-MCS . . . 18

3.2.2 CBA-CRP . . . 20

3.3 Estudo Simulado: Uma Aplica¸c˜ao em um Modelo Cl´assico de EDO . . . 22

3.3.1 Fun¸c˜ao de Verossimilhan¸ca . . . 23

3.3.2 Gera¸c˜ao dos Dados Artificiais . . . 23

(10)

3.3.4 Implementa¸c˜ao Computacional . . . 24

3.3.5 Resultados . . . 24

4 Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Equa¸c˜oes a Diferen¸cas Finitas: Uma Aplica¸c˜ao `a Modelagem de Chuva-Vaz˜ao 40 4.1 Modelo SMAP . . . 40

4.1.1 Fun¸c˜ao de Verossimilhan¸ca . . . 43

4.1.2 Formula¸c˜ao Bayesiana . . . 44

4.2 Estudo Simulado . . . 46

4.2.1 Gera¸c˜ao dos Dados Artificiais . . . 46

4.2.2 Resultados atrav´es do MCMC . . . 46

4.3 Dados Reais . . . 54

4.3.1 Bacia 35875000 . . . 54

4.3.2 Bacia 35880000 . . . 59

4.3.3 Bacia 35210000 . . . 63

(11)

Lista de Tabelas

3.1 Parˆametros do CBA-MCS ajustados . . . 25 4.1 SMAP/Bacia 35875000 - Estimativas pontual (mediana a posteriori) e

intervalar (intervalo de credibilidade de 90%) para cada parˆametro . . . . 57 4.2 SMAP/Bacia 35880000 - Estimativas pontual (mediana a posteriori) e

intervalar (intervalo de credibilidade de 90%) para cada parˆametro . . . . 61 4.3 SMAP/Bacia 36520000 - Estimativas pontual (mediana a posteriori) e

(12)

Lista de Figuras

3.1 Tra¸cos das cadeias dos parˆametros α e β (colunas), para as diferentes observa¸c˜oes com N=16, N=51 e N=151 (linhas), e supondo a priori 3 via MCMC. A linha horizontal preta ´e o valor verdadeiro do parˆametro. . . . 26 3.2 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao

a posteriori de α e β supondo a priori 1 (P1), priori 2 (P2) e priori 3 (P3), tanto via MCMC (em azul) quanto via CBA-MCS (em vermelho), com N=16, N=51 e N=151 (linhas). . . 28 3.3 I.C. de 90% (linhas tracejadas) e a mediana (linhas cheias) da distribui¸c˜ao

preditiva das popula¸c˜oes de presas e predadores, obtidos a partir dos valo-res das cadeias dos parˆametros via MCMC (em azul) e via CBA-MCS (em vermelho), assumindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados. . . 30 3.4 Gr´aficos de Dispers˜ao entre α e β, no caso da priori 3, via MCMC (primeira

coluna) e CBA-MCS (segunda coluna), e para os diferentes conjuntos de dados gerados N=16, N=51 e N=151 (linhas 1, 2 e 3, respectivamente). . 32 3.5 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao

a posteriori de α e de β via CBA-MCS (em azul) e CBA-MCS com B = 10 (em vermelho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 33

(13)

3.6 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸c˜ao preditiva das popula¸c˜oes de presas e de predadores, obtidos a partir dos valores das cadeias dos parˆametros via CBA-MCS, com B = 10, assu-mindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados. . . 34 3.7 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao

a posteriori de α e de β via CBA-MCS (em azul) e CBA-CRP (em ver-melho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 35 3.8 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸c˜ao

preditiva das popula¸c˜oes de presas e de predadores, obtidos a partir dos valores das cadeias dos parˆametros via CBA-CRP assumindo a priori 3. Os c´ırculos representam os dados observados com N=16, N=51 e N=151 (linhas). . . 36 3.9 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao

a posteriori de α e de β via CBA-MCS (em azul) e CBA-CRP com o n´ucleo de transi¸c˜ao para tr´as sub-´otimo (em vermelho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 37 3.10 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸c˜ao

preditiva das popula¸c˜oes de presas e de predadores, obtidos a partir dos va-lores das cadeias dos parˆametros via CBA-CRP, com o n´ucleo de transi¸c˜ao para tr´as sub-´otimo, assumindo a priori 3. Os c´ırculos representam os da-dos observada-dos com N=16, N=51 e N=151 (linhas). . . 38 4.1 Diagrama do modelo SMAP . . . 41 4.2 SMAP/Dados Artificiais - Tra¸cos das cadeias dos parˆametros (via

for-mula¸c˜ao 1). A linha horizontal preta ´e o valor verdadeiro do parˆametro. . 47 4.3 SMAP/Dados Artificiais - Tra¸cos das cadeias dos parˆametros (via

(14)

4.4 SMAP/Dados Artificiais - Histogramas dos parˆametros (via formula¸c˜ao 1). A linha vertical vermelha ´e o valor verdadeiro do parˆametro. . . 49 4.5 SMAP/Dados Artificiais - Histogramas dos parˆametros (via formula¸c˜ao

2). A linha vertical vermelha ´e o valor verdadeiro do parˆametro. . . 50 4.6 SMAP/Dados Artificiais - I.C. de 90% (linha tracejada) e a mediana (linha

cheia em azul) da distribui¸c˜ao preditiva da vaz˜ao obtidos a partir dos valores das cadeias dos parˆametros via MCMC e assumindo a formula¸c˜ao 1. Os c´ırculos representam os dados observados. . . 52 4.7 SMAP/Dados Artificiais - I.C. de 90% (linha tracejada) e a mediana (linha

cheia em azul) da distribui¸c˜ao preditiva da vaz˜ao obtidos a partir dos valores das cadeias dos parˆametros via MCMC e assumindo a formula¸c˜ao 2. Os c´ırculos representam os dados observados. . . 53 4.8 SMAP/Bacia 35875000 - Tra¸cos das cadeias dos parˆametros. . . 55 4.9 SMAP/Bacia 35875000 - Histogramas dos parˆametros. . . 56 4.10 SMAP/Bacia 35875000 - Mediana (linha tracejada preta) da distribui¸c˜ao

preditiva da vaz˜ao obtidos a partir dos valores das cadeias dos parˆametros via MCMC e os dados observados da bacia (linha cheia azul). . . 58 4.11 SMAP/Bacia 35875000 - Quantis de 25% e de 75% da distribui¸c˜ao

predi-tiva da vaz˜ao a partir das cadeias dos parˆametros, e os dados observados da bacia (linha cheia azul). . . 59 4.12 SMAP/Bacia 35880000 - Histogramas dos parˆametros. . . 60 4.13 SMAP/Bacia 35880000 - Mediana (linha tracejada preta) da distribui¸c˜ao

preditiva da vaz˜ao obtidos a partir dos valores das cadeias dos parˆametros via MCMC e os dados observados da bacia (linha cheia azul). . . 62 4.14 SMAP/Bacia 35880000 - Quantis de 25% e de 75% da distribui¸c˜ao

predi-tiva da vaz˜ao a partir das cadeias dos parˆametros, e os dados observados da bacia (linha cheia azul). . . 63 4.15 SMAP/Bacia 35210000 - Histogramas dos parˆametros. . . 64

(15)

4.16 SMAP/Bacia 35210000 - Mediana (linha tracejada preta) da distribui¸c˜ao preditiva da vaz˜ao obtidos a partir dos valores das cadeias dos parˆametros via MCMC e os dados observados da bacia (linha cheia azul). . . 66 4.17 SMAP/Bacia 35210000 - Quantis de 25% e de 75% da distribui¸c˜ao

predi-tiva da vaz˜ao a partir das cadeias dos parˆametros, e os dados observados da bacia (linha cheia azul). . . 67

(16)

Cap´ıtulo 1

Introdu¸

ao

Modelos matem´aticos determin´ısticos s˜ao um conjunto de equa¸c˜oes ou inequa¸c˜oes matem´aticas, organizadas de forma que, conhecidas algumas condi¸c˜oes deste sistema, ´

e poss´ıvel obter sua solu¸c˜ao em um dado momento. Estes modelos s˜ao utilizados em diversas ´areas de pesquisas cient´ıficas, tais como biologia, qu´ımica e f´ısica. Equa¸c˜oes do tipo diferenciais (ordin´arias, parciais ou com retardo), integro-diferenciais, e a diferen¸cas finitas, tˆem sido amplamente utilizadas nestes contextos.

Em modelagem matem´atica, podemos tamb´em estar interessados na calibra¸c˜ao dos parˆametros que definem o modelo determin´ıstico adotado. A calibra¸c˜ao dos parˆametros de um modelo determin´ıstico consiste em buscar um conjunto de valores para estes parˆametros at´e que se alcance uma melhor representa¸c˜ao do problema de estudo. Desta forma, ajustamos o modelo determin´ıstico aos dados em rela¸c˜ao aos parˆametros que o definem.

O crescente uso da modelagem determin´ıstica e o aumento da complexidade dos modelos, para descrever problemas de diversas ´areas, vˆem acentuando a necessidade de m´etodos de calibra¸c˜ao mais robustos neste contexto. Particularmente, no caso de parˆametros que definem equa¸c˜oes diferenciais ordin´arias n˜ao-lineares, a calibra¸c˜ao pode ser feita linearizando-se estas estruturas. Neste contexto, o m´etodo dos m´ınimos quadra-dos n˜ao-lineares tˆem sido amplamente aplicado.

Por outro lado, diversos procedimentos estat´ısticos mais elaborados, cl´assicos e baye-sianos, para estimar parˆametros envolvidos em modelos determin´ısticos tˆem sido

(17)

propos-tos na literatura. Veja, por exemplo, Poole e Raftery (2000); Cancr´e et al. (2000); Huang et al. (2006); Ramsay et al. (2007); Campbell (2007); Toni et al. (2008).

Neste trabalho, temos interesse em revisar e investigar m´etodos de estima¸c˜ao bayesiana em modelos originalmente expressos de forma determin´ıstica. Neste contexto, adicionamos incerteza ao estudo determin´ıstico. Desta forma, assumimos que a solu¸c˜ao determin´ıstica entra como, por exemplo, a m´edia de uma realiza¸c˜ao de uma distribui¸c˜ao de probabili-dade bem definida. Al´em disto, seguindo o paradigma de Bayes, obtemos como resultado da an´alise uma distribui¸c˜ao de probabilidade a posteriori para os parˆametros de interesse. Dessa forma a incerteza inerente ao procedimento de estima¸c˜ao e a informa¸c˜ao observada ´

e naturalmente descrita.

Em diversos casos, devido a complexidade dos modelos, a distribui¸c˜ao a posteriori resultante n˜ao tem forma anal´ıtica fechada. Portanto, surge a necessidade de m´etodos eficazes para a gera¸c˜ao de amostras desta distribui¸c˜ao. Em particular, selecionamos m´etodos de amostragem baseados em Monte Carlo via cadeias de Markov e em Monte Carlo sequencial, sob a perspectiva da estat´ıstica bayesiana. Nosso objetivo espec´ıfico ´e comparar a eficiˆencia destes dois m´etodos em diversos cen´arios. A seguir, descrevemos a organiza¸c˜ao deste texto.

No cap´ıtulo 2, fazemos uma revis˜ao de literatura sobre modelos determin´ısticos. Em particular, apresentamos conceitos e resultados matem´aticos relacionados as duas classes de modelos determin´ısticos estudados aqui, equa¸c˜oes a diferen¸cas finitas e equa¸c˜oes di-ferenciais ordin´arias. Al´em disto, discutimos alguns dos m´etodos mais conhecidos para aproximar solu¸c˜oes de equa¸c˜oes diferenciais ordin´arias. Finalmente, na se¸c˜ao 2.4, fornece-mos uma vis˜ao geral sobre os m´etodos de calibra¸c˜ao de parˆametros pertencentes a modelos determin´ısticos, propostos na literatura.

No cap´ıtulo 3 concentra-se o foco deste trabalho, que s˜ao os m´etodos computacionais bayesianos para estimar parˆametros envolvidos em modelos determin´ısticos. Primeiro, discutimos brevemente o que tem sido proposto na literatura. Em seguida, nas se¸c˜oes 3.1 e 3.2, apresentamos os m´etodos bayesianos de amostragem que temos interesse em investigar, inclusive descrevemos os algoritmos para implement´a-los. Mais especifica-mente, elegemos os m´etodos de Monte Carlo via cadeias de Markov e o de Monte Carlo

(18)

sequencial, adaptados ao contexto do nosso estudo. Na se¸c˜ao 3.3, utilizamos os m´etodos discutidos num estudo simulado. Escolhemos um modelo especificado por um sistema de duas equa¸c˜oes diferenciais ordin´arias n˜ao-lineares, que visa descrever dinˆamicas popula-cionais entre uma esp´ecie de presas e seus predadores.

J´a no cap´ıtulo 4, aplicamos a metodologia estudada, atrav´es de um dos m´etodos de estima¸c˜ao de interesse, a um modelo hidrol´ogico descrito por um sistema de equa¸c˜oes a diferen¸cas finitas no tempo, proposto por Lopes et al. (1981). Este modelo tem sido amplamente utilizado por especialistas em hidrologia, e ´e conhecido como Soil Moisture Accounting Procedure (SMAP). Ajustamos o modelo estat´ıstico proposto a um conjunto de dados artificialmente gerados. Al´em disto, trˆes conjuntos de dados coletados no es-tado do Cear´a, cedidos pelo grupo de pesquisa da Funda¸c˜ao Cearense de Meteorologia e Recursos H´ıdricos (FUNCEME), tamb´em foram ajustados. Estes conjuntos de dados diferem principalmente em rela¸c˜ao `a quantidade de observa¸c˜oes que comp˜oem suas s´eries temporais.

Finalmente, no cap´ıtulo 5, conclu´ımos nosso estudo apresentando uma discuss˜ao sobre os m´etodos e resultados obtidos. Al´em disto, indicamos poss´ıveis extens˜oes deste tra-balho, apontando t´opicos de nosso interesse de prosseguimento nesta linha de pesquisa.

(19)

Cap´ıtulo 2

Modelos Determin´ısticos

Modelos matem´aticos determin´ısticos s˜ao um conjunto de equa¸c˜oes ou inequa¸c˜oes matem´aticas, organizadas de forma que, conhecidas algumas condi¸c˜oes deste sistema, ´

e poss´ıvel obter sua solu¸c˜ao em um momento desejado. Portanto, dadas as mesmas condi¸c˜oes do sistema, a solu¸c˜ao ´e sempre igual.

Mais especificamente, aqui definimos um modelo determin´ıstico M como uma fun¸c˜ao que, para cada t em [0, T ], relaciona um conjunto de parˆametros θ ∈ Θ ⊂ Rm a um conjunto de vari´aveis de sa´ıda M (θ, t) ∈ Rp, dada as condi¸c˜oes de entrada deste sistema. Desta forma, modelos determin´ısticos n˜ao levam em conta nenhuma aleatoriedade. Isto ´

e, dado um conjunto de entradas do modelo, sua sa´ıda ´e unicamente determinada. Em particular, s˜ao modelos determin´ısticos sistemas de equa¸c˜oes a diferen¸cas fini-tas (discreto) e sistemas de equa¸c˜oes diferenciais ordin´arias (EDO’s) (cont´ınuo), os quais temos interesse neste trabalho. Exemplos de condi¸c˜oes de entrada, que n˜ao s˜ao parˆametros do modelo, s˜ao as condi¸c˜oes iniciais do sistema, M (θ, 0), no caso de EDO’s. Estas condi¸c˜oes s˜ao necess´arias para obtermos uma solu¸c˜ao ´unica.

2.1

Equa¸

oes a Diferen¸

cas Finitas

Bassanezi (2002) sugere que o uso de equa¸c˜oes a diferen¸cas finitas em modelagem ´e apropriado quando, por exemplo, o crescimento populacional, entre gera¸c˜oes sucessivas, ocorre em etapas discretas e sem sobreposi¸c˜ao de gera¸c˜oes da esp´ecie analisada. V´arias

(20)

aplica¸c˜oes desta classe de equa¸c˜oes s˜ao apresentadas em Bassanezi (2002), assim como um estudo introdut´orio desta teoria ´e visto em Lima (2006). Segue abaixo a defini¸c˜ao matem´atica destas equa¸c˜oes.

Defini¸c˜ao 2.1.1 Uma equa¸c˜ao a diferen¸cas de 1a ordem ´e uma equa¸ao da forma

xt+1= f (xt), (2.1)

onde f ´e uma fun¸c˜ao determinada e t ∈ {0, 1, ..., N, ...}.

A solu¸c˜ao da equa¸c˜ao a diferen¸cas finitas em (2.1) ´e uma sequˆencia, cujos termos satisfazem a rela¸c˜ao definida por f , da forma (x0, x1, ..., xN, ...). Al´em disto, segundo Lima (2006), supondo conhecido o ponto inicial x0, ou primeiro termo da sequˆencia, ent˜ao a equa¸c˜ao em (2.1) possui uma ´unica solu¸c˜ao.

2.2

Equa¸

oes Diferenciais Ordin´

arias

A vasta aplicabilidade dos conceitos do c´alculo diferencial para resolver problemas pr´aticos tem movido v´arios pesquisadores, desde o final do s´eculo XVII quando I. Newton e G. W. Leibnitz, motivados por problemas f´ısicos e geom´etricos, o desenvolveram. A seguir, apresentamos alguns conceitos indispens´aveis para uma melhor compreens˜ao desta classe de equa¸c˜oes, inclusive sua defini¸c˜ao.

Defini¸c˜ao 2.2.1 Seja f uma fun¸c˜ao definida num aberto Ω que associa cada par (t, x) ∈ Ω ⊂ (R × Rn) a um ponto pertencente ao Rn com

dx

dt = f (t, x), (2.2)

ent˜ao, dizemos que (2.2) ´e uma equa¸c˜ao diferencial ordin´aria em Rn definida por f . Uma solu¸c˜ao da EDO em (2.2) ´e uma fun¸c˜ao deriv´avel φ : I → Rn com (t, φ(t)) ∈ Ω, para todo t ∈ I ⊂ R, I intervalo. Al´em disto, supondo conhecido um ponto da solu¸c˜ao, digamos x(t0) = x0, temos um problema de valor inicial (PVI), tamb´em chamado de problema de Cauchy.

(21)

A fim de garantir a existˆencia de solu¸c˜oes de EDO’s definidas no Rn, basta que a fun¸c˜ao f seja cont´ınua. Entretanto, para garantir unicidade de solu¸c˜ao de um PVI ´e preciso assumir outras hip´oteses al´em da continuidade da fun¸c˜ao f . O teorema abaixo trata deste problema, e sua demonstra¸c˜ao pode ser apreciada em Doering e Lopes (2007). Teorema 2.1 (Teorema de Existˆencia e Unicidade de Solu¸c˜ao) Seja f : Ω → Rn uma fun¸c˜ao cont´ınua definida num aberto Ω ⊂ Rn+1. Suponhamos que a derivada parcial espacial, ∂f

∂x, seja tamb´em cont´ınua neste aberto. Ent˜ao, para cada (t0, x0) ∈ Ω existem um intervalo aberto I contendo t0 e uma ´unica fun¸c˜ao diferenci´avel φ : I → Rn com (t, φ(t)) ∈ Ω, para todo t ∈ I, que ´e solu¸c˜ao do problema de valor inicial

dx

dt = f (t, x), x(t0) = x0.

Se escrevermos x(t) = (x1(t), ..., xn(t)), e f (t, x) = (f1(t, x), ..., fn(t, x)), ent˜ao pode-mos interpretar a equa¸c˜ao diferencial vetorial dx

dt = f (t, x) ∈ R

n como um sistema de equa¸c˜oes diferenciais escalares da forma

dx1 dt = f1(t, x1(t), ..., xn(t)), dx2 dt = f2(t, x1(t), ..., xn(t)), .. . dxn dt = fn(t, x1(t), ..., xn(t)).

Uma solu¸c˜ao deste sistema ´e dada por um conjunto de fun¸c˜oes deriv´aveis φl: I → R, l = 1, ..., n, tais que, para cada t ∈ I

dφl

dt = fl(t, φ1(t), ..., φn(t)).

Equivalentemente, o vetor φ = (φ1, φ2, ..., φn) representa a solu¸c˜ao da equa¸c˜ao vetorial dx

dt = f (t, x) ∈ R

n. Desta forma, o teorema de existˆencia e unicidade de solu¸c˜oes apresentado acima para uma equa¸c˜ao diferencial ordin´aria vetorial com condi¸c˜ao inicial conhecida, tamb´em garante a existˆencia e unicidade de solu¸c˜ao para um sistema de equa¸c˜oes diferenciais escalares em R dada sua condi¸c˜ao inicial. Neste caso, uma condi¸c˜ao inicial ´e dada por x1(t0) = x01, ..., xn(t0) = x0n.

(22)

2.3

etodos Num´

ericos de Aproxima¸

ao de Solu¸

ao

de EDO

No in´ıcio do desenvolvimento das equa¸c˜oes diferenciais, a principal preocupa¸c˜ao dos pesquisadores era a obten¸c˜ao da solu¸c˜ao destas equa¸c˜oes de forma expl´ıcita. Entretanto, logo se verificou que a quantidade de equa¸c˜oes que podiam ser resolvidas analiticamente era muito pequena. Segundo Figueiredo e Neves (2005), com a rigorosidade da an´alise matem´atica, surgida mais formalmente no s´eculo XIX, passou-se a se considerar primeiro a existˆencia e unicidade de solu¸c˜oes. Al´em disto, v´arios estudos vˆem sendo realizados ao longo dos anos, em favor de m´etodos para solu¸c˜ao destas equa¸c˜oes. Quando a equa¸c˜ao ´

e linear, a solu¸c˜ao torna-se mais simples, podendo ser resolvida analiticamente. Por outro lado, quando a equa¸c˜ao apresenta algum termo n˜ao-linear, em geral, n˜ao con-seguimos resolvˆe-la exatamente. Neste contexto, m´etodos num´ericos de aproxima¸c˜ao de solu¸c˜oes surgem como ferramentas poderosas, principalmente com o advento e grande progresso da capacidade computacional. No caso de EDO’s, dada sua condi¸c˜ao inicial, alguns dos m´etodos mais conhecidos s˜ao o m´etodo de Euler (e alguns aprimoramentos deste m´etodo), o m´etodo de Runge-Kutta, o m´etodo da coloca¸c˜ao e m´etodos de passos m´ultiplos. Estes m´etodos s˜ao descritos, por exemplo, em Boyce e DiPrima (2001) e Bur-den e Faires (1993). V´arios softwares matem´aticos possuem pacotes com alguns destes m´etodos implementados, que s˜ao de f´acil manipula¸c˜ao.

A fim de fazermos uma breve introdu¸c˜ao dos m´etodos num´ericos citados, vamos con-siderar o caso mais simples. Seja uma equa¸c˜ao diferencial ordin´aria n˜ao-linear da forma

dx

dt = f (t, x),

tais que (t, x) ∈ (R × R) e com condi¸c˜ao inicial x(t0) = x0.

Al´em disto, vamos supor que f e a derivada parcial com rela¸c˜ao `a segunda vari´avel, ∂f

∂x, sejam cont´ınuas. Da´ı, pelo teorema 2.1, existe uma ´unica solu¸c˜ao do problema dado num intervalo aberto I, contendo t0.

O primeiro passo para utilizarmos um m´etodo num´erico consiste em definir N subin-tervalos do intervalo I. Denotaremos estes N subinsubin-tervalos por [tn−1, tn], n = 1, ..., N . O

(23)

pr´oximo passo ´e aproximar a solu¸c˜ao dentro de cada um destes subintervalos.

2.3.1

etodo de Euler

Embora o m´etodo de Euler seja raramente utilizado em aplica¸c˜oes reais, sua im-portˆancia te´orica para o entendimento de v´arios outros m´etodos mais robustos justifica sua apresenta¸c˜ao. Este ´e um m´etodo iterativo, no qual devemos calcular recursivamente a seguinte equa¸c˜ao

xn = xn−1+ hf (tn−1, xn−1), n = 1, ..., N, tal que h ´e o tamanho dos subintervalos [tn−1, tn], n = 1, ..., N .

Este ´e o m´etodo de Euler mais simples, pois consideramos aqui o tamanho dos inter-valos igual para todos. Desta forma, obtemos uma sequˆencia de pares (t0, x0), ..., (tN, xN) que aproximam a solu¸c˜ao alvo no intervalo I = [t0, tN].

Embora a utiliza¸c˜ao de m´etodos num´ericos seja extremamente ´util, esta solu¸c˜ao obtida sofre algumas penaliza¸c˜oes devido a erros de aproxima¸c˜ao. Os principais erros de aproxi-ma¸c˜ao nestes casos s˜ao os erros de truncamento e de arredondamento. Basicamente, o erro de arredondamento est´a relacionado `a limita¸c˜ao computacional no sentido de que os c´alculos s˜ao restritos a um n´umero finito de d´ıgitos. J´a o erro de truncamento origina-se do fato de que em cada passo somente utilizamos uma f´ormula aproximada para obter cada xn, e, al´em disto, supondo este valor correto, o utilizamos para obter o pr´oximo termo da sequˆencia. Em particular, chamamos de erro de truncamento local o erro efetuado em cada passo. Para uma vasta classe de m´etodos num´ericos ´e poss´ıvel obter estimativas destes erros.

O m´etodo de Euler pode tamb´em ser visto como um caso particular dos m´etodos de s´erie de Taylor, com a presen¸ca apenas do termo de primeira ordem (primeira derivada). Na pr´atica, estes m´etodos com ordens superiores s˜ao dificilmente empregados pois re-querem as avalia¸c˜oes de derivadas tamb´em de ordens superiores, que nem sempre existem, ou ainda, tornam a implementa¸c˜ao mais complexa.

(24)

2.3.2

etodo de Runge-Kutta

O m´etodo de Runge-Kutta tamb´em pode ser considerado uma generaliza¸c˜ao do m´etodo de Euler. Neste m´etodo, podemos variar o tamanho dos subintervalos tomados para a aproxima¸c˜ao. Dentre as v´arias formas deste m´etodo, o mais amplamente utilizado ´e o m´etodo de Runge-Kutta de quarta ordem, e sua f´ormula de recorrˆencia ´e dada por

xn= xn−1+ h  kn−1,1+ 2kn−1,2+ 2kn−1,3+ kn−1,4 6  , n = 1, ..., N, tais que kn−1,1 = f (tn−1, xn−1), kn−1,2 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,1), kn−1,3 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,2), kn−1,4 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,3), para n = 1, ..., N .

O termo que acompanha h pode ser interpretado como uma m´edia ponderada de valores de f (t, x) em diferentes pontos do intervalo [tn−1, tn], ou ainda como um coefi-ciente angular m´edio. A ampla utiliza¸c˜ao deste m´etodo pode ser explicada devido a ser um m´etodo razoavelmente simples de ser manipulado e que retorna uma aproxima¸c˜ao satisfat´oria em muitos casos.

2.3.3

etodos de Passos M´

ultiplos

M´etodos que utilizam informa¸c˜ao de mais de um passo anterior s˜ao chamados de m´etodos de passos m´ultiplos. Deste modo, os m´etodos anteriores n˜ao fazem parte desta classe de m´etodos. Entretanto, existem v´arios m´etodos que apresentam esta carac-ter´ıstica. Como ilustra¸c˜ao, vejamos um destes m´etodos, conhecido como m´etodo de Adams. A id´eia b´asica deste m´etodo ´e aproximar f (t, x) por um polinˆomio Pk(t) de grau k − 1, e usar este polinˆomio para calcular a integral

Z tn+1

tn

(25)

Assim, obtemos a f´ormula recursiva xn+1= xn+

Z tn+1

tn

f (t, x) dt. (2.3)

Os coeficientes de Pk(t) s˜ao determinados usando-se os k dados calculados anteri-ormente. O caso mais simples ´e aproximar a integral por um polinˆomio de grau 1, P2(t) = at+b. Para especificarmos os coeficientes a e b precisamos de apenas dois pontos, digamos (tn−1, yn−1) e (tn, yn). Considerando que estes pontos satisfazem o polinˆomio, basta ent˜ao resolvermos o sistema

f (tn−1, yn−1) = atn−1+ b, f (tn, yn) = atn+ b.

Para um tamanho igual a h para todos subintervalos, obtemos a = f (tn, yn) − f (tn−1, yn−1)

h ,

b = f (tn−1, yn−1)tn− f (tn, yn)tn−1

h .

Portanto, substituindo o polinˆomio P2(t) na equa¸c˜ao (2.3), e fazendo algumas simpli-fica¸c˜oes, temos a seguinte f´ormula de recorrˆencia

xn+1 = xn+ 3

2hf (tn, yn) − 1

2hf (tn−1, yn−1).

Aproxima¸c˜oes mais precisas podem ser obtidas a partir de uma aproxima¸c˜ao por um polinˆomio com grau maior. Entretanto, conforme aumentamos o grau do polinˆomio tamb´em ´e requerido um n´umero maior de pontos.

2.3.4

etodo da Coloca¸

ao

Dentre os m´etodos de aproxima¸c˜ao conhecidos, existe o m´etodo da coloca¸c˜ao, tamb´em chamado de m´etodo de expans˜ao por fun¸c˜oes base. Este m´etodo consiste em aproximar cada xn, n = 1, ..., N , por ˆxn em termos de uma combina¸c˜ao linear de fun¸c˜oes base da forma ˆ xn(t) = Kn X k=1 cn,kφn,k(t) = c0nφn(t),

(26)

tal que φn, n = 1, ..., N , representam as fun¸c˜oes bases escolhidas (geralmente polinomiais ou splines), e Kn´e o n´umero destas fun¸c˜oes que comp˜oem a combina¸c˜ao linear, que deve ser escolhido de forma a garantir flexibilidade suficiente para capturar a varia¸c˜ao de xn e sua derivada.

2.4

Calibra¸

ao e Estima¸

ao de Parˆ

ametros no

con-texto de Modelos Determin´ısticos

Nas se¸c˜oes anteriores estivemos focados na teoria matem´atica b´asica de modelos de-termin´ısticos, embora n˜ao tenhamos introduzido conceitos de estudos qualitativos que tamb´em s˜ao de grande interesse matem´atico. Estes conceitos, assim como um aprofun-damento de toda teoria apresentada podem ser vistos, por exemplo, em Boyce e DiPrima (2001); Doering e Lopes (2007); Figueiredo e Neves (2005). De forma geral, o interesse matem´atico est´a relacionado com as fun¸c˜oes inc´ognitas, inclusive com seus comportamen-tos a partir de mudan¸cas nas entradas do modelo. Entretanto, na ´area da modelagem matem´atica, o interesse b´asico est´a em ser capaz de especificar o melhor conjunto de equa¸c˜oes que represente algebricamente o fenˆomeno estudado. Neste contexto, um dos passos principais ´e chamado de calibra¸c˜ao dos parˆametros do modelo adotado. Este passo consiste em buscar um conjunto de valores para estes parˆametros at´e que se al-cance uma melhor representa¸c˜ao do problema de estudo. Na literatura, encontramos diversos estudos que utilizam diferentes m´etodos com este objetivo.

Quando n˜ao h´a informa¸c˜ao coletada sobre as vari´aveis do sistema, pode-se calibrar os valores dos parˆametros baseando-se em informa¸c˜oes das caracter´ısticas f´ısicas do sistema, por exemplo.

Quando h´a disponibilidade de dados, podemos calibrar tais valores por tentativas e erros, que ´e um m´etodo manual de ajuste. Neste caso, escolhemos diversos conjun-tos de valores de parˆametros, e resolvemos o modelo determin´ıstico. Este ajuste ´e feito at´e que se alcance uma melhor representa¸c˜ao dos dados observados atrav´es do modelo adotado. Uma outra op¸c˜ao, na presen¸ca de dados observados, ´e utilizando m´etodos

(27)

matem´aticos/estat´ısticos/computacionais para otimizar uma determinada fun¸c˜ao obje-tivo que relaciona os dados observados com os calculados via o modelo determin´ıstico. Neste contexto, buscamos de forma mais eficiente os conjuntos de valores dos parˆametros de interesse que ajustam melhor os dados observados. Entretanto, estes m´etodos tradi-cionais exigem a formula¸c˜ao de uma fun¸c˜ao objetivo, que ser´a o crit´erio de avalia¸c˜ao da solu¸c˜ao obtida. A escolha desta fun¸c˜ao pode se tornar complexa, dependendo do problema em quest˜ao. Uma fun¸c˜ao objetivo amplamente utilizada ´e a soma dos desvios quadr´aticos dos dados observados e simulados via o modelo determin´ıstico.

Em particular, um m´etodo de calibra¸c˜ao frequentemente utilizado ´e o m´etodo de m´ınimos quadrados, mais especificamente, o m´etodo de m´ınimos quadrados n˜ao-linear, devido a grande maioria dos problemas apresentarem formas n˜ao-lineares. Na verdade, este m´etodo ´e um caso particular de estima¸c˜ao por m´axima verossimilhan¸ca quando assumimos a hip´otese de normalidade.

Alternativas a estes m´etodos de otimiza¸c˜ao mais tradicionais tamb´em tˆem surgido na literatura, como o uso de algoritmos gen´eticos, veja por exemplo S´a (2003). Ainda sob a perspectiva da estat´ıstica cl´assica, um m´etodo de estima¸c˜ao mais elaborado, que avalia a aproxima¸c˜ao tanto por um crit´erio de ajuste aos dados quanto a fidelidade da aproxima¸c˜ao feita ao sistema de equa¸c˜oes, ´e desenvolvido em Ramsay et al. (2007). Neste trabalho, os autores utilizam o m´etodo da coloca¸c˜ao para aproximar a solu¸c˜ao alvo, e, a partir da inclus˜ao de incerteza ao problema, estimam os parˆametros, inclusive os coeficientes da fun¸c˜ao base que s˜ao requeridos no m´etodo da coloca¸c˜ao, ver se¸c˜ao 2.3.4.

Al´em destes m´etodos, sob a perspectiva da estat´ıstica bayesiana, diversos procedi-mentos tˆem sido propostos na literatura. Estes m´etodos ser˜ao apresentados e discutidos detalhadamente no cap´ıtulo 3.

(28)

Cap´ıtulo 3

Estima¸

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos

Determin´ısticos

Modelos determin´ısticos que representam fenˆomenos f´ısicos s˜ao especificados por parˆ a-metros que, geralmente, possuem interpreta¸c˜ao f´ısica relacionada ao problema em quest˜ao. Como discutido no cap´ıtulo 1, a fim de estimar estes parˆametros, v´arias propostas de inclus˜ao de incerteza em modelos determin´ısticos tˆem sido feitas na literatura, tanto sob a perspectiva da estat´ıstica cl´assica quanto sob a da bayesiana. Neste trabalho, estamos interessados em investigar m´etodos bayesianos de estima¸c˜ao de parˆametros originalmente envolvidos em modelos determin´ısticos.

Em Poole e Raftery (2000), ´e sugerida uma abordagem formal aplic´avel a modelos determ´ınisticos em geral, chamada Bayesian Melding, a qual leva em conta a informa¸c˜ao e a incerteza sobre as entradas e sa´ıdas do modelo determin´ıstico. Neste artigo, o m´etodo conceitual proposto ´e aplicado num modelo de dinˆamica populacional para baleias.

Cancr´e et al. (2000) calibram um modelo determin´ıstico de transmiss˜ao da mal´aria, usando dados provenientes do Senegal, sob a abordagem bayesiana. Em particular, os autores modelaram os dados, os quais s˜ao dados de contagens, por uma distribui¸c˜ao binomial. Al´em disto, devido a complexidade do modelo de transmiss˜ao, utilizam o m´etodo de MCMC para amostrar da distribui¸c˜ao a posteriori dos parˆametros de interesse.

(29)

Um m´etodo bayesiano hier´arquico ´e discutido em Huang et al. (2006), para um caso espec´ıfico de um modelo descrito por um sistema de equa¸c˜oes diferenciais ordin´arias n˜ ao-lineares. Este sistema caracteriza dinˆamicas do v´ırus da imunodeficiˆencia humana, a longo prazo, com a presen¸ca de terapia antiretroviral. Segundo Huang et al. (2006), o m´etodo proposto ´e geralmente aplic´avel a qualquer outro sistema dinˆamico da mesma classe.

Em Campbell (2007), h´a interesse espec´ıfico em estimar parˆametros provenientes de sistemas de EDO’s n˜ao-lineares, sob uma perspectiva bayesiana. S˜ao descritos dois procedimentos de estima¸c˜ao que usam o m´etodo da coloca¸c˜ao para aproximar a solu¸c˜ao do sistema de EDO’s na fun¸c˜ao de verossimilhan¸ca, sendo que um destes procedimentos ´

e uma vers˜ao bayesiana do m´etodo apresentado em Ramsay et al. (2007).

Em Buckland et al. (2007) ´e apresentada uma vasta revis˜ao dos recentes desenvolvi-mentos em modelagem de dinˆamicas de popula¸c˜oes, assim como uma descri¸c˜ao da for-mula¸c˜ao e ajuste bayesianos de modelos com estrutura matricial desta esp´ecie. Al´em disto, s˜ao sugeridos os m´etodos de ajustes de MCMC e o m´etodo de amostragem por importˆancia sequencial.

Sisson et al. (2007b) e Toni et al. (2008) prop˜oem diferentes procedimentos de com-puta¸c˜ao bayesiana aproximados, ambos baseados no m´etodo de Monte Carlo sequencial, para estimar parˆametros em sistemas dinˆamicos. As duas propostas s˜ao baseadas nos m´etodos e amostradores discutidos em Moral et al. (2006). Em Toni et al. (2008) tamb´em ´

e discutido sele¸c˜ao de modelos neste contexto, sendo que neste trabalho o m´etodo ´e apli-cado tamb´em para a estima¸c˜ao de parˆametros que definem modelos determin´ısticos.

Sob uma perspectiva bayesiana, a inclus˜ao de incerteza num sistema determin´ıstico, pode ser feita assumindo que, dado o vetor de parˆametros que o definem, a solu¸c˜ao do sistema ´e a m´edia de uma realiza¸c˜ao da distribui¸c˜ao normal com um erro associado. Para completar a formula¸c˜ao do modelo bayesiano, devemos atribuir distribui¸c˜oes a priori para os parˆametros do modelo determin´ıstico e para as variˆancias associadas a verossim-ilhan¸ca. A partir da formula¸c˜ao da fun¸c˜ao de verossimilhan¸ca e das distribui¸c˜oes a priori, e seguindo o teorema de Bayes, obtemos a distribui¸c˜ao a posteriori dos parˆametros. Em muitos casos, devido a complexidade dos modelos, a distribui¸c˜ao a posteriori resultante

(30)

n˜ao tem forma anal´ıtica fechada. Nosso interesse aqui ´e investigar diferentes m´etodos propostos na literatura para amostragem de parˆametros envolvidos em modelos deter-min´ısticos. Ambos os m´etodos estudados s˜ao m´etodos de Monte Carlo. O primeiro ´e o m´etodo de Monte Carlo via cadeias de Markov (MCMC), que tem sido amplamente adotado. O outro ´e o m´etodo de Monte Carlo sequencial (MCS), adequado ao contexto de modelos determin´ısticos. A seguir, descrevemos minuciosamente os m´etodos eleitos no contexto do nosso trabalho.

3.1

MCMC

Como apresentado em Campbell (2007); Huang et al. (2006), uma op¸c˜ao para obter amostras da distribui¸c˜ao a posteriori de parˆametros no contexto de modelos deter-min´ısticos ´e atrav´es do m´etodo de Monte Carlo via Cadeias de Markov (MCMC). Como definido em Robert e Casella (2004), um m´etodo de MCMC para a simula¸c˜ao de uma determinada distribui¸c˜ao alvo, ´e qualquer m´etodo que produza uma cadeia de Markov erg´odica cuja distribui¸c˜ao estacion´aria ´e a distribui¸c˜ao alvo. O desempenho deste m´etodo est´a associado com a convergˆencia da cadeia de Markov. Segundo Moral et al. (2006), em geral, ´e dif´ıcil avaliar quando a cadeia de Markov atingiu seu equil´ıbrio estacion´ario. V´arios procedimentos s˜ao propostos na literatura para esta avalia¸c˜ao, veja por exemplo Cowles e Carlin (1996); Robert e Casella (2004). Neste estudo, para a avalia¸c˜ao da con-vergˆencia, utilizamos diferentes cadeias iniciadas com valores distintos. Al´em disto, a fim de obtermos amostras independentes da distribui¸c˜ao alvo, geralmente, precisamos de muitas itera¸c˜oes do m´etodo para descartarmos uma quantidade suficiente de amostras, al´em das amostras geradas na fase de aquecimento do amostrador. Outra desvantagem do MCMC, em alguns casos, ´e que pode ocorrer do m´etodo ficar parado em modas locais, ao inv´es de percorrer mais o espa¸co de varia¸c˜ao do parˆametro, encontrando assim a moda global, se existir.

Segundo Gamerman e Lopes (2006), o algoritmo de amostragem de Gibbs ´e o es-quema de simula¸c˜ao estoc´astica usando MCMC mais habitual. Basicamente, o algo-ritmo de Gibbs ´e um algoritmo de MCMC onde o n´ucleo de transi¸c˜ao ´e constitu´ıdo

(31)

pelas distribui¸c˜oes condicionais completas. Entretanto, diversas vezes n˜ao ´e poss´ıvel amostrar diretamente das distribui¸c˜oes condicionais completas devido suas formas n˜ao conhecidas, complexidade ou custo computacional elevado. Neste contexto, algoritmos de Metropolis-Hastings s˜ao uma op¸c˜ao. A combina¸c˜ao entre os algoritmos de Gibbs e Metropolis-Hastings tem sido amplamente adotada. Algoritmos de Metropolis-Hastings envolvem, dentre outros conceitos, a escolha de um n´ucleo de transi¸c˜ao que devem ser preferencialmente de amostragem simples. Outro ponto importante para a performance do algoritmo, tamb´em relacionado ao n´ucleo de transi¸c˜ao (tamb´em chamado de dis-tribui¸c˜ao proposta), ´e a taxa de aceita¸c˜ao dos valores dos parˆametros propostos. Para um estudo mais detalhado e gen´erico veja, por exemplo, Gamerman e Lopes (2006); Robert e Casella (2004).

Em Marjoram et al. (2003), ´e proposto um m´etodo de MCMC para gerar observa¸c˜oes de uma distribui¸c˜ao a posteriori sem a avalia¸c˜ao da fun¸c˜ao de verossimilhan¸ca envolvida. De fato, os autores derivam uma aproxima¸c˜ao da fun¸c˜ao de verossimilhan¸ca e, segundo Marjoram et al. (2003), este m´etodo ´e indicado quando esta fun¸c˜ao ´e imposs´ıvel de ser computada ou requer um alto custo computacional para sua avalia¸c˜ao.

Abaixo, descrevemos o algoritmo de Gibbs com passos de Metropolis-Hastings que aplicaremos mais adiante nos modelos determin´ısticos de interesse.

Suponha que queremos obter amostras da distribui¸c˜ao a posteriori do vetor de parˆ ame-tros θ = (θ1, θ2, ..., θm), os quais originalmente definem um modelo determin´ıstico bem especificado. Al´em disto, utilizamos θ(j) para denotar o vetor (θ1(j), θ2(j), ..., θ(j)m), e θ(p) para (θ(p)1 , θ2(p), ..., θm(p)). De forma geral, o algoritmo de Gibbs com passos de Metropolis-Hastings para realizar o MCMC, no contexto de modelos determin´ısticos, pode ser des-crito atrav´es dos seguintes passos:

1. Inicialize j ← 1;

2. Arbitre valores iniciais para o vetor de parˆametros θ(j);

3. Resolva o sistema determin´ıstico, obtendo M (θ(j), t), para t = 1, ..., T ;

4. Amostre valores propostos θ(p), para o vetor de parˆametros, da distribui¸c˜ao proposta escolhida, q;

(32)

5. Resolva o sistema determin´ıstico, obtendo M (θ(p), t), para t = 1, ..., T ;

6. Calcule a raz˜ao de aceita¸c˜ao de Hastings, que tem como numerador (denominador) o produto da condicional completa a posteriori dos parˆametros, p(θ|.), aplicada nos valores propostos (valores correntes) com a distribui¸c˜ao proposta aplicada nos valores correntes (valores propostos)

r = p(θ

(p)|.)q(θ(j)(p))

p(θ(j)|.)q(θ(p)(j)); (3.1)

7. Amostre u ∼ U nif orme[0, 1]; 8. Se u < min(1, r)

ent˜ao θ(j+1) ← θ(p) sen˜ao θ(j+1) ← θ(j);

9. j ← j + 1, e volte ao passo 3 at´e que j > J .

3.2

MCS

No contexto de inferˆencia em modelos dinˆamicos, o m´etodo de MCMC n˜ao mostra ser muito eficiente, dado que h´a a necessidade de se estimar um grande n´umero de parˆametros, e assim podendo levar a uma taxa de aceita¸c˜ao muito baixa de novos valores propostos. E como as distribui¸c˜oes condicionais completas resultantes s˜ao geralmente desconhecidas, passos de Metropolis-Hastings s˜ao comumente utilizados. Por outro lado, a amostragem de um vetor de parˆametros dinˆamicos em blocos tamb´em n˜ao apresenta bom desempenho. Como uma alternativa, surgiram os m´etodos de Monte Carlo sequen-cial (MCS). Al´em de problemas deste tipo, este m´etodo ´e aplic´avel em contextos gerais onde estamos interessados em amostrar de um conjunto de distribui¸c˜oes sequencialmente. Segundo Sisson et al. (2007b), ao contr´ario do MCMC, o amostrador de MCS n˜ao fica parado em regi˜oes de baixa probabilidade assim como o m´etodo de amostragem por re-jei¸c˜ao. Outra vantagem do MCS sobre o MCMC, est´a na natureza das amostras n˜ao serem correlacionadas. Al´em disto, segundo Fan et al. (2008), o m´etodo de MCS fornece uma estrutura para amostragem a posteriori que n˜ao ´e dependente da convergˆencia de uma

(33)

cadeia de Markov, como ocorre no MCMC, embora tamb´em sejam necess´arias avalia¸c˜oes das amostras obtidas.

Em Chopin (2002), ´e apresentado um m´etodo de MCS para modelos est´aticos. Mais geralmente, em Moral et al. (2006), s˜ao propostos algoritmos, chamados amostradores de MCS, que usam n´ucleos de MCMC como ingredientes. Basicamente, estes algorit-mos envolvem uma combina¸c˜ao de amostragem por importˆancia sequencial e id´eias de reamostragem.

Neste contexto de m´etodos de MCS, elegemos estudar os algoritmos apresentados em Sisson et al. (2007b) e Toni et al. (2008). Ambas as propostas s˜ao baseadas nos m´etodos e amostradores discutidos em Moral et al. (2006). Em Toni et al. (2008) os autores chamam o algoritmo proposto por algoritmo de computa¸c˜ao bayesiana aproximada de MCS (CBA-MCS), enquanto que Sisson et al. (2007b) denominam o seu por algoritmo de computa¸c˜ao bayesiana aproximada por controle de rejei¸c˜ao parcial (CBA-CRP). Aqui, quando nos referirmos a estes algoritmos, tamb´em os chamaremos desta forma.

3.2.1

CBA-MCS

Novamente, suponha que queremos obter amostras da distribui¸c˜ao a posteriori do ve-tor de parˆametros θ = (θ1, θ2, ..., θm), que, a princ´ıpio, especificam um particular modelo determin´ıstico. A proposta deste algoritmo ´e, a partir de amostras da distribui¸c˜ao a pri-ori de θ, π(θ), obter amostras (popula¸c˜oes) de distribui¸c˜oes intermedi´arias, at´e alcan¸car uma amostra da distribui¸c˜ao a posteriori alvo. Determinamos o n´umero de popula¸c˜oes total igual a L, onde cada popula¸c˜ao tem tamanho J . Al´em disto, tamb´em ´e necess´ario escolher a sequˆencia de valores 1, ..., L que ser˜ao os erros de tolerˆancia para cada pop-ula¸c˜ao, tal que 1 > ... > L. Nesta nota¸c˜ao, Kl´e o n´ucleo de transi¸c˜ao da sua respectiva popula¸c˜ao l, d(a, b) ´e uma fun¸c˜ao distˆancia entre a e b definida, e x0 ´e o dado observado. Neste contexto, o algoritmo de amostragem pode ser descrito nos passos abaixo.

Primeiro, inicialize a contagem das popula¸c˜oes l ← 1. 1. Para l = 1, inicialize j ← 1;

(34)

• Repita os pr´oximos passos, da letra (a) at´e a (c), at´e que d(x∗, x0) ≤ 1 (a) Amostre θ∗∗∼ π(θ), onde θ∗∗ = (θ∗∗

1 , θ∗∗2 , ..., θm∗∗);

(b) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (c) Amostre x∗ ∼ p(x|θ∗∗), tal que p(x|θ) ´e o modelo probabil´ıstico adotado; • Atribua os valores ω[1, j] ← 1, ∀ j, onde ω ´e a matriz de pesos (probabili-dades) associada a primeira popula¸c˜ao (l = 1), e a j-´esima part´ıcula (j-´esimo elemento da popula¸c˜ao) amostrada;

• Armazene as part´ıculas amostradas θj1 ← θ∗∗, onde θj

1 ´e o vetor contendo a j-´esima part´ıcula da primeira popula¸c˜ao;

• j ← j + 1; Normalize os pesos; l ← l + 1;

2. Para 1 < l ≤ L, inicialize j ← 1; Enquanto (j ≤ J ) fa¸ca

• Repita os pr´oximos passos, da letra (a) at´e a (d), at´e que d(x∗, x0) ≤ l (a) Amostre θ∗ = (θ∗1, θ2∗, ..., θm∗) ∼ θl−1 com pesos associados ωl−1; (b) Amostre θ∗∗∼ θ∗+ K

l(θ|θ∗), at´e que π(θ∗∗) 6= 0;

(c) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (d) Amostre x∗ ∼ p(x|θ∗∗);

• Atribua os valores ω[l, j] ← PJ π(θ∗∗)

i=1Kl(θ∗∗|θ[l−1,i]), ∀ j;

• Armazene as part´ıculas amostradas θjl ← θ∗∗, onde θj

l ´e o vetor contendo a j-´esima part´ıcula da l-´esima popula¸c˜ao;

• j ← j + 1; Normalize os pesos; l ← l + 1;

(35)

Todos os passos da demonstra¸c˜ao deste algoritmo s˜ao apresentados em Toni et al. (2008). Neste artigo, na verdade, ´e demonstrado um procedimento um pouco mais geral do que acabamos de descrever. Entretanto, no contexto de modelos determin´ısticos, esta extens˜ao n˜ao ´e aplicada neste artigo, mas aqui temos interesse em aplic´a-la. Nesta generaliza¸c˜ao, para todas as popula¸c˜oes, a diferen¸ca consiste em n˜ao simular apenas um conjunto de dados, x∗, a partir do vetor proposto θ∗∗, mas, ao inv´es disto, simulamos B conjuntos de dados para cada vetor θ∗∗. Da´ı, calculamos quantas vezes (que denotaremos por b), de um total de B, a inequa¸c˜ao d(x∗, x0) ≤ l´e satisfeita, bastando ser maior do que zero para passarmos para o pr´oximo passo. Al´em disto, os pesos tamb´em s˜ao alterados. Os pesos associados a cada part´ıcula, para todas as popula¸c˜oes, s˜ao multiplicados por esta quantidade b.

3.2.2

CBA-CRP

O algoritmo proposto por Sisson et al. (2007b), ´e muito similar ao algoritmo apre-sentado em Toni et al. (2008), entretanto, apresenta diferen¸cas principalmente nos pesos, onde al´em do n´ucleo de transi¸c˜ao para frente, ´e utilizado um n´ucleo de transi¸c˜ao para tr´as.

Sob as mesmas condi¸c˜oes supostas para o algoritmo CBA-MCS, e utilizando a mesma nota¸c˜ao, abaixo descrevemos os passos do algoritmo CBA-CRP.

Primeiro, inicialize a contagem das popula¸c˜oes l ← 1. 1. Para l = 1, inicialize j ← 1;

Enquanto (j ≤ J ) fa¸ca

• Repita os pr´oximos passos, da letra (a) at´e a (c), at´e que d(x∗, x0) ≤ 1 (a) Amostre θ∗∗∼ µ(θ);

(b) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (c) Amostre x∗ ∼ p(x|θ∗∗);

• Atribua os valores ω[1, j] ← π(θµ(θ∗∗∗∗)), ∀ j;

(36)

• j ← j + 1; Normalize os pesos; Se h PJ j=1ω[1, j]

2i−1 < J/2, ent˜ao reamostre com reposi¸c˜ao, as part´ıculas {θj 1} com pesos {ω[1, j]} para obter uma nova popula¸c˜ao {θj1}, e fa¸ca ω[1, j] = 1/J, para todo j;

l ← l + 1;

2. Para 1 < l ≤ L, inicialize j ← 1; Enquanto (j ≤ J ) fa¸ca

• Repita os pr´oximos passos, da letra (a) at´e a (d), at´e que d(x∗, x0) ≤ l (a) Amostre θ∗ = (θ∗1, θ2∗, ..., θm∗) ∼ θl−1 com pesos associados ωl−1; (b) Amostre θ∗∗∼ θ∗+ K

l(θ|θ∗), at´e que π(θ∗∗) 6= 0;

(c) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (d) Amostre x∗ ∼ p(x|θ∗∗);

• Atribua os valores ω[l, j] ← π(θ∗∗)Zl−1(θ∗|θ∗∗)

π(θ∗)K

l(θ∗∗|θ∗) , ∀ j;

• Armazene as part´ıculas amostradas θjl ← θ∗∗; • j ← j + 1;

Normalize os pesos; SehPJ

j=1ω[l, j]

2i−1 < J/2, ent˜ao reamostre com reposi¸c˜ao, as part´ıculas {θj l} com pesos {ω[l, j]} para obter uma nova popula¸c˜ao {θjl}, e fa¸ca ω[l, j] = 1/J, para todo j;

l ← l + 1;

Volte para o passo 2. Neste algoritmo,

h PJ

j=1ω[l, j]

2i−1 serve para medir o grau de degenera¸c˜ao da amostra de cada popula¸c˜ao, l = 1, ..., L. Neste contexto, se hPJ

j=1ω[l, j]

2i−1 < J/2 ent˜ao reamostramos uma nova popula¸c˜ao a fim de favorecer part´ıculas com pesos maiores, que ser˜ao melhor representadas na popula¸c˜ao reamostrada.

(37)

A escolha dos n´ucleos de transi¸c˜ao para frente, Kl, ´e sempre considerada em algorit-mos de MCS. Entretando, segundo Moral et al. (2006), a escolha do n´ucleo de transi¸c˜ao para tr´as, Zl, pode ser feita levando em conta o n´ucleo para frente. Isto ´e, Zl pode ser otimizado, com respeito a Kl, a fim de obtermos uma melhor perfomance do algoritmo. Baseados no procedimento apresentado em Moral et al. (2006), Sisson et al. (2007a) propuseram um n´ucleo ´otimo neste contexto. Entretanto, em termos pr´aticos, o n´ucleo ´

otimo ´e muito d´ıficil de ser utilizado porque ele envolve distribui¸c˜oes marginais que n˜ao admitem express˜oes com forma anal´ıtica fechada. Assim, tamb´em ´e proposto um n´ucleo sub-´otimo, o qual pode ser manipulado com mais facilidade. A partir desta proposta, uma aproxima¸c˜ao para os pesos associados as part´ıculas das popula¸c˜oes, para l > 1, ´e dado por ωl[l, j] = π(θ∗∗) PJ i=1ω[l − 1, i]Kl(θ∗∗|θl−1i ) , j = 1, ..., J.

3.3

Estudo Simulado: Uma Aplica¸

ao em um

Mo-delo Cl´

assico de EDO

Como ilustra¸c˜ao, agora vamos aplicar os m´etodos apresentados nas se¸c˜oes anteriores num modelo determin´ıstico espec´ıfico. O modelo escolhido ´e um modelo cl´assico de presa-predador proposto em Lotka (1925); Volterra (1926), e por isto tamb´em ´e conhecido como modelo de Lotka-Volterra. Este modelo descreve a intera¸c˜ao entre presas, u, e predadores, v, com vetor de parˆametros θ = (α, β). Estas dinˆamicas s˜ao formuladas por um conjunto de duas equa¸c˜oes diferenciais ordin´arias n˜ao-lineares no tempo t, mais especificamente,

du

dt = αu − uv, (3.2)

dv

dt = βuv − v.

A seguir, descrevemos a fun¸c˜ao de verossimilhan¸ca. Em seguida, explicamos como foram gerados os dados artificiais. Depois, descrevemos as especifica¸c˜oes necess´arias para a formula¸c˜ao bayesiana do problema em quest˜ao. E, finalmente, mostramos os resultados obtidos atrav´es dos algoritmos estudados.

(38)

3.3.1

Fun¸

ao de Verossimilhan¸

ca

Assumimos que dado o vetor de parˆametros θ, a solu¸c˜ao do sistema de equa¸c˜oes di-ferenciais em (3.2), M (θ, t), no tempo t, ´e a m´edia de uma realiza¸c˜ao da distribui¸c˜ao normal com matriz de covariˆancias fixada, D. Assim, Y (t) ∼ N ormal(M (θ, t), D), para t ∈ [0, T ], tal que Y (t) ´e o vetor que cont´em o n´umero de presas e de predadores observados em t, para todo t, e, condicionado a θ, s˜ao independentes entre si, isto ´

e, D ´e uma matriz diagonal. Considerando uma amostra aleat´oria y1, ..., yT do vetor Y = (Y (1), ..., Y (T )), a fun¸c˜ao de verossimilhan¸ca para θ ´e proporcional a

p(y|θ) ∝ exp ( −1 2 T X t=1 [y(t) − M (θ, t)]0D−1[y(t) − M (θ, t)] ) ,

tal que D = diag{d1, d2}.

3.3.2

Gera¸

ao dos Dados Artificiais

A fim de obtermos um conjunto de dados simulados, fixamos θ = (α, β) = (1, 1), e assumimos que as condi¸c˜oes iniciais s˜ao dadas por u(0) = 1 e v(0) = 0.5, ent˜ao resolve-mos o sistema em (3.2) numericamente. A partir desta solu¸c˜ao, e introduzindo erros gaussianos, com d1 = d2 = (0.5)2, geramos uma observa¸c˜ao, para cada t ∈ [0, 15] num conjunto de N pontos. A partir deste procedimento, simulamos trˆes diferentes conjuntos de dados com diferentes tamanhos N=16, N=51 e N=151.

3.3.3

Formula¸

ao Bayesiana

Supomos que α e β s˜ao independentes a priori, e que α, β ∼ Uniforme(−a, a), tal que a ´e uma constante fixada. Assumimos trˆes diferentes valores para a constante a, a saber a = 2, a = 5 e a = 10. Portanto, chamaremos de priori 1 quando nos referirmos a Uniforme(−2, 2), priori 2 quando for a Uniforme(−5, 5), e, finalmente, priori 3 para a Uniforme(−10, 10). A escolha destas prioris visa fornecer alguma informa¸c˜ao sobre poss´ıveis diferen¸cas no comportamento dos m´etodos supondo distribui¸c˜oes a priori mais informativas do que outras.

(39)

Neste contexto, pelo teorema de Bayes, o n´ucleo da distribui¸c˜ao a posteriori dos parˆametros toma a seguinte forma

p(θ|y) ∝ exp ( −1 2 T X t=1 [y(t) − M (θ, t)]0D−1[y(t) − M (θ, t)] )

I(−a,a)(α)I(−a,a)(β),

onde I(−a,a)(x) ´e a fun¸c˜ao indicadora, para a = 2, a = 5 e a = 10.

3.3.4

Implementa¸

ao Computacional

Neste trabalho, utilizamos o software livre R1, tanto para rodar os algoritmos quanto para a constru¸c˜ao dos gr´aficos. Em particular, para resolver numericamente o sistema de equa¸c˜oes diferenciais utilizamos o pacote do R chamado ODESOLVE. Mais especificamente, utilizamos a fun¸c˜ao lsoda. Esta fun¸c˜ao adequa o melhor m´etodo para cada caso. Em alguns casos, ela utiliza o m´etodo de Adams, mais especificamente, uma vers˜ao um pouco mais elaborada do que a apresentada neste texto. A fim de obtermos uma melhor perfomance do algoritmo, podemos ajustar dois parˆametros de entrada desta fun¸c˜ao, chamados rtol e atol. A partir destas entradas, podemos controlar a precis˜ao da solu¸c˜ao requerida. Neste trabalho, ajustamos estes valores atrav´es de tentativas, balanceando o tempo gasto para retornar uma solu¸c˜ao e a capacidade de precis˜ao do m´etodo para o sistema determin´ıstico.

3.3.5

Resultados

Utilizamos os m´etodos de MCMC e cada uma das abordagens do MCS discutidas na se¸c˜ao 3.2, para obter amostras da distribui¸c˜ao a posteriori do vetor de parˆametros θ. Para ambos os algoritmos, precisamos sintonizar alguns parˆametros. No MCMC, como usamos um passo de Metropolis-Hastings, temos que escolher a distribui¸c˜ao proposta e sintonizar sua variˆancia. No caso do algoritmo CBA-MCS, ´e necess´ario fixar o n´umero de popula¸c˜oes, L, os valores dos ’s, e os n´ucleos, cujas escolhas devem influenciar nossos resultados.

(40)

Especificamente, no passo de Metropolis-Hastings do algoritmo de MCMC para a amostragem de α e β conjuntamente, utilizamos um passeio aleat´orio como proposta, a distribui¸c˜ao normal centrada no valor do parˆametro da itera¸c˜ao imediatamente anterior. J´a no algoritmo CBA-MCS, supomos o n´ucleo seguindo uma distribui¸c˜ao uniforme, isto ´e, Kl(θl|θl−1) ∼ σ U (−1, 1), para l = 1, ..., L, onde σ ´e um parˆametro de escala fi-xado em 0,1. A escolha do valor de σ foi feita atrav´es de v´arias experiˆencias com valores inferiores e superiores. Al´em disto, fizemos tentativas com diferentes valores de L e dos ’s para cada conjunto de dados. Na tabela 3.1, apresentamos os valores utilizados destes parˆametros, para as trˆes diferentes amostras. Estes valores tamb´em ser˜ao utilizados nos outros algoritmos baseados no MCS. Ainda buscando melhorar a perfomance do algo-ritmo, tamb´em supomos como n´ucleo a distribui¸c˜ao normal, entretanto, o desempenho do algoritmo n˜ao foi vantajoso. Omitimos aqui os resultados atingidos atrav´es destas diversas outras tentativas.

Tabela 3.1: Parˆametros do CBA-MCS ajustados

Popula¸c˜ao Erros de tolerˆancia () L

N=16 (40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5.5) 11

N=51 (150, 140, 100, 85, 70, 60, 50, 40, 35, 30, 25) 11 N=151 (500, 450, 350, 200, 180, 160, 145, 130, 125, 120, 115, 110) 12

A fim de compararmos ambos os esquemas amostrais MCMC e CBA-MCS, apresen-tamos numa mesma figura as estimativas pontual (mediana) e intervalar (intervalo de credibilidade de 90%) obtidas atrav´es das amostras geradas pelos dois m´etodos. No caso do MCMC, para todas as amostras e distribui¸c˜oes a priori assumidas, retiramos as mil primeiras amostras (fase de aquecimento da cadeia) e tomamos de 49 em 49 a fim de obtermos mil amostras independentes.

Primeiro, para avaliar a convergˆencia das cadeias dos parˆametros via o m´etodo de MCMC, apresentamos na figura 3.1 os tra¸cos de duas cadeias inicializadas com valores distintos, supondo a priori 3, para as amostras de tamanhos N=16, N=51 e N=151. Os tra¸cos obtidos para os outros casos foram muito similares, e portanto, omitiremos as figuras no texto.

(41)

αα 0 200 400 600 800 1000 0.5 0.6 0.7 0.8 0.9 1.0 1.1 ββ 0 200 400 600 800 1000 0.8 1.0 1.2 1.4 1.6 1.8 αα 0 200 400 600 800 1000 0.80 0.85 0.90 0.95 1.00 ββ 0 200 400 600 800 1000 0.9 1.0 1.1 1.2 αα 0 200 400 600 800 1000 0.94 0.96 0.98 1.00 1.02 ββ 0 200 400 600 800 1000 0.95 1.00 1.05 1.10

Figura 3.1: Tra¸cos das cadeias dos parˆametros α e β (colunas), para as diferentes ob-serva¸c˜oes com N=16, N=51 e N=151 (linhas), e supondo a priori 3 via MCMC. A linha horizontal preta ´e o valor verdadeiro do parˆametro.

(42)

Nos pain´eis das figuras 3.2, temos a mediana e intervalos de credibilidade de 90% das distribui¸c˜oes a posteriori de α e β, supondo as trˆes diferentes distribui¸c˜oes a priori e, constru´ıdos a partir das amostras obtidas via MCMC e CBA-MCS. Ressaltamos que para avalia¸c˜ao dos m´etodos, devemos apenas comparar os resultados obtidos supondo a mesma informa¸c˜ao a priori e a partir da mesma amostra (N=16, N=51 ou N=151).

(43)

● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● ● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● ● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● ● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● ● ● ● ● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● ● ● ●

Figura 3.2: Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao a posteriori de α e β supondo a priori 1 (P1), priori 2 (P2) e priori 3 (P3), tanto via MCMC (em azul) quanto via CBA-MCS (em vermelho), com N=16, N=51 e N=151 (linhas).

(44)

Baseados nestes resultados, n˜ao notamos diferen¸cas de comportamento dos m´etodos supondo mais informa¸c˜ao a priori. Por este motivo, daqui em diante estaremos interes-sados em apenas no caso da hip´otese da priori 3, que ´e a que sup˜oe informa¸c˜ao mais vaga sobre os parˆametros de interesse.

Notamos que quando temos uma amostra com 16 pontos observados, ambos os al-goritmos de MCMC e CBA-MCS alcan¸cam a mesma distribui¸c˜ao a posteriori para α e β. Entretanto, quando temos mais pontos observados aparentemente os algoritmos n˜ao atingem a mesma distribui¸c˜ao. O MCMC alcan¸ca uma distribui¸c˜ao a posteriori mais concentrada. Aparentemente, com o aumento do tamanho da amostra esta diferen¸ca torna-se mais significante, veja os pain´eis para N=151.

Observando os intervalos de credibilidade, notamos que ambos os algoritmos s˜ao ca-pazes de recuperar os verdadeiros valores dos parˆametros. Por´em, a descri¸c˜ao da in-certeza no caso do CBA-MCS quando temos mais do que 16 pontos ´e desconfort´avel. N˜ao sabemos ao certo qual dos m´etodos est´a correto. Mas, seguindo o teorema de Bayes, esperamos que conforme o tamanho da amostra cresce (temos mais informa¸c˜ao), e a distribui¸c˜ao a priori permanece a mesma, mais concentrada a distribui¸c˜ao a posteriori deve se tornar. O algoritmo de MCMC est´a capturando esta informa¸c˜ao com mais in-tensidade, fornecendo uma distribui¸c˜ao a posteriori mais concentrada, do que o MCS apresentado. Vale ressaltar que o algoritmo de MCMC envolve a fun¸c˜ao de verossim-ilhan¸ca em sua totalidade, porque sua express˜ao aparece nas distribui¸c˜oes condicionais completas a posteriori. J´a o m´etodo de CBA-MCS, envolve uma aproxima¸c˜ao da fun¸c˜ao de verossimilhan¸ca, aparecendo no passo de simula¸c˜ao dos dados, para a determina¸c˜ao da distˆancia entre este dado e o dado observado.

Na figura 3.3 contrastamos o dado observado com os intervalos de credibilidade de 90% e a mediana da distribui¸c˜ao preditiva das popula¸c˜oes, de presas e de predadores, obtidos a partir dos valores das cadeias dos parˆametros, via MCMC e CBA-MCS. Utilizamos estes gr´aficos para discutir os ajustes dos modelos aos dados.

(45)

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Presa 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Predador 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Presa ● ● ●●● ● ● ● ● ● ●●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Predador ● ● ● ● ● ● ●● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Presa ● ● ●● ● ●●●● ● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ●● ●● ●●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ●●● ● ● ●●● ● ●● ● ● ● ● ● ● ●●● ● ● ●● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●●● ● ●● ● ● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Predador ●● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ●● ● ●●● ● ● ● ●● ● ● ● ● ● ●●● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ●●● ●● ● ● ●●● ● ● ● ● ● ● ●●● ● ● ● ●● ● ● ● ●●●● ● ● ● ● ● ● ● ● ●● ●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● 0 5 10 15 −2 −1 0 1 2 3 4

Figura 3.3: I.C. de 90% (linhas tracejadas) e a mediana (linhas cheias) da distribui¸c˜ao preditiva das popula¸c˜oes de presas e predadores, obtidos a partir dos valores das cadeias dos parˆametros via MCMC (em azul) e via CBA-MCS (em vermelho), assumindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados.

Referências

Documentos relacionados

5.2.1.  As  rubricas  de  despesa  de  transferências  correntes  ou  de  capital  e  de  subsídios  para  organismos  da  Administração  Central  devem 

Dessa forma, caso o contrato proíba uma parte de tomar determinada conduta necessária economicamente para o seu negócio, o contrato não será observado e suas

Foram desenvolvidas duas formulações, uma utilizando um adoçante natural (stévia) e outra utilizando um adoçante artificial (sucralose) e foram realizadas análises

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

O que se pôde constatar foi que, em relação às variáveis avaliadas pelo questionário, os colaboradores de vendas possuem uma avaliação das próprias emoções e

O Convênio, que certamente trará benefícios mútuos na condução das atividades de supervisão em ambos os países, propiciará, sem dúvida, um incremento na troca

1 - A instituição pode ser remunerada por serviços prestados ou possuir relações comerciais com a(s) empresa(s) analisada(s) neste relatório ou com pessoa