Estimação Bayesiana de Parâmetros que Definem Modelos Determinísticos

(1)

Estima¸

c˜

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos Determin´ısticos

por

Josiane da Silva Cordeiro

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´etodos Estat´ısticos

2009

(2)

Estima¸

c˜

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos Determin´ısticos

Josiane da Silva Cordeiro

Disserta¸cão submetida ao Corpo Docente do Instituto de Matemática - Departamento de Métodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obten¸cão do grau de Mestre em Estat´ıstica.

Aprovada por:

Profa_{. Alexandra M. Schmidt.} PhD - IM - UFRJ - Orientadora.

Prof. Cl´audio J. Struchiner

PhD - PROCC - FIOCRUZ - Co-Orientador.

Prof. H´elio S. Migon PhD - IM - UFRJ.

Prof. Dirceu Silveira Reis Jr. PhD - DEHID - FUNCEME.

(3)

FICHA CATALOGR ´AFICA

Cordeiro, Josiane da Silva.

Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Modelos Determin´ısticos / Josiane da Silva Cordeiro.

Rio de Janeiro: UFRJ, IM, DME, 2009.

Disserta¸c˜ao - Universidade Federal do Rio de Janeiro, IM, DME. 1. Introdu¸c˜ao. 2. Modelos Determin´ısticos.

3. Estima¸cão Bayesiana de Parâmetros envolvidos em Modelos Determin´ısticos. 4. Estima¸cão Bayesiana de Parâmetros envolvidos em Equa¸cões a Diferen¸cas Finitas: Uma Aplica¸cão à Modelagem de Chuva-Vazão.

5. Conclus˜oes e Trabalhos Futuros.

(Mestrado-UFRJ/IM/DME) I. Schmidt, Alexandra II. Universidade Federal do Rio de Janeiro III. T´ıtulo.

(4)

(5)

Agradecimentos

A Deus, pelo seu grande amor. Em particular, este amor tem sido revelado através do seu cuidado, das oportunidades surgidas e a clareza necessária para enxergá-las e, principalmente, o fortalecimento para prosseguir. Agrade¸co a Deus também, por cada pessoa que faz parte da minha vida.

`

A minha fam´ılia pelo amor. Aos meu pais, Josias e Maria, pelo cuidado e carinho demonstrados de forma muito peculiar, segundo o jeito de ser de cada um. Ao meu irmão Welington, pela paciência e por me dar a certeza de que fiz a escolha certa quanto ao meu curso de mestrado. E ao meu irmão Welton, também pela paciência e pelos vários momentos descontra´ıdos.

Ao Felipe, pelo amor e apoio. E tamb´em, por ter contribu´ıdo para que meu ano de disserta¸c˜ao fosse um ano mais feliz.

`

As minhas av´os (in memorian), pelo amor que, enquanto poss´ıvel, foi dado a mim. Aos meus tios, tias, primos e primas que de diversas maneiras me amaram e incentivaram ao longo da minha vida.

Aos meus amigos, aos atualmente presentes e aos ausentes fisicamente, mas que de maneiras distintas me apoiaram muito.

Aos meus companheiros e amigos do DME, que compartilharam comigo momentos de angústia, de satisfa¸cão e de alegria, nestes dois anos de intensa convivência. E, é claro, obrigada pelos grandes momentos no laboratório casamenteiro, o LPGE. Em especial, a minha turma Denise, Mariana, N´ıcia, Patr´ıcia, Vera e Alexandre, e a Valmária, João, Targino e Vin´ıcius.

`

(6)

era aluna da UFRJ. Agrade¸co pela dedica¸c˜ao como orientadora e, pelo compartilhamento de conhecimento e experiˆencias cient´ıficas.

Ao meu atual co-orientador Cláudio Struchiner, pela orienta¸cão acadêmica dada, desde o ensino médio, com liberaridade e, também pela transmissão de um pouco, que foi muito para mim, do seu conhecimento cient´ıfico.

Aos meus professores do DME-IM/UFRJ e do DEMAT/UFRuralRJ que, em diferen-tes etapas, foram essenciais para meu crescimento atrav´es do conhecimento passado e da constante motiva¸c˜ao.

Ao H´elio Migon e ao Dirceu Reis pela cordialidade e colabora¸c˜ao cient´ıfica.

A todos os vinculados a UFRJ, pela colabora¸c˜ao para promover um ambiente de estudo de qualidade.

A todos os profissionais do PROCC/FIOCRUZ, pelo ambiente agrad´avel e pela disponi-bilidade em diversos momentos.

`

A FUNCEME pela concess˜ao dos dados utilizados nesta disserta¸c˜ao. `

A CAPES e `a FAPERJ, pela bolsa especial, que possibilitaram o prosseguimento dos meus estudos com mais entusiasmo.

(7)

Resumo

Neste trabalho, temos interesse em investigar procedimentos de inferência bayesiana de parâmetros originalmente envolvidos em modelos determin´ısticos que descrevem proble-mas reais. A fim de acoplar incerteza ao estudo determin´ıstico, assumimos que a solu¸cão determin´ıstica é a média de uma realiza¸cão da distribui¸cão normal. Desta forma, es-pecificamos a fun¸cão de verossimilhan¸ca e, sob o paradigma bayesiano, atribu´ımos uma distribui¸cão a priori para os parâmetros, assim obtendo a distribui¸cão a posteriori. De-vido à complexidade destes modelos, surge a necessidade de métodos computacionais para obtermos amostras desta distribui¸cão. Neste contexto, escolhemos algoritmos baseados em dois métodos espec´ıficos, a saber, o Monte Carlo via cadeias de Markov e o Monte Carlo sequencial. Particularmente, objetivamos comparar estes métodos para a estima¸cão dos parâmetros relacionados a um modelo determin´ıstico que descreve intera¸cões entre espécies de presas e de predadores. Os resultados atingidos via todos os algoritmos uti-lizados mostraram que tais procedimentos são razoáveis neste contexto de estima¸cão, embora a descri¸cão da incerteza, associada à distribui¸cão a posteriori dos parâmetros, reportada por ambos os métodos tenham sido distintas. Outro interesse espec´ıfico neste trabalho, assumindo um modelo determin´ıstico da vazão de uma bacia hidrográfica, é ajustar o modelo estat´ıstico proposto a conjuntos de dados de três bacias do estado do Ceará, cedidos pela FUNCEME. Neste caso, obtivemos um ajuste razoável do modelo aos diferentes conjuntos de dados atingindo distribui¸cões a posteriori informativas para os parâmetros de interesse.

Palavras Chaves: Modelos Determin´ısticos, Estima¸c˜ao Bayesiana, Monte Carlo via cadeias de Markov, Monte Carlo sequencial.

(8)

Abstract

In this work, we are interested in investigating Bayesian inference procedures of parame-ters related to deterministic models which describe real problems. In order to account for uncertainty estimation into the deterministic study, we assume the deterministic solution as the mean of a normal distribution. In this way, we specify the likelihood function and, under the Bayesian paradigm, we assign a prior distribution to the parameters, hence obtaining a posterior distribution. Due to the complexity of these models, it emerges the need of computational methods to obtain samples of the resultant posterior distribu-tion. In this context, we choose algorithms based on two specific methods, Markov chain Monte Carlo and sequential Monte Carlo algorithms. Particularly, we aim to compare these methods to estimate parameters involved in a deterministic model that describes interactions between prey species and predator species. The achieved results through all the algorithms showed that these procedures are reasonable in this context of estimation, although the description of uncertainty, associated with the posterior distribution of the parameters, reported by both methods have been distinct. Another specific aim of this work is to model the runoff of a hydrographic basin through a deterministic model. The proposed statistical model is fitted to datasets from three basins in the State of Cear´a, made available by FUNCEME. In this case, we obtained a reasonable fit of the model to the different datasets reaching informative posterior distributions to the parameters of interest.

Key Words: Deterministic Models, Bayesian Estimation, Markov Chain Monte Carlo, Sequential Monte Carlo.

(9)

Sum´

ario

1 Introdu¸c˜ao 1

2 Modelos Determin´ısticos 4

2.1 Equa¸c˜oes a Diferen¸cas Finitas . . . 4

2.2 Equa¸c˜oes Diferenciais Ordin´arias . . . 5

2.3 Métodos Numéricos de Aproxima¸cão de Solu¸cão de EDO . . . 7

2.3.1 M´etodo de Euler . . . 8

2.3.2 M´etodo de Runge-Kutta . . . 9

2.3.3 M´etodos de Passos M´ultiplos . . . 9

2.3.4 M´etodo da Coloca¸c˜ao . . . 10

2.4 Calibra¸cão e Estima¸cão de Parâmetros no contexto de Modelos Deter-min´ısticos . . . 11

3 Estima¸c˜ao Bayesiana de Parˆametros envolvidos em Modelos Deter-min´ısticos 13 3.1 MCMC . . . 15

3.2 MCS . . . 17

3.2.1 CBA-MCS . . . 18

3.2.2 CBA-CRP . . . 20

3.3 Estudo Simulado: Uma Aplica¸c˜ao em um Modelo Cl´assico de EDO . . . 22

3.3.1 Fun¸c˜ao de Verossimilhan¸ca . . . 23

3.3.2 Gera¸c˜ao dos Dados Artificiais . . . 23

(10)

3.3.4 Implementa¸c˜ao Computacional . . . 24

3.3.5 Resultados . . . 24

4 Estima¸cão Bayesiana de Parâmetros envolvidos em Equa¸cões a Diferen¸cas Finitas: Uma Aplica¸cão à Modelagem de Chuva-Vazão 40 4.1 Modelo SMAP . . . 40

4.1.1 Fun¸c˜ao de Verossimilhan¸ca . . . 43

4.1.2 Formula¸c˜ao Bayesiana . . . 44

4.2 Estudo Simulado . . . 46

4.2.1 Gera¸c˜ao dos Dados Artificiais . . . 46

4.2.2 Resultados atrav´es do MCMC . . . 46

4.3 Dados Reais . . . 54

4.3.1 Bacia 35875000 . . . 54

4.3.2 Bacia 35880000 . . . 59

4.3.3 Bacia 35210000 . . . 63

(11)

Lista de Tabelas

3.1 Parˆametros do CBA-MCS ajustados . . . 25 4.1 SMAP/Bacia 35875000 - Estimativas pontual (mediana a posteriori) e

intervalar (intervalo de credibilidade de 90%) para cada parˆametro . . . . 57 4.2 SMAP/Bacia 35880000 - Estimativas pontual (mediana a posteriori) e

intervalar (intervalo de credibilidade de 90%) para cada parˆametro . . . . 61 4.3 SMAP/Bacia 36520000 - Estimativas pontual (mediana a posteriori) e

(12)

Lista de Figuras

3.1 Tra¸cos das cadeias dos parâmetros α e β (colunas), para as diferentes observa¸cões com N=16, N=51 e N=151 (linhas), e supondo a priori 3 via MCMC. A linha horizontal preta é o valor verdadeiro do parâmetro. . . . 26 3.2 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸cão

a posteriori de α e β supondo a priori 1 (P1), priori 2 (P2) e priori 3 (P3), tanto via MCMC (em azul) quanto via CBA-MCS (em vermelho), com N=16, N=51 e N=151 (linhas). . . 28 3.3 I.C. de 90% (linhas tracejadas) e a mediana (linhas cheias) da distribui¸c˜ao

preditiva das popula¸cões de presas e predadores, obtidos a partir dos valo-res das cadeias dos parâmetros via MCMC (em azul) e via CBA-MCS (em vermelho), assumindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados. . . 30 3.4 Gráficos de Dispersão entre α e β, no caso da priori 3, via MCMC (primeira

coluna) e CBA-MCS (segunda coluna), e para os diferentes conjuntos de dados gerados N=16, N=51 e N=151 (linhas 1, 2 e 3, respectivamente). . 32 3.5 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao

a posteriori de α e de β via CBA-MCS (em azul) e CBA-MCS com B = 10 (em vermelho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 33

(13)

3.6 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸cão preditiva das popula¸cões de presas e de predadores, obtidos a partir dos valores das cadeias dos parâmetros via CBA-MCS, com B = 10, assu-mindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados. . . 34 3.7 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸cão

a posteriori de α e de β via CBA-MCS (em azul) e CBA-CRP (em ver-melho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 35 3.8 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸c˜ao

preditiva das popula¸cões de presas e de predadores, obtidos a partir dos valores das cadeias dos parâmetros via CBA-CRP assumindo a priori 3. Os c´ırculos representam os dados observados com N=16, N=51 e N=151 (linhas). . . 36 3.9 Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸cão

a posteriori de α e de β via CBA-MCS (em azul) e CBA-CRP com o núcleo de transi¸cão para trás sub-ótimo (em vermelho), a partir das amostras de tamanhos N=16 (N16), N=51 (N51) e N=151 (N151). . . 37 3.10 I.C. de 90% (linha tracejada) e a mediana (linha cheia) da distribui¸cão

preditiva das popula¸cões de presas e de predadores, obtidos a partir dos va-lores das cadeias dos parâmetros via CBA-CRP, com o núcleo de transi¸cão para trás sub-ótimo, assumindo a priori 3. Os c´ırculos representam os da-dos observada-dos com N=16, N=51 e N=151 (linhas). . . 38 4.1 Diagrama do modelo SMAP . . . 41 4.2 SMAP/Dados Artificiais - Tra¸cos das cadeias dos parâmetros (via

for-mula¸cão 1). A linha horizontal preta é o valor verdadeiro do parâmetro. . 47 4.3 SMAP/Dados Artificiais - Tra¸cos das cadeias dos parâmetros (via

(14)

4.4 SMAP/Dados Artificiais - Histogramas dos parâmetros (via formula¸cão 1). A linha vertical vermelha é o valor verdadeiro do parâmetro. . . 49 4.5 SMAP/Dados Artificiais - Histogramas dos parâmetros (via formula¸cão

2). A linha vertical vermelha ´e o valor verdadeiro do parˆametro. . . 50 4.6 SMAP/Dados Artificiais - I.C. de 90% (linha tracejada) e a mediana (linha

cheia em azul) da distribui¸cão preditiva da vazão obtidos a partir dos valores das cadeias dos parâmetros via MCMC e assumindo a formula¸cão 1. Os c´ırculos representam os dados observados. . . 52 4.7 SMAP/Dados Artificiais - I.C. de 90% (linha tracejada) e a mediana (linha

cheia em azul) da distribui¸cão preditiva da vazão obtidos a partir dos valores das cadeias dos parâmetros via MCMC e assumindo a formula¸cão 2. Os c´ırculos representam os dados observados. . . 53 4.8 SMAP/Bacia 35875000 - Tra¸cos das cadeias dos parâmetros. . . 55 4.9 SMAP/Bacia 35875000 - Histogramas dos parâmetros. . . 56 4.10 SMAP/Bacia 35875000 - Mediana (linha tracejada preta) da distribui¸cão

preditiva da vazão obtidos a partir dos valores das cadeias dos parâmetros via MCMC e os dados observados da bacia (linha cheia azul). . . 58 4.11 SMAP/Bacia 35875000 - Quantis de 25% e de 75% da distribui¸cão

predi-tiva da vazão a partir das cadeias dos parâmetros, e os dados observados da bacia (linha cheia azul). . . 59 4.12 SMAP/Bacia 35880000 - Histogramas dos parâmetros. . . 60 4.13 SMAP/Bacia 35880000 - Mediana (linha tracejada preta) da distribui¸cão

preditiva da vazão obtidos a partir dos valores das cadeias dos parâmetros via MCMC e os dados observados da bacia (linha cheia azul). . . 62 4.14 SMAP/Bacia 35880000 - Quantis de 25% e de 75% da distribui¸cão

predi-tiva da vazão a partir das cadeias dos parâmetros, e os dados observados da bacia (linha cheia azul). . . 63 4.15 SMAP/Bacia 35210000 - Histogramas dos parâmetros. . . 64

(15)

4.16 SMAP/Bacia 35210000 - Mediana (linha tracejada preta) da distribui¸cão preditiva da vazão obtidos a partir dos valores das cadeias dos parâmetros via MCMC e os dados observados da bacia (linha cheia azul). . . 66 4.17 SMAP/Bacia 35210000 - Quantis de 25% e de 75% da distribui¸cão

predi-tiva da vaz˜ao a partir das cadeias dos parˆametros, e os dados observados da bacia (linha cheia azul). . . 67

(16)

Cap´ıtulo 1

Introdu¸

c˜

ao

Modelos matemáticos determin´ısticos são um conjunto de equa¸cões ou inequa¸cões matemáticas, organizadas de forma que, conhecidas algumas condi¸cões deste sistema, ´

e poss´ıvel obter sua solu¸cão em um dado momento. Estes modelos são utilizados em diversas áreas de pesquisas cient´ıficas, tais como biologia, qu´ımica e f´ısica. Equa¸cões do tipo diferenciais (ordinárias, parciais ou com retardo), integro-diferenciais, e a diferen¸cas finitas, têm sido amplamente utilizadas nestes contextos.

Em modelagem matemática, podemos também estar interessados na calibra¸cão dos parâmetros que definem o modelo determin´ıstico adotado. A calibra¸cão dos parâmetros de um modelo determin´ıstico consiste em buscar um conjunto de valores para estes parâmetros até que se alcance uma melhor representa¸cão do problema de estudo. Desta forma, ajustamos o modelo determin´ıstico aos dados em rela¸cão aos parâmetros que o definem.

O crescente uso da modelagem determin´ıstica e o aumento da complexidade dos modelos, para descrever problemas de diversas áreas, vêm acentuando a necessidade de métodos de calibra¸cão mais robustos neste contexto. Particularmente, no caso de parâmetros que definem equa¸cões diferenciais ordinárias não-lineares, a calibra¸cão pode ser feita linearizando-se estas estruturas. Neste contexto, o método dos m´ınimos quadra-dos não-lineares têm sido amplamente aplicado.

Por outro lado, diversos procedimentos estat´ısticos mais elaborados, clássicos e baye-sianos, para estimar parâmetros envolvidos em modelos determin´ısticos têm sido

(17)

propos-tos na literatura. Veja, por exemplo, Poole e Raftery (2000); Cancr´e et al. (2000); Huang et al. (2006); Ramsay et al. (2007); Campbell (2007); Toni et al. (2008).

Neste trabalho, temos interesse em revisar e investigar métodos de estima¸cão bayesiana em modelos originalmente expressos de forma determin´ıstica. Neste contexto, adicionamos incerteza ao estudo determin´ıstico. Desta forma, assumimos que a solu¸cão determin´ıstica entra como, por exemplo, a média de uma realiza¸cão de uma distribui¸cão de probabili-dade bem definida. Além disto, seguindo o paradigma de Bayes, obtemos como resultado da análise uma distribui¸cão de probabilidade a posteriori para os parâmetros de interesse. Dessa forma a incerteza inerente ao procedimento de estima¸cão e a informa¸cão observada ´

e naturalmente descrita.

Em diversos casos, devido a complexidade dos modelos, a distribui¸cão a posteriori resultante não tem forma anal´ıtica fechada. Portanto, surge a necessidade de métodos eficazes para a gera¸cão de amostras desta distribui¸cão. Em particular, selecionamos métodos de amostragem baseados em Monte Carlo via cadeias de Markov e em Monte Carlo sequencial, sob a perspectiva da estat´ıstica bayesiana. Nosso objetivo espec´ıfico é comparar a eficiência destes dois métodos em diversos cenários. A seguir, descrevemos a organiza¸cão deste texto.

No cap´ıtulo 2, fazemos uma revisão de literatura sobre modelos determin´ısticos. Em particular, apresentamos conceitos e resultados matemáticos relacionados as duas classes de modelos determin´ısticos estudados aqui, equa¸cões a diferen¸cas finitas e equa¸cões di-ferenciais ordinárias. Além disto, discutimos alguns dos métodos mais conhecidos para aproximar solu¸cões de equa¸cões diferenciais ordinárias. Finalmente, na se¸cão 2.4, fornece-mos uma visão geral sobre os métodos de calibra¸cão de parâmetros pertencentes a modelos determin´ısticos, propostos na literatura.

No cap´ıtulo 3 concentra-se o foco deste trabalho, que são os métodos computacionais bayesianos para estimar parâmetros envolvidos em modelos determin´ısticos. Primeiro, discutimos brevemente o que tem sido proposto na literatura. Em seguida, nas se¸cões 3.1 e 3.2, apresentamos os métodos bayesianos de amostragem que temos interesse em investigar, inclusive descrevemos os algoritmos para implementá-los. Mais especifica-mente, elegemos os métodos de Monte Carlo via cadeias de Markov e o de Monte Carlo

(18)

sequencial, adaptados ao contexto do nosso estudo. Na se¸cão 3.3, utilizamos os métodos discutidos num estudo simulado. Escolhemos um modelo especificado por um sistema de duas equa¸cões diferenciais ordinárias não-lineares, que visa descrever dinâmicas popula-cionais entre uma espécie de presas e seus predadores.

Já no cap´ıtulo 4, aplicamos a metodologia estudada, através de um dos métodos de estima¸cão de interesse, a um modelo hidrológico descrito por um sistema de equa¸cões a diferen¸cas finitas no tempo, proposto por Lopes et al. (1981). Este modelo tem sido amplamente utilizado por especialistas em hidrologia, e é conhecido como Soil Moisture Accounting Procedure (SMAP). Ajustamos o modelo estat´ıstico proposto a um conjunto de dados artificialmente gerados. Além disto, três conjuntos de dados coletados no es-tado do Ceará, cedidos pelo grupo de pesquisa da Funda¸cão Cearense de Meteorologia e Recursos H´ıdricos (FUNCEME), também foram ajustados. Estes conjuntos de dados diferem principalmente em rela¸cão à quantidade de observa¸cões que compõem suas séries temporais.

Finalmente, no cap´ıtulo 5, conclu´ımos nosso estudo apresentando uma discussão sobre os métodos e resultados obtidos. Além disto, indicamos poss´ıveis extensões deste tra-balho, apontando tópicos de nosso interesse de prosseguimento nesta linha de pesquisa.

(19)

Cap´ıtulo 2

Modelos Determin´ısticos

Modelos matemáticos determin´ısticos são um conjunto de equa¸cões ou inequa¸cões matemáticas, organizadas de forma que, conhecidas algumas condi¸cões deste sistema, ´

e poss´ıvel obter sua solu¸cão em um momento desejado. Portanto, dadas as mesmas condi¸cões do sistema, a solu¸cão é sempre igual.

Mais especificamente, aqui definimos um modelo determin´ıstico M como uma fun¸c˜ao que, para cada t em [0, T ], relaciona um conjunto de parˆ_{ametros θ ∈ Θ ⊂ R}m a um conjunto de vari´_{aveis de sa´ıda M (θ, t) ∈ R}p_{, dada as condi¸c˜}_{oes de entrada deste sistema.} Desta forma, modelos determin´ısticos n˜ao levam em conta nenhuma aleatoriedade. Isto ´

e, dado um conjunto de entradas do modelo, sua sa´ıda é unicamente determinada. Em particular, são modelos determin´ısticos sistemas de equa¸cões a diferen¸cas fini-tas (discreto) e sistemas de equa¸cões diferenciais ordinárias (EDO’s) (cont´ınuo), os quais temos interesse neste trabalho. Exemplos de condi¸cões de entrada, que não são parâmetros do modelo, são as condi¸cões iniciais do sistema, M (θ, 0), no caso de EDO’s. Estas condi¸cões são necessárias para obtermos uma solu¸cão única.

2.1 Equa¸

c˜

oes a Diferen¸

cas Finitas

Bassanezi (2002) sugere que o uso de equa¸cões a diferen¸cas finitas em modelagem é apropriado quando, por exemplo, o crescimento populacional, entre gera¸cões sucessivas, ocorre em etapas discretas e sem sobreposi¸cão de gera¸cões da espécie analisada. Várias

(20)

aplica¸cões desta classe de equa¸cões são apresentadas em Bassanezi (2002), assim como um estudo introdutório desta teoria é visto em Lima (2006). Segue abaixo a defini¸cão matemática destas equa¸cões.

Defini¸c˜ao 2.1.1 Uma equa¸c˜ao a diferen¸cas de 1a _{ordem ´}_{e uma equa¸}_c˜_{ao da forma}

xt+1= f (xt), (2.1)

onde f ´e uma fun¸c˜ao determinada e t ∈ {0, 1, ..., N, ...}.

A solu¸cão da equa¸cão a diferen¸cas finitas em (2.1) é uma sequência, cujos termos satisfazem a rela¸cão definida por f , da forma (x0, x1, ..., xN, ...). Além disto, segundo Lima (2006), supondo conhecido o ponto inicial x0, ou primeiro termo da sequência, então a equa¸cão em (2.1) possui uma única solu¸cão.

2.2 Equa¸

c˜

oes Diferenciais Ordin´

arias

A vasta aplicabilidade dos conceitos do cálculo diferencial para resolver problemas práticos tem movido vários pesquisadores, desde o final do século XVII quando I. Newton e G. W. Leibnitz, motivados por problemas f´ısicos e geométricos, o desenvolveram. A seguir, apresentamos alguns conceitos indispensáveis para uma melhor compreensão desta classe de equa¸cões, inclusive sua defini¸cão.

Defini¸c˜ao 2.2.1 Seja f uma fun¸c˜ao definida num aberto Ω que associa cada par (t, x) ∈ Ω ⊂ (R × Rn_{) a um ponto pertencente ao R}n _com

dx

dt = f (t, x), (2.2)

então, dizemos que (2.2) é uma equa¸cão diferencial ordin´_{aria em R}n _{definida por f .} Uma solu¸cão da EDO em (2.2) é uma fun¸cão deriv´_{avel φ : I → R}n _{com (t, φ(t)) ∈ Ω,} para todo t ∈ I ⊂ R, I intervalo. Além disto, supondo conhecido um ponto da solu¸cão, digamos x(t0) = x0, temos um problema de valor inicial (PVI), também chamado de problema de Cauchy.

(21)

A fim de garantir a existência de solu¸c˜_{oes de EDO’s definidas no R}n, basta que a fun¸cão f seja cont´ınua. Entretanto, para garantir unicidade de solu¸cão de um PVI é preciso assumir outras hipóteses além da continuidade da fun¸cão f . O teorema abaixo trata deste problema, e sua demonstra¸cão pode ser apreciada em Doering e Lopes (2007). Teorema 2.1 (Teorema de Existência e Unicidade de Solu¸c˜_{ao) Seja f : Ω → R}n uma fun¸c˜_{ao cont´ınua definida num aberto Ω ⊂ R}n+1_{. Suponhamos que a derivada parcial} espacial, ∂f

∂x, seja também cont´ınua neste aberto. Então, para cada (t0, x0) ∈ Ω existem um intervalo aberto I contendo t0 e uma única fun¸cão diferenciável φ : I → Rn com (t, φ(t)) ∈ Ω, para todo t ∈ I, que é solu¸cão do problema de valor inicial

dx

dt = f (t, x), x(t0) = x0.

Se escrevermos x(t) = (x1(t), ..., xn(t)), e f (t, x) = (f1(t, x), ..., fn(t, x)), ent˜ao pode-mos interpretar a equa¸c˜ao diferencial vetorial dx

dt = f (t, x) ∈ R

n _{como um sistema de} equa¸c˜oes diferenciais escalares da forma

dx1 dt = f1(t, x1(t), ..., xn(t)), dx2 dt = f2(t, x1(t), ..., xn(t)), .. . dxn dt = fn(t, x1(t), ..., xn(t)).

Uma solu¸cão deste sistema é dada por um conjunto de fun¸cões deriváveis φl: I → R, l = 1, ..., n, tais que, para cada t ∈ I

dφl

dt = fl(t, φ1(t), ..., φn(t)).

Equivalentemente, o vetor φ = (φ1, φ2, ..., φn) representa a solu¸c˜ao da equa¸c˜ao vetorial dx

dt = f (t, x) ∈ R

n_. _{Desta forma, o teorema de existˆ}_{encia e unicidade de solu¸c˜}_oes apresentado acima para uma equa¸cão diferencial ordinária vetorial com condi¸cão inicial conhecida, também garante a existência e unicidade de solu¸cão para um sistema de equa¸c˜_{oes diferenciais escalares em R dada sua condi¸cão inicial. Neste caso, uma condi¸cão} inicial é dada por x1(t0) = x01, ..., xn(t0) = x0n.

(22)

2.3 M´

etodos Num´

ericos de Aproxima¸

c˜

ao de Solu¸

c˜

ao

de EDO

No in´ıcio do desenvolvimento das equa¸cões diferenciais, a principal preocupa¸cão dos pesquisadores era a obten¸cão da solu¸cão destas equa¸cões de forma expl´ıcita. Entretanto, logo se verificou que a quantidade de equa¸cões que podiam ser resolvidas analiticamente era muito pequena. Segundo Figueiredo e Neves (2005), com a rigorosidade da análise matemática, surgida mais formalmente no século XIX, passou-se a se considerar primeiro a existência e unicidade de solu¸cões. Além disto, vários estudos vêm sendo realizados ao longo dos anos, em favor de métodos para solu¸cão destas equa¸cões. Quando a equa¸cão ´

e linear, a solu¸cão torna-se mais simples, podendo ser resolvida analiticamente. Por outro lado, quando a equa¸cão apresenta algum termo não-linear, em geral, não con-seguimos resolvê-la exatamente. Neste contexto, métodos numéricos de aproxima¸cão de solu¸cões surgem como ferramentas poderosas, principalmente com o advento e grande progresso da capacidade computacional. No caso de EDO’s, dada sua condi¸cão inicial, alguns dos métodos mais conhecidos são o método de Euler (e alguns aprimoramentos deste método), o método de Runge-Kutta, o método da coloca¸cão e métodos de passos múltiplos. Estes métodos são descritos, por exemplo, em Boyce e DiPrima (2001) e Bur-den e Faires (1993). Vários softwares matemáticos possuem pacotes com alguns destes métodos implementados, que são de fácil manipula¸cão.

A fim de fazermos uma breve introdu¸cão dos métodos numéricos citados, vamos con-siderar o caso mais simples. Seja uma equa¸cão diferencial ordinária não-linear da forma

dx

dt = f (t, x),

tais que (t, x) ∈ (R × R) e com condi¸c˜ao inicial x(t0) = x0.

Além disto, vamos supor que f e a derivada parcial com rela¸cão à segunda variável, ∂f

∂x, sejam cont´ınuas. Da´ı, pelo teorema 2.1, existe uma ´unica solu¸c˜ao do problema dado num intervalo aberto I, contendo t0.

O primeiro passo para utilizarmos um m´etodo num´erico consiste em definir N subin-tervalos do intervalo I. Denotaremos estes N subinsubin-tervalos por [tn−1, tn], n = 1, ..., N . O

(23)

próximo passo é aproximar a solu¸cão dentro de cada um destes subintervalos.

2.3.1 M´

etodo de Euler

Embora o método de Euler seja raramente utilizado em aplica¸cões reais, sua im-portância teórica para o entendimento de vários outros métodos mais robustos justifica sua apresenta¸cão. Este é um método iterativo, no qual devemos calcular recursivamente a seguinte equa¸cão

xn = xn−1+ hf (tn−1, xn−1), n = 1, ..., N, tal que h ´e o tamanho dos subintervalos [tn−1, tn], n = 1, ..., N .

Este é o método de Euler mais simples, pois consideramos aqui o tamanho dos inter-valos igual para todos. Desta forma, obtemos uma sequência de pares (t0, x0), ..., (tN, xN) que aproximam a solu¸cão alvo no intervalo I = [t0, tN].

Embora a utiliza¸cão de métodos numéricos seja extremamente útil, esta solu¸cão obtida sofre algumas penaliza¸cões devido a erros de aproxima¸cão. Os principais erros de aproxi-ma¸cão nestes casos são os erros de truncamento e de arredondamento. Basicamente, o erro de arredondamento está relacionado à limita¸cão computacional no sentido de que os cálculos são restritos a um número finito de d´ıgitos. Já o erro de truncamento origina-se do fato de que em cada passo somente utilizamos uma fórmula aproximada para obter cada xn, e, além disto, supondo este valor correto, o utilizamos para obter o próximo termo da sequência. Em particular, chamamos de erro de truncamento local o erro efetuado em cada passo. Para uma vasta classe de métodos numéricos é poss´ıvel obter estimativas destes erros.

O método de Euler pode também ser visto como um caso particular dos métodos de série de Taylor, com a presen¸ca apenas do termo de primeira ordem (primeira derivada). Na prática, estes métodos com ordens superiores são dificilmente empregados pois re-querem as avalia¸cões de derivadas também de ordens superiores, que nem sempre existem, ou ainda, tornam a implementa¸cão mais complexa.

(24)

2.3.2 M´

etodo de Runge-Kutta

O método de Runge-Kutta também pode ser considerado uma generaliza¸cão do método de Euler. Neste método, podemos variar o tamanho dos subintervalos tomados para a aproxima¸cão. Dentre as várias formas deste método, o mais amplamente utilizado é o método de Runge-Kutta de quarta ordem, e sua fórmula de recorrência é dada por

xn= xn−1+ h k_n−1,1+ 2kn−1,2+ 2kn−1,3+ kn−1,4 6 , n = 1, ..., N, tais que kn−1,1 = f (tn−1, xn−1), kn−1,2 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,1), kn−1,3 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,2), kn−1,4 = f (tn−1+ 1 2h, xn−1+ 1 2hkn−1,3), para n = 1, ..., N .

O termo que acompanha h pode ser interpretado como uma média ponderada de valores de f (t, x) em diferentes pontos do intervalo [tn−1, tn], ou ainda como um coefi-ciente angular médio. A ampla utiliza¸cão deste método pode ser explicada devido a ser um método razoavelmente simples de ser manipulado e que retorna uma aproxima¸cão satisfatória em muitos casos.

2.3.3 M´

etodos de Passos M´

ultiplos

Métodos que utilizam informa¸cão de mais de um passo anterior são chamados de métodos de passos múltiplos. Deste modo, os métodos anteriores não fazem parte desta classe de métodos. Entretanto, existem vários métodos que apresentam esta carac-ter´ıstica. Como ilustra¸cão, vejamos um destes métodos, conhecido como método de Adams. A idéia básica deste método é aproximar f (t, x) por um polinômio Pk(t) de grau k − 1, e usar este polinômio para calcular a integral

Z tn+1

tn

(25)

Assim, obtemos a f´ormula recursiva xn+1= xn+

Z tn+1

tn

f (t, x) dt. (2.3)

Os coeficientes de Pk(t) são determinados usando-se os k dados calculados anteri-ormente. O caso mais simples é aproximar a integral por um polinômio de grau 1, P2(t) = at+b. Para especificarmos os coeficientes a e b precisamos de apenas dois pontos, digamos (tn−1, yn−1) e (tn, yn). Considerando que estes pontos satisfazem o polinômio, basta então resolvermos o sistema

f (tn−1, yn−1) = atn−1+ b, f (tn, yn) = atn+ b.

Para um tamanho igual a h para todos subintervalos, obtemos a = f (tn, yn) − f (tn−1, yn−1)

h ,

b = f (tn−1, yn−1)tn− f (tn, yn)tn−1

h .

Portanto, substituindo o polinômio P2(t) na equa¸cão (2.3), e fazendo algumas simpli-fica¸cões, temos a seguinte fórmula de recorrência

xn+1 = xn+ 3

2hf (tn, yn) − 1

2hf (tn−1, yn−1).

Aproxima¸cões mais precisas podem ser obtidas a partir de uma aproxima¸cão por um polinômio com grau maior. Entretanto, conforme aumentamos o grau do polinômio também é requerido um número maior de pontos.

2.3.4 M´

etodo da Coloca¸

c˜

ao

Dentre os métodos de aproxima¸cão conhecidos, existe o método da coloca¸cão, também chamado de método de expansão por fun¸cões base. Este método consiste em aproximar cada xn, n = 1, ..., N , por ˆxn em termos de uma combina¸cão linear de fun¸cões base da forma ˆ xn(t) = Kn X k=1 cn,kφn,k(t) = c0nφn(t),

(26)

tal que φn, n = 1, ..., N , representam as fun¸cões bases escolhidas (geralmente polinomiais ou splines), e Kné o número destas fun¸cões que compõem a combina¸cão linear, que deve ser escolhido de forma a garantir flexibilidade suficiente para capturar a varia¸cão de xn e sua derivada.

2.4 Calibra¸

c˜

ao e Estima¸

c˜

ao de Parˆ

ametros no

con-texto de Modelos Determin´ısticos

Nas se¸cões anteriores estivemos focados na teoria matemática básica de modelos de-termin´ısticos, embora não tenhamos introduzido conceitos de estudos qualitativos que também são de grande interesse matemático. Estes conceitos, assim como um aprofun-damento de toda teoria apresentada podem ser vistos, por exemplo, em Boyce e DiPrima (2001); Doering e Lopes (2007); Figueiredo e Neves (2005). De forma geral, o interesse matemático está relacionado com as fun¸cões incógnitas, inclusive com seus comportamen-tos a partir de mudan¸cas nas entradas do modelo. Entretanto, na área da modelagem matemática, o interesse básico está em ser capaz de especificar o melhor conjunto de equa¸cões que represente algebricamente o fenômeno estudado. Neste contexto, um dos passos principais é chamado de calibra¸cão dos parâmetros do modelo adotado. Este passo consiste em buscar um conjunto de valores para estes parâmetros até que se al-cance uma melhor representa¸cão do problema de estudo. Na literatura, encontramos diversos estudos que utilizam diferentes métodos com este objetivo.

Quando não há informa¸cão coletada sobre as variáveis do sistema, pode-se calibrar os valores dos parâmetros baseando-se em informa¸cões das caracter´ısticas f´ısicas do sistema, por exemplo.

Quando há disponibilidade de dados, podemos calibrar tais valores por tentativas e erros, que é um método manual de ajuste. Neste caso, escolhemos diversos conjun-tos de valores de parâmetros, e resolvemos o modelo determin´ıstico. Este ajuste é feito até que se alcance uma melhor representa¸cão dos dados observados através do modelo adotado. Uma outra op¸cão, na presen¸ca de dados observados, é utilizando métodos

(27)

matemáticos/estat´ısticos/computacionais para otimizar uma determinada fun¸cão obje-tivo que relaciona os dados observados com os calculados via o modelo determin´ıstico. Neste contexto, buscamos de forma mais eficiente os conjuntos de valores dos parâmetros de interesse que ajustam melhor os dados observados. Entretanto, estes métodos tradi-cionais exigem a formula¸cão de uma fun¸cão objetivo, que será o critério de avalia¸cão da solu¸cão obtida. A escolha desta fun¸cão pode se tornar complexa, dependendo do problema em questão. Uma fun¸cão objetivo amplamente utilizada é a soma dos desvios quadráticos dos dados observados e simulados via o modelo determin´ıstico.

Em particular, um método de calibra¸cão frequentemente utilizado é o método de m´ınimos quadrados, mais especificamente, o método de m´ınimos quadrados não-linear, devido a grande maioria dos problemas apresentarem formas não-lineares. Na verdade, este método é um caso particular de estima¸cão por máxima verossimilhan¸ca quando assumimos a hipótese de normalidade.

Alternativas a estes métodos de otimiza¸cão mais tradicionais também têm surgido na literatura, como o uso de algoritmos genéticos, veja por exemplo Sá (2003). Ainda sob a perspectiva da estat´ıstica clássica, um método de estima¸cão mais elaborado, que avalia a aproxima¸cão tanto por um critério de ajuste aos dados quanto a fidelidade da aproxima¸cão feita ao sistema de equa¸cões, é desenvolvido em Ramsay et al. (2007). Neste trabalho, os autores utilizam o método da coloca¸cão para aproximar a solu¸cão alvo, e, a partir da inclusão de incerteza ao problema, estimam os parâmetros, inclusive os coeficientes da fun¸cão base que são requeridos no método da coloca¸cão, ver se¸cão 2.3.4.

Além destes métodos, sob a perspectiva da estat´ıstica bayesiana, diversos procedi-mentos têm sido propostos na literatura. Estes métodos serão apresentados e discutidos detalhadamente no cap´ıtulo 3.

(28)

Cap´ıtulo 3

Estima¸

c˜

ao Bayesiana de Parˆ

ametros

envolvidos em Modelos

Determin´ısticos

Modelos determin´ısticos que representam fenômenos f´ısicos são especificados por parˆ a-metros que, geralmente, possuem interpreta¸cão f´ısica relacionada ao problema em questão. Como discutido no cap´ıtulo 1, a fim de estimar estes parâmetros, várias propostas de inclusão de incerteza em modelos determin´ısticos têm sido feitas na literatura, tanto sob a perspectiva da estat´ıstica clássica quanto sob a da bayesiana. Neste trabalho, estamos interessados em investigar métodos bayesianos de estima¸cão de parâmetros originalmente envolvidos em modelos determin´ısticos.

Em Poole e Raftery (2000), é sugerida uma abordagem formal aplicável a modelos determ´ınisticos em geral, chamada Bayesian Melding, a qual leva em conta a informa¸cão e a incerteza sobre as entradas e sa´ıdas do modelo determin´ıstico. Neste artigo, o método conceitual proposto é aplicado num modelo de dinâmica populacional para baleias.

Cancré et al. (2000) calibram um modelo determin´ıstico de transmissão da malária, usando dados provenientes do Senegal, sob a abordagem bayesiana. Em particular, os autores modelaram os dados, os quais são dados de contagens, por uma distribui¸cão binomial. Além disto, devido a complexidade do modelo de transmissão, utilizam o método de MCMC para amostrar da distribui¸cão a posteriori dos parâmetros de interesse.

(29)

Um método bayesiano hierárquico é discutido em Huang et al. (2006), para um caso espec´ıfico de um modelo descrito por um sistema de equa¸cões diferenciais ordinárias n˜ ao-lineares. Este sistema caracteriza dinâmicas do v´ırus da imunodeficiência humana, a longo prazo, com a presen¸ca de terapia antiretroviral. Segundo Huang et al. (2006), o método proposto é geralmente aplicável a qualquer outro sistema dinâmico da mesma classe.

Em Campbell (2007), há interesse espec´ıfico em estimar parâmetros provenientes de sistemas de EDO’s não-lineares, sob uma perspectiva bayesiana. São descritos dois procedimentos de estima¸cão que usam o método da coloca¸cão para aproximar a solu¸cão do sistema de EDO’s na fun¸cão de verossimilhan¸ca, sendo que um destes procedimentos ´

e uma vers˜ao bayesiana do m´etodo apresentado em Ramsay et al. (2007).

Em Buckland et al. (2007) é apresentada uma vasta revisão dos recentes desenvolvi-mentos em modelagem de dinâmicas de popula¸cões, assim como uma descri¸cão da for-mula¸cão e ajuste bayesianos de modelos com estrutura matricial desta espécie. Além disto, são sugeridos os métodos de ajustes de MCMC e o método de amostragem por importância sequencial.

Sisson et al. (2007b) e Toni et al. (2008) propõem diferentes procedimentos de com-puta¸cão bayesiana aproximados, ambos baseados no método de Monte Carlo sequencial, para estimar parâmetros em sistemas dinâmicos. As duas propostas são baseadas nos métodos e amostradores discutidos em Moral et al. (2006). Em Toni et al. (2008) também ´

e discutido sele¸cão de modelos neste contexto, sendo que neste trabalho o método é apli-cado também para a estima¸cão de parâmetros que definem modelos determin´ısticos.

Sob uma perspectiva bayesiana, a inclusão de incerteza num sistema determin´ıstico, pode ser feita assumindo que, dado o vetor de parâmetros que o definem, a solu¸cão do sistema é a média de uma realiza¸cão da distribui¸cão normal com um erro associado. Para completar a formula¸cão do modelo bayesiano, devemos atribuir distribui¸cões a priori para os parâmetros do modelo determin´ıstico e para as variâncias associadas a verossim-ilhan¸ca. A partir da formula¸cão da fun¸cão de verossimilhan¸ca e das distribui¸cões a priori, e seguindo o teorema de Bayes, obtemos a distribui¸cão a posteriori dos parâmetros. Em muitos casos, devido a complexidade dos modelos, a distribui¸cão a posteriori resultante

(30)

não tem forma anal´ıtica fechada. Nosso interesse aqui é investigar diferentes métodos propostos na literatura para amostragem de parâmetros envolvidos em modelos deter-min´ısticos. Ambos os métodos estudados são métodos de Monte Carlo. O primeiro é o método de Monte Carlo via cadeias de Markov (MCMC), que tem sido amplamente adotado. O outro é o método de Monte Carlo sequencial (MCS), adequado ao contexto de modelos determin´ısticos. A seguir, descrevemos minuciosamente os métodos eleitos no contexto do nosso trabalho.

3.1 MCMC

Como apresentado em Campbell (2007); Huang et al. (2006), uma op¸cão para obter amostras da distribui¸cão a posteriori de parâmetros no contexto de modelos deter-min´ısticos é através do método de Monte Carlo via Cadeias de Markov (MCMC). Como definido em Robert e Casella (2004), um método de MCMC para a simula¸cão de uma determinada distribui¸cão alvo, é qualquer método que produza uma cadeia de Markov ergódica cuja distribui¸cão estacionária é a distribui¸cão alvo. O desempenho deste método está associado com a convergência da cadeia de Markov. Segundo Moral et al. (2006), em geral, é dif´ıcil avaliar quando a cadeia de Markov atingiu seu equil´ıbrio estacionário. Vários procedimentos são propostos na literatura para esta avalia¸cão, veja por exemplo Cowles e Carlin (1996); Robert e Casella (2004). Neste estudo, para a avalia¸cão da con-vergência, utilizamos diferentes cadeias iniciadas com valores distintos. Além disto, a fim de obtermos amostras independentes da distribui¸cão alvo, geralmente, precisamos de muitas itera¸cões do método para descartarmos uma quantidade suficiente de amostras, além das amostras geradas na fase de aquecimento do amostrador. Outra desvantagem do MCMC, em alguns casos, é que pode ocorrer do método ficar parado em modas locais, ao invés de percorrer mais o espa¸co de varia¸cão do parâmetro, encontrando assim a moda global, se existir.

Segundo Gamerman e Lopes (2006), o algoritmo de amostragem de Gibbs é o es-quema de simula¸cão estocástica usando MCMC mais habitual. Basicamente, o algo-ritmo de Gibbs é um algoritmo de MCMC onde o núcleo de transi¸cão é constitu´ıdo

(31)

pelas distribui¸cões condicionais completas. Entretanto, diversas vezes não é poss´ıvel amostrar diretamente das distribui¸cões condicionais completas devido suas formas não conhecidas, complexidade ou custo computacional elevado. Neste contexto, algoritmos de Metropolis-Hastings são uma op¸cão. A combina¸cão entre os algoritmos de Gibbs e Metropolis-Hastings tem sido amplamente adotada. Algoritmos de Metropolis-Hastings envolvem, dentre outros conceitos, a escolha de um núcleo de transi¸cão que devem ser preferencialmente de amostragem simples. Outro ponto importante para a performance do algoritmo, também relacionado ao núcleo de transi¸cão (também chamado de dis-tribui¸cão proposta), é a taxa de aceita¸cão dos valores dos parâmetros propostos. Para um estudo mais detalhado e genérico veja, por exemplo, Gamerman e Lopes (2006); Robert e Casella (2004).

Em Marjoram et al. (2003), é proposto um método de MCMC para gerar observa¸cões de uma distribui¸cão a posteriori sem a avalia¸cão da fun¸cão de verossimilhan¸ca envolvida. De fato, os autores derivam uma aproxima¸cão da fun¸cão de verossimilhan¸ca e, segundo Marjoram et al. (2003), este método é indicado quando esta fun¸cão é imposs´ıvel de ser computada ou requer um alto custo computacional para sua avalia¸cão.

Abaixo, descrevemos o algoritmo de Gibbs com passos de Metropolis-Hastings que aplicaremos mais adiante nos modelos determin´ısticos de interesse.

Suponha que queremos obter amostras da distribui¸cão a posteriori do vetor de parˆ ame-tros θ = (θ1, θ2, ..., θm), os quais originalmente definem um modelo determin´ıstico bem especificado. Além disto, utilizamos θ(j) para denotar o vetor (θ₁(j), θ₂(j), ..., θ(j)m), e θ(p) para (θ(p)₁ , θ₂(p), ..., θm(p)). De forma geral, o algoritmo de Gibbs com passos de Metropolis-Hastings para realizar o MCMC, no contexto de modelos determin´ısticos, pode ser des-crito através dos seguintes passos:

1. Inicialize j ← 1;

2. Arbitre valores iniciais para o vetor de parˆametros θ(j);

3. Resolva o sistema determin´ıstico, obtendo M (θ(j), t), para t = 1, ..., T ;

4. Amostre valores propostos θ(p)_{, para o vetor de parˆ}_{ametros, da distribui¸c˜}_{ao proposta} escolhida, q;

(32)

5. Resolva o sistema determin´ıstico, obtendo M (θ(p), t), para t = 1, ..., T ;

6. Calcule a razão de aceita¸cão de Hastings, que tem como numerador (denominador) o produto da condicional completa a posteriori dos parâmetros, p(θ|.), aplicada nos valores propostos (valores correntes) com a distribui¸cão proposta aplicada nos valores correntes (valores propostos)

r = p(θ

(p)_|.)q(θ(j)_|θ(p)₎

p(θ(j)_|.)q(θ(p)_|θ(j)₎; (3.1)

7. Amostre u ∼ U nif orme[0, 1]; 8. Se u < min(1, r)

ent˜ao θ(j+1) _{← θ}(p) sen˜ao θ(j+1) _{← θ}(j)_;

9. j ← j + 1, e volte ao passo 3 at´e que j > J .

3.2 MCS

No contexto de inferência em modelos dinâmicos, o método de MCMC não mostra ser muito eficiente, dado que há a necessidade de se estimar um grande número de parâmetros, e assim podendo levar a uma taxa de aceita¸cão muito baixa de novos valores propostos. E como as distribui¸cões condicionais completas resultantes são geralmente desconhecidas, passos de Metropolis-Hastings são comumente utilizados. Por outro lado, a amostragem de um vetor de parâmetros dinâmicos em blocos também não apresenta bom desempenho. Como uma alternativa, surgiram os métodos de Monte Carlo sequen-cial (MCS). Além de problemas deste tipo, este método é aplicável em contextos gerais onde estamos interessados em amostrar de um conjunto de distribui¸cões sequencialmente. Segundo Sisson et al. (2007b), ao contrário do MCMC, o amostrador de MCS não fica parado em regiões de baixa probabilidade assim como o método de amostragem por re-jei¸cão. Outra vantagem do MCS sobre o MCMC, está na natureza das amostras não serem correlacionadas. Além disto, segundo Fan et al. (2008), o método de MCS fornece uma estrutura para amostragem a posteriori que não é dependente da convergência de uma

(33)

cadeia de Markov, como ocorre no MCMC, embora também sejam necessárias avalia¸cões das amostras obtidas.

Em Chopin (2002), é apresentado um método de MCS para modelos estáticos. Mais geralmente, em Moral et al. (2006), são propostos algoritmos, chamados amostradores de MCS, que usam núcleos de MCMC como ingredientes. Basicamente, estes algorit-mos envolvem uma combina¸cão de amostragem por importância sequencial e idéias de reamostragem.

Neste contexto de métodos de MCS, elegemos estudar os algoritmos apresentados em Sisson et al. (2007b) e Toni et al. (2008). Ambas as propostas são baseadas nos métodos e amostradores discutidos em Moral et al. (2006). Em Toni et al. (2008) os autores chamam o algoritmo proposto por algoritmo de computa¸cão bayesiana aproximada de MCS (CBA-MCS), enquanto que Sisson et al. (2007b) denominam o seu por algoritmo de computa¸cão bayesiana aproximada por controle de rejei¸cão parcial (CBA-CRP). Aqui, quando nos referirmos a estes algoritmos, também os chamaremos desta forma.

3.2.1 CBA-MCS

Novamente, suponha que queremos obter amostras da distribui¸cão a posteriori do ve-tor de parâmetros θ = (θ1, θ2, ..., θm), que, a princ´ıpio, especificam um particular modelo determin´ıstico. A proposta deste algoritmo é, a partir de amostras da distribui¸cão a pri-ori de θ, π(θ), obter amostras (popula¸cões) de distribui¸cões intermediárias, até alcan¸car uma amostra da distribui¸cão a posteriori alvo. Determinamos o número de popula¸cões total igual a L, onde cada popula¸cão tem tamanho J . Além disto, também é necessário escolher a sequência de valores 1, ..., L que serão os erros de tolerância para cada pop-ula¸cão, tal que 1 > ... > L. Nesta nota¸cão, Klé o núcleo de transi¸cão da sua respectiva popula¸cão l, d(a, b) é uma fun¸cão distância entre a e b definida, e x0 é o dado observado. Neste contexto, o algoritmo de amostragem pode ser descrito nos passos abaixo.

Primeiro, inicialize a contagem das popula¸c˜oes l ← 1. 1. Para l = 1, inicialize j ← 1;

(34)

• Repita os próximos passos, da letra (a) até a (c), até que d(x∗, x0) ≤ 1 (a) Amostre θ∗∗∼ π(θ), onde θ∗∗ _{= (θ}∗∗

1 , θ∗∗2 , ..., θm∗∗);

(b) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (c) Amostre x∗ ∼ p(x|θ∗∗_{), tal que p(x|θ) ´}_{e o modelo probabil´ıstico adotado;} • Atribua os valores ω[1, j] ← 1, ∀ j, onde ω é a matriz de pesos (probabili-dades) associada a primeira popula¸cão (l = 1), e a j-ésima part´ıcula (j-ésimo elemento da popula¸cão) amostrada;

• Armazene as part´ıculas amostradas θj₁ ← θ∗∗_{, onde θ}j

1 é o vetor contendo a j-ésima part´ıcula da primeira popula¸cão;

• j ← j + 1; Normalize os pesos; l ← l + 1;

2. Para 1 < l ≤ L, inicialize j ← 1; Enquanto (j ≤ J ) fa¸ca

• Repita os próximos passos, da letra (a) até a (d), até que d(x∗, x0) ≤ l (a) Amostre θ∗ = (θ∗₁, θ₂∗, ..., θ_m∗) ∼ θl−1 com pesos associados ωl−1; (b) Amostre θ∗∗∼ θ∗_{+ K}

l(θ|θ∗), at´e que π(θ∗∗) 6= 0;

(c) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (d) Amostre x∗ ∼ p(x|θ∗∗_);

• Atribua os valores ω[l, j] ← PJ π(θ∗∗)

i=1Kl(θ∗∗|θ[l−1,i]), ∀ j;

• Armazene as part´ıculas amostradas θj_l ← θ∗∗_{, onde θ}j

l é o vetor contendo a j-ésima part´ıcula da l-ésima popula¸cão;

• j ← j + 1; Normalize os pesos; l ← l + 1;

(35)

Todos os passos da demonstra¸cão deste algoritmo são apresentados em Toni et al. (2008). Neste artigo, na verdade, é demonstrado um procedimento um pouco mais geral do que acabamos de descrever. Entretanto, no contexto de modelos determin´ısticos, esta extensão não é aplicada neste artigo, mas aqui temos interesse em aplicá-la. Nesta generaliza¸cão, para todas as popula¸cões, a diferen¸ca consiste em não simular apenas um conjunto de dados, x∗, a partir do vetor proposto θ∗∗, mas, ao invés disto, simulamos B conjuntos de dados para cada vetor θ∗∗. Da´ı, calculamos quantas vezes (que denotaremos por b), de um total de B, a inequa¸cão d(x∗, x0) ≤ lé satisfeita, bastando ser maior do que zero para passarmos para o próximo passo. Além disto, os pesos também são alterados. Os pesos associados a cada part´ıcula, para todas as popula¸cões, são multiplicados por esta quantidade b.

3.2.2 CBA-CRP

O algoritmo proposto por Sisson et al. (2007b), é muito similar ao algoritmo apre-sentado em Toni et al. (2008), entretanto, apresenta diferen¸cas principalmente nos pesos, onde além do núcleo de transi¸cão para frente, é utilizado um núcleo de transi¸cão para trás.

Sob as mesmas condi¸c˜oes supostas para o algoritmo CBA-MCS, e utilizando a mesma nota¸c˜ao, abaixo descrevemos os passos do algoritmo CBA-CRP.

Primeiro, inicialize a contagem das popula¸c˜oes l ← 1. 1. Para l = 1, inicialize j ← 1;

Enquanto (j ≤ J ) fa¸ca

• Repita os próximos passos, da letra (a) até a (c), até que d(x∗, x0) ≤ 1 (a) Amostre θ∗∗∼ µ(θ);

(b) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (c) Amostre x∗ ∼ p(x|θ∗∗_);

• Atribua os valores ω[1, j] ← π(θ_µ(θ∗∗∗∗)₎, ∀ j;

(36)

• j ← j + 1; Normalize os pesos; Se h PJ j=1ω[1, j]

2i−1 _{< J/2, ent˜}_{ao reamostre com reposi¸c˜}_{ao, as part´ıculas {θ}j 1} com pesos {ω[1, j]} para obter uma nova popula¸c˜ao {θj₁}, e fa¸ca ω[1, j] = 1/J, para todo j;

l ← l + 1;

2. Para 1 < l ≤ L, inicialize j ← 1; Enquanto (j ≤ J ) fa¸ca

• Repita os próximos passos, da letra (a) até a (d), até que d(x∗, x0) ≤ l (a) Amostre θ∗ = (θ∗₁, θ₂∗, ..., θ_m∗) ∼ θl−1 com pesos associados ωl−1; (b) Amostre θ∗∗∼ θ∗_{+ K}

l(θ|θ∗), at´e que π(θ∗∗) 6= 0;

(c) Resolva o sistema determin´ıstico, obtendo M (θ∗∗, t), para t = 1, ..., T ; (d) Amostre x∗ ∼ p(x|θ∗∗_);

• Atribua os valores ω[l, j] ← π(θ∗∗)Zl−1(θ∗|θ∗∗)

π(θ∗_)K

l(θ∗∗|θ∗) , ∀ j;

• Armazene as part´ıculas amostradas θj_l ← θ∗∗_; • j ← j + 1;

Normalize os pesos; SehPJ

j=1ω[l, j]

2i−1 _{< J/2, ent˜}_{ao reamostre com reposi¸c˜}_{ao, as part´ıculas {θ}j l} com pesos {ω[l, j]} para obter uma nova popula¸c˜ao {θj_l}, e fa¸ca ω[l, j] = 1/J, para todo j;

l ← l + 1;

Volte para o passo 2. Neste algoritmo,

h PJ

j=1ω[l, j]

2i−1 _{serve para medir o grau de degenera¸c˜}_{ao da amostra} de cada popula¸c˜ao, l = 1, ..., L. Neste contexto, se hPJ

j=1ω[l, j]

2i−1 _{< J/2 ent˜}_ao reamostramos uma nova popula¸cão a fim de favorecer part´ıculas com pesos maiores, que serão melhor representadas na popula¸cão reamostrada.

(37)

A escolha dos núcleos de transi¸cão para frente, Kl, é sempre considerada em algorit-mos de MCS. Entretando, segundo Moral et al. (2006), a escolha do núcleo de transi¸cão para trás, Zl, pode ser feita levando em conta o núcleo para frente. Isto é, Zl pode ser otimizado, com respeito a Kl, a fim de obtermos uma melhor perfomance do algoritmo. Baseados no procedimento apresentado em Moral et al. (2006), Sisson et al. (2007a) propuseram um núcleo ótimo neste contexto. Entretanto, em termos práticos, o núcleo ´

otimo é muito d´ıficil de ser utilizado porque ele envolve distribui¸cões marginais que não admitem expressões com forma anal´ıtica fechada. Assim, também é proposto um núcleo sub-ótimo, o qual pode ser manipulado com mais facilidade. A partir desta proposta, uma aproxima¸cão para os pesos associados as part´ıculas das popula¸cões, para l > 1, é dado por ωl[l, j] = π(θ∗∗) PJ i=1ω[l − 1, i]Kl(θ∗∗|θl−1i ) , j = 1, ..., J.

3.3 Estudo Simulado: Uma Aplica¸

c˜

ao em um

Mo-delo Cl´

assico de EDO

Como ilustra¸cão, agora vamos aplicar os métodos apresentados nas se¸cões anteriores num modelo determin´ıstico espec´ıfico. O modelo escolhido é um modelo clássico de presa-predador proposto em Lotka (1925); Volterra (1926), e por isto também é conhecido como modelo de Lotka-Volterra. Este modelo descreve a intera¸cão entre presas, u, e predadores, v, com vetor de parâmetros θ = (α, β). Estas dinâmicas são formuladas por um conjunto de duas equa¸cões diferenciais ordinárias não-lineares no tempo t, mais especificamente,

du

dt = αu − uv, (3.2)

dv

dt = βuv − v.

A seguir, descrevemos a fun¸cão de verossimilhan¸ca. Em seguida, explicamos como foram gerados os dados artificiais. Depois, descrevemos as especifica¸cões necessárias para a formula¸cão bayesiana do problema em questão. E, finalmente, mostramos os resultados obtidos através dos algoritmos estudados.

(38)

3.3.1 Fun¸

c˜

ao de Verossimilhan¸

ca

Assumimos que dado o vetor de parâmetros θ, a solu¸cão do sistema de equa¸cões di-ferenciais em (3.2), M (θ, t), no tempo t, é a média de uma realiza¸cão da distribui¸cão normal com matriz de covariâncias fixada, D. Assim, Y (t) ∼ N ormal(M (θ, t), D), para t ∈ [0, T ], tal que Y (t) é o vetor que contém o número de presas e de predadores observados em t, para todo t, e, condicionado a θ, são independentes entre si, isto ´

e, D é uma matriz diagonal. Considerando uma amostra aleatória y1, ..., yT do vetor Y = (Y (1), ..., Y (T )), a fun¸cão de verossimilhan¸ca para θ é proporcional a

p(y|θ) ∝ exp ( −1 2 T X t=1 [y(t) − M (θ, t)]0D−1[y(t) − M (θ, t)] ) ,

tal que D = diag{d1, d2}.

3.3.2 Gera¸

c˜

ao dos Dados Artificiais

A fim de obtermos um conjunto de dados simulados, fixamos θ = (α, β) = (1, 1), e assumimos que as condi¸cões iniciais são dadas por u(0) = 1 e v(0) = 0.5, então resolve-mos o sistema em (3.2) numericamente. A partir desta solu¸cão, e introduzindo erros gaussianos, com d1 = d2 = (0.5)2, geramos uma observa¸cão, para cada t ∈ [0, 15] num conjunto de N pontos. A partir deste procedimento, simulamos três diferentes conjuntos de dados com diferentes tamanhos N=16, N=51 e N=151.

3.3.3 Formula¸

c˜

ao Bayesiana

Supomos que α e β são independentes a priori, e que α, β ∼ Uniforme(−a, a), tal que a é uma constante fixada. Assumimos três diferentes valores para a constante a, a saber a = 2, a = 5 e a = 10. Portanto, chamaremos de priori 1 quando nos referirmos a Uniforme(−2, 2), priori 2 quando for a Uniforme(−5, 5), e, finalmente, priori 3 para a Uniforme(−10, 10). A escolha destas prioris visa fornecer alguma informa¸cão sobre poss´ıveis diferen¸cas no comportamento dos métodos supondo distribui¸cões a priori mais informativas do que outras.

(39)

Neste contexto, pelo teorema de Bayes, o núcleo da distribui¸cão a posteriori dos parâmetros toma a seguinte forma

p(θ|y) ∝ exp ( −1 2 T X t=1 [y(t) − M (θ, t)]0D−1[y(t) − M (θ, t)] )

I(−a,a)(α)I(−a,a)(β),

onde I(−a,a)(x) ´e a fun¸c˜ao indicadora, para a = 2, a = 5 e a = 10.

3.3.4 Implementa¸

c˜

ao Computacional

Neste trabalho, utilizamos o software livre R1_{, tanto para rodar os algoritmos quanto} para a constru¸cão dos gráficos. Em particular, para resolver numericamente o sistema de equa¸cões diferenciais utilizamos o pacote do R chamado ODESOLVE. Mais especificamente, utilizamos a fun¸cão lsoda. Esta fun¸cão adequa o melhor método para cada caso. Em alguns casos, ela utiliza o método de Adams, mais especificamente, uma versão um pouco mais elaborada do que a apresentada neste texto. A fim de obtermos uma melhor perfomance do algoritmo, podemos ajustar dois parâmetros de entrada desta fun¸cão, chamados rtol e atol. A partir destas entradas, podemos controlar a precisão da solu¸cão requerida. Neste trabalho, ajustamos estes valores através de tentativas, balanceando o tempo gasto para retornar uma solu¸cão e a capacidade de precisão do método para o sistema determin´ıstico.

3.3.5 Resultados

Utilizamos os métodos de MCMC e cada uma das abordagens do MCS discutidas na se¸cão 3.2, para obter amostras da distribui¸cão a posteriori do vetor de parâmetros θ. Para ambos os algoritmos, precisamos sintonizar alguns parâmetros. No MCMC, como usamos um passo de Metropolis-Hastings, temos que escolher a distribui¸cão proposta e sintonizar sua variância. No caso do algoritmo CBA-MCS, é necessário fixar o número de popula¸cões, L, os valores dos ’s, e os núcleos, cujas escolhas devem influenciar nossos resultados.

(40)

Especificamente, no passo de Metropolis-Hastings do algoritmo de MCMC para a amostragem de α e β conjuntamente, utilizamos um passeio aleatório como proposta, a distribui¸cão normal centrada no valor do parâmetro da itera¸cão imediatamente anterior. Já no algoritmo CBA-MCS, supomos o núcleo seguindo uma distribui¸cão uniforme, isto é, Kl(θl|θl−1) ∼ σ U (−1, 1), para l = 1, ..., L, onde σ é um parâmetro de escala fi-xado em 0,1. A escolha do valor de σ foi feita através de várias experiências com valores inferiores e superiores. Além disto, fizemos tentativas com diferentes valores de L e dos ’s para cada conjunto de dados. Na tabela 3.1, apresentamos os valores utilizados destes parâmetros, para as três diferentes amostras. Estes valores também serão utilizados nos outros algoritmos baseados no MCS. Ainda buscando melhorar a perfomance do algo-ritmo, também supomos como núcleo a distribui¸cão normal, entretanto, o desempenho do algoritmo não foi vantajoso. Omitimos aqui os resultados atingidos através destas diversas outras tentativas.

Tabela 3.1: Parˆametros do CBA-MCS ajustados

Popula¸c˜ao Erros de tolerˆancia () L

N=16 (40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5.5) 11

N=51 (150, 140, 100, 85, 70, 60, 50, 40, 35, 30, 25) 11 N=151 (500, 450, 350, 200, 180, 160, 145, 130, 125, 120, 115, 110) 12

A fim de compararmos ambos os esquemas amostrais MCMC e CBA-MCS, apresen-tamos numa mesma figura as estimativas pontual (mediana) e intervalar (intervalo de credibilidade de 90%) obtidas através das amostras geradas pelos dois métodos. No caso do MCMC, para todas as amostras e distribui¸cões a priori assumidas, retiramos as mil primeiras amostras (fase de aquecimento da cadeia) e tomamos de 49 em 49 a fim de obtermos mil amostras independentes.

Primeiro, para avaliar a convergência das cadeias dos parâmetros via o método de MCMC, apresentamos na figura 3.1 os tra¸cos de duas cadeias inicializadas com valores distintos, supondo a priori 3, para as amostras de tamanhos N=16, N=51 e N=151. Os tra¸cos obtidos para os outros casos foram muito similares, e portanto, omitiremos as figuras no texto.

(41)

αα 0 200 400 600 800 1000 0.5 0.6 0.7 0.8 0.9 1.0 1.1 ββ 0 200 400 600 800 1000 0.8 1.0 1.2 1.4 1.6 1.8 αα 0 200 400 600 800 1000 0.80 0.85 0.90 0.95 1.00 ββ 0 200 400 600 800 1000 0.9 1.0 1.1 1.2 αα 0 200 400 600 800 1000 0.94 0.96 0.98 1.00 1.02 ββ 0 200 400 600 800 1000 0.95 1.00 1.05 1.10

Figura 3.1: Tra¸cos das cadeias dos parâmetros α e β (colunas), para as diferentes ob-serva¸cões com N=16, N=51 e N=151 (linhas), e supondo a priori 3 via MCMC. A linha horizontal preta é o valor verdadeiro do parâmetro.

(42)

Nos painéis das figuras 3.2, temos a mediana e intervalos de credibilidade de 90% das distribui¸cões a posteriori de α e β, supondo as três diferentes distribui¸cões a priori e, constru´ıdos a partir das amostras obtidas via MCMC e CBA-MCS. Ressaltamos que para avalia¸cão dos métodos, devemos apenas comparar os resultados obtidos supondo a mesma informa¸cão a priori e a partir da mesma amostra (N=16, N=51 ou N=151).

(43)

● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● ● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● _● _● _● ● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● ● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● ● ● ● ● αα P1 P2 P3 P1 P2 P3 0.7 0.8 0.9 1.0 1.1 ● ● _● ● ● ● ββ P1 P2 P3 P1 P2 P3 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 ● ● ● ● ●

Figura 3.2: Mediana (ponto cheio) e intervalos de credibilidade de 90% da distribui¸c˜ao a posteriori de α e β supondo a priori 1 (P1), priori 2 (P2) e priori 3 (P3), tanto via MCMC (em azul) quanto via CBA-MCS (em vermelho), com N=16, N=51 e N=151 (linhas).

(44)

Baseados nestes resultados, não notamos diferen¸cas de comportamento dos métodos supondo mais informa¸cão a priori. Por este motivo, daqui em diante estaremos interes-sados em apenas no caso da hipótese da priori 3, que é a que supõe informa¸cão mais vaga sobre os parâmetros de interesse.

Notamos que quando temos uma amostra com 16 pontos observados, ambos os al-goritmos de MCMC e CBA-MCS alcan¸cam a mesma distribui¸cão a posteriori para α e β. Entretanto, quando temos mais pontos observados aparentemente os algoritmos não atingem a mesma distribui¸cão. O MCMC alcan¸ca uma distribui¸cão a posteriori mais concentrada. Aparentemente, com o aumento do tamanho da amostra esta diferen¸ca torna-se mais significante, veja os painéis para N=151.

Observando os intervalos de credibilidade, notamos que ambos os algoritmos são ca-pazes de recuperar os verdadeiros valores dos parâmetros. Porém, a descri¸cão da in-certeza no caso do CBA-MCS quando temos mais do que 16 pontos é desconfortável. Não sabemos ao certo qual dos métodos está correto. Mas, seguindo o teorema de Bayes, esperamos que conforme o tamanho da amostra cresce (temos mais informa¸cão), e a distribui¸cão a priori permanece a mesma, mais concentrada a distribui¸cão a posteriori deve se tornar. O algoritmo de MCMC está capturando esta informa¸cão com mais in-tensidade, fornecendo uma distribui¸cão a posteriori mais concentrada, do que o MCS apresentado. Vale ressaltar que o algoritmo de MCMC envolve a fun¸cão de verossim-ilhan¸ca em sua totalidade, porque sua expressão aparece nas distribui¸cões condicionais completas a posteriori. Já o método de CBA-MCS, envolve uma aproxima¸cão da fun¸cão de verossimilhan¸ca, aparecendo no passo de simula¸cão dos dados, para a determina¸cão da distância entre este dado e o dado observado.

Na figura 3.3 contrastamos o dado observado com os intervalos de credibilidade de 90% e a mediana da distribui¸cão preditiva das popula¸cões, de presas e de predadores, obtidos a partir dos valores das cadeias dos parâmetros, via MCMC e CBA-MCS. Utilizamos estes gráficos para discutir os ajustes dos modelos aos dados.

(45)

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Presa 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● _● ● ● _● ● ● tempo Predador 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● _● _● ● ● ● ● ● ● _● ● ● ● ● ● ● tempo Presa ● ● ●_●● ● ● ● ● ● ●●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● _● ● ● ● ● ● ● ● ● ● ● ● ● tempo Predador ● ● ● ● ●_● ● ●● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● tempo Presa ● ● ●● ● ●●●● ● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ●● ●●_● ●●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●_● ●● ●●● ● ● ●●● ● ●● ● ● ● ● ● ● ●●● ● ● ●● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●_● ●● ● ●● ● ● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●●● ● ●● ● ● ● 0 5 10 15 −2 −1 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● _● ● ● ● tempo Predador ●● ● ● ● ● ●●● ● ● ● ● ●_● ● ● ● ● ● ●● ● ●●● ● ● ● ●● ● ● ● ● ● ●●● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ●●● ●● ● ● ●●● ● ● ● ●_● ● ●_● ●●● ● ● ● ●● ● ● ● ●●●● ● ● ● ● ● ● ● ● ●● ●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● 0 5 10 15 −2 −1 0 1 2 3 4

Figura 3.3: I.C. de 90% (linhas tracejadas) e a mediana (linhas cheias) da distribui¸cão preditiva das popula¸cões de presas e predadores, obtidos a partir dos valores das cadeias dos parâmetros via MCMC (em azul) e via CBA-MCS (em vermelho), assumindo a priori 3, e para as diferentes amostras com N=16, N=51 e N=151 (linhas). Os c´ırculos representam os dados observados.