Inferência Sequencial em Modelos Dinâmicos Generalizados

(1)

Inferˆ

encia Sequencial em Modelos

Dinˆ

amicos Generalizados

Carlos Tadeu Pagani Zanini

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´etodos Estat´ısticos

2015

(2)

Inferˆ

encia Sequencial em Modelos

Dinˆ

amicos Generalizados

Carlos Tadeu Pagani Zanini

Disserta¸cão de Mestrado submetida ao Programa de Pós-Gradua¸cão em Estat´ıstica do Instituto de Matemática da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obten¸cão do t´ıtulo de Mestre em Estat´ıstica.

Aprovada por:

Prof. Helio dos Santos Migon PhD - IM - UFRJ - Orientador.

Profa Mariane Branco Alves D.Sc - IM - UFRJ - Co-orientadora.

Dani Gamerman PhD - IM - UFRJ.

Glaura Concei¸c˜ao Franco D.Sc - ICE - UFMG.

Rio de Janeiro, RJ - Brasil 2015

(3)

`

(4)

“Do you remember standing on the shore, Head in the clouds, your pockets filled with dreams Bound for glory on the seven seas of life, But the ocean is deeper than it seems

Sail your ship across the water, Spread your wings across the sky Take the time to see You’re the one who holds the key, Or sailing ships will pass you by (...) Spread your wings and you will see You control your destiny, So sailing ships don’t pass you by

Sailing ships - Whitesnake COVERDALE, DAVID & VANDENBERG, ADRIAN ”

(5)

Agradecimentos

Os últimos dois anos foram, sem dúvida alguma, os mais desafiadores da minha vida e, se consegui completar mais essa etapa, não foi sem ajuda das pessoas mais maravilhosas e compreensivas deste mundo. Sendo assim, dedico esta pequena se¸cão do meu trabalho a agradacer a estas pessoas por estarem ao meu lado nas mais diversas e adversas situa¸cões. Primeiramente, agrade¸co à minha fam´ılia. Meus pais, que souberam estimular em mim o amor incondicional pelo conhecimento desde de crian¸ca, pelos valores e princ´ıpios que me ensinaram e pelo amor e carinho que sempre tiveram comigo. Ao meu irmão, agrade¸co por absolutamente tudo, por ser o melhor amigo que alguém pode ter, por estar sempre do meu lado pra me alegrar com as suas piadas, me inspirar com seus conselhos ou mesmo rir dos meus acessos de raiva quando meus programas não rodavam. Talvez você nem saiba disso, Gabriel, mas você me ensinou que a melhor maneira de resolver os problemas é com um largo sorriso na cara e não com um murro na mesa.

Aos meus amigos da pós-gradua¸cão, agrade¸co por dividirem comigo todos esses mo-mentos memoráveis que passamos juntos estudando, programando, reclamando, rindo e outros gerúndios. Vocês foram as pessoas com quem passei mais tempo nesses dois anos em que praticamente vivi no fundão. Aqui incluo todos os meu amigos da pós-gradua¸cão em estat´ıstica, ao pessoal da matemática e da matemática aplicada. Sem todos vocês, essa etapa seria muito mais dif´ıcil e menos divertida. Em especial, Marianas, Rafael e Ingrid, muit´ıssimo obrigado pelo conv´ıvio e companheirismo em absolutamente todos os momentos, desde as caronas, ônibus lotados, confraterniza¸cões, aulas, congressos e até os almo¸cos no bandejão (porque é claro que eu tenho que lembrar de comida sempre). Como vou sentir falta de tudo isso nos próximos anos...

Aos meus amigos de mais longa data, agrade¸co por continuarem ao meu lado mesmo nos v´arios momentos em que me ausentei por conta dos compromissos com o mestrado.

(6)

Gustavo, Fred, Raphael, Lucas, Vicente, Daniel, Bianca, Alexandre, Luciana, Para´ıba e Mirna dedicar a vocês este trabalho é uma singela forma de agradecer a tudo o que vocês significam pra mim; afinal crescemos juntos como uma grande (na verdade, imensa) fam´ılia. Vou sempre levar na minha memória os seus conselhos, conversas, piadas e as jogatinas de videogame nos fins de semana.

Agrade¸co a todo o corpo docente da pós gradua¸cão por atuar com tanta dedica¸cão para nos transmitir da melhor forma poss´ıvel o conhecimento acadêmico necessário para o nosso futuro profissional. Agrade¸co à Mariane e ao Migon por me orientarem pelos in-trincados caminhos dessa jornada de pesquisa que chamamos de disserta¸cão de mestrado. Tem sido uma grande honra e um grande prazer trabalhar com vocês dois. Fa¸co um agra-decimento especial à Mariane, que além de excelente coorientadora é uma grande amiga. Obrigado por confiar em meu potencial desde quando entrei na UFRJ ao me oferecer um projeto de inicia¸cão cient´ıfica (o que foi a fagulha inicial que iluminou minha decisão pela carreira acadêmica) e cujos conselhos me levaram onde estou hoje. Agrade¸co também à Alexandra e ao Migon pelo constante incentivo que me dão a participar de congressos. A participa¸cão nesses eventos contribuiu muito para o meu aprendizado e foi, certamente, o fator que mais ajudou a nortear meu caminho para o doutorado. Vejo nesta nova etapa que se inicia, uma excelente oportunidade de retribuir a todo conhecimento que vocês, professores, transmitiram a mim e aos meus colegas nestes últimos anos.

Aos professores Carlos Abanto Valle, Dani Gamerman e Glaura Franco, agrade¸co por aceitarem fazer parte da banca.

Finalmente, Agrade¸co ao CNPQ e `a Faperj pelo apoio financeiro no primeiro e segundo ano de mestrado, respectivamente.

(7)

Resumo

Na prática, análises estat´ısticas de séries temporais requerem atualiza¸cão constante da inferência à medida que novas observa¸cões tornam-se dispon´ıveis. Nesse sentido, o ideal é utilizar procedimentos sequenciais de inferência, sobretudo quando os intervalos de tempo em que se recebe novas informa¸cões são curtos.

Tendo como base esta motiva¸cão de caráter prático, este trabalho propõe uma meto-dologia sequencial bayesiana aplicada a modelos dinâmicos não-lineares com resposta na fam´ılia exponencial. Utiliza-se de expansão do vetor de estados e lineariza¸cão da equa¸cão de evolu¸cão resultante para estimar hiperparâmetros originalmente pertencentes à matriz de evolu¸cão, permitindo estima¸cão dos estados e hiperparâmetros conjuntamente. Para estima¸cão da variância de evolu¸cão de componentes dinâmicas, utiliza-se quadratura de Gauss Hermite.

A aplica¸cão da metodologia sequencial proposta aqui é exemplificada em contextos de modelos na fam´ılia exponencial com estrutura latente autorregressiva e também em modelos com efeito de fun¸cão de transferência para descrever o impacto de regressoras sobre a variável resposta.

Palavras-Chaves: modelos dinˆamicos, linear bayes, processos autoregressivos, com-puta¸c˜ao sequencial bayesiana, quadratura de Gauss-Hermite.

(8)

Abstract

From a practical point of view, statistical time series analysis often require the infe-rence procedure to be constantly updated as new observations become available. In this sense, the use of sequential inference procedures is desirable, specially when new data arrive in short time intervals.

Focusing on this practical motivation, this work proposes a sequential Bayesian metho-dology that applies to non-linear dynamic models with response variable belonging to the exponential family of distributions. Expansion of the state vector and linearization of the resulting evolution equation are used to estimate hyperparameters originally belonging to the evolution matrix, which allows the estimation of the states and hyperparameters jointly. In order to estimate the evolution variances related to dynamic components in the model, Gauss-Hermite quadrature is used.

The aplication of the sequential methodology proposed here is shown in examples that concern dynamic models in the exponential family with latent autorregressive struc-ture and in models with transfer function effects describing how covariates impact the response variable.

Keywords: dynamic models,linear bayes, autorregressive processes, sequential baye-sian computation, Gauss-Hermite quadrature.

(9)

Sum´

ario

1 Introdu¸c˜ao 1

2 Estima¸c˜ao bayesiana e modelos dinˆamicos 4

2.1 Inferˆencia bayesiana. . . 4

2.1.1 Estima¸c˜ao pontual . . . 6

2.1.2 Estima¸c˜ao por intervalo . . . 7

2.1.3 Aspecto sequencial do Teorema de Bayes . . . 7

2.1.4 Previs˜oes . . . 8

2.1.5 Estimador linear de Bayes . . . 9

2.2 Modelos dinˆamicos . . . 11

2.2.1 Modelos lineares dinˆamicos. . . 11

2.2.2 Modelos lineares generalizados dinˆamicos . . . 17

2.2.3 Procedimento sequencial de inferˆencia em MLGD . . . 19

2.3 Especifica¸c˜ao dos erros de evolu¸c˜ao via fatores de desconto . . . 24

3 Inferência sequencial em modelos dinâmicos não lineares 26 3.1 Modelos dinâmicos não lineares . . . 26

3.2 Processos autorregressivos . . . 27

3.3 Fun¸c˜oes de transferˆencia . . . 30

3.4 Inferência em modelos dinâmicos não-lineares . . . 34

3.4.1 Expans˜ao do vetor de estados . . . 35

3.4.2 Lineariza¸cão da equa¸cão de evolu¸cão . . . 36

(10)

3.5 Quadratura de Gauss-Hermite em modelos

dinˆamicos n˜ao-lineares . . . 39

3.6 Fatores de desconto para componentes autorregressivas . . . 45

4 Estudo de simula¸c˜ao 48 4.1 Descri¸c˜ao e objetivos do estudo simulado . . . 48

4.2 Modelo Normal . . . 50

4.2.1 Modelo normal com estrutura latente AR(1) . . . 51

4.3 Modelo Poisson . . . 69

4.3.1 Modelo poisson com estrutura latente AR(1) . . . 69

4.3.2 modelo Poisson com estrutura latente AR(2) . . . 76

4.3.3 modelo Poisson com estrutura latente AR(3) . . . 80

4.4 Modelo Binomial . . . 84

4.4.1 Modelo binomial com estrutura latente AR(1) . . . 85

4.5 Conclus˜oes do estudo simulado . . . 98

5 Aplica¸c˜ao a dados reais 101 5.1 Introdu¸c˜ao . . . 101

5.2 Descri¸c˜ao do conjunto de dados . . . 102

5.3 Descri¸c˜ao dos modelos propostos . . . 103

5.3.1 Simula¸c˜ao . . . 107

5.3.2 Aplica¸c˜ao aos dados . . . 111

5.4 Conclus˜oes da aplica¸c˜ao aos dados reais. . . 115

6 Conclus˜oes e trabalhos futuros 117

(11)

Lista de Tabelas

4.1 Tempo computacional m´edio em segundos para implementa¸c˜ao da

me-todologia sequencial baseada na expans˜ao do vetor de estados e uso da

quadratura de Gauss-Hermite aos modelos dinˆamicos normais, poisson e

binomial com estrutura latente AR(1), AR(2) e AR(3). Foram utilizados

15 pontos na quadratura de Gauss-Hermite. . . 100

5.1 Logaritmo da verossimilhan¸ca preditiva para cada um dos modelos ajustados.112

5.2 Resumo a posteriori para os parâmetros estáticos considerando toda a série de dados. LI e LS (limites inferior e superior, respectivamente) referem-se

(12)

Lista de Figuras

2.1 Estima¸c˜ao de θt ∼ AR(1) em MLD{1, φ, V, W } com φ, W e V conhecidos.

mt = E(θt | Dt), Ct = V ar(θt | Dt). `A esquerda, exibe-se a sequˆencia

Ct juntamente com o valor limite C dado pela Proposi¸c˜ao 2.2. `A direita,

exibe-se a sequˆencia de estimativas e intervalos de credibilidade a posteriori

para os estados. . . 17

3.1 Estima¸c˜ao de θt ∼ AR(1) em MLD{1, φ, V, Wt} com φ conhecido e Wt

especificado pelo fator de desconto δ. Priori: θ1 ∼ N (0, 100). mt= E(θt|

Dt), Ct= V ar(θt | Dt). . . 47

4.1 Resultados para uma r´eplica simulada do modelo normal AR(1) com φ =

0.5, 0.7, 0.95 (1a_{, 2}a_{e 3}a_{linhas, respectivamente) considerando a variˆ}_ancia

de evolu¸c˜ao fixa em seu valor real no processo de estima¸c˜ao. . . 53

4.2 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ

condicio-nais a W no tempo N com base nas 100 s´eries simuladas do modelo normal

AR(1). Os pontos representam a m´edia amostral do respectivo conjunto

de estimativas pontuais E(φ | W, DN). A linha tracejada representa o

valor verdadeiro de φ.. . . 54

4.3 Histogramas suavizados para a distribui¸c˜ao das estimativas de V

condici-onais a W no tempo N com base nas 100 s´eries simuladas para o modelo

normal AR(1). Os pontos representam a m´edia amostral do respectivo

conjunto de estimativas pontuais E(V | W, DN). A linha tracejada

(13)

4.4 Resultados para uma r´eplica simulada do modelo normal AR(1) com φ = 0.5, 0.7, 0.95 (1a_{, 2}a _{e 3}a _{linhas, respectivamente) estimando a variˆ}_ancia

de evolu¸c˜ao via quadratura de Gauss-Hermite. . . 56

4.5 Estima¸cão da variância de evolu¸cão W para a primeira réplica simulada

do modelo normal AR(1) com φ ∈ {0.5, 0.7, 0.95} (1a, 2a e 3a coluna,

respectivamente). . . 57

4.6 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ, W e

V (1a_{, 2}a _{e 3}a _{linhas, respectivamente) no tempo N , incondicionalente a}

W, com base nas 100 s´eries simuladas com φ ∈ {0.5, 0.7, 0.95}. Os

pon-tos representam a m´edia amostral do respectivo conjunto de estimativas

pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 58

4.7 Resultados para a 1a _r´_{eplica simulada do modelo normal AR(2) com φ =}

(φ1, φ2) = (0.1, 0.8) considerando a variˆancia de evolu¸c˜ao fixa em seu valor

real no processo de estima¸c˜ao. . . 59

4.8 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ1 e φ2

condicionais a W no tempo N com base nas 100 s´eries simuladas do modelo

conjunto de estimativas pontuais E(φ1 | W, DN) (1alinha) e E(φ1 | W, DN)

(2a linha). A linha tracejada representa o valor verdadeiro de φ1 ou φ2. . 60

4.9 Resultados para a primeira r´eplica simulada do modelo normal AR(2) com

φ1 = 0.1, φ2 = 0.8 estimando a variˆancia de evolu¸c˜ao via quadratura de

Gauss-Hermite. . . 62

4.10 Estima¸cão da variância de evolu¸cão W para a primeira réplica simulada

do modelo normal AR(2) com φ1 = 0.1 e φ2 = 0.8 . . . 62

4.11 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ1 e φ2 no

tempo N com base nas 100 s´eries simuladas do modelos normal AR(2). Os

pontos representam a m´edia amostral do respectivo conjunto de

estimati-vas pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro

(14)

4.12 Resultados para a primeira réplica simulada do modelo normal AR(3) com φ = (φ1, φ2, φ3) = (0.81, 0.77, −0.86) considerando a variância de evolu¸cão

fixa em seu valor real no processo de estima¸c˜ao. . . 65

condici-onalmente a W no tempo N com base nas 100 s´eries simuladas do modelo

conjunto de estimativas pontuais E(φ | W, DN), i ∈ {1, . . . , 5}. A linha

tracejada representa o valor verdadeiro de φi. . . 66

4.14 Histogramas suavizados para a distribui¸c˜ao das estimativas de V no tempo

N com base nas 100 s´eries simuladas do modelo normal AR(3)

condici-onalmente a W. Os pontos representam a m´edia amostral do respectivo

conjunto de estimativas pontuais E(V | W, DN). A linha tracejada

repre-senta o valor verdadeiro de V . . . 66

4.15 Resultados para a 1a _r´_{eplica simulada do modelo normal AR(3) com φ =}

(φ1, φ2, φ3) = (0.81, 0.77, −0.86) estimando a variˆancia de evolu¸c˜ao W via

quadratura de Gauss-Hermite. . . 68

4.16 Resultados referentes à estima¸cão da variância de evolu¸cão W e de

ob-serva¸c˜ao V para uma r´eplica simulada do modelo normal AR(3) com

φ = (φ1, φ2, φ3) = (0.81, 0.77, −0.86). . . 68

4.17 Histogramas suavizados para a distribui¸c˜ao das estimativas de φi, i ∈

{1, . . . , 5}, W e V no tempo N com base nas 100 s´eries simuladas do

mo-delo normal AR(3). Os pontos representam a m´edia amostral do respectivo

conjunto de estimativas pontuais E(φi | DN), E(W | DN) e E(V | DN).

A linha tracejada representa o valor verdadeiro de φi, W e V . . . 69

4.18 Resultados para a 1a r´eplica simulada do modelo Poisson AR(1) com

φ1 ∈ {0.5, 0.7, 0.95} (1a, 2a e 3a linhas respectivamente) considerando a

variância de evolu¸cão fixa em seu valor real no processo de estima¸cão. . . 71 4.19 Estimativas a posteriori para a soma do n´ıvel do preditor com o processo

(15)

condicio-nalmente a W, no tempo N com base nas 100 s´eries simuladas do modelo

Poisson AR(1). Os pontos representam a m´edia amostral do respectivo

conjunto de estimativas E(φ | W, DN). A linha tracejada representa o

valor verdadeiro de φ.. . . 72

4.21 Resultados para a 1a _r´_{eplica simulada do modelo Poisson AR(1) com φ}

1 ∈

{0.5, 0.7, 0.95} (1a_{, 2}a _{e 3}a _{colunas respectivamente) estimando a variˆ}_ancia

de evolu¸cão. . . 74 4.22 Resultados referentes à estima¸cão da variância de evolu¸cão W para uma

r´eplica simulada do modelo Poisson AR(1) com φ1 ∈ {0.5, 0.7, 0.95} (1a,

2a e 3a linhas respectivamente). . . 75

4.23 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ no tempo

N com base nas 100 s´eries simuladas com φ ∈ {0.5, 0.7, 0.95}. Os

pon-tos representam a m´edia amostral do respectivo conjunto de estimativas

pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 76

4.24 Resultados para uma r´eplica simulada do modelo Poisson AR(2) com φ =

(φ1, φ2) = (0.1, 0.8) considerando a variˆancia de evolu¸c˜ao fixa em seu valor

real no processo de estima¸c˜ao. . . 77

condi-cionais a W no tempo N com base nas 100 s´eries simuladas com φ =

(φ1, φ2) = (0.1, 0.8). Os pontos representam a m´edia amostral do

respec-tivo conjunto de estimativas pontuais E(φ1 | W, DN) ou E(φ2 | W, DN).

A linha tracejada representa o valor verdadeiro de φ1 e φ2. . . 78

4.26 Resultados para uma r´eplica simulada do modelo Poisson AR(2) com

φ = (φ1, φ2) = (0.1, 0.8) estimando a variância de evolu¸cão através de

(16)

N com base nas 100 s´eries simuladas do modelo Poisson AR(2) com

φ = (φ1, φ2) = (0.1, 0.8). Os pontos representam a m´edia amostral do

respectivo conjunto de estimativas pontuais E(φ1 | DN), E(φ2 | DN) e

E(W | DN). A linha tracejada representa o valor verdadeiro de φ1, φ2 e W. 79

(φ1, φ2, φ3) = (0.81, 0.77, −0.86) considerando a variˆancia de evolu¸c˜ao fixa

em seu valor real no processo de estima¸c˜ao. . . 81

4.29 Histogramas suavizados para a distribui¸c˜ao das estimativas de φi, i{1, . . . , 5}

condicionais a W no tempo N com base nas 100 s´eries simuladas do

mo-delo Poisson AR(3). Os pontos representam a m´edia amostral do

respec-tivo conjunto de estimativas pontuais E(φi | W, DN). A linha tracejada

representa o valor verdadeiro de φi. . . 82

(φ1, φ2, φ3) = (0.81, 0.77, −0.86) estimando a variˆancia de evolu¸c˜ao. . . . 83

4.31 Resultados referentes à estima¸cão da variância de evolu¸cão W para a

pri-meira r´eplica simulada do modelo Poisson AR(3) com φ = (φ1, φ2, φ3) =

(0.81, 0.77, −0.86). . . 84

4.32 Histogramas suavizados para a distribui¸c˜ao das estimativas de φi, i ∈

{1, . . . , 5} e W no tempo N com base nas 100 s´eries simuladas do modelo

Poisson AR(3). Os pontos representam a m´edia amostral do respectivo

conjunto de estimativas pontuais E(φi | DN) ou E(W | DN). . . 84

4.33 Resultados para uma r´eplica simulada do modelo binomial AR(1) com

φ1 ∈ {0.5, 0.7, 0.95} (1a, 2a e 3a linhas respectivamente) considerando a

variância de evolu¸cão fixa em seu valor real no processo de estima¸cão. . 86

N condicionalmente a W com base nas 100 s´eries simuladas do modelo

binomial AR(1). Os pontos representam a m´edia amostral do respectivo

(17)

4.35 Resultados para a primeira r´eplica simulada do modelo binomial AR(1) com φ1 ∈ {0.5, 0.7, 0.95} (1a, 2a e 3a colunas, respectivamente) estimando

a variância de evolu¸cão. . . 88 4.36 Resultados referentes à estima¸cão da variância de evolu¸cão W para uma

r´eplica simulada do modelo binomial AR(1) com φ1 ∈ {0.5, 0.7, 0.95}. . . 89

4.37 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ e W no

tempo N com base nas 100 s´eries simuladas com do modelo binomial

AR(1). Os pontos representam a m´edia amostral do respectivo conjunto

de estimativas pontuais E(φ | DN) e E(W | DN). . . 90

4.38 Resultados para a primeira r´eplica simulada do modelo binomial AR(2)

considerando a variˆancia de evolu¸c˜ao fixa em seu valor real no processo de

estima¸c˜ao. . . 91

4.39 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ1 e φ2

con-dicionalmente a W no tempo N com base nas 100 s´eries simuladas do

modelo binomial AR(2). Os pontos representam a m´edia amostral do

res-pectivo conjunto de estimativas pontuais E(φi | W, DN), i ∈ {1, 2}. . . . 91

estimando a variˆancia de evolu¸c˜ao. . . 92

pri-meira r´eplica simulada do modelo binomial AR(2). . . 93

4.42 Histogramas suavizados para a distribui¸c˜ao das estimativas de φ1 e φ2 no

tempo N com base nas 100 s´eries simuladas com φ = (φ1, φ2) = (0.1, 0.8).

Os pontos representam a m´edia amostral do respectivo conjunto de

esti-mativas pontuais E(φi | DN), i ∈ {1, 2} e E(W | DN). . . 93

considerando a variância de evolu¸cão fixa em seu valor real no processo de estima¸cão. . . 95

(18)

4.44 Histogramas suavizados para a distribui¸c˜ao das estimativas de φi

condi-cionais a W no tempo N com base nas 100 s´eries simuladas do modelo

binomial AR(3) com φ = (φ1, φ2, φ3) = (0.81, 0.77, −0.86). Os pontos

representam a m´edia amostral do respectivo conjunto de estimativas

pon-tuais E(φi | W, DN), i ∈ {1, . . . , 5}. . . 96

estimando a variˆancia de evolu¸c˜ao. . . 97

pri-eira r´eplica simulada do modelo nbinomial AR(3). . . 97

N com base nas 100 s´eries simuladas do modelo binomial AR(3) com φ =

(φ1, φ2, φ3) = (0.81, 0.77, −0.86). Os pontos representam a m´edia amostral

do respectivo conjunto de estimativas pontuais E(φi | DN), i ∈ {1, . . . , 5}

e E(W | DN). . . 98

5.1 S´eries temporais da vari´avel resposta e das regressoras. . . 102

5.2 Intervalos de credibilidade a posteriori (m´edia ± 2 desvios) para os parˆametros

est´aticos do modelo 7, condicionalmente a toda a s´erie de dados, obtidos

via metodologia sequencial e via MCMC. . . 109

5.3 Fun¸c˜ao de resposta imediata ao impulso (γt) estimada sequencialmente e

via MCMC no modelo 7. Exibe-se a s´erie real e intervalos de credibilidade

a posteriori (m´edia ± 2 desvios) condicionalmente a toda a s´erie de dados. 110

5.4 Histograma (MCMC) e curva de densidade aproximada (metodologia

se-quencial) para a variˆancia de evolu¸c˜ao a posteriori no modelo 7. Curva

obtida com 15 pontos na quadratura de Gauss-Hermite. . . 111

5.5 Intervalos de credibilidade a posteriori (m´edia ± 2 desvios-padr˜oes) para

os parâmetros estáticos considerando-se toda a série de dados. . . 114

5.6 Fun¸c˜ao de resposta ao impulso estimada para o modelo 4.. . . 114

5.7 Previsões um passo à frente para o número de óbitos de crian¸cas por doen¸ca respiratória em São Paulo . . . 115

(19)

Cap´ıtulo 1

Introdu¸

c˜

ao

Em muitas situa¸cões de caráter prático, existe o interesse, ou a necessidade, em com-preender o comportamento de alguma variável no decorrer do tempo ou mesmo em prever a trajetória de tal variável em tempos futuros. Nesses contextos, é comum que se receba novas informa¸cões com o passar do tempo, o que requer múltiplas aplica¸cões do procedi-mento inferencial adotado, visando incorporar novas observa¸cões de variáveis ao modelo conforme elas se tornam dispon´ıveis. Assim, é natural recorrer a procedimentos sequen-ciais de inferência para modelagem de séries temporais.

Os modelos de espa¸co de estados, também conhecidos como modelos dinâmicos, têm sido amplamente utilizados nos últimos anos para tratar de dados com dependência tem-poral sob enfoque bayesiano. Essa classe de modelos é bastante flex´ıvel, permitindo efeitos latentes estáticos e dinâmicos sobre a resposta. A dinâmica de tais efeitos é determinada por uma matriz de evolu¸cão que pode depender de hiperparâmetros, em geral, desco-nhecidos. Nessas circunstâncias, é fundamental a inferência sobre tais parâmetros, uma vez que eles determinam a dinâmica de processos latentes que por sua vez descreverão o comportamento da variável resposta ao longo do tempo.

Nos modelos dinâmicos em que a variável resposta é um membro da fam´ılia exponen-cial e não há parâmetros desconhecidos na matriz de evolu¸cão, West et al. (1985) des-crevem metodologia sequencial de inferência para os estados (feita em termos de média e matriz de covariâncias), propondo especifica¸cão da sequência de variâncias de evolu¸cão via fatores de desconto. Em contextos onde existem parâmetros a serem estimados na

(20)

ma-triz de evolu¸cão,Pole(1988) ePole e West(1990) propõem a estima¸cão sequencial de tais parâmetros utilizando quadratura de Gauss-Hermite, também especificando a sequência de variâncias de evolu¸cão através de fatores de desconto, porém somente abordam casos em que se tem normalidade para a variável resposta.

Nesta disserta¸cão, propõe-se um esquema sequencial de inferência bayesiana em mo-delos dinâmicos na fam´ılia exponencial com hiperparâmetros na matriz de evolu¸cão. Para inferir sobre os hiperparâmetros utilizamos a expansão do vetor de estados e lineariza¸cão da equa¸cão de evolu¸cão. A variância de evolu¸cão de componentes dinâmicas é suposta constante e estimada via quadratura de Gauss-Hermite.

A implementa¸c˜ao da metodologia sequencial proposta foi feita em linguagem R (R Development Core Team, 2008), com utiliza¸c˜ao do pacote fastGHQuad (Blocker, 2014) para obter os pontos da quadratura de Gauss-Hermite e pesos associados.

A seguir, descreve-se brevemente a estrutura da disserta¸c˜ao.

No cap´ıtulo 2, apresenta-se conceitos gerais sobre inferência bayesiana e modelos dinâmicos que servirão como base para o restante da disserta¸cão. Neste cap´ıtulo, considera-se modelos dinâmicos com resposta pertencente à fam´ılia exponencial e descreve-se em linhas gerais o procedimento sequencial proposto porWest et al.(1985) em tais modelos. O cap´ıtulo 3 aborda modelos dinâmicos não lineares, apresentando a metodologia sequencial proposta para estima¸cão dos estados, dos parâmetros de não-linearidade (ou hiperparâmetros) que caracterizam a dinâmica dos estados e das variâncias de evolu¸cão. As variâncias de evolu¸cão são estimadas via quadratura de Gauss Hermite ou especi-ficadas via fatores de desconto. A estima¸cão dos hiperparâmetros é feita incluindo-os como componentes do vetor de estados aplicando-se, em seguida, técnicas de lineariza¸cão que possibilitam aplicar do esquema sequencial para estima¸cão dos estados, descrito em

West et al. (1985). Além disso, descreve-se brevemente dois tipos de processos latentes (processos autorregressivos e de fun¸cão de transferência), que serão abordados no estudo simulado e na aplica¸cão a dados reais.

O cap´ıtulo 4 consiste num estudo simulado de modelos dinâmicos normal, poisson e binomial com estrutura latente autorregressiva de ordem 1, 2 e 3 aplicando-se a metodolo-gia sequencial descrita no cap´ıtulo 3. O objetivo é identificar a eficiência do procedimento

(21)

sequencial em estimar tais processos, bem como os parˆametros que os definem.

O cap´ıtulo 5 descreve uma aplica¸cão a dados reais no contexto de desfechos epide-miológicos, onde estuda-se a modelagem de efeitos cumulativos de regressoras sobre a resposta através de fun¸cões de transferência. Neste cap´ıtulo, faz-se uma compara¸cão entre as estimativas obtidas sequencialmente através da metodologia proposta neste tra-balho e obtidas por método de Monte Carlo via Cadeias de Markov (MCMC), utilizando o esquema proposto por Gamerman (1998) e aplicado a esse contexto de fun¸cões de transferência por Alves et al. (2010).

Em seguida, o cap´ıtulo 6 apresenta as conclusões gerais sobre a metodologia proposta na disserta¸cão, descrevendo poss´ıveis extensões do método e aplica¸cões para trablhos futuros.

Por fim, o apêndice apresenta a parametriza¸cão adotada para algumas das distri-bui¸cões que aparecem ao longo do texto. São elas: beta binomial, binomial negativa, gama, gama inversa, log normal, t-student com parâmetros de posi¸cão e escala e t-student multivariada com posi¸cão e escala.

(22)

Cap´ıtulo 2

Estima¸

c˜

ao bayesiana e modelos

dinˆ

amicos

Este cap´ıtulo faz uma breve introdu¸cão à inferência paramétrica sob enfoque baye-siano, apresentando os conceitos básicos referentes a estima¸cão de parâmetros e a rea-liza¸cão de previsões. Apresenta-se, em seguida, a classe dos modelos dinâmicos (também conhecidos na literatura como modelos de espa¸co de estados), os quais permitem que um conjunto de parâmetros responsáveis pela descri¸cão probabil´ıstica das observa¸cões varie com o decorrer do tempo. Considera-se primeiramente o caso em que a variável resposta tem distribui¸cão normal para, em seguida, tratar do caso mais geral em que a resposta é um membro da fam´ılia exponencial. O caso em que a evolu¸cão dos parâmetros do modelo ocorre de forma não linear é tratado no cap´ıtulo 3.

2.1 Inferˆ

encia bayesiana

Considere Y uma variável de interesse com distribui¸cão de probabilidade caracteri-zada por um vetor de parâmetros θ. Em geral, visando compreender o comportamento probabil´ıstico de Y , obtém-se uma amostra aleatória y1, . . . , yn dessa variável, a partir

da qual obtém-se estimativas para θ. A plausibilidade desse procedimento reside no fato de que os dados observados carregam consigo informa¸cão sobre os parâmetros θ, sendo essa informa¸cão traduzida formalmente em termos matemáticos pela fun¸cão de

(23)

verossi-milhan¸ca l(· ; y1, . . . , yn) : Θ → R+, dada por l(θ ; y1, . . . , yn) = p(y1, . . . , yn| θ), onde

Θ é o espa¸co paramétrico e p(y1, . . . , yn | θ) é a fun¸cão de densidade de (y1, . . . , yn) no

caso em que o vetor é cont´ınuo, ou a fun¸cão de probabilidades quando o vetor é discreto. A verossimilhan¸ca pode ser vista, portanto, como medida de plausibilidade para o valor θ ∈ Θ à luz das observa¸cões (y1, . . . , yn).

Sob o paradigma bayesiano considera-se também a informa¸cão subjetiva sobre o ve-tor paramétrico θ. Essa informa¸cão é traduzida matematicamente pela distribui¸cão de probabilidades a priori p : Θ → R+_{, a qual ´}_{e especificada previamente `}_{a observa¸c˜}_{ao dos}

dados, de modo que toda informa¸c˜ao proveniente dos dados esteja contida apenas na fun¸c˜ao de verossimilhan¸ca.

O Teorema de Bayes, enunciado a seguir, estabelece a rela¸cão entre priori e verossi-milhan¸ca na composi¸cão da incerteza acerca dos parâmetros.

Teorema 2.1. (Teorema de Bayes) Sejam θ ∈ Θ o vetor de parâmetros, p(θ) a densidade (ou fun¸cão de probabilidade) a priori, e y o vetor de observa¸cões com verossimilhan¸ca l(θ; y) = p(y | θ). Então, a distribui¸cão a posteriori é dada por

p(θ | y) = p(y | θ)p(θ)

R p(y | θ)p(θ)dθ ∝ p(y | θ)p(θ),

em que o produto p(y | θ)π(θ), bem como qualquer de seus múltiplos por fun¸cões que não dependam de θ, é chamado núcleo da distribui¸cão a posteriori.

A incerteza sobre θ após a observa¸cão dos dados é representada em termos proba-bil´ısticos através da distribui¸cão a posteriori, cuja densidade (ou fun¸cão de probabilidade) ´

e denotada por p(· | y1, . . . , yn) : Θ → R+. A partir da distribui¸c˜ao a posteriori s˜ao

cal-culadas as estimativas pontuais dos parˆametros e medidas de incerteza referentes ao processo de estima¸c˜ao, dentre outras quantidades de interesse poss´ıveis.

(24)

2.1.1 Estima¸

c˜

ao pontual

O processo de estima¸cão pontual do vetor paramétrico θ com dimensão, digamos, p×1 pode ser visto sob o paradigma da teoria da decisão (Migon et al., 2014). O objetivo ´

e sintetizar a informa¸cão sobre θ em um único ponto ˆθ do suporte da distribui¸cão a posteriori.

Considere Ω o conjunto de todos os valores poss´ıveis para um vetor de observa¸cões y = (y1, . . . , yn). Define-se a regra de decisão δ : Ω → A como a fun¸cão que associa a cada

vetor de observa¸cões y a decisão δ(y) no espa¸co das a¸cões A. Em seguida, especifica-se a fun¸c˜_{ao de perda L : A × Θ → R}+ _{que associa `}_{a decis˜}_{ao δ(y) ∈ A uma perda que depende}

do verdadeiro valor de θ ∈ Θ. Por fim, define-se a fun¸c˜ao de risco R(δ) = E[L(δ, θ) | y], que representa a perda esperada quando se adota a decis˜ao δ = δ(y).

O objetivo é, dadas a fun¸cão de perdas L e as observa¸cões y, tomar a decisão ótima δ = δ(y) que minimiza o risco R(δ) = E[L(δ, θ) | y]. A regra de decisão ótima é conhecida em pelo menos 3 importantes casos:

• Perda quadrática: L(δ, θ) = (δ − θ)0(δ − θ). A decisão ótima é a média a pos-teriori δ = ˆθ = E(θ | y).

• Perda absoluta: L(δ, θ) = kδ − θk.A decisão ótima é a mediana a posteriori: δ = ˆθ = med, onde P (θ < med | y) = 0, 5. Aqui, quando θ é multidimensional, a desigualdade θ < med significa que cada entrada de θ é menor que a respectiva entrada do vetor med.

• Perda 0 − 1: L(δ, θ) = I(δ = θ) =      1 se δ = θ, 0 se δ 6= θ.

A decisão ótima nesse caso é a moda a posteriori δ = ˆθ = arg max θ∈Θ

(25)

2.1.2 Estima¸

c˜

ao por intervalo

Em muitos problemas práticos, existe interesse não apenas em estimativas pontuais dos parâmetros, mas também na incerteza associada a essas medidas. Dessa forma, tem-se o interestem-se em considerar alguma medida resumo da posteriori que tem-seja capaz de refletir a incerteza associada ao procedimento de estima¸cão pontual. No caso, uma possibilidade ´

e realizar estima¸c˜ao atrav´es de intervalos de credibilidade a posteriori.

Uma regi˜_{ao C ⊂ R}p _´_{e dita regi˜}_{ao de credibilidade com probabilidade γ a posteriori}

para θ se P (θ ∈ C | y) = γ, onde p é a dimensão de θ. No caso θ unidimensional, refere-se a C como intervalo de credibilidade. Além disso, no caso em que p > 1, costuma-se reportar intervalos de credibilidade marginais unidimensionais para cada componente do vetor de estados θ.

2.1.3 Aspecto sequencial do Teorema de Bayes

O Teorema de Bayes pode também ser visto sob o aspecto sequencial, segundo o qual cada observa¸cão é incorporada em sequência à informa¸cão a priori para compor a distribui¸cão a posteriori. Mais especificamente, denotando o vetor de observa¸cões por y = (y1, y2, ..., yn), temos no instante zero a distribui¸cão a priori p(θ). Incorporada a

primeira observa¸cão y1 à informa¸cão a priori, atualiza-se a incerteza a respeito de θ

atrav´es do Teorema de Bayes, obtendo assim a distribui¸c˜ao a posteriori no tempo 1:

p(θ | y1) ∝ p(y1 | θ)p(θ)

Agora, no instante 2, toda a informa¸cão prévia a respeito de θ (representada pela posteriori no instante 1: p(θ | y1)) é considerada informa¸cão a priori e, ao ser combinada

com a observa¸c˜ao no tempo corrente, resulta na posteriori no instante 2:

p(θ | y1, y2) ∝ p(y2 | θ, y1)p(θ | y1) = p(y2 | θ)p(θ | y1),

onde a igualdade ocorre quando se supõe independência entre as observa¸cões dado o conhecimento do vetor paramétrico, o que significa assumir que o vetor paramétrico sin-tetiza toda a informa¸cão necessária para determina¸cão do comportamento probabil´ıstico

(26)

de yi. Em outras palavras, o conhecimento de yj , para qualquer j 6= i, n˜ao altera em

nada a distribui¸cão probabil´ıstica de yi se os parâmetros são conhecidos.

Prosseguindo com o mesmo racioc´ınio, tem-se no tempo n a rela¸c˜ao de recorrˆencia

p(θ | y1, ..., yn) ∝ p(yn | θ)p(θ | yn−1, ..., y1),

que permite chegar `a f´ormula enunciada no Teorema de Bayes:

p(θ | y1, ..., yn) ∝ p(yn | θ)p(yn−1 | θ)...p(y1 | θ)p(θ)

= p(y | θ)p(θ),

onde a igualdade novamente ocorre quando se supõe independência entre as observa¸cões condicionalmente ao vetor paramétrico. Portanto, a distribui¸cão a posteriori obtida se-quencialmente é a mesma que se obtém com uma única aplica¸cão do Teorema de Bayes considerando o vetor completo y = (y1, ..., yn).

Nesse ponto, cabe uma breve considera¸cão sobre a nota¸cão que por vezes será usada ao longo deste trabalho no que se refere à atualiza¸cão sequencial de informa¸cão segundo a ótica bayesiana. Considera-se D0 o conjunto contendo a informa¸cão necessária para

compor a distribui¸cão a priori p(θ). Recursivamente, tem-se no instante t o conjunto Dt−1 representando toda informa¸cão dispon´ıvel a priori, ou seja, até o instante t − 1.

Com a chegada de uma nova observa¸c˜ao yt, tem-se Dt = {yt} ∪ Dt−1 no caso em que

não se deseja incorporar nenhuma informa¸cão externa aos dados do instante t − 1 para o instante t. Portanto, em problemas onde se utiliza de informa¸cão subjetiva apenas no instante prévio à observa¸cão do primeiro dado y1, tem-se Dt = {y1, . . . , yt} ∪ D0.

2.1.4 Previs˜

oes

A distribui¸cão preditiva é um objeto probabil´ıstico que permite não só fazer previsões como também avaliar a adequa¸cão do modelo teórico formulado pelo estat´ıstico, pois permite verificar se o modelo obtido é capaz de reproduzir dados próximos dos que foram observados sob o ponto de vista preditivo.

(27)

A distribui¸cão preditiva para um vetor de dados não observados z a partir do con-junto de observa¸cões y é a fun¸cão densidade (ou fun¸cão de probabilidade) dada por

p(z | y) = Z

Θp(z | θ)p(θ | y)dθ = Eθ|y [p(z | θ)] .

A distribui¸cão preditiva para z pode ser interpretada como uma média dos valores de l(θ; z) = p(z | θ) ponderados pela posteriori p(θ | y). Neste ponto, é importante obser-var que a predi¸cão feita desta forma está condicionada apenas ao vetor de observa¸cões, sem nenhuma dependência anal´ıtica com respeito ao vetor paramétrico.

2.1.5 Estimador linear de Bayes

Conforme visto na subse¸cão 2.1.1, fixada uma fun¸cão de perda, a teoria da decisão fornece o estimador ótimo para o vetor paramétrico θ procurando dentre todas as fun¸cões dos dados, que aqui representamos por δ = δ(y), aquela que minimiza o risco a posteriori R(δ) = E[L(δ, θ) | y].

Existem casos em que não se conhece a forma anal´ıtica do estimador ótimo de θ segundo o critério de minimiza¸cão do risco a posteriori, mesmo quando se utiliza uma das fun¸cões de perda apresentadas na subse¸cão 2.1.1. Isso pode ocorrer, por exemplo, quando não se tem forma anal´ıtica dispon´ıvel para a densidade posteriori p(θ | y) e, por consequência, não se consegue obter a média, moda ou mediana para θ | y.

Nessas circunstâncias, o processo de estima¸cão linear de Bayes fornece uma apro-xima¸cão para a solu¸cão ótima dada pela teoria da decisão quando se considera a fun¸cão de perda quadrática. O procedimento, ao invés de minimizar o risco a posteriori sob todas as poss´ıveis fun¸cões dos dados, minimiza o risco a priori E[L(δ, θ)], restringindo-se as decisões a fun¸cões lineares d(y) do vetor de observa¸cões. O estimador obtido dessa forma recebe o nome de estimador linear de Bayes, e sua perda quadrática é usada como aproxima¸cão para a variância a posteriori de θ.

(28)

Proposi¸cão 2.1. (Estimador Linear de Bayes) O estimador linear de Bayes para θ é a fun¸cão linear das observa¸cões d = d(y) que minimiza a perda quadrática esperada a priori E[(θ − d)0(θ − d)].

Em suma, o estimador linear de Bayes pode ser visto como uma aproxima¸cão linear para a fun¸cão δ(y) = E(θ | y) e o risco associado ao estimador linear de Bayes constitui uma aproxima¸cão para V ar(θ | y).

A obten¸cão de estimadores lineares de Bayes é parte essencial do procedimento de in-ferência sequencial em modelos dinâmicos descrito na se¸cão2.2. Em particular, utiliza-se a proposi¸cão a seguir, cuja demonstra¸cão pode ser vista emWest e Harrison (1997).

Proposi¸cão 2.1. Suponha um vetor aleatório (θ, y) com vetor de médias e matriz de covariâncias dados por

  y θ  ∼     f a  ,   Q S0 S R    .

Nesse caso, o estimador linear de Bayes para θ é d = d(y) = a + SQ−1(y − f ) e a perda quadrática esperada para esse estimador é R − SQ−1S0. Naturalmente, o valor R − SQ−1S corresponde à menor perda esperada a priori sob fun¸cões lineares das ob-serva¸cões y.

Note-se que, sob normalidade da distribui¸c˜ao conjunta (y, θ), o estimador linear de Bayes para θ coincide com a esperan¸ca a posteriori E(θ | y) e o risco associado coincide com a variˆancia a posteriori V ar(θ | y).

(29)

2.2 Modelos dinˆ

amicos

Os modelos dinâmicos, também conhecidos como modelos de espa¸co de estados, assu-mem que a cada tempo t ∈ N a observa¸cão yté caracterizada probabilisticamente por um

vetor de parˆametros θt (denominado vetor de estados) cujas componentes podem variar

ao longo do tempo.

2.2.1 Modelos lineares dinˆ

amicos

Um modelo linear dinâmico (MLD) em sua forma geral é descrito por duas equa¸cões: a equa¸cão de observa¸cão, que descreve a rela¸cão entre covariáveis e a variável resposta, e a equa¸cão de evolu¸cão, que descreve a forma com que os parâmetros do modelo evoluem com o tempo:

yt = F0tθt+ vt, vt∼ N (0, Vt)

θt = Gtθt−1+ wt, wt∼ N (0, Wt), (2.1)

sendo (vt)t∈Ne (wt)t∈N sequências de variáveis aleatórias tais que vt⊥vs, e wt⊥ws, ∀t 6=

s. Além disso, vt⊥ws, ∀s, t. O erro vt é chamado erro de observa¸cão e wt é chamado

erro de evolu¸c˜ao.

Um MLD ´e, portanto, caracterizado pela qu´adrupla (Ft, Gt, Vt, Wt), onde:

• Ft´e o vetor de planejamento no tempo t, com valores conhecidos que podem conter

vari´aveis explicativas: Ft = (x1t, . . . , xpt)0;

• yt ´e a resposta observada no tempo t;

• θt´e o vetor param´etrico no tempo t: θt= (θ1t, . . . , θpt)0;

(30)

As variâncias Vt e Wt controlam a magnitude dos erros de observa¸cão e de evolu¸cão,

respectivamente. Quanto maiores os valores na posi¸cão i, i ∈ {1, . . . , p} da diagonal das matrizes de covariâncias Wt, t ∈ {1, . . . , p}, mais volátil é a trajetória da componente

θi,t do vetor de estados θt ao longo do tempo, e quanto maiores os valores de Vt, maior

´

e a variabilidade das observa¸c˜oes em torno do preditor linear ηt = F0tθt que, no caso

normal, coincide com a m´edia da vari´avel resposta: E(yt) = µt= ηt.

A classe MLD abrange vários tipos de modelos importantes, como os Modelos de Re-gressão Linear Normais (Ft, Gt= I, Vt = σ2, Wt = 0) e os Modelos de Séries Temporais

(Ft= F , Gt= G, Vt, Wt).

Sob o enfoque Bayesiano necessita-se ainda especificar as distribui¸cões a priori para os parâmetros de interesse de modo a completar a descri¸cão do modelo. Adotando priori normal para θ1 e conhecidos Vt e Wt, tem-se forma anal´ıtica fechada para as posterioris

θt | Dt, t = 1, 2, . . . , conforme an´alise bayesiana sequencial do modelo (2.1) dada pelas

equa¸c˜oes a seguir, em que θt−1| Dt−1∼ N (mt−1, Ct−1).

Priori no tempo t: θt | Dt−1 ∼ N (at, Rt),      at = Gtmt−1 Rt = GtCt−1G0t+ Wt, Preditiva no tempo t: yt| Dt−1 ∼ N (ft, Qt),      ft = F0tat Qt = F0tRtFt+ Vt,

Vetor de coeficientes adaptativos At e erro de previs˜ao et:

     At = RtFtQ−1t et = yt− ft, Posteriori no tempo t: θt | Dt∼ N (mt, Ct),      mt = at+ Atet Ct = Rt− AtA0tQt.

(31)

Note-se, a partir das equa¸cões, que yt não consta na expressão anal´ıtica de nenhuma

das variˆancias Rt, Qt, Ct, portanto, as variˆancias a posteriori diag(Ct) decrescem em

fun¸c˜ao apenas da quantidade de observa¸c˜oes contida no vetor de dados, independente-mente dos particulares valores observados para yt.

Nessas circunstˆancias tem-se conjuga¸c˜ao para o vetor de estados, portanto θt | Dt e

θt | Dt−1 têm distribui¸cão normal ∀t ∈ N e as preditivas yt | Dt−1 também são obtidas

analiticamente e possuem distribui¸c˜ao normal.

Também é poss´ıvel obter forma anal´ıtica fechada para as posterioris via conjuga¸cão no caso em que Vt = V, ∀t ∈ N com V desconhecido. Nessas circunstâncias, obtém-se

con-juga¸c˜ao adotando priori Normal-Gama (West e Harrison,1997) para o vetor (θt, τ ) | Dt,

onde τ = 1/V . Marginalmente, o vetor de estados θt tem distribui¸c˜ao T-Student

multi-variada (tanto a priori quanto a posteriori) e a precis˜ao dos erros de observa¸c˜ao τ | Dt

tem distribui¸cão Gama. As equa¸cões do procedimento sequencial bayesiano para o caso em que V é desconhecido estão descritas a seguir, onde V | Dt−1∼ GamaInv(nt−1₂ ,dt−1₂ )

e θt−1 | Dt−1 ∼ N (mt−1, Ct−1). Esse conjunto de equa¸c˜oes consta em West e Harrison

(1997) pp. 119 a 122. Priori no tempo t: θt | Dt−1 ∼ Tnt−1(at, Rt),      at = Gtmt−1 Rt = GtCt−1G0t+ Wt, (2.2) Preditiva no tempo t: yt| Dt−1 ∼ Tnt−1(ft, Qt), (St−1= dt−1/nt−1)      ft = F0tat Qt = F0tRtFt+ St−1, (2.3)

Vetor de coeficientes adaptativos At e erro de previs˜ao et:

     At = RtFtQ−1t et = yt− ft, (2.4)

(32)

     nt = nt−1+ 1 dt = dt−1+ St−1e2t/Qt, (2.5) Posteriori no tempo t: θt | Dt∼ Tnt(mt, Ct), (St = dt/nt)      mt = at+ Atet Ct = (Rt− AtA0tQt)St/St−1. (2.6)

No caso em que se desconhece as variâncias de evolu¸cão, as posterioris marginais (tanto para os estados quanto para a variância observacional) não são mais conhecidas analiticamente. Existem diversas propostas na literatura para tratar deste caso, dentre as quais cita-se aqui apenas algumas delas a t´ıtulo de exeplifica¸cão. Frühwirth-Schnater

(1994) eCarter e Kohn(1994) descrevem um esquema MCMC para o caso em que V e W s˜ao constantes no tempo onde as condicionais completas de V , W e θt s˜ao conhecidas,

permitindo assim a simula¸cão de cadeias através do amostrador de Gibbs. Posterior-mente, Gamerman (1998) descreve outro amostrador de Gibbs obtido reparametrizando o modelo em termos dos erros de evolu¸cão wt, reconstruindo-se o vetor de estados θt ao

final da gera¸cão das cadeias. No que tange aplica¸cão de metodologia sequencial, diversos esquemas para implementa¸cão de filtros de part´ıculas podem ser considerados, dentre os quais cita-se aquiLiu e West(2001),Storvik(2002) eCarvalho et al.(2010) por tratarem do caso geral em que θt contém, possivelmente, componentes estáticas e as variâncias

V e W são desconhecidas. Cada um dos três trabalhos propõe uma forma diferente de tratar o problema de degenera¸cão das part´ıculas conforme o tempo progride.

´

E poss´ıvel incorporar aos modelos dinˆamicos diversos tipos de estruturas latentes para descrever a evolu¸c˜ao do processo observado yt. Essa classe de modelos permite tratar,

por exemplo, de séries que apresentem simultaneamente uma tendência polinomial linear, sazonalidade, influência de covariáveis e assim por diante. Mais precisamente, cada uma das p estruturas latentes corresponde a um bloco θi,tde componentes do vetor de estados,

a uma matriz de evolu¸c˜ao Gi,t, a uma matriz de planejamento Fi,t e uma matriz de

covariˆancias Wi,t, de modo que o modelo dinˆamico constitu´ıdo por Ft = (F1, ..., Fp)t,

(33)

(θi, ..., θp)tincorpora simultaneamente todas as p estruturas latentes. Para uma descri¸c˜ao

mais detalhada quanto `a especifica¸c˜ao de Gi,t, Fi,te Wi,tpara diversos tipos de estruturas

latentes, referencia-se West e Harrison(1997) cap´ıtulos 6 a 9.

O exemplo a seguir considera um MLD com um ´unico componente no vetor de estados com dinˆamica dada por um processo autorregressivo.

Exemplo 2.1. Considere o MLD dado pela qu´adrupla {1, φ, Vt, Wt}, onde Vt, Wt e φ

s˜ao conhecidos:

yt= θt+ vt, vt∼ N (0, Vt)

θt= φθt−1+ wt, wt∼ N (0, Wt).

As equa¸c˜oes de atualiza¸c˜ao aplicadas ao MLD {1, φ, Vt, Wt} resultam em

at= φmt−1 Rt= φ2Ct−1+ Wt, ft= at = φmt−1, Qt= Rt+ Vt, At= Rt Rt+ Vt , et= yt− φmt−1, mt= φmt−1+ Rt Rt+ Vt (yt− φmt−1) Ct= AtVt.

No caso espec´ıfico do modelo tratado no exemplo 2.1, é poss´ıvel obter facilmente expressões anal´ıticas para o limite da sequência de variâncias a posteriori (Ct)t∈N, se

(Vt)t∈N e (Wt)t∈N são sequências convergentes, como aponta a Proposi¸cão2.2 a seguir.

Proposi¸c˜ao 2.2. Considere o MLD dado pela qu´adrupla {1, φ, Vt, Wt}, onde Vt e Wt

(34)

sequência Ct converge, então seu valor limite é

C = −(W + V − φ

2_{V ) +}_{p(V + W + φ}2_{V )}2_{+ 4φW V}

2φ2 .

Demonstra¸c˜ao. No MLD {1, φ, Vt, Wt}, tem-se

Ct= AtVt = RtVt Rt+ Vt = (φ 2_C t−1+ Wt)Vt φ2_C t−1+ Wt+ Vt . Supondo lim Wt= W e lim Vt= V e que ∃C = lim Ct, tem-se

C = (φ

2_{C + W )V}

φ2_{C + W + V} ,

donde φ2_C2_{+ (W + V )C − φ}2_{CV − W V = 0. Resolvendo para C, obt´}_em-se

C = −(W + V − φ

2_{V ) ±}_{p(W + V − φ}2_{V )}2_{+ 4φ}2_{W V}

2φ2 .

Como C ≥ 0, segue que o ´unico limite poss´ıvel para Ct´e

C = −(W + V − φ

2_{V ) +}_{p(W + V − φ}2_{V )}2 _{+ 4φ}2_{W V}

2φ2 .

Cabe citar aqui o Teorema 2.3 emWest e Harrison(1997), que garante que a sequˆencia Ctde variˆancias a posteriori converge em qualquer MLD com vetor de estados

unidimen-sional, desde que as variâncias (observacionais e de evolu¸cão) sejam constantes e conhe-cidas. Sendo esse o caso, a Proposi¸cão 2.2 fornece explicitamente o limite de Ct no caso

particular em que Gt= φ, ∀t ∈ N.

O comportamento assintótico explicitado na Proposi¸cão 2.2 pode ser verificado em-piricamente, como ilustrado pela figura 2.1 para uma série simulada com φ = 1 e outra com φ = 0, 8. Verifica-se que o comportamento limite para as variâncias a posteriori é alcan¸cado rapidamente. A partir de 20 observa¸cões, praticamente não se observa dimi-nui¸cão na incerteza a respeito do processo autorregressivo latente. A partir de tal ponto,

(35)

as observa¸cões acrescentam informa¸cão apenas na média das estimativas pontuais de θt,

permitindo-as acompanhar as varia¸c˜oes na trajet´oria efetiva do processo latente θt. A

distribui¸c˜ao a priori adotada ´e θ1 | D0 ∼ N (0, 100).

0 20 40 60 80 100 0 2 4 6 8 10 t Ct C (a) φ = 1 ● ● ● ● ●● ● ● ●● ●●● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ●● ● ● ●● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● 0 20 40 60 80 100 −10 −5 0 5 10 t ● ● ● ● ●● ● ● ●● ●●● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ●● ● ● ●● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● mt mt±2× Ct (b) φ = 1 0 20 40 60 80 100 0 1 2 3 4 5 6 t Ct C (c) φ = 0.8 ● ● ● ●● ● ● ● ●●●●● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● 0 20 40 60 80 100 −5 0 5 10 t ● ● ● ●● ● ● ● ●●●●● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● mt mt±2× Ct (d) φ = 0.8

Figura 2.1: Estima¸c˜ao de θt ∼ AR(1) em MLD{1, φ, V, W } com φ, W e V conhecidos.

mt = E(θt | Dt), Ct = V ar(θt| Dt). `A esquerda, exibe-se a sequˆencia Ctjuntamente com

o valor limite C dado pela Proposi¸cão2.2. À direita, exibe-se a sequência de estimativas e intervalos de credibilidade a posteriori para os estados.

2.2.2 Modelos lineares generalizados dinˆ

amicos

Os Modelos Lineares Generalizados Dinˆamicos permitem descrever o comportamento probabil´ıstico de observa¸c˜oes yt, cujo ind´ıce t geralmente se refere a uma determinada

(36)

parâmetros variando com o passar do tempo. A classe MLGD é uma extensão dos chamados Modelos Lineares Generalizados (MLG) (Nelder e Wedderburn, 1972) devido a evolu¸cão temporal dos parâmetros de estado θtque descrevem o preditor linear ηt. Em

termos pr´aticos, considerar um MLGD para observa¸c˜oes yt permite que os efeitos latetes

sobre a variável resposta se diferenciem ao longo do tempo. Mais precisamente, um MLGD é descrito por 3 equa¸cões:

p(yt| ψt) = exp Vt−1[ft(yt)ψt− a(ψt)] bt(yt, Vt) (2.7)

ηt = g(ψt) = F0tθt (2.8)

θt = Gtθt−1+ ωt, ωt ∼ [0, Wt] (2.9)

onde a equa¸cão (2.7) representa a densidade ou fun¸cão de probabilidade das observa¸cões ytcomo membro da fam´ılia exponencial, a equa¸cão (2.8) relaciona o parâmetro natural ψt

e o preditor linear ηt através da fun¸cão de liga¸cão g, descrevendo o preditor linear como

fun¸cão linear dos estados θt e, por fim, a equa¸cão (2.9), chamada equa¸cão de evolu¸cão,

descreve a dinˆamica do vetor de estados de maneira linear determinada pela matriz de evolu¸c˜ao Gt.

Em geral, ao longo do texto, usaremos a nota¸cão x ∼ [a, b] para indicar que a variável aleatória (vetor aleatório) x tem média (vetor de médias) a e variância (ma-triz de variância) b, como no caso da equa¸cão (2.9). Usaremos também os termos matriz de variância e matriz de covariâncias de forma indistinta, uma vez que tal matriz pode ser vista como uma generaliza¸cão do conceito de variância para vetores aleatórios (por isso matriz de variância), bem como suas entradas representam as covariâncias dois a dois entre as respectivas componentes do vetor aleatório (por isso matriz de covariâncias).

Com respeito à estima¸cão bayesiana de parâmetros em MLGD, as equa¸cões (2.2), (2.3), (2.4), (2.5) e (2.6) fornecem solu¸cão anal´ıtica no caso particular em que a resposta ´

e normal (e portanto, tem-se em particular um Modelo Linear Dinâmico), a variância de observa¸cão é conhecida e as variâncias dos erros de evolu¸cão são desconhecidas. No caso geral em que a resposta pertence a qualquer membro da fam´ılia exponencial, West et al.

(1985) descrevem uma metodologia sequencial para inferˆencia em MLGD, que se d´a em termos de primeiro e segundo momentos para os estados fazendo uso do procedimento

(37)

de estima¸cão linear de Bayes. Ainda nesse contexto de modelos dinâmicos parcialmente especificados, distribui¸cões preditivas podem ser obtidas analiticamente, bem como dis-tribui¸cões a posteriori para os parâmetros naturais, desde que utilizadas distribui¸cões a priori conjugadas. A necessidade de métodos alternativos para inferência se dá em fun¸cão da estima¸cão dos estados e demais parâmetros, tais como variâncias de evolu¸cão e quantidades desconhecidas na matriz Gt.

2.2.3 Procedimento sequencial de inferˆ

encia em MLGD

Um procedimento para realizar inferˆencia na classe dos MLGD com variˆancias Wt

co-nhecidas de forma sequencial é apresentado em West et al.(1985). Tal metodologia não especifica de forma completa (isto é, fixando-se uma classe de distribui¸cões espec´ıfica) os vetores dos erros de evolu¸cão, mas apenas por meio de um vetor de médias e das matrizes de variância Wt.

A especifica¸c˜ao parcial via 1o _{e 2}o _{momentos para o vetor de erros de evolu¸c˜}_{ao se}

estende para o vetor de estados, cujas posterioris a cada tempo são obtidas apenas via média e matriz de covariâncias.

O esquema iterativo a seguir resume o procedimento inferencial que permite obter vetor de médias e matriz de variância da distribui¸cão a posteriori e os parâmetros da distribui¸cão preditiva no tempo corrente como fun¸cão do vetor de médias e matriz de variância no tempo imediatamente anterior.

Inicialmente, suponha que a posteriori no tempo t−1 esteja parcialmente especificada por θt−1 | Dt−1 ∼ [mt−1, Ct−1]. Ent˜ao, temos para o tempo t,

1. Priori dos estados: θt | Dt−1 ∼ [at, Rt]

 



at= Gtmt−1,

Rt= GtCt−1G0t+ Wt,

2. Priori para o parˆametro canˆonico: g−1(ηt) = ψt| Dt−1 ∼ Priori Conj.(rt, st)

3. Preditor a priori: ηt | Dt−1 ∼ [ft, qt] ηt=F0tθt z}|{_⇒    ft = F0tat = f1(rt, st), qt= F0tRtFt = f2(rt, st),

(38)

4. Posteriori para o parˆametro canˆonico: ψt| Dt∼ Posteriori Conj.(r∗t, s∗t) 5. Preditor a posteriori: ηt= g(ψt) | Dt∼ [ft∗, q∗t]    f_t∗ = f1(rt∗, s ∗ t), q_t∗ = f2(r∗t, s ∗ t),

6. Posteriori dos estados (tempo t): θt| Dt∼ [mt, Ct]

   mt= at+ RtFt(ft∗− ft)/qt, Ct= Rt− RtFtF0t(1 − q ∗ t/qt)/qt.

Primeiramente, no item 1, obtêm-se média e matriz de variância a priori para θt a

partir das mesmas quantidades referentes `a posteriori de θt−1.

O item 2 consiste em especificar priori conjugada para o parˆametro canˆonico ψt

(para-metrizada por quantidades rt e st) segundo a teoria de conjuga¸c˜ao na fam´ılia exponencial

(Migon et al., 2014).

A passagem entre os itens 2 e 3 consiste em calcular os momentos a priori (ft, qt)

para o preditor linear ηt a partir dos momentos a priori (at, Rt) para o vetor de estados

θt utilizando-se da rela¸c˜ao linear ηt= F0tθt.

Como preditor e parâmetro canônico estão relacionados (não-linearmente) de forma determin´ıstica pela fun¸cão de liga¸cão g, os parâmetros rte stdevem ser escolhidos de tal

modo que a m´edia e a variˆancia a priori de ηt sejam iguais aos valores ft e qt obtidos no

passo 3, de modo a compatibilizar a forma anal´ıtica de p(ηt | Dt−1) com os momentos

obtidos no passo 3. Isso é feito resolvendo o sistema não-linear em 3, o que, em geral, não pode ser feito analiticamente. O que se recomenda em West et al. (1985) e West e Harrison (1997) é tomar alguma aproxima¸cão para as fun¸cões f1 e f2 de tal modo que o

novo sistema seja poss´ıvel de ser resolvido analiticamente. Nesse trabalho, para obten¸cão de f1 e f2, utilizaremos a aproxima¸cão de Taylor de 1a ordem para a fun¸cão g(ψt) para

escrever o preditor linear ηt como fun¸cão linear do parâmetro canônico ψt, de modo que

média e variância a priori para ηtsão trivialmente obtidos em fun¸cão da média e variância

(39)

ft= E(ηt | Dt−1) = E(g(ψt) | Dt−1) ≈ E [g(xt) + g0(xt)(ψt− xt)]

= g(xt). (2.10)

qt= V ar(ηt| Dt−1) ≈ V ar [g(xt) + g0(xt)(ψt− xt)]

= g0(xt)2vt (2.11)

Por fim, a conjuga¸cão especificada desta forma é responsável por garantir, a cada tempo t, que a posteriori para o parâmetro canônico ψttenha forma anal´ıtica conhecida,

bem como a distribui¸c˜ao preditiva p(yt| Dt−1).

Note-se pelos passos 3, 4 e 5 que o parâmetro canônico poderia ser substitu´ıdo nesse esquema sequencial por qualquer outro parâmetro que caracterizasse a distribui¸cão dos dados na fam´ılia exponencial, desde que se consiga encontrar conjuga¸cão da priori com a fun¸cão de verossimilhan¸ca. Dessa forma, pode-se utilizar, por exemplo, a média µt =

E(yt | ψt) no lugar do parˆametro canˆonico ψt nos casos em que essa escolha for mais

conveniente do ponto de vista anal´ıtico.

O passo 6 conclui o procedimento sequencial obtendo média e matriz de covariâncias a posteriori para os estados. Essa passagem faz uso da proposi¸cão 2.1 para obter o estimador linear de Bayes para θt como fun¸cão de Dt−1 e ηt a partir do vetor de médias

e matriz de covariˆancias da distribui¸c˜ao a priori conjunta   ηt θt Dt−1  ∼     f_t at  ,   qt F0tRt FtR0t Rt    ,

que se obt´em facilmente a partir da rela¸c˜ao ηt = Ftθt. Conforme enunciado na

Pro-posi¸c˜ao2.1, o estimador linear de Bayes at+ RtFt(ηt− ft)/qtpode ser visto como uma

aproxima¸c˜ao para E[θt | ηt, Dt−1] e o risco associado Rt− RtFtF0tRt/qt constitui uma

aproxima¸c˜ao para V ar[θt| ηt, Dt−1].

A média e matriz de covariâncias incondicionais de θta posteriori são obtidas fazendo

(40)

donde obt´em-se

mt = E(θt| Dt) = at+ RtFt(ft∗− ft)/qt,

Ct = V ar(θt | Dt) = Rt− RtFtF0t(1 − q ∗

/qt)/qt.

A seguir, explicita-se as contas necessárias para realiza¸cão dos passos 2 a 5 descri-tos nessa se¸cão aos modelos com resposta Binomial e Poisson que serão utilizados nas aplica¸cões nos cap´ıtulos 4 e 5.

Modelo Poisson

Escrevendo a distribui¸c˜ao Poisson como membro da fam´ılia exponencial, tem-se

p(yt| µt) = exp{ytlogµt− µt}(yt!)−1

, onde µt= E(ytµt) e portanto ψt = log µt = ηt, onde ηt representa o preditor linear e ψt

representa o parˆametro canˆonico da fam´ılia exponencial.

Especificamos priori conjugada para λtao invés do parâmetro canônico ψt. Então λt|

Dt−1∼ Gama(rt, st) e a fun¸cão g que aparece em (2.10) e (2.11) é a fun¸cão logar´ıtmica.

Assim, escrevendo xt= E(λt | Dt−1) e vt = V ar(λt | Dt−1) temos o sistema

   ft= g(xt) = logrt_st, qt = g0(xt)2vt= _rt1, cuja solu¸c˜ao ´e st= e −ft qt e rt= 1 qt.

Pela conjuga¸c˜ao na fam´ılia exponencial, temos λt | Dt ∼ Gama(rt∗, s∗t), onde rt∗ =

rt+ yt e s∗t = st+ 1. Assim,    f_t∗ = logr∗t s∗ t, q_t∗ = _r1∗ t,

(41)

Por fim, resolvendo a integral Z ∞

0

p(yt| λt, Dt−1)p(λt| Dt−1)dλt,

temos a distribui¸c˜ao preditiva: yt| Dt−1 ∼ BinNeg(rt, 1/(st+ 1)).

Modelo Binomial

Escrevendo yt∼ Bin(nt, pt) como membro da fam´ılia exponencial, tem-se

p(yt| ηt) = exp y_t nt log pt 1 − pt − log 1 1 − pt n_t yt

portanto ψt = log_1−ptpt = ηt, onde ηt representa o preditor linear e ψt representa o

parˆametro canˆonico da fam´ılia exponencial.

Aqui, o parˆametro canˆonico ψt coincide com o preditor linear no caso em que se

utiliza a fun¸cão logito como fun¸cão de liga¸cão. Nesse caso, podemos especificar priori conjugada para a probabilidade de sucesso pt | Dt−1 ∼ Beta(rt, st) e a fun¸cão g que

aparece em (2.10) e (2.11) ´e a fun¸c˜ao logito. Assim, escrevendo xt = E(pt | Dt−1) e

vt = V ar(pt| Dt−1) temos o sistema

   ft= g(xt) = logrt_st, qt= g0(xt)2vt = (rt+st) 2 rtst(rt+st+1), cuja solu¸c˜ao ´e st= e ft_+e−ft_+2−qt qt(eft+1) e rt = e ft_s t.

Pela conjuga¸c˜ao na fam´ılia exponencial, temos pt| Dt∼ Beta(r∗t, s ∗ t), onde r ∗ t = rt+_ntyt e s∗_t = st+ 1 − _ntyt. Assim,    f_t∗ = logrt∗ s∗t, q∗_t = (r∗t+s∗t)2 r∗ ts∗t(rt∗+s∗t+1),

(42)

Resolvendo a integral

Z ∞

0

p(yt | pt, Dt−1)p(pt| Dt−1)dpt,

temos a distribui¸c˜ao preditiva: yt| Dt−1 ∼ BetaBinomial(nt, rt, st).

2.3 Especifica¸

c˜

ao dos erros de evolu¸

c˜

ao via fatores

de desconto

De acordo com as equa¸cões de atualiza¸cão no contexto dos modelos dinâmicos com res-posta na fam´ılia exponencial exibidas na subse¸cão2.2.3, os erros de evolu¸cão wtinfluem

na estima¸c˜ao de θt unicamente atrav´es do aumento da incerteza sobre θt ao passar do

tempo t−1 (priori) para t (posteriori) com o acesso a uma nova observa¸c˜ao yt. De fato, se

não existisse a sequência de erros wt, ou equivalentemente se tivéssemos Wt= 0, ∀t ∈ N,

a única altera¸cão a ser feita seria na equa¸cão Rt = GtCt−1G0t+ Wt, que daria lugar a

Rt= GtCt−1G0t.

Tratando primeiramente o caso Wtescalar (denotando portanto Wt ao inv´es de Wt),

esse acr´escimo de incerteza devido a adi¸c˜ao de Wtpode ser alternativamente representado

pelo produto Rt= 1 δ × GtCt−1G 0 t,

onde δ ∈ (0, 1]. Assim, a quantidade δ denominada fator de desconto, garante equi-valˆencia entre as duas formas alternativas de infla¸c˜ao de incerteza, se fizermos

Rt= GtCt−1G0t+ Wt= 1 δ × GtCt−1G 0 t, donde

(43)

Wt= 1 δ − 1 × GtCt−1G0t = 1 − δ δ × GtCt−1G0t.

Portando, o uso de fatores de desconto faz com que o papel da variˆancia Wtseja gerar

um acr´escimo multiplicativo de 1−δ_δ sobre GtCt−1G0t = Var(Gtθt−1| Dt−1) para compor a

variˆancia a priori Rt.

Usualmente, os valores especificados para o fator de desconto δ variam entre 0.9 e 1 (nesse ´ultimo caso, temos uma evolu¸c˜ao determin´ıstica para θt onde, no caso particular

em que Gt = 1, temos θt constante), representando um acr´escimo percentual de 0 a

11% sobre Var(Gtθt−1 | Dt−1) para compor Var(θt | Dt−1). Valores muito menores do

que 0.9 para δ são usados no contexto de análise de interven¸cão nos instantes em que se antevê alguma mudan¸ca estrutural na série observada. Tal medida aumenta a incerteza a priori para θt+1 | Dt, fazendo com que a observa¸cão yt+1 tenha peso muito maior sobre as

estimativas para θt+1| Dt+1e, com isso, as estimativas conseguem acompanhar mudan¸cas

bruscas no n´ıvel da s´erie. Para maiores detalhes, verWest e Harrison (1997) cap´ıtulo 11. No caso mais geral em que θt ´e um vetor p-dimensional, existe mais de um modo de

especificar diferentes valores para os fatores de desconto associados `as componentes do vetor de estados. Pode-se considerar um fator de desconto diferente para cada entrada de θ, calculando Pt = GtCt−1G0t e multiplicando o i-´esimo valor da sua diagonal por

1/δi, com δi ∈ (0, 1]. Uma segunda abordagem consiste em definir uma matriz ∆ =

diag(1/√δi, ..., 1/pδp) e fazer Rt = ∆GtCt−1G0t∆. Por fim, no caso em que Gt =

BlocoDiag(G1, ..., Gk)t, pode-se ainda considerar um fator de desconto para cada bloco

estrutural multiplicando cada bloco da matriz Pt= GtCt−1G0t por 1/δi, i ∈ {1, ..., k}.

No cap´ıtulo seguinte, apresenta-se os modelos dinâmicos não lineares, que permitem a existência de hiperparâmetros que caracterizam a matriz de evolu¸cão Gt. Além disso,

descreve-se uma metodologia capaz de estimar esses hiperparâmetros juntamente com os parâmetros de estado de modo sequencial. Propõe-se duas formas de tratar das variâncias de evolu¸cão: primeiramente, especificando-as através de fatores de desconto e a segunda, estimando uma variância fixa via quadratura de Gauss-Hermite.