Modelos Dinâmicos para Deformação Espacial

(1)

Modelos dinâmicos para deformação

espacial

por

Fidel Ernesto Castro Morales

Universidade Federal do Rio de Janeiro Instituto de Matemática

Departamento de Métodos Estatísticos

(2)

Modelos dinâmicos para deformação espacial

Fidel Ernesto Castro Morales

Tese de Doutorado submetida ao programa de Pós-graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística.

Orientador: Dani Gamerman

(3)

Modelos dinâmicos para deformação espacial

Fidel Ernesto Castro Morales

Orientador: Dani Gamerman

Tese de Doutorado submetida ao programa de Pós-graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística.

Aprovada por:

Presidente Prof. Dani Gamerman IM–UFRJ

Prof. Alexandra M. Schmidt Prof. Marina S. Paez

IM–UFRJ IM–UFRJ

Prof. Luiz Duczmal Prof. Juan Vivar

UFMG University of Duke

(4)

Morales, Fidel Ernesto Castro

Modelos dinâmicos para deformação espacial/ Fidel Ernesto Castro Morales. – Rio de Janeiro: UFRJ/IM, 2010.

xvii, 133 f. : il. ; 31cm.

Tese (Doutorado) – UFRJ/IM. Programa de Pós-Graduação em Estatística, 2010.

Orientador: Dani Gamerman

Referências bibliográficas: p.138–142.

1. Estatística Matemática - Tese. I. Gamerman, Dani.

II. Universidade Federal do Rio de Janeiro. Instituto de

(5)

AGRADECIMENTOS

Primeiramente agradeço a Deus por permitir-me concluir este trabalho, pela paciência, perseverança e força para atingir meus objetivos e por colocar em meu caminho pessoas que me ajudaram e me acompanharam nos momentos difíceis.

Quero agradecer a meus pais: Abimael Enrique Castro Garcia, Piedade del Carmen Morales, às minhas avós Nohemi Morales e Ana Josefina Garcia e meus irmãos Jeronimo e Sebastian, pela ajuda incondicional, pelas orações e pelo amor que sempre recebi.

Agradeço aos professores do departamento de Estatística DME-UFRJ pelos seus ensinamentos que contribuíram de forma significativa em minha formação profissional. Em especial, agradeço ao professor Dani Gamerman, pelo grande exemplo como pessoa e profissional e pelos valiosos ensinamentos que aprendi na orientação.

Quero agradecer a minha namorada Lorena, pela paciência e amor que sempre me deu. Agradeço também a meus amigos: Fernando, Valmária, Marcelo Cunha, Esther, Juan, Vinícius, Cleide, Flávio, Luzia e Alexandre.

Agradeço a CAPES pela ajuda financeira para a realização dos de meus estu-dos no Brasil.

(6)

Resumo

A modelagem da estrutura de covariância espacial via deformação espacial tem sido utilizada sob a hipótese de que a covariância espacial do processo é constante no tempo. Porém, em aplicações reais esta suposição é inadequada e pouco rea-lista. Neste trabalho é generalizado o modelo de deformação espacial Bayesiano, que relaxa a hipótese de que a estrutura de covariância espacial seja constante no tempo. Este modelo incorpora estruturas de covariâncias que variam no tempo, através de deformações dinâmicas que, a priori, são assumidas provenientes de um processo Gaussiano dinâmico. Este modelo considera a estrutura temporal do processo tanto na sua média como na sua estrutura de covariância espacial, esti-mando conjuntamente todos seus parâmetros, utilizando o paradigma de Bayes. Esta abordagem modela a média do processo utilizando modelos lineares dinâmi-cos e a estrutura de covariância espacial via deformação espacial dinâmica. Este modelo utiliza a função de previção para fazer interpolação e no tratamento de dados faltantes. As distribuições a posteriori dos parâmetros foram aproximadas usando métodos Markov chain Monte Carlo (MCMC). Foi estabelecida por meio de dados artificiais a efetividade do esquema de amostragem em recuperar os verdadeiros valores dos parâmetros.

Este modelo proposto foi ajustado utilizando dados de concentrações de SO2

semanais na região leste de Estados Unidos. Este modelo incorporou a anisotropia supondo que a estrutura de covariância é constante no tempo. Nesta aplicação, a função preditiva fez boas predições em uma estação que não foi considerada no processo de estimação dos parâmetros. Outra aplicação com dados reais foi implementada, ajustando o modelo proposto em dados de temperaturas mínimas mensais, no Estado do Rio de Janeiro, Brasil. Neste ajuste foi relaxada a hipótese de estrutura de covariância espacial constante no tempo. Assim, foram testadas

(7)

as seguintes hipóteses: a estrutura de covariância espacial varia a cada década

seguindo os ciclos de radiação solar ou varia com as estações do ano. E foi

concluído que as estruturas de covariâncias para estes dados variam de forma independente de acordo com as estações do ano e com os ciclos de radiação solar. Palavras-Chave: Inferência Bayesiana, métodos MCMC, modelos dinâmicos, modelos de deformação espacial.

(8)

Abstract

The modeling of the spatial covariance structure via spatial deformation has been used under the assumption that the spatial covariance of the process is constant in time. However, in real applications this assumption is inappropriate and unrealistic. This work generalizes the Bayesian model for spatial deformation, by relaxing the assumption that the spatial covariance structure is constant over time. This model incorporates the covariance structures which vary over time, through dynamic deformation priors, taken from a dynamic Gaussian process. This model considers the temporal structure of the process both in its mean as in its spatial covariance structure, jointly estimating all parameters, using the Bayes paradigm. This approach models the process average using dynamic linear models and covariance structure deformation space via spatial dynamics. This model uses predictive functions for interpolation and the treatment of missing data. The posterior distributions of the parameters were approximated using MCMC methods. The effectiveness of the sampling scheme to recover the true parameter values was established with artificial data.

This model was fitted using data from weekly concentrations of SO2in eastern

United States. This model incorporate the assumption that the anisotropy in the covariance structure is constant in time. In this application, the predictive func-tion made good predicfunc-tions in a stafunc-tion that was not considered in the estimafunc-tion of parameters. Another application with real data was implemented by fitting the proposed model to the monthly minimum temperature data of State of Rio de Janeiro, Brazil. The hypothesis of the spatial covariance structure constant over time was relaxed. Thus, we tested the following hypotheses: the spatial co-variance structure varies each decade following cycles of solar radiation or varies with the seasons. It was concluded that the covariance structures for this data set vary independently according to the seasons and the cycles of solar radiation.

(9)

( Keywords:) Bayesian inference, MCMC methods, dynamic models, models of deformation space.

(10)

Conteúdo

1 Introdução

1

1.1 Notação e definições básicas

. . . .

2

1.1.1 Modelos probabilísticos . . . .

2

1.1.2 Processos Gaussianos . . . .

3

1.1.3 Análise de formas . . . .

5

1.2 Modelo de deformação espacial para processos espaciais

não-estacionários

. . . .

7

1.3 Modelo Bayesiano de deformação espacial . . . .

8

1.4 Justificativa deste trabalho . . . .

13

1.5 Organização deste trabalho . . . .

14 2 Modelo de deformação espacial com estrutura

tempo-ral

15

2.1 Modelo . . . .

16

2.1.1 Verossimilhança . . . .

18

2.1.2 Distribuições a priori para v, σ

2_d

e b . . . .

18

(11)

2.2 Aspectos computacionais . . . .

20

2.3 Dados faltantes

. . . .

24

2.4 Interpolação . . . .

26

2.5 Estudo simulado . . . .

28

2.5.1 Estudo 1 . . . .

30

2.5.2 Estudo 2 . . . .

35

2.5.3 Estudo 3 . . . .

37

2.6 Comparação de modelos . . . .

38

2.7 Estudo de incerteza da deformação espacial . . . .

43

2.8 Estudo de sensibilidade para diferentes especificações a

priori dos parâmetros b e σ

2_d

. . . .

49

2.9 Aplicações . . . .

53

2.9.1 Concentração de dióxido sulfúrico na região leste

dos Estados Unidos . . . .

53

2.9.2 Temperatura mínima no estado do Rio de Janeiro 65

2.10 Considerações finais . . . .

74 2.11 Apêndice . . . .

77

3 Modelo de deformação espaço - temporal

85

3.1 Modelo geral . . . .

86

3.1.1 Distribuições a priori . . . .

87

3.1.2 Distribuição a posteriori . . . .

88

3.2 Casos Particulares . . . .

88

(12)

3.2.2 Caso 2 . . . .

90

3.2.3 Caso 3 . . . .

91

3.3 Aspectos computacionais . . . .

92

3.4 Interpolação . . . .

96

3.5 Estudo simulado . . . 100

3.5.1 Estudo 1 . . . 100

3.5.2 Estudo 2 . . . 105

3.6 Exemplo: Temperatura mínima no estado do Rio de

Janeiro . . . 114

3.7 Considerações finais . . . 124

4 Futuras pesquisas

126

(13)

Capítulo 1

Introdução

Neste trabalho é proposto um modelo espaço-temporal para processos Gaussianos não estacionários. A característica principal deste modelo é que a função de correlação é afetada pelo espaço e pelo tempo, através de deformações dinâmicas. Este modelo estima de forma conjunta tanto os parâmetros da média como da matriz de covariância, utilizando o paradigma de Bayes.

A finalidade deste capítulo é introduzir algumas definições preliminares e no-tação que serão utilizadas no presente texto, além de especificar objetivo e justi-ficativa deste trabalho. A organização do presente capítulo é a seguinte: na Seção 1.1 apresenta-se a definição e notação dos modelos probabilísticos utilizados. Na Seção 1.2 apresenta-se um resumo das abordagens propostas para processos es-paciais não estacionários. Na Seção 1.3 é apresentado o modelo de deformação espacial proposto sob o ponto de vista Bayesiano por Schmidt e O’Hagan (2003). Na Seção 1.4 são apresentados o objetivo e justificativa desta pesquisa. Na Seção 1.5 são listados o conteúdo e organização dos próximos capítulos.

(14)

1.1 Notação e definições básicas

1.1.1 Modelos probabilísticos

Nessa seção serão listados os principais modelos probabilísticos usados na tese.

Definição 1.1.1 (Distribuicão normal multivariada). A variável aleatória Z

tem distribuição normal multivariada com média µ, matriz de covariância Σ, se e somente se, a função de densidade de probabilidade de Z é dada por

πN(z; µ, Σ) = (2π)−p/2 | Σ |−1/2 exp −1 2(z − µ) 0 Σ−1(z − µ) . A distribuição de Z é denotada por

Z ∼ N[µ, Σ].

Definição 1.1.2 (Distribuicão gama). A variável aleatória X tem distribuição gama com parâmetro de forma η e parâmetro de escala 2/ψ, se e somente se, a função de densidade de probabilidade de X é dada por

πG(x; η, ψ) =

ψη2

Γ(η₂)2η2

xη−22 exp(−ψ

2x).

A distribuição de X é denotada por

X ∼ G[η, ψ].

A parametrização da densidade gama é similar apresentada em O’Hagan

(1994). Se Y = _X1, a distribuição de Y é chamada de gama invertida cuja função

de densidade é denotada por πGI(y; η, ψ). A distribuição de Y é denotada por

Y ∼ GI[η, ψ].

Definição 1.1.3 (Distribuição normal matriz variada). A matriz aleatória Υ de dimensão n × q tem distribuição normal matriz com matriz de média M , matriz

(15)

de covariância à esquerda A e matriz de covariância à direita B, se e somente se, a função de densidade de probabilidade de Υ é dada por

π(υ; M , A, B) = k(A, B) exp −1 2tr[(υ − M ) 0 A−1(υ − M )B−1] ,

onde tr é o traço de uma matriz e k(A, B) = (2π)−qn/2 | A |−q/2_{| B |}−n/2 _{. A}

distribuição de Υ é denotada por

Υ ∼ N [M , A, B],

onde A e B são matrizes simétricas definidas positivas.

Definição 1.1.4 (Distribuição Wishart). A matriz aleatória definida positiva Σ de dimensão q × q tem distribuição Wishart se, e somente se, a distribuição de densidade de Σ é dada por

π(σ; S, n) = 2 −αq _{| S |}α πq(q−1)/4Qd i=1γ(α − i−1 2 ) | σ |α−(q+1₂ ) _{exp [−tr(Sσ)] ,}

onde α > (d − 1)/2 é o parâmetro chamado graus de liberdade, e S é uma matriz definida positiva de dimensão q × q. A distribuição de Σ é denotada por

Σ ∼ Wα[S].

Se Λ = Σ−1, a distribuição de Λ é chamada de Wishart invertida. A distribuição

de Λ é denotada por

Λ ∼ W_α−1[S].

1.1.2 Processos Gaussianos

Um dos conceitos básicos no tratamento de dados espaciais é o processo Gaus-siano. Nessa seção são apresentadas algumas propriedades do processo GausGaus-siano.

Definição 1.1.5 (Processo Gaussiano). O processo X(·) definido em S ⊂ <r

é dito Gaussiano se, para todo n > 1 e qualquer conjunto {s1, . . . , sn} ∈ S,

(16)

Definição 1.1.6 A função de covariância C(s, s0) = Cov(X(s), X(s0)) é dita ser

positiva definida se para qualquer sj ∈ S e cj ∈ <, j = 1, . . . , n

X

i

X

j

cicjC(si, sj) > 0

e a expressão acima é igual a 0 se, e somente se, ci = 0 para todo i. A função

de correlação definida por

ρ(s, s0) = C(s, s

0₎

pC(s, s)C(s0_{, s}0₎

é dita ser uma função de correlação valida se, e somente se, C(s, s0) é positiva

definida.

O processo X(·) é estritamente estacionário se para todo n > 1, qualquer

con-junto {s1, . . . , sn}, e qualquer h ∈ <r, a distribuição de X = (X(s1), . . . , X(sn))0

e X = (X(s1+ h), . . . , X(sn+ h))0 é a mesma. O processo X(·) é fracamente

esta-cionário se para qualquer s e h ∈ S, m(s) ≡ µ (o processo tem média constante) e C(s, s + h) = C(h) (Cressie, 1993). O processo X(·) estacionário é isotrópico se a função de correlação ρ depende somente das distâncias entre as localizações e possivelmente de um parâmetro desconhecido φ.

Denota-se por

X(·) ∼ P G(µ, σ2, ρφ),

um processo Gaussiano estacionário e isotrópico. A função de correlação utilizada tipicamente é positiva e decai monotonamente a 0 quando a distância entre as localizações cresce.

Definição 1.1.7 (Processo Gaussiano Multivariado). Um processo p-dimensional

X(·) = (X1(·), . . . , Xp(·))0 definido na região G ∈ <r é um processo estacionário e

isotrópico se para qualquer n ≥ 1 e localizações s1, . . . , sno vetor (X0(s1), . . . , X0(sn))0

(17)

Casos especiais dos processo Gaussianos multivariados são apresentados a seguir

• Seja Xk(·) ∼ P G(µk, σk2, ρθk), para k = 1, . . . , p, processos Gaussianos

inde-pendentes, onde cada processo tem sua própria média, variância e função

de correlação. O processo X(·) = (X1(·), . . . , Xp(·)) é denotado por

X(·) ∼

p

Y

k=1

P G(µk, σ2k, ρθk).

Assim, Cov(Xk(si), Xl(sj)) = σ2kρθk(| si− sj |), se k = l ou 0 em outro caso.

• Denota-se por X(·) ∼ P G(µ, Σ, ρθ) onde Σ = σkl é uma matriz de

co-variância e ρθ é uma função de correlação valida se Cov(Xk(si), Xl(sj)) =

σklρθ(| si− sj |), para todo l, j, i, k.

Definição 1.1.8 (Processo dinâmico Gaussiano). O processo X(·) é um processo dinâmico Gaussiano se este pode ser descrito por uma equação de diferença

X(·, t0) = G(t0, t)X(·, t) + w(·, t0, t), w(·, t0, t) ∼ P G(0, σ2, ρφ), para todo t, t0,

onde w(·, t0, t) é um processo Gaussiano com média 0 independente do tempo. O

processo é completado com a especificação de um processo Gaussiano para X(·, 0).

1.1.3 Análise de formas

Análise estatística de formas estuda a forma de um objeto através de sua in-formação geométrica. Existem diversos trabalhos que descrevem as definições e propriedades que permitem analisar formas geométricas. Algumas referências recomendadas são (Dryden e Mardia, 1998) e (Kendall, 1984). A seguir são a-presentadas algumas definições e propriedades do análise de formas.

(18)

fil-A forma de um objeto é invariante sob transformações euclidianas de translação, escala e rotação. Por exemplo a forma de um carro consiste de todas as pro-priedades geométricas que não mudam quando o carro é transladado, redimen-sionado ou rotado em um arbitrário sistema de coordenadas.

Definição 1.1.10 A matriz de rotação Γ satisfaz a seguinte propriedade ΓTΓ =

I e | Γ |= 1.

A rotação da configuração X é obtida pela posmultiplicação da configuração por uma matriz de rotação Γ.

Definição 1.1.11 A pre-forma da configuração X é dada por

Z = HX

k HX k

que é invariante sob translação e escala da configuração original.

Definição 1.1.12 Distância full Procrustes entre as configurações X1 e X2 é

definida por

dF(X1, X2) = inf

Γ,β || Z2− βZ1Γ ||,

onde Zr = HXr/ || HXr ||, r = 1, 2.

Definição 1.1.13 Distância parcial full Procrustes entre as configurações X1 e

X2 é definida por

dP(X1, X2) = inf

Γ || Z2− Z1Γ ||,

onde Zr = HXr/ || HXr ||, r = 1, 2.

Note que a distância full Procrustes entre as configurações X1 e X2 filtra o efeito

de escala e translação. Porém, a distância parcial full Procruster só filtra o efeito da translação.

Definição 1.1.14 (Distância de Riemann) A distância Procruster ρ(X1, X2) é

definida por

(19)

1.2 Modelo de deformação espacial para processos

espaciais não-estacionários

Em geoestatística, o modelo mais simples é aquele que assume que os dados espaciais são gerados por um processo Gaussiano estacionário e isotrópico. En-tretanto, em alguns processos atmosféricos, tais como temperatura, precipitação de chuva, e no caso de alguns poluentes, a estrutura de covariância é afetada também por características espaciais como: paisagem, topografia ou padrões de circulação. Deste modo, não é realista e adequada a suposição de que o processo que gera esse tipo de dados seja estacionário e isotrópico (Sampson e Guttorp, 1992; Sampson et al., 2001). Sampson e Guttorp (1992) propuseram um modelo semi-paramétrico para a modelagem da estrutura de covariância. Esta abordagem assume estacionariedade temporal mas não assume estacionariedade da estrutura de covariância espacial. A idéia principal deste modelo é mapear as coordenadas geográficas de localizações de G (região geográfica de interesse) a um novo espaço latente D (denota o espaço de dispersão) onde a estrutura espacial é estacionária e isotrópica (processo conhecido como deformação espacial). Este modelo é cons-truído em dois passos. O primeiro utiliza escalonamento multidimensional para interpolar as localizações geográficas das estações monitoradoras (que fornecem dados de variáveis ambientais ou atmosféricas) ao espaço latente D. O segundo, utiliza thin-plate splines para interpolar localizações não monitoradas de G em D. Este modelo tem várias desvantagens, a primeira é que este não incorpora a estrutura temporal dos dados; a segunda é que este não considera a incerteza na estimação da deformação espacial.

Foram propostas por Damian et al. (2001) e Schmidt e O’Hagan (2003), de forma independente, duas versões Bayesianas do modelo de Sampson e Guttorp (1992) que consideram a incerteza na estimação da deformação espacial. A prin-cipal diferença entre as duas propostas está na especificação da distribuição a

(20)

priori da deformação espacial. Damian et al. (2001) propõem uma distribuição a priori para a deformação espacial baseada em bending energy. Por outro lado, Schmidt e O’Hagan (2003) propõem um processo Gaussiano a priori para a função d(·) que mapeia as localizações geográficas do espaço G em D. Ambos mode-los incorporam uma estrutura de covariância espacial não-estacionária, mas não consideram a estrutura temporal dos dados. Damian et al. (2003) estendem o modelo proposto por eles em 2001. Esta nova abordagem, além de supor estru-tura de covariância não-estacionaria, incorpora a variância temporal dos dados. Recentemente, Bruno et al. (2008) propõem um modelo espaço-temporal no qual a não separabilidade da função de correlação surge da variabilidade temporal não-estacionária; neste modelo a anisotropia é corrigida via deformação espacial (Damian et al, 2001).

Os modelos de processos de convolução foram introduzidos por Higdon (1998) para descrever processos com estrutura de covariância não-estacionária. Esta abordagem utiliza o fato de que qualquer processo Gaussiano estacionário pode ser expresso como a convolução de um processo Gaussiano de ruído branco com uma função núcleo (kernel, em inglês) determinada. Fuentes e Smith (2001) es-tendem o modelo espacial localmente suavizado apresentado por Fuentes (2001) a uma convolução contínua de processos Gaussianos estacionários. Fuentes e Smith (2001) utilizam uma abordagem Bayesiana hierárquica para estimar as distribuições a posteriori dos parâmetros e a distribuição preditiva.

A seguir apresenta-se com detalhe o modelo de Schmidt e O’Hagan (2003) que será a base para especificação a priori da função d(·) no presente trabalho.

1.3 Modelo Bayesiano de deformação espacial

Nesta seção, apresenta-se a abordagem Bayesiana proposta por Schmidt e O’Hagan (2003), para o modelo de deformação espacial introduzido inicialmente por

(21)

Samp-son e Guttorp (1992).

Considere dados obtidos em n estações monitoradoras em certa região

geo-gráfica G para T pontos no tempo. Assim, denote Yit= Y (si, t) o valor observado

na localização si, i = 1, . . . , n, no tempo t, t = 1, . . . , T e defina os vetores Yt =

(Y1t, . . . , Ynt)0 e Y = (Y1, . . . , YT). Suponha que Y1, . . . , YT são independentes

e identicamente distribuidos (i.i.d.) com Yt ∼ N (µ, Σ) para t = 1, . . . , T . O

interesse central é fazer inferência sob Σ. Assim, depois de integrar a função de verossimilhança L(µ, Σ | y) com relação a µ, utilizando uma priori uniforme, a função de verossimilhança de Σ é dada por

L(Σ | y) ∝| Σ |−T −12 exp{−T 2trΣ −1 S}, onde S = _T1 PT t=1(yt− ¯y)(yt− ¯y) 0_.

Neste modelo, cada (i, j) − ésimo elemento de Σ é dado por

Cov(Y (si, t), Y (sj, t)) =

√

vivjρb(| d(si) − d(sj) |), i 6= j, para todo t,

onde vi = Var(Y (si, t)), i = 1, . . . , n, ρb é uma função de correlação do processo

espacial e d(·) é uma função que será especificada mais adiante. Para simplificar

o modelo assume-se que v1, . . . , vn são permutáveis a priori, isto é,

vi | τ2 ∼ GI[f, τ2(f − 2)] para i = 1, . . . , n

π(τ2) ∝ (τ2)−1.

Processo d(·)

A idéia principal de Schmidt e O’Hagan (2003) é usar um processo Gaussiano a priori para mapear as localizações geográficas a um espaço latente. A função de correlação do processo espacial depende das distâncias das localizações no espaço D, e d(·) é a função que mapeia as localizações do espaço G ao espaço D, onde estacionariedade e isotropia são válidas. Um processo Gaussiano a priori é determinado para a função d(·) e este é definido por

(22)

na qual g(·) é uma função de G em G. Seja di = d(si), g(si) = gi, d =

(d1, . . . , dn), g = (g1, . . . , gn) e Rd é uma matriz n × n com elementos rij = ρφ(|

si− sj |). Assim, pela definição de processo Gaussiano tem-se que

d | g, σ2_d, Rd ∼ N [g, σ2d, Rd].

Apesar de g(·) poder assumir qualquer forma, é razoável assumir que g(·) é a função identidade, quando não há qualquer informação a priori sobre como D difere de G.

Papel de R

d

na função d(·)

A matriz Rd, descreve a estrutura de correlação a priori das localizações no espaço

D. Ou seja, ela dá informação sobre distorções locais entre as estações em D e controla o grau de suavização do processo Gaussiano. Assume-se que a correlação das localizações em G se conserva no espaço D. Espera-se que as estações que são vizinhas em G tendam a ser vizinhas no espaço D. Assim, para refletir essa

crença, os elementos de Rd são modelados por Schmidt e O’Hagan (2003) de

acordo com uma função de correlação gaussiana

ρφ(x) = exp −φx2 ,

onde φ é conhecido. Este parâmetro controla, a priori, a forma da configuração das estações em D. Sugere-se valores de φ > 0 que façam que localizações que são relativamente próximas entre si em G tendam a ficar também próximas em D, mas pontos mais distantes em G serão menos correlacionados a priori.

Especificação de σ

2_d

O parâmetro σ2

d é uma matriz diagonal que controla o grau de distorção no

ma-peamento de G em D. Valores pequenos deste parâmetro sugerem deformações

suaves. Schimidt e O’Hagan (2003) provaram que σ2

(23)

σ2_d= diag(σ_d2₁₁, . . . , σ_d2_rr), assume-se que os elementos da diagonal de σ_d2 são

inde-pendentes com distribuição a priori σ2

dii ∼ GI(ηi, φi), i = 1, . . . , r. Na Figura 1.1

apresenta-se a deformação de uma grade regular na região [0, 1] × [0, 1] geradas

com diferentes valores de σ2

d. 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 (a) 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 (b) 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 (c) 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 (d)

Figura 1.1: Deformações da grade regular [0, 1] × [0, 1] geradas com os parâmetros φ = 3.7,

(a) σ2_d₁₁ = σ_d2₂₂ = 0.01, (b) σ_d2₁₁ = σ_d2₂₂ = 0.03, (c) σ_d2₁₁ = σ_d2₂₂ = 0.05, (d) σ2_d₁₁ = 0.01 e σ2

d22= 0.03.

Distribuição a posteriori

Neste modelo, o parâmetro a ser estimado é θ = (d, v, b, τ2_{, σ}2

d). Considerando

a distribuição a priori de θ especificada anteriormente, e combinando essa infor-mação com a função de verossimilhança, a distribuição a posteriori de θ é obtida

(24)

a partir do teorema de Bayes. Assim,

π(θ | y) ∝ L(Σ | y)π(θ).

A distribuição a posteriori mencionada anteriormente, não tem forma fechada, então recorre-se aos métodos MCMC para aproximá-la. Os detalhes computa-cionais destas aproximações encontram-se em Schmidt (2001).

Interpolação

Um dos principais objetivos da modelagem espacial é fazer predições do pro-cesso espaço-temporal, em localizações onde não existem estações

monitorado-ras. Assim, seja YN M_t = (Y(n+1)t, . . . , Y(n+m)t) o vetor de observações no tempo t,

t = 1, . . . , T , do processo nas localizações geográficas não monitoradas doN M₀ =

(sn+1, . . . , sn+m). Sejam dN M = (dn+1, . . . , dn+m) a matriz das deformações de

doN M₀ e vN M _{= (v}

n+1, . . . , vn+m) o vetor de variâncias do processo em

localiza-ções não monitoradas. Seja θA= (θ, vN M_{, d}N M_{). Então a distribuição preditiva}

é dada por

π(yN M_t | y) =

Z

θA

π(yN M_t | y_t, θA)π(θA| y)dθA.

Os detalhes computacionais para a aproximação da distribuição preditiva ap-resentada anteriormente encontram-se em (Schmidt e O’Hagan, 2003). Sob a

suposição de que Y1, . . . , YT, são independentes e identicamente distribuídos

com Yt∼ N (µ, Σ) para t = 1, . . . , T . A função preditiva utiliza o ganho obtido

na modelagem da estrutura de covariância espacial, na estimação de valores nas localizações onde não se tem estações monitoradoras. Mas, em muitos processos esta suposição não é realista. Schmidt e O’Hagan (2003) afirmam que quando o processo não satisfaz a suposição anterior, se deve trabalhar com os resíduos

obti-dos, uma vez ajustado um modelo de séries temporais. Estes resíduos Z1, . . . , ZT

(25)

t = 1, . . . , T , possuem distribuição preditiva dada por π(ZN M_t | Z) = Z θA π(ZN M_t | Zt, θA)π(θA | Zt)dθA, onde ZN M_t = (Z(n+1)t, . . . , Z(n+m)t).

1.4 Justificativa deste trabalho

O modelo proposto por Schmidt e O’Hagan (2003) é uma abordagem Bayesiana proposta para fazer inferência sob a estrutura de covariância espacial de um pro-cesso Gaussiano não estacionário. Esta proposta utiliza a idéia de Sampson e Guttorp (1992), de deformar a região de estudo para obter um novo espaço onde o processo é estacionário e isotrópico. As deformações do espaço são introduzidas através de uma distribuição a priori Gaussiana. Esta abordagem assume que a estrutura de covariância espacial é constante através do tempo. Esta suposição é restritiva e pouco realista, pois, em aplicações com dados ambientais tais como estudos de poluentes, a média e a covariância do processo sob estudo podem ser afetadas pelo tempo (Gamerman et al., 2007). Outra característica deste modelo é que ele assume que foi removida a estrutura temporal na média utilizando mo-delos de séries temporais e utiliza os resíduos ajustados para estimar a matriz de covariância.

Gamerman et al. (2007) sugerem que a estrutura de covariância

espaço-temporal seja afetada por características espaciais e pelo tempo; eles afirmam que um candidato natural para introduzir esta mudança são os processos Gaussianos dinâmicos. Neste trabalho, é proposta uma abordagem espaço-temporal para processos Gaussianos não-estacionários, onde a média do processo é modelada via modelos dinâmicos (West e Harrison, 1997) e a estrutura de covariância espa-cial via uma generalização dinâmica de deformação espaespa-cial (Sampson e Guttorp, 1992) sob o ponto de vista Bayesiano (Schmidt e O’Hagan, 2003). Ao contrário

(26)

o modelo proposto nesta tese relaxa a suposição de que a função de covariância espacial é constante, permitindo que esta evolua no tempo através de deformações espaciais dinâmicas que podem ser geradas por diferentes especificações a priori. Neste trabalho são propostas três especificações a priori para a deformação espa-cial, a primeira supõe que as deformações são geradas por um processo Gaussiano dinâmico. A segunda, assume que as deformações são geradas de forma indepen-dente. E a última especificação a priori assume que existem blocos de deformações com estrutura dinâmica dependente dentro dos blocos, mas independência entre os blocos.

1.5 Organização deste trabalho

Este trabalho esta organizado da seguinte forma. No Capítulo 2, é introduzido um modelo espaço-temporal para processos Gaussianos não estacionários. Este modelo estima conjuntamente a média e a matriz de covariância do processo uti-lizando o paradigma de Bayes. A principal característica deste modelo é incorpo-rar a média do processo através de modelos dinâmicos. Esta abordagem assume que a matriz de covariância é constante no tempo. A modelagem da estrutura de covariância espacial consiste em corrigir a anisotropia via deformação espacial sob o ponto de vista Bayesiano. As distribuições a posteriori dos parâmetros são aproximadas utilizando métodos Markov chain Monte Carlo (MCMC).

No Capítulo 3, é proposta uma generalização dinâmica do modelo de defor-mação espacial proposto no Capitulo 2. A principal característica deste modelo é relaxar a suposição de que a matriz de covariância é constante. A modelagem da estrutura de covariância é incorporada através de deformações dinâmicas. Como no Capítulo 2, as distribuições a posteriori dos parâmetros são aproximadas uti-lizando métodos MCMC. No Capítulo 4, são apresentadas varias extensões deste modelo que podem ser desenvolvidas em pesquisas futuras.

(27)

Capítulo 2

Modelo de deformação espacial com

estrutura temporal

Modelos dinâmicos são uma ferramenta importante para descrever dados prove-nientes de processos Gaussianos temporais não-estacionários (West e Harrison, 1997). Vários autores propuseram modelos espaço-temporais baseados em mo-delos de espaço de estados. Por exemplo, Gelfand et al. (2005) introduziram uma classe geral de modelos de regressão multivariados que incorpora estrutura espaço-temporal não-estacionária. Uma referência recomendada para a revisão de modelagem e análise de dados espaço-temporais é Banerjee et al. (2004).

Neste capítulo, é introduzido um modelo espaço-temporal para processos não estacionários que corrige a anisotropia via deformação espacial (Sampson e

Gut-torp, 1992), sob o ponto de vista Bayesiano (Schmidt e O’Hagan, 2003). O

modelo proposto incorpora a estrutura temporal na média do processo através de modelos dinâmicos. A modelagem da média conjuntamente com a estrutura de covariância espacial, permite de forma direta fazer predições em localizações onde não se têm estações monitoradoras e para dados faltantes.

(28)

2.1 Modelo

Seja Y (·, t) um processo Gaussiano observado em G × L, no qual G ⊂ <r e

L = {1, . . . , T }. O processo Y (·, t) é modelado através da seguinte equação:

Y (·, t) = µ(·, t) + (·, t), para t = 1, . . . , T, (2.1)

onde µ(·, t) é a média do processo Gaussiano e (·, t) é um processo Gaussiano

espaço-temporal com média 0 e função de correlação ρb, que será especificada mais

adiante. Seja f_t um vetor de covariáveis relacionado com Y (·, t), tal que µ(·, t) =

f0_tβ_t, onde β_t= (β0t, . . . , β(p−1)t) é um processo dinâmico (West e Harrison, 1997)

definido através da especificação a priori

β_t= Gtβt−1+ ωt, ωt∼ Np[0, Ψ], para t = 1, . . . , T , (2.2a)

β₀ ∼ Np[m0, C0], (2.2b)

Ψ ∼ W_n−1₀ [S0], (2.2c)

onde Gt é uma matriz de evolução de estados de dimensão p × p, com valores

conhecidos, m0, C0 e S0 podem ser escolhidos de forma que a distribuição a

priori de (β₀, Ψ) em (2.2b) e (2.2c) seja pouco informativa. Assume-se que a

estrutura de covariância espacial de (·, t) não depende do tempo t e ωt e (·, t)

são independentes, para todo t.

Covariância espacial

A função de covariância espacial de (·, t) é definida por

Cov((si, t), (sj, t)) =

√

vivjρb(| d(si) − d(sj) |), (2.3)

onde vl = Var((sl, t)), para l = 1, . . . , n, para todo t, ρb é uma função de

correlação válida, onde b é um parâmetro desconhecido. Neste capítulo se utiliza a função de correlação exponencial, dada por

(29)

A seguir, será apresentada a especificação a priori para d(·).

Deformação espacial

Seja s = (x1, . . . , xr) ∈ G e defina um processo Gaussiano a priori d(·) (Schmidt

e O’Hagan, 2003) dado por,

d(·) ∼ P G(g(·), σ2_d, ρφ), (2.5)

onde σ2_d = diag(σ_d2₁₁, . . . , σ2_d_rr) e g(·) é uma função que depende das coordenadas

x1, . . . , xr do ponto s em G. Em particular, considera-se g(s) = s. A função de

covariância de d(·) é dada por

Cov(d(si), d(sj)) =    σ2_dρφ(| si− sj |), se i 6= j σ2 d, se i = j,

na qual ρφ é uma função de correlação válida e φ é um parâmetro conhecido. A

função d(·) distorce as localizações da região geográfica G a um novo espaço D,

onde o parâmetro σ2_d determina a força da distorção e ρφ estabelece a forma da

distorção no novo espaço D. Note que as localizações geográficas são mapeadas por (2.5) no espaço D, de forma que (·, t) é estacionário e isotrópico (Sampson e Guttorp, 1992).

Suponha dados obtidos em n estações monitoradoras em uma certa região

geo-gráfica G, para T pontos no tempo. Denote por Yit = Y (si, t) o valor observado

na localização si, i = 1, . . . , n, no tempo t, t = 1, . . . , T . Suponha que o vetor

Yt = (Y1t, . . . , Ynt)0 foi gerado por (2.1) e pela definição de processo Gaussiano,

tem-se que Yt= F0tβt+ t, t∼ Nn[0, Σ], t = 1, . . . , T β_t= Gtβt−1+ ωt, ωt ∼ Np[0, Ψ], t = 1, . . . , T β₀ | Ψ ∼ Np[m0, C0], −1 (2.6)

(30)

onde F0_t é um conjunto de covariáveis dinâmicas e t = ((s1, t), . . . , (sn, t))0.

Aqui, os elementos da matriz Σ são calculados pela equação (2.3), que dependem

das localizações latentes d = (d1, . . . , dn) geradas por (2.5), na qual di = d(si),

para i = 1, . . . , n. Assim, pela definição de processo Gaussiano, tem-se que a função de densidade de probabilidade a priori de d é dada por,

π(d) = (2π)−n | σ2_d |−n/2| Rd | −1 exp −1 2tr(d − d o 0) 0 (σ2_d)−1(d − do₀)R−1_d ,

onde do₀ = (g(s1), . . . , g(sn)) = (s1, . . . , sn) e Rd é a matriz de correlação, cujos

elementos são calculados através de ρφ.

2.1.1 Verossimilhança

Neste modelo, o parâmetro a ser estimado é θ = (β, d, v, b, τ2_{, σ}2

d, Ψ), onde

β = (β₀, . . . , β_T), v = (v1, . . . , vn) e τ2 é um hiperparâmetro da distribuição a

priori de vi, i = 1, . . . , n, definido na subseção 2.1.2. Para uma série observada

y, proveniente de (2.6), a função de verossimilhança de θ é

L(θ | y) ∝| Σ |−T2 exp ( −1 2 T X t=1 (y_t− F0_tβ_t)0Σ−1(y_t− F0_tβ_t) ) . (2.7)

2.1.2 Distribuições a priori para v, σ

2_d

e b

Foram consideradas as mesmas distribuições a priori propostas por Schmidt e

O’Hagan (2003) para os parâmetros v e σ2

d. Para o parâmetro b em (2.4)

considerou-se a distribuição a priori recomendada por Schmidt e Gelfand (2003).

A seguir, são especificadas as distribuições a priori dos parâmetros vi, σ2d e b.

Distribuição a priori para v

Assume-se que o vetor de variância v não tem estrutura espaço-temporal.

(31)

i = 1, . . . , n é dada por,

vi | τ2, f ∼ GI[f, τ2(f − 2)]

π(τ2) ∼ (τ2)−1,

onde τ2 _{tem distribuição a priori não-informativa.}

Distribuição a priori para σ2

d

Assume-se que os elementos da diagonal principal de σ2_d são independentes com

distribuição a priori gama invertida para cada um dos elementos. Isto é, σ2_d

ii ∼ GI[ηi, ψi], para i = 1, . . . , r.

Distribuição a priori para b

A distribuição a priori de b é uma distribuição gama informativa. Isto é,

b ∼ G[b∗η, η],

no qual b∗ = −2 log(0.05)/ max(| si− sj |).

As distribuições a priori dos parâmetros β, d e Ψ foram especificadas em (2.2). Assim a distribuição a priori de (β, d, Ψ) é dada por

π(β, d, Ψ) = ( _T Y t=1 π(β_t| β_t−1, Ψ) ) π(β₀)π(Ψ)π(d).

2.1.3 Distribuição a posteriori

Considerando a distribuição a priori de θ especificadas anteriormente, e combi-nando essa informação com a função de verossimilhança em (2.7), a distribuição a posteriori de θ é obtida a partir do teorema de Bayes. Assim,

π(θ | y) ∝ L(θ | y) ( _T Y t=1 π(β_t| β_t−1, Ψ) ) π(β₀)π(Ψ)π(d) × ( _n Y π(vi | τ2) ) π(τ2)π(b)π(σ2_d). (2.8)

(32)

A distribuição a posteriori em (2.8) não tem forma fechada, então recorre-se aos métodos MCMC para aproximá-la. O algoritmo utilizado para obter amostras da distribuição a posteriori em (2.8) é um algoritmo híbrido da seguinte forma: para o subconjunto de parâmetros de θ cuja densidade condicional completa seja conhecida, amostra-se diretamente dela, e para o subconjunto de parâmetros cuja densidade condicional completa não seja conhecida amostra-se da mesma usando passos Metropolis-Hastings (Metropolis et al., 1953; Hastings, 1970). Referências recomendadas para a revisão de métodos MCMC são Gamerman e Lopes (2006) e Robert e Casella (2004).

2.2 Aspectos computacionais

Nesta seção, detalha-se o procedimento de amostragem do parâmetro θ da dis-tribuição a posteriori dada em (2.8).

Amostrando d

Seja X uma matriz n × r que denota uma configuração de n pontos com r componentes. Denote por Φ a matriz de distâncias euclidianas entre os pontos de X. Seja Γ uma matriz de rotação e γ um vetor de translação. Existem

infinitas configurações X∗ = XΓ + 1γ tais que a matriz de distâncias euclidianas

de X∗ denotada por Φ∗ é igual a Φ.

Dado que a verossimilhança em (2.7) depende de Σ através da matriz de distancias euclidianas do parâmetro d, então, pelo resultado anterior, tem-se que o parâmetro d é não identificável. Assim, para garantir identificabilidade do parâmetro d é imposta a restrição de fixar os valores de duas deformações como conhecidas. Esta restrição faz o papel de âncora, garantindo a não rotação e translação de d. Em aplicações, recomenda-se supor que as deformações supostas conhecidas sejam iguais às localizações geográficas correspondentes. A seguir,

(33)

apresenta-se a proposta para amostrar o parâmetro d.

Partindo da distribuição a posteriori em (2.8), a condicional completa para d é dada por πd(d) ∝| Σ |− T 2 exp ( −1 2 T X t=1 (y_t− F0_tβ_t)0Σ−1(y_t− F0_tβ_t) ) × exp −1 2tr(d − d o 0) 0 (σ2_d)−1(d − do₀)R−1_d .

A densidade de transferência q(d(j), ·) = π(·; d(j), u1I2, Rd) foi utilizada na

implementação do algoritmo de Metropolis-Hastings. Além disso, u1 é sintonizado

de forma que a taxa de aceitação fique em torno de 20%. Estudos simulados mostraram que para taxas de aceitação maiores a 20% as cadeias demoravam

mais para recorrer o espaço paramétrico. O movimento de d(j)para dprop é aceito

com probabilidade α(d(j), dprop) = min 1,πd(d prop₎ πd(d(j)) . Amostrando β Seja yt _{= (y}

1, . . . , yt). Para obter amostras de β é utilizado o algoritmo

for-ward filtering - backfor-ward sampling (FFBS) (Frühwirth-Schnatter, 1994) descrito a seguir. 1. Amostrar β_T de β_t | yt _{∼ N [m} t, Ct], com mt = at+ Atet e Ct = Rt− AtQtA 0 t. Nos quais, At = RtFtQ−1t , et = yt− ft, at = Gtmt−1, Rt = GtCt−1G0t+ Ψ, ft= Ftat e Qt= F 0 tRtFt+ Σ. 2. Amostrar β_t de β_t| β_t+1, v, Ψ, b, y_t∼ N [(G0_tΨ−1Gt+C−1t )−1(G 0 tΨ −1 β_t+1+C−1_t mt), (G0tΨ −1 Gt+ C−1_t )−1].

(34)

Amostrando vi

Seguindo a distribuição a posteriori em (2.8), a condicional completa para vi é

dada por: πv(vi) ∝ ( _T Y t=1 | Σ |−12 exp −1 2(yt− F 0 tβt) 0 Σ−1(y_t− F0_tβ_t) ) × v− f +2 2 i exp −(f − 2)τ 2 2vi . A densidade de transferência q(v(j)_i , ·) = πG(·; v (j) i × u2, u2) foi utilizada na

implementação do algoritmo de Metropolis-Hastings. Além disso, u2 é obtido de

forma que a taxa de aceitação fique em torno de 40%. O movimento de v(j)_i para

vprop é aceito com probabilidade

α(v_i(j), v_iprop) = min ( 1,πv(v prop i )q(v prop i , v (j) i ) πv(v (j) i )q(v (j) i , v prop i ) ) , i = 1, . . . , n.

Schmidt e O’Hagan (2003) recomendam usar o método da rejeição adaptativo (Gilks e Wild, 1992), já que sua distribuição condicional completa é log-côncava

quando expressa em termos de v−

1 2

i .

Amostrando b

A partir da distribuição a posteriori em (2.8), a condicional completa para b é dada por πb(b) ∝ ( _T Y t=1 | Σ |−12 exp −1 2(yt− F 0 tβt) 0 Σ−1(y_t− F0_tβ_t) ) × bb∗η−22 exp −η 2b .

A densidade de transferência q(b(j), ·) = πG(·; b(j) × u3, u3) foi utilizada na

implementação do algoritmo Metropolis-Hastings. Além disso, u3 é obtido de

forma que a taxa de aceitação fique em torno de 40%. O movimento de b(j) _para

bprop _{é aceito com probabilidade}

α(b(j), bprop) = min 1,πb(b prop_)q(bprop_{, b}(j)₎ πb(b(j))q(b(j), bprop) .

(35)

Amostrando τ2

A partir da distribuição a posteriori em (2.8), a condicional completa para τ2 é

dada por πτ(τ2) ∝ π(τ2) n Y i=1 π(vi | τ2) ∝ (τ2₎nf −2₂ n Y i=1 exp −(f − 2)τ 2 2vi = (τ2)nf −22 exp − (f − 2) Pn i=1v −1 i 2 τ2 . (2.9)

Note que a densidade em (2.9) tem a forma da distribuição gama. Assim, τ2

é amostrado diretamente de uma distribuição gama com parâmetros η = nf e

ψ = (f − 2)Pn i=1v −1 i . Amostrando σ2 d

A partir da distribuição a posteriori em (2.8), a condicional completa para σ2

d é dada por π_σ2 d(σ 2 d) ∝ π(σ 2 d)π(d | d o 0) ∝ r Y i=1 σ_d2 ii −(ηi+2₂ ) exp − ψi 2σ2 dii × | σ2_d|−n2 exp −1 2tr(d − d o 0) 0 (σ2_d)−1(d − do₀)R−1_d = r Y i=1 σ_d2 ii −(ηi+n+2₂ ) exp − ψi 2σ2 dii exp −1 2tr(σ 2 d) −1 Sd = r Y i=1 σ_d2_ii−(ηi+n+22 )_exp −ψi+ Sdii 2σ2 dii , onde Sd= (d − do0)R −1 d (d − d o 0) 0_{, em que S}

dii é i-ésimo elemento da diagonal de

Sd. Note que

σ_d2_ii | θ−σ2

dii ∼ GI[n + ηi, Sdii+ ψi], para i = 1, . . . , r, (2.10)

onde θ−σ2

diidenota o subconjunto de parâmetros θ−{σ

2

dii}. Assim, σ

2

(36)

Amostrando Ψ

Assim, Ψ é amostrado diretamente de (2.11).

2.3 Dados faltantes

Em aplicações com dados reais, é comum haver dados faltantes nas séries tempo-rais observadas. Nesta seção, é apresentada uma forma de trabalhar com este tipo de dado. Neste trabalho, os dados faltantes correspondem àqueles dados que por algum motivo não foram registrados nas estações monitoradoras. A idéia princi-pal é completar as séries temporais onde existam dados faltantes considerando-os

como parâmetros do modelo. Assim, seja Yt = (Yot, Y

no

t )0, onde Y

o

t

repre-senta o conjunto de dados observados e Yno_t o conjunto de dados não-observados

no tempo t. O conjunto de parâmetros a ser estimado é θ∗ = (Yno, θ), onde

(37)

conjunto de dados observados. Assim, a distribuição a posteriori de θ∗ é dada por π(θ∗ | yo_{) ∝ L(θ}∗ _{| y}o₎ ( _T Y t=1 π(β_t| β_t−1, Ψ) ) π(β₀)π(Ψ)π(d) ( _n Y i=1 π(vi | τ2) ) π(τ2)π(b)π(σ2_d)π(yno | θ).

O objetivo é fazer predições de dados faltantes através da função preditiva

π(yno | yo_{) =}

Z

π(yno | yo_{, θ)π(θ | y}o_)dyno_dθ.

Amostrando Yno_t

Os dados faltantes Yno_t , t = 1, . . . , T , são amostrados diretamente da condicional

completa que é calculada a seguir. Em consequência da equação (2.6), tem-se que   Yo_t Yno_t  | β, Σ ∼ N     F∗_t0β_t F∗∗_t 0β_t  ,   Σo Σono Σono0 Σno    , (2.12)

no qual F∗_t0 é a matriz de regressão dinâmica para os dados observados, F∗∗_t 0

é a matriz de regressão dinâmica para os dados não-observados, Σo é a matriz

de covariâncias dos dados observados, Σno é a matriz de covariâncias dos dados

não-observados e Σono é a matriz de covariâncias entre os dados observados e

não observados. Note que, os valores de Yt para t = 1, . . . , T , condicionados em

β e Σ são independentes. Usando a propriedade da distribuição condicional da

Normal multivariada em (2.12), a condicional completa para Yno_t é dada por,

Yno_t | θ ∼ N [F∗∗_t 0β_t+ Σono0(Σo)−1(yo_t− F∗_t0β_t), Σno− Σono0_(Σo₎−1

Σono]. (2.13)

(38)

2.4 Interpolação

Em geoestatística o principal objetivo é fazer predições de um processo ou fenô-meno sob estudo em qualquer localização, a partir dos dados observados nas estações monitoradoras. Um passo importante na previsão ou interpolação é a descrição da estrutura de covariância do processo. Os modelos tradicionais as-sumem que a distribuição espacial é estacionária e isotrópica. Entretanto, em aplicações com dados reais estas hipóteses são pouco realistas e inadequadas. Nesta seção, é apresentada a forma de fazer predições em um conjunto qualquer de localizações, utilizando o ganho obtido ao deformar o espaço original. Es-tas interpolações são feiEs-tas através da função preditiva. Antes de calcular esta função é preciso fazer interpolação das deformações das localizações geográficas de interesse. A seguir apresenta-se a forma de fazer interpolação da deformação.

Interpolação de d

Sejam doN M₀ = (sn+1, . . . , sn+m) a matriz das localizações geográficas onde não se

tem estações monitoradoras, dN M = (dn+1, . . . , dn+m) a matriz das deformações

de doN M₀ e dA = (d, dN M). Denote por vN M _{= (v}

n+1, . . . , vn+m) o vetor de

variâncias do processo em localizações não monitoradas. Em consequência de (2.5) e pela definição de processo Gaussiano, tem-se que a distribuição a priori

de dA é dada por   d dN M  | Rd, σ2d ∼ N     do₀ doN M₀  , σ2_d,   Rd RoN M 0 d RoN M_d RN M_d    , (2.14)

onde Rd é a matriz de correlação entre as estações monitoradoras, RN Md é a

matriz de correlação entre as localizações não monitoradas e RoN M_d é a matriz

de correlação entre as estações monitoradoras e localizações não monitoradas. Assim, usando as propriedades da distribuição Normal matriz variada em (3.27)

(39)

tem-se que, vec(dN M) | θA_−dN M ∼ N_2m[A, B], (2.15) onde A = vec(doN M₀ ) + (I2 ⊗ RoN Md R −1 d )(vec(d) − vec(d o 0)) e B = σ2d⊗ (Im− RoN M_d R−1_d RoN M_d 0).

Amostras da distribuição a posteriori de dN M e vN M _{são geradas da seguinte}

forma: para cada amostra θ(k) da distribuição a posteriori de θ obtida no

al-goritmo de amostragem descrito na seção 2.2, vN M (k) e dN M (k) são amostrados

de vj | θ(k) ∼ GI[τ2(k)(f − 2), f ], j = n + 1, . . . , n + m (2.16) e vec(dN M (k)) | θ ∼ N2m[A(k), B(k)], (2.17) onde, A = vec(doN M₀ ) + (I2⊗ RoN Md R −1 d )(vec(d (k) ) − vec(do₀)) e B = σ2(k)_d ⊗ (Im− RoN Md R −1 d R oN M0 d ).

Interpolação de Y

Denote por YN M_t = (Y(n+1)t, . . . , Y(n+m)t) o vetor de observações no tempo t,

t = 1, . . . , T , do processo nas localizações geográficas não monitoradas e YA_t =

(Yt, YN Mt ) o vetor de observações monitoradas e não monitoradas no tempo t.

Assim, o vetor de parâmetros θ em (2.7) é substituído por θA= (θ, vN M, dN M).

Em consequência de (2.6), tem-se que   Yt YN M_t  | θ A_{∼ N}     F0_tβ_t F0N M_t β_t  ,   Σ Σ∗ Σ∗ ΣN M    ,

no qual, F0_t é a matriz de regressão dinâmica para os dados observados, FN M_t 0

é a matriz de regressão dinâmica para os dados não monitorados, Σ é a matriz

de covariâncias dos dados observados, ΣN M é a matriz de covariâncias dos dados

(40)

monitorados. Usando propriedades básicas da distribuição Normal multivariada, tem-se que: YN M_t | θA_{, y} t∼ N [F 0_{N M} t βt+ Σ ∗0 (Σ)−1(y_t− F0_tβ_t), ΣN M− Σ∗0(Σ)−1Σ∗].

A densidade da distribuição preditiva de YN A_t | Y é dada por

π(yN M_t | y) =

Z

θA

π(yN M_t | y_t, θA)π(θA| y)dθA_. _(2.18)

Note que a integral em (2.18) não é tratável analiticamente e portanto, métodos Monte Carlo são utilizados para obter uma aproximação de (2.18) da seguinte forma: πj(yN Mt | y) = Z θA π(yN M_t | y_t, θA)π(θA | y)dθA_. = Z θA π(yN M_t | y_t, θA)π(vN M, dN M | θ)π(θ | y)dθA ≈ 1 K K X k=1 π(yN M_t | θA(k)_{, y} t),

onde θAé amostrado de sua distribuição a posteriori π(θA| y) da seguinte forma:

• θ(k) é amostrado de π(θ | y); e

• vN M (k) _{e d}N M (k) _{são amostrados de π(v}N M (k)_{, d}N M (k)_{), para k = 1, . . . , K.}

2.5 Estudo simulado

Uma análise com dados simulados foi realizada baseada no modelo (2.1). Nesta seção, foram estudados dois processos, o primeiro apresentando uma deformação

suave, gerado a partir da função de correlação Gaussiana ρφ com parâmetro φ =

3.28 (φ = −2 log(0.05)/ maxi,j=1,...,n(| si − sj |)2) e σd2ii = 0.015, i = 1, 2. O

segundo processo, apresentando uma deformação pouco suave, gerada a partir

da função de correlação Gaussiana ρφ com parâmetro φ = 3.28 e σd2ii = 0.030,

(41)

poucos dados (T = 100), foram confrontados em duas situações de interesse: 15 localizações (n=15) e 30 localizações (n=30). Por último, para os dados gerados

com φ = 3.28, σ2

dii = 0.015, i = 1, 2 e n = 15, 5% dos valores foram aleatoriamente

escolhidos como dados faltantes.

O algoritmo MCMC proposto na Seção 2.2 foi utilizado para gerar amostras da distribuição a posteriori de todos os parâmetros do modelo (2.1). Na estimação da distribuição a posteriori dos parâmetros foram utilizadas 270000 iterações, descartando-se as primeiras 20000 iterações (período de aquecimento), guardando os valores dos parâmetros da cadeia a cada 25 iterações. Logo, foram obtidas amostras de tamanho 10000. Foi usado o programa OX versão 5.10 (Doornik, 2002) para implementar o algoritmo MCMC.

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 x y s4 s7 s10 s13 s19 s24 s27 s30 s31 s35 s41 s43 s49 s53 s56 s58 s60 s63 s65 s75 s77 s80 s84 s87 s91 s93 s95 s99 s1 s100

(42)

2.5.1 Estudo 1

Neste estudo simulado foi considerado o modelo dinâmico, com um fator sazonal e uma covariável fixa no tempo. Este modelo é dado por

Yt = F0tβt+ t, t, ∼ Nn[0, Σ], β_t = Gtβt−1+ ωt, ωt∼ Np[0, Ψ], onde t = 1, . . . , T , β = (βt0, βt1, βt2, βt3)0, F0t= (1, x, 1, 0), x = (010, 117), Gt=   I2 0 0 G2  , G2 =   cos₂₅π sin₂₅π − sin π 25 cos π 25  , Ψ = diag(0.01, 0.02, 0.06, 0.06), β₀ = (0.01, 3, 5, 1)0.

Considerou-se duas situações: na primeira, foram selecionadas aleatoriamente n = 30 localizações de uma grade regular [0, 1] × [0, 1] (ver Figura 2.1), nas quais 100 realizações (T = 100) do processo foram geradas a partir do modelo apresen-tado anteriormente. Na segunda situação, foram retiradas 15 das 30 localizações, restando n = 15 localizações, com suas respectivas realizações. Foi estudado um

processo gerado por uma deformação suave, com parâmetros σ_d2₁₁ = σ2_d₂₂ = 0.015,

φ = 3.28, b = 5.99, τ2 = 0.5 e f = 15.

Distribuições a priori

Foram utilizadas distribuições a priori informativas para os parâmetros σ_d2₁₁e σ_d2₂₂.

Assim, para ambos parâmetros σ_d2₁₁e σ_d2₂₂foi considerada uma distribuição a priori

GI(66.67, 1) e para b uma distribuição a priori G(5.8 × 52, 52) (ver Figura 2.2). No entanto, como se verá na Seção 2.8, para este caso onde a deformação é suave, não são necessárias distribuições a priori informativas para estes parâmetros.

Resultados

Para verificar convergência, as distribuições a posteriori dos parâmetros foram es-timadas partindo de dois pontos iniciais diferentes. O comportamento das cadeias dos parâmetros apresenta-se no apêndice ao final deste capítulo. Em geral, todas

(43)

0.010 0.015 0.020 0.025 0 50 100 150 200 σσdii 2 densidade 0 2 4 6 8 10 12 0.00 0.05 0.10 0.15 b densidade

Figura 2.2: Distribuições a priori dos parâmetros σ2

d11= σ

2

d22 e b.

as cadeias convergiram ao seu verdadeiro valor, embora tenha sido observado uma

alta autocorrelação nas cadeias para alguns parâmetros di, no caso n = 30.

Dos resultados obtidos, têm-se que tanto para o caso n = 15 quanto para n = 30 o parâmetro d é bem estimado (ver Figura 2.3), apresentando uma leve

melhora na estimativa de d para n=30. Os parâmetros β, v, b e σ2

d foram bem

estimados em ambos os casos com, n = 15 e n = 30 (ver Figuras 2.7, 2.6 e

2.5, respetivamente). Porém, o parâmetros τ2 _{e os elementos da matriz Ψ foram}

sobre-estimados (ver Figuras 2.4 e 2.5). Por causa da semelhança das estimativas

dos parâmetros β, v, b, τ2, σ2_d e Ψ em relação ao caso n = 15, as figuras das

(44)

0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 x deformado y deformado 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 x deformado y deformado

Figura 2.3: Deformação estimada (linha tracejada) e deformação verdadeira (linha cheia),

para o processo gerado com σ2_d₁₁ = σ2

d22 = 0.015, T = 100 utilizando n = 15 (figura a esquerda)

e n = 30 (figura a direita). ω ω11 densidade 0 1 2 3 4 5 6 7 0.0 1.0 2.0 3.0 ω ω22 densidade 0.05 0.10 0.15 0.20 0.25 0 5 10 15 20 ω ω33 densidade 0 1 2 3 4 5 6 0.0 1.0 2.0 3.0 ω ω44 densidade 0.0 0.5 1.0 1.5 2.0 2.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 2.4: Valores verdadeiros (linha vertical) e distribuições a posteriori estimadas para

os elementos da matriz de covariância Ψ, processo gerado com σ_d2

11 = σ

2

d22 = 0.015, n = 15,

(45)

b densidade 5.0 5.5 6.0 6.5 7.0 7.5 0.0 0.5 1.0 1.5 ττi 2 densidade 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 1 2 3 4 5 6 7 σσd11 2 densidade 0.012 0.013 0.014 0.015 0.016 0.017 0.018 0.019 0 100 200 300 400 σσd22 2 densidade 0.012 0.013 0.014 0.015 0.016 0.017 0.018 0.019 0 100 200 300 400

Figura 2.5: Distribuições a posteriori estimadas dos parâmetros b, τ2 e σ2_d e verdadeiros

valores dos parâmetros (linha vertical), para o processo gerado com σ2_d

11 = σ 2 d22 = 0.015, n = 15, T = 100. − * − * − * − * −* − * −* − * − * − * − * −* − * − * − * v10 v13 v27 v30 v35 v43 v56 v60 v63 v75 v77 v80 v91 v1 v100 0.4 0.6 0.8 1.0 1.2 1.4

Figura 2.6: Intervalo de credibilidade de 95%, média estimada (-) e verdadeiro valor (*) dos

parâmetros v10, v13, . . . , v100, para o processo gerado com σd211= σ 2

(46)

t ββt0 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 t ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 t ββt2 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 ββt2 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 t ββt3 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 ββt3 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6

Figura 2.7: Intervalo de credibilidade do 95% (linha tracejada), média estimada (linha fina)

e verdadeiro valor (linha grossa) de β, para o processo gerado com σ2_d

11 = σ

2

d22 = 0.015, n = 15,

(47)

2.5.2 Estudo 2

Neste estudo simulado foi considerado o modelo dinâmico, com um fator sazonal e uma covariável fixa no tempo. Este modelo é dado por

Yt = F0tβt+ t, t, ∼ Nn[0, Σ], β_t = Gtβt−1+ ωt, ωt∼ Np[0, Ψ], onde t = 1, . . . , T , β = (βt0, βt1, βt2, βt3)0, F0t= (1, x, 1, 0), x = (010, 117), Gt=   I2 0 0 G2  , G2 =   cos₂₅π sin₂₅π − sin π 25 cos π 25  , Ψ = diag(0.01, 0.02, 0.06, 0.06), β₀ = (0.01, 3, 5, 1)0.

Foram consideradas duas situações: na primeira foram selecionadas aleatori-amente n = 30 localizações de uma grade regular [0, 1] × [0, 1] (ver figura 2.1), nas quais 100 realizações (T = 100) do processo foram geradas a partir do mo-delo apresentado anteriormente. Na segunda situação, foram retiradas 15 das 30 localizações, restando n = 15 localizações, com suas respetivas realizações. Foi estudado um processo gerado por uma deformação pouco suave, com parâmetros

σ2_d₁₁ = σ_d2₂₂ = 0.030, φ = 3.28, b = 5.99, τ2 = 0.5 e f = 15.

Distribuições a priori

Para os parâmetros σ2_d₁₁ e σ_d2₂₂ foram utilizadas distribuições a priori informativas.

Assim, para ambos parâmetros σ_d2₁₁e σ_d2₁₁foi considerada uma distribuição a priori

GI(333.3, 10) e para b uma distribuição a priori G(5.8, 1) (ver Figura 2.8). No entanto, como se verá na Seção 2.8, para este caso onde a deformação é menos suave, tambem não são necessárias distribuições a priori informativas para estes parâmetros.

Resultados