Modelos dinâmicos para deformação
espacial
por
Fidel Ernesto Castro Morales
Universidade Federal do Rio de Janeiro Instituto de Matemática
Departamento de Métodos Estatísticos
Modelos dinâmicos para deformação espacial
Fidel Ernesto Castro Morales
Tese de Doutorado submetida ao programa de Pós-graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística.
Orientador: Dani Gamerman
Modelos dinâmicos para deformação espacial
Fidel Ernesto Castro Morales
Orientador: Dani Gamerman
Tese de Doutorado submetida ao programa de Pós-graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística.
Aprovada por:
Presidente Prof. Dani Gamerman IM–UFRJ
Prof. Alexandra M. Schmidt Prof. Marina S. Paez
IM–UFRJ IM–UFRJ
Prof. Luiz Duczmal Prof. Juan Vivar
UFMG University of Duke
Morales, Fidel Ernesto Castro
Modelos dinâmicos para deformação espacial/ Fidel Ernesto Castro Morales. – Rio de Janeiro: UFRJ/IM, 2010.
xvii, 133 f. : il. ; 31cm.
Tese (Doutorado) – UFRJ/IM. Programa de Pós-Graduação em Estatística, 2010.
Orientador: Dani Gamerman
Referências bibliográficas: p.138–142.
1. Estatística Matemática - Tese. I. Gamerman, Dani.
II. Universidade Federal do Rio de Janeiro. Instituto de
AGRADECIMENTOS
Primeiramente agradeço a Deus por permitir-me concluir este trabalho, pela paciência, perseverança e força para atingir meus objetivos e por colocar em meu caminho pessoas que me ajudaram e me acompanharam nos momentos difíceis.
Quero agradecer a meus pais: Abimael Enrique Castro Garcia, Piedade del Carmen Morales, às minhas avós Nohemi Morales e Ana Josefina Garcia e meus irmãos Jeronimo e Sebastian, pela ajuda incondicional, pelas orações e pelo amor que sempre recebi.
Agradeço aos professores do departamento de Estatística DME-UFRJ pelos seus ensinamentos que contribuíram de forma significativa em minha formação profissional. Em especial, agradeço ao professor Dani Gamerman, pelo grande exemplo como pessoa e profissional e pelos valiosos ensinamentos que aprendi na orientação.
Quero agradecer a minha namorada Lorena, pela paciência e amor que sempre me deu. Agradeço também a meus amigos: Fernando, Valmária, Marcelo Cunha, Esther, Juan, Vinícius, Cleide, Flávio, Luzia e Alexandre.
Agradeço a CAPES pela ajuda financeira para a realização dos de meus estu-dos no Brasil.
Resumo
A modelagem da estrutura de covariância espacial via deformação espacial tem sido utilizada sob a hipótese de que a covariância espacial do processo é constante no tempo. Porém, em aplicações reais esta suposição é inadequada e pouco rea-lista. Neste trabalho é generalizado o modelo de deformação espacial Bayesiano, que relaxa a hipótese de que a estrutura de covariância espacial seja constante no tempo. Este modelo incorpora estruturas de covariâncias que variam no tempo, através de deformações dinâmicas que, a priori, são assumidas provenientes de um processo Gaussiano dinâmico. Este modelo considera a estrutura temporal do processo tanto na sua média como na sua estrutura de covariância espacial, esti-mando conjuntamente todos seus parâmetros, utilizando o paradigma de Bayes. Esta abordagem modela a média do processo utilizando modelos lineares dinâmi-cos e a estrutura de covariância espacial via deformação espacial dinâmica. Este modelo utiliza a função de previção para fazer interpolação e no tratamento de dados faltantes. As distribuições a posteriori dos parâmetros foram aproximadas usando métodos Markov chain Monte Carlo (MCMC). Foi estabelecida por meio de dados artificiais a efetividade do esquema de amostragem em recuperar os verdadeiros valores dos parâmetros.
Este modelo proposto foi ajustado utilizando dados de concentrações de SO2
semanais na região leste de Estados Unidos. Este modelo incorporou a anisotropia supondo que a estrutura de covariância é constante no tempo. Nesta aplicação, a função preditiva fez boas predições em uma estação que não foi considerada no processo de estimação dos parâmetros. Outra aplicação com dados reais foi implementada, ajustando o modelo proposto em dados de temperaturas mínimas mensais, no Estado do Rio de Janeiro, Brasil. Neste ajuste foi relaxada a hipótese de estrutura de covariância espacial constante no tempo. Assim, foram testadas
as seguintes hipóteses: a estrutura de covariância espacial varia a cada década
seguindo os ciclos de radiação solar ou varia com as estações do ano. E foi
concluído que as estruturas de covariâncias para estes dados variam de forma independente de acordo com as estações do ano e com os ciclos de radiação solar. Palavras-Chave: Inferência Bayesiana, métodos MCMC, modelos dinâmicos, modelos de deformação espacial.
Abstract
The modeling of the spatial covariance structure via spatial deformation has been used under the assumption that the spatial covariance of the process is constant in time. However, in real applications this assumption is inappropriate and unrealistic. This work generalizes the Bayesian model for spatial deformation, by relaxing the assumption that the spatial covariance structure is constant over time. This model incorporates the covariance structures which vary over time, through dynamic deformation priors, taken from a dynamic Gaussian process. This model considers the temporal structure of the process both in its mean as in its spatial covariance structure, jointly estimating all parameters, using the Bayes paradigm. This approach models the process average using dynamic linear models and covariance structure deformation space via spatial dynamics. This model uses predictive functions for interpolation and the treatment of missing data. The posterior distributions of the parameters were approximated using MCMC methods. The effectiveness of the sampling scheme to recover the true parameter values was established with artificial data.
This model was fitted using data from weekly concentrations of SO2in eastern
United States. This model incorporate the assumption that the anisotropy in the covariance structure is constant in time. In this application, the predictive func-tion made good predicfunc-tions in a stafunc-tion that was not considered in the estimafunc-tion of parameters. Another application with real data was implemented by fitting the proposed model to the monthly minimum temperature data of State of Rio de Janeiro, Brazil. The hypothesis of the spatial covariance structure constant over time was relaxed. Thus, we tested the following hypotheses: the spatial co-variance structure varies each decade following cycles of solar radiation or varies with the seasons. It was concluded that the covariance structures for this data set vary independently according to the seasons and the cycles of solar radiation.
( Keywords:) Bayesian inference, MCMC methods, dynamic models, models of deformation space.
Conteúdo
1 Introdução
1
1.1
Notação e definições básicas
. . . .
2
1.1.1
Modelos probabilísticos . . . .
2
1.1.2
Processos Gaussianos . . . .
3
1.1.3
Análise de formas . . . .
5
1.2
Modelo de deformação espacial para processos espaciais
não-estacionários
. . . .
7
1.3
Modelo Bayesiano de deformação espacial . . . .
8
1.4
Justificativa deste trabalho . . . .
13
1.5
Organização deste trabalho . . . .
14
2 Modelo de deformação espacial com estrutura
tempo-ral
15
2.1
Modelo . . . .
16
2.1.1
Verossimilhança . . . .
18
2.1.2
Distribuições a priori para v, σ
2de b . . . .
18
2.2
Aspectos computacionais . . . .
20
2.3
Dados faltantes
. . . .
24
2.4
Interpolação . . . .
26
2.5
Estudo simulado . . . .
28
2.5.1
Estudo 1 . . . .
30
2.5.2
Estudo 2 . . . .
35
2.5.3
Estudo 3 . . . .
37
2.6
Comparação de modelos . . . .
38
2.7
Estudo de incerteza da deformação espacial . . . .
43
2.8
Estudo de sensibilidade para diferentes especificações a
priori dos parâmetros b e σ
2d. . . .
49
2.9
Aplicações . . . .
53
2.9.1
Concentração de dióxido sulfúrico na região leste
dos Estados Unidos . . . .
53
2.9.2
Temperatura mínima no estado do Rio de Janeiro 65
2.10 Considerações finais . . . .
74
2.11 Apêndice . . . .
77
3
Modelo de deformação espaço - temporal
85
3.1
Modelo geral . . . .
86
3.1.1
Distribuições a priori . . . .
87
3.1.2
Distribuição a posteriori . . . .
88
3.2
Casos Particulares . . . .
88
3.2.2
Caso 2 . . . .
90
3.2.3
Caso 3 . . . .
91
3.3
Aspectos computacionais . . . .
92
3.4
Interpolação . . . .
96
3.5
Estudo simulado . . . 100
3.5.1
Estudo 1 . . . 100
3.5.2
Estudo 2 . . . 105
3.6
Exemplo: Temperatura mínima no estado do Rio de
Janeiro . . . 114
3.7
Considerações finais . . . 124
4
Futuras pesquisas
126
Capítulo 1
Introdução
Neste trabalho é proposto um modelo espaço-temporal para processos Gaussianos não estacionários. A característica principal deste modelo é que a função de correlação é afetada pelo espaço e pelo tempo, através de deformações dinâmicas. Este modelo estima de forma conjunta tanto os parâmetros da média como da matriz de covariância, utilizando o paradigma de Bayes.
A finalidade deste capítulo é introduzir algumas definições preliminares e no-tação que serão utilizadas no presente texto, além de especificar objetivo e justi-ficativa deste trabalho. A organização do presente capítulo é a seguinte: na Seção 1.1 apresenta-se a definição e notação dos modelos probabilísticos utilizados. Na Seção 1.2 apresenta-se um resumo das abordagens propostas para processos es-paciais não estacionários. Na Seção 1.3 é apresentado o modelo de deformação espacial proposto sob o ponto de vista Bayesiano por Schmidt e O’Hagan (2003). Na Seção 1.4 são apresentados o objetivo e justificativa desta pesquisa. Na Seção 1.5 são listados o conteúdo e organização dos próximos capítulos.
1.1
Notação e definições básicas
1.1.1
Modelos probabilísticos
Nessa seção serão listados os principais modelos probabilísticos usados na tese.
Definição 1.1.1 (Distribuicão normal multivariada). A variável aleatória Z
tem distribuição normal multivariada com média µ, matriz de covariância Σ, se e somente se, a função de densidade de probabilidade de Z é dada por
πN(z; µ, Σ) = (2π)−p/2 | Σ |−1/2 exp −1 2(z − µ) 0 Σ−1(z − µ) . A distribuição de Z é denotada por
Z ∼ N[µ, Σ].
Definição 1.1.2 (Distribuicão gama). A variável aleatória X tem distribuição gama com parâmetro de forma η e parâmetro de escala 2/ψ, se e somente se, a função de densidade de probabilidade de X é dada por
πG(x; η, ψ) =
ψη2
Γ(η2)2η2
xη−22 exp(−ψ
2x).
A distribuição de X é denotada por
X ∼ G[η, ψ].
A parametrização da densidade gama é similar apresentada em O’Hagan
(1994). Se Y = X1, a distribuição de Y é chamada de gama invertida cuja função
de densidade é denotada por πGI(y; η, ψ). A distribuição de Y é denotada por
Y ∼ GI[η, ψ].
Definição 1.1.3 (Distribuição normal matriz variada). A matriz aleatória Υ de dimensão n × q tem distribuição normal matriz com matriz de média M , matriz
de covariância à esquerda A e matriz de covariância à direita B, se e somente se, a função de densidade de probabilidade de Υ é dada por
π(υ; M , A, B) = k(A, B) exp −1 2tr[(υ − M ) 0 A−1(υ − M )B−1] ,
onde tr é o traço de uma matriz e k(A, B) = (2π)−qn/2 | A |−q/2| B |−n/2 . A
distribuição de Υ é denotada por
Υ ∼ N [M , A, B],
onde A e B são matrizes simétricas definidas positivas.
Definição 1.1.4 (Distribuição Wishart). A matriz aleatória definida positiva Σ de dimensão q × q tem distribuição Wishart se, e somente se, a distribuição de densidade de Σ é dada por
π(σ; S, n) = 2 −αq | S |α πq(q−1)/4Qd i=1γ(α − i−1 2 ) | σ |α−(q+12 ) exp [−tr(Sσ)] ,
onde α > (d − 1)/2 é o parâmetro chamado graus de liberdade, e S é uma matriz definida positiva de dimensão q × q. A distribuição de Σ é denotada por
Σ ∼ Wα[S].
Se Λ = Σ−1, a distribuição de Λ é chamada de Wishart invertida. A distribuição
de Λ é denotada por
Λ ∼ Wα−1[S].
1.1.2
Processos Gaussianos
Um dos conceitos básicos no tratamento de dados espaciais é o processo Gaus-siano. Nessa seção são apresentadas algumas propriedades do processo GausGaus-siano.
Definição 1.1.5 (Processo Gaussiano). O processo X(·) definido em S ⊂ <r
é dito Gaussiano se, para todo n > 1 e qualquer conjunto {s1, . . . , sn} ∈ S,
Definição 1.1.6 A função de covariância C(s, s0) = Cov(X(s), X(s0)) é dita ser
positiva definida se para qualquer sj ∈ S e cj ∈ <, j = 1, . . . , n
X
i
X
j
cicjC(si, sj) > 0
e a expressão acima é igual a 0 se, e somente se, ci = 0 para todo i. A função
de correlação definida por
ρ(s, s0) = C(s, s
0)
pC(s, s)C(s0, s0)
é dita ser uma função de correlação valida se, e somente se, C(s, s0) é positiva
definida.
O processo X(·) é estritamente estacionário se para todo n > 1, qualquer
con-junto {s1, . . . , sn}, e qualquer h ∈ <r, a distribuição de X = (X(s1), . . . , X(sn))0
e X = (X(s1+ h), . . . , X(sn+ h))0 é a mesma. O processo X(·) é fracamente
esta-cionário se para qualquer s e h ∈ S, m(s) ≡ µ (o processo tem média constante) e C(s, s + h) = C(h) (Cressie, 1993). O processo X(·) estacionário é isotrópico se a função de correlação ρ depende somente das distâncias entre as localizações e possivelmente de um parâmetro desconhecido φ.
Denota-se por
X(·) ∼ P G(µ, σ2, ρφ),
um processo Gaussiano estacionário e isotrópico. A função de correlação utilizada tipicamente é positiva e decai monotonamente a 0 quando a distância entre as localizações cresce.
Definição 1.1.7 (Processo Gaussiano Multivariado). Um processo p-dimensional
X(·) = (X1(·), . . . , Xp(·))0 definido na região G ∈ <r é um processo estacionário e
isotrópico se para qualquer n ≥ 1 e localizações s1, . . . , sno vetor (X0(s1), . . . , X0(sn))0
Casos especiais dos processo Gaussianos multivariados são apresentados a seguir
• Seja Xk(·) ∼ P G(µk, σk2, ρθk), para k = 1, . . . , p, processos Gaussianos
inde-pendentes, onde cada processo tem sua própria média, variância e função
de correlação. O processo X(·) = (X1(·), . . . , Xp(·)) é denotado por
X(·) ∼
p
Y
k=1
P G(µk, σ2k, ρθk).
Assim, Cov(Xk(si), Xl(sj)) = σ2kρθk(| si− sj |), se k = l ou 0 em outro caso.
• Denota-se por X(·) ∼ P G(µ, Σ, ρθ) onde Σ = σkl é uma matriz de
co-variância e ρθ é uma função de correlação valida se Cov(Xk(si), Xl(sj)) =
σklρθ(| si− sj |), para todo l, j, i, k.
Definição 1.1.8 (Processo dinâmico Gaussiano). O processo X(·) é um processo dinâmico Gaussiano se este pode ser descrito por uma equação de diferença
X(·, t0) = G(t0, t)X(·, t) + w(·, t0, t), w(·, t0, t) ∼ P G(0, σ2, ρφ), para todo t, t0,
onde w(·, t0, t) é um processo Gaussiano com média 0 independente do tempo. O
processo é completado com a especificação de um processo Gaussiano para X(·, 0).
1.1.3
Análise de formas
Análise estatística de formas estuda a forma de um objeto através de sua in-formação geométrica. Existem diversos trabalhos que descrevem as definições e propriedades que permitem analisar formas geométricas. Algumas referências recomendadas são (Dryden e Mardia, 1998) e (Kendall, 1984). A seguir são a-presentadas algumas definições e propriedades do análise de formas.
fil-A forma de um objeto é invariante sob transformações euclidianas de translação, escala e rotação. Por exemplo a forma de um carro consiste de todas as pro-priedades geométricas que não mudam quando o carro é transladado, redimen-sionado ou rotado em um arbitrário sistema de coordenadas.
Definição 1.1.10 A matriz de rotação Γ satisfaz a seguinte propriedade ΓTΓ =
I e | Γ |= 1.
A rotação da configuração X é obtida pela posmultiplicação da configuração por uma matriz de rotação Γ.
Definição 1.1.11 A pre-forma da configuração X é dada por
Z = HX
k HX k
que é invariante sob translação e escala da configuração original.
Definição 1.1.12 Distância full Procrustes entre as configurações X1 e X2 é
definida por
dF(X1, X2) = inf
Γ,β || Z2− βZ1Γ ||,
onde Zr = HXr/ || HXr ||, r = 1, 2.
Definição 1.1.13 Distância parcial full Procrustes entre as configurações X1 e
X2 é definida por
dP(X1, X2) = inf
Γ || Z2− Z1Γ ||,
onde Zr = HXr/ || HXr ||, r = 1, 2.
Note que a distância full Procrustes entre as configurações X1 e X2 filtra o efeito
de escala e translação. Porém, a distância parcial full Procruster só filtra o efeito da translação.
Definição 1.1.14 (Distância de Riemann) A distância Procruster ρ(X1, X2) é
definida por
1.2
Modelo de deformação espacial para processos
espaciais não-estacionários
Em geoestatística, o modelo mais simples é aquele que assume que os dados espaciais são gerados por um processo Gaussiano estacionário e isotrópico. En-tretanto, em alguns processos atmosféricos, tais como temperatura, precipitação de chuva, e no caso de alguns poluentes, a estrutura de covariância é afetada também por características espaciais como: paisagem, topografia ou padrões de circulação. Deste modo, não é realista e adequada a suposição de que o processo que gera esse tipo de dados seja estacionário e isotrópico (Sampson e Guttorp, 1992; Sampson et al., 2001). Sampson e Guttorp (1992) propuseram um modelo semi-paramétrico para a modelagem da estrutura de covariância. Esta abordagem assume estacionariedade temporal mas não assume estacionariedade da estrutura de covariância espacial. A idéia principal deste modelo é mapear as coordenadas geográficas de localizações de G (região geográfica de interesse) a um novo espaço latente D (denota o espaço de dispersão) onde a estrutura espacial é estacionária e isotrópica (processo conhecido como deformação espacial). Este modelo é cons-truído em dois passos. O primeiro utiliza escalonamento multidimensional para interpolar as localizações geográficas das estações monitoradoras (que fornecem dados de variáveis ambientais ou atmosféricas) ao espaço latente D. O segundo, utiliza thin-plate splines para interpolar localizações não monitoradas de G em D. Este modelo tem várias desvantagens, a primeira é que este não incorpora a estrutura temporal dos dados; a segunda é que este não considera a incerteza na estimação da deformação espacial.
Foram propostas por Damian et al. (2001) e Schmidt e O’Hagan (2003), de forma independente, duas versões Bayesianas do modelo de Sampson e Guttorp (1992) que consideram a incerteza na estimação da deformação espacial. A prin-cipal diferença entre as duas propostas está na especificação da distribuição a
priori da deformação espacial. Damian et al. (2001) propõem uma distribuição a priori para a deformação espacial baseada em bending energy. Por outro lado, Schmidt e O’Hagan (2003) propõem um processo Gaussiano a priori para a função d(·) que mapeia as localizações geográficas do espaço G em D. Ambos mode-los incorporam uma estrutura de covariância espacial não-estacionária, mas não consideram a estrutura temporal dos dados. Damian et al. (2003) estendem o modelo proposto por eles em 2001. Esta nova abordagem, além de supor estru-tura de covariância não-estacionaria, incorpora a variância temporal dos dados. Recentemente, Bruno et al. (2008) propõem um modelo espaço-temporal no qual a não separabilidade da função de correlação surge da variabilidade temporal não-estacionária; neste modelo a anisotropia é corrigida via deformação espacial (Damian et al, 2001).
Os modelos de processos de convolução foram introduzidos por Higdon (1998) para descrever processos com estrutura de covariância não-estacionária. Esta abordagem utiliza o fato de que qualquer processo Gaussiano estacionário pode ser expresso como a convolução de um processo Gaussiano de ruído branco com uma função núcleo (kernel, em inglês) determinada. Fuentes e Smith (2001) es-tendem o modelo espacial localmente suavizado apresentado por Fuentes (2001) a uma convolução contínua de processos Gaussianos estacionários. Fuentes e Smith (2001) utilizam uma abordagem Bayesiana hierárquica para estimar as distribuições a posteriori dos parâmetros e a distribuição preditiva.
A seguir apresenta-se com detalhe o modelo de Schmidt e O’Hagan (2003) que será a base para especificação a priori da função d(·) no presente trabalho.
1.3
Modelo Bayesiano de deformação espacial
Nesta seção, apresenta-se a abordagem Bayesiana proposta por Schmidt e O’Hagan (2003), para o modelo de deformação espacial introduzido inicialmente por
Samp-son e Guttorp (1992).
Considere dados obtidos em n estações monitoradoras em certa região
geo-gráfica G para T pontos no tempo. Assim, denote Yit= Y (si, t) o valor observado
na localização si, i = 1, . . . , n, no tempo t, t = 1, . . . , T e defina os vetores Yt =
(Y1t, . . . , Ynt)0 e Y = (Y1, . . . , YT). Suponha que Y1, . . . , YT são independentes
e identicamente distribuidos (i.i.d.) com Yt ∼ N (µ, Σ) para t = 1, . . . , T . O
interesse central é fazer inferência sob Σ. Assim, depois de integrar a função de verossimilhança L(µ, Σ | y) com relação a µ, utilizando uma priori uniforme, a função de verossimilhança de Σ é dada por
L(Σ | y) ∝| Σ |−T −12 exp{−T 2trΣ −1 S}, onde S = T1 PT t=1(yt− ¯y)(yt− ¯y) 0.
Neste modelo, cada (i, j) − ésimo elemento de Σ é dado por
Cov(Y (si, t), Y (sj, t)) =
√
vivjρb(| d(si) − d(sj) |), i 6= j, para todo t,
onde vi = Var(Y (si, t)), i = 1, . . . , n, ρb é uma função de correlação do processo
espacial e d(·) é uma função que será especificada mais adiante. Para simplificar
o modelo assume-se que v1, . . . , vn são permutáveis a priori, isto é,
vi | τ2 ∼ GI[f, τ2(f − 2)] para i = 1, . . . , n
π(τ2) ∝ (τ2)−1.
Processo d(·)
A idéia principal de Schmidt e O’Hagan (2003) é usar um processo Gaussiano a priori para mapear as localizações geográficas a um espaço latente. A função de correlação do processo espacial depende das distâncias das localizações no espaço D, e d(·) é a função que mapeia as localizações do espaço G ao espaço D, onde estacionariedade e isotropia são válidas. Um processo Gaussiano a priori é determinado para a função d(·) e este é definido por
na qual g(·) é uma função de G em G. Seja di = d(si), g(si) = gi, d =
(d1, . . . , dn), g = (g1, . . . , gn) e Rd é uma matriz n × n com elementos rij = ρφ(|
si− sj |). Assim, pela definição de processo Gaussiano tem-se que
d | g, σ2d, Rd ∼ N [g, σ2d, Rd].
Apesar de g(·) poder assumir qualquer forma, é razoável assumir que g(·) é a função identidade, quando não há qualquer informação a priori sobre como D difere de G.
Papel de R
dna função d(·)
A matriz Rd, descreve a estrutura de correlação a priori das localizações no espaço
D. Ou seja, ela dá informação sobre distorções locais entre as estações em D e controla o grau de suavização do processo Gaussiano. Assume-se que a correlação das localizações em G se conserva no espaço D. Espera-se que as estações que são vizinhas em G tendam a ser vizinhas no espaço D. Assim, para refletir essa
crença, os elementos de Rd são modelados por Schmidt e O’Hagan (2003) de
acordo com uma função de correlação gaussiana
ρφ(x) = exp −φx2 ,
onde φ é conhecido. Este parâmetro controla, a priori, a forma da configuração das estações em D. Sugere-se valores de φ > 0 que façam que localizações que são relativamente próximas entre si em G tendam a ficar também próximas em D, mas pontos mais distantes em G serão menos correlacionados a priori.
Especificação de σ
2dO parâmetro σ2
d é uma matriz diagonal que controla o grau de distorção no
ma-peamento de G em D. Valores pequenos deste parâmetro sugerem deformações
suaves. Schimidt e O’Hagan (2003) provaram que σ2
σ2d= diag(σd211, . . . , σd2rr), assume-se que os elementos da diagonal de σd2 são
inde-pendentes com distribuição a priori σ2
dii ∼ GI(ηi, φi), i = 1, . . . , r. Na Figura 1.1
apresenta-se a deformação de uma grade regular na região [0, 1] × [0, 1] geradas
com diferentes valores de σ2
d. 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 0.2 0.4 0.6 0.8 1.0 0.0 0.4 0.8 (a) 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 0.0 0.4 0.8 1.2 0.0 0.4 0.8 (b) 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 (c) 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 0.2 0.4 0.6 0.8 1.0 −0.2 0.2 0.6 1.0 (d)
Figura 1.1: Deformações da grade regular [0, 1] × [0, 1] geradas com os parâmetros φ = 3.7,
(a) σ2d11 = σd222 = 0.01, (b) σd211 = σd222 = 0.03, (c) σd211 = σd222 = 0.05, (d) σ2d11 = 0.01 e σ2
d22= 0.03.
Distribuição a posteriori
Neste modelo, o parâmetro a ser estimado é θ = (d, v, b, τ2, σ2
d). Considerando
a distribuição a priori de θ especificada anteriormente, e combinando essa infor-mação com a função de verossimilhança, a distribuição a posteriori de θ é obtida
a partir do teorema de Bayes. Assim,
π(θ | y) ∝ L(Σ | y)π(θ).
A distribuição a posteriori mencionada anteriormente, não tem forma fechada, então recorre-se aos métodos MCMC para aproximá-la. Os detalhes computa-cionais destas aproximações encontram-se em Schmidt (2001).
Interpolação
Um dos principais objetivos da modelagem espacial é fazer predições do pro-cesso espaço-temporal, em localizações onde não existem estações
monitorado-ras. Assim, seja YN Mt = (Y(n+1)t, . . . , Y(n+m)t) o vetor de observações no tempo t,
t = 1, . . . , T , do processo nas localizações geográficas não monitoradas doN M0 =
(sn+1, . . . , sn+m). Sejam dN M = (dn+1, . . . , dn+m) a matriz das deformações de
doN M0 e vN M = (v
n+1, . . . , vn+m) o vetor de variâncias do processo em
localiza-ções não monitoradas. Seja θA= (θ, vN M, dN M). Então a distribuição preditiva
é dada por
π(yN Mt | y) =
Z
θA
π(yN Mt | yt, θA)π(θA| y)dθA.
Os detalhes computacionais para a aproximação da distribuição preditiva ap-resentada anteriormente encontram-se em (Schmidt e O’Hagan, 2003). Sob a
suposição de que Y1, . . . , YT, são independentes e identicamente distribuídos
com Yt∼ N (µ, Σ) para t = 1, . . . , T . A função preditiva utiliza o ganho obtido
na modelagem da estrutura de covariância espacial, na estimação de valores nas localizações onde não se tem estações monitoradoras. Mas, em muitos processos esta suposição não é realista. Schmidt e O’Hagan (2003) afirmam que quando o processo não satisfaz a suposição anterior, se deve trabalhar com os resíduos
obti-dos, uma vez ajustado um modelo de séries temporais. Estes resíduos Z1, . . . , ZT
t = 1, . . . , T , possuem distribuição preditiva dada por π(ZN Mt | Z) = Z θA π(ZN Mt | Zt, θA)π(θA | Zt)dθA, onde ZN Mt = (Z(n+1)t, . . . , Z(n+m)t).
1.4
Justificativa deste trabalho
O modelo proposto por Schmidt e O’Hagan (2003) é uma abordagem Bayesiana proposta para fazer inferência sob a estrutura de covariância espacial de um pro-cesso Gaussiano não estacionário. Esta proposta utiliza a idéia de Sampson e Guttorp (1992), de deformar a região de estudo para obter um novo espaço onde o processo é estacionário e isotrópico. As deformações do espaço são introduzidas através de uma distribuição a priori Gaussiana. Esta abordagem assume que a estrutura de covariância espacial é constante através do tempo. Esta suposição é restritiva e pouco realista, pois, em aplicações com dados ambientais tais como estudos de poluentes, a média e a covariância do processo sob estudo podem ser afetadas pelo tempo (Gamerman et al., 2007). Outra característica deste modelo é que ele assume que foi removida a estrutura temporal na média utilizando mo-delos de séries temporais e utiliza os resíduos ajustados para estimar a matriz de covariância.
Gamerman et al. (2007) sugerem que a estrutura de covariância
espaço-temporal seja afetada por características espaciais e pelo tempo; eles afirmam que um candidato natural para introduzir esta mudança são os processos Gaussianos dinâmicos. Neste trabalho, é proposta uma abordagem espaço-temporal para processos Gaussianos não-estacionários, onde a média do processo é modelada via modelos dinâmicos (West e Harrison, 1997) e a estrutura de covariância espa-cial via uma generalização dinâmica de deformação espaespa-cial (Sampson e Guttorp, 1992) sob o ponto de vista Bayesiano (Schmidt e O’Hagan, 2003). Ao contrário
o modelo proposto nesta tese relaxa a suposição de que a função de covariância espacial é constante, permitindo que esta evolua no tempo através de deformações espaciais dinâmicas que podem ser geradas por diferentes especificações a priori. Neste trabalho são propostas três especificações a priori para a deformação espa-cial, a primeira supõe que as deformações são geradas por um processo Gaussiano dinâmico. A segunda, assume que as deformações são geradas de forma indepen-dente. E a última especificação a priori assume que existem blocos de deformações com estrutura dinâmica dependente dentro dos blocos, mas independência entre os blocos.
1.5
Organização deste trabalho
Este trabalho esta organizado da seguinte forma. No Capítulo 2, é introduzido um modelo espaço-temporal para processos Gaussianos não estacionários. Este modelo estima conjuntamente a média e a matriz de covariância do processo uti-lizando o paradigma de Bayes. A principal característica deste modelo é incorpo-rar a média do processo através de modelos dinâmicos. Esta abordagem assume que a matriz de covariância é constante no tempo. A modelagem da estrutura de covariância espacial consiste em corrigir a anisotropia via deformação espacial sob o ponto de vista Bayesiano. As distribuições a posteriori dos parâmetros são aproximadas utilizando métodos Markov chain Monte Carlo (MCMC).
No Capítulo 3, é proposta uma generalização dinâmica do modelo de defor-mação espacial proposto no Capitulo 2. A principal característica deste modelo é relaxar a suposição de que a matriz de covariância é constante. A modelagem da estrutura de covariância é incorporada através de deformações dinâmicas. Como no Capítulo 2, as distribuições a posteriori dos parâmetros são aproximadas uti-lizando métodos MCMC. No Capítulo 4, são apresentadas varias extensões deste modelo que podem ser desenvolvidas em pesquisas futuras.
Capítulo 2
Modelo de deformação espacial com
estrutura temporal
Modelos dinâmicos são uma ferramenta importante para descrever dados prove-nientes de processos Gaussianos temporais não-estacionários (West e Harrison, 1997). Vários autores propuseram modelos espaço-temporais baseados em mo-delos de espaço de estados. Por exemplo, Gelfand et al. (2005) introduziram uma classe geral de modelos de regressão multivariados que incorpora estrutura espaço-temporal não-estacionária. Uma referência recomendada para a revisão de modelagem e análise de dados espaço-temporais é Banerjee et al. (2004).
Neste capítulo, é introduzido um modelo espaço-temporal para processos não estacionários que corrige a anisotropia via deformação espacial (Sampson e
Gut-torp, 1992), sob o ponto de vista Bayesiano (Schmidt e O’Hagan, 2003). O
modelo proposto incorpora a estrutura temporal na média do processo através de modelos dinâmicos. A modelagem da média conjuntamente com a estrutura de covariância espacial, permite de forma direta fazer predições em localizações onde não se têm estações monitoradoras e para dados faltantes.
2.1
Modelo
Seja Y (·, t) um processo Gaussiano observado em G × L, no qual G ⊂ <r e
L = {1, . . . , T }. O processo Y (·, t) é modelado através da seguinte equação:
Y (·, t) = µ(·, t) + (·, t), para t = 1, . . . , T, (2.1)
onde µ(·, t) é a média do processo Gaussiano e (·, t) é um processo Gaussiano
espaço-temporal com média 0 e função de correlação ρb, que será especificada mais
adiante. Seja ft um vetor de covariáveis relacionado com Y (·, t), tal que µ(·, t) =
f0tβt, onde βt= (β0t, . . . , β(p−1)t) é um processo dinâmico (West e Harrison, 1997)
definido através da especificação a priori
βt= Gtβt−1+ ωt, ωt∼ Np[0, Ψ], para t = 1, . . . , T , (2.2a)
β0 ∼ Np[m0, C0], (2.2b)
Ψ ∼ Wn−10 [S0], (2.2c)
onde Gt é uma matriz de evolução de estados de dimensão p × p, com valores
conhecidos, m0, C0 e S0 podem ser escolhidos de forma que a distribuição a
priori de (β0, Ψ) em (2.2b) e (2.2c) seja pouco informativa. Assume-se que a
estrutura de covariância espacial de (·, t) não depende do tempo t e ωt e (·, t)
são independentes, para todo t.
Covariância espacial
A função de covariância espacial de (·, t) é definida por
Cov((si, t), (sj, t)) =
√
vivjρb(| d(si) − d(sj) |), (2.3)
onde vl = Var((sl, t)), para l = 1, . . . , n, para todo t, ρb é uma função de
correlação válida, onde b é um parâmetro desconhecido. Neste capítulo se utiliza a função de correlação exponencial, dada por
A seguir, será apresentada a especificação a priori para d(·).
Deformação espacial
Seja s = (x1, . . . , xr) ∈ G e defina um processo Gaussiano a priori d(·) (Schmidt
e O’Hagan, 2003) dado por,
d(·) ∼ P G(g(·), σ2d, ρφ), (2.5)
onde σ2d = diag(σd211, . . . , σ2drr) e g(·) é uma função que depende das coordenadas
x1, . . . , xr do ponto s em G. Em particular, considera-se g(s) = s. A função de
covariância de d(·) é dada por
Cov(d(si), d(sj)) = σ2dρφ(| si− sj |), se i 6= j σ2 d, se i = j,
na qual ρφ é uma função de correlação válida e φ é um parâmetro conhecido. A
função d(·) distorce as localizações da região geográfica G a um novo espaço D,
onde o parâmetro σ2d determina a força da distorção e ρφ estabelece a forma da
distorção no novo espaço D. Note que as localizações geográficas são mapeadas por (2.5) no espaço D, de forma que (·, t) é estacionário e isotrópico (Sampson e Guttorp, 1992).
Suponha dados obtidos em n estações monitoradoras em uma certa região
geo-gráfica G, para T pontos no tempo. Denote por Yit = Y (si, t) o valor observado
na localização si, i = 1, . . . , n, no tempo t, t = 1, . . . , T . Suponha que o vetor
Yt = (Y1t, . . . , Ynt)0 foi gerado por (2.1) e pela definição de processo Gaussiano,
tem-se que Yt= F0tβt+ t, t∼ Nn[0, Σ], t = 1, . . . , T βt= Gtβt−1+ ωt, ωt ∼ Np[0, Ψ], t = 1, . . . , T β0 | Ψ ∼ Np[m0, C0], −1 (2.6)
onde F0t é um conjunto de covariáveis dinâmicas e t = ((s1, t), . . . , (sn, t))0.
Aqui, os elementos da matriz Σ são calculados pela equação (2.3), que dependem
das localizações latentes d = (d1, . . . , dn) geradas por (2.5), na qual di = d(si),
para i = 1, . . . , n. Assim, pela definição de processo Gaussiano, tem-se que a função de densidade de probabilidade a priori de d é dada por,
π(d) = (2π)−n | σ2d |−n/2| Rd | −1 exp −1 2tr(d − d o 0) 0 (σ2d)−1(d − do0)R−1d ,
onde do0 = (g(s1), . . . , g(sn)) = (s1, . . . , sn) e Rd é a matriz de correlação, cujos
elementos são calculados através de ρφ.
2.1.1
Verossimilhança
Neste modelo, o parâmetro a ser estimado é θ = (β, d, v, b, τ2, σ2
d, Ψ), onde
β = (β0, . . . , βT), v = (v1, . . . , vn) e τ2 é um hiperparâmetro da distribuição a
priori de vi, i = 1, . . . , n, definido na subseção 2.1.2. Para uma série observada
y, proveniente de (2.6), a função de verossimilhança de θ é
L(θ | y) ∝| Σ |−T2 exp ( −1 2 T X t=1 (yt− F0tβt)0Σ−1(yt− F0tβt) ) . (2.7)
2.1.2
Distribuições a priori para v, σ
2de b
Foram consideradas as mesmas distribuições a priori propostas por Schmidt e
O’Hagan (2003) para os parâmetros v e σ2
d. Para o parâmetro b em (2.4)
considerou-se a distribuição a priori recomendada por Schmidt e Gelfand (2003).
A seguir, são especificadas as distribuições a priori dos parâmetros vi, σ2d e b.
Distribuição a priori para v
Assume-se que o vetor de variância v não tem estrutura espaço-temporal.
i = 1, . . . , n é dada por,
vi | τ2, f ∼ GI[f, τ2(f − 2)]
π(τ2) ∼ (τ2)−1,
onde τ2 tem distribuição a priori não-informativa.
Distribuição a priori para σ2
d
Assume-se que os elementos da diagonal principal de σ2d são independentes com
distribuição a priori gama invertida para cada um dos elementos. Isto é, σ2d
ii ∼ GI[ηi, ψi], para i = 1, . . . , r.
Distribuição a priori para b
A distribuição a priori de b é uma distribuição gama informativa. Isto é,
b ∼ G[b∗η, η],
no qual b∗ = −2 log(0.05)/ max(| si− sj |).
As distribuições a priori dos parâmetros β, d e Ψ foram especificadas em (2.2). Assim a distribuição a priori de (β, d, Ψ) é dada por
π(β, d, Ψ) = ( T Y t=1 π(βt| βt−1, Ψ) ) π(β0)π(Ψ)π(d).
2.1.3
Distribuição a posteriori
Considerando a distribuição a priori de θ especificadas anteriormente, e combi-nando essa informação com a função de verossimilhança em (2.7), a distribuição a posteriori de θ é obtida a partir do teorema de Bayes. Assim,
π(θ | y) ∝ L(θ | y) ( T Y t=1 π(βt| βt−1, Ψ) ) π(β0)π(Ψ)π(d) × ( n Y π(vi | τ2) ) π(τ2)π(b)π(σ2d). (2.8)
A distribuição a posteriori em (2.8) não tem forma fechada, então recorre-se aos métodos MCMC para aproximá-la. O algoritmo utilizado para obter amostras da distribuição a posteriori em (2.8) é um algoritmo híbrido da seguinte forma: para o subconjunto de parâmetros de θ cuja densidade condicional completa seja conhecida, amostra-se diretamente dela, e para o subconjunto de parâmetros cuja densidade condicional completa não seja conhecida amostra-se da mesma usando passos Metropolis-Hastings (Metropolis et al., 1953; Hastings, 1970). Referências recomendadas para a revisão de métodos MCMC são Gamerman e Lopes (2006) e Robert e Casella (2004).
2.2
Aspectos computacionais
Nesta seção, detalha-se o procedimento de amostragem do parâmetro θ da dis-tribuição a posteriori dada em (2.8).
Amostrando d
Seja X uma matriz n × r que denota uma configuração de n pontos com r componentes. Denote por Φ a matriz de distâncias euclidianas entre os pontos de X. Seja Γ uma matriz de rotação e γ um vetor de translação. Existem
infinitas configurações X∗ = XΓ + 1γ tais que a matriz de distâncias euclidianas
de X∗ denotada por Φ∗ é igual a Φ.
Dado que a verossimilhança em (2.7) depende de Σ através da matriz de distancias euclidianas do parâmetro d, então, pelo resultado anterior, tem-se que o parâmetro d é não identificável. Assim, para garantir identificabilidade do parâmetro d é imposta a restrição de fixar os valores de duas deformações como conhecidas. Esta restrição faz o papel de âncora, garantindo a não rotação e translação de d. Em aplicações, recomenda-se supor que as deformações supostas conhecidas sejam iguais às localizações geográficas correspondentes. A seguir,
apresenta-se a proposta para amostrar o parâmetro d.
Partindo da distribuição a posteriori em (2.8), a condicional completa para d é dada por πd(d) ∝| Σ |− T 2 exp ( −1 2 T X t=1 (yt− F0tβt)0Σ−1(yt− F0tβt) ) × exp −1 2tr(d − d o 0) 0 (σ2d)−1(d − do0)R−1d .
A densidade de transferência q(d(j), ·) = π(·; d(j), u1I2, Rd) foi utilizada na
implementação do algoritmo de Metropolis-Hastings. Além disso, u1 é sintonizado
de forma que a taxa de aceitação fique em torno de 20%. Estudos simulados mostraram que para taxas de aceitação maiores a 20% as cadeias demoravam
mais para recorrer o espaço paramétrico. O movimento de d(j)para dprop é aceito
com probabilidade α(d(j), dprop) = min 1,πd(d prop) πd(d(j)) . Amostrando β Seja yt = (y
1, . . . , yt). Para obter amostras de β é utilizado o algoritmo
for-ward filtering - backfor-ward sampling (FFBS) (Frühwirth-Schnatter, 1994) descrito a seguir. 1. Amostrar βT de βt | yt ∼ N [m t, Ct], com mt = at+ Atet e Ct = Rt− AtQtA 0 t. Nos quais, At = RtFtQ−1t , et = yt− ft, at = Gtmt−1, Rt = GtCt−1G0t+ Ψ, ft= Ftat e Qt= F 0 tRtFt+ Σ. 2. Amostrar βt de βt| βt+1, v, Ψ, b, yt∼ N [(G0tΨ−1Gt+C−1t )−1(G 0 tΨ −1 βt+1+C−1t mt), (G0tΨ −1 Gt+ C−1t )−1].
Amostrando vi
Seguindo a distribuição a posteriori em (2.8), a condicional completa para vi é
dada por: πv(vi) ∝ ( T Y t=1 | Σ |−12 exp −1 2(yt− F 0 tβt) 0 Σ−1(yt− F0tβt) ) × v− f +2 2 i exp −(f − 2)τ 2 2vi . A densidade de transferência q(v(j)i , ·) = πG(·; v (j) i × u2, u2) foi utilizada na
implementação do algoritmo de Metropolis-Hastings. Além disso, u2 é obtido de
forma que a taxa de aceitação fique em torno de 40%. O movimento de v(j)i para
vprop é aceito com probabilidade
α(vi(j), viprop) = min ( 1,πv(v prop i )q(v prop i , v (j) i ) πv(v (j) i )q(v (j) i , v prop i ) ) , i = 1, . . . , n.
Schmidt e O’Hagan (2003) recomendam usar o método da rejeição adaptativo (Gilks e Wild, 1992), já que sua distribuição condicional completa é log-côncava
quando expressa em termos de v−
1 2
i .
Amostrando b
A partir da distribuição a posteriori em (2.8), a condicional completa para b é dada por πb(b) ∝ ( T Y t=1 | Σ |−12 exp −1 2(yt− F 0 tβt) 0 Σ−1(yt− F0tβt) ) × bb∗η−22 exp −η 2b .
A densidade de transferência q(b(j), ·) = πG(·; b(j) × u3, u3) foi utilizada na
implementação do algoritmo Metropolis-Hastings. Além disso, u3 é obtido de
forma que a taxa de aceitação fique em torno de 40%. O movimento de b(j) para
bprop é aceito com probabilidade
α(b(j), bprop) = min 1,πb(b prop)q(bprop, b(j)) πb(b(j))q(b(j), bprop) .
Amostrando τ2
A partir da distribuição a posteriori em (2.8), a condicional completa para τ2 é
dada por πτ(τ2) ∝ π(τ2) n Y i=1 π(vi | τ2) ∝ (τ2)nf −22 n Y i=1 exp −(f − 2)τ 2 2vi = (τ2)nf −22 exp − (f − 2) Pn i=1v −1 i 2 τ2 . (2.9)
Note que a densidade em (2.9) tem a forma da distribuição gama. Assim, τ2
é amostrado diretamente de uma distribuição gama com parâmetros η = nf e
ψ = (f − 2)Pn i=1v −1 i . Amostrando σ2 d
A partir da distribuição a posteriori em (2.8), a condicional completa para σ2
d é dada por πσ2 d(σ 2 d) ∝ π(σ 2 d)π(d | d o 0) ∝ r Y i=1 σd2 ii −(ηi+22 ) exp − ψi 2σ2 dii × | σ2d|−n2 exp −1 2tr(d − d o 0) 0 (σ2d)−1(d − do0)R−1d = r Y i=1 σd2 ii −(ηi+n+22 ) exp − ψi 2σ2 dii exp −1 2tr(σ 2 d) −1 Sd = r Y i=1 σd2ii−(ηi+n+22 )exp −ψi+ Sdii 2σ2 dii , onde Sd= (d − do0)R −1 d (d − d o 0) 0, em que S
dii é i-ésimo elemento da diagonal de
Sd. Note que
σd2ii | θ−σ2
dii ∼ GI[n + ηi, Sdii+ ψi], para i = 1, . . . , r, (2.10)
onde θ−σ2
diidenota o subconjunto de parâmetros θ−{σ
2
dii}. Assim, σ
2
Amostrando Ψ
A partir da distribuição a posteriori em (2.8), a condicional completa para Ψ é dada por πΨ(Ψ) ∝ T Y t=1 π(βt| βt−1, Ψ) ∝ T Y t=1 | Ψ |−12 exp −1 2 βt− Gtβt−1 0 Ψ−1 βt− Gtβt−1 × | Ψ |−(p+n02 ) exp −1 2tr noS0Ψ −1 =| Ψ |− p+n∗0 2 exp −1 2trn ∗ 0S ∗ 0Ψ −1 , onde n∗0 = n0+ T e S∗0 = 1 n∗0 " T X t=1 (βt− Gtβt−1)(βt− Gtβt−1) 0 + n0S0 # . Note que Ψ | θ−Ψ ∼ W−1n∗ 0[S ∗ 0]. (2.11)
Assim, Ψ é amostrado diretamente de (2.11).
2.3
Dados faltantes
Em aplicações com dados reais, é comum haver dados faltantes nas séries tempo-rais observadas. Nesta seção, é apresentada uma forma de trabalhar com este tipo de dado. Neste trabalho, os dados faltantes correspondem àqueles dados que por algum motivo não foram registrados nas estações monitoradoras. A idéia princi-pal é completar as séries temporais onde existam dados faltantes considerando-os
como parâmetros do modelo. Assim, seja Yt = (Yot, Y
no
t )0, onde Y
o
t
repre-senta o conjunto de dados observados e Ynot o conjunto de dados não-observados
no tempo t. O conjunto de parâmetros a ser estimado é θ∗ = (Yno, θ), onde
conjunto de dados observados. Assim, a distribuição a posteriori de θ∗ é dada por π(θ∗ | yo) ∝ L(θ∗ | yo) ( T Y t=1 π(βt| βt−1, Ψ) ) π(β0)π(Ψ)π(d) ( n Y i=1 π(vi | τ2) ) π(τ2)π(b)π(σ2d)π(yno | θ).
O objetivo é fazer predições de dados faltantes através da função preditiva
π(yno | yo) =
Z
π(yno | yo, θ)π(θ | yo)dynodθ.
Amostrando Ynot
Os dados faltantes Ynot , t = 1, . . . , T , são amostrados diretamente da condicional
completa que é calculada a seguir. Em consequência da equação (2.6), tem-se que Yot Ynot | β, Σ ∼ N F∗t0βt F∗∗t 0βt , Σo Σono Σono0 Σno , (2.12)
no qual F∗t0 é a matriz de regressão dinâmica para os dados observados, F∗∗t 0
é a matriz de regressão dinâmica para os dados não-observados, Σo é a matriz
de covariâncias dos dados observados, Σno é a matriz de covariâncias dos dados
não-observados e Σono é a matriz de covariâncias entre os dados observados e
não observados. Note que, os valores de Yt para t = 1, . . . , T , condicionados em
β e Σ são independentes. Usando a propriedade da distribuição condicional da
Normal multivariada em (2.12), a condicional completa para Ynot é dada por,
Ynot | θ ∼ N [F∗∗t 0βt+ Σono0(Σo)−1(yot− F∗t0βt), Σno− Σono0(Σo)−1
Σono]. (2.13)
2.4
Interpolação
Em geoestatística o principal objetivo é fazer predições de um processo ou fenô-meno sob estudo em qualquer localização, a partir dos dados observados nas estações monitoradoras. Um passo importante na previsão ou interpolação é a descrição da estrutura de covariância do processo. Os modelos tradicionais as-sumem que a distribuição espacial é estacionária e isotrópica. Entretanto, em aplicações com dados reais estas hipóteses são pouco realistas e inadequadas. Nesta seção, é apresentada a forma de fazer predições em um conjunto qualquer de localizações, utilizando o ganho obtido ao deformar o espaço original. Es-tas interpolações são feiEs-tas através da função preditiva. Antes de calcular esta função é preciso fazer interpolação das deformações das localizações geográficas de interesse. A seguir apresenta-se a forma de fazer interpolação da deformação.
Interpolação de d
Sejam doN M0 = (sn+1, . . . , sn+m) a matriz das localizações geográficas onde não se
tem estações monitoradoras, dN M = (dn+1, . . . , dn+m) a matriz das deformações
de doN M0 e dA = (d, dN M). Denote por vN M = (v
n+1, . . . , vn+m) o vetor de
variâncias do processo em localizações não monitoradas. Em consequência de (2.5) e pela definição de processo Gaussiano, tem-se que a distribuição a priori
de dA é dada por d dN M | Rd, σ2d ∼ N do0 doN M0 , σ2d, Rd RoN M 0 d RoN Md RN Md , (2.14)
onde Rd é a matriz de correlação entre as estações monitoradoras, RN Md é a
matriz de correlação entre as localizações não monitoradas e RoN Md é a matriz
de correlação entre as estações monitoradoras e localizações não monitoradas. Assim, usando as propriedades da distribuição Normal matriz variada em (3.27)
tem-se que, vec(dN M) | θA−dN M ∼ N2m[A, B], (2.15) onde A = vec(doN M0 ) + (I2 ⊗ RoN Md R −1 d )(vec(d) − vec(d o 0)) e B = σ2d⊗ (Im− RoN Md R−1d RoN Md 0).
Amostras da distribuição a posteriori de dN M e vN M são geradas da seguinte
forma: para cada amostra θ(k) da distribuição a posteriori de θ obtida no
al-goritmo de amostragem descrito na seção 2.2, vN M (k) e dN M (k) são amostrados
de vj | θ(k) ∼ GI[τ2(k)(f − 2), f ], j = n + 1, . . . , n + m (2.16) e vec(dN M (k)) | θ ∼ N2m[A(k), B(k)], (2.17) onde, A = vec(doN M0 ) + (I2⊗ RoN Md R −1 d )(vec(d (k) ) − vec(do0)) e B = σ2(k)d ⊗ (Im− RoN Md R −1 d R oN M0 d ).
Interpolação de Y
Denote por YN Mt = (Y(n+1)t, . . . , Y(n+m)t) o vetor de observações no tempo t,
t = 1, . . . , T , do processo nas localizações geográficas não monitoradas e YAt =
(Yt, YN Mt ) o vetor de observações monitoradas e não monitoradas no tempo t.
Assim, o vetor de parâmetros θ em (2.7) é substituído por θA= (θ, vN M, dN M).
Em consequência de (2.6), tem-se que Yt YN Mt | θ A∼ N F0tβt F0N Mt βt , Σ Σ∗ Σ∗ ΣN M ,
no qual, F0t é a matriz de regressão dinâmica para os dados observados, FN Mt 0
é a matriz de regressão dinâmica para os dados não monitorados, Σ é a matriz
de covariâncias dos dados observados, ΣN M é a matriz de covariâncias dos dados
monitorados. Usando propriedades básicas da distribuição Normal multivariada, tem-se que: YN Mt | θA, y t∼ N [F 0N M t βt+ Σ ∗0 (Σ)−1(yt− F0tβt), ΣN M− Σ∗0(Σ)−1Σ∗].
A densidade da distribuição preditiva de YN At | Y é dada por
π(yN Mt | y) =
Z
θA
π(yN Mt | yt, θA)π(θA| y)dθA. (2.18)
Note que a integral em (2.18) não é tratável analiticamente e portanto, métodos Monte Carlo são utilizados para obter uma aproximação de (2.18) da seguinte forma: πj(yN Mt | y) = Z θA π(yN Mt | yt, θA)π(θA | y)dθA. = Z θA π(yN Mt | yt, θA)π(vN M, dN M | θ)π(θ | y)dθA ≈ 1 K K X k=1 π(yN Mt | θA(k), y t),
onde θAé amostrado de sua distribuição a posteriori π(θA| y) da seguinte forma:
• θ(k) é amostrado de π(θ | y); e
• vN M (k) e dN M (k) são amostrados de π(vN M (k), dN M (k)), para k = 1, . . . , K.
2.5
Estudo simulado
Uma análise com dados simulados foi realizada baseada no modelo (2.1). Nesta seção, foram estudados dois processos, o primeiro apresentando uma deformação
suave, gerado a partir da função de correlação Gaussiana ρφ com parâmetro φ =
3.28 (φ = −2 log(0.05)/ maxi,j=1,...,n(| si − sj |)2) e σd2ii = 0.015, i = 1, 2. O
segundo processo, apresentando uma deformação pouco suave, gerada a partir
da função de correlação Gaussiana ρφ com parâmetro φ = 3.28 e σd2ii = 0.030,
poucos dados (T = 100), foram confrontados em duas situações de interesse: 15 localizações (n=15) e 30 localizações (n=30). Por último, para os dados gerados
com φ = 3.28, σ2
dii = 0.015, i = 1, 2 e n = 15, 5% dos valores foram aleatoriamente
escolhidos como dados faltantes.
O algoritmo MCMC proposto na Seção 2.2 foi utilizado para gerar amostras da distribuição a posteriori de todos os parâmetros do modelo (2.1). Na estimação da distribuição a posteriori dos parâmetros foram utilizadas 270000 iterações, descartando-se as primeiras 20000 iterações (período de aquecimento), guardando os valores dos parâmetros da cadeia a cada 25 iterações. Logo, foram obtidas amostras de tamanho 10000. Foi usado o programa OX versão 5.10 (Doornik, 2002) para implementar o algoritmo MCMC.
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 x y s4 s7 s10 s13 s19 s24 s27 s30 s31 s35 s41 s43 s49 s53 s56 s58 s60 s63 s65 s75 s77 s80 s84 s87 s91 s93 s95 s99 s1 s100
2.5.1
Estudo 1
Neste estudo simulado foi considerado o modelo dinâmico, com um fator sazonal e uma covariável fixa no tempo. Este modelo é dado por
Yt = F0tβt+ t, t, ∼ Nn[0, Σ], βt = Gtβt−1+ ωt, ωt∼ Np[0, Ψ], onde t = 1, . . . , T , β = (βt0, βt1, βt2, βt3)0, F0t= (1, x, 1, 0), x = (010, 117), Gt= I2 0 0 G2 , G2 = cos25π sin25π − sin π 25 cos π 25 , Ψ = diag(0.01, 0.02, 0.06, 0.06), β0 = (0.01, 3, 5, 1)0.
Considerou-se duas situações: na primeira, foram selecionadas aleatoriamente n = 30 localizações de uma grade regular [0, 1] × [0, 1] (ver Figura 2.1), nas quais 100 realizações (T = 100) do processo foram geradas a partir do modelo apresen-tado anteriormente. Na segunda situação, foram retiradas 15 das 30 localizações, restando n = 15 localizações, com suas respectivas realizações. Foi estudado um
processo gerado por uma deformação suave, com parâmetros σd211 = σ2d22 = 0.015,
φ = 3.28, b = 5.99, τ2 = 0.5 e f = 15.
Distribuições a priori
Foram utilizadas distribuições a priori informativas para os parâmetros σd211e σd222.
Assim, para ambos parâmetros σd211e σd222foi considerada uma distribuição a priori
GI(66.67, 1) e para b uma distribuição a priori G(5.8 × 52, 52) (ver Figura 2.2). No entanto, como se verá na Seção 2.8, para este caso onde a deformação é suave, não são necessárias distribuições a priori informativas para estes parâmetros.
Resultados
Para verificar convergência, as distribuições a posteriori dos parâmetros foram es-timadas partindo de dois pontos iniciais diferentes. O comportamento das cadeias dos parâmetros apresenta-se no apêndice ao final deste capítulo. Em geral, todas
0.010 0.015 0.020 0.025 0 50 100 150 200 σσdii 2 densidade 0 2 4 6 8 10 12 0.00 0.05 0.10 0.15 b densidade
Figura 2.2: Distribuições a priori dos parâmetros σ2
d11= σ
2
d22 e b.
as cadeias convergiram ao seu verdadeiro valor, embora tenha sido observado uma
alta autocorrelação nas cadeias para alguns parâmetros di, no caso n = 30.
Dos resultados obtidos, têm-se que tanto para o caso n = 15 quanto para n = 30 o parâmetro d é bem estimado (ver Figura 2.3), apresentando uma leve
melhora na estimativa de d para n=30. Os parâmetros β, v, b e σ2
d foram bem
estimados em ambos os casos com, n = 15 e n = 30 (ver Figuras 2.7, 2.6 e
2.5, respetivamente). Porém, o parâmetros τ2 e os elementos da matriz Ψ foram
sobre-estimados (ver Figuras 2.4 e 2.5). Por causa da semelhança das estimativas
dos parâmetros β, v, b, τ2, σ2d e Ψ em relação ao caso n = 15, as figuras das
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 x deformado y deformado 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 x deformado y deformado
Figura 2.3: Deformação estimada (linha tracejada) e deformação verdadeira (linha cheia),
para o processo gerado com σ2d11 = σ2
d22 = 0.015, T = 100 utilizando n = 15 (figura a esquerda)
e n = 30 (figura a direita). ω ω11 densidade 0 1 2 3 4 5 6 7 0.0 1.0 2.0 3.0 ω ω22 densidade 0.05 0.10 0.15 0.20 0.25 0 5 10 15 20 ω ω33 densidade 0 1 2 3 4 5 6 0.0 1.0 2.0 3.0 ω ω44 densidade 0.0 0.5 1.0 1.5 2.0 2.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0
Figura 2.4: Valores verdadeiros (linha vertical) e distribuições a posteriori estimadas para
os elementos da matriz de covariância Ψ, processo gerado com σd2
11 = σ
2
d22 = 0.015, n = 15,
b densidade 5.0 5.5 6.0 6.5 7.0 7.5 0.0 0.5 1.0 1.5 ττi 2 densidade 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 1 2 3 4 5 6 7 σσd11 2 densidade 0.012 0.013 0.014 0.015 0.016 0.017 0.018 0.019 0 100 200 300 400 σσd22 2 densidade 0.012 0.013 0.014 0.015 0.016 0.017 0.018 0.019 0 100 200 300 400
Figura 2.5: Distribuições a posteriori estimadas dos parâmetros b, τ2 e σ2d e verdadeiros
valores dos parâmetros (linha vertical), para o processo gerado com σ2d
11 = σ 2 d22 = 0.015, n = 15, T = 100. − * − * − * − * −* − * −* − * − * − * − * −* − * − * − * v10 v13 v27 v30 v35 v43 v56 v60 v63 v75 v77 v80 v91 v1 v100 0.4 0.6 0.8 1.0 1.2 1.4
Figura 2.6: Intervalo de credibilidade de 95%, média estimada (-) e verdadeiro valor (*) dos
parâmetros v10, v13, . . . , v100, para o processo gerado com σd211= σ 2
t ββt0 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 0 20 40 60 80 100 −2 0 2 4 6 t ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 ββt1 0 20 40 60 80 100 2.5 3.0 3.5 4.0 4.5 t ββt2 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 ββt2 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 t ββt3 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 ββt3 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6 0 20 40 60 80 100 −6 −4 −2 0 2 4 6
Figura 2.7: Intervalo de credibilidade do 95% (linha tracejada), média estimada (linha fina)
e verdadeiro valor (linha grossa) de β, para o processo gerado com σ2d
11 = σ
2
d22 = 0.015, n = 15,
2.5.2
Estudo 2
Neste estudo simulado foi considerado o modelo dinâmico, com um fator sazonal e uma covariável fixa no tempo. Este modelo é dado por
Yt = F0tβt+ t, t, ∼ Nn[0, Σ], βt = Gtβt−1+ ωt, ωt∼ Np[0, Ψ], onde t = 1, . . . , T , β = (βt0, βt1, βt2, βt3)0, F0t= (1, x, 1, 0), x = (010, 117), Gt= I2 0 0 G2 , G2 = cos25π sin25π − sin π 25 cos π 25 , Ψ = diag(0.01, 0.02, 0.06, 0.06), β0 = (0.01, 3, 5, 1)0.
Foram consideradas duas situações: na primeira foram selecionadas aleatori-amente n = 30 localizações de uma grade regular [0, 1] × [0, 1] (ver figura 2.1), nas quais 100 realizações (T = 100) do processo foram geradas a partir do mo-delo apresentado anteriormente. Na segunda situação, foram retiradas 15 das 30 localizações, restando n = 15 localizações, com suas respetivas realizações. Foi estudado um processo gerado por uma deformação pouco suave, com parâmetros
σ2d11 = σd222 = 0.030, φ = 3.28, b = 5.99, τ2 = 0.5 e f = 15.
Distribuições a priori
Para os parâmetros σ2d11 e σd222 foram utilizadas distribuições a priori informativas.
Assim, para ambos parâmetros σd211e σd211foi considerada uma distribuição a priori
GI(333.3, 10) e para b uma distribuição a priori G(5.8, 1) (ver Figura 2.8). No entanto, como se verá na Seção 2.8, para este caso onde a deformação é menos suave, tambem não são necessárias distribuições a priori informativas para estes parâmetros.
Resultados