Os dados se constituem das temperaturas m´ınimas mensais registradas entre Janeiro de 1961 a Dezembro de 2000, totalizando T = 480 instantes de tempo, em n = 37 locais no estado do Rio de Janeiro, como apresentado na Figura 5.1. Os dados s˜ao reco- lhidos por diferentes institui¸c˜oes governamentais, ligadas `a rede do Instituto Nacional de Meteorologia (INMET) e ao Centro de Previs˜ao de Tempo e Estudos Clim´aticos (CPTEC) do Instituto Nacional de Pesquisas Espaciais (INPE). Cada valor observado de temperatura yt(si) no local si, i = 1, . . . , n e tempo t, t = 1, . . . , T , ´e explicado como
a soma de uma m´edia dependente do espa¸co e do tempo e uma componente espacial n˜ao-estacion´aria
Formula¸c˜oes alternativas podem tamb´em ser consideradas. Por exemplo, a inclus˜ao de termos de erros n˜ao estruturados com um erro de medida e/ou efeito pepita ou correla¸c˜ao temporal entre os erros.
A estrutura m´edia ´e dada por uma forma linear com vari´aveis explicativas que podem mudar no tempo e espa¸co
µt(s) =
X
p
βp(s, t)fp(s, t), (5.2)
onde fp(s, t) s˜ao vari´aveis relevantes para temperatura e βp(si, t) s˜ao seus respectivos
coeficientes. Os efeitos dos valores das covari´aveis podem mudar no espa¸co, como em Gelfand, Kim, Sirmans, e Banerjee (2003) e Paez, Gamerman, e de Oliveira (2005b), ou no espa¸co e tempo, como em Huerta, Sans´o, e Stroud (2004) e Gelfand et al. (2005a). As covari´aveis consideradas nesta aplica¸c˜ao foram a altitude, um harmˆonico de per´ıodo 12 para representar o ciclo sazonal da temperatura em um ano e o tempo. A mudan¸ca clim´atica no tempo ´e determinada por caracter´ısticas globais e locais. Portanto, poderia ser inadequado assumir ela como fixa no espa¸co. O efeito do tempo βt ´e assumido ser espacialmente estruturado e modelado de acordo com um processo
Gaussiano isotr´opico para permitir aumentos/decrescimentos diferentes em cada local. Assim, o vetor de coeficientes do efeito do tempo ¯β = (β1, . . . , βn) ´e estruturado como
¯
β ∼ Nb1, σβ2exp (−φβ|si− sj|) . (5.3)
A m´edia global b representa a tendˆencia global para toda regi˜ao, mas cada localiza¸c˜ao pode ter um efeito diferente do tempo em sua temperatura. Os hiperparˆametros σ2
β e
φβ controlam a incerteza sobre a regi˜ao de interesse a respeito da tendˆencia m´edia b
dos efeitos espec´ıficos dos locais e a similaridade espacial entre eles, respectivamente.
5.2.1
Modelando a estrutura n˜ao-estacion´aria
O modelo de misturas apresentado nos cap´ıtulos anteriores ´e considerado aqui. Como definido no Cap´ıtulo 2, s˜ao considerados M diferentes centros u1, . . . , uM localizados
em uma regi˜ao D. Processos estacion´arios Wm(.) de m´edia 0, com fun¸c˜ao de covariˆancia
Modelos de convolu¸c˜ao para dados espa¸co-temporais 84
Figura 5.1: Localiza¸c˜oes das esta¸c˜oes de monitoramento e centros das componentes no estado do Rio de Janeiro.
cada um dos centros um, para m = 1, ..., M . Deste modo, a componente espacial
n˜ao-estacion´aria ´e dada por
ε(s) =
M
X
m=1
γm(s)Wm(s), (5.4)
para cada localiza¸c˜ao s ∈ D.
Novamente ´e utilizada a restri¸c˜ao
M
X
m=1
γm(si) = 1, de modo que cada componente
de mistura γm(s) representa o peso relativo de uma fun¸c˜ao n´ucleo cont´ınua km(s), que
depende de um parˆametro de suaviza¸c˜ao hm de acordo com
γm(s − um) =
km(s)
PM
m0=1km0(s)
A formula¸c˜ao do modelo (5.4) implica que ε(·) ´e um processo espacial de m´edia 0 e fun¸c˜ao de covariˆancia
Cov (ε(si), ε(sj)) = M
X
m=1
γm(si)γm(sj)Cov (Wm(si), Wm(sj)) . (5.6)
Nesta aplica¸c˜ao os n´ucleos s˜ao assumidos como Gaussianos e os processos esta- cion´arios de mistura assumidos serem isotr´opicos e Gaussianos com variˆancia σ2
m e
fun¸c˜ao de correla¸c˜ao exponencial de amplitude 1/φm, para m = 1, ..., M .
5.2.2
Inferˆencia dos parˆametros do modelo
Sejam as observa¸c˜oes denotadas por Y = (Y01, . . . , Y0T)0, onde Yt= (Yt(s1), . . . , Yt(sn))0,
t = 1, . . . , T . Ent˜ao, o modelo dado por (5.1), (5.2), (5.3) e (5.4) pode ser escrito na forma matricial como
Y ∼ N [Xβ, Ω ⊗ IT]
¯
β ∼ N [b1n, W ]
onde β = ˜β, ¯β
0
, ˜β = (β0, βx, βc, βs) ´e o vetor dos coeficientes de regress˜ao fixados,
os elementos de Ω s˜ao dados por Ωi,j =
PM
m=1γm(si)γm(sj)σ 2
mexp (−φm|si− sj|) e os
elemento de W por Wi,j = σ2βexp (−φβ|si− sj|), 1n ´e o vetor n-dimensional de 1’s e
In ´e a matriz identidade n-dimensional.
Denotando por σ = (σ1, . . . , σM), φ = (φ1, . . . , φM) e h = (h1, . . . , hM), o conjunto
de parˆametros a serem estimados ´e Θ = (β, b, σβ, φβ, h, σ, φ). A fun¸c˜ao de verossimi-
lhan¸ca ´e L(Θ; Y ) ∝ T Y t=1 |Ω|−12 exp −1 2(Yt− Xtβ) 0 Ω−1(Yt− Xtβ) , (5.7)
onde Xt´e a sub-matriz de X correspondente ao tempo t. A distribui¸c˜ao a priori para
os coeficientes de regress˜ao fixados e a m´edia b dos coeficientes do tempo s˜ao assumidas independentes e vagas com variˆancias grandes ω e c0 respectivamente. Al´em disso, ´e
Modelos de convolu¸c˜ao para dados espa¸co-temporais 86
assumido que os parˆametros da m´edia mencionados acima s˜ao independentes dos outros parˆametros.
Como discutido no Cap´ıtulo 2, distribui¸c˜oes a priori semi-Cauchy foram assumi- das para os parˆametros de suaviza¸c˜ao, variˆancias e amplitude (range) que definem o processo n˜ao-estacion´ario.
A combina¸c˜ao das especifica¸c˜oes das prioris acima com a verossimilhan¸ca (5.7) fornece a distribui¸c˜ao a priori via teorema de Bayes. Dada a complexidade desta ex- press˜ao um algoritmo h´ıbrido MCMC com amostrador de Gibbs, passos de Metropolis- Hastings e slice sampling foi utilizado.
5.2.3
Aspectos computacionais
A distribui¸c˜ao condicional completa de β ´e dada por
[β|Θ−β, Y ] ∼ Nβp, Vp , (5.8) onde Vp = V−1+PT t=1X 0 tΩ −1 Xt −1 , βp = Vp V−1µβ +PT t=1X 0 tΩ −1 Yt , µβ = ˜b, b1n 0
e V = diag (ω, W ). A distribui¸c˜ao condicional completa de b ´e facil- mente obtida como [b|Θ−b, Y ] ∼ N [m1, c1], com c1 = 10W−11 + c−10
e m1 =
c1 10W−1β + m¯ 0c−10 .
Cada parˆametro σβ, φβ, σm e φm, m = 1, . . . , M ´e amostrado individualmente com
passos de Metropolis. A amostragem dos parˆametros de suaviza¸c˜ao ´e realizada atrav´es de slice sampling (Cap´ıtulo 2).
5.2.4
Dados faltantes e interpola¸c˜ao
Uma caracter´ıstica comum de conjunto de dados de meio-ambiente ´e a ausˆencia de dados em trechos de tempo. Isto pode ser causado por uma s´erie de raz˜oes, incluindo a manuten¸c˜ao da esta¸c˜ao, falha inesperada do equipamento de medi¸c˜ao, dentre outros. Dados faltantes devem ser manuseados e contabilizados no procedimento de inferˆencia. Para algum tempo t dado, o modelo induz uma distribui¸c˜ao normal conjunta para o vetor de dados n˜ao-observados Ynot e dados observados Yot com matriz de covariˆancia
Ω, que depende dos parˆametros do modelo Θ. Assim, um exerc´ıcio simples para obter a distribui¸c˜ao condicional completa dos dados faltantes ´e considerar [Ynot |Yot, Θ] ∼ NXnot β + Ω12Ω−122 (Y o t− X o tβ) , Ω11− Ω12Ω−122Ω 0 12. As matrizes Ω11, Ω12 e Ω22 s˜ao
os blocos correspondentes de Ω. Como essa ´e a distribui¸c˜ao ´e condicional completa de Ynot , ela pode ser facilmente amostrada. Assim, o dado faltante ´e naturalmente incorporado ao ciclo do MCMC.
Coment´arios parecidos podem ser feitos sobre a interpola¸c˜ao das observa¸c˜oes para qualquer outro local da regi˜ao de interesse. Este exerc´ıcio de interpola¸c˜ao ´e usualmente referido como krigagem e fornece uma estrutura natural de passar as informa¸c˜oes dos locais monitorados para toda a regi˜ao de interesse. Para isso no entanto, uma opera¸c˜ao semelhante `a krigagem deve ser realizada previamente aos coeficientes de regress˜ao dependentes espacialmente.