• Nenhum resultado encontrado

Os dados se constituem das temperaturas m´ınimas mensais registradas entre Janeiro de 1961 a Dezembro de 2000, totalizando T = 480 instantes de tempo, em n = 37 locais no estado do Rio de Janeiro, como apresentado na Figura 5.1. Os dados s˜ao reco- lhidos por diferentes institui¸c˜oes governamentais, ligadas `a rede do Instituto Nacional de Meteorologia (INMET) e ao Centro de Previs˜ao de Tempo e Estudos Clim´aticos (CPTEC) do Instituto Nacional de Pesquisas Espaciais (INPE). Cada valor observado de temperatura yt(si) no local si, i = 1, . . . , n e tempo t, t = 1, . . . , T , ´e explicado como

a soma de uma m´edia dependente do espa¸co e do tempo e uma componente espacial n˜ao-estacion´aria

Formula¸c˜oes alternativas podem tamb´em ser consideradas. Por exemplo, a inclus˜ao de termos de erros n˜ao estruturados com um erro de medida e/ou efeito pepita ou correla¸c˜ao temporal entre os erros.

A estrutura m´edia ´e dada por uma forma linear com vari´aveis explicativas que podem mudar no tempo e espa¸co

µt(s) =

X

p

βp(s, t)fp(s, t), (5.2)

onde fp(s, t) s˜ao vari´aveis relevantes para temperatura e βp(si, t) s˜ao seus respectivos

coeficientes. Os efeitos dos valores das covari´aveis podem mudar no espa¸co, como em Gelfand, Kim, Sirmans, e Banerjee (2003) e Paez, Gamerman, e de Oliveira (2005b), ou no espa¸co e tempo, como em Huerta, Sans´o, e Stroud (2004) e Gelfand et al. (2005a). As covari´aveis consideradas nesta aplica¸c˜ao foram a altitude, um harmˆonico de per´ıodo 12 para representar o ciclo sazonal da temperatura em um ano e o tempo. A mudan¸ca clim´atica no tempo ´e determinada por caracter´ısticas globais e locais. Portanto, poderia ser inadequado assumir ela como fixa no espa¸co. O efeito do tempo βt ´e assumido ser espacialmente estruturado e modelado de acordo com um processo

Gaussiano isotr´opico para permitir aumentos/decrescimentos diferentes em cada local. Assim, o vetor de coeficientes do efeito do tempo ¯β = (β1, . . . , βn) ´e estruturado como

¯

β ∼ Nb1, σβ2exp (−φβ|si− sj|) . (5.3)

A m´edia global b representa a tendˆencia global para toda regi˜ao, mas cada localiza¸c˜ao pode ter um efeito diferente do tempo em sua temperatura. Os hiperparˆametros σ2

β e

φβ controlam a incerteza sobre a regi˜ao de interesse a respeito da tendˆencia m´edia b

dos efeitos espec´ıficos dos locais e a similaridade espacial entre eles, respectivamente.

5.2.1

Modelando a estrutura n˜ao-estacion´aria

O modelo de misturas apresentado nos cap´ıtulos anteriores ´e considerado aqui. Como definido no Cap´ıtulo 2, s˜ao considerados M diferentes centros u1, . . . , uM localizados

em uma regi˜ao D. Processos estacion´arios Wm(.) de m´edia 0, com fun¸c˜ao de covariˆancia

Modelos de convolu¸c˜ao para dados espa¸co-temporais 84

Figura 5.1: Localiza¸c˜oes das esta¸c˜oes de monitoramento e centros das componentes no estado do Rio de Janeiro.

cada um dos centros um, para m = 1, ..., M . Deste modo, a componente espacial

n˜ao-estacion´aria ´e dada por

ε(s) =

M

X

m=1

γm(s)Wm(s), (5.4)

para cada localiza¸c˜ao s ∈ D.

Novamente ´e utilizada a restri¸c˜ao

M

X

m=1

γm(si) = 1, de modo que cada componente

de mistura γm(s) representa o peso relativo de uma fun¸c˜ao n´ucleo cont´ınua km(s), que

depende de um parˆametro de suaviza¸c˜ao hm de acordo com

γm(s − um) =

km(s)

PM

m0=1km0(s)

A formula¸c˜ao do modelo (5.4) implica que ε(·) ´e um processo espacial de m´edia 0 e fun¸c˜ao de covariˆancia

Cov (ε(si), ε(sj)) = M

X

m=1

γm(si)γm(sj)Cov (Wm(si), Wm(sj)) . (5.6)

Nesta aplica¸c˜ao os n´ucleos s˜ao assumidos como Gaussianos e os processos esta- cion´arios de mistura assumidos serem isotr´opicos e Gaussianos com variˆancia σ2

m e

fun¸c˜ao de correla¸c˜ao exponencial de amplitude 1/φm, para m = 1, ..., M .

5.2.2

Inferˆencia dos parˆametros do modelo

Sejam as observa¸c˜oes denotadas por Y = (Y01, . . . , Y0T)0, onde Yt= (Yt(s1), . . . , Yt(sn))0,

t = 1, . . . , T . Ent˜ao, o modelo dado por (5.1), (5.2), (5.3) e (5.4) pode ser escrito na forma matricial como

Y ∼ N [Xβ, Ω ⊗ IT]

¯

β ∼ N [b1n, W ]

onde β =  ˜β, ¯β

0

, ˜β = (β0, βx, βc, βs) ´e o vetor dos coeficientes de regress˜ao fixados,

os elementos de Ω s˜ao dados por Ωi,j =

PM

m=1γm(si)γm(sj)σ 2

mexp (−φm|si− sj|) e os

elemento de W por Wi,j = σ2βexp (−φβ|si− sj|), 1n ´e o vetor n-dimensional de 1’s e

In ´e a matriz identidade n-dimensional.

Denotando por σ = (σ1, . . . , σM), φ = (φ1, . . . , φM) e h = (h1, . . . , hM), o conjunto

de parˆametros a serem estimados ´e Θ = (β, b, σβ, φβ, h, σ, φ). A fun¸c˜ao de verossimi-

lhan¸ca ´e L(Θ; Y ) ∝ T Y t=1 |Ω|−12 exp  −1 2(Yt− Xtβ) 0 Ω−1(Yt− Xtβ)  , (5.7)

onde Xt´e a sub-matriz de X correspondente ao tempo t. A distribui¸c˜ao a priori para

os coeficientes de regress˜ao fixados e a m´edia b dos coeficientes do tempo s˜ao assumidas independentes e vagas com variˆancias grandes ω e c0 respectivamente. Al´em disso, ´e

Modelos de convolu¸c˜ao para dados espa¸co-temporais 86

assumido que os parˆametros da m´edia mencionados acima s˜ao independentes dos outros parˆametros.

Como discutido no Cap´ıtulo 2, distribui¸c˜oes a priori semi-Cauchy foram assumi- das para os parˆametros de suaviza¸c˜ao, variˆancias e amplitude (range) que definem o processo n˜ao-estacion´ario.

A combina¸c˜ao das especifica¸c˜oes das prioris acima com a verossimilhan¸ca (5.7) fornece a distribui¸c˜ao a priori via teorema de Bayes. Dada a complexidade desta ex- press˜ao um algoritmo h´ıbrido MCMC com amostrador de Gibbs, passos de Metropolis- Hastings e slice sampling foi utilizado.

5.2.3

Aspectos computacionais

A distribui¸c˜ao condicional completa de β ´e dada por

[β|Θ−β, Y ] ∼ Nβp, Vp , (5.8) onde Vp =  V−1+PT t=1X 0 tΩ −1 Xt −1 , βp = Vp  V−1µβ +PT t=1X 0 tΩ −1 Yt  , µβ = ˜b, b1n 0

e V = diag (ω, W ). A distribui¸c˜ao condicional completa de b ´e facil- mente obtida como [b|Θ−b, Y ] ∼ N [m1, c1], com c1 = 10W−11 + c−10



e m1 =

c1 10W−1β + m¯ 0c−10 .

Cada parˆametro σβ, φβ, σm e φm, m = 1, . . . , M ´e amostrado individualmente com

passos de Metropolis. A amostragem dos parˆametros de suaviza¸c˜ao ´e realizada atrav´es de slice sampling (Cap´ıtulo 2).

5.2.4

Dados faltantes e interpola¸c˜ao

Uma caracter´ıstica comum de conjunto de dados de meio-ambiente ´e a ausˆencia de dados em trechos de tempo. Isto pode ser causado por uma s´erie de raz˜oes, incluindo a manuten¸c˜ao da esta¸c˜ao, falha inesperada do equipamento de medi¸c˜ao, dentre outros. Dados faltantes devem ser manuseados e contabilizados no procedimento de inferˆencia. Para algum tempo t dado, o modelo induz uma distribui¸c˜ao normal conjunta para o vetor de dados n˜ao-observados Ynot e dados observados Yot com matriz de covariˆancia

Ω, que depende dos parˆametros do modelo Θ. Assim, um exerc´ıcio simples para obter a distribui¸c˜ao condicional completa dos dados faltantes ´e considerar [Ynot |Yot, Θ] ∼ NXnot β + Ω12Ω−122 (Y o t− X o tβ) , Ω11− Ω12Ω−122Ω 0 12. As matrizes Ω11, Ω12 e Ω22 s˜ao

os blocos correspondentes de Ω. Como essa ´e a distribui¸c˜ao ´e condicional completa de Ynot , ela pode ser facilmente amostrada. Assim, o dado faltante ´e naturalmente incorporado ao ciclo do MCMC.

Coment´arios parecidos podem ser feitos sobre a interpola¸c˜ao das observa¸c˜oes para qualquer outro local da regi˜ao de interesse. Este exerc´ıcio de interpola¸c˜ao ´e usualmente referido como krigagem e fornece uma estrutura natural de passar as informa¸c˜oes dos locais monitorados para toda a regi˜ao de interesse. Para isso no entanto, uma opera¸c˜ao semelhante `a krigagem deve ser realizada previamente aos coeficientes de regress˜ao dependentes espacialmente.

Documentos relacionados