Modelo para varia¸c˜ oes na temperatura - Universidade Federal do Rio de Janeiro Instituto de M

Os dados se constituem das temperaturas m´ınimas mensais registradas entre Janeiro de 1961 a Dezembro de 2000, totalizando T = 480 instantes de tempo, em n = 37 locais no estado do Rio de Janeiro, como apresentado na Figura 5.1. Os dados são reco- lhidos por diferentes institui¸cões governamentais, ligadas à rede do Instituto Nacional de Meteorologia (INMET) e ao Centro de Previsão de Tempo e Estudos Climáticos (CPTEC) do Instituto Nacional de Pesquisas Espaciais (INPE). Cada valor observado de temperatura yt(si) no local si, i = 1, . . . , n e tempo t, t = 1, . . . , T , é explicado como

a soma de uma média dependente do espa¸co e do tempo e uma componente espacial não-estacionária

Formula¸cões alternativas podem também ser consideradas. Por exemplo, a inclusão de termos de erros não estruturados com um erro de medida e/ou efeito pepita ou correla¸cão temporal entre os erros.

A estrutura média é dada por uma forma linear com variáveis explicativas que podem mudar no tempo e espa¸co

µt(s) =

βp(s, t)fp(s, t), (5.2)

onde fp(s, t) são variáveis relevantes para temperatura e βp(si, t) são seus respectivos

coeficientes. Os efeitos dos valores das covariáveis podem mudar no espa¸co, como em Gelfand, Kim, Sirmans, e Banerjee (2003) e Paez, Gamerman, e de Oliveira (2005b), ou no espa¸co e tempo, como em Huerta, Sansó, e Stroud (2004) e Gelfand et al. (2005a). As covariáveis consideradas nesta aplica¸cão foram a altitude, um harmônico de per´ıodo 12 para representar o ciclo sazonal da temperatura em um ano e o tempo. A mudan¸ca climática no tempo é determinada por caracter´ısticas globais e locais. Portanto, poderia ser inadequado assumir ela como fixa no espa¸co. O efeito do tempo βt é assumido ser espacialmente estruturado e modelado de acordo com um processo

Gaussiano isotr´opico para permitir aumentos/decrescimentos diferentes em cada local. Assim, o vetor de coeficientes do efeito do tempo ¯β = (β1, . . . , βn) ´e estruturado como

β ∼ Nb1, σ_β2exp (−φβ|si− sj|) . (5.3)

A média global b representa a tendência global para toda região, mas cada localiza¸cão pode ter um efeito diferente do tempo em sua temperatura. Os hiperparâmetros σ2

β e

φβ controlam a incerteza sobre a região de interesse a respeito da tendência média b

dos efeitos espec´ıficos dos locais e a similaridade espacial entre eles, respectivamente.

5.2.1 Modelando a estrutura n˜ao-estacion´aria

O modelo de misturas apresentado nos cap´ıtulos anteriores ´e considerado aqui. Como definido no Cap´ıtulo 2, s˜ao considerados M diferentes centros u1, . . . , uM localizados

em uma região D. Processos estacionários Wm(.) de média 0, com fun¸cão de covariância

Modelos de convolu¸c˜ao para dados espa¸co-temporais 84

Figura 5.1: Localiza¸c˜oes das esta¸c˜oes de monitoramento e centros das componentes no estado do Rio de Janeiro.

cada um dos centros um, para m = 1, ..., M . Deste modo, a componente espacial

não-estacionária é dada por

ε(s) =

m=1

γm(s)Wm(s), (5.4)

para cada localiza¸c˜ao s ∈ D.

Novamente ´e utilizada a restri¸c˜ao

m=1

γm(si) = 1, de modo que cada componente

de mistura γm(s) representa o peso relativo de uma fun¸c˜ao n´ucleo cont´ınua km(s), que

depende de um parˆametro de suaviza¸c˜ao hm de acordo com

γm(s − um) =

km(s)

m0₌₁km0(s)

A formula¸cão do modelo (5.4) implica que ε(·) é um processo espacial de média 0 e fun¸cão de covariância

Cov (ε(si), ε(sj)) = M

m=1

γm(si)γm(sj)Cov (Wm(si), Wm(sj)) . (5.6)

Nesta aplica¸cão os núcleos são assumidos como Gaussianos e os processos esta- cionários de mistura assumidos serem isotrópicos e Gaussianos com variância σ2

m e

fun¸c˜ao de correla¸c˜ao exponencial de amplitude 1/φm, para m = 1, ..., M .

5.2.2 Inferˆencia dos parˆametros do modelo

Sejam as observa¸c˜oes denotadas por Y = (Y0₁, . . . , Y0_T)0, onde Yt= (Yt(s1), . . . , Yt(sn))0,

t = 1, . . . , T . Ent˜ao, o modelo dado por (5.1), (5.2), (5.3) e (5.4) pode ser escrito na forma matricial como

Y ∼ N [Xβ, Ω ⊗ IT]

β ∼ N [b1n, W ]

onde β = ˜β, ¯β

, ˜β = (β0, βx, βc, βs) ´e o vetor dos coeficientes de regress˜ao fixados,

os elementos de Ω s˜ao dados por Ωi,j =

m=1γm(si)γm(sj)σ 2

mexp (−φm|si− sj|) e os

elemento de W por Wi,j = σ2βexp (−φβ|si− sj|), 1n ´e o vetor n-dimensional de 1’s e

In ´e a matriz identidade n-dimensional.

Denotando por σ = (σ1, . . . , σM), φ = (φ1, . . . , φM) e h = (h1, . . . , hM), o conjunto

de parâmetros a serem estimados é Θ = (β, b, σβ, φβ, h, σ, φ). A fun¸cão de verossimi-

lhan¸ca ´e L(Θ; Y ) ∝ T Y t=1 |Ω|−12 exp −1 2(Yt− Xtβ) 0 Ω−1(Yt− Xtβ) , (5.7)

onde Xt´e a sub-matriz de X correspondente ao tempo t. A distribui¸c˜ao a priori para

os coeficientes de regressão fixados e a média b dos coeficientes do tempo são assumidas independentes e vagas com variâncias grandes ω e c0 respectivamente. Além disso, é

Modelos de convolu¸c˜ao para dados espa¸co-temporais 86

assumido que os parâmetros da média mencionados acima são independentes dos outros parâmetros.

Como discutido no Cap´ıtulo 2, distribui¸cões a priori semi-Cauchy foram assumidas para os parâmetros de suaviza¸cão, variâncias e amplitude (range) que definem o processo não-estacionário.

A combina¸cão das especifica¸cões das prioris acima com a verossimilhan¸ca (5.7) fornece a distribui¸cão a priori via teorema de Bayes. Dada a complexidade desta ex- pressão um algoritmo h´ıbrido MCMC com amostrador de Gibbs, passos de Metropolis- Hastings e slice sampling foi utilizado.

5.2.3 Aspectos computacionais

A distribui¸c˜ao condicional completa de β ´e dada por

[β|Θ−β, Y ] ∼ Nβp, Vp , (5.8) onde Vp = V−1+PT t=1X 0 tΩ −1 Xt −1 , β_p = Vp V−1µ_β +PT t=1X 0 tΩ −1 Yt , µ_β = ˜b, b1n 0

e V = diag (ω, W ). A distribui¸c˜ao condicional completa de b ´e facilmente obtida como [b|Θ−b, Y ] ∼ N [m1, c1], com c1 = 10W−11 + c−10

e m1 =

c1 10W−1β + m¯ 0c−10 .

Cada parˆametro σβ, φβ, σm e φm, m = 1, . . . , M ´e amostrado individualmente com

passos de Metropolis. A amostragem dos parâmetros de suaviza¸cão é realizada através de slice sampling (Cap´ıtulo 2).

5.2.4 Dados faltantes e interpola¸c˜ao

Uma caracter´ıstica comum de conjunto de dados de meio-ambiente é a ausência de dados em trechos de tempo. Isto pode ser causado por uma série de razões, incluindo a manuten¸cão da esta¸cão, falha inesperada do equipamento de medi¸cão, dentre outros. Dados faltantes devem ser manuseados e contabilizados no procedimento de inferência. Para algum tempo t dado, o modelo induz uma distribui¸cão normal conjunta para o vetor de dados não-observados Yno_t e dados observados Yo_t com matriz de covariância

Ω, que depende dos parâmetros do modelo Θ. Assim, um exerc´ıcio simples para obter a distribui¸cão condicional completa dos dados faltantes é considerar [Yno_t |Yo_t, Θ] ∼ NXno_t β + Ω12Ω−122 (Y o t− X o tβ) , Ω11− Ω12Ω−122Ω 0 12. As matrizes Ω11, Ω12 e Ω22 são

os blocos correspondentes de Ω. Como essa é a distribui¸cão é condicional completa de Yno_t , ela pode ser facilmente amostrada. Assim, o dado faltante é naturalmente incorporado ao ciclo do MCMC.

Comentários parecidos podem ser feitos sobre a interpola¸cão das observa¸cões para qualquer outro local da região de interesse. Este exerc´ıcio de interpola¸cão é usualmente referido como krigagem e fornece uma estrutura natural de passar as informa¸cões dos locais monitorados para toda a região de interesse. Para isso no entanto, uma opera¸cão semelhante à krigagem deve ser realizada previamente aos coeficientes de regressão dependentes espacialmente.

No documento Universidade Federal do Rio de Janeiro Instituto de Matemática. Modelos de convolução para dados espaço-temporais. Geraldo Marcelo da Cunha (páginas 87-92)