• Nenhum resultado encontrado

Universidade Federal do Rio de Janeiro Instituto de Matemática. Modelos de convolução para dados espaço-temporais. Geraldo Marcelo da Cunha

N/A
N/A
Protected

Academic year: 2021

Share "Universidade Federal do Rio de Janeiro Instituto de Matemática. Modelos de convolução para dados espaço-temporais. Geraldo Marcelo da Cunha"

Copied!
114
0
0

Texto

(1)

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Modelos de convolu¸

ao para dados

espa¸

co-temporais

Geraldo Marcelo da Cunha

(2)

espa¸

co-temporais

Geraldo Marcelo da Cunha

Tese de Doutorado submetida ao programa de P´os-gradua¸c˜ao em Estat´ıstica do Instituto de Matem´atica da Universidade Federal do Rio de Janeiro como parte dos requisitos necess´arios `a obten¸c˜ao do grau de Doutor em Estat´ıstica.

Orientador: Dani Gamerman

(3)

Modelos de convolu¸

ao para dados

espa¸

co-temporais

Geraldo Marcelo da Cunha

Orientador: Dani Gamerman

Tese de Doutorado submetida ao programa de P´os-gradua¸c˜ao em Estat´ıstica do Instituto de Matem´atica da Universidade Federal do Rio de Janeiro como parte dos requisitos necess´arios `a obten¸c˜ao do grau de Doutor em Estat´ıstica.

Aprovada por:

Presidente Prof. Dani Gamerman Profa. Esther Salazar

IM–UFRJ IM–UFRJ

Prof. Hedibert Freitas Lopes Prof. Ronaldo Dias

University of Chicago UNICAMP

Prof. Josemar Rodrigues UFSCAR

(4)

Geraldo Marcelo da Cunha. – Rio de Janeiro: UFRJ/IM, 2009.

xvii, 133 f. : il. ; 31cm.

Tese (Doutorado) – UFRJ/IM. Programa de P´ os-Gradua¸c˜ao em Estat´ıstica, 2009.

Orientador: Dani Gamerman

Referˆencias bibliogr´aficas: p.101–106.

1. Estat´ıstica Matem´atica - Tese. I. Gamerman, Dani. II. Universidade Federal do Rio de Janeiro. Instituto de Matem´atica. III. T´ıtulo.

(5)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 1

Resumo

Nos recentes anos, uma s´erie de modelos para dados espacialmente correlacionados surgiram no intuito de relaxar ou desconsiderar a suposi¸c˜ao de estacionaridade na estrutura de covariˆancia. Alguns desses modelos utilizam a id´eia de convolu¸c˜ao de processos por fun¸c˜oes n´ucleo. Partindo de modelos conhecidos na literatura (Fuentes e Smith (2001); Fuentes (2002); Banerjee, Gelfand, Knight, e Sirmans (2004b)) um novo modelo que considera estrutura de covariˆancia n˜ao-estacion´aria ´e apresentado. O modelo ´e definido como uma mistura de processos estacion´arios latentes ponderados por componentes de misturas. Fun¸c˜oes n´ucleo cont´ınuas s˜ao utilizadas para definir estas componentes. Nossa abordagem consiste em a partir dos dados, estimar os parˆametros de suaviza¸c˜ao das fun¸c˜oes n´ucleo consideradas.

Seguindo adiante no trabalho, o modelo proposto para processos espaciais n˜ ao-estacion´arios ´e inserido no contexto de dados que variam no tempo e espa¸co. Dois diferentes modelos dinˆamicos espa¸co-temporais s˜ao propostos. O primeiro, considera uma mesma estrutura espacial n˜ao-estacion´aria em todos os tempos. O segundo, ge-neraliza o primeiro, permitindo tamb´em, que esta estrutura espacial evolua no tempo atrav´es de seus parˆametros de suaviza¸c˜ao.

No ´ultimo cap´ıtulo, dados de temperatura m´ınima mensal observados no estado do Rio de Janeiro de 1961 a 2000 s˜ao analisados considerando um modelo hier´arquico que incorpora nossa abordagem para a estrutura espacial n˜ao-estacion´aria.

(6)

Abstract

In recent years, different models for correlated spatial data emerged in order to relax or disregard the stationarity assumption of covariance structure. Some of these mod-els are built around kernel convolution of stationary processes. Starting from known models in the literature (Fuentes e Smith (2001); Fuentes (2002); Banerjee, Gelfand, Knight, e Sirmans (2004b)) a new model considering non-stationary covariance struc-ture is presented. The model is defined as a weighted combination of latent stationary processes by mixture components. Continuous kernel functions are used to define these componentes. Our approach consists in estimation of the bandwidths in the kernels, from the data.

Following on the work, the proposed model for spatial non-stationary processes is inserted to account for data varying in time and space. Two different spatio-temporal dynamic models are proposed. The first one considers the same non-stationary spatial structure for all times. The second one generalizes the first one by allowing this spatial structure to vary over time through their bandwidths parameters.

In the last chapter monthly minimum temperature data observed in Rio de Janeiro state from 1961 to 2000 are analyzed considering a hierarchical model that incorporates our non-stationary approach.

(7)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 2

AGRADECIMENTOS

Inicialmente gostaria de agradecer ao meu orientador Dani Gamerman, pessoa pela qual passei a admirar nos ´ultimos anos como pesquisador e ser humano. Este tra-balho ´e fruto de muitos dos seus conselhos e intui¸c˜oes, ditos ou escritos muitas vezes em pequenos rascunhos em peda¸cos de papel, ou em seu pequeno quadro branco, o que sempre me surpreendia. Eu espero que esta rela¸c˜ao forne¸ca frutos de amizade e trabalhos futuros.

Gostaria tamb´em de agradecer pelas outras pessoas maravilhosas que conheci e que participaram deste processo, todos professores do programa e meus amigos e colegas da p´os: Valm´aria, M´ario, Adelmo, Fidel, Esther e Fernando. Meus amigos da FIOCRUZ que sempre me apoiaram e possibilitaram minha visita a Universidade Estadual da Carolina do Norte.

Gostaria de agradecer `a minha fam´ılia e amigos distantes que s˜ao o meu suporte e d˜ao raz˜ao ao meu viver. Meu pais, M´ario e Ana, meus irm˜aos, Rosana e M´arcio e outros do cora¸c˜ao, Buda, Ivan, Alan, Alex primo, Didier, Alex Erikson, Edicl´eia, Tio Rˆomulo. `A Lane que esteve comigo em boa parte deste per´ıodo. E finalmente, `a Thati, minha companheira, amiga e mulher que sempre me incentivou e incentiva em tudo o que fa¸co.

Durante este doutorado, outras coisas alegres e tristes ocorreram em minha vida, sou grato a todas elas. Citando meu preferido poeta, Fernando Pessoa:

“...

Quem quere passar al´em do Bojador Tem que passar al´em da dor.

Deus ao mar o perigo e o abysmo deu, Mas nelle ´e que espelhou o c´eu.”

(8)

1

Processos espaciais via convolu¸

ao de processos

7

1.1

Introdu¸c˜

ao . . . .

7

1.2

Modelos para processos espaciais n˜

ao-estacion´

arios . . . .

10

1.3

Processos espaciais via convolu¸c˜

ao de processos

. . . . .

12

1.3.1

Processos estacion´

arios via convolu¸c˜

ao de processos 12

1.3.2

Processos n˜

ao-estacion´

arios via convolu¸c˜

ao de

pro-cessos com n´

ucleos variando no espa¸co . . . .

16

1.3.3

Processos n˜

ao-estacion´

arios via convolu¸c˜

ao de

pro-cessos localmente estacion´

arios . . . .

17

1.4

Justificativa deste trabalho . . . .

20

1.5

Organiza¸c˜

ao da tese . . . .

20

2

Processos n˜

ao-estacion´

arios via convolu¸

ao de processos

estacion´

arios latentes

24

2.1

Introdu¸c˜

ao . . . .

24

2.2

Defini¸c˜

ao do modelo e suas propriedades . . . .

25

2.3

Inferˆ

encia . . . .

28

(9)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 4

2.3.1

Introdu¸c˜

ao . . . .

28

2.3.2

Verossimilhan¸ca . . . .

29

2.3.3

Distribui¸c˜

oes a Priori e a Posteriori . . . .

29

2.4

Aspectos computacionais . . . .

32

2.4.1

Interpola¸c˜

ao . . . .

35

2.5

Simula¸c˜

oes

. . . .

35

2.5.1

Estudo 1

. . . .

36

2.5.2

Estudo 2

. . . .

44

3

Modelo dinˆ

amico com estrutura de covariˆ

ancia espacial

ao-estacion´

aria

51

3.1

Introdu¸c˜

ao

. . . .

51

3.2

Modelo Proposto . . . .

53

3.3

Inferˆ

encia . . . .

55

3.3.1

Verossimilhan¸ca . . . .

55

3.3.2

Distribui¸c˜

ao a Priori . . . .

55

3.3.3

Distribui¸c˜

ao a Posteriori . . . .

56

3.4

Aspectos computacionais . . . .

56

3.5

Simula¸c˜

ao . . . .

60

4

Modelo dinˆ

amico com estrutura de covariˆ

ancia espacial

dinˆ

amica n˜

ao-estacion´

aria

66

4.1

Introdu¸c˜

ao . . . .

66

(10)

4.3

Inferˆ

encia . . . .

72

4.3.1

Verossimilhan¸ca . . . .

72

4.3.2

Distribui¸c˜

ao a Priori . . . .

72

4.3.3

Distribui¸c˜

ao a Posteriori . . . .

73

4.4

Aspectos computacionais . . . .

73

4.5

Simula¸c˜

ao . . . .

77

5

Aplica¸

ao

81

5.1

Introdu¸c˜

ao . . . .

81

5.2

Modelo para varia¸c˜

oes na temperatura . . . .

82

5.2.1

Modelando a estrutura n˜

ao-estacion´

aria . . . .

83

5.2.2

Inferˆ

encia dos parˆ

ametros do modelo . . . .

85

5.2.3

Aspectos computacionais . . . .

86

5.2.4

Dados faltantes e interpola¸c˜

ao . . . .

86

5.3

Exemplo simulado . . . .

87

5.4

Resultados da an´

alise . . . .

88

5.4.1

Descri¸c˜

ao dos dados e modelo . . . .

88

5.4.2

Compara¸c˜

ao dos modelos . . . .

90

5.4.3

Estima¸c˜

ao do termo espacial . . . .

93

5.4.4

Estima¸c˜

ao da estrutura m´

edia . . . .

93

5.5

Conclus˜

ao . . . .

98

(11)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 6

(12)

Processos espaciais via convolu¸

ao

de processos

1.1

Introdu¸

ao

Nesta se¸c˜ao fazemos uma revis˜ao breve e simples de modelos para dados espacialmente correlacionados. O objetivo ´e apresentar algumas defini¸c˜oes da teoria cl´assica e chamar aten¸c˜ao de como algumas propriedades desses modelos foram constru´ıdas de modo a facilitar a estima¸c˜ao e interpreta¸c˜ao de seus parˆametros.

Considere uma regi˜ao espacialmente cont´ınua1 D ⊂ <2 na qual, somente para um conjunto n de posi¸c˜oes fixas s1, . . . , sn, s˜ao conhecidas medidas de interesse Y =

(Y (s1), . . . , Y (sn))0. O objetivo final da an´alise estat´ıstica espacial ´e ser capaz de

fornecer a qualquer localiza¸c˜ao s0 ∈ D, onde n˜ao se conhece o valor da medida de

interesse, a melhor estimativa Y (s0), a partir dos dados observados Y .

A fun¸c˜ao aleat´oria Y (.) ´e chamada campo aleat´orio. Uma abordagem usual na modelagem de valores observados de um campo aleat´orio ´e feita ao considerar Y de-composto nas seguintes componentes:

1Pode-se considerar uma regi˜ao definida em um espa¸co de dimens˜ao L qualquer, onde L ≥ 1 e L ´e

um n´umero inteiro.

(13)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 8

Y = (m´edia)+(componente espacial)+(erro de medida) (1.1) = µ + Z + ,

onde µ representa uma m´edia que pode, por exemplo, ter forma linear, isto ´e, µ = Xβ, onde X ´e uma matriz (n × p) que acomoda p covari´aveis associadas `a m´edia e β ´e um vetor (p × 1) dos parˆametros associados a essas covari´aveis. A componente Z corresponde a um vetor (n × 1) de realiza¸c˜ao de um campo aleat´orio espacial de m´edia 0 e  ´e um vetor (n × 1) de erros de medida independentes e identicamente distribu´ıdos, tal que  e Z s˜ao independentes.  ´e comumente chamado de efeito pepita (Cressie, 1993).

Em muitas aplica¸c˜oes, o campo aleat´orio espacial Z(.) ´e assumido Gaussiano, ou diz-se simplesmente que Z(.) segue um processo Gaussiano.

De um modo geral, Z(.) segue um processo Gaussiano de m´edia 0, se para qualquer n ≥ 1, o conjunto de observa¸c˜oes Z = (Z(s1), . . . , Z(sn))0 tˆem distribui¸c˜ao normal

multivariada com m´edia 0 e matriz de covariˆancia Ω. Vamos considerar a seguinte nota¸c˜ao,

Z(.) ∼ P G(0, Ω).

No contexto da teoria espacial cl´assica, ´e utilizada a simplifica¸c˜ao Ω = σ2Σ, onde

Σ ´e a matriz de correla¸c˜ao dos dados e σ2 ´e a variˆancia, igual para todos os Z(s). Assumindo que Y ´e condicionalmente independente dado os parˆametros e que o processo Z(.) segue um processo Gaussiano podemos escrever:

Y | β, Z, σ2 ∼ N Xβ + Z, σ2I , (1.2)

onde σ2

 ´e a variˆancia do erro de medida .

Da express˜ao acima, podemos marginalizar em Z, obtendo

Y | β, σ2, Σ, σ2 ∼ N Xβ, σ2Σ + σ2

(14)

Outra simplifica¸c˜ao ´util ocorre pela especifica¸c˜ao da matriz Σ definida a partir de uma ´unica fun¸c˜ao de correla¸c˜ao ρ entre medidas realizadas em dois pontos quaisquer si e sj,

ρij = ρ(Z(si), Z(sj)).

Como esperado, ρij deve ser definido como uma fun¸c˜ao que decres¸ca com o aumento

da distˆancia que separa as localiza¸c˜oes si e sj. A geoestat´ıstica cl´assica (Cressie, 1993)

apresenta uma classe param´etrica de fun¸c˜oes de correla¸c˜ao ρ que dependem somente do vetor diferen¸ca entre os pontos si e sj.

Sendo mais espec´ıfico, se ν = si− sj ´e o vetor da diferen¸ca entre duas localiza¸c˜oes

quaisquer si e sj e ρ ´e fun¸c˜ao somente dessa diferen¸ca, ρ = ρ(ν), Z(.) ´e estacion´ario,

significando que a correla¸c˜ao entre quaisquer dois pontos em D depende da orienta¸c˜ao do vetor da diferen¸ca entre os pontos e do m´odulo dessa diferen¸ca. Caso ρ dependa somente da distˆancia entre as localiza¸c˜oes, ρ = ρ(|ν|), Z(.) ´e isotr´opico, e portanto, ρ passa a n˜ao depender mais da orienta¸c˜ao do vetor diferen¸ca. Sendo assim, segue que todo processo isotr´opico ´e tamb´em estacion´ario.

Como exemplo, temos abaixo a fun¸c˜ao de correla¸c˜ao estacion´aria Mat´ern:

ρ = 1

2ξ−1Γ(ξ)(2ξ

1/2 | ν | φ)νκ

ξ(2ξ1/2φ | ν |),

onde κν ´e a fun¸c˜ao modificada de Bessel de terceira ordem. Neste caso, a matriz

de covariˆancias ´e totalmente especificada se conhecemos os parˆametros σ2, φ e ξ. O

parˆametro φ ´e o inverso da amplitude r (range) que mede como a correla¸c˜ao decai com a distˆancia. O parˆametro ξ ´e respons´avel pela suavidade do processo sendo este mais suave na medida em que ξ aumenta. O parˆametro σ2 ´e a variˆancia do processo.

Outras importantes fun¸c˜oes de correla¸c˜ao s˜ao derivadas a partir da fun¸c˜ao de correla¸c˜ao Mat´ern. Por exemplo, fazendo ξ → ∞ obtemos a fun¸c˜ao de correla¸c˜ao gaussiana. Fixando ξ = 12, obtemos a fun¸c˜ao de correla¸c˜ao exponencial:

(15)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 10

Apesar de atraentes do ponto de vista da interpreta¸c˜ao e f´acil implementa¸c˜ao, os modelos que consideram processos espaciais estacion´arios/isotr´opicos s˜ao limitados dadas as suas especifica¸c˜oes. Essas propriedades limitam uma poss´ıvel complexidade real na estrutura espacial que dados reais possam vir a ter. Recorre-se portanto a mode-los espaciais mais elaborados, onde por exemplo, seja permitido `a fun¸c˜ao de covariˆancia variar sobre a regi˜ao de estudo.

1.2

Modelos para processos espaciais n˜

ao-estacion´

arios

Devido ao avan¸co e maior utiliza¸c˜ao de procedimentos computacionalmente intensivos nos recentes anos, uma s´erie de procedimentos surgiram no intuito de relaxar ou des-considerar a suposi¸c˜ao de estacionaridade para dados espaciais.

Uma s´erie de procedimentos que obtiveram not´orio reconhecimento na literatura parte do artigo inicial de Sampson e Guttorp (1992) que sugerem um modelo de de-forma¸c˜ao espacial para dados espa¸co-temporais onde a estacionaridade ´e assumida no processo temporal enquanto ´e permitido ao processo espacial ser n˜ao-estacion´ario. Eles utilizam t´ecnicas de escalonamento multidimensional para transformar o espa¸co onde se encontram as observa¸c˜oes, em um espa¸co latente estacion´ario no qual procedimentos de geoestat´ıstica cl´assica podem ser aplicados. Seguindo essa linha, Schmidt e O’Hagan (2003) prop˜oem uma abordagem Bayesiana para este modelo.

Hass (1995) prop˜oe uma abordagem baseada em janelas m´oveis para estruturas de covariˆancia n˜ao-estacion´arias. Entretanto, uma desvantagem deste modelo ´e que ele pressup˜oe isotropia nas janelas que incidem sobre as localiza¸c˜oes.

Uma outra abordagem proposta por Nychka e Saltzman (1998) utiliza fun¸c˜oes or-togonais emp´ıricas para modelar dados com estruturas de covariˆancia mais complexas. Entretanto, o inconveniente deste m´etodo ´e a necessidade de que as localiza¸c˜oes, onde os dados foram coletados, sejam um subconjunto da grade onde ´e feita a interpola¸c˜ao dos dados.

Outras duas diferentes abordagens surgem da convolu¸c˜ao de processos por fun¸c˜oes n´ucleo (kernel ). A primeira abordagem (Higdon, Swall, e Kern (1999); Swall (1999))

(16)

permite que n´ucleos normais bivariados possam variar no espa¸co e considera os proces-sos como sendo um mesmo ru´ıdo branco ou um mesmo processo espacial estacion´ario definido por um mesmo conjunto de parˆametros. Paciorek e Schervish (2004) e Pa-ciorek e Schervish (2006) mostraram ser poss´ıvel, a partir de outros n´ucleos, estabelecer diferentes estruturas de covariˆancias n˜ao-estacion´arias. A segunda abordagem (Fuentes e Smith (2001); Fuentes (2002)) utiliza um mesmo n´ucleo para diferentes centros, mas processos espaciais estacion´arios definidos por diferentes conjuntos de parˆametros. Banerjee et al. (2004b) estende este modelo ao substituir os n´ucleos por fun¸c˜oes ponde-radas dos n´ucleos. Todos os trabalhos que consideram esta segunda abordagem fixam os parˆametros de suaviza¸c˜ao em valores conhecidos, como ser´a discutido na pr´oxima se¸c˜ao.

Gelfand, Kottas, e MacEachern (2005b) definem processos n˜ao estacion´arios n˜ ao-param´etricos a partir da convolu¸c˜ao de processos de Dirichlet. Kottas, Duan, e Gelfand (2008) utilizam uma abordagem equivalente a partir de um processo de Dirichlet cen-trado em torno de uma normal multivariada. Ainda neste artigo, o modelo ´e estendido para an´alise de dados espa¸co-temporais atrav´es de uma formula¸c˜ao dinˆamica (West e Harrison, 1997) para os efeitos aleat´orios. Fuentes e Reich (2009) permitem aos parˆametros de suaviza¸c˜ao que comp˜oe a convolu¸c˜ao de processos de Dirichlet vari-arem no espa¸co, para caracterizar a falta de estacionaridade na dependˆencia espacial e dependˆencia cruzada, quando s˜ao considerados processos espaciais multivariados. Tamb´em, Fuentes, Henry, e Reich (2009) permitem ao parˆametro de suaviza¸c˜ao do n´ucleo ser fun¸c˜ao espacial para explicar falta de estacionaridade em distribui¸c˜oes de extremos, utilizando uma mistura n˜ao-param´etrica para dados de extremos de tempe-ratura.

Para processos n˜ao-estacion´arios multivariados Schmidt e Gelfand (2003) e Gelfand, Schmidt, Banerjee, e Sirmans (2004) utilizam modelos de coregionaliza¸c˜ao. Tamb´em Calder (2003) e Calder (2007) prop˜oem um modelo n˜ao-estacion´ario com n´ucleos va-riando espacialmente para dados espa¸co-temporais multivariados considerando modelos dinˆamicos.

(17)

ao-Modelos de convolu¸c˜ao para dados espa¸co-temporais 12

estacion´arios. Uma revis˜ao dos principais modelos pode ser encontrada em Banerjee, Carlin, e Gelfand (2004a) e Smith (2001). Em portuguˆes, a revis˜ao de alguns desses modelos pode ser encontrada em Schmidt e Sans´o (2006).

A pr´oxima se¸c˜ao ´e dedicada `a uma melhor compreens˜ao de modelos espaciais n˜ ao-estacion´arios envolvendo convolu¸c˜ao de processos.

1.3

Processos espaciais via convolu¸

ao de processos

1.3.1

Processos estacion´

arios via convolu¸

ao de processos

Considere uma grade de M pontos u1, ..., uM contidos em uma regi˜ao D, como na

Figura 1.1 e suponha localiza¸c˜oes (s1, . . . , sn) onde s˜ao observadas as realiza¸c˜oes de

um processo de interesse Z = Z(s1), . . . , Z(sn). Vejamos como isto pode ser obtido

a partir da convolu¸c˜ao de processos, de modo que Z represente a realiza¸c˜ao de um processo espacial estacion´ario.

Inicialmente a cada um, m = 1, . . . , M s˜ao atribu´ıdas vari´aveis aleat´orias ω(um)

independentes e identicamente distribu´ıdas,

ω(um) ∼ N 0, σ2 .

Deste modo, ω(um) representa um processo ru´ıdo branco.

Seja k(si − um; hm) o valor de uma fun¸c˜ao n´ucleo de centro um avaliada em si,

i = 1, . . . , n. O parˆametro hm ´e chamado de parˆametro de suaviza¸c˜ao. Quanto maiores

os valores de hm, m = 1, . . . , M , mais suave ´e o processo final observado. De agora

em diante, a seguinte nota¸c˜ao ser´a considerada. Para um n´ucleo cont´ınuo qualquer k(.), onde u varia continuamente no espa¸co, k(si − u) = ku(si) representa o n´ucleo

centrado em u e avaliado em si. No caso em que u varia discretamente no espa¸co,

k(si − um) = km(si) representa o n´ucleo centrado em um e avaliado em si. Al´em

disto, subentende-se um parˆametro de suaviza¸c˜ao para definir cada uma destas fun¸c˜oes n´ucleo.

(18)

0 2 4 6 8 10 0 2 4 6 8 10 u1 u2 u3 …… … … u99 u100 s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 s11 s12 s13 s14 s15 s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 s11 s12 s13 s14 s15

Figura 1.1: Grade formada de um pontos, m = 1, . . . , 100 em D = [0, 10] × [0, 10]. A cada um

´

e atribu´ıdo um processo ru´ıdo branco ω(um). A figura apresenta tamb´em o que poderiam ser as

poss´ıveis localiza¸c˜oes si, i = 1, . . . , 15 das medidas de interesse Z(si).

iguais para m = 1, . . . , M , a realiza¸c˜ao de um processo estacion´ario Z(si) pode ser

obtida por convolver os processos ω(um) por km(si) atrav´es da soma finita,

Z(si) = M

X

m=1

km(si)ω(um). (1.4)

Segue ent˜ao que Z ´e a realiza¸c˜ao de um processo Gaussiano no qual,

E[Z(si)] = E " M X m=1 km(si)ω(um) # = M X i=m km(si)E[ω(um)] = 0,

(19)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 14 V ar[Z(si)] = E   M X m=1 km(si)ω(um) !2  = σ2 M X m=1 km(si)2, e:

Cov[Z(si), Z(sj)] = E[Z(si)Z(sj)] − E[Z(si)]E[Z(sj)]

= σ2 M X m=1 km(si)km(sj) − 0 = σ2 M X m=1 km(si)km(sj).

Na Figura 1.2 o processo estacion´ario foi gerado sobre a grade de pontos repre-sentada pela Figura 1.1 considerando uma fun¸c˜ao n´ucleo normal padr˜ao, km(s) =

1

2πexp− 1 2s

0s , ou seja, h

m = 1 para m = 1, . . . , M e um processo ru´ıdo branco de

variˆancia σ2 = 0.01.

A vers˜ao cont´ınua de convolu¸c˜ao de processos, segue diretamente do limite da grade de pontos formada por um cada vez mais densa,

Z(s) = Z

ku(s)ω(u)du. (1.5)

A variˆancia e covariˆancia de Z(si) s˜ao dadas por,

V ar[Z(si)] = σ2 Z (ku(si))2du, (1.6) Cov[Z(si), Z(sj)] = σ2 Z ku(si)ku(sj)du. (1.7)

Uma demonstra¸c˜ao interessante da aproxima¸c˜ao discreta para a cont´ınua de con-volu¸c˜ao de processos pode ser encontrada em Smith (2001).

(20)

Figura 1.2: A realiza¸c˜ao de um processo estacion´ario ´e obtida a partir da convolu¸c˜ao do n´ucleo normal padr˜ao km(si) e um processo ru´ıdo branco ω(um) de variˆancia 0.01.

Cov[Z(si), Z(sj)] = σ2 Z k(si− u)k(sj− u)du = σ2 Z k(si− sj + δ)k(δ)dδ

que depende somente do vetor da diferen¸ca entre as localiza¸c˜oes ν = si− sj e portanto,

Z(.) ´e estacion´ario.

A equa¸c˜ao (1.4) pode ser utilizada para gerar processos estacion´arios cujas fun¸c˜oes de correla¸c˜ao podem ser obtidas na sua forma expl´ıcita, utilizando a rela¸c˜ao entre a transformada de Fourier de Cov[si− sj] e a transformada de Fourier do n´ucleo

k(si − sj). Uma discuss˜ao sobre este tema pode ser encontrada em Kern (2000).

Cabe ressaltar que os ru´ıdos brancos ω(um) podem ser substitu´ıdos por realiza¸c˜oes

de um mesmo processo estacion´ario definido por um conjunto de parˆametros fixados e ainda assim, o processo Z(.) ser´a estacion´ario.

Na pr´atica, a vers˜ao discreta do modelo (1.4) ´e utilizada pois a integra¸c˜ao das es-truturas de covariˆancias estabelecidas por (1.5) ´e de dif´ıcil manipula¸c˜ao por m´etodos

(21)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 16

num´ericos. Uma das vantagens atribu´ıdas ao modelo (1.4) ´e a redu¸c˜ao da dimensionali-dade no problema, quando M ´e pequeno em rela¸c˜ao ao n´umero de localiza¸c˜oes (Higdon (1998); Kern (2000)).

Calder (2003) estende o modelo discreto de convolu¸c˜ao de processos (1.4) para modelos dinˆamicos (West e Harrison, 1997). Isso ´e feito ao definir componentes de ru´ıdo ωt(um), m = 1, . . . , M , t = 1, . . . , T , evoluindo no tempo.

1.3.2

Processos n˜

ao-estacion´

arios via convolu¸

ao de processos

com n´

ucleos variando no espa¸

co

No intuito de obter processos n˜ao-estacion´arios, duas diferentes abordagens s˜ao moti-vadas a partir de (1.4) e (1.5).

Uma primeira abordagem para processos n˜ao-estacion´arios proposta por Higdon et al. (1999) e Swall (1999) ´e obtida ao se manterem os processos ru´ıdo branco ω(u), mas serem definidos n´ucleos ksi(.) que variam de acordo com a localiza¸c˜ao si. O modelo

´

e ent˜ao representado por,

Z(si) =

Z

ksi(u)ω(u)du, (1.8)

onde ksi(.) ´e um n´ucleo de centro si.

De modo que a fun¸c˜ao de covariˆancia do processo ´e dada por,

Cov[Z(si), Z(sj)] = σ2

Z

ksi(u)ksj(u)du. (1.9)

Uma vez que Cov[Z(si), Z(sj)] depende tamb´em das localiza¸c˜oes de si e sj, o

processo Z(.) ´e n˜ao-estacion´ario.

Higdon et al. (1999) e Swall (1999) escolhem propositalmente a forma do n´ucleo, ks(.), como a de uma normal bivariada com matriz de covariˆancias Λ(s). Como as

curvas de n´ıvel deste n´ucleo tˆem forma de elipse, eles utilizam elementos da equa¸c˜ao de uma elipse (os focos, a ´area e um fator de expans˜ao) como um modo de parametrizar os elementos da matriz Λ(s). Al´em disso, eles estabelecem que os focos dessa elipse

(22)

sigam um processo Gaussiano. A varia¸c˜ao dos focos permite que o modelo se ajuste a estruturas complexas dos dados podendo eles exibir um comportamento suave ou n˜ao.

Novamente na pr´atica, a integra¸c˜ao em (1.8) ´e aproximada pela soma finita,

Z(si) = M

X

m=1

ksi(um)ω(um), (1.10)

sendo portanto a fun¸c˜ao de covariˆancia

Cov[Z(si), Z(sj)] = σ2 M

X

m=1

ksi(um)ksj(um). (1.11)

1.3.3

Processos n˜

ao-estacion´

arios via convolu¸

ao de processos

localmente estacion´

arios

Nosso trabalho tem como ponto de partida uma outra abordagem baseada na con-volu¸c˜ao de processos, proposta inicialmente por Fuentes e Smith (2001) e Fuentes (2002). Esta abordagem difere da anterior por manter fixo o n´ucleo ku(s) e substituir

o ´unico processo ru´ıdo branco ω(u) por processos espaciais localmente estacion´arios Wη(u)(s) de m´edia 0 e conjunto de parˆametros da fun¸c˜ao de covariˆancia η(u). Por

exemplo, se Wη(u)(.) representa um processo estacion´ario com fun¸c˜ao de correla¸c˜ao

exponencial de parˆametros η(u) = (σ2

u, φu), de modo que,

Wη(u)(.) ∼ P G 0, σu2 exp {−φu| si− sj |} .

O modelo n˜ao-estacion´ario ´e ent˜ao representado por,

Z(s) = Z

ku(s)Wη(u)(s)du. (1.12)

Fuentes e Smith (2001) resolvem a integral em (1.12) cobrindo a regi˜ao de estudo D por uma grade fina de pontos um, m = 1, . . . , M . Definindo para cada um um

processo Wη(um)(.), os autores assumem que fun¸c˜oes (por exemplo, logar´ıtmica) de cada

um dos parˆametros em η(um) variam no espa¸co segundo processos Gaussianos. Eles

(23)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 18

suaviza¸c˜ao de modo que para pontos si e sj pr´oximos de um, Z(si) e Z(sj) sejam como

realiza¸c˜oes de um mesmo processo estacion´ario de parˆametros η(um). Deste modo, o

processo observado global ´e n˜ao-estacion´ario, mas ret´em localmente caracter´ısticas de um processo estacion´ario.

Apesar das interessantes considera¸c˜oes te´oricas e propriedades deste modelo descrito em Fuentes e Smith (2001), parecem haver problemas pr´aticos na convergˆencia dos parˆametros por considerar a aproxima¸c˜ao da integral por uma grade fina de pontos um (Barber (1999); Banerjee et al. (2004a)). Deste modo, a integral em (1.12) ´e de

fato aproximada por uma grade de pontos relativamente muito menor ao n´umero de localiza¸c˜oes (Fuentes (2002); Fuentes, Chen, Davis, e Lackmann (2005); Banerjee et al. (2004b)).

Define-se portanto processos localmente estacion´arios Wη(um)(si) = Wm(si), m =

1, . . . , M , satisfazendo Cov[Wm(si), Wm0(sj)] = 0 para m 6= m0 de modo que assume-se

a vers˜ao discreta de (1.12), Z(si) = M X m=1 km(si)Wm(si). (1.13) ´

E f´acil ver que E[Z(si)] = 0, desde que os processos Wm(si) tem m´edia 0 para

m = 1, . . . , M . Pode-se mostrar tamb´em que,

Cov[Z(si), Z(sj)] = M

X

m=1

km(si)km(sj)Cov[Wm(si), Wm(sj)], (1.14)

e que portanto o processo geral ´e n˜ao-estacion´ario.

Nesta abordagem, os parˆametros de suaviza¸c˜ao hm dos n´ucleos km(.), m = 1, . . . , M,

s˜ao escolhidas e fixadas nos menores valores poss´ıveis de modo que a estacionaridade ´

e aproximadamente obtida dentro de cada sub-regi˜ao. Para isto, as amplitudes dos parˆametros de suaviza¸c˜ao hm s˜ao escolhidas em seus menores valores poss´ıveis,

satis-fazendo km(si) > 0 para todo si em D . A proposta apresentada por Banerjee et al.

(2004b) estende o modelo ao substituir os n´ucleos km(si) por pesos ponderados dos

(24)

γm(si) = km(si) PM m0=1km0(si) ,ou ainda, γm(si) = km(si) q PM m0=1k 2 m0(si) ; (1.15)

e o modelo (1.13) ´e ent˜ao reescrito como,

Z(si) = M

X

m=1

γm(si)Wm(si). (1.16)

Estas duas abordagens apresentadas nos modelo (1.13) e (1.16) que fixam os parˆ ame-tros de suaviza¸c˜ao hm, fazem uma parti¸c˜ao de D similar `a utilizada na Tesselagem de

Voronoi. Em outras palavras, o processo n˜ao-estacion´ario ´e basicamente obtido pela composi¸c˜ao de processos estacion´arios ao inv´es de uma mistura destes processos. Como um exemplo, considere uma regi˜ao D = [0, 100] × [0, 100], com M = 4 centros como dispostos na Figura 1.3. Considere tamb´em 40 localiza¸c˜oes (s1, . . . , s40) e pesos

pon-derados (1.15, primeira equa¸c˜ao) definidos a partir de n´ucleos normais padr˜ao, k(si) = 1

2πexp− 1 2(si)

0(s

i) , ou seja, n´ucleos com parˆametros de suaviza¸c˜ao hm = 1. Tomando

como exemplo, a localiza¸c˜ao s37, temos2, k1(s37) = O(10−400), k2(s37) = O(10−311),

k3(s37) = O(10−280), k4(s37) = O(10−139), de modo que γ1(s37)

. = 0, γ2(s37) . = 0, γ3(s37) . = 0, γ4(s37) .

= 1, e portanto, Z(s37) = W4(s37), independente dos valores

ob-servados em cada um dos processos W1(s37), W2(s37) e W3(s37). O mesmo ocorre para

cada uma das outras localiza¸c˜oes que tˆem somente um peso relevante associado, de modo que s˜ao estabelecidas 4 sub-regi˜oes descritas por 4 processos estacion´arios. As-sim, o processo resultante ´e globalmente n˜ao-estacion´ario mas retendo uma estrutura local estacion´aria.

Esta abordagem leva a invers˜ao de matrizes esparsas da dimens˜ao dos dados. A proposta adotada por Kim, Mallick, e Holmes (2006) define processos estacion´arios independentes em sub-regi˜oes obtidas pela Tesselagem de Voronoi. Neste caso, ma-trizes de dimens˜ao do n´umero de localiza¸c˜oes em cada uma das sub-regi˜oes ´e que s˜ao invertidas, tornando esta abordagem computacionalmente mais atrativa.

2Se lim

(25)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 20

1.4

Justificativa deste trabalho

Este trabalho ´e focado na extens˜ao do modelo (1.16) por tratar cada um dos parˆametros de suaviza¸c˜ao hmdos n´ucleos km(.) que definem γm(.), m = 1, . . . , M , como parˆametros

do modelo. Essa abordagem ´e original uma vez que n˜ao estamos propondo um modelo de misturas de processos localmente estacion´arios (1.13) e (1.16). Nosso modelo assume processos estacion´arios latentes que se misturam entre si, ponderados por componentes de misturas a serem definidas no pr´oximo cap´ıtulo. Nosso modelo tamb´em se difere dos modelos (1.13) e (1.16) por ser n˜ao-estacion´ario n˜ao s´o atrav´es dos processos esta-cion´arios latentes mas tamb´em atrav´es das componentes de mistura, uma vez que ´e permitido a elas variarem no espa¸co.

Os procedimentos de inferˆencia e amostragem adotados para os parˆametros pos-sui a vantagem de selecionar automaticamente o n´umero de componentes de misturas envolvidas no problema. Este procedimento evita o uso de algoritmos de saltos re-vers´ıveis (Green, 1985) tornando o procedimento computacional relativamente simples. Exemplos simulados do pr´oximo cap´ıtulo sugerem que mesmo considerando diferentes crit´erios de mistura dos processos estacion´arios envolvidos, os procedimentos de in-ferˆencia e amostragem adotados s˜ao eficazes na recupera¸c˜ao dos parˆametros utilizados na simula¸c˜ao dos dados.

Este trabalho tamb´em se justifica por extender esta nova proposta para processos espaciais n˜ao-estacion´arios em modelos espa¸co-temporais atrav´es de uma abordagem de modelos dinˆamicos (West e Harrison, 1997) na qual duas propostas s˜ao apresen-tadas. A primeira extens˜ao considera uma estrutura dinˆamica na m´edia na qual a estrutura espacial n˜ao-estacion´aria dos dados permanece constante ao longo tempo enquanto, a segunda extens˜ao, considera uma estrutura dinˆamica na m´edia e uma estrutura dinˆamica para a matriz de covariˆancia espacial n˜ao-estacion´aria dos dados.

1.5

Organiza¸

ao da tese

(26)

No Cap´ıtulo 2 o modelo proposto para processos espaciais n˜ao-estacion´arios ´e definido e suas propriedades s˜ao estabelecidas. Partindo de uma abordagem Bayesiana, o procedimento de inferˆencia e esquema de amostragem s˜ao apresentados para os parˆametros que comp˜oem a fun¸c˜ao de covariˆancia do modelo. Dois exemplos simu-lados s˜ao apresentados. Estes estudos ilustram como o procedimento de inferˆencia e de amostragem adotados s˜ao capazes de identificar corretamente o n´umero de com-ponentes do modelo, descartando aquelas n˜ao existentes. Nestes estudos, o modelo proposto ´e tamb´em comparado ao modelo de mistura de processos localmente esta-cion´arios no que diz respeito `a capacidade preditiva destes modelos .

No Cap´ıtulo 3, a fun¸c˜ao de covariˆancia do modelo proposto no Cap´ıtulo 2 ´e inserida no contexto de dados espa¸co-temporais. Para isso, ´e utilizada uma abordagem de mode-los dinˆamicos para a m´edia do processo (West e Harrison, 1997) na qual ´e sugerida `a matriz de covariˆancias das observa¸c˜oes ser n˜ao-estacion´aria. O modelo proposto neste cap´ıtulo considera que esta estrutura de covariˆancia n˜ao evolua no tempo. Todo o procedimento de inferˆencia e esquemas de amostragem s˜ao apresentados para todos os parˆametros do modelo. Ao final, um exemplo simulado de regress˜ao dinˆamica ´e uti-lizado para exemplifica¸c˜ao. Para os parˆametros de variˆancia dos coeficientes dinˆamicos da regress˜ao duas prioris s˜ao sugeridas, a Gamma Invertida e a Semi-Cauchy. Al´em disso, o efeito delas na estimativa a posteriori dos parˆametros ´e analisada.

O Cap´ıtulo 4 estende o modelo estabelecido no Cap´ıtulo 3 ao permitir que estrutura de covariˆancia n˜ao-estacion´aria evolua no tempo. Isso ´e feito por definir uma estrutura dinˆamica para os parˆametros de suaviza¸c˜ao. Por serem positivos, a distribui¸c˜ao log-normal ´e utilizada na constru¸c˜ao da estrutura dinˆamica desses parˆametros. Essas distribui¸c˜oes s˜ao parametrizadas de modo que a cada evolu¸c˜ao no tempo o parˆametro de suaviza¸c˜ao tenha m´edia igual ao valor do parˆametro de suaviza¸c˜ao no tempo anterior. No final do cap´ıtulo um exemplo simulado ´e utilizado para exemplificar este modelo dinˆamico de estrutura de covariˆancia dinˆamica.

No Cap´ıtulo 5 ´e apresentado um estudo das altera¸c˜oes clim´aticas sofridas no estado do Rio de Janeiro a partir da an´alise dos dados de temperatura m´ınima mensal de 1961 a 2000. O modelo considerado ´e baseado em uma especifica¸c˜ao hier´arquica onde

(27)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 22

os dados s˜ao modelados atrav´es de uma estrutura de regress˜ao para a m´edia e um termo de ru´ıdo espacialmente estruturado com uma representa¸c˜ao n˜ao-estacion´aria. Ao final, este modelo ´e comparado a outros que consideram para o termo espacial, um modelo de mistura de processos localmente estacion´arios e um ´unico processo espacial estacion´ario.

O Cap´ıtulo 6 tra¸ca os plano de trabalhos futuros e poss´ıveis extens˜oes para os modelos.

(28)

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude 37 u1 u2 u3 u4 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude u1 u2 u3 u4

Figura 1.3: Localiza¸c˜oes de 40 pontos (s1, . . . , s40) de medidas de interesse Z(si) e centros dos

processos localmente estacion´arios (u1, u2, u3, u4) (acima) e como esses pontos s˜ao alocados a cada

uma das sub-regi˜oes (abaixo) a partir dos seus respectivos pesos γm(si), m = 1, . . . , 4. Por exemplo,

(29)

Cap´ıtulo 2

Processos n˜

ao-estacion´

arios via

convolu¸

ao de processos

estacion´

arios latentes

2.1

Introdu¸

ao

Neste cap´ıtulo apresentamos uma nova representa¸c˜ao n˜ao-estacion´aria para processos espaciais. O modelo ´e formalmente definido e suas propriedades s˜ao estabelecidas. Partindo de uma abordagem Bayesiana, o procedimento de inferˆencia e esquema de amostragem s˜ao apresentados para o conjunto de parˆametros que comp˜oem o modelo. Um estudo simulado ´e utilizado para mostrar como as estrat´egias de inferˆencia e de amostragem adotadas selecionam o n´umero correto de misturas envolvidas na constru¸c˜ao do processo espacial n˜ao-estacion´ario. Neste estudo, s˜ao comparadas as capacidades preditivas do modelo proposto e modelo de mistura de processos localmente estacion´arios. Outro estudo ´e utilizado para mostrar que o modelo proposto ´e capaz de identificar um processo n˜ao-estacion´ario definido a partir da mistura de processos localmente estacion´arios.

(30)

2.2

Defini¸

ao do modelo e suas propriedades

O modelo proposto ´e introduzido aqui. Considere M sub-regi˜oes em D de centros um, m = 1, . . . , M e para cada uma dessas sub-regi˜oes defina processos estacion´arios

latentes Wm(.) seguindo um processo Gaussiano de m´edia 0 e fun¸c˜ao de covariˆancia

definida por parˆametros η(um). Os processos Wm(.) s˜ao independentes, isto ´e, para

todo i, j = 1, · · · , n, Wm(si) e Wm0(sj) s˜ao independentes para todo m 6= m0 e si,

sj ∈ D. Seja tamb´em,

γ(si− um) = γm(si)

a componente de mistura associada ao processo Wm(.).

A restri¸c˜ao de idenficabilidade

M

X

m=1

γm(si) = 1, ´e considerada da mesma forma como

em Banerjee et al. (2004b).

Se km(si− um) = km(si) representa uma fun¸c˜ao n´ucleo, esta restri¸c˜ao ´e facilmente

satisfeita se as componentes de mistura γm(si) s˜ao definidas como pesos relativos,

γm(si) =

km(si)

PM

m0=1km0(si)

.

Note que em nossa abordagem, os n´ucleos km(.) dependem de seus respectivos

parˆametros de suaviza¸c˜ao desconhecidos hm. Quanto maior o valor de hm maior a

influˆencia da componente m sobre o processo observado na regi˜ao.

O processo n˜ao-estacion´ario ´e obtido pela mistura (convolu¸c˜ao) discreta,

Z(s) = M X m=1 γm(s)Wm(s), (2.1) para cada s ∈ D.

A equa¸c˜ao (2.1) fornece uma m´edia ponderada dos processos e pode ser vista como uma generaliza¸c˜ao espacial da estima¸c˜ao dos parˆametros de suaviza¸c˜ao de Nadaraya (1964) e Watson (1964) em modelos de regress˜ao.

(31)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 26

Al´em disso, ´e esperado que com uma escolha adequada de componentes, esta re-presenta¸c˜ao finita forne¸ca uma aproxima¸c˜ao representativa da mistura cont´ınua subja-cente,

Z

γu(s)Wu(s)du, (2.2)

como sugerido em Fuentes e Smith (2001). Note que os centros e suas correspondentes regi˜oes de vizinhan¸ca s˜ao meramente uma aproxima¸c˜ao para a forma de convolu¸c˜ao infinita. Deste modo, eles n˜ao precisam necessariamente estar relacionados a alguma caracter´ıstica local espec´ıfica da regi˜ao. De fato, eles s˜ao um artefato para a apro-xima¸c˜ao finita e as componentes do modelo podem n˜ao ter uma interpreta¸c˜ao espacial associadas `as suas localiza¸c˜oes espec´ıficas.

Dada estas especifica¸c˜oes do modelo segue que a esperan¸ca, variˆancia e covariˆancia do processo obtido s˜ao,

E [Z(si)] = E " M X m=1 γm(si)Wm(si) # = 0, V ar[Z(si)] = V ar " M X m=1 γm(si)Wm(si) # = E " M X m=1 γm(si)Wm(si) #2 = M X m=1 [γm(si)]2V ar[Wm(si)] e

(32)

Cov[Z(si), Z(sj)] = Cov " M X m=1 γm(si)Wm(si), M X m0=1 γm0(sj)Wm0(sj) # = E " M X m=1 γm(si)Wm(si) ! M X m0=1 γm0(sj)Wm0(sj) !# = M X m=1 M X m0=1 γm(si)γm0(sj)E [Wm(si)Wm0(sj)] = M X m=1 γm(si)γm(sj)Cov [Wm(si), Wm(sj)] .

A n˜ao-estacionaridade ´e obtida porque os pesos γm(si) podem variar no espa¸co

atrav´es de seus parˆametros de suaviza¸c˜ao hm e os processos Wm(.) podem tamb´em

variar no espa¸co atrav´es de seus parˆametros η(um) que os definem. Banerjee et al.

(2004a) observam que esta abordagem apresenta algumas similaridades qualitativas com o modelo proposto por Higdon et al. (1999).

O modelo (1.16) proposto por Banerjee et al. (2004b) pode ser visto como um caso especial do modelo (2.1) quando os valores de hm, m = 1, . . . , M , s˜ao pequenos o

suficiente para evitar uma intera¸c˜ao entre as componentes do modelo, definindo assim processos localmente estacion´arios. Neste caso, se uma localiza¸c˜ao si ´e mais pr´oxima

do centro um que dos demais centros ent˜ao γm(si) ≈ 1 e γm0(si) ≈ 0 para todo

m0 6= m. Ent˜ao Z(si) ≈ Wm(si). O mesmo racioc´ınio pode ser aplicado a todas

as localiza¸c˜oes em D, implicando uma representa¸c˜ao de processo aproximadamente estacion´ario para todas as localiza¸c˜oes, mas variando no espa¸co uma vez que diferentes localiza¸c˜oes podem estar mais pr´oximas de diferentes centros. Note tamb´em que no caso em que M = 1 e h1 ´e suficientemente grande, γ1(si) = 1 para todo si ∈ D, e

portanto Z(si) = W1(si) define um ´unico processo estacion´ario em toda regi˜ao.

Uma poss´ıvel interpreta¸c˜ao para o modelo (2.1) ´e a seguinte: para todo ponto s ∈ D, o processo observado Z(s) ´e uma mistura de processos estacion´arios latentes Wm(s), ponderados por componentes de mistura γm(s). Naturalmente, os parˆametros

η(um) das fun¸c˜oes de covariˆancia Wm(s) estimados n˜ao podem ser comparados com os

(33)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 28

o modelo de mistura de processos localmente estacion´arios (1.16). ´

E bastante conhecido o fato de que os parˆametros de suaviza¸c˜ao desempenham um papel mais importante do que a forma do n´ucleo em modelos de mistura e suavizadores via n´ucleo (ver por exemplo, Epanechnikov (1969)). O mesmo efeito ´e v´alido aqui.

Algumas suposi¸c˜oes a respeito do n´ucleo e fun¸c˜ao de covariˆancia s˜ao agora assumidas para serem consideradas neste cap´ıtulo e cap´ıtulos subsequentes.

Vamos considerar o seguinte n´ucleo Gaussiano,

km(si− um) = 1 2π|Λm| −1 2 exp  −1 2(si− um) 0 Λ−1m (si− um)  , (2.3) onde Λm =   h2m 0 0 h2m

e que os processos estacion´arios de mistura sejam isotr´opicos e Gaussianos com variˆancia σ2m e fun¸c˜ao de correla¸c˜ao espacial de amplitude 1/φm,

para m = 1, . . . , M . Ou seja,

Wm(.) ∼ P G 0, σm2 exp(−φm|si− sj|) , (2.4)

de modo que a fun¸c˜ao de covariˆancia do modelo proposto (2.1) ser´a dada por, Cov[Z(si), Z(sj)] =

PM

m=1γm(si)γm(sj)σm2 exp(−φm|si− sj|).

Note que outras possibilidades mais elaboradas na defini¸c˜ao do n´ucleo s˜ao poss´ıveis, por exemplo, a utiliza¸c˜ao de n´ucleos Gaussianos anisotr´opicos correlacionados como em Higdon et al. (1999) ou n´ucleos mais gerais como os estabelecidos em Paciorek e Schervish (2006). Note tamb´em que outras diferentes fun¸c˜oes de correla¸c˜ao para os processos estacion´arios latentes poderiam ser consideradas.

2.3

Inferˆ

encia

2.3.1

Introdu¸

ao

Sejam as observa¸c˜oes ao longo do tempo denotadas por Z = (Z01, . . . , Z0T)0, onde Zt = (Zt(s1), . . . , Zt(sn))0. Dadas as especifica¸c˜oes em (2.3) e (2.4), σ = (σ1, . . . , σM)

(34)

e φ = (φ1, . . . , φM) representam os parˆametros das fun¸c˜oes de covariˆancia dos processos

Wm(.) e h = (h1, . . . , hM) os parˆametros de suaviza¸c˜ao que comp˜oem as componentes

de mistura γm(.) O conjunto de parˆametros a serem estimados ´e Θ = (σ, φ, h). Vamos

supor inicialmente que as observa¸c˜oes Zt, t = 1, . . . T s˜ao independentes para t 6= t0 e

que a estrutura espacial n˜ao-estacion´aria seja a mesma para todos os tempos,

Z|Θ ∼ N (0, Ω ⊗ IT), (2.5)

onde Ω = PM

m=1σ 2

mAmR(φm)Am, Am = diag(γm(s1), . . . , γm(sn)) , [R(φm)]i,j =

exp(−φm|si − sj|) e In ´e a matriz identidade n-dimensional. Esta especifica¸c˜ao ´e

tal que (2.5) pode ser facilmente incorporado a um modelo mais geral, como um ru´ıdo espacialmente estruturado n˜ao-estacion´ario.

A partir de cada uma das amostras observadas Zt = (Zt(s1), . . . , Zt(sn))0 o objetivo

´

e interpolar Zt(.) n˜ao observado em localiza¸c˜oes (sn+1, . . . , sn+k). As respostas n˜

ao-observadas nessas localiza¸c˜oes, Znot = (Zt(sn+1), . . . , Zt(sn+k))0 no tempo t s˜ao obtidas

atrav´es de E[Znot |Zt].

2.3.2

Verossimilhan¸

ca

Dado o conjunto de observa¸c˜oes Z = (Z01, . . . , Z0T)0 e Θ = (σ, φ, h) o conjunto de todos os parˆametros do modelo, a fun¸c˜ao de verossimilhan¸ca ´e dada por,

p(Z | Θ) ∝ T Y t=1 | Ω |−12 exp  −1 2Z 0 tΩ −1 Zt  (2.6) ∝ | Ω |−T2 exp ( −1 2 T X t=1 Z0tΩ−1Zt ) .

2.3.3

Distribui¸

oes a Priori e a Posteriori

(35)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 30 p(Θ) = p(σ)p(φ)p(h) = M Y m=1 p(σm)p(φm)p(hm).

Embora pare¸ca razo´avel, na ausˆencia de informa¸c˜ao a priori relevante, assumir pri-oris Gama e Gama-Invertida pouco informativas para aos parˆametros de suaviza¸c˜ao, variˆancias e amplitudes, estudos pilotos simulados mostraram que estas distribui¸c˜oes tiveram impacto na posteriori desses parˆametros. Berger, Oliveira, e Sans´o (2001) con-sideram o uso de prioris de referˆencia para estes parˆametros quando se tem um ´unico processo Gaussiano isotr´opico definido para toda regi˜ao. Em nosso caso, o exerc´ıcio de obter estas prioris ´e complicado pois estamos definindo um processo n˜ao-estacion´ario como mistura de diferentes processos Gaussianos. Al´em disso, esta mistura tamb´em considera parˆametros de suaviza¸c˜ao dos n´ucleos a serem estimadas. Algumas outras distribui¸c˜oes alternativas foram testadas, mas bons resultados foram geralmente obti-dos com distribui¸c˜oes a priori semi-Cauchy (half-Cauchy) sugeridas por Gelman (2006). Se κ ´e um dado parˆametro com distribui¸c˜ao semi-Cauchy, ent˜ao sua densidade ´e pro-porcional a p(κ) ∝  1 +κ c 2−1 , (2.7)

se κ > 0 e 0, caso contr´ario.

A Figura 2.1 mostra como essa priori se comporta para diferentes valores do parˆametro de escala c.

Gelman (2006) sugere o uso dessas prioris para o parˆametro desvio-padr˜ao e n˜ao para a variˆancia para evitar distribui¸c˜oes a posteriori impr´oprias.

Um cuidado especial deve ser tomado para a especifica¸c˜ao a priori dos parˆametros de suaviza¸c˜ao hm.

(36)

Seja s − um = (xm, ym). Ent˜ao, para todo m, γm(s) = km(s) PM m0=1km0(s) = 1 2πh2 m exp n − 1 2h2 m[x 2 m+ ym2] o PM m0=1 2πh12 m0 exp n − 1 2h2 m0 [x2 m0 + ym20] o = 1 2πh2 mexp n − 1 2h2 m [x 2 m+ y2m] o 1 2πh2 mexp n − 1 2h2 m[x 2 m+ ym2] o + c

Segue diretamente que limhm→∞γm(s) = 0 e que limhm→0γm(s) = 0. Esses c´alculos

mostram que γm(s) → 0 quando hm → ∞ e γm(s) → 0 quando hm → 0. Assim, a

verossimilhan¸ca perfilada de hm(que depende de hmsomente atrav´es de Ω, que depende

de hm somente atrav´es de γm(s)) converge para o mesmo valor se hm converge para 0

ou infinito. Ou seja, se L(hm; Y , Θ−hm) representa a verossimilhan¸ca perfilada de hm,

lim

hm→∞

L(hm; Y , Θ−hm) = lim

hm→0

L(hm; Y , Θ−hm). (2.8)

Deste modo, os parˆametros de suaviza¸c˜ao devem ser adicionalmente restritos a um suporte finito a fim de se verificar a possibilidade de sua convergˆencia para 0. Se isto acontece, esta componente de mistura ´e desnecess´aria e pode ser removida do modelo. Esta observa¸c˜ao fornece um procedimento simples para determina¸c˜ao do n´umero de componentes. Um exerc´ıcio simulado na pr´oxima se¸c˜ao e outro no cap´ıtulo 5 fornecer˜ao maiores evidˆencias da adequa¸c˜ao desta abordagem. Neste caso, outras alternativas complexas para estimar o n´umero desconhecido de componentes s˜ao evitadas.

Os centros das componentes de mistura s˜ao alocados em torno da regi˜ao de interesse a fim de cobri-la adequadamente. Considera¸c˜oes espec´ıficas sobre as caracter´ısticas locais das sub-regi˜oes podem ser utilizadas tamb´em. Elas podem, mas n˜ao necessaria-mente precisam ser interpretadas em associa¸c˜ao com os aspectos f´ısicos locais. De fato, eles s˜ao utilizados na inten¸c˜ao de se fazer uma aproxima¸c˜ao adequada da representa¸c˜ao espacial infinitamente dimensional. Os centros s˜ao assumidos fixados neste trabalho mas podem tamb´em ser estimados como em Fuentes, Chaudhuri, e Holland (2007).

(37)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 32 0 50 100 150 0.0 0.2 0.4 0.6 0.8 1.0 σσm Densidade c=25 c=10 c=5

Figura 2.1: Densidades proporcionais de uma distribui¸c˜ao Semi-Cauchy para trˆes diferentes valores da constante c = 5, 10, 25. A distribui¸c˜ao apresenta cauda pesada e sugere prioris pouco informativas.

A combina¸c˜ao das especifica¸c˜oes a priori acima com a verossimilhan¸ca (2.6) fornece a distribui¸c˜ao a posteriori pelo teorema de Bayes,

p(Θ | Z) ∝ | Ω |−T2 exp ( −1 2 T X t=1 Z0tΩ−1Zt ) M Y m=1 p(σm)p(φm)p(hm). (2.9)

Como usualmente ocorre em modelos com este grau de complexidade, ´e dif´ıcil ex-trair informa¸c˜oes analiticamente e algum mecanismo de aproxima¸c˜ao deve ser uti-lizado. Dentre as poucas alternativas dispon´ıveis, um algoritmo MCMC h´ıbrido com amostrador de Gibbs (ver cap´ıtulo 5), passos de Metropolis-Hastings e slice sampling foi escolhido. No restante do texto que segue, Θ−ξ denota o vetor completo de parˆametros

sem seu componente ξ.

2.4

Aspectos computacionais

(38)

p(σm | Θ−σm) ∝ | Ω | −T 2 exp ( −1 2 T X t=1 Z0tΩ−1Zt ) p(σm). (2.10) p(φm | Θ−φm) ∝ | Ω | −T 2 exp ( −1 2 T X t=1 Z0tΩ−1Zt ) p(φm). (2.11) p(hm | Θ−hm) ∝ | Ω | −T 2 exp ( −1 2 T X t=1 Z0tΩ−1Zt ) p(hm). (2.12)

Cada um dos parˆametros σm, φm, m = 1, . . . , M ´e amostrado individualmente por

passos de Metropolis. Por aproveitarem da mesma estrutura da fun¸c˜ao de verossimi-lhan¸ca e terem distribui¸c˜ao a priori semi-Cauchy, os passos de amostragem de cada um dos parˆametros σm e φm, m = 1, . . . , M no algoritmo MCMC s˜ao parecidos. O quadro

abaixo apresenta como exemplo, como um elemento σm pode ser amostrado.

Algoritmo: Metropolis-Hastings para σm, m = 1, . . . , M .

A cada passo da itera¸c˜ao i + 1 do algoritmo de Metropolis-Hastings,

• Gere cada componente σ(p)m proposto, a partir de uma proposta de transi¸c˜ao

Gama-Invertida (GI) com m´edia σm(i) e variˆancia σ

2(i) m ∆σm, σm(p) ∼ GI∆σm+ 2, σ (i) m(∆σm+ 1) .

• Aceite σm(p) com probabilidade,

B(σm(i), σ(p)m ) = min ( 1,p(σ (p) m | Θ(i)−σm)q(σ (p) m → σm(i)) p(σ(i)m | Θ(i)−σm)q(σ (i) m → σ(p)m ) )

onde q(.) ´e a densidade da proposta de transi¸c˜ao e p(.) ´e fornecida pela equa¸c˜ao (2.10).

Amostrar os parˆametros de suaviza¸c˜ao hm eficientemente requer utilizar outra

(39)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 34

deles vai para 0 o que implicaria na remo¸c˜ao deste componente do modelo. O algoritmo slice sampling proposto por Neal (2003) ´e utilizado com este fim. Agarwal e Gelfand (2005) utilizam este algoritmo no contexto espacial e relatam as vantagens sobre os esquemas de reamostragem e Metropolis.

O quadro abaixo apresenta como exemplo, como um elemento hmpode ser amostrado.

Algoritmo: Slice Sampling para hm, m = 1, . . . , M .

• Amostre aleatoriamente h(1)m da distribui¸c˜ao uniforme [0, R] e um ponto S da

distribui¸c˜ao uniforme h0, L(Θh(1)m ; Y )

i

, onde L(Θh(1)m ; Y ) ´e a verossimilhan¸ca de

h(1)m e valores correntes dos outros parˆametros.

• O ponto S define um slice horizontal na fun¸c˜ao de verossimilhan¸ca. Um novo ponto h(2)m ´e amostrado da distribui¸c˜ao condicional completa de hm at´e que ele

esteja dentro do slice.

Maiores detalhes t´ecnicos que tornam o uso deste algoritmo vi´avel como a utiliza¸c˜ao de um esquema de amostragem com retra¸c˜ao (shrinkage sampling scheme) e o uso do algoritmo na escala logar´ıtmica podem ser encontrados em Neal (2003) e Agarwal e Gelfand (2005).

Nossa abordagem consiste em definir suportes iniciais [0, R] de amplitudes largas em rela¸c˜ao `a regi˜ao de estudo para todos os parˆametros de suaviza¸c˜ao hm. Se um dado

parˆametro de suaviza¸c˜ao n˜ao converge, indo para R, o algoritmo ´e reinicializado para um novo e menor suporte [0, R1], onde R1 < R, para este parˆametro de suaviza¸c˜ao. Esta

estrat´egia fornece bons resultados em exerc´ıcios simulados, como descrito na pr´oxima se¸c˜ao, provendo indica¸c˜oes claras da relevˆancia de um dado componente adicionado ao modelo. Ela tamb´em evita o uso de algoritmos de saltos revers´ıveis (Green, 1985) para determinar o n´umero de componentes tornando o procedimento computacional relativamente simples.

(40)

2.4.1

Interpola¸

ao

As respostas n˜ao-observadas Znot = (Zt(sn+1), . . . , Zt(sn+k))0para localiza¸c˜oes (sl, . . . , sl+k)

no tempo t s˜ao obtidas atrav´es de E[Znot |Zt], onde Znot |Zt representa a distribui¸c˜ao

preditiva, cuja densidade ´e dada por

p(Znot |Zt) = Z p(Znot , Θ|Zt)dΘ (2.13) = Z p(Znot |Zt, Θ)p(Θ|Zt)dΘ ≈ 1 G G X g=1 p Znot |Zt, Θ(g) 

onde p(Znot |Zt, Θ) tem distribui¸c˜ao condicional normal surgindo da distribui¸c˜ao normal

conjunta de Znot e Zt, e por ´ultimo Θ(1), . . . , Θ(G) s˜ao amostras da distribui¸c˜ao a

posteriori p(Θ|Zt) obtidas pelo algoritmo MCMC descrito. Cabe observar tamb´em

que E[Znot |Zt] e V ar[Znot |Zt] podem ser obtidos pelas aproxima¸c˜oes:

E(Znot |Zt) = E [E(Znot |Zt, Θ)] ≈ 1 G G X g=1 E Znot |Zt, Θ(g) 

V ar(Znot |Zt) = E [V ar(Znot |Zt, Θ)] + V ar [E(Znot |Zt, Θ)]

≈ 1 G G X g=1 V ar Znot |Zt, Θ(g) + 1 GE Z no t |Zt, Θ(g) − E (Znot |Zt) E Znot |Zt, Θ(g) − E (Znot |Zt) 0 .

2.5

Simula¸

oes

Dois diferentes estudos simulados s˜ao considerados nesta se¸c˜ao. Estes estudos servem para ilustrar as vantagens obtidas quando os parˆametros de suaviza¸c˜ao das com-ponentes de mistura s˜ao estimadas no modelo. Em ambos os estudos foram con-sideradas n = 30 localiza¸c˜oes (s1, . . . , s30) em D = [0, 100] × [0, 100] e 5 centros

(41)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 36

(u1, u2, u3, u4, u5). Os valores dos parˆametros da fun¸c˜ao de covariˆancia dos

proces-sos estacion´arios de m´edia 0 foram, σ21 = 1.0, σ22 = 5.0, σ32 = 2, σ42 = 3, σ25 = 0.5 e φ1 = 0.040, φ2 = 0.015, φ3 = 0.025, φ4 = 0.020, φ5 = 0.030). A partir desse conjunto

de parˆametros e valores fixados, T = 200 realiza¸c˜oes independentes foram geradas, (Z01, . . . , Z0200)0, onde Zt= (Zt(s1), . . . , Zt(s30))0.

Os algoritmos de estima¸c˜ao dos parˆametros utilizado em todos os exemplos e si-mula¸c˜oes deste trabalho, foram implementados no programa Ox; as simula¸c˜oes e an´alise dos dados feitas no R.

2.5.1

Estudo 1

Neste primeiro estudo, supomos observa¸c˜oes de um processo n˜ao-estacion´ario definido a partir da mistura de cinco processos estacion´arios. Entretanto, para um destes pro-cessos, a componente de mistura ´e gerada a partir de parˆametro de suaviza¸c˜ao pr´oximo de 0. Isto significa na realidade que apenas quatro destes processos s˜ao utilizados para gerar os dados. Nossos interesses neste estudo s˜ao: 1) mostrar como o procedimento de amostragem para o modelo proposto ´e capaz de diferenciar o parˆametro de suaviza¸c˜ao pr´oximo de 0. Neste caso, isso implica que esta componente se faz desnecess´aria no modelo e deve ser removida; 2) Comparar a capacidade preditiva em termos da m´edia e variˆancia do modelo proposto (modelo I) com o modelo de misturas de processos localmente estacion´arios (modelo II) considerando os mesmos cinco centros e com o modelo de misturas de processos localmente estacion´arios (modelo III) considerando os quatro centros que de fato possuem pesos associados.

Os dados foram gerados a partir dos parˆametros de suaviza¸c˜ao h1 = 0.01, h2 =

30, h3 = 20, h4 = 40, h5 = 15. A Figura 2.2 apresenta as curvas de n´ıvel das

compo-nentes de mistura γ1(.), γ2(.), γ3(.), γ4(.) e γ5(.) que s˜ao observadas ao considerarmos

estas componentes para o vetor h. Esta especifica¸c˜ao faz com que a correla¸c˜ao obser-vada nos dados varie de 0.004 a 0.7989.

Modelo I

(42)

0 20 40 60 80 100 0 20 40 60 80 100 γγ1 longitude latitude u1 u2 u3 u4 u5 0 20 40 60 80 100 0 20 40 60 80 100 γγ2 longitude latitude u1 u2 u3 u4 u5 0.2 0.4 0.6 0.8 0 20 40 60 80 100 0 20 40 60 80 100 γγ3 longitude latitude u1 u2 u3 u4 u5 0.2 0.4 0.6 0.8 0 20 40 60 80 100 0 20 40 60 80 100 γγ4 longitude latitude u1 u2 u3 u4 u5 0.2 0.4 0.6 0.8 0 20 40 60 80 100 0 20 40 60 80 100 γγ5 longitude latitude u1 u2 u3 u4 u5 0.2 0.4 0.6 0.8

Figura 2.2: Curvas de n´ıvel de cada uma das componentes de mistura γ1(.), γ2(.), γ3(.),γ4(.) e

γ5(.) em D. As curvas fornecem uma id´eia da influˆencia de cada componente nas observa¸c˜oes Zt(si).

de 0 a 100 para cada um dos 5 parˆametros de suaviza¸c˜ao hm considerados. Este ´e

um limite bastante elevado, uma vez que maxmhm = 40. As distribui¸c˜oes a priori

Semi-Cauchy foram assumidas com c = 30. A Figura 2.3 apresenta a verossimilhan¸ca perfilada para cada hm, onde a concentra¸c˜ao em torno de 0 somente ´e observada para a

componente no. 1. A Figura 2.4 apresenta os tra¸cos para os 5 parˆametros de suaviza¸c˜ao. Ela mostra que embora os parˆametros que influenciam no processo observado sejam bem estimados a distribui¸c˜ao para h1 se acumula no limite superior do intervalo.

Ou-tras exemplos simulados mostram que nem sempre os parˆametros de suaviza¸c˜ao que influenciam o processo observado s˜ao bem estimadas quando um destes parˆametros n˜ao converge (veja o exemplo simulado do cap´ıtulo 5). De qualquer maneira h´a uma indica¸c˜ao de problemas de convergˆencia e a discuss˜ao da se¸c˜ao anterior j´a indicava que isto poderia indicar h1 concentrado em torno de 0. O algoritmo de amostragem foi

reiniciado com um suporte mais curto [0, 15], somente para h1. A Figura 2.5 mostra

que todas as distribui¸c˜oes dos parˆametros de suaviza¸c˜ao ficam concentradas em torno de seus verdadeiros valores, incluindo h1 que se concentra em torno de 0. Isto indica

(43)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 38 0 50 100 150 200 −1550 −1450 −1350 −1250 h1 log(Verossimilhança) 0 50 100 150 200 −1550 −1450 −1350 −1250 h2 log(Verossimilhança) 0 50 100 150 200 −1500 −1400 −1300 h3 log(Verossimilhança) 0 50 100 150 200 −1550 −1450 −1350 −1250 h4 log(Verossimilhança) 0 50 100 150 200 −1700 −1600 −1500 −1400 −1300 h5 log(Verossimilhança)

Figura 2.3: Log das fun¸c˜oes de verossimilhan¸ca perfilada para h1, h2, h3, h4 e h5.

iteração h1 0 1000 2000 3000 4000 5000 40 50 60 70 80 90 100 iteração h2 0 1000 2000 3000 4000 5000 30 40 50 60 70 iteração h3 0 1000 2000 3000 4000 5000 20 40 60 80 iteração h4 0 1000 2000 3000 4000 5000 30 40 50 60 70 80 90 100 iteração h5 0 1000 2000 3000 4000 5000 20 30 40 50 60 70 80

Figura 2.4: Tra¸cos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizontal)

considerando o suporte [0, 100] for h1.

O Algoritmo ´e reiniciado excluindo a componente 1. A Tabela 2.1 confirma o achado visual da Figura 2.5 para os outros parˆametros do modelo. Quando os parˆametros de

(44)

iteração h1 0 1000 2000 3000 4000 5000 0 2 4 6 8 iteração h2 0 1000 2000 3000 4000 5000 20 30 40 50 60 70 80 iteração h3 0 1000 2000 3000 4000 5000 20 30 40 50 60 70 80 iteração h4 0 1000 2000 3000 4000 5000 30 40 50 60 70 80 iteração h5 0 1000 2000 3000 4000 5000 20 40 60 80 100

Figura 2.5: Tra¸cos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizontal)

considerando o suporte [0, 15] para h1.

suaviza¸c˜ao e n´umero de componentes s˜ao corretamente estimados, todos os parˆametros podem ser identificados e eles s˜ao bem estimados.

Modelo II

Para obter as estimativas do modelo II cada um dos valores de hm ´e fixado como

igual a 1. Este valor gera automaticamente 5 processos que s˜ao localmente esta-cion´arios. A Tabela 2.2 fornece as estimativas obtidas para σm2 e φm, m = 1, . . . , 5.

Modelo III

O modelo III difere do modelo II no fato de que somente as componentes 2, 3, 4 e 5, que de fato possuem pesos associados ao processo observado, s˜ao consideradas. Este novo esquema gera 4 processos que s˜ao localmente estacion´arios. A Tabela 2.3 fornece as estimativas obtidas para σ2

m e φm, m = 2, . . . , 5.

Compara¸c˜ao dos modelos As estimativas de σ2

m e φm obtidas pelo modelo I (Tabela 2.1) n˜ao podem ser

(45)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 40

Tabela 2.1: Valores estimados de parˆametros `a posteriori para o Modelo I e seus respectivos intervalos de credibilidade de 95%.

Parˆametros Verdadeiros valores M´edias a posteriori I.C. 95 %

σ22 5.0 4.7 (4.1, 5.2) σ2 3 2.0 2.2 (2.0, 2.5) σ2 4 3.0 3.1 (2.5, 3.6) σ52 0.5 0.5 (0.4, 0.6) φ2 0.015 0.015 (0.013, 0.018) φ3 0.025 0.021 (0.018, 0.025) φ4 0.020 0.019 (0.016, 0.024) φ5 0.030 0.031 (0.026, 0.038)

Tabela 2.2: Valores estimados de parˆametros `a posteriori para o Modelo II e seus respectivos intervalos de credibilidade de 95%.

Parˆametros M´edias a posteriori I.C. 95 %

σ21 1.2 (1.0, 1.4) σ22 2.4 (2.1, 2.7) σ2 3 1.6 (1.4, 1.9) σ24 1.8 (1.6, 2.1) σ2 5 0.4 (0.4, 0.5) φ1 0.025 (0.0203, 0.030) φ2 0.018 (0.015, 0.022) φ3 0.023 (0.018, 0.027) φ4 0.033 (0.028, 0.039) φ5 0.033 (0.028, 0.039)

(46)

Tabela 2.3: Valores estimados de parˆametros `a posteriori para o Modelo III e seus respectivos intervalos de credibilidade de 95%.

Parˆametros M´edias a posteriori I.C. 95 %

σ22 2.3 (2.0, 2.6) σ2 3 1.6 (1.4, 1.8) σ2 4 1.7 (1.5, 1.9) σ52 0.4 (0.4, 0.5) φ2 0.017 (0.015, 0.020) φ3 0.024 (0.020, 0.028) φ4 0.021 (0.018, 0.025) φ5 0.033 (0.029, 0.038)

estimativas destes parˆametros, obtidas pelos modelos II e III revelam o grau de n˜ ao-estacionaridade do processo global e podem ser interpretadas, pois cada uma delas corresponde a uma distinta sub-regi˜ao de estacionaridade. Os parˆametros estimados pelo modelo I n˜ao podem ser interpretados dada a misturas dos processos pelas com-ponentes de mistura.

Uma vez que estamos tratando de um estudo simulado, conhecemos a verdadeira dis-tribui¸c˜ao condicional [Zno

t |Zt] e podemos comparar diretamente a esperan¸ca e variˆancia

condicionais E[Znot |Zt] e V ar[Znot |Zt] com suas respectivas estimativas obtidas pelos

modelos I, II e III. Para isto, observa¸c˜oes geradas em 256 pontos de uma grade regular foram geradas e guardadas para compara¸c˜ao.

A Figura 2.6 apresenta os verdadeiros valores de E[Znot |Zt] no tempo t = 10 e os

valores interpolados para estes pontos obtidos a partir das equa¸c˜oes descritas na sub-se¸c˜ao 2.4.1. ´E n´ıtido observar que as estimativas obtidas pelo Modelo I s˜ao superiores, `

as obtidas pelos modelos II e III. De fato, a soma dos res´ıduos quadrados s˜ao 0.019 (modelo I), 3.733 (modelo II) e 7.539 (modelo III). O mesmo cen´ario ocorre para outros diferentes valores de t.

(47)

Modelos de convolu¸c˜ao para dados espa¸co-temporais 42 −1 0 1 2 3 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude −1 0 1 2 3 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude −1 0 1 2 3 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude −1 0 1 2 3 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude

Figura 2.6: Verdadeira esperan¸ca condicionalE[Zno10|Z10](acima e `a esquerda) no tempo t = 10

e suas estimativas fornecidas pelo Modelo I (acima e `a direita), Modelo II (abaixo e `a esquerda) e Modelo III (abaixo e `a direita).

apresenta estes verdadeiros valores e os valores interpolados para estes pontos obtidos no tempo t = 10. Os gr´aficos revelam que o modelo I recupera estas variˆancias, enquanto que os outros modelos fornecem estimativas que sobreestimam ou subestimam estes valores em algumas regi˜oes. A soma dos res´ıduos quadrados das variˆancias s˜ao 0.02 (modelo I), 5.64 (modelo II) e 5.94 (modelo III).

(48)

0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude 0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude 0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude 0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 0 20 40 60 80 100 longitude latitude

Figura 2.7: Verdadeira variˆancia condicionalV ar[Zno|Z](acima e `a esquerda) e suas estimativas fornecidas pelo Modelo I (acima e `a direita), Modelo II (abaixo e `a esquerda) e Modelo III (abaixo e `

a direita) no tempo t = 10.

pelos modelos II e III acabam por influenciar na capacidade de interpola¸c˜ao real dos dados. Por exemplo, considere o ponto se = (53.3, 46.7). A Figura 2.8 apresenta os

valores verdadeiros observados de Zt(se) para t = 1, . . . , 200 (em ordem crescente),

contra as estimativas da m´edia e respectivos intervalos de credibilidade de 95%. A qualidade dos intervalos de confian¸ca e valores preditos obtidos pelo modelo I s˜ao notavelmente superiores `aqueles obtidos pelos modelos II e III. O tamanho m´edio dos intervalos para o Modelo I (4.39) ´e menor quando comparado ao tamanho dos

Referências

Documentos relacionados

int *pi // variável “pi” é ponteiro para inteiro float *pc // variável “pc” é ponteiro para float char *xy // variável “xy” é ponteiro para caracter. unsigned long int

duplamente encadeada com este valor caso o mesmo ainda não exista na lista, em ordem CRESCENTE, ou seja, sempre entre um nó contendo um valor menor e outro contendo um valor

 São TADs representados através de listas sequenciais.. (fixas) ou encadeadas (dinâmicas), em que a seguinte regra deve

Não obstante a reconhecida necessidade desses serviços, tem-se observado graves falhas na gestão dos contratos de fornecimento de mão de obra terceirizada, bem

intitulado “O Plano de Desenvolvimento da Educação: razões, princípios e programas” (BRASIL, 2007d), o PDE tem a intenção de “ser mais do que a tradução..

[r]

A presente dissertação é desenvolvida no âmbito do Mestrado Profissional em Gestão e Avaliação da Educação (PPGP) do Centro de Políticas Públicas e Avaliação

Dessa forma, diante das questões apontadas no segundo capítulo, com os entraves enfrentados pela Gerência de Pós-compra da UFJF, como a falta de aplicação de