Modelos espaço-temporais com caudas pesadas e assimétricos

(1)

Modelos espa¸

co-temporais com caudas

pesadas e assim´

etricos

Renata Souza Bueno

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´

etodos Estat´ısticos

2016

(2)

Modelos espa¸

co-temporais com caudas

pesadas e assim´

etricos

Renata Souza Bueno

Tese de Doutorado submetida ao Programa de Pós-Gradua¸cão em Estat´ıstica do Instituto de Matemática da Universidade Federal do Rio de Janeiro, UFRJ, como parte dos requisitos necessários à obten¸cão do grau de Doutor em Estat´ıstica.

Orientadoras: Alexandra M. Schmidt e Thais C. O. da Fonseca

Rio de Janeiro, RJ - Brasil 2016

(3)

Modelos espa¸

co-temporais com caudas

pesadas e assim´

etricos

Renata Souza Bueno

Tese de Doutorado submetida ao Programa de Pós-Gradua¸cão em Estat´ıstica do Instituto de Matemática da Universidade Federal do Rio de Janeiro, UFRJ, como parte dos requisitos necessários à obten¸cão do grau de Doutor em Estat´ıstica.

Aprovada por:

Profa. Alexandra M. Schmidt, PhD, UFRJ (Presidente)

Profa. Thais C. O. Fonseca, PhD, UFRJ

Prof. Helio dos Santos Migon, PhD, UFRJ

Prof. Dani Gamerman, PhD, UFRJ

Profa_{. Rosangela H. Loschi, PhD, UFMG}

Prof. Reinaldo B. Arellano-Vale, PhD, PUC-Chile

Rio de Janeiro, RJ - Brasil 2016

(4)

`

(5)

“Quanto mais eu estudo e tento chegar a algum lugar, mais o universo se dilata, mais consciente eu me torno de tudo que n˜ao sei e nem vou saber. ...”

(6)

Agradecimentos

Primeiramente, agrade¸co a Deus por ter me dado sa´ude, uma fam´ılia maravilhosa e for¸ca para seguir em frente.

Agrade¸co à mulher mais importante da minha vida! Minha mãe, Dona Stella. Minha grande incentivadora em tudo e em especial nos estudos. Foi minha grande companheira em vida e sou muito grata pela oportunidade de ter convivido com ela. Ao meu pai, agrade¸co por todo o carinho e apoio durante minha trajetória. Agrade¸co também todas as conversas e idas oportunas ao cinema. À minha vó Edna por toda inspira¸cão que ela me causa e por ser um exemplo de pessoa para mim. Por todo amor, dedica¸cão e for¸ca que ela me dá. Ao meu irmão, agrade¸co pelo amor e carinho depositados em mim e por ter me dado meu maior presente, minha sobrinha Manuela. À Manu agrade¸co o sorriso e a alegria sempre que me vê e todo amor que uma pessoinha tão pequena pode proporcionar a essa tia mais que babona. Agrade¸co a todos da minha fam´ılia pelo carinho, incentivo e pela união em todos os momentos. Ao Nuno agrade¸co por todo amor, carinho e apoio que ele me dá, com ele tudo fica mais fácil. Obrigada pela parceria, pela paciência e por todo conforto que tem me dado.

Aos meus professores, da gradua¸cão e da pós-gradua¸cão, agrade¸co pelos ensinamen-tos, pela dedica¸cão e por toda ajuda na minha forma¸cão. Em especial, agrade¸co às minhas orientadoras Alexandra e Thais pelo privilégio de poder trabalhar com elas. À Thais, agrade¸co toda ajuda, incentivo durante o doutorado e pela oportunidade de com-partilhar seus conhecimentos comigo. À Alexandra, que foi minha professora desde a gradua¸cão, agrade¸co pelas conversas, ajuda, incentivo e por conviver com uma referência de profissional para mim.

Aos meus amigos do DME agrade¸co pelas experiˆencias e conhecimentos comparti-lhados. Em especial, agrade¸co `a panela (Camilinha, Lari, Dance e Jonhh) por terem

(7)

me acolhido, por toda ajuda durante essa etapa e pela amizade constru´ıda. Agrade¸co `

a Patty, Mari, Josi e Jony por todo carinho e ajuda. Aos meus colegas de trabalho na ENCE, agrade¸co pela convivência alegre de todos os dias, pelas conversas construti-vas, pelo incentivo e pelas discussões interessantes sobre o trabalho. Agrade¸co a todos que foram meus alunos pelas experiências trocadas em sala de aula e pelo aprendizado adquirido com eles.

Agrade¸co a todos os meus amigos pela paciência que tiveram durante esta etapa, por entenderem à minha ausência quando foi necessário. Em especial, agrade¸co à minha best Luana pelo companheirismo em todos os nossos 18 anos de amizade e pela alegria de me dar mais uma afilhada, a tão aguardada Lu´ısa. À minha amiga Vanessa, agrade¸co pelo carinho e for¸ca de sempre. Ao bonde da estat´ıstica, Fabi, Carol e Ju pela amizade verdadeira e por todos os momentos divididos juntas. À Jones pela amizade, por sempre me entender e pela companhia divertida.

Agrade¸co por todo mundo que torceu e acompanhou essa etapa t˜ao importante na minha vida. Obrigada pelo carinho e confian¸ca!

Agrade¸co aos professores Helio Migon, Dani Gamerman, Rosangela Loschi e Reinaldo Arellano-Vale por aceitarem participar desta banca.

(8)

Resumo

Diversos fenômenos referenciados no espa¸co e no tempo são frequentemente estudados em diferentes áreas da ciência. Com isso, o desenvolvimento de modelos que descrevem os processos espa¸co-temporais se tornam extremamente relevantes. Tais processos tem como objetivos, entender o comportamento do fenômeno sob estudo e realizar previsões para tempos futuros ou para localiza¸cões não observadas. Usualmente, os modelos utili-zados para descrever estes processos são baseados em processos Gaussianos. No entanto, distribui¸cões de dados reais apresentam frequentemente desvios nas suposi¸cões de norma-lidade, como a presen¸ca de assimetria ou caudas mais pesadas. O objetivo deste trabalho ´

e propor modelos que possam acomodar estes desvios. Duas abordagens são propostas. A primeira utiliza um processo não Gaussiano definido como uma mistura de escala para acomodar caudas mais pesadas. Nesta mistura é usada uma variável latente para mode-lar a variância do fenômeno de interesse. A ideia é incorporar nesta variável, o uso de covariáveis espacialmente referenciadas tornando o processo mais flex´ıvel, em que a cur-tose varia conforme a localiza¸cão. Um estudo com dados contaminados e uma aplica¸cão em dados de temperatura máxima em uma região da Espanha são realizados nesta abor-dagem. A segunda abordagem leva em considera¸cão a assimetria da distribui¸cão dos dados. Baseado em um processo espacial marginal assimétrico, cuja distribui¸cão em cada localiza¸cão é uma normal assimétrica, é proposto um processo que utiliza ao invés da dis-tribui¸cão half normal, na defini¸cão da normal assimétrica, uma distribui¸cão log-normal. Esta proposta define uma nova classe de processos espaciais e espa¸co-temporais que apre-senta maior flexibilidade quanto à assimetria e curtose. São realizados um exerc´ıcio com dados artificiais e uma aplica¸cão à temperatura máxima mensal na região sul e sudeste do Brasil. O procedimento de inferência é feito sob o enfoque bayesiano.

Palavras-Chave: Modelagem espa¸co-temporal; curtose; assimetria; inferˆencia bayesiana; processos n˜ao Gaussianos.

(9)

Abstract

Several phenomena referenced in space and time are often studied in different areas of science. Thus, the development of models that describe spatio-temporal processes become extremely relevant. Such processes aims to understand the behavior of phenomenon under study and make predictions for future times or unobserved locations. Usually, the models used to describe these processes are based on Gaussian processes. However, real data distributions often exhibit deviations from the assumptions of normality, as the presence of skewness or heavy tails. The objective of this work is to propose models that can accommodate these deviations. Two approaches are proposed. The first uses a non-Gaussian process defined as a scale mixture to accommodate heavier tails. In this mixture is used a latent variable to model the variance of the phenomenon of interest. The idea is incorporate in this variable, the use of spatial covariates making the process more flexible with the kurtosis varying by location. A study of contaminated data and an application in maximum temperature data in a region of Spain are made in this approach. The second approach takes into account the skewness of data distribution. Based on a skewed marginal spatial process, whose distribution in each location is a skew-normal, a process is proposed which uses log-normal distribution instead of the half-normal distribution, in definition of skew-normal. The proposal defines a new class of spatial and spatiotemporal processes which presents more flexibility to skewness and kurtosis. It is conducted an exercise with artificial data and an application to the monthly maximum temperature in the area south and southeast of Brazil. The inference procedure is done under the Bayesian approach.

Keywords: Spatio-temporal modelling; kurtosis; skewness; bayesian inference; non-gaussian processes.

(10)

Sum´

ario

1 Introdu¸c˜ao 1

2 Modelagem Espa¸co-Temporal 6

2.1 Modelagem Espacial . . . 7

2.1.1 Geoestat´ıstica . . . 8

2.1.2 Processos n˜ao Gaussianos . . . 13

2.2 Modelagem Temporal . . . 14

2.2.1 Modelos lineares dinˆamicos . . . 15

2.3 Modelagem Espa¸co-Temporal . . . 19

2.3.1 Tempo discreto . . . 20

2.3.2 Tempo cont´ınuo . . . 21

3 Modelagem da curtose em modelos espa¸co-temporais 24 3.1 Motiva¸c˜ao . . . 25

3.2 Modelo proposto . . . 27

3.3 Propriedades do modelo proposto . . . 29

3.3.1 Modelagem da curtose . . . 33

3.4 Procedimento de Inferˆencia . . . 39

3.4.1 Crit´erios de compara¸c˜ao de modelos . . . 43

3.5 Estudo com dados contaminados . . . 46

3.6 Aplica¸c˜ao a dados reais . . . 62

(11)

4 Modelagem da assimetria em processos espaciais 79

4.1 Revis˜ao de Literatura . . . 80

4.1.1 Distribui¸c˜ao normal assim´etrica . . . 82

4.1.2 Modelo espacial com distribui¸c˜ao marginal normal assim´etrica . . 83

4.2 Modelo proposto . . . 85

4.2.1 Caso univariado - Mistura normal-log-normal . . . 85

4.2.2 Caso multivariado - Processo normal-log-normal espacial . . . 91

4.3.1 Distribui¸c˜oes a priori para os parˆametros do modelo proposto . . 95

4.4 An´alise de dados gerados artificialmente . . . 97

4.4.1 Exemplo com r´eplicas independentes . . . 101

4.5 Conclus˜oes . . . 105

5 Modelagem da assimetria em modelos espa¸co-temporais 106 5.1 Modelo normal-log-normal espa¸co-temporal . . . 107

5.2 Propriedades do modelo normal-log-normal espa¸co-temporal . . . 109

5.3.1 Distribui¸c˜oes a priori . . . 114

5.3.2 Previs˜ao . . . 115

5.4 Estudo com dados gerados artificialmente . . . 119

5.5 Aplica¸c˜ao a dados de temperatura m´axima . . . 137

5.6 Conclus˜oes . . . 149

6 Conclus˜oes e Trabalhos Futuros 150

A Modelo espa¸co-temporal 153

B Modelo espacial assim´etrico 162

(12)

Lista de Tabelas

3.1 Curtose do processo para diferentes valores de β0 considerando β1 = 0. . 33

3.2 Calibragem do Fator de Bayes na escala logar´ıtmica segundo Kass e Raf-tery (1995). . . 45

3.3 Valores dos parˆametros fixados para a gera¸c˜ao dos dados artificiais. . . . 47

3.4 Soma das amplitudes dos intervalos de credibilidade a posteriori de 95% da variˆancia condicional do processo. . . 53

3.5 Crit´erios para compara¸c˜ao quanto ao ajuste dos modelos. . . 56

3.6 Critérios para compara¸cão dos modelos quanto a previsão. . . 61

3.8 Critérios para compara¸cão dos modelos quanto a previsão. . . 76

4.1 Coeficiente de assimetria das distribui¸c˜oes assim´etricas . . . 89

4.2 Curtose das distribui¸c˜oes assim´etricas . . . 89

4.3 Valores dos parˆametros fixados para a gera¸c˜ao dos dados artificiais . . . 98

5.1 Valores dos parâmetros fixados para a gera¸cão dos dados artificiais usando o modelo espa¸co-temporal assimétrico. . . 121

5.2 Valores dos parâmetros fixados relacionados a assimetria para a cria¸cão de diferentes cenários. . . 122

5.3 Sum´ario a posteriori dos parˆametros para os modelos ajustados. . . 142

5.5 Critérios para compara¸cão quanto à previsão para localiza¸cão não medidas dos modelos. . . 146 5.6 Critérios para compara¸cão quanto à previsão 3 passos a frente dos modelos.149

(13)

Lista de Figuras

3.1 Diagrama de dispersão para os dados de temperatura máxima em que o tamanho dos c´ırculos é proporcional ao valor da variância amostral em cada localiza¸cão. . . 25 3.2 Diagrama de dispersão entre a altitude e a variância emp´ırica da temperatura máxima

em uma regi˜ao da Espanha em julho de 2006. . . 26 3.3 Grade de valores de uma covari´avel fict´ıcia representada pelos quadrados e os c´ırculos

representam as correla¸c˜oes de cada ponto com o ponto representado com asterisco em branco. . . 31 3.4 Grade de valores de uma covari´avel fict´ıcia representada pelos quadrados e os c´ırculos

representam as correla¸c˜oes de cada ponto com o ponto representado com asterisco em preto. . . 32 3.5 Grade de valores de uma covari´avel fict´ıcia representada pelas cores e os c´ırculos

repre-sentam as curtoses em cada localiza¸cão. β1 foi considerado positivo (painéis (a) e (b)) e negativo (painéis (c) e (d)). . . 34 3.6 Tabela com medidas-resumo da distribui¸cão a priori para β0e o gráfico de sua fun¸cão

de densidade. . . 35 3.7 Tabela com os quantis da distribui¸c˜ao a priori para a curtose e o gr´afico de seu

histo-grama, quando β1= 0. . . 36

3.8 Histogramas da distribui¸cão a priori para a curtose assumindo diferentes distribui¸cões a priori para o parâmetro β1e para a covariável x∗1 e β0∼ N T−(0, 3). . . 37

3.9 Distribui¸cões a priori marginal para β1e para a curtose considerando diferentes valores para lkurt. Na segunda coluna os painéis enfatizam as caudas das respectivas distribui¸cões. 39

(14)

3.10 Gráfico de dispersão no espa¸co dos pontos usados para a gera¸cão das observa¸cões. Os c´ırculos cheios representam os pontos usados para o ajuste do modelo. Os quadrados representam os pontos usados para a realiza¸cão da previsão. O ponto destacado com asterisco é o ponto referência para a contamina¸cão dos dados. Os números representam uma identifica¸cão de cada localiza¸cão. . . 47 3.11 Gráfico de dispersão no espa¸co dos pontos de cada localiza¸cão em que o tamanho do

c´ırculo é inversamente proporcional a distância com o ponto de referência (em asterisco). 48 3.12 Gráficos do intervalo de credibilidade (95%) e da mediana a posteriori das fun¸cões de

correla¸cão (onde t = 1) dos quatro modelos e do processo gerador dos dados, antes da contamina¸cão. A linha pontilhada é a fun¸cão de correla¸cão verdadeira. . . 51 3.13 Gráficos das densidades a priori e a posteriori referentes aos parâmetros β0 e β1 dos

modelos PNG.X (I) e PNG.X (D). . . 52 3.14 Gr´aficos dos intervalos de credibilidade a posteriori de 95%, em que os c´ırculos

repre-sentam a mediana a posteriori da variˆancia condicional do processo. . . 54 3.15 Gr´afico dos intervalos de credibilidade a posteriori de 95%, em que os c´ırculos

represen-tam a mediana a posteriori da curtose dos modelos PNG.X (I) e modelo PNG.X (D) [Painéis à esquerda]. O primeiro intervalo representa o do modelo PNG. Nos painéis à direita estão os gráficos das medianas a posteriori da curtose distribu´ıdas ao longo da região geográfica.. . . 55 3.16 Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 1 e 2 em

todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos. . . 57 3.17 Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 3 e 4 em

todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos. . . 58 3.18 Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 5 e 6 em

todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos. . . 59 3.19 Critério de compara¸cão de modelos quanto a previsão (CRPS) referentes aos locais de

(15)

3.20 Localiza¸cões das esta¸cões monitoradoras de temperatura. Os c´ırculos cheios represen-tam as localiza¸cões usadas para previsão. . . 62 3.21 Sumários dos dados referentes a temperatura máxima do Pa´ıs Basco no per´ıodo de

julho de 2006. . . 63 3.22 (a) Variância emp´ırica distribu´ıda no espa¸co (tamanho do c´ırculo proporcional à variância)

e (b) altitude padronizada interpolada no espa¸co. . . 64 3.23 Gr´aficos das densidades a priori e a posteriori do parˆametro σ2 _{sob os quatro modelos}

ajustados. . . 66 3.24 Gr´aficos das densidades a priori e a posteriori dos parˆametros δ0, δ1, δ2, δ3, δ4 e δ5

para os quatro modelos ajustados. . . 67 3.25 Gr´aficos das densidades a priori e a posteriori dos parˆametros a1, a2, α1 e α2 para os

quatro modelos ajustados. . . 69 3.26 Gr´aficos das densidades a priori e a posteriori referentes aos parˆametros β0 e β1 dos

modelos PNG.X. . . 69 3.27 Gr´aficos dos intervalos de credibilidade a posteriori de 95% para a variˆancia condicional

dos modelos PNG, PNG.X (I) e PNG.X (D). Os c´ırculos representam a mediana a posteriori. . . 71 3.28 Gr´afico do intervalo de credibilidade a posteriori de 95%, em que os c´ırculos representam

a mediana a posteriori da curtose dos modelos PNG.X (I) e PNG.X (D). O primeiro intervalo representa o do modelo PNG. . . 72 3.29 Mapa das medianas a posteriori da curtose interpolada dos modelos PNG.X (I) e

PNG.X (D). . . 72 3.30 Gr´afico dos intervalos de credibilidade de 95% para as previs˜oes dos locais 1 e 2 em

todos os 31 tempos. Os valores verdadeiros estão simbolizados através dos asteriscos. 74 3.31 Gráfico dos intervalos de credibilidade de 95% para a previsão do local 3 em todos os

31 tempos. Os valores verdadeiros estão simbolizados através dos asteriscos. . . 75 3.32 Critério de compara¸cão de modelos quanto a previsão (CRPS) referentes ao local 1, 2

(16)

4.1 Gráficos das fun¸cões de densidade de probabilidade das variáveis que se-guem uma distribui¸cão normal assimétrica e normal-log-normal, variando o parâmetro de forma. A distribui¸cão normal serviu como base de com-para¸cão. Os parâmetros de posi¸cão e escala foram fixados em µ = 0 e σ = 1. . . 90 4.2 Histogramas da distribui¸cão a priori para o parâmetro τ , em que σ2

2 ∼

GI(2; 0, 8) e σ1 ∼ N (0, Cσ1). Foram considerados diferentes valores para Cσ1. . . 96 4.3 Gráfico das localiza¸cões no espa¸co dos dados gerados artificialmente. . . 97 4.4 Gráficos dos tra¸cos das cadeias e das densidades a priori e a posteriori dos parâmetros

β0 e β1. . . 99

4.5 Gr´aficos dos tra¸cos das cadeias e das densidades a priori e a posteriori dos parˆametros σ1 e σ22. . . 100

4.6 Gr´aficos dos tra¸cos das cadeias e das densidades a priori e a posteriori dos parˆametros a1e a2. . . 101

4.7 Gráficos dos tra¸cos das cadeias a posteriori dos parâmetros β0, β1 eσ1com 1 réplica e 30 réplicas. . . 103 4.8 Gráficos dos tra¸cos das cadeias a posteriori dos parâmetros σ2

2, a1 e a2com 1 r´eplica e 30 r´eplicas. . . 104

5.1 Gr´aficos dos comportamentos do coeficiente de assimetria do modelo normal-log-normal espa¸co-temporal para diferentes valores dos parˆametros σ1, σ02 e σ22. . . 112

5.2 Gr´aficos dos comportamentos da curtose do modelo normal-log-normal espa¸co-temporal para diferentes valores dos parˆametros σ1, σ02 e σ22. . . 112

5.3 Gráfico das localiza¸cões no espa¸co dos dados gerados artificialmente. . . 121 5.4 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori e a priori

do parâmetro a1 para os dois modelos ajustados, o modelo que estima os W ’s (M.W) e o que usa fator de desconto (M.FD). Os intervalos são para diferentes cenários. A linha horizontal tracejada representa o valor verdadeiro do parâmetro. . . 123

(17)

5.5 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori do parâmetro a2para os dois modelos ajustados, M.W e M.FD, e para os quatro cenários criados. A linha horizontal tracejada representa o valor verdadeiro do parâmetro. . . 124 5.6 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori dos

parˆametros σ2

0 e σ22 para os quatro cenários nos dois modelos ajustados, M.W e M.FD. A linha horizontal tracejada representa o valor verdadeiro do parâmetro. . . 125 5.7 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori dos

parâmetros W1 e W2 nos quatro cenários para o modelo ajustado M.W. A linha hori-zontal tracejada representa o valor verdadeiro do parâmetro. . . 125 5.8 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% dos parâmetros µσ1

e Cσ1 para os diferentes cen´arios e para os dois modelos ajustados, M.W e M¿FD. O

asterisco representa o valor verdadeiro do parˆametro. . . 126 5.9 Gr´aficos dos intervalos de credibilidade a posteriori de 95% e a mediana a posteriori da

evolu¸cão no tempo dos estados do modelo para os diferentes cenários de assimetria e para os dois modelos ajustados. . . 127 5.10 Gráficos dos intervalos de credibilidade a posteriori de 95% do parâmetro σ1que está

relacionado com a assimetria para os cenários 1 e 2. Os intervalos são referentes ao ajuste do modelo M.W e os asteriscos representam os valores verdadeiros. . . 129 5.11 Gráficos dos intervalos de credibilidade a posteriori de 95% do parâmetro σ1que está

relacionado com a assimetria para os cenários 3 e 4. Os intervalos são referentes ao ajuste do modelo M.W. Os asteriscos representam os valores verdadeiros no painel (a) e no painel (b) o valor verdadeiro é representado pela linha horizontal tracejada. . . 130 5.12 Gráficos dos intervalos a posteriori preditivos de 95% de credibilidade para 6 localiza¸cões

ao longo dos 60 instantes de tempo para o cenário 1. Intervalos referentes ao modelo M.W. . . 131 5.13 Gráficos dos intervalos a posteriori preditivos de 95% de credibilidade para 2 localiza¸cões

ao longo dos 60 instantes de tempo para os cenários 2, 3 e 4. Intervalos referentes ao modelo M.W. . . 132 5.14 Gráfico dos intervalos de previsão de 95% de credibilidade para 5 instantes futuros dos

(18)

5.15 Gráficos das interpola¸cões espaciais do modelo M.W para o instante de tempo 60 no cenário 1. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribui¸cão preditiva a posteriori. . . 134 5.16 Gráficos das interpola¸cões espaciais do modelo M.W para o instante de tempo 60 no

cenário 2. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribui¸cão preditiva a posteriori. . . 135 5.17 Gráficos das interpola¸cões espaciais do modelo M.W para o instante de tempo 60 no

cenário 3. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribui¸cão preditiva a posteriori. . . 135 5.18 Gráficos das interpola¸cões espaciais do modelo M.W para o instante de tempo 60 no

cenário 4. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribui¸cão preditiva a posteriori . . . 136 5.19 Mapa da região em estudo onde os c´ırculos cheios são as esta¸cões monitoradoras usadas

no ajuste do modelo e os asteriscos são as esta¸cões que foram retiradas para a previsão. 137 5.20 Gráfico das séries temporais da temperatura máxima mensal em cada esta¸cão

monito-radora. . . 138 5.21 Box-plot da temperatura máxima mensal para cada instante de tempo usado na análise. 138 5.22 Box-plot da temperatura máxima mensal para cada esta¸cão monitoradora. . . 139 5.23 Gráfico das séries temporais da umidade média mensal em cada esta¸cão monitoradora. 139 5.24 Gráficos dos intervalos de credibilidade a posteriori de 95% dos valores ajustados pelo

modelo NLN em 4 esta¸cões monitoradoras em que o c´ırculo cheio representa o valor verdadeiro e a linha cheia a mediana a posteriori. . . 143 5.25 Gráficos das distribui¸cões a priori e a posteriori dos parâmetros µσ1 e Cσ1 referente ao

modelo NLN. . . 144 5.26 Gr´aficos dos intervalos de credibilidade a posteriori de 95% do parˆametro σ1do modelo

NLN. A linha tracejada no zero representa uma referˆencia de presen¸ca de simetria nos dados. . . 145 5.27 Gr´aficos dos intervalos de credibilidade a posteriori de 95% para os estados do modelo

(19)

5.28 Gráfico dos intervalos a posteriori de 95% de credibilidade da distribui¸cão preditiva para 2 esta¸cões não medidas referentes aos três modelos ajustados. . . 147 5.29 Gráficos do intervalos de credibilidade a posteriori de 95% da distribui¸cão preditiva

para 3 meses a frente em 6 esta¸cões. Os resultados são referentes aos três modelos ajustados. . . 148

A.1 Gráficos das cadeias a posteriori dos parâmetros do modelo PNG.X (I) e das variâncias de três localiza¸cões. Em parênteses são apresentados os valores da estat´ıstica ˆR. . . . 160 A.2 Gráficos das cadeias a posteriori dos parâmetros do modelo PNG.X (I) e das variâncias

de trˆes localiza¸c˜oes. . . 161

C.1 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no cenário 1. Em parênteses são apresentados os valores da estat´ıstica ˆR.. . . 179 C.2 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localiza¸cões do

mo-delo normal-log-normal no cenário 1. Em parênteses são apresentados os valores da estat´ıstica ˆR. . . 180 C.3 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no

cenário 2. Em parênteses são apresentados os valores da estat´ıstica ˆR.. . . 181 C.4 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localiza¸cões do

cenário 3. Em parênteses são apresentados os valores da estat´ıstica ˆR.. . . 183 C.6 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localiza¸cões do

cenário 4. Em parênteses são apresentados os valores da estat´ıstica ˆR.. . . 185 C.8 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal para a

(20)

Cap´ıtulo 1

Introdu¸

c˜

ao

O foco deste trabalho está na modelagem de dados referenciados no espa¸co e no tempo. Em particular, assume-se que a estrutura espacial das observa¸cões segue a estru-tura da geoestat´ıstica. A geoestat´ıstica é uma subárea da estat´ıstica espacial, onde as observa¸cões são consideradas uma realiza¸cão parcial de um processo estocástico indexado pela localiza¸cão que varia continuamente no espa¸co. Este processo é chamado de pro-cesso espacial. É natural pensar em uma extensão deste processo para o tempo, em que são analisados distintos instantes de tempo em um dado intervalo. A varia¸cão do tempo neste processo pode acontecer tanto de forma cont´ınua quanto discreta. Tais processos são chamados processos espa¸co-temporais.

O desenvolvimento de métodos para a análise de processos espa¸co-temporais vem aumentando consideravelmente devido aos avan¸cos computacionais. Os modelos que descrevem estes processos incorporam as dependências espaciais e temporais entre as ob-serva¸cões com o objetivo de entender o comportamento do processo sob estudo e realizar previsões para tempos futuros ou para localiza¸cões não observadas.

Existem inúmeras aplica¸cões práticas destes processos. Por exemplo, é interesse en-tender o comportamento de fenômenos climáticos, bem como prever a ocorrência dos mesmos. Com isto, torna-se fundamental entender a dinâmica espacial e temporal de tais fenômenos. O mesmo ocorre em estudos do efeito da polui¸cão atmosférica, estudos ambientais, entre outros.

(21)

ba-seados em processos Gaussianos que apresentam a vantagem de estarem completamente especificados se a fun¸cão de média e a fun¸cão de covariância forem especificadas. No entanto, distribui¸cões de dados reais apresentam frequentemente desvios nas suposi¸cões de normalidade. Tais desvios podem ser a presen¸ca de caudas mais pesadas ou um comportamento assimétrico.

Sob essa perspectiva, o objetivo principal deste trabalho é propor modelos que pos-sam acomodar estes desvios que as distribui¸cões dos dados possam apresentar. Duas abordagens são propostas, uma para acomodar distribui¸cões de dados com caudas mais pesadas e a outra para acomodar distribui¸cões de dados com assimetria e com caudas mais pesadas ambas no contexto dos processos espa¸co-temporais.

A primeira abordagem que é usada para acomodar caudas mais pesadas inspira-se na ideia apresentada por Palacios e Steel (2006) e estendida por Fonseca e Steel (2011) em que é definido um processo não Gaussiano como uma mistura de escala. Nesta mistura é usada uma variável latente que modela a variância do processo de interesse. Tal variável permite que exista uma heterocedasticidade espacial e que o processo tenha uma cauda mais pesada que a do processo Gaussiano. Podendo assim, acomodar poss´ıveis valores discrepantes.

A ideia a ser desenvolvida aqui é incorporar, na variável latente que modela a variância do processo, poss´ıveis covariáveis espacialmente referenciadas. Espera-se que o uso destas covariáveis ajude a trazer informa¸cão sobre a variância do processo e sobre o comporta-mento dos dados em estudo. A abordagem proposta permite que a curtose do processo, medida responsável pela cauda da distribui¸cão resultante, possa variar conforme a loca-liza¸cão. Este fato faz com que o modelo seja mais flex´ıvel, podendo assumir distribui¸cões com diferentes comportamentos em cada localiza¸cão. Acredita-se que com o uso destas covariáveis a previsão para localiza¸cões não medidas possa ser melhorada, no sentido em que a incerteza associada a previsão seja menor. Neste contexto, o processo espa¸co-temporal que é proposto considera o tempo cont´ınuo assim como é feito em Fonseca e Steel (2011).

Um estudo com dados contaminados é feito com a finalidade de avaliar o comporta-mento do modelo proposto em rela¸cão à ajuste e a previsão. Tal estudo é relevante para

(22)

avaliar se o modelo proposto consegue recuperar o comportamento dos dados e realizar previsões que incorporem o efeito da contamina¸cão. Para realizar a contamina¸cão do dados, a ideia usada é supor um ponto como fonte de contamina¸cão, por exemplo uma fonte de polui¸cão do ar, e a contamina¸cão é feita considerando uma fun¸cão da distância entre cada ponto da amostra para a fonte contaminadora. De forma que quanto menor ´

e a distância, maior é a contamina¸cão. O exerc´ıcio é feito ajustando o modelo que é proposto neste trabalho e modelos que são casos particulares dele. Para o modelo pro-posto, a covariável usada para modelar a variância do processo é a distância euclidiana entre cada localiza¸cão e a fonte de contamina¸cão. Uma aplica¸cão do modelo é feita em dados referentes a temperatura máxima diária observada em 70 localiza¸cões do Pa´ıs Basco, Espanha no per´ıodo do mês de julho do ano de 2006. Nesta aplica¸cão também são ajustados casos particulares do modelo proposto e é feita uma compara¸cão entre estes modelos considerando o ajuste e a previsão.

A segunda abordagem proposta neste trabalho leva, principalmente, em considera¸cão a assimetria da distribui¸cão dos dados em processos espaciais e espa¸co-temporais. Zhang e El-Shaarawi (2010) definem um processo espacial marginal assimétrico cuja distribui¸cão marginal para cada localiza¸cão segue uma distribui¸cão normal assimétrica definida por Azzalini (1985). Henze (1986) mostrou que a distribui¸cão normal assimétrica pode ser escrita em fun¸cão da soma de duas variáveis aleatórias, em que uma variável segue uma distribui¸cão normal e a outra uma distribui¸cão normal truncada.

A proposta deste trabalho consiste em substituir a distribui¸cão normal truncada para uma das componentes da soma, descrita por Henze (1986), por uma distribui¸cão Log-normal. Esta proposta define uma nova classe de processos espaciais e espa¸co-temporais assimétricos, em que os processos apresentam maior flexibilidade quanto ao comporta-mento da assimetria e, consequentemente, quanto ao comportacomporta-mento da curtose.

No contexto dos processos espaciais, é definido um parâmetro responsável pela forma da distribui¸cão marginal em cada localiza¸cão. Este parâmetro influencia tanto a assime-tria quanto a curtose do processo e é fixo ao longo do espa¸co. A ideia é estendida para a classe de modelos espa¸co-temporais incorporando o tempo como discreto. Sendo assim, considera-se que as observa¸cões são dadas por intervalos regulares ao longo do tempo.

(23)

A modelagem do tempo é feita usando a ideia da classe dos modelo dinâmicos proposta por Harrison e Stevens (1976) e muito discutida em West e Harrison (1997). Com o uso dos modelos dinâmicos, estruturas como sazonalidade, tendência e n´ıvel podem ser incorporadas na modelagem. No processo espa¸co-temporal, permite-se que o parâmetro responsável pela forma da distribui¸cão varie ao longo do espa¸co, podendo assumir dife-rentes comportamentos assimétricos e de caudas pesadas em cada localiza¸cão.

Um exerc´ıcio com dados gerados artificialmente é realizado considerando 4 diferentes cenários de comportamento em rela¸cão à assimetria do processo. O intuito do exerc´ıcio ´

e avaliar tanto o ajuste quanto a previsão que é realizada pelo modelo proposto. São discutidas previsões com rela¸cão a tempo futuro e interpola¸cões espaciais. O modelo pro-posto também é aplicado a um conjunto de dados reais referente a temperatura máxima mensal na região sul e sudeste do Brasil. São usadas 58 localiza¸cões ao longo de 5 anos, no per´ıodo de mar¸co de 2007 a abril de 2012. Para efeitos de compara¸cão, ajusta-se também um modelo Gaussiano, para os dados na escala original e uma transforma¸cão dos dados. As abordagens são comparadas em rela¸cão ao ajuste e a previsão.

O procedimento de inferˆencia em ambos os modelos ´e feito sob o enfoque bayesiano. ´

E desenvolvido e implementado um algoritmo de simula¸cão de Monte Carlo via cadeias de Markov para obter amostras da distribui¸cão a posteriori dos parâmetros e da distri-bui¸cão preditiva. Em ambas abordagens é explorada a estrutura Gaussiana do processo condicional às variáveis latentes para a aproxima¸cão da distribui¸cão preditiva.

A tese está dividida da seguinte maneira. No Cap´ıtulo 2 é feita uma revisão dos conceitos da modelagem de processos espaciais, em particular, a área da geoestat´ıstica. Também é feita uma revisão sobre os processos temporais em que discute-se o modelo linear dinâmico e suas principais caracter´ısticas. A seguir, são introduzidos os principais conceitos sobre a modelagem dos processos espa¸co-temporais onde são revisadas duas abordagens em que uma considera o tempo como discreto e a outra como cont´ınuo.

No Cap´ıtulo 3 é proposto o modelo para acomodar as caudas mais pesadas em pro-cessos espa¸co-temporais. Neste cap´ıtulo, a formula¸cão do modelo proposto é descrita em conjunto com suas propriedades. É detalhado o procedimento de inferência bem como os critérios de compara¸cão de modelos usados neste trabalho. Um estudo com dados

(24)

conta-minados ´e realizado a fim de verificar o comportamento do modelo proposto e tamb´em ´

e feita uma aplica¸cão do modelo aos dados de temperatura em uma região da Espanha. No final do cap´ıtulo são discutidas as principais conclusões desta proposta.

O Cap´ıtulo 4 propõe um modelo para processos espaciais que possuem comportamento assimétrico. É feita uma revisão de literatura da modelagem assimétrica no contexto da geoestat´ıstica. Em seguida, descreve-se a formula¸cão do modelo proposto e o proce-dimento de inferência. Um estudo com dados gerados artificialmente é realizado para verificar o ajuste do modelo, sendo feito o mesmo exerc´ıcio com réplicas independentes. São apontadas, no fim do cap´ıtulo, as principais conclusões.

No Cap´ıtulo 5 é feita uma extensão do processo assimétrico, apresentado anterior-mente, para o contexto espa¸co-temporal. São discutidas as propriedades deste modelo, o procedimento de inferência e as diferentes abordagens para realizar previsões no modelo proposto. Um exerc´ıcio com dados gerados artificialmente em diferentes cenários de as-simetria é realizado, bem como um ajuste do modelo a um conjunto de dados referente a temperatura máxima mensal nas regiões sul e sudeste do Brasil.

Por fim, no Cap´ıtulo 6 é realizada uma conclusão geral sobre a tese e são discutidos poss´ıveis trabalhos futuros.

(25)

Cap´ıtulo 2

Modelagem Espa¸

co-Temporal

Diversas áreas da ciência apresentam fenômenos que são indexados no espa¸co e no tempo e tais ´ındices podem ser de extrema importância para a análise destes dados. Com isso, surge a necessidade de entender e modelar estes fenômenos incorporando a informa¸cão da localiza¸cão e do tempo em sua análise. Por exemplo, em estudos de polui¸cão do ar, há interesse não só na natureza espacial da superf´ıcie do poluente, mas também no comportamento desta superf´ıcie ao longo do tempo. É usual que medi¸cões de variáveis de interesse sejam coletadas em diferente locais de monitoramento ao longo de diversos instantes de tempo. A modelagem espa¸co-temporal tem o intuito de modelar fenômenos em que tanto o espa¸co, quanto o tempo são informa¸cões essenciais para o entendimento dos dados.

Neste cap´ıtulo é feita uma revisão de conceitos da modelagem espa¸co-temporal. Na primeira se¸cão é discutida a modelagem de processos espaciais, em particular, na área da geoestat´ıstica que trata de processos que variam continuamente no espa¸co. O processo Gaussiano é apresentado nesta se¸cão e uma alternativa mais flex´ıvel a este processo também é apresentada, que são os processos não Gaussianos. Na segunda se¸cão discute-se a modelagem de processos temporais onde é definido o modelo linear dinâmico e suas principais caracter´ısticas. Na terceira se¸cão é apresentada poss´ıveis generaliza¸cões dos processos discutidos nas se¸cões anteriores para o caso de um processo espa¸co-temporal. São discutidas duas abordagens em que uma considera o tempo como discreto e a outra como cont´ınuo.

(26)

2.1 Modelagem Espacial

Fênomenos em que a localiza¸cão geográfica influi no seu comportamento são bastante frequentes em diversas áreas de estudo como epidemiologia, demografia, meteorologia e estudos de violência, entre outros. Questões como: a distribui¸cão dos casos de doen¸ca formam algum padrão no espa¸co? Como prever a precipita¸cão de chuva numa dada localiza¸cão? São recorrentes e de grande interesse para uma popula¸cão. A estat´ıstica espacial é o conjunto de métodos de análise de fenômenos em que a localiza¸cão geográfica é usada explicitamente na análise. A incorpora¸cão da localiza¸cão na modelagem tem como objetivo descrever ou explicar o comportamento destes fenômenos de forma mais realista. Os dados portanto, representam uma amostra do processo de interesse, a partir dos quais se busca fazer inferência sobre o comportamento do processo.

Segundo Cressie (1993) e Banerjee et al. (2004), os conjuntos de dados espaciais podem ser classificados em trˆes grupos:

• Padrões de pontos: Os pontos localizados no espa¸co em geral não estão asso-ciados a valores, mas apenas à ocorrência dos eventos considerados. Exemplos: localiza¸cão de crimes, ocorrências de doen¸ca. Neste tipo de dado, a posi¸cão dos pontos é dita aleatória e um dos principais interesses é determinar se os pontos observados exibem algum padrão sistemático. Busca-se detectar a existência de padrão de conglomerados espaciais.

• Dados de área: Neste caso, a localiza¸cão dos dados está associada a áreas deli-mitadas decorrentes de uma parti¸cão do espa¸co. Isto ocorre com muita frequência quando são analisados eventos agregados por munic´ıpios, bairros ou setores cen-sitários, onde não se dispõe da localiza¸cão exata dos eventos, mas de um valor por ´

area. Exemplo: n´umero de ´obitos por munic´ıpio.

• Geoestat´ıstica: Supõe que existe uma superf´ıcie cont´ınua subjacente ao processo de interesse. Dados são observados nesta superf´ıcie em um número finito de loca-liza¸cões. Exemplos: medidas de chuva ou temperatura em postos meteorológicos, concentra¸cão de poluentes observada em esta¸cões de monitoramento.

(27)

Este trabalho irá considerar a modelagem de dados de geoestat´ıstica. A seguir, serão discutidos mais detalhes desta área da estat´ıstica espacial. Caracter´ısticas e propriedades da modelagem na geoestat´ıstica serão apresentadas. Para maiores informa¸cões e detalhes veja Cressie (1993) e Banerjee et al. (2004).

2.1.1 Geoestat´ıstica

A Geoestat´ıstica é uma área da estat´ıstica espacial em que os dados são constitu´ıdos de um número finito de medi¸cões relacionadas a um fenômeno subjacente espacialmente cont´ınuo. Por exemplo, considere um conjunto de medidas de um determinado poluente coletadas em uma hora em esta¸cões meteorológicas de uma certa cidade. O fenômeno subjacente é dado pelo conjunto de medidas do poluente em toda a área da cidade. Considera-se que o fênomeno subjacente é uma realiza¸cão de um processo estocástico no espa¸co e a amostra é formada por medi¸cões feitas em alguns pontos da superf´ıcie.

Na geoestat´ıstica, o processo estocástico no espa¸co é definido por {Z(s) : s ∈ D} em que D ´_{e um subconjunto do R}p com volume p-dimensional positivo (Cressie, 1993), ou seja, s varia continuamente ao longo da região D e representa as localiza¸cões espaciais. Especificada a região D, o processo será denotado somente por Z(·). Na prática, o que se observa é uma realiza¸cão parcial deste processo.

Um dos objetivos da análise de dados espaciais é a identifica¸cão das varia¸cões de pri-meira ordem ou de grande escala, e as varia¸cões de segunda ordem ou pequena escala. A varia¸cão de primeira ordem é definida pela média do processo espacial, E[Z(s)], também chamada de tendência do processo. A varia¸cão de segunda ordem é representada pelas dependências entre as diferentes localiza¸cões, isto é, Cov[Z(s1), Z(s2)] para s1, s2 ∈ D.

Conceitos como estacionariedade e isotropia estão diretamente ligados a especifica¸cão destas varia¸cões.

Assuma que a média, E[Z(s)], e a variância, V ar[Z(s)] = Cov[Z(s), Z(s)] , do pro-cesso existam para todo s. Existem três diferentes tipos de estacionariedade, que são definidas a seguir.

(28)

es-tacion´ario se para todo n ∈ {1, 2, . . . }, todo conjunto finito de pontos {s1, s2, . . . , sn} ⊂

D e qualquer h ∈ Rp_{, a distribui¸c˜}_{ao de (Z(s}

1), . . . , Z(sn)) ´e a mesma de (Z(s1 +

h), . . . , Z(sn+ h)). A estacionariedade estrita significa que as respectivas distribui¸c˜oes

finito dimensionais são invariantes à transla¸cão.

Defini¸cão 2 (Processo estacionário de segunda ordem (ou fracamente estaciónário): Um processo Z(s) é estacionário de segunda ordem se E[Z(s)] = µ, ou seja, a média é cons-tante, e Cov[Z(s), Z(s + h)] = C(h) para todo h ∈ Rp e s, s + h ∈ D. A fun¸cão de covariância, C(·), só depende do vetor de separa¸cão h. Esta fun¸cão também é chamada de covariograma. Estacionariedade estrita implica em estacionariedade de segunda or-dem, mas a rec´ıproca não é necessariamente verdadeira.

Defini¸cão 3 (Processo intrinsecamente estacionário): Um processo Z(s) é intrinseca-mente estacionário se

E[Z(s + h) − Z(s)] = 0 e V ar[Z(s + h) − Z(s)] = 2γ(h),

para todo s, s + h ∈ D. A quantidade 2γ(h) é conhecida como variograma e possui um papel importante na geoestat´ıstica pois descreve a estrutura de covariância, ou seja, a dependência espacial. A quantidade γ(h) é conhecida como semivariograma. Algumas propriedades do semivariograma são:

• γ(−h) = γ(h); • γ(0) = 0;

• Se limh→0γ(h) = c0 6= 0, ent˜ao c0 ´e chamado de efeito pepita.

O efeito pepita representa uma varia¸c˜ao de microescala ou erro de medida. O variograma de um processo intrinsecamente estacion´ario pode ser escrito como:

2γ(h) = 2C(0) − 2C(h).

Se C(h) → 0 quando h → ∞, então 2γ(h) → 2C(0) em que C(0) é conhecido como patamar do variograma. Existe também, outro parâmetro de dependência espacial

(29)

conhecido como alcance. Ele representa a distˆancia a partir da qual a correla¸c˜ao espacial ´

e pr´oxima de zero.

Além da estacionariedade, uma importante propriedade dos processos espaciais é a isotropia. Um processo estacionário é isotrópico se Cov[Z(s), Z(s + h)] = C(||h||), isto ´

e, a covariância depende apenas da distância entre as localiza¸cões onde ||h|| representa a distância euclidiana entre os vetores s e s + h. Com isso, a fun¸cão de covariância é invariante à rota¸cões. Caso contrário, o processo é chamado de anisotrópico. Processos intrinsecamente estacionários e isotrópicos são chamados de homogêneos (Smith, 1996). Se uma dessas condi¸cões não se aplica, o processo é heterogêneo.

Através da fun¸cão de covariância pode ser definida a fun¸cão de correla¸cão, ou cor-relograma, do processo espacial. Se C(0) > 0, então a fun¸cão de correla¸cão é definida por: ρ(h) = C(h)_C(0) e C(0) = V ar[Z(s)] se Z(s) é um processo estacionário de segunda ordem.

Quando um processo é homogêneo, sua variância é constante ao longo de D, isto é V ar[Z(s)] = σ2 para todo s ∈ D. Portanto, a fun¸cão de covariância de Z(s) pode ser escrita como

Cov[Z(s1), Z(s2)] = C(s1, s2) = σ2ρ(||s1− s2||; θ), s1, s2 ∈ D,

onde ρ(·; θ) é uma fun¸cão de correla¸cão positiva definida e depende de um vetor pa-ramétrico θ. Seja ||s1− s2|| a distância euclidiana entre s1 e s2. Este é um dos grandes

atrativos para os processos homogêneos, pois dada a fun¸cão ρ(·; θ), a estrutura de co-variância do processo pode ser modelada apenas através dos parâmetros σ2 _{e θ.}

Em geral, na modelagem de dados geoestat´ısticos, assume-se que o processo espacial de interesse Z(·) segue um Processo Gaussiano, que ´e definido a seguir.

Defini¸cão 4 (Processo Gaussiano): Um vetor aleatório Z(·) segue um Processo Gaussi-ano (PG) com média µ(·) e fun¸cão de covariância C(·, ·) denotado por Z ∼ P G(µ, C), se para qualquer conjunto finito de pontos {s1, . . . , sn} ∈ D, e qualquer n = 1, 2, . . . , a

distribui¸cão conjunta de (Z(s1), . . . , Z(sn)) é uma distribui¸cão normal multivariada com

(30)

Em outras palavras, um processo é Gaussiano se qualquer distribui¸cão finito dimensi-onal for normal multivariada. Como a distribui¸cão normal multivariada é completamente determinada por seu vetor de média e por sua matriz de covariância, tudo o que é ne-cessário saber para especificar completamente um Processo Gaussiano é sua média e sua fun¸cão de covariância.

A especifica¸cão da fun¸cão de covariância é de extrema importância pois, em processos Gaussianos, sua suavidade está diretamente relacionada à diferenciabilidade da sua es-trutura de covariância. Algumas das principais classes de fun¸cões de covariância usadas na literatura são:

1 - Fam´ılia exponencial potência: A fun¸cão de covariância é dada por C(h) = σ2exp − h a κ ,

em que h ´e a distˆancia euclidiana entre dois pontos quaisquer em D. σ2 _{> 0 ´}_{e a variˆ}_ancia

do processo, a > 0 é o parâmetro de escala e κ ∈ (0, 2]. Quando κ = 1 obtem-se o caso particular da fun¸cão de covariância exponencial e κ = 2 corresponde à fun¸cão exponencial potência quadrática. Esta fam´ılia de fun¸cões tem uma expressão paramétrica simples e ´

e fácil de ser interpretada. No entanto, note que quando h → ∞ a covariância nunca alcan¸ca zero. Portanto, o alcance não pode ser obtido exatamente. Nesta situa¸cão, a ideia do alcance efetivo é usada, isto é, o alcance é definido pelo h no qual a correla¸cão é aproximadamente 0,05. No caso da fun¸cão de correla¸cão exponencial h ≈ 3a é o alcance efetivo.

Esta classe é frequentemente usada em aplica¸cões, embora sua forma simples implique em propriedades teóricas muito restritivas, que não são realistas na prática. Na classe de fun¸cões exponencial potência quadrática, a fun¸cão de covariância é infinitamente dife-renciável tornando os processos muito suaves, que pode ser uma hipótese pouco realista para problemas ambientais.

2 - Fam´ılia Matérn: A fun¸cão de covariância é dada por C(h) = σ2 1 2κ−1_Γ(κ) h λ κ Kκ h λ ,

(31)

em que h é a distância euclidiana, σ2 > 0 é a variância do processo, λ > 0 é o parâmetro de escala, que indica o quão rápido a correla¸cão decai com h, κ > 0 é o parâmetro de forma, controla a suavidade do processo espacial. Quanto maior o valor de κ mais suave será o processo. A fun¸cão Γ(·) é a fun¸cão gama e Kκ(·) é a fun¸cão modificada de Bessel

do terceiro tipo de ordem κ.

Esta classe é interessante por abranger diferentes comportamentos do processo e pela interpreta¸cão dos parâmetros. A fun¸cão de correla¸cão exponencial é obtida quando κ = 1/2. E quando κ → ∞ obtém-se a fun¸cão de correla¸cão exponencial potência quadrática. O uso desta classe é de especial interesse nos casos em que o pesquisador acredita que os dados poderão informar sobre o parâmetro κ, pois assim não será necessário fixar a suavidade antes de observar os dados.

3 - Fam´ılia Cauchy A fun¸cão de covariância é dada por

C(h) = σ2

1 + h λ

κ−α/κ

em que h ´e a distˆancia euclidiana, σ2 _{> 0 ´}_{e a variˆ}_{ancia do processo, λ > 0 ´}_{e o parˆ}_ametro

de escala, responsável pelo decaimento da fun¸cão, α > 0 é o parâmetro responsável pela dependência de longo alcance, κ ∈ (0, 2] é o parâmetro de forma.

Esta classe é bastante flex´ıvel, pois permite a modelagem de dependência de longo alcance e também correla¸cões com defasagens curtas e intermediárias. Se α ∈ (0, 1), então o processo é dito ter memória longa. Mais informa¸cões sobre esta classe pode ser vista em Gneiting (2000) e Gneiting e Schlather (2004).

Na geoestat´ıstica, os dados observados são considerados uma realiza¸cão parcial de um processo estocástico que varia continuamente no espa¸co. Usualmente, assume-se que este processo é um processo Gaussiano e esta suposi¸cão facilita a previsão de dados para localiza¸cões não medidas devido as propriedades de parti¸cão da distribui¸cão normal mul-tivariada. No entanto, frequentemente distribui¸cões de dados reais apresentam desvios quanto a suposi¸cão de normalidade tais como caudas mais pesadas ou comportamento as-simétrico. Neste cenário, processos Gaussianos podem não ser apropriados para explicar o comportamento do processo de interesse.

(32)

2.1.2 Processos n˜

ao Gaussianos

V´arias propostas foram feitas na literatura para solucionar este problema. Por exem-plo, De Oliveira et al. (1997) desenvolveram um modelo bayesiano em que a normalidade ´

e suposta para uma transforma¸cão dos dados. Os autores se basearam na fam´ılia Box-Cox de transforma¸cões. Diggle et al. (1998) propuseram um modelo espacial linear genera-lizado para aumentar a classe de distribui¸cões de modelos espaciais. Higdon (2002) usa convolu¸cões de processos com fun¸cões suavizadoras. Gelfand et al. (2005) e Reich e Fu-entes (2007) usam abordagem não paramétrica para introduzir um comportamento mais flex´ıvel no modelo.

Outro exemplo de modelos não Gaussianos foi apresentado por Palacios e Steel (2006). Neste artigo, os autores propõem um processo espacial que apresenta caudas mais pesadas que a da distribui¸cão Gaussiana. Tal processo é obtido através de uma mistura de escala em que é introduzida uma variável latente que permite que o processo seja mais flex´ıvel, acomodando uma poss´ıvel heterocedasticidade espacial.

O processo n˜ao Gaussiano proposto por Palacios e Steel (2006) foi denominado como processo Gaussiano-Log-Gaussiano (GLG) e ´e definido por:

Z(si) = x0iβ + σ

(si)

pλ(si)

+ τ v(si), (2.1)

em que si representa uma localiza¸c˜ao da regi˜ao espacial D ⊂ Rp e i = 1, . . . , n; x0i =

(x1i, . . . , xki) representa um vetor com k covari´aveis espaciais referentes a localiza¸c˜ao

si e β é o vetor dos respectivos coeficientes da regressão; x0iβ é a superf´ıcie média do

processo Z(si); v(si) ∼ N (0, 1) ´e um ru´ıdo branco, ou seja, ´e independente e

identica-mente distribu´ıdo para todo i e independente de = ((s1), . . . , (sn))0 ∼ P G(0, Cθ);

Cθ é uma fun¸cão de correla¸cão parametrizada pelo vetor θ; τ2 é o efeito pepita, que representa um erro de medida. O vetor Z = (Z(s1), . . . , Z(sn))0 condicional a

compo-nente λ = (λ(s1), . . . , λ(sn))0 possui distribui¸c˜ao normal multivariada com m´edia Xβ

e matriz de covariˆancia dada por σ2_(Λ−1/2

CθΛ−1/2) + τ2_I

n, onde X = (x1, . . . , xk)0,

β = (β1, . . . , βk)0, Λ = Diag(λ(s1), . . . , λ(sn)) e In´e uma matriz identidade de dimens˜ao

n.

(33)

por inflacionar a variˆancia do processo Z(si). A componente λ(si) faz com que cada

localiza¸cão possua uma variância diferente, tornando o processo espacial heterocedástico. Assume-se que λ(si) é independente de (si) e v(si). Para a modelagem do vetor ln(λ) =

[ln(λ(s1)), . . . , ln(λ(sn))]0, assume-se, ln(λ) ∼ Nn −ν 21, νCθ , (2.2)

em que 1 é um vetor de dimensão n composto por um. Portanto, atribui-se a ln(λ) um processo Gaussiano com uma superf´ıcie de média constante, −ν₂, e uma fun¸cão de covariˆ_{ancia νCθ. Note que é usada a mesma fun¸cão de correla¸cão da componente .} O parâmetro ν > 0 é introduzido em (2.2) e pode-se observar que E[λ(si)] = 1 e a

V ar[λ(si)] = exp(ν) − 1. Assim, quando ν assume valores pequenos a distribui¸c˜ao

mar-ginal de λ(si) ser´a concentrada no valor 1 e quando ν aumenta, a distribui¸c˜ao se torna

menos concentrada e mais assimétrica à direita, enquanto que a moda se desloca para zero. Por exemplo, para ν = 3, a variância é 19,1 e existe uma massa de densidade próximo de zero. Valores de λ(si) próximos de zero irão inflacionar a escala do modelo

definido em (2.1) e permitir que valores at´ıpicos sejam acomodados.

A seguir ser´a discutido a modelagem de dados com dependˆencia temporal.

2.2 Modelagem Temporal

Frequentemente existe um interesse em descrever fenômenos que variam ao longo do tempo. Tal descri¸cão pode ser feita através de modelos que incorporam a estrutura tem-poral inerente ao fenômeno. Na literatura, o vetor que representa as observa¸cões, neste contexto, é conhecido por série temporal. Um dos principais objetivos de uma análise de séries temporais é o entendimento do mecanismo de gera¸cão dessas variáveis e a previsão para tempos futuros. Existem diversas formas de abordar a modelagem de observa¸cões com essas caracter´ısticas. Harrison e Stevens (1976) propuseram o uso de uma ampla classe de modelos para tratar séries temporais, denominada modelos dinâmicos.

Os modelos dinâmicos também conhecidos como modelos de espa¸co de estados, são formulados para permitir altera¸cões nos valores dos parâmetros com o passar do tempo.

(34)

Tal caracter´ıstica torna esta classe de modelos uma classe de grande versatilidade e utiliza¸c˜ao.

Os modelos dinâmicos são constitu´ıdos por dois processos: o processo dos estados não observáveis e o processo observacional. Com a evolu¸cão do tempo, toda a informa¸cão relevante para prever o futuro é recebida e pode ser usada na revisão do modelo. Suponha que o tempo inicial seja t = 0 e que D0 represente a informa¸cão relevante e dispon´ıvel

sobre o modelo até o tempo t = 0. Esta informa¸cão será usada pelo pesquisador para fazer as previsões iniciais do futuro. De forma similar, suponha que para qualquer tempo t > 0, a informa¸cão dispon´ıvel e relevante seja denotada por Dt. Qualquer afirma¸cão

sobre o futuro ser´a condicionada nesta informa¸c˜ao.

Uma subclasse dos modelos dinâmicos bastante disseminada na literatura são os mo-delos linerares dinâmicos (MLD), em que é suposto normalidade para a variável resposta e para a evolu¸cão dos estados através do tempo. A seguir será apresentada de maneira resumida esta subclasse de modelos, para uma leitura mais detalhada sobre o assunto, veja West e Harrison (1997).

2.2.1 Modelos lineares dinˆ

amicos

Suponha Yt representando um vetor coluna de n observa¸c˜oes no instante de tempo

t, com t = 1, 2, . . . , T . O modelo ´e definido pela qu´adrupla {Ft, Gt, Vt, Wt} para cada

tempo t tal que

Yt = F0tθt+ vt, vt ∼ N (0, Vt) (2.3)

θt = Gtθt−1+ wt, wt∼ N (0, Wt). (2.4)

Este modelo é chamado de linear pela rela¸cão entre o vetor das observa¸cões e a matriz Ft. Tal matriz é a matriz de regressão dinâmica de dimensão r × n que pode conter

variáveis explicativas, componentes de n´ıvel, tendência, sazonalidade, entre outros. As componentes desta matriz podem variar ou não com o tempo. Gté a matriz de evolu¸cão

do vetor de estados com dimensão r × r, esta matriz controla a parte determin´ıstica da evolu¸cão ao longo do tempo. A equa¸cão (2.3) é chamada equa¸cão de observa¸cão e descreve a evolu¸cão estocástica da variável resposta. Nesta equa¸cão, vtrepresenta uma sequência

(35)

de erros independentes que segue uma estrutura Gaussiana com vetor de médias zero e matriz de covariância Vt de dimensão n × n. A equa¸cão (2.4), denominada de equa¸cão

do sistema ou de evolu¸c˜ao, descreve a evolu¸c˜ao dos estados ao longo do tempo onde wt

´

e uma sequência de erros independentes também com estrutura Gaussiana com vetor de médias zero e matriz de covariância Wt. As sequências de erros vte wt são mutuamente

independentes. Para cada tempo t o vetor de estados, θt, tem dimens˜ao r × 1.

Quando as matrizes {Ft, Gt, Vt, Wt} s˜ao conhecidas, o procedimento de inferˆencia

sobre os estados nesta subclasse de modelos pode ser feito atrav´es de algoritmos sequen-ciais, como por exemplo, o Filtro de Kalman.

Filtro de Kalman

O filtro de Kalman, desenvolvido por Kalman (1960), fornece a distribui¸c˜ao condi-cional de θt, dada a informa¸c˜ao dispon´ıvel Dt, de uma maneira computacionalmente

eficiente. As equa¸cões do filtro de Kalman são obtidas utilizando o aspecto sequencial da inferência bayesiana. Inicialmente supõe-se que a distribui¸cão a priori inicial em t = 0 é uma distribui¸cão normal multivariada, θ0|D0 ∼ N (m0, C0), para algum vetor de médias

m0 e matriz de covariˆancias C0, conhecidas. Assim, para cada tempo t, as distribui¸c˜oes

a priori, preditiva e a posteriori são atualizadas utilizando as seguintes equa¸cões: 1. Distribui¸cão a posteriori em t − 1:

(θt−1|Dt−1) ∼ N (mt−1, Ct−1).

2. Distribui¸c˜ao a priori em t:

(θt|Dt−1) ∼ N (at, Rt),

em que at = Gtmt−1 e Rt= GtCt−1G0t+ Wt.

3. Previs˜ao um passo a frente:

(Yt|Dt−1) ∼ N (ft, Qt),

em que f_t= F0_tat e Qt = F 0

(36)

4. Distribui¸c˜ao a posteriori em t:

(θt|Dt) ∼ N (mt, Ct),

onde mt = at+ Atet e Ct = Rt− AtQtA 0

t, sendo At = RtFtQ−1t e et= Yt− ft.

As provas destes resultados podem ser vistas em West e Harrison (1997). Quando as matrizes {Ft, Gt, Vt, Wt} não são conhecidas não é poss´ıvel utilizar somente o Filtro

de Kalman para realizar a inferência sobre os parâmetros. Com isso, a inferência pode ser feita através de métodos numéricos como, por exemplo, os métodos de Monte Carlo via Cadeias de Markov (MCMC). Desta forma, para a amostragem de cada parâmetro, é necessário encontrar a sua distribui¸cão condicional completa a posteriori. Para amostrar o vetor de estados pode-se obter esta distribui¸cão pelo algoritmo FFBS (Forward Filtering Backward Sampler).

Algoritmo FFBS

O algoritmo FFBS foi um dos primeiros métodos de MCMC desenvolvidos para mo-delos dinâmicos, proposto simultaneamente por Frühwirth-Schnatter (1994) e Carter e Kohn (1994). A ideia do método é amostrar todos os elementos do vetor de estados em um passo de amostragem múltipla. Em um modelo linear dinâmico, o passo Forward Filtering consiste em calcular sequencialmente o primeiro e segundo momentos da dis-tribu¸cão a posteriori do parâmetro de estado θt, para t = 1, 2, . . . , T . Estes momentos são

encontrados através do Filtro de Kalman. Neste caso, a distribui¸cão condicional completa a posteriori de θt é exatamente conhecida. Especificamente, θt segue uma distribui¸cão

Normal. O passo Backward Sampling do algoritmo FFBS é baseado na decomposi¸cão da distribui¸cão a posteriori conjunta dos parâmetros de estado na forma

p(θ1, . . . , θT|DT) = p(θT|DT) T −1

Y

t=1

p(θt|θt+1, Dt).

Pelo teorema de Bayes, para t = T − 1, . . . , 1, pode ser mostrado que p(θt|θt+1, Dt) ∝ p(θt+1|θt, Dt)p(θt|Dt),

(37)

em que θt|θt+1, Dt segue uma distribui¸c˜ao Normal com m´edia

m∗_t = mt+ CtG0t+1(Gt+1CtG0t+1+ Wt+1)−1(θt+1− Gt+1mt)

e variˆancia

C∗_t = Ct− CtG0t+1(Gt+1CtG0t+1+ Wt+1)−1Gt+1Ct,

em que mte Cts˜ao o primeiro e segundo momentos obtidos atrav´es do Filtro de Kalman.

Para o tempo T , tem-se que m∗_t = mt e C∗t = Ct.

A matriz de covariância dos erros da equa¸cão de sistema Wté dif´ıcil de ser estimada

na prática. Por isto, um método usual descrito na literatura é o uso de fator de desconto que será definido a seguir.

Fator de desconto

Analisando as equa¸c˜oes do filtro de Kalman, nota-se que a componente Wt reflete

o aumento na incerteza quando se evolui de p(θt−1|Dt−1) para p(θt|Dt−1). No caso,

Wt pode ser vista como a perda de informa¸c˜ao ao se passar do tempo presente para o

instante futuro. Esta perda de informa¸cão é expressa pelo aumento da variância, pois quanto maior for esta, mais incerteza se terá sobre a quantidade que se quer inferir. Seja Pt= V ar(Gtθt−1|Dt−1), então, tem-se que a variância de θt−1|Dt−1é dada por

V ar(θt−1|Dt−1) = Rt = Pt+ Wt.

Quando Wt = 0, não há evolu¸cão do parâmetro e, consequentemente, não se perde

informa¸cão de um instante para outro. É razoável pensar que Wt seja uma quantidade

que ocasione um aumento de Pt para Rt, ou seja, pode-se considerar que

Rt = Pt/δ = GtCt−1G0t/δ,

onde δ ∈ (0, 1] e ´e denominado fator de desconto.

O fator de desconto, δ, é uma corre¸cão que inflaciona a variância devido à dinâmica dos parâmetros. Ele representa a quantidade de informa¸cão que se mantém ao se evoluir de um instante do tempo para outro. Se, por exemplo, δ = 0, 9, então haveria uma perda de 10% da informa¸cão ao se avan¸car no tempo. Se δ = 1, então o modelo considera que

(38)

não houve evolu¸cão nos parâmetros. A considera¸cão do fator de desconto simplifica o problema de estima¸cão e vem-se mostrando uma alternativa bastante eficaz em problemas práticos. Mais referências sobre o fator de desconto podem ser encontradas em West e Harrison (1997).

Até agora foi discutido separadamente os processos espaciais e os processos temporais. Na se¸cão a seguir será discutida a extensão dos mesmos em uma modelagem espa¸co-temporal.

2.3 Modelagem Espa¸

co-Temporal

O aprendizado sobre a modelagem de fenômenos espa¸co-temporais se tornou extre-mamente importante, devido ao aumento dos conjuntos de dados que são indexados pelo espa¸co e pelo tempo e a grande necessidade de entendê-los. Os modelos para fenômenos desta natureza podem ser aplicados a conjuntos de dados coletados em diferentes loca-liza¸cões associadas a um ponto ou região do espa¸co e observados em diversos per´ıodos de tempo.

Do ponto de vista metodológico, a considera¸cão de uma estrutura temporal e espacial em um modelo levanta questionamentos sobre como deve ser incorporada a correla¸cão espacial, a correla¸cão temporal e como o espa¸co e o tempo devem interagir nos fenômenos estudados. Considerando que os dados estudados nesta tese apresentam as caracter´ısticas relacionadas à área da Geoestat´ıstica, ou seja, dados que variam continuamente no espa¸co, haverá uma discussão de como incorporar a estrutura temporal em processos espaciais.

Sendo assim, olhando para a componente do tempo pode ser feita uma distin¸cão para a sua escala. O tempo pode ser visto como discreto (por exemplo, dados diários, trimes-trais) ou como cont´ınuo (por exemplo, sobre o conjunto dos reais ou algum subintervalo dele). Neste trabalho serão consideradas as duas abordagens. Portanto, a seguir serão descritos, de maneira breve, modelos que consideram estes dois enfoques.

(39)

2.3.1 Tempo discreto

Algumas propostas que classificam o tempo como discreto utilizam a classe de modelos dinâmicos definida na Se¸cão 2.2 para realizar a modelagem espa¸co-temporal. Um exemplo desta abordagem pode ser visto em Huerta et al. (2004) onde é feita uma análise dos n´ıveis de ozônio na cidade do México e em trabalhos mais recentes como Mahmoudian e Mohammadzadeh (2014) que modelam valores extremos para dados de velocidade do vento e Bakar e Kovic (2015) que avaliam os riscos de geada na Austrália.

Seja um processo estoc´astico espa¸co-temporal definido por {Yt(s) : s ∈ D; t ∈ N}

onde t se refere ao instante de tempo e s ´e a localiza¸c˜ao no espa¸co. Banerjee et al. (2004) descrevem um modelo geral da seguinte maneira:

Yt(s) = µt(s) + t(s),

onde µt(s) denota a estrutura de m´edia e t(s) denota o res´ıduo do modelo. Suponha

que um conjunto de dados s˜ao observados em distintas localiza¸c˜oes si, i = 1, . . . , N e

em diferentes instantes de tempo t = 1, . . . , T . Estes dados podem ser alocados em uma matriz, Y , de dimensão T × N , onde cada coluna da matriz representa uma série temporal para a localiza¸cão si e cada linha representa observa¸cões de uma determinada

localiza¸cão geográfica no tempo t. Reescrevendo o modelo para cada linha desta matriz obtém-se:

Yt= µt+ t,

onde Yt representa um vetor de tamanho N referente as observa¸c˜oes das N localiza¸c˜oes

no instante de tempo t. Se uma matriz contendo covari´aveis Ft pode ser associada

ao vetor Yt, a estrutura de m´edia pode ser reescrita como µt = F 0

tθt. Note que esta

forma permite que os coeficientes da regress˜ao, θt, possam variar com o tempo. A

evolu¸cão destes coeficientes pode seguir de acordo com um modelo linear dinâmico visto na Subse¸cão 2.2.1. O vetor t que representa os erros deste modelo, podem seguir uma

distribui¸cão normal em que a matriz de covariância apresente uma estrutura espacial como descrito na Subse¸cão 2.1.1 que discute a modelagem na Geoestat´ıstica.

Portanto, este modelo pode ser visto como uma integra¸cão da modelagem espa-cial na área da Geoestat´ıstica com a modelagem temporal através dos modelos lineares

(40)

dinˆamicos. Tal modelagem se torna muito vers´atil e incorpora tanto a estrutura espacial quanto a estrutura temporal dos dados.

A seguir ser´a discutido a modelagem de processos espa¸co-temporais quando o tempo ´

e considerado variando continuamente.

2.3.2 Tempo cont´ınuo

Neste contexto, a mesma ideia que é usada na geoestat´ıstica discutida na Subse¸cão 2.1.1 se estende para o caso da modelagem de dados espa¸co-temporais. Só que agora o processo estocástico subjacente ao fenômeno varia continuamente no espa¸co e no tempo. Seja um processo estocástico espa¸co-temporal definido por {Z(s, t) : s ∈ D; t ∈ T } onde (s, t) são coordenadas do espa¸co e do tempo que variam continuamente em D × T , D ⊆ Rd_{, T ⊆ R, tipicamente d = 1, 2, ou 3. O processo é Gaussiano quando assume-se}

que a distribui¸c˜ao finito dimensional ´e Gaussiana. Sejam Z(s1, t1), Z(s2, t2), . . . , Z(sI, tJ)

observa¸c˜oes do processo nas localiza¸c˜oes si (i = 1, . . . , I) e nos tempos tj (j = 1, . . . , J ),

ent˜ao Z(s1, t1), Z(s2, t2), . . . , Z(sI, tJ) segue uma distribui¸c˜ao normal multivariada com

vetor de m´edias e matriz de covariˆancia, dadas respectivamente por

m = (m(s1, t1), . . . , m(sI, tJ))0 e Σij = Cov[Z(si, ti), Z(sj, tj)].

A fun¸cão de covariância é o principal elemento da modelagem espa¸co-temporal, pois é através de sua escolha que são definidas as propriedades do processo de interesse. Para a constru¸cão de modelos adequados, é necessário a utiliza¸cão de uma fun¸cão de covariância válida, ou seja, uma fun¸cão positiva definida. Em geral, é bastante dif´ıcil verificar se uma fun¸cão é positiva definida e esta é uma das principais dificuldades na constru¸cão de novas fun¸cões de covariância.

Portanto, é comum que a modelagem de processos espa¸co-temporais utilize hipóteses simplificadoras fazendo com que a dependência entre as observa¸cões, muitas vezes, não seja completamente explorada. Além disso, a inferência é baseada em uma única re-aliza¸cão do processo subjacente, o que também requer hipóteses simplificadoras. Uma possibilidade de garantir que a fun¸cão de covariância seja positiva definida é a suposi¸cão