Predi¸ c˜ ao Bayesiana - Predi¸ c˜ ao Espacial

3.5 Predi¸ c˜ ao Espacial

3.5.2 Predi¸ c˜ ao Bayesiana

Posteriormente à observa¸cão de Y = y, para implementar a distribui¸cão preditiva para um valor não observado Y0 e, segundo Fonseca (2008) [9], pode-se executar do modo:

p(y0|y) =

p(y0, θ|y)dθ =

p(y0|θ, y)p(θ|y)dθ, (3.36)

em que p(y0|θ, y) é a distribui¸cão das medidas não observadas dado as medidas já obser-

vadas e p(θ|y) ´e a distribui¸c˜ao a posteriori de θ

A maior parte das ocorrências não dispõem de uma solu¸cão anal´ıtica da integral acima, por consequência, usa-se táticas de aproxima¸cão. Para qualquer amostra l, l = 1, . . . , L, conquistado no algoritmo de Monte Carlo via cadeias de Markov, que é aprofundado em Gamerman e Lopes (2006) [10], pode-se conseguir uma aproxima¸cão amostrando de p(y0|θ) e computando p(y0|y) ≈ 1 L L X l=1 p(y0|θl). (3.37)

A média amostral de y0 serve como estimativa para a média da distribui¸cão preditiva

de y0|y.

3.6 geoR

O R Project [11] foi criado por Robert Gentleman e Ross Ihaka do Departamento de Estat´ıstica da University of Auckland em 1995, porém, o R conta com a colabora¸cão de voluntários para aperfei¸coamento de suas capacidades. O Software estat´ıstico R é livre, de fácil instala¸cão e com uma linguagem de fácil manuseio, no entanto, é desejável um conhecimento básico prévio em programa¸cão estat´ıstica para uma boa interpreta¸cão das sa´ıdas que o programa retorna. O software conta com uma vasta variedade de técnicas gráficas e estat´ısticas.

Uma importante ferramenta para aplica¸cão de toda a metodologia neste trabalho foram as fun¸cões do pacote geoR [12], criado por Paulo J. Ribeiro Jr e Peter J. Diggle em 2001, apresentando fun¸cões para análise de dados geoestat´ısticos relacionados a modelos Gaussianos e Gaussianos transformados incluindo os métodos frequentista e Bayesiano. O geoR nos permite ler e preparar os dados, realizar análise exploratória dos dados, inferir sobre os parâmetros do modelo baseando-se no variograma ou na verossimilhan¸ca

3.6 geoR 36

e ainda realizar interpola¸cão espacial. Também consegue-se implementar diferentes tipos de krigagem, incluir algoritmos para simula¸cão condicional e utilizar métodos Bayesianos para predi¸cão em localiza¸cões espec´ıficas.

Primeiramente, será necessário alterar o banco de dados para um objeto da classe “geodata”. Tal feito pode ser realizado por intermédio da fun¸cão as.geodata() que transforma uma matriz ou data-frame em uma lista que, obrigatoriamente, terá duas componentes sendo elas os dados e as coordenadas, não sendo permitido valores faltantes nessa última. ´

E preciso que essa transforma¸cão seja feita para facilitar a aplica¸cão das análises geoestat´ısticas utilizando o geoR porém, essa conversão não é obrigatória. Além disso, um objeto da classe “geodata”também pode conter componentes opcionais como um vetor ou uma matriz de covariáveis.

A fun¸cão summary() para um objeto da classe “geodata”traz uma lista com medidas resumo, sendo elas: número de observa¸cões - que nesse caso seriam o número total de esta¸cões que apresentam dados, m´ınimo e máximo das coordenadas - longitude e latitude, m´ınimo e máximo das distâncias entre esta¸cões e, por fim, um sumário dos dados cont´ınuos - ou melhor Temperaturas Compensadas Médias.

Para realizar análise exploratória, a fun¸cão plot() para objetos da classe “geodata”devolve quatro gráficos distintos. Esses quatro gráficos serão: o gráfico dos pontos amostrados em que os valores referentes a cada ponto será dividido pelos quartis, dois gráficos dos dados contra cada coordenada separadamente e um histograma dos dados. Se o argumento “trend”for utilizado para especificar uma tendência linear ou uma tendência quadrática, os gráficos serão gerados automaticamente para os res´ıduos. O argumento “lowess”aplicará uma regressão local suavizadora aos dados. Se o valor de “lambda”for alterado para qualquer que difira de 1, acontecerá uma transforma¸cão Box-Cox.

Ainda na parte de análise exploratória, a fun¸cão points() fornece um gráfico dos locais das esta¸cões em c´ırculos representados proporcionalmente aos valores atribu´ıdos a cada ponto. Podem ser aplicadas diferentes aparta¸cões dos dados em categorias por meio do argumento “pt.divide”. Aqui também pode-se aplicar os argumentos “trend”e “lambda”e as consequências serão as mesmas. Outros argumentos podem ser passados a estas fun¸cões além dos mencionados.

Para calcular o variograma emp´ırico, usa-se a fun¸cão variog(). Com esta fun¸cão, também estimam-se parâmetros de covariância e também comparar o variograma teórico e modelos ajustados com o variograma amostral. A fun¸cão variog() nos permite escolher o tipo de estimador: clássico ou robusto. Além disso, tal fun¸cão pode nos retornar a nuvem

3.6 geoR 37

de variograma, o variograma suavizado ou simplesmente o variograma amostral. Com esta fun¸cão, tendência podem ser especificadas e serão ajustadas por m´ınimos quadrados ordinários no caso do variograma ser computado usando os res´ıduos. Os estimadores implementados são o método dos momentos e o estimador de módulo de Hawkins e Cressie (Hawkins and Cressie’s modulus estimator). A sa´ıda desta fun¸cão será uma lista com diversas informa¸cões como vetor com as distâncias entre os pontos, número de pares para cada trecho de distância, limites que definem cada um desses trechos, entre outras coisas. A fun¸cão likfit() estimará os parâmetros de modelos Gaussianos para campos aleatórios por meio da máxima verossimilhan¸ca ou da máxima verossimilhan¸ca restrita. Em geral, é utilizada a fun¸cão optim() para minimizar a log-verossimilhan¸ca negativa encontrada pela fun¸cão negloglik.GRF(). No entanto, se os parâmetros do efeito pepita, anisotropia, suavidade e transforma¸cão permanecerem fixos, a minimiza¸cão poderá ser reduzida para uma dimensão e então a fun¸cão optimize() substituirá a fun¸cão optim().

Já que os valores dos parâmetros são achados por otimiza¸cão numérica pela fun¸cão optim(), em algumas circunstâncias o algoritmo pode não convergir para os valores corre- tos dos parâmetros quando usadas as op¸cões default. O usuário deverá tentar diferentes valores iniciais e se os parâmetros tiverem diferentes ordens de magnitude, será necessário dimensionar esses parâmetros. Existem solu¸cões alternativas à essas apresentadas ante- riormente como redimensionar os dados dividindo-os por uma constante, redimensionar as coordenadas ou usar o mecanismo de passar o argumento control() para o otimizador internamente.

O argumento ini.cov.pars aceita objetos das classes “eyefit”ou “variomodel”e isso permite o uso das sa´ıdas das fun¸cões eyefit(), variofit() ou likfit() para ser usada como valor inicial. O argumento realisations assume independentes replica¸cões do mesmo processo do conjunto de dados. Dados coletados em diversos tempos podem ser agrupados para a estima¸cão dos parâmetros assumindo independência quanto ao tempo.

O resumo da fun¸cão likfit() também será uma lista contendo, por exemplo, nome da fun¸cão de correla¸cão, vetor com as estimativas dos parâmetros σ2 _{e φ e estimativa da}

m´edia do parˆametro β.

Para realizar a predi¸cão espacial, será definida uma grade de pontos. A fun¸cão que realizará a krigagem tem como default a krigagem ordinária.

A fun¸cão krige.bayes() faz uma interpreta¸cão Bayesiana dos dados geoestat´ısticos deixando peculiarizar distintos graus de incerteza para os parâmetros do modelo. A fun¸cão

3.6 geoR 38

torna os efeitos da distribui¸cão a posteriori dos parâmetros do modelo, como também as distribui¸cões preditivas para os locais de previsão. Esta fun¸cão depende de outras duas e são elas: model.control() e prior.control().

A fun¸cão model.control() é exercida para classificar a tendência dos pontos amostrados, indicar a fun¸cão de correla¸cão a ser utilizada e ainda se é necessária a realiza¸cão da corre¸cão de anisotropia. A fun¸cão prior.control() define as prioris a serem utilizadas para os parâmetros β, σ2, φ e ν2.

A sa´ıda da fun¸cão krige.bayes() é composta pelo efeito da distribui¸cão a posteriori dos parâmetros do modelo. Se for realizada a krigagem, a fun¸cão também retornará a resultância da distribui¸cão preditiva para os locais que era desejável suceder previsão.

4 Resultados

Este cap´ıtulo será destinado à apresenta¸cão da base de dados que será trabalhada e os resultados obtidos por meio de análises da estat´ıstica espacial. A pesquisa será dividida nas esta¸cões do ano de verão e inverno e, portanto, ostentado dessa maneira.

No documento Um modelo para dados geoestatísticos: uma aplicação na temperatura das Regiões Sul e Sudeste do Brasil (páginas 37-41)