• Nenhum resultado encontrado

3.5 Predi¸ c˜ ao Espacial

3.5.2 Predi¸ c˜ ao Bayesiana

Posteriormente `a observa¸c˜ao de Y = y, para implementar a distribui¸c˜ao preditiva para um valor n˜ao observado Y0 e, segundo Fonseca (2008) [9], pode-se executar do modo:

p(y0|y) =

Z

p(y0, θ|y)dθ =

Z

p(y0|θ, y)p(θ|y)dθ, (3.36)

em que p(y0|θ, y) ´e a distribui¸c˜ao das medidas n˜ao observadas dado as medidas j´a obser-

vadas e p(θ|y) ´e a distribui¸c˜ao a posteriori de θ

A maior parte das ocorrˆencias n˜ao disp˜oem de uma solu¸c˜ao anal´ıtica da integral acima, por consequˆencia, usa-se t´aticas de aproxima¸c˜ao. Para qualquer amostra l, l = 1, . . . , L, conquistado no algoritmo de Monte Carlo via cadeias de Markov, que ´e aprofundado em Gamerman e Lopes (2006) [10], pode-se conseguir uma aproxima¸c˜ao amostrando de p(y0|θ) e computando p(y0|y) ≈ 1 L L X l=1 p(y0|θl). (3.37)

A m´edia amostral de y0 serve como estimativa para a m´edia da distribui¸c˜ao preditiva

de y0|y.

3.6

geoR

O R Project [11] foi criado por Robert Gentleman e Ross Ihaka do Departamento de Estat´ıstica da University of Auckland em 1995, por´em, o R conta com a colabora¸c˜ao de volunt´arios para aperfei¸coamento de suas capacidades. O Software estat´ıstico R ´e livre, de f´acil instala¸c˜ao e com uma linguagem de f´acil manuseio, no entanto, ´e desej´avel um conhecimento b´asico pr´evio em programa¸c˜ao estat´ıstica para uma boa interpreta¸c˜ao das sa´ıdas que o programa retorna. O software conta com uma vasta variedade de t´ecnicas gr´aficas e estat´ısticas.

Uma importante ferramenta para aplica¸c˜ao de toda a metodologia neste trabalho foram as fun¸c˜oes do pacote geoR [12], criado por Paulo J. Ribeiro Jr e Peter J. Diggle em 2001, apresentando fun¸c˜oes para an´alise de dados geoestat´ısticos relacionados a modelos Gaussianos e Gaussianos transformados incluindo os m´etodos frequentista e Bayesiano. O geoR nos permite ler e preparar os dados, realizar an´alise explorat´oria dos dados, inferir sobre os parˆametros do modelo baseando-se no variograma ou na verossimilhan¸ca

3.6 geoR 36

e ainda realizar interpola¸c˜ao espacial. Tamb´em consegue-se implementar diferentes tipos de krigagem, incluir algoritmos para simula¸c˜ao condicional e utilizar m´etodos Bayesianos para predi¸c˜ao em localiza¸c˜oes espec´ıficas.

Primeiramente, ser´a necess´ario alterar o banco de dados para um objeto da classe “ge- odata”. Tal feito pode ser realizado por interm´edio da fun¸c˜ao as.geodata() que transforma uma matriz ou data-frame em uma lista que, obrigatoriamente, ter´a duas componentes sendo elas os dados e as coordenadas, n˜ao sendo permitido valores faltantes nessa ´ultima. ´

E preciso que essa transforma¸c˜ao seja feita para facilitar a aplica¸c˜ao das an´alises geo- estat´ısticas utilizando o geoR por´em, essa convers˜ao n˜ao ´e obrigat´oria. Al´em disso, um objeto da classe “geodata”tamb´em pode conter componentes opcionais como um vetor ou uma matriz de covari´aveis.

A fun¸c˜ao summary() para um objeto da classe “geodata”traz uma lista com medidas resumo, sendo elas: n´umero de observa¸c˜oes - que nesse caso seriam o n´umero total de esta¸c˜oes que apresentam dados, m´ınimo e m´aximo das coordenadas - longitude e latitude, m´ınimo e m´aximo das distˆancias entre esta¸c˜oes e, por fim, um sum´ario dos dados cont´ınuos - ou melhor Temperaturas Compensadas M´edias.

Para realizar an´alise explorat´oria, a fun¸c˜ao plot() para objetos da classe “geodata”devolve quatro gr´aficos distintos. Esses quatro gr´aficos ser˜ao: o gr´afico dos pontos amostrados em que os valores referentes a cada ponto ser´a dividido pelos quartis, dois gr´aficos dos da- dos contra cada coordenada separadamente e um histograma dos dados. Se o argumento “trend”for utilizado para especificar uma tendˆencia linear ou uma tendˆencia quadr´atica, os gr´aficos ser˜ao gerados automaticamente para os res´ıduos. O argumento “lowess”aplicar´a uma regress˜ao local suavizadora aos dados. Se o valor de “lambda”for alterado para qualquer que difira de 1, acontecer´a uma transforma¸c˜ao Box-Cox.

Ainda na parte de an´alise explorat´oria, a fun¸c˜ao points() fornece um gr´afico dos locais das esta¸c˜oes em c´ırculos representados proporcionalmente aos valores atribu´ıdos a cada ponto. Podem ser aplicadas diferentes aparta¸c˜oes dos dados em categorias por meio do argumento “pt.divide”. Aqui tamb´em pode-se aplicar os argumentos “trend”e “lambda”e as consequˆencias ser˜ao as mesmas. Outros argumentos podem ser passados a estas fun¸c˜oes al´em dos mencionados.

Para calcular o variograma emp´ırico, usa-se a fun¸c˜ao variog(). Com esta fun¸c˜ao, tamb´em estimam-se parˆametros de covariˆancia e tamb´em comparar o variograma te´orico e modelos ajustados com o variograma amostral. A fun¸c˜ao variog() nos permite escolher o tipo de estimador: cl´assico ou robusto. Al´em disso, tal fun¸c˜ao pode nos retornar a nuvem

3.6 geoR 37

de variograma, o variograma suavizado ou simplesmente o variograma amostral. Com esta fun¸c˜ao, tendˆencia podem ser especificadas e ser˜ao ajustadas por m´ınimos quadrados ordin´arios no caso do variograma ser computado usando os res´ıduos. Os estimadores implementados s˜ao o m´etodo dos momentos e o estimador de m´odulo de Hawkins e Cressie (Hawkins and Cressie’s modulus estimator). A sa´ıda desta fun¸c˜ao ser´a uma lista com diversas informa¸c˜oes como vetor com as distˆancias entre os pontos, n´umero de pares para cada trecho de distˆancia, limites que definem cada um desses trechos, entre outras coisas. A fun¸c˜ao likfit() estimar´a os parˆametros de modelos Gaussianos para campos aleat´orios por meio da m´axima verossimilhan¸ca ou da m´axima verossimilhan¸ca restrita. Em geral, ´e utilizada a fun¸c˜ao optim() para minimizar a log-verossimilhan¸ca negativa encontrada pela fun¸c˜ao negloglik.GRF(). No entanto, se os parˆametros do efeito pepita, anisotropia, suavidade e transforma¸c˜ao permanecerem fixos, a minimiza¸c˜ao poder´a ser reduzida para uma dimens˜ao e ent˜ao a fun¸c˜ao optimize() substituir´a a fun¸c˜ao optim().

J´a que os valores dos parˆametros s˜ao achados por otimiza¸c˜ao num´erica pela fun¸c˜ao optim(), em algumas circunstˆancias o algoritmo pode n˜ao convergir para os valores corre- tos dos parˆametros quando usadas as op¸c˜oes default. O usu´ario dever´a tentar diferentes valores iniciais e se os parˆametros tiverem diferentes ordens de magnitude, ser´a necess´ario dimensionar esses parˆametros. Existem solu¸c˜oes alternativas `a essas apresentadas ante- riormente como redimensionar os dados dividindo-os por uma constante, redimensionar as coordenadas ou usar o mecanismo de passar o argumento control() para o otimizador internamente.

O argumento ini.cov.pars aceita objetos das classes “eyefit”ou “variomodel”e isso per- mite o uso das sa´ıdas das fun¸c˜oes eyefit(), variofit() ou likfit() para ser usada como valor inicial. O argumento realisations assume independentes replica¸c˜oes do mesmo processo do conjunto de dados. Dados coletados em diversos tempos podem ser agrupados para a estima¸c˜ao dos parˆametros assumindo independˆencia quanto ao tempo.

O resumo da fun¸c˜ao likfit() tamb´em ser´a uma lista contendo, por exemplo, nome da fun¸c˜ao de correla¸c˜ao, vetor com as estimativas dos parˆametros σ2 e φ e estimativa da

m´edia do parˆametro β.

Para realizar a predi¸c˜ao espacial, ser´a definida uma grade de pontos. A fun¸c˜ao que realizar´a a krigagem tem como default a krigagem ordin´aria.

A fun¸c˜ao krige.bayes() faz uma interpreta¸c˜ao Bayesiana dos dados geoestat´ısticos deixando peculiarizar distintos graus de incerteza para os parˆametros do modelo. A fun¸c˜ao

3.6 geoR 38

torna os efeitos da distribui¸c˜ao a posteriori dos parˆametros do modelo, como tamb´em as distribui¸c˜oes preditivas para os locais de previs˜ao. Esta fun¸c˜ao depende de outras duas e s˜ao elas: model.control() e prior.control().

A fun¸c˜ao model.control() ´e exercida para classificar a tendˆencia dos pontos amostra- dos, indicar a fun¸c˜ao de correla¸c˜ao a ser utilizada e ainda se ´e necess´aria a realiza¸c˜ao da corre¸c˜ao de anisotropia. A fun¸c˜ao prior.control() define as prioris a serem utilizadas para os parˆametros β, σ2, φ e ν2.

A sa´ıda da fun¸c˜ao krige.bayes() ´e composta pelo efeito da distribui¸c˜ao a posteriori dos parˆametros do modelo. Se for realizada a krigagem, a fun¸c˜ao tamb´em retornar´a a resultˆancia da distribui¸c˜ao preditiva para os locais que era desej´avel suceder previs˜ao.

39

4

Resultados

Este cap´ıtulo ser´a destinado `a apresenta¸c˜ao da base de dados que ser´a trabalhada e os resultados obtidos por meio de an´alises da estat´ıstica espacial. A pesquisa ser´a dividida nas esta¸c˜oes do ano de ver˜ao e inverno e, portanto, ostentado dessa maneira.

Documentos relacionados