• Nenhum resultado encontrado

Estima¸c˜ ao dos parˆ ametros de um modelo de variograma

No documento Métodos robustos em geoestatística (páginas 44-49)

riograma

O conjunto de estimativas pontuais do variograma, cuja obten¸c˜ao foi descrita na sec¸c˜ao anterior, n˜ao ´e suficiente para traduzir a estrutura de dependˆencia de um processo geo- estat´ıstico, uma vez que n˜ao tem dom´ınio em Rd, e que nem sempre ´e condicionalmente definido negativo. Assim, para se obter uma estimativa v´alida do variograma, ´e ne- cess´ario ajustar um modelo param´etrico que seja adequado `as estimativas pontuais encontradas.

A escolha do modelo de variograma que melhor se ajusta `a estrutura de dependˆencia revelada pelas observa¸c˜oes do processo, n˜ao ´e uma tarefa f´acil, uma vez que o conjunto de variogramas v´alidos ´e bastante vasto. O procedimento mais utilizado na pr´atica, consiste em escolher, com base em conhecimentos emp´ıricos, uma fam´ılia de modelos do conjunto de todos os variogramas param´etricos v´alidos

{2γ : 2γ(h) = 2γ(h; θ); h ∈ Rd, θ ∈ Θ}.

Actualmente existem alguns m´etodos estat´ısticos que podem ajudar o investigador no

processo de selec¸c˜ao do modelo de variograma. Como exemplo, Gorsich e Genton

(2000) propuseram uma metodologia de escolha do modelo de variograma com base na compara¸c˜ao de derivadas. Na opini˜ao desses autores, os modelos de variograma diferem muito pouco entre si – o que difere, significativamente, ´e a derivada de cada uma das

fun¸c˜oes 2γ, de acordo com os modelos. Consequentemente, esses autores defendem

que o modelo de variograma que ´e mais adequado ao processo em estudo, ´e aquele cuja derivada se aproxima mais da estimativa da derivada do modelo, a qual se obt´em usando a estimativa n˜ao param´etrica encontrada na primeira etapa de estima¸c˜ao. Por outro lado, Maglione e Diblasi (2001) desenvolveram um teste para decidir se um

determinado modelo de variograma ´e adequado para modelar um dado processo em

estudo.

Depois de se ter escolhido uma fam´ılia de variogramas, estimam-se os parˆametros de modo a que a fun¸c˜ao variograma se aproxime o mais poss´ıvel das estimativas pontu- ais do variograma, as quais foram obtidas na primeira etapa do processo de estima¸c˜ao.

Por outras palavras, determina-se ˆθ ∈ Θ que faz com que 2γ(h; ˆθ) optimize o crit´erio de ajustamento escolhido. Existem diversos crit´erios de ajustamento, com base nos quais se encontram os estimadores mais utilizados, de entre os quais se salientam a m´axima verosimilhan¸ca e os m´ınimos quadrados. Seguidamente apresentam-se os cor- respondentes m´etodos de estima¸c˜ao.

2.2.1

M´etodo da m´axima verosimilhan¸ca

O estimador de m´axima verosimilhan¸ca ´e obtido, em geral, supondo a distribui¸c˜ao normal de Z(s). Admitindo a estacionaridade da m´edia e que as observa¸c˜oes s˜ao provenientes de uma distribui¸c˜ao normal multivariada, com matriz de covariˆancias Σ(θ), i.e., que Z = (Z(s1), ..., Z(sn)) ∼ N (µ, Σ(θ)), ent˜ao o logaritmo da fun¸c˜ao de

verosimilhan¸ca vem expresso por log L(θ) = −n 2 log(2π) − 1 2log(det(Σ(θ))) + 1 2(Z − µ) TΣ(θ)−1 (Z − µ),

onde det(Σ(θ)) representa o determinante da matriz Σ(θ). O estimador de m´axima

verosimilhan¸ca, ˆθM L, obt´em-se determinando o valor θ ∈ Θ que maximiza a fun¸c˜ao

log L(θ).

Repare-se que as estimativas pontuais do variograma n˜ao entram no processo de maximiza¸c˜ao da fun¸c˜ao de verosimilhan¸ca. De facto, de acordo com este m´etodo, tais estimativas apenas contribuem para seleccionar o modelo de variograma mais adequado.

Embora os estimadores de m´axima verosimilhan¸ca tenham boas propriedades em

geral, tamb´em tˆem algumas desvantagens. Para al´em de ser necess´ario pressupor o co- nhecimento da distribui¸c˜ao do processo, verifica-se que ˆθM L´e um estimador enviesado,

como se pode ver em Cressie (1993).

Por estes motivos, o m´etodo da m´axima verosimilhan¸ca ´e menos utilizado do que, por exemplo, o m´etodo dos m´ınimos quadrados e, por isso, n˜ao ser´a considerado em detalhe no desenvolvimento deste trabalho.

2.2.2

M´etodo dos m´ınimos quadrados

O m´etodo de m´ınimos quadrados ´e intuitivo, est´a muito divulgado e imp˜oe hip´oteses pouco restritivas sobre as distribui¸c˜oes das observa¸c˜oes do processo. Por isso, n˜ao ´e de

32

admirar que seja um dos m´etodos mais utilizados nas aplica¸c˜oes da Geoestat´ıstica. Considere-se um vector constitu´ıdo pelas estimativas pontuais do variograma, 2ˆγ = (2ˆγ(h1), ..., 2ˆγ(hH)), para H ∈ N, e um outro vector cujas componentes s˜ao definidas

por um modelo de variograma param´etrico v´alido, 2γ(θ) = (2γ(h1; θ), ..., 2γ(hH; θ)),

os quais foram obtidos nos mesmos pontos h1, ..., hH. O estimador de m´ınimos quadra-

dos ˆθLS ´e determinado pela solu¸c˜ao θ ∈ Θ que minimiza uma express˜ao do tipo

(2ˆγ − 2γ(θ))TV−1(2ˆγ − 2γ(θ)), (2.2.1)

onde V representa a matriz de covariˆancias do estimador.

Se V for a matriz identidade de ordem H, ent˜ao ˆθLS corresponde ao estimador

de m´ınimos quadrados simples (denotado por OLS ); se V for uma matriz diagonal tal que vi = Var[2ˆγ(hi)], o crit´erio passa a ser designado por m´ınimos quadrados

ponderados (denotado por WLS ); finalmente, se V for uma matriz quadrada tal que vi,j = Cov[2ˆγ(hi), 2ˆγ(hj)], o estimador resultante ´e referido como estimador de m´ınimos

quadrados generalizados (denotado por GLS ).

Tendo em conta as caracter´ısticas do processo, a matriz V n˜ao ´e m´ultipla da iden- tidade. Por isso, o estimador de OLS ´e desaconselhado, uma vez que n˜ao goza das propriedades que o tornam atractivo num cen´ario de observa¸c˜oes i.i.d.. Por outro lado, n˜ao ´e poss´ıvel conhecer a matriz V, pois ela depende do pr´oprio variograma que se pretende estimar.

No exemplo que se segue, particulariza-se o c´alculo de V para o caso do estimador de Matheron, supondo um processo Gaussiano.

Exemplo 2.2.1. Seja Z(s) um processo Gaussiano. A estacionaridade da m´edia garante que ∀s∈D∀h∈Rd Z(s + h) − Z(s) p2γ(h) ∼ N (0, 1), e, portanto, que ∀s∈D∀h∈Rd (Z(s + h) − Z(s))2 2γ(h) ∼ χ 2 1, (2.2.2) onde χ2

1 representa a distribui¸c˜ao do Qui-quadrado com um grau de liberdade.

Para facilitar a nota¸c˜ao, considere-se que hi,j = si − sj e represente-se por Ti,j =

Z(si) − Z(sj) o incremento do processo entre si e sj. Note-se, desde j´a, que por (2.2.2)

se sabe que T2

Calculando a variˆancia do estimador de Matheron apresentado em (2.1.1), para um qualquer vector hm tem-se que

Var[2ˆγ(hm)] = (#N (h1 m))2Var h P N (hm)T 2 i,j i = (#N (h1 m))2 P i,j P k,lCov[Ti.j2 , Tk.l2 ]. (2.2.3)

Contudo, ´e poss´ıvel verificar que as parcelas Cov[T2

i.j, Tk.l2 ] podem ser expressas em

termos da fun¸c˜ao 2γ. Para tal ´e preciso ter em conta um resultado simples, o qual pode ser encontrado, por exemplo, em Casella e Berger (2002). Esse resultado afirma que, se X ∼ N (µX, σX2), Y ∼ N (µY, σY2), Cov[X, Y ] = σX,Y, Var[X2] = σX22 e Var[Y2] = σY22,

ent˜ao Cov[X2, Y2] σX2σY2 = σ 2 X,Y σ2 XσY2 .

Sendo assim, tomando X = Ti,j e Y = Tk,l, facilmente se conclui que

Cov[Ti,j2 , Tk,l2 ] = r VarT2 i,j Var h T2 k,l i × Cov[Ti,j,Tk,l]2

Var[Ti,j]Var[Tk,l] =

8γ2(hi,j)8γ2(hk,l)Cov[Ti,j,Tk,l]2

2γ(hi,j)2γ(hk,l) = 2Cov[Ti,j, Tk,l]2

= 2[Cov[Z(si), Z(sk)] + Cov[Z(sj), Z(sl)] − Cov[Z(si), Z(sl)] − Cov[Z(sj), Z(sk)]]2

= 2[γ(hi,k) + γ(hj,l) − γ(hi,l) − γ(hj,k)]2.

Isto implica que as variˆancias e covariˆancias do estimador de Matheron dependem do pr´oprio variograma. Ent˜ao, a matriz V ´e dependente do pr´oprio parˆametro θ que se pretende estimar. Para al´em disso, e como se pˆode observar, mesmo para o estimador

de Matheron num processo Gaussiano, a forma da matriz V n˜ao ´e simples. Mais,

a invers˜ao de V e a minimiza¸c˜ao por GLS ´e, frequentemente, computacionalmente imposs´ıvel (vide Lahiri et al. (2002)).

♦ Tendo em vista ultrapassar a dificuldade de c´alculo da matriz V, Cressie (1993) recomenda uma alternativa. A ideia ´e considerar que o estimador de WLS ´e um bom compromisso entre o OLS e o GLS no que diz respeito `a eficiˆencia/facilidade de c´alculo. O autor sugere que os elementos da diagonal principal da matriz V sejam aproximados por

vm = Var[2ˆγ(hm)] ≈

2[2γ(hm; θ)]2

#N (hm)

34

Esta aproxima¸c˜ao resulta de (2.2.3), assumindo que os T2

i,jtˆem entre si uma covariˆancia

nula.

Apesar de Cressie defender o uso do WLS, Zimmerman e Zimmerman (1991) de-

senvolveram estudos emp´ıricos que indicam que o OLS e o WLS tˆem desempenhos

semelhantes, pelo que consideram desnecess´aria a utiliza¸c˜ao do WLS.

A Figura 2.2 representa um conjunto de curvas de acordo com um modelo esf´erico, as quais foram obtidas com as estimativas pontuais do semivariograma da Figura 2.1. Cada curva foi determinada atrav´es de um m´etodo de estima¸c˜ao diferente. A linha a cheio representa a estimativa obtida por OLS, a curva a tracejado foi obtida utilizando WLS, com a aproxima¸c˜ao de Cressie (1993) e, finalmente, a curva a ponteado foi obtida pelo m´etodo da m´axima verosimilhan¸ca.

Figura 2.2: Representa¸c˜ao das estimativas pontuais do semivariograma obtidas atra- v´es do estimador de Matheron e dos semivariogramas do modelo esf´erico estimados por WLS, OLS e m´axima verosimilhan¸ca.

´

E de salientar que, tal como verificaram Zimmerman e Zimmerman, as curvas o-

btidas por OLS e por WLS s˜ao bastante semelhantes, principalmente para valores

2.3

Propriedades assint´oticas dos estimadores do

No documento Métodos robustos em geoestatística (páginas 44-49)