Capítulo 3 – Simulação condicional seqüencial
3.6 Método dos Indicadores – método não-paramétrico
3.6.4.2 Simplificação da cokrigagem
3.6.4.2.3 Krigagem dos componentes principais dos indicadores
u
Y21( , como apresentado na Figura 3.10), a estimativa da dclp em u seria o resultado de 10 combinações lineares de quatro elementos (Equação 3.71). Logo, com o emprego de KFM seria necessária a resolução de somente três sistemas de cokrigagem, que definiriam os três fatores
) u
Ysq( . Contudo, esse procedimento não dispensa o cálculo do MLC.
A cokrigagem de duas VAs Zi(u) também pode se simplificada, se o MLC se enquadrar no chamado “Modelo do Resíduo” ou “Modelo de Markov” (Rivoirard, 2001 e 2002). Nesse caso, uma das duas variáveis, juntamente com o resíduo [R(u) = Z*(u) – Z(u)], são autokrigáveis. Assim, a VA Zi(u) que não é autokrigável é estimada em função da krigagem do resíduo e da outra variável. Por exemplo, o MLC exemplo apresentado acima (p. 54 e Figura 3.10) se enquadra no modelo do resíduo.
Nesse caso a VA Z2(u) é autokrigável e a VA Z1(u) poderia ser determinada, por cokrigagem, dessa forma:
* K
* k 2
* CK
1(u)] a [Z (u)] b [R(u)]
Z
[ = ⋅ + + (3.74)
onde
)]
u ( Z [ Var
)]
u ( Z ), u ( Z [ a Cov
1 2
= 1 e b=m1 −a⋅m2
Os termos m1 e m2 são as médias das VAs Z1(u) e VA Z2(u), respectivamente. Porém essa simplificação só é aplicada nos casos onde existem duas variáveis, o que não é o caso de cokrigagem de K VAs indicadoras I(uα;zk).
3.6.4.2.3. Krigagem dos componentes principais dos indicadores
O método de krigagem dos componentes principais dos indicadores (KCPI) (Suro-Pérez e Journel, 1991) agrega a Análise dos Componentes Principais (ACP) (Matheron, 1982; Davis e Greenes, 1983) e o formalismo dos indicadores para modelar as dclp. Nesse algoritmo, as dclp são modeladas a partir da estimativa dos componentes principais dos indicadores Yk(u), ao invés da estimativa dos próprios indicadores I(uα;zk). O método de KCPI é considerado uma simplificação dos algoritmos de
Capítulo 3 – Simulação condicional seqüencial 59
cokrigagem, pois permite que as dclp sejam modeladas com a mesma eficiência proporcionada pelos algoritmos de CKI e com o mesmo esforço despendido para KI. Isso porque, a ACP faz com que as VAs indicadoras I(uα;zk) sejam transformadas em componentes Yk(u) “independentes”, resumindo as covariâncias diretas e cruzadas dos indicadores em covariâncias diretas dos componentes principais.
Entretanto, como será visto a seguir, as covariâncias cruzadas dos componentes principais não são necessariamente nulas, mas são insignificantes quando comparadas com as covariâncias diretas – isso explica porque o termo independente foi escrito entre aspas na frase acima. Isso faz com que os componentes principais dos indicadores Yk(u) possam ser considerados como sendo autokrigáveis, isto é:
[ ]
*[
k]
*Kk(u) CK Y (u)
Y = .
A Análise dos Componentes principais é uma técnica algébrica de transformação linear de vetores. Em duas dimensões, ACP pode ser visto como uma rotação de eixos ortogonais, de modo que o ângulo de rotação seja tal que o espalhamento da primeira variável transformada, ao longo do primeiro eixo, seja máximo, enquanto que o espalhamento da segunda variável transformada, ao longo do segundo eixo, seja mínimo (Anderson, 1984).
ACP é um procedimento de ortogonalização que não requer nenhuma hipótese estatística a priori sobre as informações. Entretanto, a aplicação estatística dessa ortogonalização mostra que as covariâncias cruzadas entre as VAs transformadas Yk(u) são estritamente nulas (Suro-Pérez e Journel, 1991). Ou seja:
Outra característica importante apresentada pela ACP é que a variância dos componentes principais (Yk) é decrescente, isto é:
Y ) reduzida por meio dos componentes principais que mais contribuem para variância.
A determinação dos componentes principais Yk(u) pode ser realizada a partir da decomposição espectral da matriz de covariâncias espaciais C(h; zk, zk’) das K VAs indicadoras I(uα;zk): representa a matriz diagonal constituída pelos seus valores próprios (que representam as variâncias dos componentes principais dos indicadores). Na prática, essas matrizes podem ser obtidas com o auxílio de qualquer rotina de decomposição espectral, por exemplo, o algoritmo de decomposição do valor singular (DVS) – Apêndice A.
A partir daí, o vetor dos componentes principais dos indicadores é calculado por meio de uma simples multiplicação de matrizes, em um processo chamado de ortogonalização:
Capítulo 3 – Simulação condicional seqüencial 60
) z u;
( Q I ) u (
Y = t⋅ (3.76)
Ou seja, cada componente principal Yk(u) é calculado da seguinte forma:
∑ ⋅
=
= α
α K
1 '
k k 'k k'
k(u ) q I(u ;z )
Y α = 1,...,n(u)
k = 1,..., K
(3.77) onde q k’ k são os elementos da matriz ortogonal Q, enquanto que I(uα;zk’) são os elementos do vetor I(u; z). Portanto, os componentes principais Yk(uα) são o resultado da combinação linear das K VAs indicadoras I(uα;zk) com os vetores próprios resultantes da decomposição de C(h; zk, zk’).
Entretanto, a ortogonalização, apresentada acima, não garante que as covariâncias cruzadas CY(h; zk, zk’) sejam nulas para vetores h diferentes daqueles empregados no momento da ortogonalização. Porém, foi provado empiricamente (Suro-Pérez e Journel, 1991) que, nesses casos, a magnitude de correlação é tão insignificante que pode ser desprezada. Assim, a matriz de variâncias e covariâncias dos componentes principais dos indicadores Yk(u) pode ser considerada como sendo uma matriz diagonal, independente do vetor h. Porém, é conveniente que essa condição sempre seja testada. Wackernagel (1994), reforça exatamente isso, alertando para o fato de que os componentes principais possam apresentar um certo grau de correlação em curtas distâncias.
Em princípio, a ortogonalização pode ser realizada para qualquer vetor h. Porém, na prática, essa distância deve ser tal que as correlações espaciais entre os componentes principais sejam tão mínimas quanto possíveis, de modo que possam ser ignoradas. Em especial, essas correlações devem ser insignificantes quando comparadas com as covariâncias diretas. Na prática, uma primeira aproximação consiste em utilizar o menor passo (lag distance) do semi-variograma experimental dos indicadores, pois as covariâncias cruzadas são decrescentes para a maioria dessas distribuições. Como alternativa, também pode-se utilizar h=0 ou h→0. Nesse caso, a grande vantagem é que os semi-variogramas diretos e cruzados dos indicadores se tornam desnecessários para a determinação de seus componentes principais. Isto é, a decomposição espectral pode ser realizada a partir da matriz de variâncias e covariâncias dos indicadores.
A partir da transformação linear das K VAs indicadoras I(uα;zk) em componentes principais Yk(u) “independentes”, os componentes principais nas localizações não medidas são calculados a partir da seguinte combinação linear:
[ ]
= ∑ λ=
α α α
) u ( n
1 KCPI k
* KCPI
k(u) (u) .Y (u )
Y k = 1,..., K (3.78)
onde os ponderadores λKCPIα dos componentes principais Y nas localizações u, são determinados pela k resolução do seguinte sistema de KO:
Capítulo 3 – Simulação condicional seqüencial 61 µKCPIzk é o lagrangeano do sistema CPI.
Após o cálculo da estimativa dos componentes principais nas localizações desconhecidas, as probabilidades condicionais podem ser determinadas por meio da seguinte transformação inversa:
[ ] [ ]
onde, t indica transposta. Em termos de somatório:
[ ]
= ∑ ⋅ indicadores foi ortogonalizada para um vetor h unitário. Nesse exemplo, havia nove VAs indicadoras I(uα;zk) (K = 9) e, portanto, nove componentes principais Yk(u) (k = 1,2,...,9). Como os autores esperavam, as covariâncias cruzadas espaciais (h≠0) entre os componentes principais dos indicadores foram nulas para alguns pares de componentes e insignificantes para outros. Dessa forma, teoricamente, seriam necessários o cálculo e o ajuste de nove semi-variogramas experimentais, assim como a resolução de nove sistemas de krigagem. Contudo, somente os três primeiros componentes principais apresentaram alguma estruturação espacial (sendo que as variâncias dos últimos componentes principais foram quase nulas). Os outros seis componentes principais tiveram seus semi-variogramas modelados como efeito pepita puro. Assim, para a modelagem da dclp em cada localização não medida, foi necessário resolver somente três sistemas de krigagem. Nesse caso, o algoritmo de KCPI simplificou enormemente a CKI e também significantemente a KI, sendo que os resultados obtidos foram muito similares àqueles obtidos a partir do algoritmo de CKI (teoricamente melhor do que o de KI).Capítulo 3 – Simulação condicional seqüencial 62
Portanto, além de transformar problemas de K2 dimensões (ou K*(K+1)/2, considerando as covariâncias como sendo simétricas) para problemas de K dimensões, o algoritmo de KCPI ainda mostra a característica de desestruturação dos semi-variogramas dos componentes principais dos indicadores com o aumento de K. Além disso, em relação a KI, o cálculo e o ajuste dos semi-variogramas experimentais dos componentes principais dos indicadores se torna mais fácil. Isso porque, os componentes principais dos indicadores são variáveis contínuas e, portanto os semi-variogramas calculados a partir dessas variáveis são mais representativos – contando com um maior número de pares.