Estatística multivariada na seleção dos parâmetros do índice de qualidade de água

5.1 Fundamentação teórica

5.1.4 Estatística multivariada na seleção dos parâmetros do índice de qualidade de água

Os parâmetros químicos e físico-químicos provenientes do monitoramento das águas podem ser melhor selecionados utilizando estatística multivariada Os pesos dos parâmetros de maior relevância para uso na irrigação são extraídos da análise e utilizados na formação do índice de qualidade de água (IQA).

A identificação dos parâmetros mais importantes para a variabilidade da qualidade da água aplicando o modelo de estatística multivariada, Análise Fatorial/Componente Principal (AF/ACP), é realizada nas seguintes etapas:

1) Elaboração da matriz de correlação

Tendo por base os dados normalizados é construída a matriz de correlação [R]n x n, para n igual ao número de variáveis. Esta matriz representa a base para a

transformação das variáveis ortogonais observadas em fatores. Maiores esclarecimentos podem ser encontrados em Dillon & Goldstein (1984).

2) Análise da adequacidade do modelo

Antes de aplicar o método de extração de fatores, faz-se necessário verificar, a partir da matriz de correlação, a adequabilidade do conjunto de variáveis ao procedimento estatístico. Análise de sensibilidade das variáveis para a análise de fator foi realizada através do teste KMO - Kaiser-Meyer-Olkin, proposto por Kaiser (1974 apud NORUSIS, 1990). Este teste compara a magnitude dos coeficientes de correlação observadas com a magnitude dos coeficientes de correlações parciais através da equação:

∑∑

≠ ≠ ≠ ≠ ≠ ≠ + = j i i j ij i j i j ij j i i j ij a r r KMO ₂ ₂ 2 , (2) onde:

rij : coeficiente de correlação simples entre as variáveis i e j;

aij : coeficiente de correlação parcial entre as variáveis i e j.

Se a soma dos coeficientes de correlação parciais ao quadrado entre os pares de variáveis for pequena comparada à soma dos coeficientes de correlação simples ao quadrado, as medidas de KMO serão próximas a um, indicando que não há restrição ao uso do modelo da análise dos fatores. Valores pequenos para o KMO indicam que o modelo de análise de fator não se aplica. A Tabela 6 lista os intervalos do referido teste.

TABELA 6 - Intervalo de validade do teste KMO

Valor de KMO Aplicação do modelo

KMO ≥ 0,9 Excelente 0,8 ≤ KMO < 0,9 Ótima 0,7 ≤ KMO < 0,8 Boa 0,6 ≤ KMO < 0,7 Regular 0,5 ≤ KMO < 0,6 Ruim KMO < 0,5 Inadequada Fonte: Adaptado por Silveira & Andrade (2002)

3) Extração dos fatores pela análise da componente

O objetivo da extração de fator é determinar os fatores representativos da variabilidade da qualidade da água, contida no total dos dados, com o mínimo de perda das informações.

Uma vez que a análise fatorial (AF) necessita que o número de fatores seja conhecido anteriormente, os fatores foram determinados pela ACP (MOHAN & ARUMUGAM, 1996; WUNDERLIN et al, 2001). Na ACP, combinações lineares das variáveis são formadas. A primeira componente principal é a combinação que explica a maior contribuição para a variância na amostra. A segunda componente principal explica a segunda maior contribuição para a variância, sem estar correlacionada com a primeira. Sucessivas componentes explicam porções progressivamente menores da variância da amostra total, sem apresentar correlação com as componentes anteriores.

O modelo matemático para AF apresenta semelhança com uma equação de regressão múltipla (SINGH et al, 2005). Cada variável é expressa por uma combinação linear de fatores (que não são observados de fato), da seguinte forma:

Xi = Ai1F1 + Ai2 F2 + ... + Aik.Fk + i (3)

F: fatores comuns, isto é, que formam uma nova variável; Ai: constantes usadas para combinar os fatores (i = 1,..., k)

k: número de fatores;

i: erro experimental.

Os fatores são deduzidos das variáveis observadas e podem ser calculados como combinações lineares. Considerando-se que, é possível que todas as variáveis contribuam para o fator qualidade da água, espera-se que somente um único subconjunto de variáveis caracterize a qualidade da água, como indicado pelos seus grandes coeficientes. A expressão geral para estimativa do j-ésimo fator é:

Fj =

∑

= n i 1

WjiXi (4)

Wi: coeficiente de contagem de cada fator;

n: número de variáveis

Para decidir quantos fatores/componentes seriam necessários para representar os dados, deve-se examinar a variância total explicada por cada uma. O critério comumente adotado foi descrito por Norusis (1990), segundo o qual somente componentes com variância superior a 1 são consideradas. Este critério fundamenta-se no postulado que qualquer fator deve explicar uma variância superior àquela apresentada por uma simples variável.

4) Extração da comunalidade de cada variável

As comunalidades medem a capacidade que têm as componentes retiradas de explicar a variação de cada variável original; apresentam valores variando de 0 a 1 (SILVEIRA, 2000). “Zero” indica que as componentes não explicam nada da variância e “Um” indica que toda a variância é explicada pelas componentes que compõe o modelo. A comunalidade é estimada pela seguinte equação:

∑

=

N i i

A

_ij

C

1 2 (5) ij

A : variância referente à variável x_ij;

C : valor da comunalidade referente de cada variável

5) Transformação dos fatores

A matriz das componentes obtidas na fase de extração pode apresentar, às vezes, resultados de difícil interpretação com relação aos fatores significantes. Para superar esta limitação, a transformação da matriz em uma outra de mais fácil interpretação pode ser efetuada utilizando a rotação da análise de fator (DILLON & GOLDSTEIN, 1984). A rotação não afeta o valor de ajuste de uma solução de fator, de maneira que a comunalidade e a percentagem de variância total explicada não são alteradas. A percentagem de variância considerada por cada um dos fatores faz, porém, a mudança.

O método de rotação minimiza a contribuição dos parâmetros de menor significância no fator (VEGA et al., 1998; HELENA et al., 2000; WUNDERLIN et al., 2001), de modo que os parâmetros passam a apresentar pesos próximos à zero ou à unidade, eliminando os valores intermediários responsáveis por dificultar a interpretação.

No documento Dinâmica qualitativa das águas superficiais da bacia do Acaraú e uma proposta de classificação para fins de irrigação (páginas 68-72)