5.1 Fundamentação teórica
5.1.4 Estatística multivariada na seleção dos parâmetros do índice de qualidade de água
Os parâmetros químicos e físico-químicos provenientes do monitoramento das águas podem ser melhor selecionados utilizando estatística multivariada Os pesos dos parâmetros de maior relevância para uso na irrigação são extraídos da análise e utilizados na formação do índice de qualidade de água (IQA).
A identificação dos parâmetros mais importantes para a variabilidade da qualidade da água aplicando o modelo de estatística multivariada, Análise Fatorial/Componente Principal (AF/ACP), é realizada nas seguintes etapas:
1) Elaboração da matriz de correlação
Tendo por base os dados normalizados é construída a matriz de correlação [R]n x n, para n igual ao número de variáveis. Esta matriz representa a base para a
transformação das variáveis ortogonais observadas em fatores. Maiores esclarecimentos podem ser encontrados em Dillon & Goldstein (1984).
2) Análise da adequacidade do modelo
Antes de aplicar o método de extração de fatores, faz-se necessário verificar, a partir da matriz de correlação, a adequabilidade do conjunto de variáveis ao procedimento estatístico. Análise de sensibilidade das variáveis para a análise de fator foi realizada através do teste KMO - Kaiser-Meyer-Olkin, proposto por Kaiser (1974 apud NORUSIS, 1990). Este teste compara a magnitude dos coeficientes de correlação observadas com a magnitude dos coeficientes de correlações parciais através da equação:
∑∑
∑∑
∑∑
≠ ≠ ≠ ≠ ≠ ≠ + = j i i j ij i j i j ij j i i j ij a r r KMO 2 2 2 , (2) onde:rij : coeficiente de correlação simples entre as variáveis i e j;
aij : coeficiente de correlação parcial entre as variáveis i e j.
Se a soma dos coeficientes de correlação parciais ao quadrado entre os pares de variáveis for pequena comparada à soma dos coeficientes de correlação simples ao quadrado, as medidas de KMO serão próximas a um, indicando que não há restrição ao uso do modelo da análise dos fatores. Valores pequenos para o KMO indicam que o modelo de análise de fator não se aplica. A Tabela 6 lista os intervalos do referido teste.
TABELA 6 - Intervalo de validade do teste KMO
Valor de KMO Aplicação do modelo
KMO ≥ 0,9 Excelente 0,8 ≤ KMO < 0,9 Ótima 0,7 ≤ KMO < 0,8 Boa 0,6 ≤ KMO < 0,7 Regular 0,5 ≤ KMO < 0,6 Ruim KMO < 0,5 Inadequada Fonte: Adaptado por Silveira & Andrade (2002)
3) Extração dos fatores pela análise da componente
O objetivo da extração de fator é determinar os fatores representativos da variabilidade da qualidade da água, contida no total dos dados, com o mínimo de perda das informações.
Uma vez que a análise fatorial (AF) necessita que o número de fatores seja conhecido anteriormente, os fatores foram determinados pela ACP (MOHAN & ARUMUGAM, 1996; WUNDERLIN et al, 2001). Na ACP, combinações lineares das variáveis são formadas. A primeira componente principal é a combinação que explica a maior contribuição para a variância na amostra. A segunda componente principal explica a segunda maior contribuição para a variância, sem estar correlacionada com a primeira. Sucessivas componentes explicam porções progressivamente menores da variância da amostra total, sem apresentar correlação com as componentes anteriores.
O modelo matemático para AF apresenta semelhança com uma equação de regressão múltipla (SINGH et al, 2005). Cada variável é expressa por uma combinação linear de fatores (que não são observados de fato), da seguinte forma:
Xi = Ai1F1 + Ai2 F2 + ... + Aik.Fk + i (3)
F: fatores comuns, isto é, que formam uma nova variável; Ai: constantes usadas para combinar os fatores (i = 1,..., k)
k: número de fatores;
i: erro experimental.
Os fatores são deduzidos das variáveis observadas e podem ser calculados como combinações lineares. Considerando-se que, é possível que todas as variáveis contribuam para o fator qualidade da água, espera-se que somente um único subconjunto de variáveis caracterize a qualidade da água, como indicado pelos seus grandes coeficientes. A expressão geral para estimativa do j-ésimo fator é:
Fj =
∑
= n i 1WjiXi (4)
Wi: coeficiente de contagem de cada fator;
n: número de variáveis
Para decidir quantos fatores/componentes seriam necessários para representar os dados, deve-se examinar a variância total explicada por cada uma. O critério comumente adotado foi descrito por Norusis (1990), segundo o qual somente componentes com variância superior a 1 são consideradas. Este critério fundamenta-se no postulado que qualquer fator deve explicar uma variância superior àquela apresentada por uma simples variável.
4) Extração da comunalidade de cada variável
As comunalidades medem a capacidade que têm as componentes retiradas de explicar a variação de cada variável original; apresentam valores variando de 0 a 1 (SILVEIRA, 2000). “Zero” indica que as componentes não explicam nada da variância e “Um” indica que toda a variância é explicada pelas componentes que compõe o modelo. A comunalidade é estimada pela seguinte equação:
∑
==
N i iA
ijC
1 2 (5) ijA : variância referente à variável xij;
i
C : valor da comunalidade referente de cada variável
5) Transformação dos fatores
A matriz das componentes obtidas na fase de extração pode apresentar, às vezes, resultados de difícil interpretação com relação aos fatores significantes. Para superar esta limitação, a transformação da matriz em uma outra de mais fácil interpretação pode ser efetuada utilizando a rotação da análise de fator (DILLON & GOLDSTEIN, 1984). A rotação não afeta o valor de ajuste de uma solução de fator, de maneira que a comunalidade e a percentagem de variância total explicada não são alteradas. A percentagem de variância considerada por cada um dos fatores faz, porém, a mudança.
O método de rotação minimiza a contribuição dos parâmetros de menor significância no fator (VEGA et al., 1998; HELENA et al., 2000; WUNDERLIN et al., 2001), de modo que os parâmetros passam a apresentar pesos próximos à zero ou à unidade, eliminando os valores intermediários responsáveis por dificultar a interpretação.