• Nenhum resultado encontrado

2 REVISÃO DA LITERATURA

5. Muito Poluída Enquadram-se, nesta categoria, os corpos de água que não se enquadram

2.3 MODELAGEM DA QUALIDADE DA ÁGUA

2.3.1 Análise de Componentes Principais (ACP)

Os parâmetros físicos, químicos e biológicos que caracterizam a qualidade das águas sofrem grandes variações no tempo e no espaço, havendo a necessidade de um programa de monitoramento sistemático para obter a real estimativa da variação da qualidade das águas superficiais. Em geral, um programa de monitoramento inclui coletas frequentes nos mesmos pontos de amostragem e análise em laboratório de grande número de parâmetros, resultando em matriz de grandes dimensões e complexa interpretação. Muitas vezes, pequeno número desses parâmetros contém as informações químicas mais relevantes, enquanto a maioria das variáveis adiciona pouco ou nada à interpretação dos resultados em termos de qualidade.

A estatística multivariada consiste em um conjunto de métodos estatísticos utilizados em situações nas quais várias variáveis são medidas simultaneamente, em cada elemento amostral. Em geral, as variáveis são correlacionadas entre si e quanto maior o número de

variáveis, mais complexa torna-se a análise por métodos comuns de estatística univariada. Embora historicamente o uso de métodos multivariados esteja relacionado com trabalhos na Psicologia, Ciências Sociais e Biológicas, há algum tempo eles têm sido aplicados em um grande universo de áreas diferentes, como: Educação, Geologia, Química, Física, Engenharia, Ergonomia, entre outros. Esta expansão na aplicação dessas técnicas somente foi possível graças ao grande avanço da tecnologia computacional e ao grande número de softwares estatísticos com módulos de análise multivariada implementados (MINGOTI, 2005).

Portanto, a estatística multivariada é uma alternativa para tratar a complexidade da modelagem e compreensão das relações multivariáveis existentes no tratamento de dados de química analítica ambiental como, por exemplo, dos parâmetros hidrológicos, físicos, químicos e biológicos no estudo da qualidade das águas. Um dos objetivos da utilização da análise multivariada é reduzir a representação dimensional dos dados, organizando-os em uma estrutura que facilita a visualização e interpretação de todo o conjunto de dados. O que pode ser interessante para um pré-processamento de dados para a RNA. Sendo assim, os métodos estatísticos multivariados consideram as amostras e as variáveis em seu conjunto, permitindo extrair informações complementares que a análise univariada não consegue evidenciar.

A estatística multivariada divide-se, basicamente, em dois grupos. O primeiro consiste em técnicas exploratórias de sintetização (ou simplificação) da estrutura de variabilidade dos dados, fazem parte os métodos de análise de componentes principais, análise fatorial, análise de correlações canônicas, análise de agrupamento, análise discriminante e análise de correspondência. O segundo consiste em técnicas de inferência estatística, encontram-se os métodos de estimação de parâmetros, testes de hipóteses, análise de variância, de covariância e de regressão multivariada (MINGOTI, 2005).

Segundo Mingoti (2005), os métodos de estatística multivariada são utilizados com o propósito de simplificar ou facilitar a interpretação do fenômeno que está sendo estudado através da construção de índices ou variáveis alternativas que sintetizem a informação original dos dados; construir grupos de elementos amostrais que apresentam similaridade entre si possibilitando a segmentação do conjunto de dados original; investigar as relações de dependência entre as variáveis respostas associadas ao fenômeno e outros fatores (variáveis explicativas), muitas vezes, com objetivos de previsão, comparar populações ou validar suposições através de testes de hipóteses.

Uma técnica de estatística multivariada que recebe grande interesse e tem se tornado popular em modelagem ecológica ambiental é a Análise de Componentes Principais (ACP). A

Análise de ACP é um procedimento matemático que utiliza uma transformação ortogonal (ortogonalização de vetores) para converter um conjunto de observações de variáveis possivelmente correlacionadas num conjunto de valores de variáveis linearmente não correlacionadas, denominados de componentes principais (Figura 1). O número de componentes principais é menor ou igual ao número de variáveis originais (CARVALHO et al., 2010).

O novo conjunto de variáveis são ortogonais entre si e, portanto, não correlacionadas. As primeiras componentes principais (Figura 1) explicam a maior parte da variância total contida no conjunto de dados e podem ser usadas para representá-lo, que contém m variáveis, de modo que é possível compactar grande parte da informação linear desse sistema em apenas k novas variáveis, onde k <m. Assim, a i-ésima componente principal de um conjunto de m variáveis é definida segundo a Equação 1, na qual Zi é a componente principal, os aij são os

loading e Xj são as variáveis originais.

(1)

Figura 1- Interpretação geométrica das componentes principais.

A técnica de Análise de Componente Principal é muito utilizada em estudos de modelagem em ambientes aquáticos e estudos ecológicos, pois oferece um método objetivo para manusear grande quantidade de parâmetros, reduzindo a complexidade de sistemas multidimensionais.

Alguns atores relatam que a maior preocupação quanto à aplicação da análise de componentes principais é o entendimento do modo e ação ou comportamento dos componentes de um sistema ou subsistema, por isso, é importante que se tenha conhecimento fenomenológico do sistema.

Segundo Çamdevýren et al. (2005), a análise de ACP, a qual é muito utilizada em estudos de modelagem em ambientes aquáticos e estudos ecológicos, oferece um método objetivo para manusear uma grande parcela de dados abióticos e bióticos e ainda é um redutor de complexidade de sistemas multidimensionais pela maximização dos componentes principais e eliminação de componentes inválidos.

Podemos observar através da literatura consultada que a técnica de ACP vem sendo utilizada para o tratamento de dados de qualidade das águas assim como de dados da química analítica ambiental em geral. Contudo, sua eficácia depende da qualidade e quantidade de dados de campo, que, em geral, tendem a ser esparsos, principalmente quando se trata de sub- bacias inteiras. Apesar disso atualmente ainda não é muito frequente a utilização.

A técnica ACP foi utilizada no presente trabalho buscando um conhecimento maior das relações existentes entre variáveis e amostras no conjunto de dados com informações relevantes, ou seja, dados realmente úteis para a análise da qualidade de água.