• Nenhum resultado encontrado

2 REVISÃO DA LITERATURA

3 MATERIAIS E MÉTODOS

Foram realizadas pesquisas constantes em diversos bancos de dados tanto no Brasil como em outros países a fim de obter dados suficientes para a realização do projeto. Através dessas pesquisas escolheram-se os dados do Brasil, da Espanha e da China para realizá-lo.

3.1 DADOS REAIS DE RESERVATÓRIOS DE ÁGUA UTILIZADOS

Os dados utilizados do Brasil são referentes à represa de Guarapiranga, o qual é o segundo maior sistema de água potável da Região Metropolitana de São Paulo, localizado nas proximidades da Serra do Mar. Seu manancial é formado pelos rios Embu-Mirim, Embu- Guaçu, Santa Rita, Vermelho, Ribeirão Itaim, Capivari e Parelheiros. As represas de Guarapiranga e Billings produzem 15 mil litros de água por segundo e abastece 4,9 milhões de pessoas das Zonas Sul e Sudoeste da Capital. Possui uma área de 26,6 km2 e a área da bacia é de 631 km2, tem uma capacidade máxima de 171 bilhões de litros.

Figura 28 - Meio do corpo das Represas Guarapiranga e Billings –

Sistema Guarapiranga.

Fonte: Sabesp (Companhia de Saneamento Básico do Estado de São Paulo).

A análise dos mananciais é feita por sondas instaladas em Unidades de Monitoramento Remoto (UMR), a GU 104 foi utilizada para dados estacionários enquanto a GU 107 para dinâmicos. O monitoramento realiza análises a cada 30 min a uma profundidade de 0,3m, diretamente na represa. A Sabesp é a empresa que está responsável por tal monitoramento. Foram disponibilizadas para este trabalho 512 amostras em 179 dias, com séries diárias e horárias, nos quais os parâmetros analisados são: Condutividade, Oxigênio Dissolvido (OD), pH, Potencial de Oxi-redução (ORP), Temperatura e Turbidez.

O Rio LamTsuen é um rio chinês que atravessa o distrito de Tai Po, uma cidade do sul de Hong Kong na China. A nascente do rio localiza-se a 750 m acima do nível do mar, tem uma grande bacia de cerca de 18,5 Km2, com volume médio anual total de 14,6 milhões de metros cúbicos e comprimento de 12 km.

Figura 29 - Rio LamTsuen, Hong Kong.

Fonte: Google.

Foram disponibilizadas para este trabalho 288 amostras do Rio LamTsuen, em Hong Kong, nos quais os parâmetros analisados são: Temperatura, Sólidos suspensos, Sólidos totais, Fósforo, Nitrito, Nitrato, OD (mg.L-1 e porcentagem de saturação), Condutividade, Demanda Química de Oxigênio (DQO), Amônia e Demanda Bioquímica de Oxigênio (DBO).

Os dados utilizados da Espanha são referentes ao reservatório de Trasona nas redondezas de Astúrias, na Espanha. Seu manancial é composto pelos rios Alvares e Narcea. Volume de 31 mil metros cúbicos e capacidade total de 41 hm3, sua bacia tem área de capitação de 37 km2.

Figura 30 - Reservatório de Trasona - Espanha.

Fonte: Fernández, et al. (2013).

Foram disponibilizadas 151 amostras do Reservatório de Trasona, Espanha, e entre os parâmetros analisados no manancial do Reservatório de Trasona estão cianotoxinas, clorofila, condutividade, alcalinidade, turbidez, fosfato, amônia, nitrito, cálcio, entre outros.

3.2 ANÁLISE EXPLORATÓRIA DOS DADOS E MODELAGEM

A metodologia utilizada no presente trabalho teve início por uma análise exploratória de dados, baseada em técnicas de estatísticas multivariadas de Análise de Componentes Principais (ACP) e de Redes Neurais Kohonen (SOM). Os parâmetros físico-químicos da água ao longo do ano foram modelados para prever parâmetros de qualidade global, tais como clorofila, Demanda Bioquímica de Oxigênio (DBO) e cianobactérias, com base em modelos de inteligência artificial de Redes Neurais do tipo Perceptron Multicamadas (MLP) e Neuro- Fuzzy, e modelos estatísticos do tipo Máquina de Vetores de Suporte (SVM). Em seguida os dados do manancial brasileiro foram utilizados numa modelagem de uma série de dados temporais para previsão futura em curto período de tempo da concentração de clorofila como parâmetro global de qualidade, com base na transformada de wavelet aplicada aos modelos de redes neurais e estatísticos.

Os dados temporais necessários para a realização do trabalho foram obtidos através de uma revisão bibliográfica que resultou em um conjunto de dados, disponibilizados pela Companhia de Saneamento Básico do Estado de São Paulo (Sabesp), formando uma série temporal com dados horários de 179 dias, utilizados tanto na forma horária quanto na forma de médias diárias, com o intuito de desenvolver estratégias na forma de ferramentas

computacionais construídas em ambiente MatLab que permitam a avaliação e a previsão a curto e longo prazo de variáveis de qualidade de água na forma de séries temporais que estejam direta e indiretamente envolvidas na qualidade da água. As estratégias desenvolvidas utilizarão técnicas de tratamento de sinais, como a transformada Wavelet em conjunção com técnicas de sistemas inteligentes tais como Redes Neurais Artificiais.

A metodologia descrita anteriormente pode ser melhor compreendida através do esquema ilustrado na Figura 31.

Figura 31 - Esquema da Metodologia utilizada.

3.2.1 Medidas de Desempenho

A fase de validação, o ajuste do modelo é certificado de acordo com um conjunto de parâmetros (medidas de desempenho), que compara, por exemplo, a concentração de clorofila-a observada e a obtida pelo modelo. Estas medidas de desempenho são obtidas por meio da tentativa e erro e utilizadas em estudos como forma de avaliação dos modelos propostos. A Tabela 18 mostra os parâmetros e como são calculados.

Tabela 18 - Medidas de desempenho para avaliação dos modelos.

Parâmetro Equação

Coeficiente de Correlação de Pearson(r)

Erro de Previsão Médio (MPE)

Erro Quadrático Médio (MSE)

Raiz do Erro Médio Quadrado (RMSE)

Sendo: N = o número de dados; x = parâmetro de entrada; y = parâmetro de saída; PEi (Erro de previsão) = OP (valor previsto) – OR (valor real).

Fonte: Vilas et al. (2011) e Wu e Lo et al. (2008).

O coeficiente de correlação de Pearson (r) compara o desempenho do modelo com a de um modelo de referência, a saída do que é a média de todas as amostras (WU e LO, 2008). Pode, portanto, ser usado para comparar o desempenho relativo dos diferentes modelos de saídas.

Com o Erro de Previsão Médio (MPE) foi possível descobrir se um modelo tende a subestimar (altos valores positivos) ou superestimar (altos valores negativos) as concentrações de clorofila-a observados.

A raiz do Erro Médio Guadrado (RMSE) é usada como um índice de desempenho para comparar a capacidade de previsão de RNA treinada por cada conjunto de dados. O RMSE é conhecido por ser descritivo, quando a capacidade de previsão entre os modelos é comparada (WU e LO, 2008).