Uma Abordagem de Mineração de Dados para a Previsão de Vazões com Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu

(1)

Uma Abordagem de Mineração de Dados para a Previsão de Vazões com

Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu

Alexandre G. Evsukoff

1

_{, Nelson F. F. Ebecken}

1

_{, Fabio T. de Souza}

1

_,

Marcello P. Alegre

1

_{, Guilherme S. Terra}

1

_{, Geraldo M. Tavares}

2

_{, Antônio F. da Hora}

2

1

_{COPPE/Universidade Federal do Rio de Janeiro,}

Caixa Postal 68506, 21945‐970 Rio de Janeiro, RJ

2

_{LEV/Universidade Federal Fluminense}

22283‐900 Niterói, RJ

RESUMO

Neste trabalho, apresenta‐se o desenvolvimento de modelos de previsão de vazões para a bacia do Rio Iguaçu, utilizando lógica fuzzy e técnicas de bancos de dados para permitir acesso e visualização dos dados. O modelo utiliza dados de previsão de precipitação de dez dias à frente fornecidos pelo modelo ETA. Os resultados numéricos mostram que o modelo é robusto e apresenta um bom desempenho para todos os aproveitamentos considerados. O protótipo foi integrado a um ambiente de banco de dados comercial, com grande capacidade de armazenamento, o que agrega confiabilidade e praticidade à solução proposta.

1 INTRODUÇÃO

O desenvolvimento de modelos precisos de previsão de vazões é de grande importância para o planejamento operacional das usinas do Sistema Interligado Nacional.

No final de 2004 o Operador Nacional do Sistema (ONS), responsável pelo planejamento operacional do Sistema Interligado Nacional (SIN), lançou uma demanda para modelos de previsão de vazões com incorporação de previsão de precipitação. Este trabalho apresenta um dos modelos selecionados pelo ONS para dar suporte ao planejamento operacional. O modelo foi desenvolvido para a previsão de vazões para a bacia do Rio Iguaçu. O modelo utiliza dados de previsão de precipitação de dez dias a frente fornecidos pelo modelo de previsão ETA. O desenvolvimento do modelo foi realizado utilizando a metodologia de Extração de Conhecimento em Bases de Dados.

A Extração de Conhecimento em Bases de Dados (ou Knowledge Discovery in Databases) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados. Devido a essas

características incomuns, todo o processo de Extração de Conhecimento depende de uma nova geração de ferramentas e técnicas de análise de dados, envolvendo diversas etapas: Definição do Problema, Pré‐processamento de dados; Mineração (Análise) de Dados e Interpretação (Evsukoff e Ebecken, 2003; Han e Kamber, 2001).

O processo de Extração de Conhecimento começa, obviamente, com o entendimento do domínio da aplicação e dos objetivos finais a serem atingidos. O sucesso do processo de Extração de Conhecimento depende, em parte, da participação de especialistas do domínio e apoio aos analistas em sua tarefa de encontrar padrões.

(2)

Figura 1: Extração de Conhecimento

Os fenômenos hidrológicos são extremamente complexos, não lineares e têm um alto grau de variabilidade espacial e temporal. O modelo desenvolvido permite que a solução proposta possa ser empregada em problemas de grande porte, bem como ser adequada para tratar diversos horizontes temporais.

O desenvolvimento metodológico é baseado em técnicas de mineração de dados e tem o seu esquema geral representado na Figura 2. BD TELEMETRIA ETA MODELO DE PREVISÃO OLAP Figura 2: Esquema geral da proposta metodológica A Base de Dados (BD) do sistema representa o repositório a partir do qual foram selecionados os dados para o desenvolvimento do projeto e que também será utilizado na operacionalização do sistema. A BD é composta pelos dados de pluviômetros e medidores de vazão ligados em um sistema automático de aquisição de dados. Além disso, a BD armazena também os dados de previsões semanais do modelo ETA, que também deverão ser utilizados para as previsões de vazão. Neste artigo, são abordados os seguintes modelos:

Modelo de Dados

Modelo de Previsão

O modelo de dados é representado pelo cubo OLAP (On‐Line Analytical Processing) e é uma tecnologia que explora os dados em um formato multidimensional. O modelo de previsão utilizado foi um modelo fuzzy recorrente, desenvolvido recentemente (Evsukoff e Ebecken, 2004).

A solução completa inclui ainda os modelos de imputação de dados, para o preenchimento de dados ausentes, e um módulo análise de incertezas que não serão abordados neste artigo.

A continuação deste artigo está organizada da seguinte forma: a seguir, apresenta‐se sucintamente a bacia do Rio Iguaçu, bem como os dados fornecidos para o desenvolvimento do projeto e o modelo de dados; na Seção 3, é apresentado o modelo não linear de previsão de vazões; na Seção 4, apresentam‐se os resultados obtidos; e, finalmente, a Seção 5 apresenta as conclusões do trabalho.

2 O MODELO DE DADOS

2.1 Dados fornecidos

Para a realização do trabalho, foram utilizadas as séries históricas de vazões naturais totais e incrementais de quatro Usinas Hidrelétricas (UHEs): Foz do Areia, Segredo, Salto Santiago e Salto Osório, além da vazão natural total do Desvio do Rio Jordão. Além disso, foram fornecidas, também, as séries históricas de 30 pluviômetros sobre a área da bacia.

O objetivo do projeto foi o desenvolvimento de modelos de previsão de vazões incorporando informações de previsão de precipitação. Para isso, foram também fornecidas as previsões do modelo ETA para a chuva acumulada em 24h, numa grade de 40km x 40km, entre 1996 e 2001.

Os dados foram fornecidos em uma série de arquivos, em que cada arquivo de dados continha a previsão de um dia de previsão. A grade fornecida em cada arquivo cobria uma área muito maior que a bacia. A grade do modelo foi reduzida para a área sobre a bacia, considerando apenas nx=15 pontos na direção Leste‐Oeste, entre as Longitudes ‐49º e ‐ 54.6º, e ny=6 na direção Norte‐Sul, entre as Latitudes ‐25º e ‐27º.

(3)

da grade selecionada, ordenados de Oeste para Leste e de Sul para Norte, totalizando nx.ny=90 colunas.

2.2 Cubo OLAP

A tecnologia OLAP (On‐Line Analytical Processing) é uma de banco de dados que explora os dados em um formato multidimensional, de onde se visualiza os dados em diferentes perspectivas e em diferentes níveis de agregação (Han e Kamber, 2001; Harinarayan et al., 1996). A análise OLAP é interativa e guiada pelo usuário. Geralmente, a análise OLAP é realizada em dados de um banco de dados chamado Datamart, que é mantido separadamente dos sistemas operacionais de uma empresa, na qual os dados estão em uma forma consolidada.

No Datamart, utiliza‐se o modelo de dados multidimensional, conhecido como modelo estrela ( Figura 3). Neste modelo, uma tabela de dados central possui os dados das medidas (assunto que estamos analisando, no nosso caso, vazões e medidas pluviométricas). Esta tabela é chamada de Tabela Fato, na qual se conectam as tabelas de referências, cujos dados referenciam às medidas da Tabela Fato. Estas tabelas são chamadas de dimensões (no nosso caso, temos dimensão tempo e local). Tabela Fato medida 1 medida 2 medida n Dimensão 1 atributos Dimensão 2 atributos Dimensão 3 atributos Figura 3: Formato do modelo de dados estrela. Logo, as medidas são indexadas pelas dimensões, ou seja, as dimensões são únicas para determinar uma medida.

As dimensões podem ser hierárquicas, por exemplo, a dimensão tempo que possui uma hierarquia de ano, mês e dia. Logo, podemos ter medidas vistas

por dia, por mês e por ano, ou seja, os dados podem ser vistos em diferentes perspectivas.

A partir do modelo estrela podemos construir cubos de dados por meio de ferramentas OLAP. Os cubos de dados são visões lógicas multidimensionais dos dados com referência hierárquica. As ferramentas OLAP fornecem funcionalidades para análise interativa de dados em diferentes visões e granularidades.

A essência do OLAP se dá pela eficiente computação das agregações dos diversos conjuntos de dimensões do cubo de dados. Estas agregações são referenciadas em SQL como group by.

As operações no cubo de dados são chamadas operações OLAP, por meio das quais se consegue flexibilidade durante as consultas aos dados no cubo.

Conseqüentemente, o cubo de dados é formado por medidas numéricas para análise e um conjunto de dimensões que define a medida.

As principais operações OLAP são:

• Roll‐up: ocorre diminuição do nível de detalhe da informação (Ex.: passagem de mês para ano). • Drill‐down: ocorre aumento do nível de detalhe da informação (Ex.: passagem de ano para mês). • Slice/Dice: visualizar sub‐cubos do cubo de

dados (Ex.: ver dados do ano de 2002).

• Pivot: alterar linhas por colunas na visualização de resultados.

O modelo estrela elaborado para os dados de vazão está mostrado na Figura 4, na qual podemos ver a tabela Fato, chamada de vazão, contendo as medidas: vazão medida e vazão prevista.

(4)

possui uma chave única (PK), que identifica unicamente o registro na tabela de dados. As chaves únicas das dimensões tempo e local são dia e usina_id, respectivamente. vazão PK,FK2 dia PK,FK1 usina_id vazao medida vazao prevista soma chuva medida soma chuva prevista tempo PK dia semana ano local PK usina_id nome usina bacia Figura 4: Modelo estrela dos dados vazão. A conexão entre as dimensões e a Tabela Fato ocorre pela utilização de chaves estrangeiras (FK), que são a migração das chaves únicas das dimensões para a Tabela Fato. A união das chaves estrangeiras na Tabela Fato forma a sua chave única.

Para os dados de índices pluviométricos, o modelo estrela está mostrado na Figura 5, na qual podemos ver a Tabela Fato, chamada de pluviometria, contendo a medida: índice medido. pluviometria PK,FK2 dia PK,FK1 pluvi_id indice medida indice previsto tempo PK dia semana ano local PK pluvi_id nome pluviometro usina bacia Figura 5: Modelo estrela dos dados de índices pluviométricos. Foi criado mais um campo para conter os dados de índice previsto que serão fornecidos pelo modelo de previsão, e assim teremos os dados medidos e previstos armazenados no banco de dados e disponibilizados para análise OLAP.

As dimensões desta tabela Fato são tempo e local. A dimensão tempo é a mesma utilizada no modelo de

vazão. A dimensão local possui os níveis pluviômetro, usina e bacia e a hierarquia nesta mesma ordenação. As chaves únicas das dimensões tempo e local são dia e pluvi_id, respectivamente. Os dados utilizados no projeto estão na forma mais detalhada do modelo, ou seja, dados diários e por usina ou pluviômetro. Para cálculo e visualização das medidas em outros níveis hierárquicos (semana, ano ou bacia), devemos realizar agregações nos dados.

No caso de vazão, não faz sentido agregarmos vazões por bacia (sumarizar as vazões de todas as usinas). Neste caso, podemos usar outra função de agregação, por exemplo, média. Pode‐se usar para uma mesma medida mais de uma função de agregação. A TABELA 1 mostra as funções de agregação utilizadas.

TABELA 1: Funções de agregação usadas.

MEDIDA DIM. TEMPO DIM. LOCAL

VAZÃO MÉDIA MÉDIA

CHUVA SOMA e MÉDIA SOMA e MÉDIA

3 DESCRIÇÃO DO MODELO

O sistema natural das vazões natural total e incremental da bacia é acoplado, conforme mostrado na Figura 6. A identificação do modelo acoplado é bem mais complexa e não foi abordada neste trabalho. As variáveis de vazão são consideradas independentes e, desta forma, há um modelo para cada aproveitamento, tanto para as previsões diárias, como para as semanais. Segredo Foz do Areia S. Osório S. Santiago Desvio Jordão Segredo S. Santiago S. Osório Segredo Foz do Areia S. Osório S. Santiago Desvio Jordão Segredo S. Santiago S. Osório Figura 6: Acoplamento entre as variáveis. 3.1 O Modelo Fuzzy Recorrente

(5)

(

)

( )

⎩ ⎨ ⎧ = = + ) ( ) ( ) ( ), ( ) 1 ( t t t t t x g y u x f x (1)

onde f e g são funções não lineares, x(t)é o vetor de estados e u(t) são as entradas do sistema e y(t) são as saídas do modelo de previsão. No modelo desenvolvido, os estados são considerados como cópias defasadas da saída, onde: ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − = ) 2 ( ) 1 ( ) ( t t t y y x (2) A função de saída g é considerada a identidade, de forma que a estrutura matemática do modelo pode ser rescrita como:

(

( 1), ( 2), ()

)

(t f yt y t ut

y = − − (3)

Diversos métodos para previsão de modelos hidrológicos têm sido propostas na literatura (Srinivasulu e Jain, 2006; Nayaka e Ramasastri, 2004). Na modelagem empregada para o modelo de previsão de vazões naturais totais diárias, utilizou‐ se um modelo fuzzy recorrente, (Evsukoff e Ebecken, 2004; Gama et al. 2007), no qual as regras fuzzy são escritas como: r k j i θ t então B é t e A é t e A é t Se = − − ) ( ) ( ) 2 ( ) 1 ( y u y y (4) onde B são conjuntos fuzzy definidos no domínio j da variável de entrada (precipitação acumulada) e

i

A e A são conjuntos fuzzy definidos no domínio j da variável de saída (vazão natural total diária). Os parâmetros θ são as saídas para cada uma das k

M

r=1... regras.

Para a construção das regras do modelo, foram utilizados cinco conjuntos fuzzy na partição da variável de entrada (precipitação acumulada) e dois conjuntos fuzzy para a variável de saída (vazão natural total diária). Para a interpretação dos conjuntos fuzzy, foram utilizados os seguintes termos lingüísticos:  MP: “Muito Pequeno”  PE: “Pequeno”  ME: “Médio”  GR: “Grande”  MG: “Muito Grande”

A parametrização dos conjuntos fuzzy da partição das variáveis de entrada utilizou os valores dos percentis p10%, p25%, p50%, p75% e p90%, como mostra a Figura 7. Os conjuntos fuzzy para a vazão natural total utilizou os valores mínimo e máximo das vazões observadas (Figura 8). p10% p25% p50% p75% p90% ) ( x μ )( x μ _MP _PE _ME _GR _MG Figura 7: Partições fuzzy das variáveis de precipitação min max ) ( x μ( x) μ _B _A Figura 8: Partições fuzzy das variáveis de saída. O modelo resultante desta estrutura é representado por M =20 regras e, conseqüentemente, deve ser ajustado por 20 parâmetros de saída de regras.

3.2 Homogeneização das Séries de Precipitação

As séries de precipitação observada representam medidas localizadas sobre as coordenadas dos pluviômetros, enquanto que a precipitação prevista é calculada sobre as coordenadas da grade. Para poder ajustar um modelo com os dados observados e testá‐lo com os dados preditos pelo modelo ETA, é necessário homogeneizar as coordenadas de precipitação observada e prevista. A homogeneização das variáveis foi realizada em duas etapas:

1. calcular os valores de precipitação prevista sobre as coordenadas dos pluviômetros; e 2. utilizar uma média (ponderada) da

precipitação medidas nos pluviômetros como entrada dos modelos.

(6)

conforme mostrado na Figura 9, onde

(

xi,yj

)

representa as coordenadas do ponto de grade ( ji, ) e

(

x ,P yP

)

representa as coordenadas do pluviômetro P. N L S O xi xi+1 j y 1 + j y P x P y ) , ( ji (i+1,j) ) 1 , (i j+ (i+ j1, +1) P N L S O x_i xi+1 j y 1 + j y P x P y ) , ( ji (i+1,j) ) 1 , (i j+ (i+ j1, +1) P Figura 9: Localização de um pluviômetro entre quatro pontos de grade.

Para todos os pluviômetros, sempre existirão quatro pontos de grade próximos, embora existam pontos de grade sem pluviômetros próximos, o que prejudica a estimativa da precipitação observada sobre as coordenadas da grade.

Para a interpolação linear, calculam‐se inicialmente os coeficientes de interpolação associados às coordenadas dos pluviômetros e pontos de grade próximos como: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + j j j P i i i P j i _y _y y y x x x x 1 1 ) , ( μ . (5) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + j j j P i i P i j i _y _y y y x x x x 1 1 1 ) , 1 ( μ . (6) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + j j P j i i i P j i y y y y x x x x 1 1 1 ) 1 , ( μ . (7) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + + + j j P j i i P i j i y y y y x x x x 1 1 1 1 ) 1 , 1 ( μ . (8)

O cálculo da estimativa da precipitação prevista sobre a coordenada do pluviômetro é calculado pela contribuição dos quatro pontos de grade adjacentes, ponderados pelos respectivos coeficientes de interpolação: ) 1 , 1 ( 1 1 ) 1 , ( 1 ) , 1 ( 1 ) , ( ) , ( ˆ ) , ( ˆ ) , ( ˆ ) , ( ˆ ) , ( ˆ + + + + + + + + + + + = j i j i j i ij j i j i j i ij P d k w d k w d k w d k w d k u μ μ μ μ (9)

Os cálculos acima permitem a homogeneização espacial entre as séries de precipitação observada e prevista, uma vez que levam em consideração apenas as coordenadas geográficas dos pontos de grade e pluviômetros. Do ponto de vista temporal, as séries de precipitação observada são diárias, enquanto que as séries de precipitação prevista são calculadas semanalmente para dez dias de previsão. Desprezando‐se os três últimos dias de previsão, podem‐se gerar séries de precipitação prevista diárias, estimadas sobre as coordenadas dos pluviômetros, como uˆP(t)=uˆP(k,d), considerando: 7 .. 1 , 1 7 / ) ( + + 0 + = = t d d d k (10)

onde d é o índice do primeiro registro 0

correspondente a uma quarta‐feira no intervalo considerado. No caso das séries de precipitação prevista fornecidas, d₀=3, pois a primeira quarta‐ feira de 1996 ocorreu no dia 03 de janeiro.

3.3 Pluviômetros Utilizados para o Cálculo da Previsão de Vazão Incremental

Fisicamente, apenas os pluviômetros localizados nas áreas de drenagem correspondentes a cada aproveitamento deveriam ser considerados. Esta abordagem resulta, na maioria dos casos, na seleção de apenas um pluviômetro para a entrada do modelo, sendo que, no caso de Salto Osório, nenhum pluviômetro seria selecionado.

(7)

Para a seleção dos pluviômetros associados a cada aproveitamento, diversas alternativas foram testadas: a seleção baseada na Análise de Componentes Principais (ACP), a seleção baseada no agrupamento de dados pelo método k‐means e a seleção baseada nos dois vizinhos mais próximos. A abordagem que resultou no menor erro foi a abordagem baseada nos dois vizinhos mais próximos. Desta forma, foram selecionados os dois pluviômetros a montante de cada aproveitamento como entrada dos modelos de vazão natural incremental, como mostram as Figuras 14, 15 e 16. No caso da vazão natural incremental de Salto Osório, que não tinha nenhum pluviômetro localizado em sua área de drenagem, foram selecionados os mesmos pluviômetros do cálculo do modelo de vazão incremental de Salto Santiago. Figura 10: Seleção para o modelo do Desvio Jordão. Figura 11: Seleção para o modelo de Segredo. Figura 12: Seleção para os modelos de Salto Santiago e Salto Osório. 3.4 Identificação dos Modelos A identificação de um modelo de dados é realizada em quatro etapas:

1. organização do conjunto de dados para treinamento, teste e validação;

2. identificação da estrutura do modelo, desenvolvida em três etapas;

3. determinação dos parâmetros do modelo a partir de um conjunto de dados de treinamento representativo do sistema; e

4. validação do modelo, considerando‐se os objetivos do modelo, se para predição, simulação, controle, diagnóstico, etc.

A particularidade do presente estudo é que os dados de entrada do modelo, que correspondem aos valores das séries de precipitação, podem ser obtidos a partir das séries observadas ou previstas pelo modelo ETA. A estratégia a ser adotada neste projeto é utilizar as séries de precipitação observada para a identificação dos parâmetros dos modelos e as séries de precipitação prevista para testes e validação.

De uma forma geral, o modelo de um sistema real é identificado a partir de um conjunto de dados de treinamento T1=

{

(

u(t),v(t)

)

,t=1,KN1

}

. No caso do

presente estudo, cada registro t=1,KN1, a saída

) (t

v corresponde às vazões naturais e a entrada )

(t

u corresponde às séries de precipitação. Em geral considera‐se também um conjunto de testes

(

)

{

2

}

2 (t), (t),t 1, N

T = u v = K e um conjunto de validação T3=

{

(

u(t),v(t)

)

,t=1,KN3

}

. A diferença

entre o conjunto de testes e validação é que o conjunto de teste pode ser utilizado para apoiar o desenvolvimento do modelo, e o conjunto de validação representa um conjunto de dados não utilizados e que representam os dados de operação do modelo. O desempenho do modelo deverá ser aferido sobre os dados de validação.

(8)

relacionados à freqüência dos fenômenos meteorológicos.

Para o ajuste dos modelos, os conjuntos de treinamento, testes e validação deverão ser montados com as séries de dados de precipitação separadas de acordo com a decomposição estrutural da bacia e a variável de vazão correspondente. Esta montagem leva em consideração que um pluviômetro localizado a jusante de uma UHE não pode ser considerado para o cálculo desta vazão. Foram desenvolvidos 16 modelos no total: um para cada aproveitamento de vazão natural total, no horizonte diário e semanal; e um para cada aproveitamento de vazão natural incremental, também nos horizontes diário e semanal.

Treinamento Testes Validação

1992 1996 1998 2002

Treinamento Testes Validação

1992 1996 1998 2002

Figura 13: Representação esquemática dos conjuntos de treinamento, testes e validação

Para o ajuste dos parâmetros dos modelos foi utilizado um algoritmo genético (Evsukoff e Ebecken, 2003) que permite grande flexibilidade na escolha da estrutura do modelo, o que foi importante durante o desenvolvimento. Os resultados obtidos são apresentados a seguir.

4 RESULTADOS

A codificação do modelo no banco de dados foi realizada no Oracle versão 10. O modelo foi codificado na linguagem PL/SQL, que é a linguagem de banco de dados da Oracle. Os programas ficam armazenados no próprio banco de dados.

Para a comparação dos resultados dos modelos, foram utilizadas quatro métricas de erro para a comparação dos modelos: O erro RMS, definido como:

(

)

∑

= − = N t t t N RMS .. 1 2 ) ( ) ( 1 v y (11) O erro MAPE, definido como:

∑

= − = N t t t t N MAPE .. 1 () ) ( ) ( 100 v v y (12)

 O Coeficiente de Eficiência de Nash, definido como:

(

)

(

)

∑

= = − − − = N t N t t t t R .. 1 2 .. 1 2 2 ) ( ) ( ) ( 1 v v v y (13)  O Coeficiente de Eficiência de Nash aplicado aos logaritmos, definido como:

( )

(

)

( )

(

)

∑

= = − − − = N t N t t t t R .. 1 2 .. 1 2 2 log ) log( ) ( log ) ( log ) ( log 1 v v v y (14)

Os termos v e log(v) referem‐se respectivamente às médias dos valores observados de vazão e às médias do logaritmo dos valores observados de vazão.

A seguir, são apresentados os resultados de desempenho dos modelos de previsão de vazão nos horizontes diário e semanal. Para se ter uma melhor avaliação do tipo de erro obtido, os modelos foram executados considerando a chuva observada e prevista como entrada.

4.1 Resultados de Previsão Diária

4.1.1 Vazões Naturais Totais

Na Figura 14, apresentam‐se os resultados de previsão de vazão natural total para a UHE de Foz do Areia, obtidos para as quatro métricas de erro definidas pelas equações (11) a (14).

(9)

Erro RMS 0 100 200 300 400 500 600 0 2 4 6 8 10 12 14 Dia m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 5 10 15 20 25 30 35 40 45 0 2 4 6 8 10 12 14 Dia % Modelo.PRV Modelo.OBS Coef. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Coef. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Figura 14: Resultados do modelo de Foz do Areia.

Os hidrogramas para o primeiro e último são apresentados, respectivamente, na Figura 15 e na Figura 16. Nestas figuras, os resultados do modelo nas duas situações de chuva descritas acima são confrontados com os valores de vazão natural observada no aproveitamento. Pode‐se observar que, mesmo para o 12º dia de previsão e utilizando os valores de chuva prevista como entrada, o modelo é capaz de descrever adequadamente a dinâmica do sistema. 0 500 1000 1500 2000 2500 3000 3500 4000

4-Jan-96 1-Oct-96 29-Jun-97 27-Mar-98 24-Dec-98 21-Sep-99 18-Jun-00 16-Mar-01 13-Dec-01

Observada Modelo.OBS Modelo.PRV Figura 15: Hidrograma o para 1º dia de previsão de Foz do Areia. 0 500 1000 1500 2000 2500 3000 3500 4000 4500

4-Jan-96 1-Oct-96 29-Jun-97 27-Mar-98 24-Dec-98 21-Sep-99 18-Jun-00 16-Mar-01 13-Dec-01

(10)

4.1.2 Vazões Naturais Incrementais

A previsão de vazões naturais incrementais diárias foi prejudicada pela falta de informações mais completas sobre a chuva em cada sub‐bacia. Além disso, as características dinâmicas das variáveis de vazão incremental diárias, levantadas nos estudos preliminares, mostraram que este problema seria mais complexo que o anterior.

Os resultados dos modelos apresentaram um desempenho inferior aos modelos de previsão de vazões totais. A Figura 17 mostra os resultados obtidos para Segredo. Erro RMS 0 20 40 60 80 100 120 140 160 180 200 0 2 4 6 8 10 12 14 Dia m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 10 20 30 40 50 60 0 2 4 6 8 10 12 14 Dia % Modelo.PRV Modelo.OBS Coef. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Coe f. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Figura 17: Resultados do modelo de Segredo. 4.2 Resultados de Previsão Semanal

O modelo fuzzy recorrente, apresentado na seção 3.1, utiliza como entrada, além dos valores de precipitação, os valores de vazão calculados nos dois passos anteriores (ver eq. (3)). Desta forma, para o cálculo das médias semanais referentes aos últimos dias de previsão, é necessária a simulação utilizando as médias desde o primeiro dia de previsão, como mostrado na Figura 18. 1 2 3 4 5 6 7 8 9 10 11 12 0 -1 -2 -3 -4 -5 ... Semana 1 Semana 2 Semana 3 Semana 4 Semana 5 Semana 11 Semana 10 Semana 9 Semana 8 Semana7 Semana 6 Semana 12 1 2 3 4 5 6 7 8 9 10 11 12 0 -1 -2 -3 -4 -5 ... -5 -4 -3 -2 -1 0 11 22 33 44 55 66 77 8 9 10 11 12 ... Semana 1 Semana 2 Semana 3 Semana 4 Semana 5 Semana 11 Semana 10 Semana 9 Semana 8 Semana7 Semana 6 Semana 12 Figura 18: Cálculo das médias semanais. Os modelos de previsão semanal utilizam dados de médias semanais que agem como filtros sobre os

valores diários das variáveis. Desta forma, o desempenho dos modelos semanais é melhor que o desempenho dos modelos diários, como apresentado a seguir.

4.2.1 Vazões Naturais Totais

Os resultados de previsão de vazão natural total semanal para a UHE de Foz do Areia, calculados de acordo com as métricas de erro definidas pelas equações (11) a (14) são apresentados na Figura 19. O efeito da filtragem provocada pelo cálculo das médias semanais pode ser observado comparando‐ se a Figura 19 com a Figura 14. Erro RMS 0 50 100 150 200 250 300 350 400 450 500 0 2 4 6 8 10 12 14 SEM m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 5 10 15 20 25 30 35 40 45 0 2 4 6 8 10 12 14 SEM % Modelo.PRV Modelo.OBS Coe f. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 SEM R 2 Modelo.PRV Modelo.OBS Coe f. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 SEM R 2 Modelo.PRV Modelo.OBS Figura 19: Resultados do modelo de Foz do Areia. 4.2.2 Vazões Naturais Incrementais

(11)

5 CONCLUSÕES

O desenvolvimento dos modelos de vazão para a bacia do Rio Iguaçu foi realizado utilizando técnicas de OLAP e mineração de dados, codificado de forma integrada num ambiente de banco de dados, de alta capacidade de armazenamento. Esta integração é uma tendência recente, que garante a compatibilidade dos desenvolvimentos futuros e traz confiabilidade à atividade de previsões em todas as áreas da engenharia. Os resultados numéricos mostram que o modelo é robusto e apresenta um bom desempenho para todos os tipos de variáveis consideradas.

Este trabalho abre perspectivas para a continuidade de desenvolvimento em diversas direções como, por exemplo, uma abordagem completa capaz de levar em consideração os acoplamentos entre as variáveis de vazão.

REFERÊNCIAS BIBLIOGRÁFICAS

Evsukoff, A. e Ebecken, N. F. F. Mineração de dados de recursos hídricos. R. C. V. da Silva (editor) Métodos Numéricos em Recursos Hídricos,

vol. 6. ABRH/COPPETEC, 2003.

Evsukoff, A. G. e Ebecken, N. F. F. “Identification of recurrent fuzzy systems with genetic algorithms”. Proceedings of IEEE International

Conference on Fuzzy Systems, pp. 1703 ‐ 1708 vol.3,

2004.

Gama, C. A.; Evsukoff, A. G.; Weber, P. e Ebecken, N. F. F. “Parameter Identification of Recurrent Fuzzy Systems with Fuzzy Finite‐State Automata Representation”. Aceito para publicação em IEEE

Transactions of Fuzzy Systems, 2007.

Han, J. e Kamber, M. Data Mining: Concepts and

Techniques. Morgan Kaufmann, 2001

Harinarayan, V.; Rajaraman, A. e Ullman, J. D. “Implementing data cubes efficiently”. In

Proceedings of the ACM SIGMOD International Conference on Management of Data, Vol. 2 of ACM

SIGMOD Record, pp. 205‐216, 1996.

Srinivasulu S. e Jain, A. “A comparative analysis of training methods for artificial neural network rainfall–runoff models”, Applied Soft Computing, Vol. 6, pp. 295–306, 2006.

Nayaka, P.C. e Ramasastri, K. S. “A neuro‐fuzzy computing technique for modeling hydrological

Uma Abordagem de Mineração de Dados para a Previsão de Vazões com Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu