• Nenhum resultado encontrado

Uma Abordagem de Mineração de Dados para a Previsão de Vazões com Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu

N/A
N/A
Protected

Academic year: 2021

Share "Uma Abordagem de Mineração de Dados para a Previsão de Vazões com Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu"

Copied!
11
0
0

Texto

(1)

Uma Abordagem de Mineração de Dados para a Previsão de Vazões com 

Incorporação de Previsão de Precipitação da Bacia do Rio Iguaçu 

Alexandre G. Evsukoff

1

, Nelson F. F. Ebecken

1

, Fabio T. de Souza

1

,  

Marcello P. Alegre

1

, Guilherme S. Terra

1

, Geraldo M. Tavares

2

, Antônio F. da Hora

2

 

 

1

COPPE/Universidade Federal do Rio de Janeiro, 

Caixa Postal 68506, 21945‐970 Rio de Janeiro, RJ 

2

LEV/Universidade Federal Fluminense 

22283‐900 Niterói, RJ 

  RESUMO 

Neste  trabalho,  apresenta‐se  o  desenvolvimento  de  modelos  de  previsão  de  vazões  para  a  bacia  do  Rio  Iguaçu, utilizando lógica fuzzy e técnicas de bancos de dados para permitir acesso e visualização dos dados.  O  modelo  utiliza  dados  de  previsão  de  precipitação  de  dez  dias  à  frente  fornecidos  pelo modelo  ETA.  Os  resultados  numéricos  mostram  que  o  modelo  é  robusto  e  apresenta  um  bom  desempenho  para  todos  os  aproveitamentos considerados. O protótipo foi integrado a um ambiente de banco de dados comercial, com  grande capacidade de armazenamento, o que agrega confiabilidade e praticidade à solução proposta.   

1

INTRODUÇÃO 

O  desenvolvimento  de  modelos  precisos  de  previsão de vazões é de grande importância para o  planejamento  operacional  das  usinas  do  Sistema  Interligado Nacional. 

No  final  de  2004  o  Operador  Nacional  do  Sistema  (ONS),  responsável  pelo  planejamento  operacional  do  Sistema  Interligado  Nacional  (SIN),  lançou  uma  demanda para modelos de previsão de vazões com  incorporação  de  previsão  de  precipitação.  Este  trabalho  apresenta  um  dos  modelos  selecionados  pelo  ONS  para  dar  suporte  ao  planejamento  operacional.  O  modelo  foi  desenvolvido  para  a  previsão  de  vazões  para  a  bacia  do  Rio  Iguaçu.  O  modelo utiliza dados de previsão de precipitação de  dez  dias  a  frente  fornecidos  pelo  modelo  de  previsão  ETA.  O  desenvolvimento  do  modelo  foi  realizado  utilizando  a  metodologia  de  Extração  de  Conhecimento em Bases de Dados. 

A  Extração  de  Conhecimento  em  Bases  de  Dados  (ou Knowledge Discovery in Databases) é o processo de  extrair  informação  válida,  previamente  desconhecida  e  de  máxima  abrangência  a  partir  de  grandes  bases  de  dados.  Devido  a  essas 

características  incomuns,  todo  o  processo  de  Extração  de  Conhecimento  depende  de  uma  nova  geração  de  ferramentas  e  técnicas  de  análise  de  dados,  envolvendo  diversas  etapas:  Definição  do  Problema,  Pré‐processamento  de  dados;  Mineração  (Análise)  de  Dados  e  Interpretação  (Evsukoff  e  Ebecken, 2003; Han e Kamber, 2001). 

O  processo  de  Extração  de  Conhecimento  começa,  obviamente,  com  o  entendimento  do  domínio  da  aplicação e dos objetivos finais a serem atingidos. O  sucesso  do  processo  de  Extração  de  Conhecimento  depende,  em  parte, da  participação de especialistas  do  domínio  e  apoio  aos  analistas  em  sua  tarefa  de  encontrar padrões.  

(2)

  Figura 1: Extração de Conhecimento 

Os  fenômenos  hidrológicos  são  extremamente  complexos,  não  lineares  e  têm  um  alto  grau  de  variabilidade  espacial  e  temporal.  O  modelo  desenvolvido permite que a solução proposta possa  ser empregada em problemas de grande porte, bem  como  ser  adequada  para  tratar  diversos  horizontes  temporais. 

O  desenvolvimento  metodológico  é  baseado  em  técnicas de mineração de dados e tem o seu esquema  geral representado na Figura 2.   BD TELEMETRIA ETA MODELO DE PREVISÃO OLAP Figura 2: Esquema geral da proposta metodológica  A  Base  de  Dados  (BD)  do  sistema  representa  o  repositório  a  partir  do  qual  foram  selecionados  os  dados  para  o  desenvolvimento  do  projeto  e  que  também  será  utilizado  na  operacionalização  do  sistema.  A  BD  é  composta  pelos  dados  de  pluviômetros e medidores de vazão ligados em um  sistema  automático  de  aquisição  de  dados.  Além  disso,  a  BD  armazena  também  os  dados  de  previsões  semanais  do  modelo  ETA,  que  também  deverão ser utilizados para as previsões de vazão.   Neste artigo, são abordados os seguintes modelos: 

ƒ

Modelo de Dados 

ƒ

Modelo de Previsão 

O modelo de dados é representado pelo cubo OLAP  (On‐Line  Analytical  Processing)  e  é  uma  tecnologia  que  explora  os  dados  em  um  formato  multidimensional.  O  modelo  de  previsão  utilizado  foi  um  modelo  fuzzy  recorrente,  desenvolvido  recentemente (Evsukoff e Ebecken, 2004). 

A  solução  completa  inclui  ainda  os  modelos  de  imputação  de  dados,  para  o  preenchimento  de  dados ausentes, e um módulo análise de incertezas  que não serão abordados neste artigo. 

A  continuação  deste  artigo  está  organizada  da  seguinte forma: a seguir, apresenta‐se sucintamente  a  bacia  do  Rio  Iguaçu,  bem  como  os  dados  fornecidos  para  o  desenvolvimento  do  projeto  e  o  modelo  de  dados;  na  Seção  3,  é  apresentado  o  modelo  não linear  de  previsão  de  vazões;  na  Seção  4,  apresentam‐se  os  resultados  obtidos;  e,  finalmente,  a  Seção  5  apresenta  as  conclusões  do  trabalho. 

2

O MODELO DE DADOS 

2.1 Dados fornecidos 

Para  a  realização  do  trabalho,  foram  utilizadas  as  séries  históricas  de  vazões  naturais  totais  e  incrementais  de  quatro  Usinas  Hidrelétricas  (UHEs):  Foz  do  Areia,  Segredo,  Salto  Santiago  e  Salto Osório, além da vazão natural total do Desvio  do  Rio  Jordão.  Além  disso,  foram  fornecidas,  também,  as  séries  históricas  de  30  pluviômetros  sobre a área da bacia.  

O  objetivo  do  projeto  foi  o  desenvolvimento  de  modelos  de  previsão  de  vazões  incorporando  informações  de  previsão  de  precipitação.  Para  isso,  foram  também  fornecidas  as  previsões  do  modelo  ETA para a chuva acumulada em 24h, numa grade  de 40km x 40km, entre 1996 e 2001.  

Os  dados  foram  fornecidos  em  uma  série  de  arquivos, em que cada arquivo de dados continha a  previsão  de um dia de  previsão. A grade  fornecida  em cada arquivo cobria uma área muito maior que a  bacia.  A  grade  do  modelo  foi  reduzida  para  a  área  sobre  a  bacia,  considerando  apenas nx=15  pontos  na direção Leste‐Oeste, entre as Longitudes ‐49º e ‐ 54.6º,  e  ny=6  na  direção  Norte‐Sul,  entre  as  Latitudes ‐25º e ‐27º. 

(3)

da  grade  selecionada,  ordenados  de  Oeste  para  Leste  e  de  Sul  para  Norte,  totalizando  nx.ny=90  colunas. 

2.2 Cubo OLAP 

A tecnologia OLAP (On‐Line Analytical Processing) é  uma  de  banco  de  dados  que  explora  os  dados  em  um formato multidimensional, de onde se visualiza  os dados em diferentes perspectivas e em diferentes  níveis  de  agregação  (Han  e  Kamber,  2001;  Harinarayan  et  al.,  1996).  A  análise  OLAP  é  interativa  e  guiada  pelo  usuário.  Geralmente,  a  análise OLAP é realizada em dados de um banco de  dados  chamado  Datamart,  que  é  mantido  separadamente  dos  sistemas  operacionais  de  uma  empresa,  na  qual  os  dados  estão  em  uma  forma  consolidada.  

No  Datamart,  utiliza‐se  o  modelo  de  dados  multidimensional, conhecido como modelo estrela (  Figura  3).  Neste  modelo,  uma  tabela  de  dados  central  possui  os  dados  das  medidas  (assunto  que  estamos  analisando,  no  nosso  caso,  vazões  e  medidas pluviométricas). Esta  tabela é chamada de  Tabela  Fato,  na  qual  se  conectam  as  tabelas  de  referências,  cujos dados  referenciam  às medidas da  Tabela  Fato.  Estas  tabelas  são  chamadas  de  dimensões (no nosso caso, temos dimensão tempo e  local).  Tabela Fato medida 1 medida 2 medida n Dimensão 1 atributos Dimensão 2 atributos Dimensão 3 atributos   Figura 3: Formato do modelo de dados estrela.  Logo,  as  medidas  são  indexadas  pelas  dimensões,  ou  seja,  as  dimensões  são  únicas  para  determinar  uma medida. 

As dimensões podem ser hierárquicas, por exemplo,  a  dimensão  tempo  que  possui  uma  hierarquia  de  ano,  mês  e  dia.  Logo,  podemos  ter  medidas  vistas 

por dia, por mês e por ano, ou seja, os dados podem  ser vistos em diferentes perspectivas.  

A partir do modelo estrela podemos construir cubos  de dados por meio de ferramentas OLAP. Os cubos  de  dados  são  visões  lógicas  multidimensionais  dos  dados  com  referência  hierárquica.  As  ferramentas  OLAP  fornecem  funcionalidades  para  análise  interativa  de  dados  em  diferentes  visões  e  granularidades. 

A  essência  do  OLAP  se  dá  pela  eficiente  computação  das  agregações  dos  diversos  conjuntos  de  dimensões  do  cubo  de  dados.  Estas  agregações  são referenciadas em SQL como group by. 

As  operações  no  cubo  de  dados  são  chamadas  operações  OLAP,  por  meio  das  quais  se  consegue  flexibilidade  durante  as  consultas  aos  dados  no  cubo.  

Conseqüentemente, o cubo de dados é formado por  medidas  numéricas  para  análise  e  um  conjunto  de  dimensões que define a medida. 

As principais operações OLAP são: 

• Roll‐up:  ocorre  diminuição  do  nível  de  detalhe  da informação (Ex.: passagem de mês para ano).  • Drill‐down: ocorre aumento do nível de detalhe  da informação (Ex.: passagem de ano para mês).  • Slice/Dice:  visualizar  sub‐cubos  do  cubo  de 

dados (Ex.: ver dados do ano de 2002). 

• Pivot: alterar linhas por colunas na visualização  de resultados. 

O modelo estrela elaborado para os dados de vazão  está  mostrado  na  Figura  4,  na  qual  podemos  ver  a  tabela  Fato,  chamada  de  vazão,  contendo  as  medidas: vazão medida e vazão prevista.  

(4)

possui  uma  chave  única  (PK),  que  identifica  unicamente o registro na tabela de dados. As chaves  únicas  das  dimensões  tempo  e  local  são  dia  e  usina_id, respectivamente.   vazão PK,FK2 dia PK,FK1 usina_id vazao medida vazao prevista soma chuva medida soma chuva prevista tempo PK dia semana ano local PK usina_id nome usina bacia Figura 4: Modelo estrela dos dados vazão.  A conexão entre as dimensões e a Tabela Fato ocorre  pela utilização de chaves estrangeiras (FK), que são  a migração das chaves únicas das dimensões para a  Tabela  Fato.  A  união  das  chaves  estrangeiras  na  Tabela Fato forma a sua chave única. 

Para  os  dados  de  índices pluviométricos,  o  modelo  estrela está mostrado na Figura 5, na qual podemos  ver  a  Tabela  Fato,  chamada  de  pluviometria,  contendo a medida: índice medido.   pluviometria PK,FK2 dia PK,FK1 pluvi_id indice medida indice previsto tempo PK dia semana ano local PK pluvi_id nome pluviometro usina bacia Figura 5: Modelo estrela dos dados de índices  pluviométricos.  Foi criado mais um campo para conter os dados de  índice previsto que serão fornecidos pelo modelo de  previsão,  e  assim  teremos  os  dados  medidos  e  previstos  armazenados  no  banco  de  dados  e  disponibilizados para análise OLAP.  

As dimensões desta tabela Fato são tempo e local. A  dimensão tempo é a mesma utilizada no modelo de 

vazão.  A  dimensão  local  possui  os  níveis  pluviômetro,  usina  e  bacia  e  a  hierarquia  nesta  mesma ordenação. As chaves únicas das dimensões  tempo e local são dia e pluvi_id, respectivamente.   Os dados utilizados no projeto estão na forma mais  detalhada  do  modelo,  ou  seja,  dados  diários  e  por  usina  ou  pluviômetro.  Para  cálculo  e  visualização  das medidas em outros níveis hierárquicos (semana,  ano  ou  bacia),  devemos  realizar  agregações  nos  dados.  

No  caso  de  vazão,  não  faz  sentido  agregarmos  vazões  por  bacia  (sumarizar  as  vazões  de  todas  as  usinas).  Neste  caso,  podemos  usar  outra  função  de  agregação,  por  exemplo,  média.  Pode‐se  usar  para  uma  mesma  medida  mais  de  uma  função  de  agregação.  A  TABELA  1  mostra  as  funções  de  agregação utilizadas. 

TABELA 1: Funções de agregação usadas. 

MEDIDA  DIM. TEMPO  DIM. LOCAL 

VAZÃO  MÉDIA  MÉDIA 

CHUVA  SOMA e MÉDIA  SOMA e MÉDIA 

 

3

DESCRIÇÃO DO MODELO 

O  sistema  natural  das  vazões  natural  total  e  incremental  da  bacia  é  acoplado,  conforme  mostrado  na  Figura  6.  A  identificação  do  modelo  acoplado  é  bem  mais  complexa  e  não  foi  abordada  neste  trabalho.  As  variáveis  de  vazão  são  consideradas  independentes  e,  desta  forma,  há  um  modelo  para  cada  aproveitamento,  tanto  para  as  previsões diárias, como para as semanais.  Segredo Foz do Areia S. Osório S. Santiago Desvio Jordão Segredo S. Santiago S. Osório Segredo Foz do Areia S. Osório S. Santiago Desvio Jordão Segredo S. Santiago S. Osório   Figura 6: Acoplamento entre as variáveis.  3.1 O Modelo Fuzzy Recorrente 

(5)

(

)

( )

⎩ ⎨ ⎧ = = + ) ( ) ( ) ( ), ( ) 1 ( t t t t t x g y u x f x   (1) 

onde  f  e  g  são funções não lineares, x(t)é o vetor  de estados e u(t) são as entradas do sistema e y(t)  são  as  saídas  do  modelo  de  previsão.  No  modelo  desenvolvido,  os  estados  são  considerados  como  cópias defasadas da saída, onde:  ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − = ) 2 ( ) 1 ( ) ( t t t y y x   (2)  A função de saída  g  é considerada a identidade, de  forma que  a estrutura  matemática  do  modelo pode  ser rescrita como: 

(

( 1), ( 2), ()

)

)

(t f yt y t ut

y = − −   (3)

Diversos  métodos  para  previsão  de  modelos  hidrológicos  têm  sido  propostas  na  literatura  (Srinivasulu  e  Jain,  2006;  Nayaka  e  Ramasastri,  2004). Na modelagem empregada para o modelo de  previsão  de  vazões  naturais  totais  diárias,  utilizou‐ se  um  modelo  fuzzy  recorrente,  (Evsukoff  e  Ebecken,  2004;  Gama  et  al.  2007),  no  qual  as  regras  fuzzy são escritas como:  r k j i θ t então B é t e A é t e A é t Se = − − ) ( ) ( ) 2 ( ) 1 ( y u y y (4) onde B  são conjuntos fuzzy definidos no domínio j da  variável  de  entrada  (precipitação  acumulada)  e 

i

A  e A  são conjuntos fuzzy definidos no domínio j da variável de saída (vazão natural total diária). Os  parâmetros  θ   são  as  saídas  para  cada  uma  das k

M

r=1...  regras. 

Para  a  construção  das  regras  do  modelo,  foram  utilizados  cinco  conjuntos  fuzzy  na  partição  da  variável de entrada (precipitação acumulada) e dois  conjuntos  fuzzy  para  a  variável  de  saída  (vazão  natural  total  diária).  Para  a  interpretação  dos  conjuntos  fuzzy,  foram  utilizados  os  seguintes  termos lingüísticos:  ƒ MP: “Muito Pequeno”  ƒ PE: “Pequeno”  ƒ ME: “Médio”  ƒ GR: “Grande”  ƒ MG: “Muito Grande” 

A  parametrização  dos  conjuntos  fuzzy  da  partição  das  variáveis  de  entrada  utilizou  os  valores  dos  percentis  p10%,  p25%,  p50%,  p75%  e  p90%,  como  mostra a Figura 7. Os conjuntos fuzzy para a vazão  natural  total  utilizou  os  valores  mínimo  e  máximo  das vazões observadas (Figura 8).  p10% p25% p50% p75% p90% ) ( x μ )( x μ MP PE ME GR MG   Figura 7: Partições fuzzy das variáveis de  precipitação  min max ) ( x μ( x) μ B A   Figura 8: Partições fuzzy das variáveis de saída.  O modelo resultante desta estrutura é representado  por  M =20  regras  e,  conseqüentemente,  deve  ser  ajustado por 20 parâmetros de saída de regras. 

3.2 Homogeneização das Séries de  Precipitação 

As  séries  de  precipitação  observada  representam  medidas  localizadas  sobre  as  coordenadas  dos  pluviômetros, enquanto que a precipitação prevista  é  calculada  sobre  as  coordenadas  da  grade.  Para  poder ajustar um modelo com os dados observados  e testá‐lo com os dados preditos pelo modelo ETA, é  necessário  homogeneizar  as  coordenadas  de  precipitação  observada  e  prevista.  A  homogeneização das variáveis foi realizada em duas  etapas: 

1. calcular  os  valores  de  precipitação  prevista  sobre as coordenadas dos pluviômetros; e  2. utilizar  uma  média  (ponderada)  da 

precipitação  medidas  nos  pluviômetros  como entrada dos modelos. 

(6)

conforme  mostrado  na  Figura  9,  onde 

(

xi,yj

)

  representa as coordenadas do ponto de grade ( ji, )  e 

(

x ,P yP

)

  representa  as  coordenadas  do  pluviômetro P.   N L S O xi xi+1 j y 1 + j y P x P y ) , ( ji (i+1,j) ) 1 , (i j+ (i+ j1, +1) P N L S O xi xi+1 j y 1 + j y P x P y ) , ( ji (i+1,j) ) 1 , (i j+ (i+ j1, +1) P   Figura  9:  Localização  de  um  pluviômetro  entre  quatro pontos de grade. 

Para todos os pluviômetros, sempre existirão quatro  pontos  de  grade  próximos,  embora  existam  pontos  de  grade  sem  pluviômetros  próximos,  o  que  prejudica  a  estimativa  da  precipitação  observada  sobre as coordenadas da grade. 

Para  a  interpolação  linear,  calculam‐se  inicialmente  os  coeficientes  de  interpolação  associados  às  coordenadas  dos  pluviômetros  e  pontos  de  grade  próximos como:  ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + j j j P i i i P j i y y y y x x x x 1 1 ) , ( μ .  (5)  ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + j j j P i i P i j i y y y y x x x x 1 1 1 ) , 1 ( μ .  (6) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + j j P j i i i P j i y y y y x x x x 1 1 1 ) 1 , ( μ .  (7)  ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = + + + + + + j j P j i i P i j i y y y y x x x x 1 1 1 1 ) 1 , 1 ( μ .  (8) 

O  cálculo  da  estimativa  da  precipitação  prevista  sobre a coordenada do pluviômetro é calculado pela  contribuição dos quatro pontos de grade adjacentes,  ponderados  pelos  respectivos  coeficientes  de  interpolação:  ) 1 , 1 ( 1 1 ) 1 , ( 1 ) , 1 ( 1 ) , ( ) , ( ˆ ) , ( ˆ ) , ( ˆ ) , ( ˆ ) , ( ˆ + + + + + + + + + + + = j i j i j i ij j i j i j i ij P d k w d k w d k w d k w d k u μ μ μ μ   (9) 

Os  cálculos  acima  permitem  a  homogeneização  espacial entre  as  séries  de  precipitação observada e  prevista,  uma  vez  que  levam  em  consideração  apenas  as  coordenadas  geográficas  dos  pontos  de  grade  e  pluviômetros.  Do  ponto  de  vista  temporal,  as  séries  de  precipitação  observada  são  diárias,  enquanto que as séries de precipitação prevista são  calculadas semanalmente para dez dias de previsão.  Desprezando‐se  os  três  últimos  dias  de  previsão,  podem‐se  gerar  séries  de  precipitação  prevista  diárias,  estimadas  sobre  as  coordenadas  dos  pluviômetros, como uˆP(t)=uˆP(k,d), considerando:  7 .. 1 , 1 7 / ) ( + + 0 + = = t d d d k   (10)

onde  d   é  o  índice  do  primeiro  registro 0

correspondente  a  uma  quarta‐feira  no  intervalo  considerado.  No  caso  das  séries  de  precipitação  prevista  fornecidas, d0=3,  pois a  primeira quarta‐ feira de 1996 ocorreu no dia 03 de janeiro. 

3.3 Pluviômetros Utilizados para o Cálculo  da Previsão de Vazão Incremental 

Fisicamente, apenas os pluviômetros localizados nas  áreas  de  drenagem  correspondentes  a  cada  aproveitamento  deveriam  ser  considerados.  Esta  abordagem resulta, na maioria dos casos, na seleção  de  apenas  um  pluviômetro  para  a  entrada  do  modelo,  sendo  que,  no  caso  de  Salto  Osório,  nenhum pluviômetro seria selecionado.  

(7)

Para  a  seleção  dos  pluviômetros  associados  a  cada  aproveitamento,  diversas  alternativas  foram  testadas:  a  seleção  baseada  na  Análise  de  Componentes  Principais  (ACP),  a  seleção  baseada  no agrupamento de dados pelo método k‐means e a  seleção baseada nos dois vizinhos mais próximos.   A  abordagem  que  resultou  no  menor  erro  foi  a  abordagem  baseada  nos  dois  vizinhos  mais  próximos.  Desta  forma,  foram  selecionados  os  dois  pluviômetros  a  montante  de  cada  aproveitamento  como  entrada  dos  modelos  de  vazão  natural  incremental,  como  mostram  as  Figuras  14,  15  e  16.  No  caso  da  vazão  natural  incremental  de  Salto  Osório,  que  não  tinha  nenhum  pluviômetro  localizado  em  sua  área  de  drenagem,  foram  selecionados os mesmos pluviômetros do cálculo do  modelo de vazão incremental de Salto Santiago.    Figura 10: Seleção para o modelo do Desvio Jordão.    Figura 11: Seleção para o modelo de Segredo.    Figura 12: Seleção para os modelos de Salto  Santiago e Salto Osório.  3.4 Identificação dos Modelos  A identificação de um modelo de dados é realizada  em quatro etapas: 

1. organização  do  conjunto  de  dados  para  treinamento, teste e validação; 

2. identificação  da  estrutura  do  modelo,  desenvolvida em três etapas; 

3. determinação dos parâmetros do modelo a partir  de  um  conjunto  de  dados  de  treinamento  representativo do sistema; e 

4. validação  do  modelo,  considerando‐se  os  objetivos  do  modelo,  se  para  predição,  simulação, controle, diagnóstico, etc. 

A  particularidade  do  presente  estudo  é  que  os  dados de entrada do modelo, que correspondem aos  valores  das  séries  de  precipitação,  podem  ser  obtidos  a  partir  das  séries  observadas  ou  previstas  pelo  modelo  ETA.  A  estratégia  a  ser  adotada  neste  projeto é utilizar as séries de precipitação observada  para  a  identificação  dos  parâmetros  dos  modelos  e  as  séries  de  precipitação  prevista  para  testes  e  validação.  

De uma forma geral, o modelo de um sistema real é  identificado  a  partir  de  um  conjunto  de  dados  de  treinamento T1=

{

(

u(t),v(t)

)

,t=1,KN1

}

.  No  caso  do 

presente  estudo,  cada  registro  t=1,KN1,  a  saída 

) (t

v   corresponde  às  vazões  naturais  e  a  entrada  )

(t

u  corresponde às séries de precipitação. Em geral  considera‐se  também  um  conjunto  de  testes 

(

)

{

2

}

2 (t), (t),t 1, N

T = u v = K   e  um  conjunto  de  validação  T3=

{

(

u(t),v(t)

)

,t=1,KN3

}

.  A  diferença 

entre  o  conjunto  de  testes  e  validação  é  que  o  conjunto  de  teste  pode  ser  utilizado  para  apoiar  o  desenvolvimento  do  modelo,  e  o  conjunto  de  validação  representa  um  conjunto  de  dados  não  utilizados e que representam os dados de operação  do  modelo.  O  desempenho  do  modelo  deverá  ser  aferido sobre os dados de validação. 

(8)

relacionados  à  freqüência  dos  fenômenos  meteorológicos. 

Para  o  ajuste  dos  modelos,  os  conjuntos  de  treinamento,  testes  e  validação  deverão  ser  montados  com  as  séries  de  dados  de  precipitação  separadas de acordo com a decomposição estrutural  da bacia e a variável de vazão correspondente. Esta  montagem  leva  em  consideração  que  um  pluviômetro  localizado  a  jusante  de  uma  UHE  não  pode ser considerado para o cálculo desta vazão.  Foram desenvolvidos 16 modelos no total: um para  cada  aproveitamento  de  vazão  natural  total,  no  horizonte  diário  e  semanal;  e  um  para  cada  aproveitamento  de  vazão  natural  incremental,  também nos horizontes diário e semanal.  

Treinamento Testes Validação

1992 1996 1998 2002

Treinamento Testes Validação

1992 1996 1998 2002

  Figura 13: Representação esquemática dos conjuntos  de treinamento, testes e validação 

Para  o  ajuste  dos  parâmetros  dos  modelos  foi  utilizado  um  algoritmo  genético  (Evsukoff  e  Ebecken, 2003) que permite grande flexibilidade na  escolha  da  estrutura  do  modelo,  o  que  foi  importante  durante  o  desenvolvimento.  Os  resultados obtidos são apresentados a seguir. 

4 RESULTADOS 

A  codificação  do  modelo  no  banco  de  dados  foi  realizada  no  Oracle  versão  10.  O  modelo  foi  codificado  na  linguagem  PL/SQL,  que  é  a  linguagem  de  banco  de  dados  da  Oracle.  Os  programas ficam armazenados no próprio banco de  dados.  

Para  a  comparação  dos  resultados  dos  modelos,  foram  utilizadas  quatro  métricas  de  erro  para  a  comparação dos modelos:  ƒ O erro RMS, definido como: 

(

)

= − = N t t t N RMS .. 1 2 ) ( ) ( 1 v y   (11) ƒ O erro MAPE, definido como: 

= − = N t t t t N MAPE .. 1 () ) ( ) ( 100 v v y   (12) 

ƒ O  Coeficiente  de  Eficiência  de  Nash,  definido  como: 

(

)

(

)

= = − − − = N t N t t t t R .. 1 2 .. 1 2 2 ) ( ) ( ) ( 1 v v v y   (13)  ƒ O Coeficiente de Eficiência de Nash aplicado aos  logaritmos, definido como: 

( )

( )

(

)

( )

(

)

= = − − − = N t N t t t t R .. 1 2 .. 1 2 2 log ) log( ) ( log ) ( log ) ( log 1 v v v y   (14) 

Os termos  v  e log(v) referem‐se respectivamente às  médias  dos  valores  observados  de  vazão  e  às  médias  do  logaritmo  dos  valores  observados  de  vazão. 

A  seguir,  são  apresentados  os  resultados  de  desempenho dos modelos de previsão de vazão nos  horizontes diário e semanal. Para se ter uma melhor  avaliação do tipo de erro obtido, os modelos foram  executados  considerando  a  chuva  observada  e  prevista como entrada. 

4.1 Resultados de Previsão Diária 

4.1.1 Vazões Naturais Totais 

Na  Figura  14,  apresentam‐se  os  resultados  de  previsão de vazão natural total para a UHE de Foz  do  Areia,  obtidos  para  as  quatro  métricas  de  erro  definidas pelas equações (11) a (14).  

(9)

Erro RMS 0 100 200 300 400 500 600 0 2 4 6 8 10 12 14 Dia m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 5 10 15 20 25 30 35 40 45 0 2 4 6 8 10 12 14 Dia % Modelo.PRV Modelo.OBS Coef. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Coef. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS   Figura 14: Resultados do modelo de Foz do Areia. 

Os  hidrogramas  para  o  primeiro  e  último  são  apresentados,  respectivamente,  na  Figura  15  e  na  Figura  16.  Nestas  figuras,  os  resultados  do  modelo  nas  duas  situações  de  chuva  descritas  acima  são  confrontados  com  os  valores  de  vazão  natural  observada  no  aproveitamento.  Pode‐se  observar  que, mesmo para o 12º dia de previsão e utilizando  os  valores  de  chuva  prevista  como  entrada,  o  modelo  é  capaz  de  descrever  adequadamente  a  dinâmica do sistema.    0 500 1000 1500 2000 2500 3000 3500 4000

4-Jan-96 1-Oct-96 29-Jun-97 27-Mar-98 24-Dec-98 21-Sep-99 18-Jun-00 16-Mar-01 13-Dec-01

Observada Modelo.OBS Modelo.PRV   Figura 15: Hidrograma o para 1º dia de previsão de Foz do Areia.  0 500 1000 1500 2000 2500 3000 3500 4000 4500

4-Jan-96 1-Oct-96 29-Jun-97 27-Mar-98 24-Dec-98 21-Sep-99 18-Jun-00 16-Mar-01 13-Dec-01

(10)

4.1.2 Vazões Naturais Incrementais  

A previsão de vazões naturais incrementais diárias  foi  prejudicada  pela  falta  de  informações  mais  completas  sobre  a  chuva  em  cada  sub‐bacia.  Além  disso,  as características  dinâmicas  das variáveis de  vazão  incremental  diárias,  levantadas  nos  estudos  preliminares,  mostraram  que  este  problema  seria  mais complexo que o anterior.  

Os  resultados  dos  modelos  apresentaram  um  desempenho  inferior  aos  modelos  de  previsão  de  vazões  totais.  A  Figura  17  mostra  os  resultados  obtidos para Segredo.  Erro RMS 0 20 40 60 80 100 120 140 160 180 200 0 2 4 6 8 10 12 14 Dia m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 10 20 30 40 50 60 0 2 4 6 8 10 12 14 Dia % Modelo.PRV Modelo.OBS Coef. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS Coe f. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 Dia R 2 Modelo.PRV Modelo.OBS   Figura 17: Resultados do modelo de Segredo.  4.2 Resultados de Previsão Semanal 

O  modelo  fuzzy  recorrente,  apresentado  na  seção  3.1,  utiliza  como  entrada,  além  dos  valores  de  precipitação,  os  valores  de  vazão  calculados  nos  dois  passos  anteriores  (ver  eq.  (3)).  Desta  forma,  para  o  cálculo  das  médias  semanais  referentes  aos  últimos  dias  de  previsão,  é  necessária  a  simulação  utilizando  as  médias  desde  o  primeiro  dia  de  previsão, como mostrado na Figura 18.  1 2 3 4 5 6 7 8 9 10 11 12 0 -1 -2 -3 -4 -5 ... Semana 1 Semana 2 Semana 3 Semana 4 Semana 5 Semana 11 Semana 10 Semana 9 Semana 8 Semana7 Semana 6 Semana 12 1 2 3 4 5 6 7 8 9 10 11 12 0 -1 -2 -3 -4 -5 ... -5 -4 -3 -2 -1 0 11 22 33 44 55 66 77 8 9 10 11 12 ... Semana 1 Semana 2 Semana 3 Semana 4 Semana 5 Semana 11 Semana 10 Semana 9 Semana 8 Semana7 Semana 6 Semana 12   Figura 18: Cálculo das médias semanais.  Os modelos de previsão semanal utilizam dados de  médias  semanais  que  agem  como  filtros  sobre  os 

valores  diários  das  variáveis.  Desta  forma,  o  desempenho dos modelos semanais é melhor que o  desempenho  dos  modelos  diários,  como  apresentado a seguir. 

4.2.1 Vazões Naturais Totais 

Os  resultados  de  previsão  de  vazão  natural  total  semanal para a UHE de Foz do Areia, calculados de  acordo  com  as  métricas  de  erro  definidas  pelas  equações (11) a (14) são apresentados na Figura 19.   O  efeito  da  filtragem  provocada  pelo  cálculo  das  médias semanais pode ser observado comparando‐ se a Figura 19 com a Figura 14.  Erro RMS 0 50 100 150 200 250 300 350 400 450 500 0 2 4 6 8 10 12 14 SEM m 3/s Modelo.PRV Modelo.OBS Erro MAPE 0 5 10 15 20 25 30 35 40 45 0 2 4 6 8 10 12 14 SEM % Modelo.PRV Modelo.OBS Coe f. Nash 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 SEM R 2 Modelo.PRV Modelo.OBS Coe f. Nash-log 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 2 4 6 8 10 12 14 SEM R 2 Modelo.PRV Modelo.OBS   Figura 19: Resultados do modelo de Foz do Areia.  4.2.2 Vazões Naturais Incrementais  

(11)

5 CONCLUSÕES 

O  desenvolvimento  dos  modelos  de  vazão  para  a  bacia  do  Rio  Iguaçu  foi  realizado  utilizando  técnicas  de  OLAP  e  mineração de dados,  codificado  de  forma  integrada  num  ambiente  de  banco  de  dados, de alta capacidade de armazenamento. Esta  integração  é  uma  tendência  recente,  que  garante  a  compatibilidade  dos  desenvolvimentos  futuros  e  traz  confiabilidade  à  atividade  de  previsões  em  todas  as  áreas  da  engenharia.  Os  resultados  numéricos  mostram  que  o  modelo  é  robusto  e  apresenta um bom desempenho para todos os tipos  de variáveis consideradas. 

Este trabalho abre perspectivas para a continuidade  de  desenvolvimento  em  diversas  direções  como,  por  exemplo,  uma  abordagem  completa  capaz  de  levar  em  consideração  os  acoplamentos  entre  as  variáveis de vazão. 

REFERÊNCIAS BIBLIOGRÁFICAS 

Evsukoff,  A.  e  Ebecken,  N.  F.  F.  Mineração  de  dados  de  recursos  hídricos.  R.  C.  V.  da  Silva  (editor)  Métodos  Numéricos  em  Recursos  Hídricos, 

vol. 6. ABRH/COPPETEC, 2003. 

Evsukoff,  A.  G.  e  Ebecken,  N.  F.  F.  “Identification  of  recurrent  fuzzy  systems  with  genetic  algorithms”.  Proceedings  of  IEEE  International 

Conference on Fuzzy Systems, pp. 1703 ‐ 1708 vol.3, 

2004. 

Gama, C. A.; Evsukoff, A. G.; Weber, P. e Ebecken,  N.  F.  F.  “Parameter  Identification  of  Recurrent  Fuzzy Systems with Fuzzy Finite‐State Automata  Representation”. Aceito para publicação em IEEE 

Transactions of Fuzzy Systems, 2007. 

Han,  J.  e  Kamber,  M.  Data Mining:  Concepts  and 

Techniques. Morgan Kaufmann, 2001 

Harinarayan,  V.;  Rajaraman,  A.  e  Ullman,  J.  D.  “Implementing  data  cubes  efficiently”.  In 

Proceedings  of  the  ACM  SIGMOD  International  Conference on Management of Data, Vol. 2 of ACM 

SIGMOD Record, pp. 205‐216, 1996. 

Srinivasulu S. e Jain, A. “A comparative analysis of  training  methods  for  artificial  neural  network  rainfall–runoff  models”,  Applied  Soft  Computing,  Vol. 6, pp. 295–306, 2006. 

Nayaka,  P.C.  e  Ramasastri,  K.  S.  “A  neuro‐fuzzy  computing  technique  for  modeling  hydrological 

Referências

Documentos relacionados

A realização desta dissertação tem como principal objectivo o melhoramento de um sistema protótipo já existente utilizando para isso tecnologia de reconhecimento

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Ressalta-se que mesmo que haja uma padronização (determinada por lei) e unidades com estrutura física ideal (física, material e humana), com base nos resultados da

Neste capítulo foram descritas: a composição e a abrangência da Rede Estadual de Ensino do Estado do Rio de Janeiro; o Programa Estadual de Educação e em especial as

De acordo com o Consed (2011), o cursista deve ter em mente os pressupostos básicos que sustentam a formulação do Progestão, tanto do ponto de vista do gerenciamento

O primeiro conjunto de artigos, uma reflexão sobre atores, doenças e instituições, particularmente no âmbito da hanse- níase, do seu espaço, do seu enquadramento ou confinamen- to

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Os coletores foram deixados na água por quinze dias e depois retirados, acondicionados em potes plásticos e as amostras fixadas com etanol a 80% e levados para o