• Nenhum resultado encontrado

Identificação de curvas de carga diária típicas com uso de Mapa de Kohonen e Fuzzy C-Means

N/A
N/A
Protected

Academic year: 2021

Share "Identificação de curvas de carga diária típicas com uso de Mapa de Kohonen e Fuzzy C-Means"

Copied!
8
0
0

Texto

(1)

Identificação de curvas de carga diária típicas com

uso de Mapa de Kohonen e Fuzzy C-Means

Nelson R. de Albuquerque, Douglas A. A. de Farias Pontifícia Universidade Católica do Rio de Janeiro

Departamento de Engenharia Elétrica - DEE / PUC Laboratório de Inteligência Computacional Aplicada – ICA

Rio de Janeiro. Julho-2006.

E-mail: nelson.albuquerque@redewb.net,

Resumo

Este artigo apresenta uma metodologia desenvolvida para se projetar uma curva de carga de energia elétrica diária, tendo por referência o valor máximo projetado para o dia.

A partir da identificação do valor de carga de um determinado dia e com as informações do dia como: temperatura máxima e se o dia projetado está em horário de verão ou não é possível fazer a projeção horária da carga com a utilização de uma curva de carga típica. Essas curvas típicas foram obtidas a partir da identificação de grupos (clusters) com uso de inteligência computacional (mapas de Kohonen e o algoritmo fuzzy c-means).

O método é explicado em detalhes para os domingos e as demais curvas de dias típicos (segundas, dias úteis, sábados e feriados) são apresentadas graficamente. Utilizamos a série diária de carga da região sudeste de janeiro/1999 até dezembro/2005; a série de feriados; dias em horário de verão e série de temperaturas média, máxima e mínima da região de junho/2001 até junho/2005).

Index Terms – curva de carga típica, mapa de Kohonen, FCM, lógica Fuzzy, Redes Neurais Artificiais.

I - INTRODUÇÃO

Diariamente o Operador Nacional do Sistema Elétrico – NOS, empresa responsável pela sincronização de todas as unidades geradoras de energia elétrica do Brasil, elabora um plano da operação, que é utilizado pela sala de controle para realizar operar o SIN - Sistema Interligado Nacional. Um dos principais insumos para elaboração desse plano de operação é a previsão do consumo de carga de demanda no intervalo de meia hora.

É muito importante o uso de uma série intervalar de qualidade para o sucesso da operação do SIN. Essa previsão representa o comportamento dos diversos setores econômicos durante um dia, ou seja, industrial, comercial, residencial, agrícola, serviços públicos, etc.

Além do comportamento nesses setores, podemos destacar outras questões que influenciam o comportamento da curva de carga, quais sejam: a entrada e a saída da iluminação pública, que se diferenciam nos períodos verão e inverno em função do horário de verão; a influência da temperatura que modifica os hábitos das pessoas; o final de novelas de grande audiência, dias de jogos de futebol da seleção brasileira, etc.

Dessa forma, a previsão da curva de carga por modelagem matemática se torna um processo complexo, que precisa em

muitos casos levar em consideração vários fatores não lineares e assim obter uma informação de qualidade. Por tudo isso fica evidente a necessidade de se investir na pesquisa e desenvolvimento de ferramenta e métodos estatísticos, computacionais e de inteligência artificial no estudo desses problemas, para que seja possível estabelecer rotinas, o mais automáticas possível, para realizar a tarefa da previsão da curva de carga.

II – MÉTODOS DE AGRUPAMENTO

O método de agrupamento consiste na identificação de características semelhantes em determinados conjuntos de dados, que levaram aqueles grupos a terem determinado tipo de comportamento. A diferença entre agrupamento e classificação é que no primeiro caso não se conhece, previamente, a característica intrínseca do grupo.

Existem alguns métodos já consagrados para identificação esses grupos [3],[8],[9].

- Métodos baseados em distância:

• Métodos de partição (“Crisp” ou “Fuzzy”); • Métodos hierárquicos

– Outros Métodos • CobWeb

• Self Organizing Maps

O método baseado na distância consiste em encontrar um centro de gravidade de um grupo de dados tal que a distância entre esse centro e os demais membros do grupo seja a menor possível. O número de centros é procurado de forma a se identificar um número razoável de elementos pertencentes ao mesmo grupo que tenham características semelhantes e que tenham divergências relevantes com os demais grupos. A definição se um elemento pertence a um determinado grupo ou não; pode ser feito pelo conceito tradicional de conjunto, onde cada elemento pertence a apenas um agrupamento (“crisp”) ou utilizando-se uma visão ambígua, apresentada na década de 80 por Zadeh [10], onde um elemento pode pertencer a mais de um grupo, com graus de pertinências diferentes, numa escala que vai de 0 a 1 (lógica fuzzy ou lógica nebulosa).

Os métodos “crisp” mais conhecidos são [4], [8]; método da máxima-verossimilhança e k-means onde se usa métricas relacionadas medição da distância de k (centróide do agrupamento estudado) e os diversos elementos desse grupo. Já o método desenvolvido dentro do conceito de número fuzzy a fronteira entre os grupos não é precisa e todos os

(2)

membros de cada agrupamento podem ter graus de pertinência a todos os grupos. Nesse caso, a escolha do número de grupos também é um processo de tentativa de tal forma que se encontre o menor número de grupos significativos onde se identifiquem as características relevantes dos mesmos.

O método hierárquico pode ter duas abordagens; “bottom-up” onde parte-se dos elementos do conjunto de dados e agrupa-se de dois em dois para encontrar os pares com menor distância entre eles, ou seja, que tenham características semelhantes. Depois agrupa os pares com o mesmo objetivo de se obter dupla de pares cuja distância seja mínima e assim sucessivamente até existir apenas um único grupo. Já na abordagem “top-down” onde o processo é inverso, partido do geral para identificar pares de dados com a menor distância entre os mesmos. Ao final é obtida uma árvore invertida. O corte horizontal determina, então, a quantidade os clusters.

Em outro processo utiliza o agrupamento a partir do conceito de probabilidade condicional (COBWEB conhecido como “Incremental Conceptual Clustering”). É possível a caracterização de clusters a partir do uso de Redes Neurais Artificiais num processo de aprendizagem não supervisionado denominado Mapas Auto-organizáveis ou SOM (Self-Organizing Maps) desenvolvidos por Teuvo Kohonen (1982). Nesse processo o neurônio com maior grau de ativação, após a apresentação à rede de um determinado dado, obtém o direito de ajustar os pesos a ele ligados. Ao final do processo de aprendizagem, após vários ciclos de ajuste de pesos, onde todos os dados são apresentados a rede é possível identificar grupos de dados associados a um determinado neurônio.

III - PROBLEMA

O objetivo desse trabalho é encontrar grupos, os mais homogêneos possíveis, que possam indicar um perfil típico de consumo de energia elétrica durante o dia, utilizando o método de agrupamento através de redes neurais artificiais, conhecido como mapas de Kohonen [6] e pelo uso do algoritmo FCM - fuzzy c-means [1], [2],. Posteriormente é feito a comparação dos valores encontrados através de cada método e compara-se o ajuste dos valores obtidos com os padrões utilizados para o treinamento dessas redes.

Caracterização de uma curva de carga diária

O consumo de energia normalmente apresenta uma curva que pode ser segmentada em três momentos distintos. Uma faixa que representa o consumo do início do dia (Baixa); outra onde pode ser interpretado com um consumo médio (Média); um terceiro momento que abrange o período onde há uma justaposição do consumo residencial mais intenso com o consumo industrial, comercial e de serviço, classificado como horário de pico ou ponta (Alta).

Curva de Carga Diária - média da região sudeste

0 5000 10000 15000 20000 25000 30000 35000 40000 45000 1 2 3 4 5 6 7 8 9 10 11 1213 14 15 16 17 18 1920 21 22 23 24 Horas MW B M A M

Ilustração 1 - Curva de carga

Verifica-se, contudo, que dispersão é muito grande e não se pode adotar uma curva típica que represente o comportamento durante o dia a partir desses dados.

Primeira segmentação

Identifica-se que determinados dias têm um comportamento semelhante nas faixas apresentadas. Essa primeira classificação dá-se da seguinte forma [8], [10]:

• Domingos;

• Segundas-feiras;

• Dias úteis (terça-feira, quarta-feira, quinta-feira e

sexta-feira);

• Sábados; e Domingos.

Ilustração 2 - Caracterização por dia da semana (PUC RJ - ICA)

Onde a linha contínua representa um dia útil, a linha com (*) os sábados, a linha com (+) as segundas-feiras e com (--) os domingos.

Mesmo com essa segmentação, ainda se identifica uma grande dispersão nos valores e nos horários de mínimo e máximo consumo. Por exemplo, observa-se claramente essa dispersão na curva que caracteriza todos os domingos, na série analisada.

Consumo diário - Domingos

0 5,000 10,000 15,000 20,000 25,000 30,000 35,000 1 3 5 7 9 11 13 15 17 19 21 23 horas Mw máximo média mínimo

(3)

O escopo desse estudo foi, então, identificar padrões de comportamento, em cada dia de semana, que relacione o perfil típico de consumo a temperatura máxima e se o dia é ou não enquadrado no horário oficial de verão utilizando as duas técnicas já mencionadas.

IV - AGRUPAMENTO POR MAPAS DE KOHONEN A série obtida pela seleção dos domingos foi normalizada, tendo os valores máximo e mínimo usados como limites:

( )

(

( )

)

(

)

CC MIN NORM MAX MIN V t V V t V V − = − (1)

Vnorm(t): Valor Normalizado; Vcc(t): Valor original; Vmax

e Vmin: valores máximo e mínimo da série a ser normalizada.

Foram testadas várias configurações de Mapas sendo que a configuração com a melhor distribuição dos agrupamentos e melhor definição das características foi obtida com 4 clusters ou um mapa com 4 neurônios (2 x 2). Utilizou-se o programa MatLab (newsom) com uma topologia “grid”, método de cálculo da distância pela norma do vetor (distância Euclidiana), taxa de aprendizagem decrescente durante o processo de agrupamento (de 0,9 a 0,01) e vizinhança igual a zero ao final do processo (apenas um neurônio para cada agrupamento). A fase de sintonia teve uma varredura com 10.000 ciclos.

Ao final do processo obteve-se ativação de 03 (três) neurônios, sendo um deles ativado exclusivamente com elementos oriundos de dias com Horário de Verão - HV e os outros dois com dias Fora do Horário de Verão - FHV. Um com média de temperatura máxima de 25ºC outro grupo de dias mais quente com média de 30ºC. Foram, dessa forma, identificadas 03 curvas típicas:

Domingos (curvas típicas)

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 HV FHV-25ºC FHV-30ºC

Ilustração 4 - Curvas típicas de Domingos / Kohonen

Tabela 1 Curvas típicas - Domingos

hora 1 2 3 4 5 6 7 8 9 10 11 12 HV 0.474 0.324 0.218 0.148 0.119 0.111 0.044 0.000 0.092 0.176 0.237 0.269 FHV - 25ºC 0.311 0.198 0.126 0.084 0.065 0.068 0.018 0.000 0.103 0.181 0.221 0.246 FHV - 30ºC 0.431 0.292 0.209 0.155 0.126 0.103 0.000 0.037 0.132 0.197 0.232 0.252 hora 13 14 15 16 17 18 19 20 21 22 23 24 HV 0.275 0.264 0.255 0.268 0.302 0.368 0.465 0.624 1.000 0.970 0.860 0.638 FHV - 25ºC 0.247 0.222 0.209 0.225 0.297 0.529 1.000 0.920 0.802 0.707 0.559 0.374 FHV - 30ºC 0.272 0.258 0.256 0.275 0.317 0.418 0.843 1.000 0.922 0.844 0.717 0.524 (FC) - HV 1.446

(FC) - FHV 25ºC 1.558 Valor carga(i)= Valor Tipico(i)*Valor Máximo*(1-1/FC)+Vmáximo/FC (FC) - FHV 30ºC 1.492

Avaliação da recuperação do valor em MW (desnormalização)

Uma vez que se obtém a projeção de um valor de consumo máximo para um determinado dia, utiliza-se uma dessas curvas típicas para compor a série horária. Existem duas maneiras de fazer essa composição:

A primeira utilizando-se os valores máximo e mínimo projetado para aquele dia. Outro método é utilizar apenas o Máximo e um Fator de Conversão – FC obtido pela razão Valor Máximo / Valor Mínimo da série.

No nosso exercício, utilizamos essa segunda opção dado que a projeção utilizada fornecia apenas a previsão do Máximo. Avaliação do erro

O erro médio medido, tendo por base a série de domingos utilizada variou de 1% para série recompostas com Máx-Min e de 2% para séries recompostas com FC. O gráfico a seguir mostra a recuperação de uma determinada série de domingo e a tabela anexa mostra o erro hora a hora.

Comparação entre a série original e as duas séries recuperadas

0 5000 10000 15000 20000 25000 30000 35000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Exemplo Valo r Original Curva reco mpo sta co m FC Curva reco mpo sta c/ M ax-M in

Ilustração 5 - Comparação entre real e recomposição por FC.

V - AGRUPAMENTO POR FUZZY C-MEANS Partindo da mesma base de dados normalizada dos domingos e da mesma quantidade de Clusters (quatro), obtiveram-se as seguintes curvas típicas para os domingos:

Curvas típicas Domingos - (FCM)

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 hora HV-01(30ºC) HV-02 (28ºC) FHV-01(28ºC) FHV-02 (25ºC) HV

Ilustração 6 - Curvas típica de domingos por FCM

Tabela 2 - Valores típicos para os domingos (FCM)

Curvas típicas - Domingos (FCM)

mês 1 2 3 4 5 6 7 8 9 10 11 12 HV-01(30ºC) 0.508 0.342 0.234 0.162 0.132 0.122 0.062 0.000 0.084 0.171 0.223 0.247 HV-02 (28ºC) 0.429 0.287 0.184 0.141 0.113 0.105 0.006 0.000 0.107 0.190 0.253 0.271 FHV-01(28ºC) 0.383 0.265 0.184 0.134 0.111 0.093 0.000 0.036 0.139 0.204 0.245 0.263 FHV-02 (25ºC) 0.294 0.191 0.119 0.077 0.060 0.062 0.029 0.000 0.097 0.171 0.215 0.235 mês 13 14 15 16 17 18 19 20 21 22 23 24 HV-01(30ºC) 0.250 0.249 0.248 0.260 0.286 0.353 0.428 0.561 0.985 1.000 0.889 0.670 HV-02 (28ºC) 0.281 0.271 0.255 0.272 0.312 0.386 0.527 0.796 1.000 0.923 0.796 0.573 FHV-01(28ºC) 0.272 0.261 0.256 0.274 0.319 0.448 0.954 1.000 0.898 0.810 0.670 0.461 FHV-02 (25ºC) 0.238 0.217 0.205 0.219 0.291 0.550 1.000 0.881 0.782 0.684 0.543 0.347 (FC) HV-01 = 1.422780206 (FC) FHV-01 = 1.507793936 (FC) HV-02 = 1.465389733 (FC) FHV-02 = 1.568531645

VI – COMPARAÇÃO ENTRE OS AGRUPAMENTOS Diferente do mapa de Kohonen, onde 94% das ativações de séries HV deram-se no mesmo neurônio, com FCM houve uma separação em dois grupos com a característica de pertencerem a HV e com temperaturas médias das máximas de 28ºC e um maior achatamento do período de ponta em um grupo com média mais quente durante o dia e um achatamento no mínimo. O agrupamento Kohonen se aproximou mais do cluster fuzzy (VH-FCM02) com média de 28ºC. Analisando o parâmetro temperatura não se pode

(4)

concluir a causa dessa diferença, nem tão pouco se tentar explicar levando em conta os dias dentro do período de horário de verão, pois ambos os grupos tem dias em todos os meses do Horário de Verão. Contudo, mesmo assim o erro ao adotar-se um único padrão é muito baixo, como já foi visto anteriormente.

Comparação das C. Típicas obtidas - Horário de Verão por M. Kohonen e por FCM

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Kohon-HV HV-FCM02 HV-FCM04

Ilustração 7 - Curvas típicas de HV por Kohonen e FCM

Já as curvas fora do horário de verão tiveram uma sobreposição grande, tanto por Kohonen quanto por FCM.

Comparação das C. Típicas obtidas - Fora do H. de Verão

por M. Kohonen e por FCM

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 FHV-Kohon-I FHV-Kohon-II FHV-FCM01 FHV-FCM03

VII – CURVAS TÍPICAS DOS DEMAIS DIAS Segundas-feiras

Curvas Típicas (segunda-feira)

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 HV FHV (ameno) FHV (médio) FHV (quente)

Ilustração 8 - Curvas típicas das segundas obtidas com FCM Tabela 3 - Valores típicos de segundas (FCM)

segundas 1 2 3 4 5 6 7 8 9 10 11 12 HV 0.214 0.095 0.024 0.000 0.014 0.100 0.258 0.400 0.616 0.760 0.834 0.826 FHV (ameno) 0.110 0.043 0.009 0.000 0.022 0.109 0.274 0.375 0.522 0.608 0.668 0.668 FHV (médio) 0.143 0.054 0.014 0.000 0.023 0.119 0.281 0.407 0.597 0.711 0.779 0.770 FHV (quente) 0.167 0.066 0.020 0.000 0.018 0.105 0.222 0.407 0.667 0.799 0.884 0.867 13 14 15 16 17 18 19 20 21 22 23 24 HV 0.787 0.845 0.885 0.890 0.874 0.775 0.658 0.715 1.000 0.944 0.853 0.617 FHV (ameno) 0.631 0.658 0.682 0.690 0.720 0.769 1.000 0.910 0.821 0.750 0.622 0.438 FHV (médio) 0.733 0.771 0.809 0.812 0.820 0.767 1.000 0.981 0.881 0.830 0.718 0.503 FHV (quente) 0.828 0.890 0.936 0.940 0.911 0.762 0.925 1.000 0.914 0.902 0.806 0.591 Dias úteis

H.Verão (quentes x amenos)

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 amenos quentes

Ilustração 9 - Dias úteis - Horário de verão

Tabela 4 - Valores típicos, desvio padrão e variância. Dias úteis - Horário de Verão

Dias amenos 1 2 3 4 5 6 7 8 9 10 11 12 Mediana 0.243 0.103 0.026 0.000 0.007 0.079 0.211 0.347 0.547 0.658 0.729 0.688 Desv.Padrão 0.048 0.024 0.013 0.008 0.007 0.024 0.068 0.091 0.085 0.074 0.061 0.055 Variancia 0.002 0.001 0.000 0.000 0.000 0.001 0.005 0.008 0.007 0.005 0.004 0.003 máx 0.385 0.175 0.066 0.025 0.027 0.150 0.414 0.620 0.803 0.879 0.913 0.852 min 0.100 0.030 -0.013 -0.025 -0.014 0.008 0.007 0.074 0.291 0.437 0.544 0.524 Dias amenos 13 14 15 16 17 18 19 20 21 22 23 24 Mediana 0.652 0.711 0.749 0.753 0.754 0.686 0.652 0.730 1.000 0.881 0.787 0.531 Desv.Padrão 0.036 0.039 0.049 0.051 0.054 0.051 0.069 0.090 0.000 0.037 0.048 0.061 Variancia 0.001 0.002 0.002 0.003 0.003 0.003 0.005 0.008 0.000 0.001 0.002 0.004 máx 0.760 0.829 0.895 0.907 0.915 0.839 0.860 1.000 1.000 0.992 0.931 0.714 min 0.544 0.593 0.603 0.600 0.594 0.534 0.444 0.459 1.000 0.771 0.643 0.347

Fora H. Verão (comparação de curvas tipicas)

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 + quentes quentes - 31% amenos - 59%

Ilustração 10 - Dias úteis - FHV Tabela 5 - Valores típicos - dias úteis

Série típica de dias úteis - Fora do Horário de Verão - FHV

FHV 1 2 3 4 5 6 7 8 9 10 11 12 Dias amenos 0.166 0.062 0.014 0.000 0.016 0.101 0.268 0.366 0.516 0.600 0.652 0.638 quentes 0.211 0.083 0.021 0.000 0.016 0.107 0.250 0.390 0.592 0.695 0.761 0.746 Dias + quentes 0.251 0.106 0.031 0.000 0.008 0.092 0.207 0.389 0.649 0.783 0.865 0.835 FHV 13 14 15 16 17 18 19 20 21 22 23 24 Dias amenos 0.593 0.627 0.659 0.662 0.683 0.741 1.000 0.891 0.774 0.717 0.589 0.377 Dias quentes 0.700 0.741 0.784 0.785 0.792 0.725 1.000 0.993 0.861 0.808 0.672 0.452 Dias + quentes 0.780 0.854 0.917 0.911 0.886 0.712 0.825 1.000 0.891 0.875 0.752 0.530 Sábados

Comparação entre as curvas de sábado

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 HV FHV - ameno FHV - quente

Ilustração 11 Curvas típicas de sábados Tabela 6 - Valores típicos de sábados

Curva típica de um sábado

1 2 3 4 5 6 7 8 9 10 11 12 HV 0.3713 0.1845 0.0745 0.0189 0.0000 0.0228 0.0249 0.0879 0.2643 0.3873 0.4456 0.4245 FHV-ameno 0.246 0.117 0.036 0.003 0.000 0.028 0.045 0.118 0.269 0.357 0.390 0.365 FHV-quente 0.299 0.157 0.087 0.043 0.027 0.032 0.000 0.127 0.290 0.390 0.426 0.402 13 14 15 16 17 18 19 20 21 22 23 24 HV 0.3963 0.3830 0.3631 0.3553 0.3505 0.3639 0.4265 0.6302 1.0000 0.8620 0.6949 0.4666 FHV-ameno 0.342 0.335 0.324 0.322 0.338 0.524 1.000 0.934 0.779 0.628 0.484 0.286 FHV-quente 0.381 0.382 0.365 0.357 0.358 0.401 0.823 1.000 0.855 0.709 0.558 0.355 CONSIDERAÇÕES FINAIS:

O planejamento diário do despacho das usinas hidrelétricas e unidades termelétricas da rede básica, administrada pelo ONS, requer uma previsão do movimento de consumo ao longo do dia e esse estudo torna-se altamente complexo devido a multiplicidade de consumidores com os mais diversos perfis. A modelagem matemática, por esse motivo torna-se extremamente complexa. O uso de técnicas de identificação de agrupamentos tendo como fonte de informação as séries históricas é um importante recurso para esse trabalho.

Neste artigo mostramos o uso de duas técnicas desenvolvidas com aplicação de inteligência computacional (redes neurais e números fuzzy) e que se mostraram eficazes na identificação dos diversos perfis de consumo.

O método aplicado neste estudo será avaliado por especialistas do ONS com objetivo de aferir sua validade, uma vez que ainda não há modelos definitivos que pudessem servir de paradigma para este estudo.

(5)

No entanto, comparando-se os dados reais do passado com os valores obtidos pelas curvas típicas, pudemos verificar um o erro muito pequeno e aceitável, uma vez que o plano de despacho é continuamente ajustado durante o dia e que qualquer discrepância poderia ser ajustada.

Pelo fato de ter-se utilizado apenas a temperatura máxima do dia e não outros fatores climáticos, como chuva/umidade e luminosidade (hora do nascente e do poente) muitas explicações sobre os clusters não foram totalmente consistentes.

Como desdobramento futuro desse projeto, imagina-se obter associar essas informações e avaliar se os agrupamentos ficariam mais bem caracterizados.

Uma vez obtido um padrão que pudesse ser atualizado continuamente é possível simular várias curvas de carga baseadas nos principais parâmetros que influenciam essas curvas típicas.

REFERÊNCIAS BIBLIOGRÁFICAS: [1] Bezdek, C. J. and Pal, S. K. (1992). Fuzzy Models for

Pattern Recognition, IEEE Press, New York. [2] Bezdek, J. (1981). Pattern Recognition with Fuzzy

Objective Function Algorithms, Plenum Press, New York

[3] Cardoso, G. C. (2003). Modelo de previsão baseado em agrupamento e base de regras nebulosas, Dissertação de Mestrado, Unicamp.

[4] Cardoso, Giselle Cristina. Modelo de previsão baseado em agrupamento e base de regras nebulosas / Giselle Cristina Cardoso.--Campinas, SP: [s.n.], 2003. [5] Klir, G. J. and Yuan, B. (1995). Fuzzy Sets and Fuzzy

Logic Theory and Applications, Prentice Hall. [6] Kohonen, T. (1982). Self-organized formation of

topologically correct feature maps, Biological Cyberneticys 43: 59–69.

[7] Last, M., Klein, Y. and Kandel, A. (2001). Knowlegde discovery in time series databases, IEEE Transactions on Systems, Man and Cybernetics - Part B: Cybernetics 31(1): 160–169.

[8] Lima, W. S. and Ohishi, T. (1999). Mapas auto-organizáveis não-paramétricos para analise da influencia climática em curvas de carga, Seminário Nacional de Produção e Transmissão de Energia Elétrica 14: 35–62.

[9] Magalhães, Marina Horota. Redes Neurais, metodologias de agrupamento e combinação de previsores aplicados à previsão de vazões naturais. Dissertação de Mestrado – Unicampi – Campinas, SP – 2004

[10] Salgado, Ricardo Menezes “Clustering Bus Load Curves”,

http://ieeexplore.ieee.org/iel5/9620/30397/01397652.pd f?isnumber=&arnumber=1397652

(6)

ANEXO: O que é Mapa de Kohonen ?

• Um Mapa Kohonen é inspirado na forma como se supõe que redes neurais naturais aprendem; e

• O modelo originou-se a partir das pesquisas anteriores de Teuvo Kohonen em Análise de

Componentes Principais e Quantização de Vetores.

Para fundamentar uma aplicação na prática de Mapas de Kohonen como um mecanismo para o

aprendizado auto-organizado de padrões e seu posterior uso para classificação de padrões, é importante analisarmos a capacidade representacional e a forma de representação da informação em um Mapa Auto-Organizado - SOM.

Na prática, um Mapa de Kohonen toma um conjunto de dados em um espaço de dados VVVV qualquer e os

representa de forma discretizada através de um neurônio (e eventualmente sua vizinhança) no espaço de

um Mapa Auto-Organizado AAA. Esta transformação de um espaço de representação para outro é A

denominada mapeamento φ, podendo ser representada por:

(

)

(

( )

)

: V

A x V

,

x

A

φ

φ

(2)

A condição para que este mapeamento seja uma boa representação do espaço vetorial é que:

( )X

min

r

,

W

φ

X

=

W

X

r

A

(3)

Onde W é um vetor de pesos da rede AAAA.

Este mapeamento está ilustrado na figura abaixo.

O espaço vetorial VVVV é um espaço qualquer com a dimensionalidade do número de variáveis de um padrão XXX X

desse espaço. O vetor de pesos

w

s do neurônio vencedor se SSSS ∈ AAAA e representa uma aproximação da

função de mapeamento f que associa pontos do espaço vetorial VV a neurônios em AVV AAA.

w

s é o erro dessa

(7)

O Algoritmo Fuzzy C-Means (FCM)

O algoritmo de agrupamento de dados nebuloso fuzzy c-means (Bezdek, 1981) baseia-se em um modelo não linear de otimização que agrupa dados com características similares de acordo com um procedimento iterativo de minimização de uma função objetivo que representa um critério de partição, ponderado pelos graus de pertinência dos dados aos

respectivos grupos.

O algoritmo FCM utiliza as seguintes notações. Seja um conjunto finito de padrões P = {p1; p2; ... ; pN} ⊂ℜ

s onde

s

é um espaço Euclideano s-dimensional; c é o número de grupos, com 2 c N; U = [µij ] e´ a matriz de pertinência,

onde µij, 1 i c e 1 j N denota o grau de pertinência do padrão pj ao grupo i. Uma c-partição de P ´e definida por:

[ ]

1 1

|

0,1 , , ;

1, ;0

,

c N fc ij ij ij i i j

M

U

µ

i j

µ

j

µ

N

= =

=

= ∀

<

<

(

4)

O algoritmo FCM procura agrupar os dados minimizando a seguinte função:

(

)

2 1 1

,

N c m

,

,1

m ij ij fc j i

J

U V

µ

d U

M

m

= =

<

> ∞

∑ ∑

(

5

)

Sendo dij = ||pj − vi||A a distância entre pj e vi dada por uma norma induzida por um produto interno, isto é, ||x||A =

xTAx, com A uma matriz s x s definida positiva; V = {v1;v2; ...;vc} é um conjunto de centros de grupo em que vi é

denominado o i-ésimo grupo; e m é o fator que define o grau de nebulosidade da partição nebulosa do sistema. A seguir, os passos básicos do algoritmo FCM:

Algoritmo 1 FCM

Dado P, escolher o número de grupos 1 < c < N, o parâmetro m > 1, o critério de parada εεεε > 0 e o número máximo de

iterações lmax.

1. Inicializar U(0) e o contador de iterações l = 1.

2. Calcular os c centros de grupos

{

v

1( )l

,

v

2( )l

,...,

v

c( )l

}

U(l)

, com a equação: ( )

( )

( )

1 1

,

1, 2,...,

m N ij j j l i N m ij j

p

v

µ

i

c

µ

= =

=

=

3. Utilizando

v

i( )l , atualizar U(l-1) , com seguinte procedimento:

Para j = 1 até N  Se ||pj − ( )l i

v

||2 > 0 1 1 2 1 2 1 m c j i l ij k j k

p

v

p

v

µ

− − =

=

 Se ||pj − ( )l i

v

||2 = 0 µlij = 1; 1 i c 4. Calcular

U

( )l

U

(l−1)

max

i j,

µ

ij( )l

µ

ij(l−1)

∆ =

=

 Se ∆ > εεεε ou l < lmax l = l + 1 e voltar ao passo 2 Senão parar.

(8)

Detalhamento do erro na recomposição de uma curva típica

1 2 3 4 5 6 7 8 9 10 11 12

Exemplo Valor Original 24783 23569 22526 22097 21831 21715 20584 20663 21418 21988 22208 22426

Valor CurvaTipica- recomposta 0.47 0.32 0.22 0.15 0.12 0.11 0.04 0.00 0.09 0.18 0.24 0.27

Curva recomposta com FC 24,185 22,849 21,905 21,286 21,024 20,951 20,363 19,968 20,789 21,533 22,073 22,359 Curva recomposta c/ Max-Min 24,509 23,266 22,387 21,811 21,567 21,500 20,952 20,584 21,348 22,041 22,543 22,810

erro(Max-Min) 0.8% 0.6% 0.6% 0.3% 0.6% 0.6% 0.5% 0.9% 0.2% 0.2% 0.1% 0.8% 0.9%

erro-FC 1.1% 1.2% 1.5% 1.4% 1.8% 1.8% 1.8% 0.5% 1.7% 1.5% 1.0% 0.3% 0.1%

Erros V.Típico x DesNormalizados

seq. Max-Min FC 180 1 0.8% 1.8% 130 2 0.5% 1.3% 79 3 0.8% 1.1% 24 4 1.0% 1.4% 78 5 0.3% 0.9% 138 6 0.4% 0.4% 35 7 0.7% 1.3% 189 8 0.8% 0.9% 81 9 0.4% 0.4% 22 10 0.9% 1.0%

Erro = erro quadrático médio percentual

Cluster obtidos para dias úteis:

Presença de informação (total 815 padrões) Temp máx. média ( °C)

85% 9% 15% 1% 81% 88% 19% 9% ameno quente m. quente

1 1 1 1

2% 2% 98% 59% 1% 0% 99% 31% ameno quente

0 0 0 0

0 1 0 1

células células

Fora Horário de Verão tem três grupos bem marcados No período do Horário de Verão identificamosdois grupos mais relevantes: (0,0) com 59% das ativações. Clima ameno. (1,1) - com 89% das ativações, caracterizam-se por serem dias quentes. (1,0) com 31% das ativações. Dias quentes. (0,1) - com 9% das ativações, caracterizam-se por serem dias amenos para verão. (1,1) com 9% das ativações. Dias mais quentes.

31.2 25.6 25.0 27.8 HV Fora HV Fora 25.9 28.5 29.1 30.6 HV Fora HV Fora Fora HV Fora HV HV Fora HV Fora 177 6 330 1 22 4 223 52

Referências

Documentos relacionados

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Os elementos caracterizadores da obra são: a presença constante de componentes da tragédia clássica e o fatalismo, onde o destino acompanha todos os momentos das vidas das

Combinaram encontrar-se às 21h

Quero ir com o avô Markus buscar a Boneca-Mais-Linda-do-Mundo, quero andar de trenó, comer maçãs assadas e pão escuro com geleia (17) de framboesa (18).... – Porque é tão

O desenvolvimento das interações entre os próprios alunos e entre estes e as professoras, juntamente com o reconhecimento da singularidade dos conhecimentos

Tanto em sua paisagem física como em sua paisagem humana, o Mediterrâneo encruzilhada, o Mediterrâneo heteróclito apresenta-se em nossas lembranças como uma imagem coerente, como