• Nenhum resultado encontrado

Previsão de curto prazo de carga de energia elétrica do estado de Santa Catarina

N/A
N/A
Protected

Academic year: 2021

Share "Previsão de curto prazo de carga de energia elétrica do estado de Santa Catarina"

Copied!
12
0
0

Texto

(1)

Previsão de curto prazo de carga de energia elétrica

do estado de Santa Catarina

Thaís Rohling Girardi (UFSC) thagirardi@gmail.com

Gerson Ishikawa (UFSC) gerson.ishikawa@ita90.com.br

Resumo: Os requisitos das previsões de curto prazo, por questões de praticidade, tendem a se basear preferencialmente nos métodos de previsão do tipo univariado. Além disto, dadas as características da demanda de carga de energia elétrica de curto prazo (com sazonalidades diárias e semanais), faz-se necessário a adaptação dos métodos tradicionais de previsão univariada para incorporar dois padrões sazonais. Com base na série histórica de carga de energia elétrica do estado de Santa Catarina (hora a hora) no período de 01/01/2002 a 16/03/2005, avalia-se os desempenhos do método univariado de previsão de Holt-Winters modificado para comportar dois padrões sazonais e do método de regressão múltipla composto apenas por variáveis independentes que minimizem a dependência de informações externas para o cálculo das previsões. Apesar do método de Holt-Winters modificado para dois padrões sazonais ter apresentado desempenho superior, a regressão múltipla obtida apresenta desempenhos relevantes e que sugerem a possibilidade do uso de métodos multivariados para a previsão de curto prazo de energia elétrica.

Palavras chave: Carga de energia elétrica; modelos de previsão;Curto prazo; Holt-Winters;

Regressão múltipla.

1. Introdução

Empresas operadoras de energia elétrica utilizam a predição da demanda de carga de eletricidade de curto prazo (tipicamente de uma hora a frente a até 24 horas a frente) para o controle de sistemas elétricos: desde o agendamento de procedimentos de manutenção a até a otimização do mix de capacidade da rede. Adicionalmente, em função da crescente incorporação de novos geradores de energia à rede e dos elaborados esquemas de precificação e de contratação de energia em vigência no mercado brasileiro, existe uma tendência de se buscar métodos de maior acurácia nas previsões não somente de longo prazo mas também de curto prazo.

Para as previsões de curto prazo, requer-se o uso de séries temporais com períodos curtos de amostragem (e.g, na ordem de 1 hora ou períodos inferiores) e, de acordo com Taylor (2003), faz-se também necessário a adoção de procedimentos automatizados de previsão. Desta maneira, os métodos univariados que apenas utilizam as informações contidas na própria série temporal, como ARIMA e Holt-Winters, são bastante populares neste tipo de situação (TAYLOR, 2003).

Para a previsão de séries de carga de energia elétrica, Taylor (2003) utilizou dois métodos univariados que possibilitavam a captura de sazonalidades múltiplas. O primeiro método foi uma variante do método de Box Jenkins, conhecido como ARIMA multiplicativo adaptado para dois padrões diferentes de sazonalidade: ARIMA(2,0,0)×(2,0,2)48×(2,0,2)336. Onde os períodos de amostragem da série temporal foram a cada 30 minutos (i.e., 1 dia = 48

(2)

períodos, 1 semana = 336 períodos). Observa-se também que os aplicativos estatísticos disponíveis (Minitab, Statistica e PcGive) não possuem a implementação multiplicativa e disponibilizam apenas um padrão sazonal.

O segundo método avaliado por Taylor (2003) para previsões de curto prazo para séries de energia elétrica foi uma modificação do tradicional método de Holt-Winters de tal forma a acomodar dois padrões de sazonalidade, obtendo resultados superiores ao do ARIMA multiplicativo com duas sazonalidades após efetuar os ajustes para auto-correlação (AR(1)) dos resíduos.

Neste contexto, este artigo avalia o desempenho do método proposto por Taylor (2003), modificação do Holt-Winters para duas sazonalidades e com introdução de mecanismo de ajuste dos resíduos, para séries temporais de carga de energia elétrica (amostradas a cada hora) e que reflitam condições climáticas e de demanda do mercado brasileiro.

Além disto, este artigo considera um segundo método de previsão de carga de eletricidade de curto prazo, de característica multivariada. No entanto, restringindo-se às informações que permitam um elevado grau de automatização do processo de previsão, ou seja, sem recorrer ao uso de informações de difícil acesso ou de métodos de previsão que requeiram uma sistemática interação com fontes externas de informação (exemplo, previsão horária de temperaturas).

2. Apresentação dos dados.

Os dados explorados no presente trabalho foram disponibilizados pela CELESC (Centrais Elétrica de Santa Catarina), empresa responsável pela distribuição de energia elétrica no estado de Santa Catarina.

Os valores fornecidos correspondem a demanda total de carga de energia elétrica de hora em hora no estado de Santa Catarina em MWh de 01/janeiro/2002 a 16/03/2005. Embora não seja possível reproduzir os dados na sua totalidade, a tabela 1 permite uma visualização desta série temporal.

TABELA 1 – Carga (de hora em hora) de Energia Elétrica em Santa Catarina (MWh)

Horas 01/01/2002.. ...30/12/2002 ..01/01/2003 ...30/12/2003 01/01/2004… ...31/12/2004.... 1:00 1146,337 1336,534 1224,648 1258,258 1173,281 1563,771 2:00 1112,599 1261,192 1190,220 1164,568 1095,272 1445,453 3:00 1031,827 1217,830 1124,850 1114,774 1014,580 1378,570 ... ... ... ... ... ... ... 22:00 1447,342 1786,782 1563,080 1727,444 1443,542 1642,830 23:00 1367,776 1707,636 1477,646 1589,818 1308,573 1501,871 24:00 1228,025 1578,996 1358,792 1388,668 1160,195 1366,694 Fonte: Centrais Elétricas Santa Catarina S/A.

O método de Holt-Winters com sazonalidade dupla ajustada, proposto por Taylor (2003), e método da regressão múltipla foram aplicados para a previsão de curto prazo desta série temporal. A amostra utilizada para a aplicação dos métodos contempla o período de 01/janeiro/2002 a 31/dezembro/2004, sendo que os primeiros meses do ano de 2005 (de 01/janeiro/2005 a 16/março/2005) são utilizados para avaliar os desempenhos dos métodos através do cálculo do MAPE (erro percentual absoluto médio).

(3)

3. Estatística descritiva

Descrever a informação contida uma amostra é o primeiro passo de muitos estudos estatísticos. A estatística descritiva limita-se justamente a expor dados e conclusões obtidos a partir da amostra, ou seja, não avança no sentido de fazer inferências ou conclusões acerca do universo. É a partir desta análise inicial que o comportamento geral dos dados é explorado e onde é verificada a necessidade de transformações. Estas transformações são, na maioria dos casos, exigidas para aplicação de determinados métodos que requerem características específicas da amostra para tornarem-se válidos.

O histograma da figura 1 indica que a amostra não segue uma distribuição normal. A assimetria negativa de -0,21, significa que os valores mais altos estão concentrados no final da curva que indica a ausência da simetria requisitada pela distribuição normal. O valor da curtose para dados normais deve ser 3, enquanto que obtido com a amostra foi de -0,94. A questão central porém é se a assimetria e a curtose são suficientes para violar a suposição de dados distribuídos normalmente. Para tal verificação aplica-se o teste de normalidade (Bera Jarque) que é construído a partir da assimetria e curtose e tem a hipótese nula de normalidade rejeitada (portanto, a favor da não normalidade) quando a expressão abaixo é maior que 5,99:

2 2 2 2 ( 3) 5,99 6 24 ass curt n + − ≈χ ≥  

Substituindo os valores obtidos com a amostra, o índice de Bera Jarque confirma a presença de não normalidade na distribuição dos dados da série temporal (=17,20).

2460 2360 2260 2160 2060 1960 1860 1760 1660 1560 1460 1360 1260 1160 1060 960 860 760

95% Confidence Interval for Mu

1725 1715

1705 1695

1685

95% Confidence Interval for Median

Variable: Consumo MWh 1704,05 351,55 1686,83 Maximum 3rd Quartile Median 1st Quartile Minimum N Kurtosis Skewness Variance StDev Mean P-Value: A-Squared: 1722,87 357,63 1695,43 2485,52 1988,48 1712,92 1412,94 726,46 26136 -9,4E-01 -2,1E-01 125714 354,56 1691,13 0,000 219,204

95% Confidence Interval for Median 95% Confidence Interval for Sigm a 95% Confidence Interval for Mu Anderson-Darling Normality Test Descriptive Statistics

FIGURA 1 – Estatística Descritiva dos dados

4. Autocorrelação e Estacionariedade da Série Temporal

Quando uma variável é mensurada através do tempo, é normal que as observações em diferentes períodos estejam relacionadas uma com as outras. Isso significa que os valores

(4)

observados em um período anterior influenciam, ou ajudam a explicar os valores observados em um período posterior. Uma análise dos coeficientes de autocorrelação de uma série temporal, aliado à uma análise do gráfico gerado (correlograma), permite identificar se os dados são aleatórios, se a série está estacionada ou não; e se existe algum comportamento de sazonalidade na amostra.

O correlograma da série temporal gerado (figura 2) permite observar que os dados não possuem comportamento aleatório, pois os resultados indicam elevado nível de correlação das observações da amostra.

Além disto, constata-se pelos coeficientes de correlação a presença de duas sazonalidades: uma diária e uma semanal. A diária, apontada na defasagem 24, indica que o consumo de energia elétrica consumida em um dia relaciona-se com a energia consumida no próximo. Da mesma forma, o alto coeficiente indicado na altura da defasagem 168 (7 dias vezes 24 horas) indica que o comportamento de consumo apresentado na semana tende a ser parecido com o da semana anterior.

200 150 100 50 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 A u to c o rr e la ti o n LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag 1,9E+05 1,9E+05 1,9E+05 1,9E+05 1,9E+05 1,9E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,8E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,7E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,6E+05 1,5E+05 1,5E+05 1,4E+05 1,3E+05 1,2E+05 1,2E+05 1,1E+05 1,1E+05 1,0E+05 1,0E+05 1,0E+05 1,0E+05 1,0E+05 1,0E+05 9,8E+04 9,7E+04 9,5E+04 9,3E+04 9,1E+04 8,8E+04 8,4E+04 7,8E+04 7,0E+04 5,9E+04 4,3E+04 2,4E+04 2,70 5,88 8,63 10,19 8,74 6,05 2,93 -0,44 -3,72 -6,51 -8,35 -9,42 -9,74 -9,43 -8,70 -8,31 -8,59 -9,24 -9,49 -9,12 -7,95 -5,93 -2,87 0,72 4,41 7,88 10,92 12,72 11,32 8,61 5,45 2,04 -1,27 -4,03 -5,72 -6,54 -6,53 -5,81 -4,63 -3,73 -3,44 -3,40 -2,87 -1,63 0,40 3,24 7,10 11,61 16,43 21,23 25,87 29,28 28,71 26,26 23,02 19,27 15,60 12,55 10,65 9,67 9,65 10,50 12,07 13,53 14,55 15,45 17,14 19,80 23,56 28,59 35,67 45,43 59,58 83,52 154,38 0,07 0,14 0,21 0,24 0,21 0,14 0,07 -0,01 -0,09 -0,16 -0,20 -0,22 -0,23 -0,22 -0,20 -0,19 -0,20 -0,21 -0,22 -0,21 -0,18 -0,14 -0,07 0,02 0,10 0,18 0,25 0,29 0,26 0,19 0,12 0,05 -0,03 -0,09 -0,13 -0,15 -0,15 -0,13 -0,10 -0,08 -0,08 -0,08 -0,06 -0,04 0,01 0,07 0,16 0,26 0,36 0,46 0,54 0,60 0,57 0,51 0,43 0,36 0,29 0,23 0,19 0,18 0,17 0,19 0,22 0,24 0,26 0,27 0,30 0,34 0,39 0,46 0,55 0,65 0,76 0,86 0,95 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

Autocorrelation Function for Consumo MWh

FIGURA 2 – Correlograma

Quando os dados são observados através do tempo, como no gráfico da figura 3, é possível verificar que eles estão estacionados, ou seja, aparentemente não há qualquer tendência de crescimento ou de queda.

1 5 0 0 1 0 0 0 5 0 0 2 0 0 0 1 5 0 0 1 0 0 0 I n d e x C A R G A

(5)

FIGURA 3 – Carga de eletricidade no Estado de Santa Catarina

Esta estacionariedade foi ainda comprovada pelo teste Dickey e Fuller realizado no programa PcGive 10 (que apresentou resultado -3.43.)

5. Holt-Winters Modificado para Dupla Sazonalidade e com Ajuste dos Resíduos

O método tradicional de Holt-Winters (WINTERS, 1960) é adequado para séries com apenas um padrão sazonal. Para a inclusão de um segundo padrão de sazonalidade, Taylor (2003) propõe que o segundo padrão sazonal seja incluído de forma multiplicativa e de forma análoga à decomposição multiplicativa de séries temporais. Além disto, no método de Holt-Winters, assume-se uma tendência aditiva e estima-se a sua inclinação (Tt) através da suavização das diferenças de níveis (StSt1) dos níveis locais (St). Nesta adaptação, assume-se dois índices separados de sazonalidade, Dt e Wt, sendo que s1corresponde ao

período de sazonalidade de Dt; e s2 a Wt, respectivamente. O método de Holt-Winters adaptado para dois padrões de sazonalidade está descrito nas equações (1) a (5).

Nível: ( ) (1 )( 1 1) 2 1 − − − − + − + = t t s t s t t t S T W D X S α α (1) Tendência: Tt =γ(StSt1)+(1−γ)Tt1 (2) Sazonalidade 1: 1 2 ) 1 ( ) ( t s s t t t t D W S X D − − + =δ δ (3) Sazonalidade 2: 2 1 ) 1 ( ) ( t s s t t t t W D S X W − − + =ω ω (4) Previsão: Xˆt(k)=(St +kTt)Dts1+kWts2+k (5)

Onde

α

, γ, δ e ω são os parâmetros de suavização e Xˆ kt( )é a previsão k períodos a frente. Observa-se adicionalmente que, para Taylor (2003), a formulação acima proposta pode ser facilmente generalizada para incorporar mais padrões sazonais através da introdução de índices sazonais extras com as respectivas equações de suavização e de forma multiplicativa na equação de previsão.

De acordo com Taylor (2003), a avaliação dos resíduos, neste tipo de série temporal, revelou considerável auto-correlação de primeira ordem. Deste modo, este autor propõe o ajuste da previsão a partir da avaliação dos erros de previsão.

Para um ajuste do tipo AR(1), o ajuste seria da forma: etet−1+ξt,

Sendo que o ajuste para k passos a partir da origem τ é modificado com a adição do termo: λkeτ.

Para a inicialização deste método, assumiu-se Dt =1 e Wt =1 conforme sugerido por

Hanke, Reitsch e Wichern (2001) e Tt =0, uma vez que a inclinação tende a zero para esta série temporal (não foi detectada tendência para esta série temporal). Para a estimativa dos valores de St, adotou-se a média móvel dos valores de um período de 24 amostras anteriores (equivalente a 24 horas), congelando-se o valor do período 25 para todos os primeiros 24 períodos.

Para o cálculo dos parâmetros de suavização deste método, utilizou-se o período de novembro/2002 a março/2003, onde os meses de novembro/2002 e dezembro/2002 foram

(6)

utilizados para a inicialização do algoritmo e os meses de janeiro/2003, fevereiro/2003 e março/2003 foram utilizados para a minimização da média dos erros absolutos percentuais (MAPE) da previsão de um período à frente. A minimização dos erros percentuais foi realizada com a funcionalidade Solver do Excel. Ressalta-se que para avaliar a congruência dos resultados da otimização deste aplicativo, as condições iniciais foram alteradas de forma a cobrir as principais possibilidades – a partir dos valores preliminarmente ótimo dos parâmetros, modificou-os para os extremos (para 0 e para 1) dos 4 parâmetros de suavização e do parâmetro de ajuste de erro. Uma vez que se obteve de forma consistente o mesmo conjunto de valores dos parâmetros que minimizam o MAPE, utilizou-se o seguinte conjunto de parâmetros de suavização para a previsão fora da amostra:

9790 , 0 4112 , 0 1899 , 0 0000 , 0 0000 , 0 = = = = = λ ω δ γ α

Para a avaliação das previsões deste método, utilizou-se os dados efetivos de 01/janeiro/2005 a 16/março/2005.

Uma medida comum para se avaliar a capacidade de previsão de um método de previsão é o coeficiente chamado U de Theil que é definido como

= − − = − − − − − − − − = T t t t t T t t t t t t t Y Y Y Y Y Y Y Y Y U 1 2 1 1 1 2 1 1 1 1 ) ( ) ˆ ( (6)

Os resultados da previsão de um período a frente, com o método de Holt-Winters modificado para duas sazonalidades e com ajuste do resíduo, gerou um índice U de 0,08 , no período fora da amostra, valor que demonstra um desempenho significativamente superior ao da previsão ingênua (quando este coeficiente é igual a 1).

O MAPE para um período a frente, neste período foi de 1,027%. Sendo que a figura 4 mostra os resultados das projeções de um período à frente a até 24 períodos à frente.

0% 1% 2% 3% 4% 5% 1 3 5 7 9 11 13 15 17 19 21 23

Previsão do Modelo (Período em horas a frente)

M

A

P

E

FIGURA 4 – Evolução do MAPE de acordo com o período de projeção, utilizando-se o método modificado de Holt-Winters para duas sazonalidades e com o ajuste AR dos resíduos

(7)

Contrastando com a suave evolução do MAPE conforme os períodos de projeção à frente, uma análise do desempenho desse método ao longo do mês de janeiro/2005, revela que as previsões de 12 a 24 horas a frente apresentam elevada variação da média diária dos MAPEs (oscilando na faixa de 1,69% a 15,1%), por exemplo no dia 07/01/2005, principalmente quando comparadas à previsão de 1 hora a frente (cujo desempenho oscilou na faixa de 0,63% a 2,25%), conforme a figura 5.

0% 2% 4% 6% 8% 10% 12% 14% 16% 1 /1 /2 0 0 5 3 /1 /2 0 0 5 5 /1 /2 0 0 5 7 /1 /2 0 0 5 9 /1 /2 0 0 5 1 1 /1 /2 0 0 5 1 3 /1 /2 0 0 5 1 5 /1 /2 0 0 5 1 7 /1 /2 0 0 5 1 9 /1 /2 0 0 5 2 1 /1 /2 0 0 5 2 3 /1 /2 0 0 5 2 5 /1 /2 0 0 5 2 7 /1 /2 0 0 5 2 9 /1 /2 0 0 5 3 1 /1 /2 0 0 5 Datas (Mês de Janeiro/2005) M A P E D ri o Prev. +1h +2h +3h +6h +12h +18h +24h

FIGURA 5 – Evolução da média diária do MAPE em função do período de projeção no período de 01/1/2005 a 31/1/2005, utilizando-se o método modificado de Holt-Winters para duas sazonalidades e com o ajuste AR dos resíduos

6. Regressão Dinâmica

O método de regressão dinâmica trabalha com a seleção de variáveis regressoras que possivelmente estão relacionadas com a variável dependente (Y) e que, portanto, explicam o comportamento de determinada série. Uma grande vantagem deste tipo de regressão, é que os valores passados da série original podem ser utilizados como variáveis regressoras, e a sazonalidade da série pode ser captada pela inserção de variáveis dummy (binárias) no modelo.

Para que uma regressão possa ser validada ela precisa atender algumas condições como a inexistência de correlação serial entre os erros, bem como a distribuição destes erros deve ser normal com média zero e variância constante. Se a variável dependente apresenta uma distribuição normal, é grande a possibilidade de seus erros também apresentarem. Portanto é comum na aplicação de regressões, tentar-se algumas transformações nos dados originais até que se atinja uma normalidade para então proceder a regressão.

Para a aplicação deste método na série estudada, duas dificuldades foram encontradas. A primeira foi em relação á normalidade dos dados, pois nenhuma das diversas transformações tentadas (diferença, ln, Box-Cox etc.) normalizou a série. Como a regressão dinâmica exige que a série seja estacionária (requisito atendido) e que a distribuição dos erros seja uma curva gaussiana normal com média zero e variância constante, optou-se por aplicar a regressão nos dados originais para a posterior validação da normalidade dos resíduos.

(8)

A segunda dificuldade foi a de encontrar variáveis regressoras (independentes) de fora da amostra que poderiam explicar o modelo, pois os dados possuem freqüência horária. Optou-se então por trabalhar-se apenas com as variáveis defasadas e com as variáveis dummy. As variáveis independentes foram criadas defasando-se a série original em uma semana e um dia, pois como foi demonstrado pela análise de autocorrelação (item 3), a série apresenta estas duas sazonalidades. Além disso, criou-se mais uma variável com defasagem 1, ou seja, relacionada com a hora anterior.

Na seqüência foram criadas as variáveis dummy, sendo que as primeiras a serem incorporadas no modelo foram as horárias, as semanais e as mensais. Além disso, com o intuito de captar variações no consumo de energia em função de feriados introduziu-se variáveis dummy para os dias correspondentes bem como para os “dias pontes” (aqueles que acabam tendo características de feriado por “caírem” entre o feriado e o fim de semana). Finalmente optou-se por diferenciar o natal e sua véspera bem como o ano novo e sua véspera por estes apresentarem um comportamento diferente dos demais feriados. Tentou-se ainda inserir variáveis diárias (como função do dia do mês), mas estas não apresentaram significância para o modelo.

Os resultados gerados, a partir do aplicativo Minitab, com estas variáveis apresentaram um R2 ajustado de 96% com todos as variáveis sendo significativas. Porém os resíduos demonstravam uma elevada auto-correlação principalmente nas defasagens 24, 48, 72 etc, como pode ser verificado na figura 6.

200 150 100 50 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 A u to c o rr e la tio n LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag 2,9E+04 2,9E+04 2,9E+04 2,8E+04 2,6E+04 2,6E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,5E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,4E+04 2,1E+04 2,1E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 2,0E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,9E+04 1,8E+04 1,1E+04 1,0E+04 1,0E+04 1,0E+04 1,0E+04 9818,78 9388,05 8848,12 8431,77 8252,20 8200,46 8174,14 8034,50 8001,22 8001,13 7919,60 7486,75 6842,79 6169,83 5888,59 5687,02 5286,15 4923,46 -3,78 -9,88 2,93 30,37 3,05 -10,99 -4,27 -0,22 0,04 -0,80 1,57 3,22 2,30 2,76 8,13 14,97 7,24 3,33 2,67 3,31 1,69 -0,82 -0,79 -1,32 -5,39 -12,11 2,30 33,46 5,33 -9,25 -0,47 4,00 3,59 2,66 5,41 7,23 6,66 6,98 9,08 14,27 5,32 -1,57 -1,28 1,37 1,50 0,05 -1,40 -3,34 -5,17 -10,78 11,81 63,13 21,11 -2,18 6,40 8,82 10,60 15,83 17,94 15,90 10,49 5,64 4,02 9,30 4,54 0,24 7,12 16,59 20,56 21,38 13,92 11,85 16,89 16,23 70,16 -0,04 -0,11 0,03 0,32 0,03 -0,12 -0,05 -0,00 0,00 -0,01 0,02 0,03 0,02 0,03 0,09 0,16 0,08 0,03 0,03 0,03 0,02 -0,01 -0,01 -0,01 -0,06 -0,13 0,02 0,33 0,05 -0,09 -0,00 0,04 0,04 0,03 0,05 0,07 0,07 0,07 0,09 0,14 0,05 -0,02 -0,01 0,01 0,01 0,00 -0,01 -0,03 -0,05 -0,10 0,11 0,53 0,17 -0,02 0,05 0,07 0,09 0,13 0,14 0,13 0,08 0,04 0,03 0,07 0,04 0,00 0,06 0,13 0,16 0,16 0,10 0,09 0,12 0,12 0,43 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

Autocorrelation Function for RESI1

Figura 6 – Autocorrelação dos resíduos (resultados intermediários)

Buscando minimizar estas autocorrelações criou-se mais duas variáveis auxiliares formadas pelas diferenças Y(t-1) – Y(t-2) e Y(t-1) – Y(t-25). Assim, as variáveis selecionadas para o modelo de regressão múltipla foram:

- Y(t) = Consumo (variável dependente) - T-1hora = Y defasado em uma hora = Y(t-1) - T-1 dia = Y defasado um dia = Y(t-24)

- T- 1 semana = Y defasado 1 Semana = Y(t-168) - Y-2 = Y(t-1) – Y(t-2)

(9)

- Dummy Semanal = segunda á sábado - Dummy Horária = 1h até 23hs

- Dummy Mensal = Fevereiro a Dezembro - Dummy Feriado

- Dummy Dias Pontes

- Dummy Véspera de Natal e Natal

- Dummy Véspera de Ano Novo e Ano Novo

Os resultados da regressão formada pelas variáveis acima selecionadas encontram-se na tabela 2.

TABELA 2: Resultados da Regressão Dinâmica The regression equation is

Consumo MWh TOTAL = 24,5 + 0,291 Consumo (T-1hora) + 0,567 Consumo (T-1dia) + 0,110 Consumo (T-1semana) + 0,216 Y(t-1) - Y(t-2)

+ 0,540 Y(t-1) - Y(t-25) + 33,8 Segunda + 13,5 Terça + 15,4 Quarta + 14,8 Quinta + 15,9 Sexta - 9,52 Sábado - 51,1 Feriados

- 21,7 Dias Pontes + 21,7 H1 + 28,1 H2 + 29,0 H3 + 26,0 H4 + 26,1 H5 + 46,9 H6 + 33,6 H7 + 48,8 H8 + 36,2 H9 + 34,5 H10 + 42,1 H11 + 16,1 H12 - 12,5 H13 + 100 H14 + 28,8 H15 + 26,3 H16 + 40,0 H17 + 35,5 H18 + 62,2 H19 + 10,1 H20 + 52,0 H21 + 14,6 H22 + 20,7 H23 - 8,65 FEV - 11,4 MAR - 11,3 ABRIL - 16,2 MAI - 12,8 JUN - 16,5 JUL - 14,9 AGO - 12,1 SET - 12,4 OUT - 6,29 NOV - 22,5 DEZ - 95,7 Véspera Natal - 96,2 Natal - 16,1 VésperaAno Novo - 22,0 Ano Novo Predictor Coef SE Coef T P

Constant 24,473 3,438 7,12 0,000 Consumo 0,290825 0,004309 67,50 0,000 Consumo 0,566867 0,004411 128,52 0,000 Consumo 0,110407 0,002238 49,33 0,000 Y(t-1) - 0,215691 0,004242 50,84 0,000 Y(t-1) - 0,540245 0,004456 121,23 0,000 Segunda 33,776 1,712 19,73 0,000 Terça 13,510 1,387 9,74 0,000 Quarta 15,416 1,315 11,72 0,000 Quinta 14,751 1,309 11,27 0,000 Sexta 15,857 1,382 11,47 0,000 Sábado -9,521 1,176 -8,09 0,000 Feriados -51,133 1,952 -26,19 0,000 Dias Pon -21,716 3,398 -6,39 0,000 H1 21,730 2,100 10,35 0,000 H2 28,075 2,148 13,07 0,000 H3 29,034 2,215 13,11 0,000 H4 26,000 2,271 11,45 0,000 H5 26,081 2,307 11,31 0,000 H6 46,864 2,409 19,45 0,000 H7 33,635 2,449 13,74 0,000 H8 48,828 2,490 19,61 0,000 H9 36,160 2,475 14,61 0,000 H10 34,502 2,389 14,44 0,000 H11 42,085 2,357 17,85 0,000 H12 16,149 2,238 7,21 0,000 H13 -12,491 2,084 -5,99 0,000 H14 100,386 2,392 41,97 0,000 H15 28,788 2,349 12,26 0,000 H16 26,316 2,239 11,76 0,000 H17 39,984 2,224 17,98 0,000 H18 35,460 2,221 15,97 0,000 H19 62,213 2,349 26,49 0,000 H20 10,108 2,251 4,49 0,000 H21 51,957 2,241 23,19 0,000 H22 14,632 2,166 6,76 0,000 H23 20,673 2,097 9,86 0,000 FEV -8,654 1,541 -5,61 0,000 MAR -11,370 1,518 -7,49 0,000 ABRIL -11,326 1,508 -7,51 0,000 MAI -16,165 1,502 -10,76 0,000 JUN -12,810 1,502 -8,53 0,000 JUL -16,520 1,500 -11,01 0,000 AGO -14,925 1,496 -9,98 0,000 SET -12,088 1,503 -8,04 0,000 OUT -12,368 1,496 -8,27 0,000 NOV -6,287 1,502 -4,18 0,000 DEZ -22,513 1,572 -14,32 0,000 Véspera -95,656 5,961 -16,05 0,000 Natal -96,151 6,018 -15,98 0,000 VAno Nov -16,080 5,858 -2,75 0,006 Ano Novo -22,021 7,150 -3,08 0,002 S = 48,05 R-Sq = 98,2% R-Sq(adj) = 98,2% Analysis of Variance Source DF SS MS F P Regression 51 3225311138 63241395 27396,26 0,000 Residual Error 26084 60212172 2308 Total 26135 3285523310

(10)

A aplicação deste modelo gerou previsões em que o MAPE dentro da amostra (2002, 2003 e 2004) foi de 1,98% e fora da amostra (2005) 1,97% . O coeficiente U de Theil, que compara o desempenho da regressão com a previsão ingênua, foi de 0,20.

A análise dos resíduos, no período de avaliação (2005), demonstra que as duas últimas variáveis criadas, além de aumentarem o R2 ajustado para 98,2%, também minimizaram a auto-correlação dos erros, porém não foi o suficiente para eliminá-los como pode ser verificado na figura 7. A figura 8 contém a estatística descritiva dos resíduos da regressão múltipla e sua tendência a se aproximar a uma curva normal.

85 75 65 55 45 35 25 15 5 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 A u to c o rr e la ti o n LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag LBQ T Corr Lag 1030,17 1026,24 1025,35 1024,80 942,51 941,83 938,42 935,49 933,50 931,71 928,54 927,62 925,90 923,58 920,24 913,90 892,24 882,57 868,06 866,13 861,33 858,08 856,97 846,71 828,35 826,00 824,27 801,26 786,71 782,58 777,87 768,16 742,88 732,84 731,20 729,03 725,37 714,92 681,74 651,45 578,66 562,22 544,36 537,83 536,37 528,32 518,87 507,95 496,34 478,24 477,40 474,44 399,15 398,41 397,71 388,16 385,71 385,49 378,00 364,85 356,86 354,16 352,89 347,63 347,09 346,69 344,80 339,10 302,78 251,41 175,32 166,96 165,67 122,30 102,21 1,33 -0,63 -0,50 6,23 -0,57 -1,27 1,18 0,97 0,92 1,23 0,66 0,91 1,05 1,27 1,75 3,25 2,18 2,68 0,98 1,55 1,27 0,75 2,27 3,05 1,09 -0,94 -3,45 2,76 -1,47 -1,57 2,26 3,68 2,33 0,94 1,08 1,41 2,39 4,31 4,15 6,60 3,15 3,31 2,00 0,95 2,23 2,43 2,62 2,72 3,41 -0,73 -1,38 7,17 0,71 -0,69 2,57 1,30 0,39 2,28 3,05 2,38 1,39 0,95 -1,94 -0,62 -0,53 -1,17 2,03 5,20 6,32 7,96 2,65 1,04 6,17 4,24 10,10 0,05 -0,02 -0,02 0,21 -0,02 -0,04 0,04 0,03 0,03 0,04 0,02 0,03 0,04 0,04 0,06 0,11 0,07 0,09 0,03 0,05 0,04 0,02 0,07 0,10 0,04 -0,03 -0,11 0,09 -0,05 -0,05 0,07 0,12 0,07 0,03 0,03 0,04 0,08 0,13 0,13 0,20 0,09 0,10 0,06 0,03 0,07 0,07 0,08 0,08 0,10 -0,02 -0,04 0,20 0,02 -0,02 0,07 0,04 0,01 0,06 0,09 0,07 0,04 0,03 -0,05 -0,02 -0,01 -0,03 0,06 0,14 0,17 0,21 0,07 0,03 0,16 0,11 0,24 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

Autocorrelação dos Resíduos (01/01/2005 a 16/03/2005)

FIGURA 7 – Autocorrelação dos resíduos (resultados finais)

310 260 210 160 110 60 10 -40 -90 -140 -190 -240 -290 -340 -390

95% Confidence Interval for Mu

0,5 0,0

-0,5

95% Confidence Interval for Median

Variable: RESI1 -0,789 48,025 -0,587 Maximum 3rd Quartile Median 1st Quartile Minimum N Kurtosis Skewness Variance StDev Mean P-Value: A-Squared: -0,002 48,855 0,587 303,585 19,561 -0,382 -19,398 -332,327 26136 3,84786 3,61E-02 2346,09 48,4365 -0,0000 0,000 572,357

95% Confidence Interval for Median 95% Confidence Interval for Sigm a 95% Confidence Interval for Mu Anderson-Darling Normality Test Descriptive Statistics

(11)

7. Considerações Finais

Dadas as características sazonais das curvas de carga de energia elétrica de curto prazo, com padrões pronunciados de sazonalidade diária e semanal, apenas os métodos de projeção que comportem múltiplos padrões de sazonalidade foram considerados. Taylor (2003) também utilizou o método ARIMA multiplicativo modificado para 2 sazonalidades, neste tipo de série temporal, e obteve que o método modificado de Holt-Winters para dois padrões sazonais e com ajuste dos resíduos apresentou desempenho superior ao ARIMA. Desta maneira, considerou-se neste artigo dois métodos de previsão, o método univariado de Holt-Winters (modificado para dois padrões sazonais) e o método multivariado com base em uma única equação de regressão linear de múltiplas variáveis independentes.

O método de Holt-Winters modificado para dois padrões de sazonalidade e com ajuste dos resíduos, similarmente aos resultados de Taylor (2003), também apresentou excelente desempenho para previsões de curto prazo de carga de energia elétrica. Dentre as vantagens desse método, destaca-se a sua simplicidade de implementação computacional para a previsão do tipo on-line e de forma univariada (ou seja, utiliza apenas as informações contidas na própria série temporal). Além disto, os resultados demonstram-se robustos e de elevada confiabilidade.

Por outro lado, os resultados apresentados na figura 5 sugerem possibilidades de melhoria desse algoritmo modificado de Holt-Winters com a introdução de variáveis externas como, por exemplo, as informações de feriados nacionais. Neste contexto, avaliou-se também o método da regressão múltipla como alternativa para o método univariado.

Embora o requisito da ausência de autocorrelação dos resíduos não tenha sido completamente alcançado pela regressão dinâmica, o elevado índice explicativo do modelo (98,2%), o alto grau de significância das variáveis independentes, juntamente com o baixo erro percentual absoluto médio, nas previsões fora da amostra, conferem à técnica aplicada de regressão múltipla substancial confiabilidade.

Dentre as possíveis causas do MAPE da regressão múltipla não ter alcançado o mesmo nível de desempenho do obtido com o Holt-Winters modificado, encontra-se o tamanho da amostra que se limita a três anos de observações. Uma vez que feriados e dias pontes, entre outros eventos de caráter cíclico (mas não estritamente sazonal), estão representados de forma limitada nesta amostra, a equação de regressão múltipla também incorpora estas restrições. Outra dificuldade é a identificação de variáveis externas que possuam correlação com a variável dependente. Na revisão da literatura para este tipo de previsão, encontram-se indicações sobre a dependência de variáveis como a temperatura. No entanto, além da questão da disponibilidade dos dados de temperatura na mesma freqüência da carga de eletricidade, existe o problema de projeção desta variável para que através da regressão múltipla seja possível a projeção da demanda de carga; por fim, devem ser consideradas as questões geográficas para o cálculo da temperatura média aplicável ao modelo de previsão de carga de todo o estado de Santa Catarina.

Observa-se que o método da regressão múltipla não esgota a possibilidade de se obter um modelo que possua um melhor desempenho com a seleção de outras variáveis independentes e de outras variantes deste método. Neste artigo, optou-se pela previsão da demanda de carga com uma única fórmula de regressão múltipla. No entanto, de forma similar à proposição de Engle et al. (1992), pode-se construir vários conjuntos de equações de regressões lineares múltiplas, como por exemplo, uma equação para cada hora do dia (resultando em 24 modelos de regressão múltipla).

Outra possibilidade de melhoria seria a utilização de métodos de previsão baseados em redes neurais, como uma alternativa univariada. Sugere-se, nesse caso, a necessidade dessas redes neurais serem capazes de armazenar e processar informações que permitam capturar os

(12)

padrões sazonais claramente identificados neste artigo (diário, semanal e, se possível, feriados anuais).

Por fim, considera-se que o método de previsão modificado de Holt-Winters para a incorporação de dois padrões sazonais e ajustado para a correção dos resíduos como um forte candidato, em função do nível de confiabilidade e dos baixos requisitos operacionais, para a previsão de curto prazo para séries de carga de energia elétrica, conforme também constatado para as séries temporais (de hora em hora) do estado de Santa Catarina.

Referências Bibliográficas:

ENGLE, R. F., CHOWDHURY, M., RICE, J. Modelling Peak Electricity Demand. Journal of Forecasting, v. 11(3), p. 241-251, 1992.

RANKE, J. E., REITSCH, A. G., WICHERN, D. W. Business Forecasting. New Jersey: Prentice Hall, 2001. TAYLOR, J. W. Short-term electricity demand forecasting using double seasonal exponential smoothing.

Journal of the Operational Research Society, v. 54, p. 799-805, 2003.

WINTERS, P. R. Forecasting sales by exponentially weighted moving averages. Management Science, v. 6, p. 324-342, 1960.

Referências

Documentos relacionados

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Combinaram encontrar-se às 21h

Tanto em sua paisagem física como em sua paisagem humana, o Mediterrâneo encruzilhada, o Mediterrâneo heteróclito apresenta-se em nossas lembranças como uma imagem coerente, como

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Não tentarei sintetizar a interpretação de Armindo de Sousa sobre o parlamento medieval, dado que as suas propostas mais fraturantes foram já evidenciadas, de forma incisiva, por

As Figuras A-06 (a) e (b) apresentam respectivamente a taxa de aplicação de força (xPC/s) e o pico de força (xPC) do exercício Femoral simples, nos lados direito e esquerdo, de

No primeiro, destacam-se as percepções que as cuidadoras possuem sobre o hospital psiquiátrico e os cuidados com seus familiares durante o internamento; no segundo, evidencia-se