• Nenhum resultado encontrado

Previsão de demanda de energia elétrica usando análise de componentes principais e análise gráfica dos autovetores na abordagem singular spectrum analysis

N/A
N/A
Protected

Academic year: 2021

Share "Previsão de demanda de energia elétrica usando análise de componentes principais e análise gráfica dos autovetores na abordagem singular spectrum analysis"

Copied!
44
0
0

Texto

(1)

Eduardo Takamine Correia

Previs˜

ao de Demanda de Energia El´

etrica

usando An´

alise de Componentes Principais

e An´

alise Gr´

afica dos Autovetores na

Abordagem Singular Spectrum Analysis

Niter´oi - RJ, Brasil 12 de Julho de 2017

(2)

Eduardo Takamine Correia

Previs˜

ao de Demanda de Energia

El´

etrica usando An´

alise de

Componentes Principais e An´

alise

Gr´

afica dos Autovetores na

Abordagem Singular Spectrum

Analysis

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Mois´es Lima de Menezes

Niter´oi - RJ, Brasil 12 de Julho de 2017

(3)

Universidade Federal Fluminense

Eduardo Takamine Correia

Previs˜

ao de Demanda de Energia El´

etrica

usando An´

alise de Componentes Principais e

An´

alise Gr´

afica dos Autovetores na

Abordagem Singular Spectrum Analysis

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Pre-vis˜ao de Demanda de Energia El´etrica usando An´alise de Com-ponentes Principais e An´alise Gr´afica dos Autovetores na Abor-dagem Singular Spectrum Analysis”, defendida por Eduardo Takamine Correia e aprovada em 12 de Julho de 2017, na ci-dade de Niter´oi, no Estado do Rio de Janeiro, pela banca exa-minadora constitu´ıda pelos professores:

Prof. Dr. Mois´es Lima de Menezes Departamento de Estat´ıstica – UFF

Profa. Dra. Keila Mara Cassiano Departamento de Estat´ıstica - UFF

Profa. Dra. M´arcia Marques de Carvalho Departamento de Estat´ıstica - UFF

(4)

de Componentes Principais e Análise Gráfica dos Autovetores na Abordagem Singular Spectrum Analysis /Eduardo Takamine

Correia. - Niterói: [s. n.], 2017. 42f.

Trabalho de Conclusão de Curso - (Bacharelado em Es- tatística) – Universidade Federal Fluminense, 2017.

1. Singular Spectrum Analysis. 2. Análise de Componentes principais. 3. Demanda de Energia. 4.Análise Gráfica dos Autovetores I. Título.

(5)

Resumo

O consumo de energia el´etrica por pessoas, empresas e ind´ustrias aumentam devido ao avan¸co tecnol´ogico, o crescimento da popula¸c˜ao e a ascens˜ao dos pa´ıses emergentes. Para atender esta demanda, o desenvolvimento de novas t´ecnicas capazes de prever com uma melhor acur´acia o consumo de energia el´etrica se faz necess´ario. Singular Spectrum Analysis (SSA) ´e um m´etodo em estat´ıstica que pode, dentre outras coisas, filtrar s´eries temporais eliminando sua componente ruidosa podendo melhorar a acur´acia da previs˜ao. Esta pesquisa prop˜oe a filtragem de uma s´erie temporal de consumo de energia el´etrica via SSA usando An´alise de Componentes Principais e An´alise Gr´afica dos Autovetores. A verifica¸c˜ao do poder preditivo das modelagens nas abordagens de Holt-Winters e de Box & Jenkins ´e feita atrav´es das estat´ısticas de aderˆencia Mean Absolute Percentage Error (MAPE), Root Mean Squared Error (RMSE), Bayesian Information Criterion (BIC) e o coeficiente de determina¸c˜ao R2. Os resultados obtidos mostram que a utiliza¸c˜ao da filtragem SSA proporciona um ganho preditivo `a modelagem e que ao utilizar a An´alise Gr´afica dos Autovetores obt´em o melhor desempenho do que o uso da abordagem com a An´alise de Componentes Principais. Os resultados mostram tamb´em que a modelagem de Box & Jenkins apresenta melhores resultados do que as modelagens de Amortecimento Exponencial de Holt-Winters para a previs˜ao de consumo de energia el´etrica. Tais resul-tados corroboram para a utiliza¸c˜ao destes modelos no aux´ılio do planejamento energ´etico do pa´ıs.

Palavras-chaves: Consumo de Energia El´etrica; SSA; An´alise Gr´afica dos Autovetores; Modelagem; Previs˜ao; An´alise de Componentes Principais

(6)
(7)

Agradecimentos

Agrade¸co primeiramente a Deus e minha fam´ılia: Nancy, Joaquim e Guilherme por sempre me apoiarem, mesmo eu n˜ao sendo a pessoa mais presente de todas.

A L´ıdia Pinto, por sempre ter me dado o maior apoio poss´ıvel e por permanecer ao meu lado em todos os momentos.

Ao meu orientador Moises Lima de Menezes por ter me dado todo o aux´ılio poss´ıvel para a conclus˜ao desse trabalho.

Aos meus amigos que fiz na gradua¸c˜ao, principalmente Natan Borges, Igor Pinto, Jo˜ao Marcos, Jo˜ao Policia, Guilherme Cruvello, Tiago Sales, Fabricio Albernaz, Lucas Meireles, Ranah Duarte e Gilberto Martins que faziam as horas de estudo se tornarem divertidas e menos sufocantes.

(8)

Lista de Figuras Lista de Tabelas 1 Introdu¸c˜ao p. 11 2 Objetivos p. 13 3 Materiais e M´etodos p. 14 3.1 Base de dados . . . p. 14 3.2 Componentes de uma S´erie Temporal . . . p. 15 3.3 Met´odos preditivos . . . p. 15 3.3.1 Modelo de Holt-Winters . . . p. 16 3.3.2 Modelo de Box & Jenkins . . . p. 17 3.3.2.1 Modelos Autoregressivos (AR(p)) . . . p. 18 3.3.2.2 Modelo de m´edias m´oveis (M A(q)) . . . p. 18 3.3.2.3 Modelos autorregressivos e de m´edias m´oveis (ARM A(p, q)) p. 18 3.3.2.4 Modelos autorregressivos integrados de m´edias m´oveis

(ARIM A(p, d, q)) . . . p. 19 3.3.2.5 Modelo SARIM A(p, d, q) × (P, D, Q) . . . p. 19 3.3.2.6 Fun¸c˜ao de Autocorrela¸c˜ao (F AC) e Fun¸c˜ao de

Autocor-rela¸c˜ao Parcial (F ACP ) . . . p. 20 3.4 Filtragem SSA . . . p. 21 3.4.1 Decomposi¸c˜ao . . . p. 22

(9)

3.4.2 Reconstru¸c˜ao . . . p. 23 3.4.3 An´alise Componentes Principais . . . p. 24 3.4.4 An´alise Gr´afica dos Autovetores . . . p. 24 3.5 Estat´ısticas de aderˆencia . . . p. 25 3.6 Resumo de metodologia . . . p. 26

4 An´alise dos Resultados p. 28

4.1 An´alise e Modelagem da S´erie Original . . . p. 28 4.2 An´alise e modelagem da s´erie sob a abordagem SSA-ACP . . . p. 30 4.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica . p. 33 4.4 An´alise dos Res´ıduos . . . p. 39

5 Conclus˜ao p. 40

Referˆencias p. 41

(10)

1 S´erie de consumo de energia. . . p. 14 2 Fluxograma resumido da metodologia . . . p. 27 3 S´erie original x S´erie ajustada pelo melhor modelo. . . p. 29 4 Logaritmos dos autovalores na abordagem SSA-ACP. . . p. 30 5 Matriz de Correla¸c˜ao Ponderada SSA-ACP. . . p. 31 6 S´erie original x S´erie ajustada pelo melhor modelo ap´os a filtragem

SSA-ACP. . . p. 32 7 Os nove autovetores mais significantes na abordagem SSA-An´alise Gr´afica. p. 34 8 Diagramas de dispers˜ao dos autovetores em sequˆencia. . . p. 35 9 Matriz de Correla¸c˜ao Ponderada SSA-An´alise Gr´afica. . . p. 36 10 S´erie original x S´erie ajustada pelo melhor modelo ap´os a filtragem

SSA-An´alise Gr´afica. . . p. 38 11 FAC do modelo escolhido. . . p. 39 12 Modelagem da s´erie Original. . . p. 42 13 Modelagem da sob abordagem SSA-ACP. . . p. 42 14 Modelagem da sob abordagem SSA-An´alise Gr´afica. . . p. 43

(11)

Lista de Tabelas

1 Estat´ıstica descritiva . . . p. 14 2 Equac˜oes dos modelos de Holt-Winters Multiplicativo e Aditivo . . . . p. 16 3 Propriedades te´oricas da F AC e F ACP . . . p. 21 4 Estat´ısticas de aderˆencia da Modelagem da S´erie Original . . . p. 29 5 Estat´ısticas de aderˆencia da Modelagem da S´erie sob Abordagem SSA-ACP p. 32 6 Agrupamento das Componentes . . . p. 35 7 Correla¸c˜ao Ponderada Entre Componentes . . . p. 36 8 Estat´ısticas de aderˆencia da Modelagem da S´erie sob Abordagem

SSA-An´alise Gr´afica . . . p. 37 9 Estat´ıstica de aderˆencia dos modelos com melhor resultado . . . p. 38

(12)

1

Introdu¸

ao

Segundo a proje¸c˜ao do IBGE em 2016, a popula¸c˜ao brasileira j´a passa dos 200 milh˜oes habitantes e a energia el´etrica tem se tornado um bem indispens´avel, tanto para a po-pula¸c˜ao urbana, quanto para a rural. Segundo Rodrigues et al. [1], empresas que s˜ao responsav´eis por gerar, transmitir e distribuir energia el´etrica investem cada vez mais em estudos e proje¸c˜oes sobre demanda. Conhecer a futura demanda de energia el´etrica seria uma grande ajuda em v´arias das atividades di´arias, especialmente se permitirem otimi-zar o escalonamento da produ¸c˜ao de energia el´etrica e a distribui¸c˜ao de energia, al´em de permitirem um agendamento de manuten¸c˜ao que n˜ao perturbe o fornecimento.

Diante da grande demanda de energia el´etrica, faz-se necess´ario um planejamento ade-quado para que n˜ao haja escassez deste produto. O conhecimento futuro desta demanda ´e essencial para que se tenha em vista a necessidade de amplia¸c˜ao do sistema de gera¸c˜ao de energia adequado de modo a n˜ao gerar gastos desnecess´arios em obras que n˜ao servir˜ao `

a popula¸c˜ao ou, por outro lado, n˜ao haver investimento suficiente para suprir a demanda e, com isso, provocar efeitos negativos como apag˜oes, sobrecarga de sistema de energia ou o racionamento for¸cado de energia por falta deste recurso.

O crescimento da popula¸c˜ao, o progresso tecnol´ogico e as economias emergentes tˆem promovido o aumento da demanda por energia el´etrica em todo o mundo. Para lidar com essa tendˆencia crescente, as previs˜oes s˜ao periodicamente revisadas, a fim de atualizar o planejamento da expans˜ao de m´edio e longo prazos (MENEZES et al., 2014)[2].

Com tantas mudan¸cas se faz necess´ario toda uma reestrutura¸c˜ao do sistema para que se tenha uma ind´ustria de energia el´etrica de alta qualidade, com fornecimento de energia de qualidade e seguran¸ca para o consumidor com a minimiza¸c˜ao dos custos. Logo, a previs˜ao de consumo de energia ´e um tema de grande interesse para este setor, uma vez que os custos dos erros de previs˜ao acabam por gerar um custo financeiro muito elevado, seja por excesso (overforecast) ou por falta (underforecast) (SERR ˜AO, 2013)[3].

(13)

1 Introdu¸c˜ao 12

se fazer estas previs˜oes tendo em vistas o conhecimento futuro da demanda de energia el´etrica de forma segura. (Singular Spectrum Analysis)SSA ´e um m´etodo em estat´ıstica que pode, dentre outras coisas, realizar filtragem de s´eries temporais minimizando a com-ponente ruidosa e promovendo um ganho priditivo.

Esta pesquisa prop˜oe as modelagens Holt-Winters e Box & Jenkins para uma s´erie mensal de demanda de energia el´etrica entre o per´ıodo de Jan/2002 a Dez/2016. Al´em disso, prop˜oe uma filtragem SSA baseada na an´alise de componentes principais (ACP ) na s´erie antes das modelagens. Para verificar a capacidade preditiva dos modelos sem e com a filtragem SSA, as estat´ısticas de aderˆencia M AP E(Mean Absolute Percentage Error) e RM SE(Root Mean Square Error) e o coeficiente de determina¸c˜ao R2 al´em do

crit´erio de informa¸c˜ao bayesiano (BIC) ser˜ao utilizados. O modelo mais adequado para esta s´erie ser´a aquele que minimizar as estat´ısticas de aderˆencia e maximizar o coeficiente de determina¸c˜ao. Para as modelagens Holt-Winters e Box & Jenkins ser´a utilizado o pro-grama Forecast Pro for windows (FPW). A filtragem SSA ser´a feita a partir do programa CaterpillarSSA bem como a ACP . As estat´ısticas de aderˆencia ser˜ao feitas a partir do FPW.

Esta pesquisa est´a dividido em cinco cap´ıtulos. Ap´os esta breve introdu¸c˜ao, tem-se, no cap´ıtulo 2 os objetivos. No cap´ıtulo 3 est˜ao os materiais e m´etodos. Os resultados e discuss˜oes est˜ao no cap´ıtulo 4 e no cap´ıtulo 5 est˜ao as conclus˜oes.

(14)

2

Objetivos

Esta pesquisa o tem como objetivo avaliar sobre o ganho preditivo de uma s´erie de demanda de energia el´etrica, com base em dados do Operador Nacional do Sistema El´etrico (ONS), com filtragem SSA ( Singular Spectrum Analysis) e com o uso da ACP (An´alise de Componentes Principais) para modelar e prever demanda de energia el´etrica e, assim, verificar qual o modelo mais adequado para esta s´erie dentre os modelos Holt-Winters e Box & Jenkins.

(15)

14

3

Materiais e M´

etodos

3.1

Base de dados

Nesta pesquisa ser´a utilizada uma s´erie temporal de consumo mensal de energia da base nacional de dados do Operador Nacional do Sistema El´etrico (ONS). A s´erie em quest˜ao cont´em 180 observa¸c˜oes medidas de janeiro de 2002 a dezembro de 2016 medidos em MWh. As informa¸c˜oes est˜ao dispon´ıveis em http://www.ons.org.br/. A figura 1 apresenta s´erie temporal de consumo de energia.

Figura 1: S´erie de consumo de energia.

A tabela 1 apresenta algumas estat´ısticas descritivas da s´erie temporal avaliada. Tabela 1: Estat´ıstica descritiva

Tamanho da s´erie 180

Valor m´ınimo 43.941, 88 MWh Valor m´aximo 84.920, 41 MWh

M´edia 64.834, 30 MWh

(16)

3.2

Componentes de uma S´

erie Temporal

Uma s´erie temporal ´e um conjunto de observa¸c˜oes ordenadas no tempo. Uma s´erie ´e dita estacion´aria quando ela se desenvolve no tempo aleatoriamente ao redor de uma m´edia constante, refletindo alguma forma de equil´ıbrio est´avel.

Na tentativa de descrever o comportamento de uma s´erie temporal, utilizamos a de-composi¸c˜ao da s´erie original em quatro s´eries temporais, ciclo, tendˆencia, sazonalidade e uma componente aleat´oria, conhecida tamb´em como ru´ıdo.

• Ciclo (C): Movimento ondulat´orio que ao longo de v´arios anos tende a ser peri´odico. • Tendˆencia (T): A tendˆencia de uma s´erie indica o seu comportamento “de longo prazo”, isto ´e, se ela cresce, decresce ou permanece est´avel, e qual a velocidade destas mudan¸cas.

• Sazonalidade (S): A sazonalidade em uma s´erie corresponde `as oscila¸c˜oes de subida e de queda que sempre ocorrem em um determinado per´ıodo do ano, do mˆes, da semana ou do dia.

• Componente aleat´oria (A): Flutua¸c˜oes inexplic´aveis e inesperados como cat´astrofes naturais, decis˜oes humanas que ocorrem de forma intempestivas e etc

3.3

Met´

odos preditivos

A maioria dos m´etodos de previs˜ao baseia-se na ideia de que as observa¸c˜oes passadas contˆem informa¸c˜oes sobre o padr˜ao de comportamento da s´erie temporal. O prop´osito dos m´etodos ´e distinguir a similaridade de qualquer ru´ıdo que possa estar contido nas ob-serva¸c˜oes e ent˜ao usar esse modelo para prever valores futuros da s´erie. Segundo Morettin e Toloi [8] um modelo pode ser utilizado para investigar o mecanismo gerador da s´erie temporal, fazer previs˜oes de valores futuros da s´erie, verificar a existˆencia de tendˆencias, ciclos e varia¸c˜oes sazonais.

Nesta se¸c˜ao s˜ao apresentados os m´etodos preditivos a serem testados na previs˜ao de s´eries filtradas e n˜ao filtradas via SSA − ACP . Os m´etodos testados nesta pesquisa s˜ao de Holt Winters e Box & Jenkins.

(17)

3.3 Met´odos preditivos 16

3.3.1

Modelo de Holt-Winters

Os modelos de Holt-Winters (HW) descrevem apropriadamente dados de demanda em que verifica-se a ocorrˆencia de tendˆencia linear, al´em de uma componente de sazonalidade (FOGLIATO [10]). Caso a amplitude da varia¸c˜ao sazonal mantenha-se constante, diz-se que o modelo ´e aditivo, caso aumente com o tempo, diz-se que o modelo ´e multiplicativo. De acordo com Morettin e Toloi [8], as vantagens desse modelo s˜ao: f´acil entendimento; aplica¸c˜ao n˜ao dispendiosa; adequados para s´erie com padr˜ao de comportamento mais geral e que as desvantagens s˜ao: dificuldades em determinar os valores mais apropriados das constantes de suaviza¸c˜ao e/ou impossibilidade de estudar as propriedades estat´ısticas, tais como m´edia e variˆancia de previs˜ao e, consequentemente, a constru¸c˜ao de um intervalo de confian¸ca. O m´etodo de Holt-Winters ´e baseado em trˆes equa¸c˜oes alisadoras. Uma para o n´ıvel, outra para tendˆencia e outra para sazonalidade. A sazonalidade pode ter efeito multiplicativo ou aditivo. As equa¸c˜oes b´asicas para ambos os tipos de modelo est˜ao apresentadas na tabela 2.

Tabela 2: Equac˜oes dos modelos de Holt-Winters Multiplicativo e Aditivo Modelo Multiplicativo Modelo Aditivo

N´ıvel Lt=αSt−12Yt +(1−α)×(Lt−1+Bt−1) Lt=α(Yt−St−12)+(1α)×(Lt−1+Bt−1) Tendˆencia Bt=β(Lt−Lt−1)+(1−β)Bt−1 Bt=β(Lt−Lt−1)+(1−β)Bt−1 Sazonalidade St=γLtYt+(1−γ)St−12 St=γ(Yt−Lt)+(1−γ)St−12 Previs˜ao Ft+m=(Lt+Bt+m)St−12+m Ft+m=(Lt+Bt+m)St−12+m Onde: • S - Comprimento da sazonalidade; • Lt - N´ıvel da s´erie; • Bt - Tendˆencia; • St - Componente sazonal;

• Ft+m - Previs˜ao m passos `a frente;

• Yt - Valor observado;

• α β γ - Parˆametros de amortecimento do n´ıvel, da tendˆencia e da sazonalidade, respec-tivamente.

(18)

3.3.2

Modelo de Box & Jenkins

Os modelos de Box & Jenkins, tamb´em conhecidos como Modelos Autoregressivos Integrados a M´edia M´ovel, ou simplesmente ARIM A (Autoregressive Integrated Moving Average), foram propostos por George Box e Gwilym Jenkins, no in´ıcio dos anos 70 (BOX & JENKINS [5]). Os modelos de Box & Jenkins partem da id´eia de que os valores de uma s´erie temporal s˜ao altamente dependentes, ou seja, cada valor pode ser explicado por valores pr´evios da s´erie. Os modelos ARIM A representam a classe mais geral de modelos para a an´alise de s´eries temporais. Algumas condi¸c˜oes devem ser observadas para o entendimento dos modelos Box & Jenkins. As condi¸c˜oes s˜ao de estacionariedade, normalidade e homocedasticidade.

• Estacionariedade: Uma s´erie temporal ´e dita estacion´aria se ela conserva suas pro-priedades estat´ısticas ao longo do tempo. A maioria dos procedimentos de an´alise estat´ıstica de s´eries temporais sup˜oe que estas sejam estacion´arias. Portanto, ser´a necess´ario transformar os dados originais se estes n˜ao formam uma s´erie estacion´aria. A transforma¸c˜ao mais comum consiste em tomar diferen¸cas sucessivas da s´erie ori-ginal at´e se obter uma s´erie estacion´aria. A primeira diferen¸ca ∆Z(t) ´e definida por:

∆Z(t) = Z(t) − Z(t − 1) (3.1)

Assim a segunda diferen¸ca ´e:

∆2Z(t) = ∆[∆Z(t)] = ∆[Z(t) − Z(t − 1)] = Z(t) − 2Z(t − 1) + Z(t − 2) (3.2)

De modo geral ´e

∆nZ(t) = ∆[∆n−1Z(t)] (3.3)

• Normalidade: Uma s´erie obedece o crit´erio de normalidade se seu processo gerador segue uma distribui¸c˜ao normal de probabilidades. Existem v´arios testes na literatura como por exemplo os testes de Shapiro-Wilk ou Kolmogorov-Smirnov. A hip´otese nula do teste ´e de normalidade. Se o teste rejeita a hip´otese nula, deve-se proceder com a transforma¸c˜ao logaritmica dos dados.

(19)

3.3 Met´odos preditivos 18

observa¸c˜oes diferentes. O teste de Breusch-Pagan ´e uma das formas para verificar se uma s´erie ´e um homoced´astica.

3.3.2.1 Modelos Autoregressivos (AR(p))

O modelo AR(p) ´e um modelo estoc´astico ´util na representa¸c˜ao de um grande n´umero de s´eries temporais. Neste modelo, o valor corrente do processo ´e expresso como uma com-bina¸c˜ao linear finita de valores pr´evios do processo e um ru´ıdo aleat´orio t.

Assim, Zt, t  Z ´e um processo autorregressivo de ordem p e ´e denotado por (3.4)

Zt∼ AR(p) (3.4)

A equa¸c˜ao do modelo (AR(p)) esta representada em (3.5)

Zt= φ1Zt−1+ · · · + φpZt−p+ t (3.5)

Onde φ1, . . . , φps˜ao coeficientes reais e t ´e independente e identicamente distribuida

(i.i.d) e t∼ N (0, σ2).

3.3.2.2 Modelo de m´edias m´oveis (M A(q))

Considere um processo linear Zt, tZ. O processo MA(q) ´e descrito pela equa¸c˜ao (3.6)

Zt= t− θ1t−1− · · · − θqt−q (3.6)

Onde θ1, . . . , θq s˜ao coeficientes reais, t ´e i.i.d com t∼ N (0, σ2).

3.3.2.3 Modelos autorregressivos e de m´edias m´oveis (ARM A(p, q))

Modelos autorregressivos e de m´edias m´oveis s˜ao a jun¸c˜ao dos modelos AR e M A. Denota-se por ARM A(p, q) um processo autorregressivo e de m´edias m´oveis de ordem (p, q) e pode ser representado pela equa¸c˜ao (3.7)

Zt= φ1Zt−1+ · · · + φpZt−p+ t− θ1t−1− · · · − θqt−q (3.7)

(20)

3.3.2.4 Modelos autorregressivos integrados de m´edias m´oveis (ARIM A(p, d, q)) O modelo ARIM A considera a tendˆencia da s´erie temporal, tem ordem (p, d, q) e pode ser representado por: 3.8

φ(B)(1 − B)dZt= θ(B)t (3.8)

Onde φ(B) = 1 − φ1B − φ2B2 − · · · − φpBp o polinˆomio autoregressivo de ordem p;

θ(B) = 1 − θ1B − θ2B2 − · · · − θqBp o polinˆomio de m´edias m´oveis de ordem q, B o

operador de retardo, tal que BjZ

t= Zt−j e d ´e o n´umero de diferen¸cas necess´arias para

retirar a tendˆencia da s´erie e transform´a-la em estacion´aria.

3.3.2.5 Modelo SARIM A(p, d, q) × (P, D, Q)

Um dos modelos mais utilizados que consideram a sazonalidade de uma determinada serie temporal ´e o chamado modelo ARIM A sazonal ou SARIM A. Tais modelos s˜ao importantes pois levam em considerac˜ao a sazonalidade estoc´astica dos dados. Quando o per´ıodo s = 12, o modelo denominado SARIM A de ordem (p, d, q) × (P, D, Q)12, ´e dado

por 3.9

φ(B)Φ(B12)∆d∆D12Zt= θ(B)Θ(B)t (3.9)

Onde :

• φ(B) ´e o operador autoregressivo (AR) de ordem p; • θ(B) ´e o operador de m´edias m´oveis (M A) de ordem q; • Φ(B) ´e o operador AR-sazonal de ordem P ;

• Θ(B) ´e o operador M A-sazonal de ordem Q; • ∆d ´e o operador de diferen¸ca;

• ∆D

12 ´e o operador de diferen¸ca sazonal;

(21)

3.3 Met´odos preditivos 20

3.3.2.6 Fun¸c˜ao de Autocorrela¸c˜ao (F AC) e Fun¸c˜ao de Autocorrela¸c˜ao Parcial (F ACP )

A fun¸c˜ao de autocorrela¸c˜ao mede o grau de correla¸c˜ao de uma vari´avel, em um dado instante, consigo mesma, em um instante de tempo posterior. Ela permite que se analise o grau de irregularidade de um sinal.

A an´alise da F AC e da F ACP ´e de fundamental importˆancia para o procedimento de previs˜ao de s´eries temporais, pois ´e com ela que se identifica-se as ordens p e q de um modelo ARM A. A F AC ´e definida como a raz˜ao entre a autocovariˆancia e a variˆancia para um conjunto de dados, que corrresponde a 3.11

γk = T −k X t=1 1 T − k(Zt− E(Zt))(Zt+k − E(Zt+k)) (3.10) ρk = γk γ0 (3.11) Onde, • γk ´e a autocovariˆancia; • γ0 ´e a variˆancia.

Os modelos AR(p), M A(q) e ARM A(p, q) apresentam F AC com caracter´ısticas es-pec´ıficas:

(i) Processo AR(p) tem F AC infinita em extens˜ao que decai de acordo com exponen-ciais e/ou senoides amortecidas;

(ii) Processo M A(q) tem F AC finita, no sentido que ela apresenta um corte ap´os a defasagem q;

(iii) Processo ARM A(p, q) tem F AC infinita que decai de acordo com exponencias e/ou senoides amortecidas ap´os a defasagem (q − p).

Uma outra ferramenta utilizada no processo de identifica¸c˜ao do modelo ´e a FACP. Esta medida corresponde a correla¸c˜ao de Zt e Zt−k removendo o efeito das observa¸c˜oes

Zt−1, Zt−2, . . . , Zt−k+1 e ´e denotada por φkk , ou seja

(22)

Um m´etodo geral para encontrar a FACP de um processo autoregressivo com FAC ρk ´e

utilizando as equa¸c˜oes de Yule-Walker, dado por:

          1 ρ1 ρ2 . . . ρp−1 ρ1 1 ρ1 . . . ρp−2 ρ2 ρ1 1 . . . ρp−3 .. . ... ... . .. ... ρp1 ρp−2 ρp−3 . . . 1                     φ1 φ2 φ3 .. . φp           =           ρ1 ρ2 ρ3 .. . ρp          

A tabela 2, mostra as propriedades te´oricas das fun¸c˜oes de autocorrela¸c˜ao e auto-correla¸c˜ao parcial para alguns processos estacion´arios como auxiliar na identica¸c˜ao do modelo.

Tabela 3: Propriedades te´oricas da F AC e F ACP

Processo F AC F ACP

AR(1), α > 0 decaimento exponencial 0, k ≥ 1 AR(p), α > 0 decaimento exponencial 0, k ≥ p

M A(1) 0, k > 1 decaimento oscilat´orio

ARM A(p, q) decaimento a partir de q decaimento a partir de p

3.4

Filtragem SSA

Singular Spectrum Analysis (SSA) ´e uma t´ecnica n˜ao param´etrica que permite de-compor uma s´erie temporal em sinal e ru´ıdo. ´E uma t´ecnica ´util para filtrar dados de s´eries temporais. Por Menezes et al. [2], s˜ao utilizadas trˆes metodologias na abordagem SSA: An´alise de componentes principais (ACP), ACP associado com An´alise de Cluster e An´alise Gr´afica dos Vetores Singulares. Em seu artigo ´e mostrado que o melhor m´etodo em SSA ´e a An´alise Gr´afica dos vetores singulares, que ser´a usado nesta pesquisa. Para Elsner e Tsonis [6], SSA ´e um m´etodo recente e poderoso em s´eries temporais que incor-pora elementos de an´alise cl´assica de s´eries temporais, estat´ıstica multivariada, geometria multivariada, sistemas dinˆamicos e processamentos de sinais . SSA tem sido aplicada com sucesso em diversas ´areas: na matem´atica e f´ısica a economia e matem´atica financeira, na meteorologia e oceanografia a ciˆencias sociais (GOLYANDINA et al. [7]).

O m´etodo SSA ´e um procedimento que pode ser utilizado, dentre outras aplica¸c˜oes, na remo¸c˜ao de ru´ıdo e de s´eries temporais (GOLYANDINA et al. [7]; HASSANI et al. [9]). A vers˜ao b´asica do m´etodo SSA pode ser dividida em duas etapas: decomposi¸c˜ao e

(23)

3.4 Filtragem SSA 22

reconstru¸c˜ao.

3.4.1

Decomposi¸

ao

Segundo Menezes et al. [2], a etapa de decomposi¸c˜ao pode ser subdividida em duas partes: Incorpora¸c˜ao e decomposi¸c˜ao em valores singulares (SVD – Singular Value De-composition).

Seja Yt = [y1, . . . yT]1×T uma s´erie temporal e considere L tal que 2 ≤ L ≤ T de

modo que L ´e um parˆametro a ser estimado e ´e chamado de comprimento da janela (GOLYANDINA et al. [7]). Entende-se por Incorpora¸c˜ao o procedimento no qual uma s´erie temporal YT ´e levada a uma matriz X chamada “Matriz Trajet´oria” dada por (3.13).

X =        y1 y2 y3 . . . yk y2 y3 y4 . . . yk+1 .. . ... ... . .. ... yL yL+1 yL+2 . . . yT        (3.13)

A matriz X ´e uma matriz Hankel, ou seja, os elementos de xi,j tal que i+j = constante

s˜ao iguais.

Considere S = XX0. Os autovalores de S dispostos em ordem de significˆancia λ1 ≥ · · · ≥ λL ≥ 0 s˜ao obtidos e os respectivos autovalores U1, . . . , UL s˜ao encontrados.

Considere V0 = (X0UL)/

λ, como S ´e positivo semi-definido, ent˜ao a matriz trajet´oria X pode ser expressa pela decomposi¸c˜ao em valores singulares (SVD) apresentada em (3.14):

X = E1+ E2+ · · · + EL, (3.14)

onde El =

λUlVl0, para todo l = 1, . . . , L. A cole¸c˜ao (

λl, Ul, Vl) ´e conhecida como

auto-tripla da expans˜ao SVD de X. Os elementos da autotripla s˜ao definidos respectivamente por: valor singular, vetor singular `a esquerda e vetor singular `a direita de X (MENEZES et al. [2]). A contribui¸c˜ao de cada componente em (3.14) pode ser mensurada pela raz˜ao de autovalores λl/PLl=1λl.

(24)

3.4.2

Reconstru¸

ao

Segundo Menezes et al. [2], a etapa de reconstru¸c˜ao est´a subdividida em duas partes: agrupamento e m´edia diagonal. A etapa de agrupamento consiste no procedimento de agrupar algumas sequˆencias de matrizes elementares resultantes da decomposi¸c˜ao SVD em grupos disjuntos e, ap´os isso, som´a-las, gerando novas matrizes elementares.

Considere a sequencia PL

l=1El de matrizes elementares da expans˜ao de SVD. Agrupe

as mesmas em m grupos disjuntos utilizando algum m´etodo, por exemplo, por meio de an´alise de componentes principais, an´alise gr´afica de vetores singulares ou agrupamento hier´arquico e assumir que o conjunto de ´ındices gerado ´e dado por {I1, . . . , Im}, de modo

que a expans˜ao (3.14) pode ser reescrita como em (3.15), sendo XIiarbitr´aria tal queXIi =

Ppi j=1XIij (MENEZES et al. [2]). X = L X l=1 El = m X i=1 XIi (3.15)

O objetivo do agrupamento ´e diminuir o n´umero de componentes na expans˜ao da matriz trajet´oria X. A contribui¸c˜ao de cada componente ´e mensurada pela raz˜ao (3.16) (MENEZES et al. [2]). Ppi j=1λIij PL l=1λl . (3.16)

Considere a matriz trajet´oria X e assuma que L∗ = min(L, K) e K∗ = max(L, K). Considere x(i)l,k um elemento na linha l e coluna k na matriz XIi. O elemento y

(i) t da

componente hyt(i)i

1×T da s´erie temporal [yt]1×T ´e calculado por meio da m´edia diagonal

da matriz elementar XIi definida em (3.17), a partir da matriz elementar XIi.

yt(i)=                  t P l=1 x(i)l,t−l+1 t , se 1 ≤ t < L ∗ L∗ P l=1 x(i)l,t−l+1 L∗ , se L∗ ≤ t < K∗ T −K∗+1 P l=t−K∗+1 x(i)l,t−l+1 T −K∗+1 , se K∗ ≤ t ≤ T (3.17)

Cada componente hyt(i)i

1×T concentra parte da energia da s´erie temporal original

[yt]1×T que pode ser mensurada pela raz˜ao de autovalores pi P j=1 λIij/ d P l=1 λl. De acordo com

(25)

3.4 Filtragem SSA 24

[9], podemos classificar as componentes SSA hy(i)t i

1×T

de uma s´erie temporal arbitr´aria [yt]1×T em trˆes categorais: tendˆencia, componentes harmˆonicas (ciclo e sazonalidade) e

ru´ıdo (GOLYANDINA et al. [7]).

Um dos principais conceitos estudados em SSA ´e a propriedade de separabilidade Hassani et al. [9]. Tal propriedade caracteriza qu˜ao bem separados est˜ao as diferentes, componentes, umas das outras. Uma boa medida de separabilidade ´e a Correla¸c˜ao Ponde-rada. Por correla¸c˜ao ponderada weighted correlation ou w-correla¸c˜ao, podemos entender como uma fun¸c˜ao que quantifica a dependˆencia linear entre duas componentes SSA YT(1) e YT(2) definida em (3.18) (MENEZES et al. [2]).

ρ(w)ij = 

YT(i), YT(j)

w

||YT(i)||w||Y (j) T ||w

. (3.18)

onde ||YT(i)||w =

r  YT(i), YT(i) w ; ||YT(j)||w = r  YT(j), YT(j) w ;YT(i), YT(j) w = T P k=1 wky (i) k y (j) k e wk= min{k, L, T − k}.

Atrav´es da separabilidade, pode-se verificar estatisticamente se duas componentes SSA est˜ao bem separadas, em termos de dependˆencia linear. Segundo Hassani et al. [9], o valor absoluto da w-correla¸c˜ao ´e pequeno, ent˜ao as componentes SSA correspondentes s˜ao classificadas como w-ortogonais (ou quase w-ortogonais); caso contr´ario, s˜ao ditas mal separadas. Salienta-se que comumente utiliza-se a correla¸c˜ao ponderada na fase de agrupamento SSA (GOLYANDINA et al. [7]).

3.4.3

An´

alise Componentes Principais

Na filtragem SSA via abordagem ACP-SVD, define-se um comprimento de janela ´

otimo igual a L para a matriz trajet´oria X, um truncamento ´otimo na componente N na SVD, de modo que a soma das matrizes elementares remanescentes na SVD venha a gerar uma s´erie temporal RT classificada como ru´ıdo. O objetivo ´e obter uma s´erie temporal

yT menos ruidosa que a s´erie temporal original YT, removendo-se RT. Trata-se, portanto,

de um problema de otimiza¸c˜ao.

3.4.4

An´

alise Gr´

afica dos Autovetores

A an´alise das coordenadas da s´erie temporal na base definida pelos vetores singulares resultantes da SVD permite identificar as componentes de tendˆencia e da sazonalidade da

(26)

s´erie. O problema geral aqui consiste em identificar e separar as componentes oscilat´orias das componentes que fazem parte da tendˆencia. De acordo com (GOLYANDINA et al. [7]) a an´alise gr´afica de tais coordenadas aos pares permite identificar por meio visual as componentes harmˆonicas da s´erie.

As coordenadas da s´erie temporal em duas componentes ortogonais podem ser dispos-tas em um diagrama de dispers˜ao. Considere um harmˆonico puro com frequˆencia igual a ω, fase igual a ξ, amplitude igual a ξ e per´ıodo ρ=1ω definido como um divisor do tamanho da janela L e K. Se o parˆametro ρ assume um valor inteiro, ent˜ao ρ ´e classificado como per´ıodo do harmˆonico. Por exemplo, as fun¸c˜oes seno e o cosseno com frequˆencias, ampli-tudes e fases iguais resultam em um diagrama de dispers˜ao que exibe um padr˜ao circular. Por sua vez, se ρ=1ω ´e um inteiro, ent˜ao o diagrama de dispers˜ao exibe um pol´ıgono regular com ρ v´ertices. Para uma frequˆencia ω = mn < 0.5 com m e n inteiros e primos, os pontos s˜ao v´ertices de um pol´ıgono regular de n v´ertices (GOLYANDINA et al. [7]). Dessa forma, a identifica¸c˜ao dos componentes que s˜ao gerados por um harmˆonico ´e reduzida `a an´alise pict´orica do padr˜ao determinado nos diferentes pares de componentes.

3.5

Estat´ısticas de aderˆ

encia

Na escolha de um m´etodo de previs˜ao ou outro ´e importante utilizar medidas de erro com a finalidade de se encontrar aquele m´etodo que melhor atende os objetivos da an´alise de s´erie temporal. Dentre as estat´ısticas de aderˆencia, se destacam:

(i) RM SE (Root mean square error): na equa¸c˜ao 3.19, mostra as diferen¸cas individuais entre a previs˜ao do modelo ( ˆZt) e as observa¸c˜oes (Zt) , onde n ´e o total

de compara¸c˜oes. Elevando as diferen¸cas ao quadrado for¸ca a tratar igualmente os resultados negativos e positivos. Mede o erro total (sistem´aticos e randˆomicos). ´E utilizado para medir a magnitude do erro.

RM SE = v u u t n P t=1 (Zt− ˆZt)2 n . (3.19)

(ii) M AP E (Mean Absolute Percentage Erro): na equa¸c˜ao 3.20, expressa a acur´acia do erro em percentagem. Onde Zt s˜ao os dados observados, ˆZt s˜ao os

dados ajustados pelo o modelo e n ´e o n´umero de observa¸c˜oes. M AP E =

Pn

t=1|(Zt− ˆZt)/Zt|

(27)

3.6 Resumo de metodologia 26

(iii) BIC (Byesian information Criterion) : o BIC (3.21) aumenta conforme a soma dos quadrados dos erros (SQE) (3.22) aumenta. Al´em disso, o BIC penaliza modelos com muitos parˆametros. Quanto menor o valor de BIC, melhor.

BIC = −2 log Lp+ [(p + 1) + 1] log n, (3.21)

onde Lp´e a fun¸c˜ao de m´axima verossimilhan¸ca do modelo e p ´e o n´umero de vari´aveis

explicativas consideradas no modelo.

SQE = v u u t n X t=1 (Zt− ˆZt)2 n . (3.22)

Como modelos com mais vari´aveis tendem a produzir menor SQE mas usam mais parˆametros, a melhor escolha ´e balancear o ajuste com a quantidade de vari´aveis. (iv) R2 (Coeficiente de determina¸c˜ao): tamb´em chamado de R2, expressa em 3.23 ´e

uma medida de ajustamento de um modelo estat´ıstico. O R2 varia entre 0 e 1,

indi-cando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R2, mais explicativo ´e modelo, melhor ele se ajusta `a amostra.

R2 = 1 − PT t=1(Zt− ˆZt)2 PT t=1(Zt− ¯Z)2) ! (3.23)

3.6

Resumo de metodologia

A execu¸c˜ao desta pesquisa dever´a seguir na seguinte sequencia: inicialmente a s´erie original de demanda de energia ser´a modelada de acordo com o modelo sugerido pelo software FPW; em seguida ser˜ao feitos testes de normalidade e de estacionariedade com os programas Eviews e Gretl com o intuito de realizar a modelagem ARIM A. Caso n˜ao se verifiquem as condi¸c˜oes de normalidade e de estacionariedade, os procedimentos de transforma¸c˜ao logaritmica e de realizar diferen¸cas sucessivas na s´erie ser˜ao feitos at´e que sejam obedecidas tais condi¸c˜oes. Posto isso, a modelagem ARIM A ser´a feita pelo FPW e confirmada pelo Gretl a partir das an´alises do correlograma.As adequa¸c˜oes dos modelos ser˜ao feitas pela an´alise dos res´ıduos verificando se os mesmos s˜ao independentes e identicamente distribu´ıdas (i.i.d.).

(28)

CaterpillarSSA. Nesta filtragem, ser´a levada em considera¸c˜ao a filtragem tradicional via an´alise gr´afica dos autovetores e a a filtragem SSA sob a abordagem com an´alise de componentes principais. Nestas duas filtragens, a s´erie original ser´a decomposta em trˆes componentes: tendˆencia, harmˆonica e ru´ıdo, sendo esta ´ultima removida ap´os a con-firma¸c˜ao com o teste independˆencia usando o Eviews. Nos dois casos das filtragens SSA, as s´eries filtradas ser˜ao modeladas tamb´em via Holt-Winters e Box & jenkins.

Ap´os as modelagens das s´eries original e filtrada via SSA e SSA − ACP , as es-tat´ısticas de aderˆencia ser˜ao feitas e seus resultados listados em uma tabela de modo que o modelo mais adequado ser´a aquele que minimize estas estat´ısticas de erro utilizadas e que maximize o coeficiente de determina¸c˜ao. A figura 2 apresenta o fluxograma resumido desta metodologia.

(29)

28

4

An´

alise dos Resultados

Conforme a proposta, foram feitas as an´alises e modelagens da s´erie temporal de demanda de energia el´etrica sem filtragem, com a filtragem SSA usando an´alise gr´afica (SSA-An´alise Gr´afica) e com a filtragem SSA sob a abordagem ACP (SSA-ACP). Na se¸c˜ao 4.1 s˜ao apresentados os resultados obtidos da an´alise de s´eries temporais para a s´erie original.

4.1

An´

alise e Modelagem da S´

erie Original

A modelagem da s´erie original se deu por meio da an´alise de cinco (5) potenciais modelos, sendo trˆes (3) de amortecimento exponencial de Holt-Winters e dois (2) da classe de modelos ARIMA de Box & Jenkins.

A escolha dos modelos de Holt-Winters se deu pela sugest˜ao da sele¸c˜ao do espe-cialista do programa FPW e por suas varia¸c˜oes. Dessa forma, os modelos analisados foram: HW1 (Modelo com tendˆencia linear e sazonalidade multiplicativa - escolha do es-pecialista); HW2 (Modelo de Amortecimento Exponencial Simples, sem tendˆencia e sem sazonalidade); HW3 (Modelo com tendˆencia linear e sem sazonalidade). Todos eles com otimiza¸c˜ao dos parˆametros.

A escolha dos modelos de Box & Jenkins tamb´em partiu da sele¸c˜ao do especialista, seguido de uma varia¸c˜ao deste mesmo modelo. Desta forma, o s modelos analisados foram: BJ1 (SARIM A(0, 1, 1) × (1, 0, 1) com transforma¸c˜ao logar´ıtmica) e o modelo BJ2 (ARIM A(2, 2, 1) × (1, 0, 1) sem transforma¸c˜ao logar´ıtmica). A tabela 4 apresenta os resultados das estat´ısticas de aderˆencia para estes modelos.

(30)

Tabela 4: Estat´ısticas de aderˆencia da Modelagem da S´erie Original

Modelo BIC MAPE RMSE R2

HW1 1893 0,0185 1813 0,9616

HW2 2153 0,0211 2123 0,9473

HW3 2182 0,0211 2120 0,9474

BJ1 1601 0,0168 1709 0,9727

BJ2 1862 0,0169 1732 0,9649

De acordo com as estat´ısticas de aderˆencia apresentadas na tabela 4, o modelo que ob-teve melhor desempenho foi o modelo BJ1 (ARIM A(0, 1, 1) × (1, 0, 1) com transforma¸c˜ao logar´ıtmica). Os parˆametros esimados e sua significˆancia est˜ao dispon´ıveis no Anexo A.

A figura 3 apresenta a sobreposi¸c˜ao do gr´afico da s´erie ajustada a partir deste modelo com o gr´afico da s´erie original.

Figura 3: S´erie original x S´erie ajustada pelo melhor modelo. ´

E poss´ıvel perceber na figura 3 que o modelo consegue captar o comportamento da s´erie original e pode ser adequado para esta modelagem.

Para confrontar com este modelo, uma filtragem SSA ser´a feita na s´erie original a partir de duas metodologias diferentes. A se¸c˜ao 4.2 apresenta a filtragem SSA sob a abordagem ACP e a se¸c˜ao 4.3 apresenta a filtragem SSA sob a abordagem da an´alise gr´afica.

(31)

4.2 An´alise e modelagem da s´erie sob a abordagem SSA-ACP 30

4.2

An´

alise e modelagem da s´

erie sob a abordagem

SSA-ACP

Na abordagem ACP, usa-se um crit´erio de escolha das componentes principais de acordo com a significˆancia destas componentes. Na abordagem SSA, ao escolher o com-primento de janela ideal (L = 90. Ou seja, L = T /2 de acordo com (GOLYANDINA et al. [7]), percebe-se que as componentes at´e 47a. correspondem a 99,997% da forma¸c˜ao da s´erie e que as demais (da 48a. a 90a.) correspondem apenas a 0,003% da s´erie e est˜ao

entre as menos significantes para sua forma¸c˜ao e ser˜ao consideradas como ruidosas. A figura 4 apresenta o logaritmo dos autovalores em ordem de significˆancia.

Figura 4: Logaritmos dos autovalores na abordagem SSA-ACP.

Ap´os a escolha das componentes principais para compor a s´erie, surge a necessidade de uma ferramenta para averiguar se a separa¸c˜ao das componentes ´e adequada. A partir da correla¸c˜ao ponderada, pode-se ter uma no¸c˜ao de o qu˜ao bem separadas est˜ao as compo-nentes. Quanto menor a correla¸c˜ao entre elas, melhor ´e a separa¸c˜ao. A figura 5 apresenta uma ilustra¸c˜ao da matriz de correla¸c˜ao ponderada (w-correlation matrix). Quanto mais escura ´e a imagem, maior ´e a correla¸c˜ao e quanto mais clara, menor esta correla¸c˜ao de modo que a parte preta indica correla¸c˜ao igual `a 1 e a parte branca indica correla¸c˜ao zero.

(32)

Figura 5: Matriz de Correla¸c˜ao Ponderada SSA-ACP.

Conforme pode ser visto na figura 5, a correla¸c˜ao entre as duas componentes separadas est´a no intervalo entre 0,00 e 0,05 o que indica que as duas componentes est˜ao bem separadas e, uma vez denotadas “sinal”e “ru´ıdo”, pode-se concluir que na decomposi¸c˜ao n˜ao h´a sinal na s´erie de ru´ıdos e nem ru´ıdos na s´erie de sinal.

Desta forma, a decomposi¸c˜ao da s´erie via SSA-ACP gerada est´a na equa¸c˜ao 4.1

Yt= St+ Rt, (4.1)

onde St ´e a s´erie de sinal definida pelos autovalores de 1 a 47 e Rt ´e a s´erie de ru´ıdos

definida pelos autovalores de 48 a 90. A filtragem se confirma na fase de reconstru¸c˜ao da s´erie filtrada utilizando apenas a componente de sinal St e excluindo-se a s´erie de ru´ıdos

Rt.

Ap´os a filtragem, a s´erie filtrada via SSA-ACP foi modelada por cinco (5) modelos, sendo trˆes (3) da classe de modelos de amortecimento exponencial de Holt-Winters e dois (2), da classe de modelos ARIMA de Box & Jenkins.

A escolha dos modelos de Holt-Winters se deu pela sugest˜ao da sele¸c˜ao do especialista do programa FPW e por suas varia¸c˜oes igual a modelagem anterior. Dessa forma, os

(33)

mo-4.2 An´alise e modelagem da s´erie sob a abordagem SSA-ACP 32

delos analisados foram: HW1 (Modelo com tendˆencia linear e sazonalidade multiplicativa - escolha do especialista); HW2 (Modelo de Amortecimento Exponencial Simples, sem tendˆencia e sem sazonalidade); HW3 (Modelo com tendˆencia linear e sem sazonalidade). Todos eles com otimiza¸c˜ao dos parˆametros.

A escolha dos modelos de Box & Jenkins tamb´em partiu da sele¸c˜ao do especialista, seguido de uma varia¸c˜ao deste mesmo modelo igual a modelagem anterior. Desta forma, os modelos analisados foram: BJ1 (SARIM A(0, 1, 1) × (1, 0, 1) com transforma¸c˜ao lo-gar´ıtmica) e o modelo BJ2 (ARIM A(2, 2, 1) × (1, 0, 1) sem transforma¸c˜ao logar´ıtmica). A tabela 5 apresenta os resultados das estat´ısticas de aderˆencia para estes modelos.

Tabela 5: Estat´ısticas de aderˆencia da Modelagem da S´erie sob Abordagem SSA-ACP

Modelo BIC MAPE RMSE R2

HW1 1510 0,0157 1645 0,9754

WH2 2059 0,01936 2029 0,9513

HW3 2087 0,01947 2028 0,9514

BJ1 1510 0,0157 1645 0,9754

BJ2 1785 0,01581 1661 0,9674

De acordo com as estat´ısticas de aderˆencia apresentadas na tabela 5, o modelo que obteve melhor desempenho foi o modelo BJ1 (SARIM A(0, 1, 1) × (1, 0, 1) com trans-forma¸c˜ao logar´ıtmica). Os parˆametros esimados e sua significˆancia est˜ao dispon´ıveis no Anexo A.

A figura 6 apresenta a sobreposi¸c˜ao do gr´afico da s´erie ajustada a partir deste modelo com o gr´afico da s´erie original.

Figura 6: S´erie original x S´erie ajustada pelo melhor modelo ap´os a filtragem SSA-ACP. ´

E poss´ıvel perceber na figura 6 que o modelo SSA-ACP consegue captar o comporta-mento da s´erie original e pode ser adequado para esta modelagem.

(34)

Por fim, uma filtragem SSA ser´a feita na s´erie original a partir da abordagem com an´alise gr´afica autovetores.

4.3

An´

alise e modelagem da s´

erie sob a abordagem

SSA - An´

alise Gr´

afica

Na abordagem SSA - An´alise Gr´afica ´e feita uma decomposi¸c˜ao da s´erie em trˆes componentes, sendo elas: componente de tendˆencia, componente harmˆonia e componente ruidosa. Para decidir os autovetores que formar˜ao cada uma das componentes, a an´alise gr´afica do comportamento de cada autovetor e do diagrama de dispers˜ao de dois autove-tores consecutivos indica a componente a qual ele (ou eles) pertence(m). Nesta an´alise, se um autovetor tem comportamento suave, ele pertence a componente de tendˆencia, se ele tem um comportamento senoidal e/ou o diagrama de dispers˜ao dos pares conse-cutivos apresentam formas circulares ou poligonais, ent˜ao eles pertencem `a componente harmˆonica e se n˜ao possuem nenhuma destas caracter´ısticas e o diagrama de dispers˜ao dos pares consecutivos apresenta uma forma ca´otica, ent˜ao eles pertencem a componente ruidosa.

A figura 7 apresenta os 9 primeiros autovetores na decomposi¸c˜ao SSA via an´alise gr´afica. Assim, percebe-se que o primeiro autovetor forma o componente de tedˆencia nessa visualiza¸c˜ao. Para identifica¸c˜ao de tendˆencia semelha uma reta.

(35)

4.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 34

Figura 7: Os nove autovetores mais significantes na abordagem SSA-An´alise Gr´afica. Na figura 7 ´e poss´ıvel perceber que o primeiro autovetor pertence `a componente de tendˆencia assim como os autovetores 4 e 5 devido ao comportamento mais suave. Tamb´em ´e poss´ıvel perceber que os autovetores 2, 3, 6 e 7 pertencem a componente harmˆonica pelo comportamento senoidal. J´a os autovetores 8 e 9 pertencem a componente ruidosa uma vez que n˜ao apresenta nenhuma das caracter´ısticas anotadas nos autovetores das compo-nentes de tendˆencia e harmˆonica. Outra forma de verificar os autovetores da componente harmˆonica se faz a partir da an´alise gr´afica dos diagramas de dispers˜ao dos autovetores em sequˆencia. Na ocasi˜ao, se tais diagramas tem formato de um pol´ıgono regular, ent˜ao os dois autovetores que o forma pertencem `a componente harmˆonica. A figura 8 apresenta os 9 primeiros pares de autovetores em sequencia na abordagem SSA via an´alise gr´afica. Na figura 8 pode-se perceber que os pares de autovetores 2-3 e 6-7 pertencem a componente harmˆonica, uma vez que eles formam um pol´ıgono regular.

(36)

Figura 8: Diagramas de dispers˜ao dos autovetores em sequˆencia.

Ap´os a an´alise gr´afica de todos autovetores, obtem-se o agrupamento das componen-tes. A tabela 6 apresenta o resultado obtido.

Tabela 6: Agrupamento das Componentes Tendˆencia Harmˆonica ru´ıdo 1, 4, 5, 11,12 2, 3, 6, 7 8 - 10, 15, 20, 21

16 - 18, 26 13, 19, 22 23 - 25, 27 - 90

A figura 9 apresenta uma ilustra¸c˜ao da matriz de correla¸c˜ao ponderada (w-correlation matrix). Quanto mais escura ´e a imagem, maior ´e a correla¸c˜ao e quanto mais clara, menor esta correla¸c˜ao de modo que a parte preta indica correla¸c˜ao igual `a 1 e a parte branca indica correla¸c˜ao zero.

(37)

4.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 36

Figura 9: Matriz de Correla¸c˜ao Ponderada SSA-An´alise Gr´afica.

A tabela 7 apresenta os valores da matriz de correla¸c˜ao ponderada entre as compo-nentes.

Tabela 7: Correla¸c˜ao Ponderada Entre Componentes Tend. Harm. Ru´ıdo

Tend. 1 0,001 0,003

Harm. 0,001 1 0,109

Ru´ıdo 0,003 0,109 1

´

E poss´ıvel perceber que, de acordo com a figura 9 e a tabela 7, as trˆes componentes est˜ao bem separadas, uma vez que as correla¸c˜oes apresentadas nelas s˜ao baixas e pr´oximas a zero.

Para a conclus˜ao da filtragem, as componentes de tendˆencia e harmˆonicas s˜ao consi-deradas e somadas enquanto a componente ruidosa ´e removida.

Com a nova s´erie filtrada via SSA-An´alise Gr´afica, cinco modelos foram testados sendo 3 da classes de modelos de amortecimento exponencial de Hot-Winters e 2 da classe de modelos ARIMA de Box & Jenkins.

(38)

A escolha dos modelos de Holt-Winters se deu pela sugest˜ao da sele¸c˜ao do especialista do programa FPW e por suas varia¸c˜oes igual a modelagem anterior. Dessa forma, os mo-delos analisados foram: HW1 (Modelo com tendˆencia linear e sazonalidade multiplicativa - escolha do especialista); HW2 (Modelo de Amortecimento Exponencial Simples, sem tendˆencia e sem sazonalidade); HW3 (Modelo com tendˆencia linear e sem sazonalidade). Todos eles com otimiza¸c˜ao dos parˆametros.

A escolha dos modelos de Box & Jenkins tamb´em partiu da sele¸c˜ao do especialista, por´em diferente das modelagens anteriores, seguido de uma varia¸c˜ao deste mesmo mo-delo igual a modelagem anterior. Desta forma, os modelos analisados foram: BJ1

-(SARIM A(0, 1, 4)×(0, 1, 4) com transforma¸c˜ao logar´ıtmica) e o modelo BJ2 (SARIM A(0, 1, 1)× (1, 0, 1) sem transforma¸c˜ao logar´ıtmica). A tabela 8 apresenta os resultados das

es-tat´ısticas de aderˆencia para estes modelos.

Tabela 8: Estat´ısticas de aderˆencia da Modelagem da S´erie sob Abordagem SSA-An´alise Gr´afica

Modelo BIC MAPE RMSE R2

HW1 903 0,00945 862,5 0,991

WH2 1409 0,01377 1389 0,9767

HW3 1426 0,01366 1485 0,9768

BJ1 376 0,00376 382,1 0,9986

BJ2 468 0,00478 516,2 0,9976

De acordo com as estat´ısticas de aderˆencia apresentadas na tabela 8, o modelo que ob-teve melhor desempenho foi o modelo BJ1 (ARIM A(0, 1, 4) × (0, 1, 4) com transforma¸c˜ao logar´ıtmica). Os parˆametros esimados e sua significˆancia est˜ao dispon´ıveis no Anexo A.

A figura 10 apresenta a sobreposi¸c˜ao do gr´afico da s´erie ajustada a partir deste modelo com o gr´afico da s´erie original.

(39)

4.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 38

Figura 10: S´erie original x S´erie ajustada pelo melhor modelo ap´os a filtragem SSA-An´alise Gr´afica.

Ap´os esta etapa, os modelos que obtiveram o melhor desempenho dentre os mo-delos, sem SSA e com SSA s˜ao comparados e os resultados apresentados na tabela 9. Nesta tabela, considerando o modelo ARIM A1 o modelo SARIM A(0, 1, 1) × (1, 0, 1) que foi o melhor modelo na an´alise da s´erie original, o modelo ARIM A2 o modelo SARIM A(0, 1, 1)×(1, 0, 1) que foi o melhor modelo da s´erie ap´os a filtragem SSA - an´alise de componentes principais e o modelo ARIM A3 o modelo SARIM A(0, 1, 4) × (0, 1, 4) que foi o melhor modelo da s´erie ap´os a filtragem SSA - An´alise Gr´afica.

Tabela 9: Estat´ıstica de aderˆencia dos modelos com melhor resultado

Filtragem Modelo BIC MAPE RMSE R2

Nenhuma ARIMA1 1601 0,0168 1709 0,9727

SSA-ACP ARIMA2 1510 0,0157 1645 0,9754

SSA-An´alise Gr´afica ARIMA3 376 0,00376 382,1 0,9986

Conforme pode ser observado na tabela 9, em todos os casos os modelos de Box & Jenkins se sobressaem sobre os modelos de Holt-Winters e dentre as melhores modelagens, a que teve o melhor desempenho foi aquela a que se refere `a s´erie de consumo de energia ap´os a filtragem SSA sob a abordagem com An´alise Gr´afica dos autovetores.

O modelo escolhido foi:

Zt= Zt−1+ et+ 0, 5145et−1+ 0, 1806et−2+ 0, 4226et−3− 0, 2246et−4−

0, 1646et−12− 0, 8499et−24+ 0, 5067et−36+ 0, 1346et−48

(40)

4.4

An´

alise dos Res´ıduos

Ap´os definir o melhor modelo de acordo com as estat´ısticas de aderˆencia, a an´alise dos res´ıduos verifica se o modelo escolhido ´e adequado para esta s´erie. A figura 11 mostra o gr´afico da FAC dos res´ıduos do modelo de Box & Jenkins para a s´erie filtrada via SSA-An´alise Gr´afica.

Figura 11: FAC do modelo escolhido.

Conforme pode ser visto na figura 11, os res´ıduos s˜ao n˜ao correlacionados uma vez que est˜ao dentro do limite de significˆancia ±1, 96/√T = ±1, 96/√180 = ±0, 15 ao n´ıvel de 5%. Desta forma, pode-se dizer que o modelo ´e adequado.

(41)

40

5

Conclus˜

ao

A energia el´etrica que chega `as residˆencias, ao com´ercio e `a ind´ustria n˜ao tem demanda uniforme ao longo do dia. O mesmo tipo de comportamento pode ser observado quando avaliado no ˆambito mensal. A impossibilidade de estoc´a-la imp˜oe que sua gera¸c˜ao se dˆe na medida do consumo, que passa por diversas varia¸c˜oes ao longo do tempo. Prever e atender a essas varia¸c˜oes de modo a evitar problemas de falta de energia ou desperd´ıcios ´e uma a¸c˜ao necess´aria.

´

E nessas horas que se torna importante o desenvolvimento de novas t´ecnicas e fer-ramentas estat´ısticas que possam vir a melhorar cada vez mais os modelos de previs˜oes de s´eries temporais. O objetivo desse projeto foi mostrar que o uso de filtragens ajuda a limpar a s´erie de forma que seja mais eficaz a sua previs˜ao.

Os dados utilizados para fazer as an´alises s˜ao do consumo mensal do Brasil no per´ıodo entre jan/2002 a dez/2016 medidos em MWh.

Os modelos de Holt-Winters e de Box & Jenkins foram aplicados as s´eries original e filtradas e foram comparados segundo as estat´ısticas de aderˆencia (RMSE, BIC, MAPE e R2). Os resultados desmontraram que a s´erie filtrada via SSA por An´alise Gr´afica obteve a melhor modelagem comparada a s´erie sem filtragem e a s´erie filtrada via An´alise de Componentes Principais. E que a modelagem via Box & Jenkins foi superior em todas as an´alises de acordo com estat´ısticas de aderˆencias.

Com isso, pode-se concluir que ao aplicar um filtragem na s´erie original, os modelos tˆem melhor desempenho e que a filtragem via SSA-An´alise Gr´afica proporciona um ganho preditivo sobre as demais filtragens. Neste contexto, dentre as classes de modelos, a classe de Box & Jenkins foi a que deteve os melhores resultados.

(42)

Referˆ

encias

[1] Rodrigues, L.; Pinho, P.; Linden, R. “S´eries temporais no consumo de energia el´etrica no Estado do Rio de Janeiro”. Revista Vis˜oes 1. 2007.

[2] Menezes, M. L.;Cassiano, K. M.; Souza, R. M.; Junior, L. A. T.; Pessanha, J. F. M.; Souza, R. C. “Modelagem e previs˜ao de demanda de energia com filtragem SSA.”, Revista da Estat´ıstica UFOP, vol III(2), 2014.

[3] Serrao, F. “Modelo de previs˜ao de carga de curto prazo utilizando redes neurais e l´ogica fuzzy”. Master’s thesis, Pont´ıfica Universidade Cat´olica, Brasil, Rio de Janeiro, 2003.

[4] Schmidt, C. and Lima, M. “Estima¸c˜oes e previs˜oes da demanda por energia el´etrica no Brasil.” Rio de Janeiro: Secretaria de Acompanhamento Econˆomico do Minist´erio da Fazenda, 2002.

[5] Box, G.; Jenkins, G. “Time Series Analysis: Forecasting and Control”. San Francisco: Holden-Day, 1970.

[6] Elsner, J. and Tsonis, A. Singular Spectrum Analysis. A New Tool in Time Series Analysis. Plenum Press, New York, 1996.

[7] Golynadina, N., Nekrutkin, V., and Zhihgljavsky, A. Analysis of time series structure: SSA and reletade techniques. Chapman&Hall/CRC, New York, 2001. [8] Morettin, P. and Toloi, C. An´alise de s´eries temporais. S˜ao Paulo: Egard

Bl¨ucher, 2006.

[9] Hassani, H., Heravi, S., and. Zhigljavsky, A. Forecasting UK Industrial Pro-duction with Multivariate Singular Spectrum Analysis, presentedat the 2012 Intrernational Conference on the Singular Spectrum Analysis and its Applica-tions, Beijing, China, 2012.

[10] Fogliatto, F. Previs˜ao de Demanda. Curso de gradua¸c˜ao em Engenharia de Produ¸c˜ao e Transporte (apostila). Porto Alegre, 2003.

[11] Hipel, K. W. e McLeod, A. I. Time Series Modelling of Water Resources and Environmental Systems. Ed. Elsevier. Amsterdam, The Netherlands, 1994.

(43)

42

ANEXO A -- Output das Modelagens

Figura 12: Modelagem da s´erie Original.

(44)

Referências

Documentos relacionados

El fortalecimiento de las lenguas indígenas, desde nuestro punto de vista, pone en el centro de las estrategias una educación escolar bilingüe, para lo cual se requiere

Art. 8° O corte, a supressão e a exploração da vegetação do Bioma Mata Atlântica far-se-ão de maneira diferenciada, conforme se trate de vegetação primária ou

Ao propor como objetivo da pesquisa a qual é, analisar produção e aplicação de atividades de uma SD e a partir dessa análise investigar como a formação inicial do professor de

Foram considerados como mais relevantes, e optou-se neste trabalho, pelos seguintes itens da NBR ISO 14001:2015: política ambiental, levantamento de aspectos e

A motivação para o tema surgiu a partir de conversas com professores brasileiros, que têm desenvolvido a pesquisa “Paisagem Sonora, Memória e Cultura Urbana” elaborada no Programa

insights into the effects of small obstacles on riverine habitat and fish community structure of two Iberian streams with different levels of impact from the

Taking into account the theoretical framework we have presented as relevant for understanding the organization, expression and social impact of these civic movements, grounded on

Mestrado em Administração e Gestão Pública, começo por fazer uma breve apresentação histórica do surgimento de estruturas da Administração Central com competências em matéria