• Nenhum resultado encontrado

Avaliação da capacidade preditiva dos modelos das classes ARIMA e de Amortecimento Exponencial sob diferentes aspectos da abordagem SSA na modelagem e previsão de consumo de energia

N/A
N/A
Protected

Academic year: 2021

Share "Avaliação da capacidade preditiva dos modelos das classes ARIMA e de Amortecimento Exponencial sob diferentes aspectos da abordagem SSA na modelagem e previsão de consumo de energia"

Copied!
60
0
0

Texto

(1)

Lucas Primo Luz

Avalia¸

ao da capacidade preditiva dos

modelos das classes ARIMA e de

Amortecimento Exponencial sob diferentes

aspectos da abordagem SSA na modelagem

e previs˜

ao de consumo de energia

Niter´oi - RJ, Brasil 17 de dezembro de 2019

(2)

Universidade Federal Fluminense

Lucas Primo Luz

Avalia¸

ao da capacidade preditiva

dos modelos das classes ARIMA e de

Amortecimento Exponencial sob

diferentes aspectos da abordagem

SSA na modelagem e previs˜

ao de

consumo de energia

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Mois´es Lima de Menezes

Niter´oi - RJ, Brasil 17 de dezembro de 2019

(3)
(4)

Ficha catalográfica automática - SDC/BIME Gerada com informações fornecidas pelo autor

Bibliotecário responsável: Ana Nogueira Braga - CRB7/4776

L979a Luz, Lucas Primo

Avaliação da capacidade preditiva dos modelos das classes ARIMA e de Amortecimento Exponencial sob diferentes aspectos da abordagem SSA na modelagem e previsão de consumo de energia / Lucas Primo Luz ; Moisés Lima de Menezes, orientador. Niterói, 2019.

59 f.

Trabalho de Conclusão de Curso (Graduação em

Estatística)-Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2019.

1. Séries Temporais. 2. Singular Spectrum Analysis. 3. Análise Gráfica dos Autovetores. 4. Consumo de energia elétrica. 5. Produção intelectual. I. Menezes, Moisés Lima de, orientador. II. Universidade Federal Fluminense. Instituto de Matemática e Estatística. III. Título.

(5)

-Resumo

O consumo de energia el´etrica no Brasil vem aumentando gradativamente durante os anos. Este aumento no consumo se justifica devido `a urbaniza¸c˜ao, ao aumento po-pulacional e tamb´em devido aos avan¸cos tecnol´ogicos nas casas, com´ercios e ind´ustrias. Para atender esta demanda, se faz necess´ario o desenvolvimento de novas t´ecnicas capazes de prever com uma melhor acur´acia o consumo de energia el´etrica. Singular Spectrum Analysis (SSA) ´e um m´etodo estat´ıstico que pode, dentre outras coisas, filtrar s´eries tem-porais eliminando sua componente ruidosa e melhorando a acur´acia da previs˜ao. Este projeto prop˜oe fazer a modelagem de Holt-Winters e Box & Jenkins na s´erie de consumo de energia el´etrica no Brasil. Al´em disso, fazer uma filtragem SSA nessa mesma s´erie removendo os ru´ıdos e utilizar os modelos de Holt-Winters e Box & Jenkins para fazer a modelagem com a s´erie filtrada pela metodologia de An´alise Gr´afica dos Autovetores. Ap´os as modelagens, foram utilizadas as estat´ısticas de aderˆencia para verificar a capaci-dade preditiva de cada modelo. As estat´ısticas de aderˆencia utilizadas foram o Coeficiente de Determina¸c˜ao (R2), Erro M´edio Percentual Absoluto (M AP E), Erro M´edio Absoluto

(M AE), Raiz Quadrada do Erro Quadr´atico M´edio (RM SE) e Crit´erio de Informa¸c˜ao Bayesiana (BIC). Com as an´alises realizadas, foi verificado que os modelos de Box & Jenkins obteve os melhores resultados quanto as estat´ısticas de aderˆencia tanto na s´erie original quanto na s´erie filtrada. Ao aplicar a filtragem SSA tem-se um ganho preditivo em todos os casos para a previs˜ao de consumo de energia.

Palavras-chaves: S´eries Temporais. Singular Spectrum Analysis. Holt-Winters. Box & Jenkins. An´alise Gr´afica dos autovetores. Consumo de energia el´etrica.

(6)

Sum´

ario

Lista de Figuras

Lista de Tabelas

1 Introdu¸c˜ao p. 11

1.1 Contextualiza¸c˜ao . . . p. 11 1.2 A importˆancia de fazer previs˜oes de consumo de energia . . . p. 12 1.3 Revis˜ao Bibliogr´afica . . . p. 13 1.4 Objetivos . . . p. 14 1.5 Proposta do Projeto . . . p. 14 1.6 Organiza¸c˜ao . . . p. 15 2 Materiais e M´etodos p. 16 2.1 Base de Dados . . . p. 16 2.2 S´eries Temporais . . . p. 17 2.3 Modelos de Holt-Winters . . . p. 18 2.4 Modelo de Box & Jenkins . . . p. 19 2.4.1 Processo Autoregressivo . . . p. 19 2.4.2 Processo de M´edias M´oveis . . . p. 19 2.4.3 Processo Autoregressivos e de M´edias M´oveis . . . p. 20 2.4.4 Processos Autorregressivos Integrados e de M´edias M´oveis . . . p. 20 2.4.5 Modelagem SARIM A . . . p. 20 2.4.6 Fun¸c˜ao de Auto Correla¸c˜ao e Fun¸c˜ao de Auto Correla¸c˜ao Parcial p. 21

(7)

2.5 Estat´ıstica de Aderˆencia . . . p. 22 2.5.1 Raiz Quadrada do Erro Quadr´atico M´edio . . . p. 22 2.5.2 Erro M´edio Percentual Absoluto . . . p. 23 2.5.3 Crit´erio de Informa¸c˜ao Bayesiano . . . p. 23 2.5.4 Coeficiente de Determina¸c˜ao . . . p. 23 2.6 Singular Spectrum Analysis . . . p. 24 2.6.1 Decomposi¸c˜ao . . . p. 24 2.6.2 Reconstru¸c˜ao . . . p. 25 2.6.3 An´alise Gr´afica dos Autovetores . . . p. 27 2.7 Resumo da Metodologia . . . p. 27

3 An´alise dos Resultados p. 29

3.1 M´etodo de Holt-Winters . . . p. 29 3.2 M´etodo de Box & Jenkins . . . p. 31 3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica . p. 35 3.3.1 1o caso : L = 161 . . . . p. 37

3.3.2 2o caso : L = 240 . . . . p. 41

3.3.3 3o caso : L = 241 . . . . p. 45

3.3.4 4o caso : L = 252 . . . . p. 48

3.3.5 5o caso : L = 321 . . . . p. 52

3.3.6 An´alise dos res´ıduos . . . p. 56

4 Conclus˜ao p. 57

(8)

Lista de Figuras

1 S´erie de consumo de energia el´etrica no Brasil em GWh, 1979-2019 . . p. 16 2 Fluxograma da Metodologia . . . p. 28 3 Boxplot da S´erie . . . p. 29 4 An´alise dos Res´ıduos . . . p. 31 5 Correlograma com 1 diferen¸ca . . . p. 32 6 Correlograma com 1 diferen¸ca sazonal . . . p. 33 7 Correlograma com 1 diferen¸ca e transforma¸c˜ao logar´ıtmica . . . p. 34 8 Correlograma com 1 diferen¸ca sazonal da transforma¸c˜ao logar´ıtmica . . p. 34 9 Matriz de correla¸c˜ao ponderada . . . p. 36 10 Diagrama de dispers˜ao dos autovetores sequenciais com L=161 . . . p. 37 11 Os nove autovetores mais significantes com L = 161 . . . p. 38 12 Reconstru¸c˜ao com L = 161 . . . p. 39 13 Diagrama de dispers˜ao dos autovetores sequenciais . . . p. 41 14 Os nove autovetores mais significantes com L = 240 . . . p. 42 15 Diagrama de dispers˜ao dos autovetores . . . p. 43 16 Diagrama de dispers˜ao dos autovetores sequenciais . . . p. 45 17 Os nove autovetores mais significantes com L = 241 . . . p. 45 18 Diagrama de dispers˜ao dos autovetores . . . p. 46 19 Diagrama de dispers˜ao dos autovetores sequenciais . . . p. 48 20 Os nove autovetores mais significantes com L = 252 . . . p. 49 21 Diagrama de dispers˜ao dos autovetores . . . p. 50 22 Diagrama de dispers˜ao dos autovetores sequenciais . . . p. 52

(9)

23 Os nove autovetores mais significantes com L = 321 . . . p. 53 24 Diagrama de dispers˜ao dos autovetores . . . p. 54 25 Correlograma dos res´ıduos do modelo SARIM A(3, 2, 3) × (0, 2, 2) com

(10)

Lista de Tabelas

1 Equa¸c˜oes de atualiza¸c˜oes dos parˆametros do modelos de Holt-Winters . p. 18 2 Propriedades te´oricas da F AC e F ACP . . . p. 22 3 Algumas Estat´ısticas Descritivas da s´erie temporal de Consumo de

Ener-gia El´etrica no Brasil 1979-2019 . . . p. 29 4 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters . . . p. 30 5 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins . . . p. 35 6 Agrupamento das componentes . . . p. 38 7 Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 161 . . . p. 38 8 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters com L = 161 p. 39 9 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 161 p. 40 10 Agrupamento das componentes . . . p. 42 11 Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 240 . . . p. 42 12 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 240 . . p. 43 13 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 240 p. 44 14 Agrupamento das componentes . . . p. 46 15 Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 241 . . . p. 46 16 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 241 . . p. 47 17 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 241 p. 48 18 Agrupamento das componentes . . . p. 49 19 Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 252 . . . p. 49 20 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 252 . . p. 50 21 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 252 p. 51

(11)

22 Agrupamento das componentes . . . p. 53 23 Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 321 . . . p. 53 24 Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 321 . . p. 54 25 Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 321 p. 55

(12)

11

1

Introdu¸

ao

1.1

Contextualiza¸

ao

Desde o investimento em novas ´areas para o crescimento econˆomico do Brasil no s´eculo XIX, at´e o grande avan¸co tecnol´ogico do s´eculo XXI, a produ¸c˜ao e o consumo de energia el´etrica s˜ao fatores diretamente ligados `a economia do pa´ıs. Com o passar das d´ecadas a energia el´etrica tornou-se cada vez mais presente nas ind´ustrias, nos meios de transportes, nas moradias e hoje, ´e praticamente essencial para a maior parte da popula¸c˜ao.

No s´eculo XIX, a produ¸c˜ao exportadora de caf´e, principal fonte de gera¸c˜ao de renda do pa´ıs e com alta lucratividade para os investidores, obteve grande aplica¸c˜ao de capital. Esse contexto possibilitou a moderniza¸c˜ao do pa´ıs, que alavancou o setor urbano da eco-nomia e que, paralelamente, gerou o crescimento das cidades, o que levou a uma expans˜ao da ind´ustria de constru¸c˜ao civil e da oferta de infra-estrutura urbana. ´E nesse movimento que se inserem as primeiras iniciativas de uso da energia el´etrica no pa´ıs, `a mesma ´epoca que essa inova¸c˜ao tecnol´ogica era introduzida na Europa e nos Estados Unidos (ABARCA et al., 2002).

No s´eculo XXI, a entrada da tecnologia nos setores de agricultura, produ¸c˜ao indus-trial, pesquisa, entretenimento, entre outros, foi evoluindo juntamente com o aumento do acesso a energia el´etrica no pa´ıs. Al´em desses, atualmente, a crise no setor trabalhista e as demiss˜oes em massa ampliaram o n´umero de pequenas empresas e do trabalho no setor informal, o que gera uma maior demanda de energia.

O tipo de gera¸c˜ao de energia el´etrica est´a na pauta de discuss˜oes sobre os impactos na natureza causados por este tipo de produ¸c˜ao. A emiss˜ao de gases do efeito estufa, o esgotamento de recursos naturais e os preju´ızos `a fauna e `a flora causados pelas usinas hidrel´etricas s˜ao alguns dos fatores motivadores para o incentivo `a diminui¸c˜ao do consumo desse tipo de energia, em favorecimento ao desenvolvimento sustent´avel de energia limpa.

(13)

1.2 A importˆancia de fazer previs˜oes de consumo de energia 12

1.2

A importˆ

ancia de fazer previs˜

oes de consumo de

energia

O conhecimento pr´evio, em qualquer instante, dos valores aproximados de potˆencia reativa1 requerida pelo sistema ou pelas barras de carga tem uma grande importˆancia.

A previs˜ao da potˆencia reativa em conjunto com a previs˜ao da demanda se constituem numa ferramenta de extremo valor no monitoramento de Sistemas de Energia El´etrica (CHRISTO; SOUZA, 2006).

A qualidade da proje¸c˜ao futura do consumo de energia a ser realizada pelas distri-buidoras impacta de forma significativa em dois pontos distintos: O primeiro se refere ao pr´oprio planejamento da expans˜ao do sistema el´etrico, uma vez que estas proje¸c˜oes s˜ao utilizadas pelo Minist´erio de Minas e Energia para dar suporte `as decis˜oes tomadas neste sentido. O segundo ponto est´a no contexto operacional e financeiro das pr´oprias distribuidoras. O desafio de prever o consumo de energia el´etrica no contexto de uma economia est´avel, com s´eries temporais razoavelmente estacion´arias, j´a seria um grande desafio. Esse desafio torna-se tanto maior no contexto de uma economia cujas carac-ter´ısticas mudam significativamente em curtos intervalos de tempo, tudo isso agravado pela globaliza¸c˜ao mundial (CAMPOS, 2008).

´

E de grande importˆancia para as empresas que atuam no setor de gera¸c˜ao, transmiss˜ao e distribui¸c˜ao de energia el´etrica, conhecer a futura demanda deste bem dado que isto seria essencial em v´arias das atividades di´arias efetuadas por estas empresas, especialmente se permitirem otimizar o escalonamento da produ¸c˜ao de energia el´etrica e a distribui¸c˜ao de energia, al´em de permitirem um agendamento de manuten¸c˜ao que n˜ao perturbe o fornecimento (RODRIGUES; SILVA; LINDEN, 2006).

Ao se trabalhar com s´eries temporais, o objetivo mais usual ´e a predi¸c˜ao de valores futuros. A necessidade de obter previs˜oes precisas de eventos futuros ou suas consequen-cias, sejam clim´aticas, econˆomicas, epidemiol´ogicas ou de qualquer natureza, tem levado a um constante desenvolvimento de t´ecnicas de previs˜ao em s´eries temporais. Os m´etodos estat´ısticos cl´assicos para an´alise de s´eries temporais encontram-se bem documentados na literatura pertinente. Contudo, boa parte desses m´etodos requer conhecimento especi-alizado para sua correta aplica¸c˜ao. Sendo assim, o uso adequado dos modelos cl´assicos exigir´a verifica¸c˜oes das suas suposi¸c˜oes, o que demanda esfor¸cos e experiˆencia, na an´alise explorat´oria dos dados. Singular Spectrum Analysis (SSA) se apresenta como uma

alter-1Potˆencia reativa representa parte da potˆencia que ´e empregada nas cargas capacitativas e indutivas

(14)

1.3 Revis˜ao Bibliogr´afica 13

nativa relativamente simples e poderosa. SSA pode decompor uma s´eries em componentes disjuntas como tendˆencia, componentes c´ıclicas ou harmˆonicas e ru´ıdo, sendo esta ´ultima removida para obter uma s´erie menos ruidosa. (ESQUIVEL; SENNA; GOMES, 2012).

1.3

Revis˜

ao Bibliogr´

afica

(MENEZES et al., 2014) utilizaram modelos de Holt-Winter e de Box & Jenkins associados a trˆes metodologias diferentes em SSA para ajustar uma s´erie de demanda de energia el´etrica. Na ocasi˜ao, eles chegaram a conclus˜ao que a filtragem SSA sob a abordagem de an´alises gr´aficas dos autovetores proporcionam uma melhora na qualidade do ajuste e que os modelos de Box & Jenkins s˜ao mais apropriados para esta s´erie.

(CAMPOS, 2008) realizou dois estudos de caso: o consumo de energia da cidade de New England (U SA) e a s´erie de consumo do Estado de Minas Gerais (Brasil). Os modelos s˜ao comparados usando os ´ındices de desempenho: M P E ( Erro m´edio percentual ), M AP E ( Erro m´edio percentual absoluto ) e RM SE ( Raiz Quadrada do Erro Quadr´atico M´edio ). No caso do consumo do Estado de Minas Gerais, como a s´erie temporal ´e composta por poucas observa¸c˜oes, n˜ao existem amostras para realizar a compara¸c˜ao, ent˜ao ´e utilizado SSA nas previs˜oes juntamente com a s´erie original de consumo. Os resultados obtidos para os dois estudos de caso mostram que os modelos ARIM A e SARIM A s˜ao ferramentas eficientes que podem auxiliar no planejamento e tomadas de decis˜oes no setor el´etrico.

(BIASE; IMACULADA; VINICIUS, 2013) analisaram o consumo de energia el´etrica na regi˜ao Norte do Brasil. Dentre os poss´ıveis modelos, foram ajustados modelos SARIM A sem e com interven¸c˜oes. A sele¸c˜ao do melhor modelo foi realizada por meio dos crit´erios AIC (Crit´erio de Informa¸c˜ao de Akaike), BIC (Crit´erio de Informa¸c˜ao Bayesiano). O modelo escolhido foi o SARIM A(2, 1, 2) × (0, 1, 1)12 com interven¸c˜ao, que apresentou

valores de previs˜ao relativamente precisos.

(ESQUIVEL; SENNA; GOMES, 2012) apresentou desenvolvimento te´orico e aplica¸c˜oes do m´etodo SSA para comparar com modelos cl´assicos. Em seguida analisou duas s´eries com caracter´ısticas distintas. O m´etodo SSA conseguiu representar melhor as varia¸c˜oes existentes nos dados. A previs˜ao com SSA apresentou um comportamento mais pr´oximo `a realidade das s´eries analisadas. Sua utiliza¸c˜ao produziu resultados superiores aos gerados pelos m´etodos cl´assicos.

(15)

1.4 Objetivos 14

1.4

Objetivos

Este trabalho teve como objetivo avaliar a capacidade preditiva dos modelos ARIMA e Holt-Winters para a s´erie de consumo de energia no Brasil, avaliar o ganho preditivo ao se fazer uma filtragem SSA, avaliar se h´a ganho preditivo ao mudar os parˆametros na abordagem SSA e determinar qual o melhor modelo que se ajusta `a s´erie.

1.5

Proposta do Projeto

A proposta deste projeto foi de realizar boas previs˜oes da demanda do conumo de energia `a partir de diversas abordagens de modelagens, sendo elas: modelagem de amor-tecimento exponencial, modelagem ARIM A, modelagem com filtragem SSA sob diversos aspectos e an´alise da capacidade preditiva usando as estat´ısticas de aderˆencia.

Inicialmente, a s´erie original de consumo de energia foi modelada pelos m´etodos ci-tados acima. A modelagem do m´etodo de amortecimento exponencial possui v´arias ver-tentes: sem tendˆencia, sem sazonalidade, com tendˆencia, com sazonalidade. O ARIM A possui v´arias op¸c˜oes `a partir das an´alises dos correlogramas. Em seguida a s´erie passar´a por uma filtragem SSA, na ocasi˜ao, foram utilizados diversos valores de janela na fase de decomposi¸c˜ao da s´erie. Para cada abordagem SSA, foram ajustados os modelos de Holt-Winters e de Box & Jenkins.

Ap´os as modelagens e devidas an´alises de res´ıduos e de significˆancia dos parˆametros estimados, as estat´ısticas de aderˆencia s˜ao calculadas. Para efeito de verifica¸c˜ao da ca-pacidade preditiva dos modelos, est˜ao sendo consideradas as estat´ısticas: M AP E (Mean Absolute Percentage Error), RM SE (Root Mean Square Error), o crit´erio BIC (Bayesian Information Criterion) e o Coeficiente de Determina¸c˜ao R2.

Foi considerado o modelo mais adequado aquele que minimizou as estat´ısticas de aderˆencia.

Para cada etapa do desenvolvimento do projeto foram utilizados diversos softwares, sendo eles: F P W (Forecast Pro for Windows) para a modelagem de Holt-Witers e de Box & Jenkins. C´alculo das estat´ısticas de aderˆencia a partir do R, Gretl (Gnu Regression, Econometrics and Time-series Library) e F P W . Os gr´aficos foram gerados no Microsoft Excel. A filtragem SSA foi feita a partir do programa Caterpillar-SSA e as an´alises dos res´ıduos no Gretl e F P W .

(16)

1.6 Organiza¸c˜ao 15

Ao final, foi escolhido o modelo que minimizou as estat´ısticas de aderˆencia.

1.6

Organiza¸

ao

Este projeto foi dividido em 5 cap´ıtulos. O cap´ıtulo 1 ´e composto pela introdu¸c˜ao. O cap´ıtulo 2 cont´em os objetivos. No cap´ıtulo 3 foram apresentados os materiais e m´etodos utilizados. Os resultados no cap´ıtulo 4 e as conclus˜oes no cap´ıtulo 5.

(17)

16

2

Materiais e M´

etodos

2.1

Base de Dados

As an´alises neste trabalho foram feitas sob uma s´erie de medidas mensais de con-sumo de energia no Brasil no per´ıodo de janeiro de 1979 a fevereiro de 2019. A s´erie foi obtida da base de dados do Banco Central do Brasil e pode ser acessada a partir deste endere¸co: <hwww3.bcb.gov.br/sgspub/localizarseries/localizarSeries.do?method= prepararTelaLocalizarSeriesi> em seguida, siga os passos para chegar `a s´erie temporal, clicar em: Atividade econˆomica − > Setor real − > Energia − > Consumo de ener-gia el´etrica − > selecionar Brasil-Total − > Consultar s´erie. Esta s´erie cont´em 482 observa¸c˜oes. A Figura 1 apresenta o comportamento desta s´erie.

Figura 1: S´erie de consumo de energia el´etrica no Brasil em GWh, 1979-2019

No ano de 2001, o Brasil sofreu a “Crise do Apag˜ao” devido a desconformidade do volume pluviom´etrico em Minas Gerais, onde era localizado 65% dos reservat´orios das usinas hidrel´etricas. Com isso, o governo brasileiro elaborou um plano de racionamento

(18)

2.2 S´eries Temporais 17

de energia, na qual falhas na execu¸c˜ao desse projeto geraria uma crise no setor econˆomico, principalmente pela disponibiliza¸c˜ao irregular de energia para as ind´ustrias e com´ercios (GOMES, 2019). Tal crise proporcionou o decl´ınio brusco, em 2001, que pode ser obser-vado no gr´afico da figura 1.

2.2

eries Temporais

S´erie Temporal ´e um conjunto de observa¸c˜oes sobre uma vari´avel ordenada no tempo e registrado em per´ıodos regulares.

O prop´osito da an´alise de s´eries temporais ´e identificar padr˜oes na s´erie temporal de uma vari´avel de interesse. A observa¸c˜ao deste comportamento pode permitir fazer previs˜oes sobre o futuro, orientando a tomada de decis˜oes (MORETTIN; TOLOI, 2006). Segundo o modelo cl´assico, as s´eries temporais s˜ao compostas por quatro padr˜oes: tendˆencia, ciclo, sazonalidade e ru´ıdo aleat´orio.

A tendˆencia ´e o comportamento do gr´afico que se desenvolve em um longo intervalo de tempo e verifica o sentido de deslocamento da s´erie temporal, ao longo de v´arios anos, podendo aumentar, diminuir ou permanecer constante. No contexto de consumo de energia el´etrica, pode ser causada pela expans˜ao demogr´afica, ou mudan¸ca gradativa de h´abitos de consumo, ou qualquer outro aspecto que afete a vari´avel de interesse a per´ıodos extensos.

O ciclo, que se refere `as oscila¸c˜oes ao longo de v´arios anos ou aos desvios em torno da reta de tendˆencia, tem movimento ondulat´orio, ou seja, ´e o movimento da s´erie que se repete ao longo dos per´ıodos de tempo. Podem ser resultado de varia¸c˜oes da economia como per´ıodos de crescimento, recess˜ao ou fenˆomenos clim´aticos como o El Ni˜no ou La Ni˜na (que se repete com periodicidade superior a um ano).

A sazonalidade, relata as flutua¸c˜oes peri´odicas de comprimento constante, repetindo em per´ıodos fixos associados. Este per´ıodo se repetem todos os anos, geralmente em fun¸c˜ao das esta¸c˜oes do ano, em fun¸c˜ao de vendas em determinados feriados ou em mudan¸cas clim´aticas.

Ru´ıdo aleat´orio ou erro ´e tudo aquilo que n˜ao ´e explicado pelas outras componentes da s´erie, ou seja, ´e o que o modelo estimado n˜ao consegue captar. Um erro ´e dito ru´ıdo branco quando possui distribui¸c˜ao normal, a m´edia de seus componentes ´e zero e a variˆancia constante.

(19)

2.3 Modelos de Holt-Winters 18

A decomposi¸c˜ao cl´assica ´e ´util tanto para planejamento como para previs˜ao, pois, al´em de permitir fazer previs˜oes, ela auxilia na tomada de decis˜ao sobre o m´etodo mais adequado aos aspectos dos dados dispon´ıveis (REIS, 2017).

2.3

Modelos de Holt-Winters

(HOLT, 1957) e (WINTERS, 1960) desenvolveram um m´etodo de amortecimento exponencial para modelagem de s´eries que apresentam tendˆencia e sazonalidade. Existem dois tipos de procedimento para o m´etodo de Holt-Winters: o aditivo e o multiplicativo. O m´etodo de Holt-Winters se baseia em trˆes equa¸c˜oes alisadoras, as quais segundo (MORETTIN; TOLOI, 2006), se referem uma para o n´ıvel, outra para tendˆencia e outra para sazonalidade. A suaviza¸c˜ao ´e tamb´em um m´etodo estat´ıstico que parte de uma equa¸c˜ao de m´edias m´oveis, ponderadas exponencialmente, com o objetivo de produzir ajustes nas varia¸c˜oes aleat´orias dos dados da s´erie temporal.

Os m´etodos de previs˜ao por suaviza¸c˜ao exponencial n˜ao depende de nenhuma vari´avel externa para realizar previs˜oes, depende apenas da pr´opria s´erie de dados.

A tabela 1 apresenta as equa¸c˜oes de atualiza¸c˜ao dos parˆametros e de previs˜ao dos modelos de Holt-Winters com sazonalidade aditiva e multiplicativa.

Tabela 1: Equa¸c˜oes de atualiza¸c˜oes dos parˆametros do modelos de Holt-Winters Modelo Aditivo

N´ıvel a(t) = α(Zt− St−12) + (1 − α) × (a(t − 1) + b(t − 1))

Tendˆencia b(t) = β(a(t) − a(t − 1) + (1 − β)b(t − 1) Sazonalidade St= γ(Zt− a(t)) + (1 − γ)St−12

Previs˜ao Z(h) = a(t) + b(t)h + Sb t−12+h Modelo Multiplicativo N´ıvel a(t) = α[ Zt

St−12] + (1 − α) × (a(t − 1) + b(t − 1))

Tendˆencia b(t) = β(a(t) − a(t − 1) + (1 − β)b(t − 1) Sazonalidade St = γa(t)Zt + (1 − γ)St−12

Previs˜ao Z(h) = (a(t) + b(t)h)Sb t−12+h

Onde:

(20)

2.4 Modelo de Box & Jenkins 19

• a(t) - N´ıvel da s´erie; • b(t) - Tendˆencia;

• St - Componente sazonal;

• bZ(h) - Previs˜ao h passos a frente; • Zt - Valor observado;

• α β γ - Parˆametros de amortecimento do n´ıvel, da tendˆencia e da sazonalidade respec-tivamente.

2.4

Modelo de Box & Jenkins

Os modelos de Box & Jenkins, genericamente conhecidos por ARIM A (Auto Re-gressive Integrated Moving Averages) e na literatura em portuguˆes por Auto-regressivos Integrados de M´edias M´oveis, s˜ao modelos matem´aticos que visam captar o comporta-mento da correla¸c˜ao seriada ou autocorrela¸c˜ao entre os valores da s´erie temporal, e com base nesse comportamento realizar previs˜oes futuras. Se essa estrutura de correla¸c˜ao for bem modelada, fornecer´a boas previs˜oes. Se o processo n˜ao ´e estacion´ario, pode-se torn´a-lo estacion´ario por meio de sucessivas diferencia¸c˜oes na s´erie original.

2.4.1

Processo Autoregressivo

Seja {t} um processo puramente aleat´orio com m´edia zero e variˆancia σ2.

Um processo Zt ´e chamado de processo autoregressivo (AR) de ordem p, ou AR(p)

se,

Zt= φ1Zt−1+ ... + φpZt−p+ t

Em que φ1, ..., φp s˜ao constantes reais e t ´e i.i.d com t∼ RB(0, σ2).

2.4.2

Processo de M´

edias M´

oveis

Seja {t} um processo puramente aleat´orio com m´edia zero e variˆancia σ2.

Um processo Zt´e chamado de processo de m´edias m´oveis (M A) de ordem q, ou M A(q)

(21)

2.4 Modelo de Box & Jenkins 20

Zt= t− θ1t−1− ... − θqt−q,

em que θ1, ..., θq s˜ao constantes reais e t´e i.i.d com t∼ RB(0, σ2).

2.4.3

Processo Autoregressivos e de M´

edias M´

oveis

Os processos autoregressivos e de m´edias m´oveis (ARM A) s˜ao uma generaliza¸c˜ao dos modelos AR e M A.

Seja {t} um processo puramente aleat´orio com m´edia zero e variˆancia σ2.

Um processo Zt´e chamado de processo autorregressivo e de m´edias m´oveis, ARM A(p, q)

se,

Zt= φ1Zt−1+ ... + φpZt−p+ t− θ1t−1− ... − θqt−q,

em que φ1, ..., φp e θ1, ..., θq s˜ao constantes reais e t´e i.i.d com t∼ RB(0, σ2).

2.4.4

Processos Autorregressivos Integrados e de M´

edias M´

oveis

O processo autoregressivo integrado e de m´edias m´oveis (ARIM A), denotado por ARIM A(p, d, q), considera a tendˆencia da s´erie temporal. Os parˆametros (p, d, q) s˜ao n´umeros inteiros e n˜ao negativos. Sua representa¸c˜ao ´e dada por:

φ(B)(1 − B)dZt = θ(B)t,

sendo, φ(B) = 1 − φ1(B) − φ2(B)2 − ... − φpBp o polinˆomio autoregressivo de ordem p;

θ(B) = 1 − θ1(B) − θ2(B)2 − ... − θqBq o polinˆomio de m´edias m´oveis de ordem q; B

o operador de retardo tal que, BiZ

t = Zt−i ; d o n´umero de diferen¸cas necess´arias para

retirar a tendˆencia da s´erie e transform´a-la em estacion´aria.

2.4.5

Modelagem SARIM A

(BOX; JENKINS, 1970) generalizaram o modelo ARIM A para lidar com a sazona-lidade de uma determinada s´erie temporal. Tais modelos s˜ao importantes, pois levam em considera¸c˜ao a sazonalidade estoc´astica dos dados. Definiram um modelo ARIM A

(22)

2.4 Modelo de Box & Jenkins 21

sazonal multiplicativo, denominado SARIM A de ordem (p, d, q) × (P, D, Q)s, onde s ´e o

n´umero de fatores sazonais. Ent˜ao SARIM A(p, d, q) × (P, D, Q)s ´e dado por

φ(B)Φ(Bs)Wt= θ(B)Θ(B)t onde, φ(B) = 1 − φ1(B) − ... − φpBp Φ(B) = 1 − Φ1(Bs) − ... − ΦPBP s Wt= ∆d∆Ds Zt θ(B) = 1 − θ1(B) − ... − θqBq Θ(B) = 1 − Θ1(Bs) − ... − ΘQBQs,

φ(B) ´e o operador auto regressivo AR(p), θ(B) ´e o operador de m´edias m´oveis M A(q), Φ(B) ´e o operador AR sazonal de ordem P , Θ(B) ´e o operador M A sazonal de ordem Q, ∆d ´e o operador de diferen¸cas, ∆D

s ´e o operador de diferen¸ca sazonal e t ´e um ru´ıdo

branco com m´edia zero e variˆancia σ2.

2.4.6

Fun¸

ao de Auto Correla¸

ao e Fun¸

ao de Auto Correla¸

ao

Parcial

A fun¸c˜ao de autocorrela¸c˜ao (F AC) mede o grau de correla¸c˜ao de uma vari´avel, em um dado instante, consigo mesma, em um instante de tempo posterior. Ela permite que se analise o grau de irregularidade de um sinal.

A fun¸c˜ao de autocorrela¸c˜ao parcial (F ACP ) ´e uma medida da correla¸c˜ao entre as observa¸c˜oes de uma s´erie temporal que s˜ao separadas por k unidades de tempo (yt e yt–k).

Utilizamos a F AC e F ACP para identificarmos a ordem p da parte auto-regressiva e a ordem q da parte m´edia m´ovel de um modelo ARM A, sendo indispens´avel para o c´alculo da previs˜ao da s´erie. A F AC ´e definida como a raz˜ao entre a autocovariˆancia e a variˆancia para um conjunto de dados.

Dadas as observa¸c˜oes Z1, ..., ZT, a fun¸c˜ao de autocorrela¸c˜ao ´e estimada por

ρk =

γk

γ0

,

(23)

2.5 Estat´ıstica de Aderˆencia 22

dada por

γk = E(Zt− µ)(Zt−k− µ).

A Tabela 2 mostra as propriedades te´oricas das fun¸c˜oes de autocorrela¸c˜ao e auto-correla¸c˜ao parcial para alguns processos estacion´arios como auxiliar na identifica¸c˜ao do modelo.

Tabela 2: Propriedades te´oricas da F AC e F ACP

Processo F AC F ACP

Ru´ıdo Branco 0 0

AR(1), φ1 > 0 decaimento exponencial 0, k ≥ 2

AR(1), φ1 < 0 decaimento oscilat´orio 0, k ≥ 2

AR(p) decaimento para zero 0, k > p

MA(1) 0, k > 1 decaimento oscilat´orio

ARMA(p,q) decaimento a partir de q decaimento a partir de p

2.5

Estat´ıstica de Aderˆ

encia

As estat´ısticas de aderˆencia medem o quanto a s´erie ajustada reconhece o padr˜ao da s´erie original. Essas estat´ısticas s˜ao obtidas a partir da medida de erro de previs˜ao, portanto o objetivo ´e que sejam minimizadas.

2.5.1

Raiz Quadrada do Erro Quadr´

atico M´

edio

A raiz quadrada do erro quadr´atico m´edio (RM SE) ´e a medida da magnitude m´edia dos erros estimados, tem valor sempre positivo e quanto mais pr´oximo de zero, maior a qualidade dos valores medidos ou estimados. O RM SE ´e obtido por (2.1):

RM SE = v u u t N X t=1 (zt−bzt) 2 N (2.1)

onde N ´e o n´umero de observa¸c˜oes, zt representa o valor observado no instante t, zbt representa o valor estimado no instante t.

(24)

2.5 Estat´ıstica de Aderˆencia 23

2.5.2

Erro M´

edio Percentual Absoluto

O erro m´edio percentual absoluto (M AP E) mostra, em m´edia, o quanto est´a errando no n´ıvel de agrega¸c˜ao de c´alculo, com valores variando entre 0 e 100%. O M AP E ´e obtido por (2.2): M AP E = PN t=1 zt−bzt zt N × 100, (2.2)

onde N ´e o n´umero de observa¸c˜oes, zt representa o valor observado no instante t, zbt representa o valor estimado no instante t.

2.5.3

Crit´

erio de Informa¸

ao Bayesiano

O conceito fundamental que sustenta o crit´erio de informa¸c˜ao bayesiano (BIC) ´e o Princ´ıpio da Parcimˆonia, o qual determina que o modelo selecionado deva ser aquele que apresente a menor complexidade e ao mesmo tempo tenha uma elevada capacidade para modelar os dados de treinamento. O BIC ´e obtido por (2.3):

BIC = −2 log Lp+ [p + 2] log n, (2.3)

onde Lp ´e a fun¸c˜ao de m´axima verossimilhan¸ca do modelo e p ´e o n´umero de vari´aveis

explicativas no modelo.

O BIC aumenta conforme o SQE1aumenta, al´em disso, penaliza modelos com muitas vari´aveis. Quanto menor o valor do BIC, melhor ser´a o modelo.

2.5.4

Coeficiente de Determina¸

ao

O coeficiente de determina¸c˜ao (R2), ´e uma medida de ajustamento de um modelo

estat´ıstico. Neste caso ser´a utilizado o R2 ajustado, pois ele penaliza a inclus˜ao de

regres-sores pouco explicativos.

O R2 varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue

explicar na varia¸c˜ao dos valores observados. Quanto maior o R2, mais explicativo ´e o

1SQE ´e a soma dos quadrados dos erros e ´e obtida por: SQE =PN

t=1 (zt−bzt)

2

(25)

2.6 Singular Spectrum Analysis 24

modelo, melhor ele se ajusta `a amostra. O R2 ´e obtido por (2.4):

R2 = 1 − PT t=1(Zt− bZt)2 PT t=1(Zt− Zt)2 ! . (2.4)

2.6

Singular Spectrum Analysis

Singular Spectrum Analysis (SSA), ´e uma t´ecnica n˜ao param´etrica que permite de-compor uma s´erie temporal em sinal e ru´ıdo. ´E uma t´ecnica ´util para filtrar dados de s´eries temporais. (MENEZES et al., 2014) utilizaram trˆes metodologias na abordagem SSA: An´alise de componentes principais (ACP), ACP associado com An´alise de Clus-ter e An´alise Gr´afica dos Vetores Singulares. Em seu artigo ´e mostrado que o melhor m´etodo em SSA ´e a An´alise Gr´afica dos vetores singulares, que foi utilizado neste projeto. SSA ´e um m´etodo recente e poderoso em s´eries temporais que incorpora elementos de an´alise cl´assica de s´eries temporais, estat´ıstica multivariada, geometria multivariada, sis-temas dinˆamicos e processamentos de sinais (Elsner & Tsonis, 1996) (ELSNER; TSONIS, 1996). SSA tem sido aplicada com sucesso em diversas ´areas: na matem´atica e f´ısica a economia e matem´atica financeira, na meteorologia e oceanografia a ciˆencias sociais (GOLYANDINA; NEKRUTKIN; ZHIHGLJAVSKY, 2001).

O m´etodo SSA ´e um procedimento que pode ser utilizado, dentre outras aplica¸c˜oes, na remo¸c˜ao de ru´ıdo e de s´eries temporais (GOLYANDINA; NEKRUTKIN; ZHIHGL-JAVSKY, 2001), (HASSANI; HERAVI; ZHIGLZHIHGL-JAVSKY, 2012). A vers˜ao b´asica do m´etodo SSA pode ser dividida em duas etapas: decomposi¸c˜ao e reconstru¸c˜ao.

2.6.1

Decomposi¸

ao

Segundo (GOLYANDINA; NEKRUTKIN; ZHIHGLJAVSKY, 2001), a etapa de de-composi¸c˜ao pode ser subdividida em duas partes: Incorpora¸c˜ao e decomposi¸c˜ao em valores singulares (SVD – Singular Value Decomposition).

Seja Zt= [z1, . . . zT]1×T uma s´erie temporal (HAMILTON, 1994) e considere L tal que

2 ≤ L ≤ T de modo que L ´e um parˆametro a ser estimado e ´e chamado de comprimento da janela. Entende-se por Incorpora¸c˜ao o procedimento no qual uma s´erie temporal ZT ´e

levada a uma matriz X = [z1, . . . , zk]L×T, para todo k ∈ [1, . . . , K], onde K = T − L + 1.

A matriz X, conhecida como matriz trajet´oria ´e uma matriz Hankel, ou seja, os elementos de xi,j tal que i + j = constante s˜ao iguais.

(26)

2.6 Singular Spectrum Analysis 25

Considere S = XX0. Os autovalores de S dispostos em ordem de significˆancia λ1 ≥ · · · ≥ λL ≥ 0 s˜ao obtidos e os respectivos autovetores U1, . . . , UL s˜ao encontrados.

Considere V0 = (X0UL)/

λ, como S ´e positivo semi-definido, ent˜ao a matriz trajet´oria X pode ser expressa pela decomposi¸c˜ao em valores singulares (SVD) apresentada em (2.5):

X = E1+ E2+ · · · + EL, (2.5)

onde El =

λUlVl0, para todo l = 1, . . . , L. A cole¸c˜ao (

λl, Ul, Vl) ´e conhecida como

auto-tripla da expans˜ao SVD de X. Os elementos da autotripla s˜ao definidos respectivamente por: valor singular, vetor singular `a esquerda e vetor singular `a direita de X (MENEZES et al., 2014). A contribui¸c˜ao de cada componente em (2.5) pode ser mensurada pela raz˜ao de autovalores λl/

PL

l=1λl.

2.6.2

Reconstru¸

ao

Segundo (GOLYANDINA; NEKRUTKIN; ZHIHGLJAVSKY, 2001), a etapa de re-constru¸c˜ao est´a subdividida em duas partes: agrupamento e m´edia diagonal. A etapa de agrupamento consiste no procedimento de agrupar algumas sequˆencias de matrizes ele-mentares resultantes da decomposi¸c˜ao SVD em grupos disjuntos e, ap´os isso, som´a-las, gerando novas matrizes elementares.

Considere a sequencia PL

l=1El de matrizes elementares da expans˜ao de SVD. Agrupe

as mesmas em m grupos disjuntos utilizando algum m´etodo, por exemplo, por meio de an´alise de componentes principais ou an´alise gr´afica de vetores singulares e assumir que o conjunto de ´ındices gerado ´e dado por {I1, . . . , Im}, de modo que a expans˜ao (2.5) pode

ser reescrita como em (2.6), sendo XIi arbitr´aria tal queXIi =

Ppi j=1XIij. X = L X l=1 El = m X i=1 XIi (2.6)

O objetivo do agrupamento ´e diminuir o n´umero de componentes na expans˜ao da matriz trajet´oria X. A contribui¸c˜ao de cada componente ´e mensurada pela raz˜ao (2.7).

Ppi

j=1λIij

PL

l=1λl

. (2.7)

(27)

2.6 Singular Spectrum Analysis 26

Considere x(i)l,k um elemento na linha l e coluna k na matriz XIi. O elemento z

(i) t da

componente hz(i)t i

1×T

da s´erie temporal [zt]1×T ´e calculado por meio da m´edia diagonal

da matriz elementar XIi definida em (2.8), a partir da matriz elementar XIi.

z(i)t =                  t P l=1 x(i)l,t−l+1 t , se 1 ≤ t < L ∗ L∗ P l=1 x(i)l,t−l+1 L∗ , se L ∗ ≤ t < K∗ T −K∗+1 P l=t−K∗+1 x(i)l,t−l+1 T −K∗+1 , se K∗ ≤ t ≤ T (2.8)

Cada componente hzt(i)i

1×T

concentra parte da energia da s´erie temporal original [zt]1×T que pode ser mensurada pela raz˜ao de autovalores

pi P j=1 λIij/ d P l=1 λl. De acordo com

(HASSANI; HERAVI; ZHIGLJAVSKY, 2012), podemos classificar as componentes SSA h

zt(i)i

1×T

de uma s´erie temporal arbitr´aria [zt]1×T em trˆes categorais: tendˆencia,

compo-nentes harmˆonicas (ciclo e sazonalidade) e ru´ıdo (GOLYANDINA; NEKRUTKIN; ZHIH-GLJAVSKY, 2001).

De acordo com (HASSANI; HERAVI; ZHIGLJAVSKY, 2012), um dos principais con-ceitos estudados em SSA ´e a propriedade de separabilidade. Tal propriedade caracteriza qu˜ao bem separados est˜ao as diferentes, componentes, umas das outras. Uma boa me-dida de separabilidade ´e a Correla¸c˜ao Ponderada. Por correla¸c˜ao ponderada w-correla¸c˜ao (weighted correlation), podemos entender como uma fun¸c˜ao que quantifica a dependˆencia linear entre duas componentes SSA ZT(1) e ZT(2) definida em (2.9).

ρ(w)ij =  ZT(i), ZT(j) w ||ZT(i)||w||Z (j) T ||w . (2.9) onde ||ZT(i)||w = r  ZT(i), ZT(i) w ; ||ZT(j)||w = r  ZT(j), ZT(j) w ;ZT(i), ZT(j) w = T P k=1 wkz (i) k z (j) k e wk= min{k, L, T − k}.

Atrav´es da separabilidade, pode-se verificar estatisticamente se duas componentes SSA est˜ao bem separadas, em termos de dependˆencia linear. Se o valor absoluto da w-correla¸c˜ao ´e pequeno, ent˜ao as componentes SSA correspondentes s˜ao classificadas como w-ortogonais (ou quase w-ortogonais); caso contr´ario, s˜ao ditas mal separadas. Salienta-se que comumente utiliza-se a correla¸c˜ao ponderada na fase de agrupamento SSA (GOLYAN-DINA; NEKRUTKIN; ZHIHGLJAVSKY, 2001).

(28)

2.7 Resumo da Metodologia 27

2.6.3

An´

alise Gr´

afica dos Autovetores

A an´alise das coordenadas da s´erie temporal na base definida pelos vetores singulares resultantes da SVD permite identificar as componentes de tendˆencia e da sazonalidade da s´erie. O problema geral aqui consiste em identificar e separar as componentes oscilat´orias das componentes que fazem parte da tendˆencia. De acordo com GOLYANDINA et al. (2001) a an´alise gr´afica de tais coordenadas aos pares permite identificar por meio visual as componentes harmˆonicas da s´erie.

As coordenadas da s´erie temporal em duas componentes ortogonais podem ser dispos-tas em um diagrama de dispers˜ao. Considere um harmˆonico puro com frequˆencia igual a ω, fase igual a δ, amplitude igual a ξ e per´ıodo ρ = ω1 definido como um divisor do tama-nho da janela L e K. Se o parˆametro ρ assume um valor inteiro, ent˜ao ρ ´e classificado como per´ıodo do harmˆonico. Por exemplo, as fun¸c˜oes seno e o cosseno com frequˆencias, amplitudes e fases iguais resultam em um diagrama de dispers˜ao que exibe um padr˜ao circular. Por sua vez, se ρ = ω1 ´e um inteiro, ent˜ao o diagrama de dispers˜ao exibe um pol´ıgono regular com ρ v´ertices. Para uma frequˆencia ω = mn < 0, 5 com m e n inteiros e primos, os pontos s˜ao v´ertices de um pol´ıgono regular de n v´ertices (GOLYANDINA et al., 2001). Dessa forma, a identifica¸c˜ao dos componentes que s˜ao gerados por um harmˆonico ´e reduzida `a an´alise pict´orica do padr˜ao determinado nos diferentes pares de componentes.

2.7

Resumo da Metodologia

Este trabalho realizaou modelagens de uma s´erie temporal de consumo de energia no Brasil a partir de diversas abordagens. Em princ´ıpio, a s´erie original foi modelada via Holt-Winters sob diversos aspectos e via Box & Jenkins a partir das an´alises de fun¸c˜oes de autocorrela¸c˜ao e autocorrela¸c˜ao ponderada, bem como a partir dos testes de normalidade e de estacionariedade. Em um segundo momento, a s´erie passa por uma filtragem SSA, onde foram consideradas v´arias abordagens diferentes, levando em considera¸c˜ao diversos tamanho de janela (L) e diversas formas de agrupamentos de autovetores. Ap´os cada fil-tragem SSA, a s´erie filtrada foi modelada via Holt-Winters e via Box & Jenkins conforme os aspectos citados anteriormente. Ao final, todos os modelos considerados adequados pelas an´alises dos res´ıduos foram comparados pelas estat´ısticas de aderˆencia. Aquele que minimizou foi o modelo escolhido. A figura 2 resume os passos seguintes da execu¸c˜ao deste projeto.

(29)

2.7 Resumo da Metodologia 28

(30)

29

3

An´

alise dos Resultados

No experimento computacional, considerou-se a s´erie temporal de consumo de energia el´etrica no Brasil, medida em GWh (com frequˆencia mensal) apresentada na figura 1.

A tabela 3 apresenta as principais estat´ısticas descritivas para este banco de dados.

Tabela 3: Algumas Estat´ısticas Descritivas da s´erie temporal de Consumo de Energia El´etrica no Brasil 1979-2019

Estat´ıstica GWh M´edia 24063,00 Desvio Padr˜ao 9843,75 M´ınimo 7859,00 1o Quartil 15913,00 Mediana 23630,00 3o Quartil 32291,00 M´aximo 41911,00

Figura 3: Boxplot da S´erie

Inicialmente, a s´erie foi modelada via Modelos de Amortecimento Exponencial de Holt-Winters utilizando o software F P W .

3.1

etodo de Holt-Winters

Para a modelagem de Holt-Winters foram considerados modelos sem e com tendˆencia linear e sem e com sazonalidade, que pode ser aditiva ou multiplicativa. Para todos os casos, as estat´ısticas de aderˆencia foram calculadas. A tabela 4 apresenta os resultados obtidos com estas modelagens para a S´erie Original.

(31)

3.1 M´etodo de Holt-Winters 30

Tabela 4: Estat´ısticas de Aderˆencia para os modelos de Holt-Winters

Modelo R2 MAPE MAE RMSE BIC

Constante e sem sazonalidade 0,9961 0,02080 463,4 612,0 616,0 Constante e com sazonalidade aditiva 0,9971 0,01836 396,7 531,9 538,8 Constante e com sazonalidade multiplicativa 0,9971 0,01774 388,9 524,6 531,4

Linear e sem sazonalidade 0,9962 0,02035 456,1 608,2 616,0

Linear e com sazonalidade aditiva 0,9971 0,01795 387,7 525,8 536,0 Linear e com sazonalidade multiplicativa 0,9972 0,01724 379,1 518,6 528,7

De acordo com a Tabela 4, o modelo que melhor se ajustou via Holt-Winters foi o que apresentou tendˆencia linear e sazonalidade multiplicativa, uma vez que possui o maior R2

e o menor BIC. Os parˆametros ajustados neste modelo foram: N´ıvel = 0,78612

Tendˆencia = 0,00259 Sazonalidade = 0,48516

Fatores sazonais = 1,00775; 1,00109; 1,01287; 1,01097; 0,98700; 0,97282; 0,97099; 0,99162; 1,00446; 1,01541; 1,02080; 1,00568.

Com o intuito de realizar an´alise de res´ıduos para ver a adequa¸c˜ao dos modelos, o correlograma dos res´ıduos foi estudado. Conforme apresentado na figura 4, percebe-se que a s´erie de res´ıduos apresenta o comportamento de um ru´ıdo branco com m´edia zero e variˆancia constante e isso coincide com i.i.d. (independente e identicamente distribu´ıda), visto que as correla¸c˜oes n˜ao s˜ao significantes.

(32)

3.2 M´etodo de Box & Jenkins 31

Figura 4: An´alise dos Res´ıduos

Portanto, o modelo tem um bom ajuste.

3.2

etodo de Box & Jenkins

Em um primeiro momento foi feito o teste de Doornik-Hansen, teste de Shapiro-Wilk, teste de Lilliefors e o teste de Jarque-Bera. Esses tˆem como objetivo verificar a normalidade da S´erie Original utilizando o software Gretl. Suas hip´oteses s˜ao compostas por:

(

H0 : Os dados seguem uma distribui¸c˜ao Normal

H1 : Os dados n˜ao seguem uma distribui¸c˜ao Normal

Ao realizar o teste de normalidade da s´erie, temos que:

Teste de Doornik-Hansen = 59, 0791, com p-valor 1, 48295e−013 Shapiro-Wilk = 0,943685, com p-valor 1, 47662e−012

Teste de Lilliefors = 0, 0897621, com p-valor = 0

Teste de Jarque-Bera = 31, 0616, com p-valor 1, 79908e−007

De acordo com os testes realizados anteriormente rejeita-se a hip´otese nula em to-dos os tipos de teste de normalidade. Para contornar esse problema, foi realizada uma

(33)

3.2 M´etodo de Box & Jenkins 32

transforma¸c˜ao logar´ıtmica nos dados a fim de normalizar a s´erie. Em seguida foi feito o teste de raiz unit´aria.

O teste de raiz unit´aria de Dickey-Fuller Aumentado (teste ADF ) ´e utilizado para saber se a s´erie ´e estacion´aria ou n˜ao.

(

H0 : Tem raiz unit´aria ( n˜ao ´e estacion´ario )

H1 : N˜ao tem raiz unit´aria ( ´e estacion´ario )

Fazendo o teste utilizando o software Gretl, temos: p-valor assint´otico = 0, 9404. Com isso, n˜ao rejeita-se a hip´otese nula, logo, aplica-se a primeira diferen¸ca.

Acrescentando a primeira diferen¸ca e refazendo o teste de raiz unit´aria, obtem-se p-valor assint´otico = 1, 734e−009. A partir disso, rejeita-se a hip´otese nula, ent˜ao a s´erie ´e estacion´aria com uma diferen¸ca. Assim, at´e o momento se tem:

ARIM A(p, d = 1, q)

Com a an´alise do correlograma ´e poss´ıvel definir os poss´ıveis valores de p e q para testar e verificar qual modelo ir´a se ajustar melhor.

Figura 5: Correlograma com 1 diferen¸ca

´

(34)

3.2 M´etodo de Box & Jenkins 33

s˜ao significativos.

O correlograma pode sugerir um AR(1) sazonal (devido ao lag 12 significativo na F ACP ) ou uma n˜ao estacionariedade sazonal (devido ao decaimento na F AC).

No primeiro caso, o modelo seria: SARIM A(0, 1, 0) × (1, 0, 0)

No caso da n˜ao estacionariedade sazonal, faz-se uma diferen¸ca sazonal.

Figura 6: Correlograma com 1 diferen¸ca sazonal

O resultado mostrado no correlograma da Figura 6, indica que possamos ter um MA(1) sazonal com ARMA(1,1) simples.

No segundo caso, o modelo seria: SARIM A(1, 1, 1) × (0, 1, 1)

Aplicando a transforma¸c˜ao logar´ıtmica nos dados teremos outro poss´ıvel modelo a ser testado.

(35)

3.2 M´etodo de Box & Jenkins 34

Figura 7: Correlograma com 1 diferen¸ca e transforma¸c˜ao logar´ıtmica

´

E poss´ıvel perceber que novamente h´a uma interferˆencia sazonal. O resultado mos-trado no correlograma da Figura 7, indica que possamos ter um AR(1) sazonal com ARM A(1, 1) simples.

No terceiro caso, o modelo seria:

SARIM A(1, 1, 1) × (1, 0, 0) com transforma¸c˜ao logar´ıtmica.

No caso da n˜ao estacionariedade sazonal para a transforma¸c˜ao logar´ıtmica, faz-se uma diferen¸ca sazonal.

(36)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 35

O resultado mostrado no correlograma da Figura 8, indica que possamos ter um M A(2) sazonal com ARM A(1, 1) simples.

No quarto caso, o modelo seria:

SARIM A(1, 1, 1) × (0, 1, 2) com transforma¸c˜ao logar´ıtmica.

Para as modelagens de Box & Jenkins, as estat´ısticas de aderˆencia foram encontradas. A Tabela 5 apresenta os resultados obtidos.

Tabela 5: Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins

Modelo R2 MAPE MAE RMSE BIC

SARIM A(0, 1, 0) × (1, 0, 0) 0,9968 0,01920 421,7 557,3 560,8 SARIM A(1, 1, 1) × (0, 1, 1) 0,9973 0,01654 369,5 513,3 523,3 SARIM A(1, 1, 1) × (1, 0, 0) 0,9970 0,01791 406,3 561,4 553,1 SARIM A(1, 1, 1) × (0, 1, 2) 0,9974 0,01604 365,5 525,9 511,8

Pelos resultados obtidos na tabela 5, o modelo que melhor se ajustou via Box & Jenkins foi o SARIM A(1, 1, 1) × (0, 1, 2), pois ele possui o maior R2 e o menor BIC.

Por fim, uma filtragem SSA ser´a feita na s´erie original a partir da abordagem com an´alise gr´afica dos autovetores.

3.3

An´

alise e modelagem da s´

erie sob a abordagem

SSA - An´

alise Gr´

afica

Na abordagem SSA - An´alise gr´afica segundo (GOLYANDINA; NEKRUTKIN; ZHIH-GLJAVSKY, 2001), os melhores valores para o comprimento de janela L s˜ao valores pr´oximos a T2, m´ultiplos do n´umero de fatores sazoais pr´oximos a T2 e tamb´em, L = T3 e L = 2T3 . Como a s´erie ´e mensal e ciclo anual, ent˜ao o n´umero de fatores sazonais ´e igual `

a 12 e T = 482, pois a s´erie vai de janeiro de 1979 a fevereiro de 2019. Logo, s˜ao 5 casos a se testar, sendo eles:

• 1o caso : T

3 = L = 161.

• 2o caso : L = 240, o maior multiplo de 12 menor que 241.

• 3o caso : T

(37)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 36

• 4o caso : L = 252, o menor multiplo de 12 maior que 241.

• 5o caso : 2T

3 = L = 321.

Para cada caso ´e feito uma decomposi¸c˜ao da s´erie em trˆes componentes, sendo elas: tendˆencia, harmˆonica e ru´ıdo. Para decidir os autovetores que formar˜ao cada uma das componentes, a an´alise gr´afica do comportamento de cada autovetor e do diagrama de dispers˜ao de dois autovetores consecutivos indica a componente a qual ele (ou eles) per-tence(m). Nesta an´alise, se um autovetor tem comportamento crescente ou decrescente, ele pertence a componente de tendˆencia, se ele tem um comportamento suave e/ou o diagrama de dispers˜ao dos pares consecutivos apresentam formas de pol´ıgonos regulares, ent˜ao eles pertencem `a componente harmˆonica e se n˜ao possuem nenhuma destas carac-ter´ısticas e o diagrama de dispers˜ao dos pares consecutivos apresenta uma forma ca´otica, ent˜ao eles pertencem a componente ruidosa.

Logo ap´os feito a separa¸c˜ao das componentes verificamos a matriz de correla¸c˜ao pon-derada (W-correlation matrix) sendo apresentado na figura 9. Quanto mais escura ´e a imagem, maior ´e a correla¸c˜ao entre as componentes e quanto mais clara, menor esta cor-rela¸c˜ao de modo que a parte preta indica correla¸c˜ao igual a 1 e a parte branca indica correla¸c˜ao igual ou pr´oximo de zero.

Figura 9: Matriz de correla¸c˜ao ponderada

Se a correla¸c˜ao entre as coponentes for menor ou igual a 0,05, estar´a garantido que as componentes foram bem separadas. Assim, foram formadas as recontru¸c˜oes com as

(38)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 37

componentes Tendˆencia e Harmˆonica excluindo a componente Ru´ıdosa.

Por fim, foram feitas as modelagens de Holt-Winters e Box & Jenkins para a s´erie filtrada via SSA.

3.3.1

1

o

caso : L = 161

Verificando-se os pares de diagrama de dispers˜ao para ver se h´a pares de autovetores pertencentes a componente harmˆonica. A figura 10 apresenta os 9 primeiros pares de autovetores sequenciais.

Figura 10: Diagrama de dispers˜ao dos autovetores sequenciais com L=161

´

E poss´ıvel perceber que n˜ao h´a pares de autovetores que tenham um formato que se aproxime de um pol´ıgono regular. Dessa forma, momentaneamente n˜ao se tem pares de autovetores pertencentes a componente harmˆonica.

(39)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 38

Figura 11: Os nove autovetores mais significantes com L = 161

Na figura 11 ´e poss´ıvel perceber que o primeiro autovetor pertence `a componente tendˆencia. J´a os autovetores 2, 3, 4 e 5 pertencem `a componente harmˆonica e o restˆante pertencem a componente ruidosa.

No 1o caso, tem a seguinte decomposi¸c˜ao:

Tabela 6: Agrupamento das componentes Tendˆencia Harmˆonica Ru´ıdo

1 2 - 5 6 - 161

Sua matriz de correla¸c˜ao ´e dada na tabela 7.

Tabela 7: Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 161 Correla¸c˜ao Tendˆencia Harmˆonica Ru´ıdo

Tendˆencia 1,000 0,005 0,000

Harmˆonica 0,005 1,000 0,042

Ru´ıdo 0,000 0,042 1,000

Pode-se perceber na tabela 7 que as correla¸c˜oes s˜ao baixas. Portanto, foi garantido uma boa separa¸c˜ao entre as componentes. A partir de ent˜ao, foi feita a reconstru¸c˜ao.

(40)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 39

A figura 12 apresenta a s´erie original e a recontru¸c˜ao com L = 161.

Figura 12: Reconstru¸c˜ao com L = 161

Com a s´erie reconstru´ıda, foram feitas as modelagens via Holt-Winters e Box & Jen-kins.

A tabela 8 apresenta as estat´ısticas de aderˆencia para modelagem via Holt-Winters. Tabela 8: Estat´ısticas de Aderˆencia para os modelos de Holt-Winters com L = 161

Modelo R2 MAPE MAE RMSE BIC

Constante e sem sazonalidade 0,9999 0,0033250 71,860 83,110 83,650 Constante e com sazonalidade aditiva 0,9999 0,0033250 71,860 83,110 84,190 Constante e com sazonalidade multiplicativa 0.9999 0,0033250 71,860 83,110 84,190

Linear e sem sazonalidade 1,0000 0,0001167 02,801 04,464 04,522

Linear e com sazonalidade aditiva 1,0000 0,0007260 17,080 24,660 25,140 Linear e com sazonalidade multiplicativa 1,0000 0,0007292 17,140 23,720 24,180

O modelo que melhor se ajustou via modelagem Holt-Winters com janela L = 161 foi o modelo Linear sem Sazonalidade, pois possui o maior R2 e o menor M AP E, M AE, RM SE e BIC .

Ap´os a modelagem de Holt-Winters vem a modelagem via Box & Jenkins. Ao realizar o teste de Normalidade, temos:

Teste de Doornik-Hansen = 61,6619, com p-valor 4, 07658e−014 Shapiro-Wilk W = 0,933368, com p-valor 7, 70005e−014

(41)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 40

Teste de Lilliefors = 0,08576, com p-valor ≈ 0

Teste de Jarque-Bera = 31,9186, com p-valor 1, 17211e−007

De acordo com os testes realizados rejeita-se a hipotese nula, ent˜ao a s´erie n˜ao ´e normal. Contornando este problema aplica-se a transforma¸c˜ao logar´ıtmica a fim de nor-malizar a s´erie. Logo ap´os, faz-se o teste de ra´ız unit´aria de Dickey-Fuller Aumentado (ADF ).

De acordo com o teste, p-valor assint´otico = 0,9994. Com isso, n˜ao se rejeita a hip´otese nula, logo, aplica-se a primeira diferen¸ca. Acrescentando a primeira diferen¸ca e refazendo o teste de raiz unit´aria, obt´em-se p-valor assint´otico = 0, 1676 que n˜ao rejeita novamente a hip´otese nula. Aplicando a segunda diferen¸ca se obt´em p-valor assint´otico = 1, 18e−005 que rejeita a hip´otese nula.

A partir disso, a s´erie ´e estacion´aria com duas diferen¸cas. Assim, temos at´e o mo-mento:

ARIM A(p, d = 2, q)

Foram realizados v´arios testes de Box & Jenkins com d = 2. Os modelos que apre-sentaram os melhores resultados encontram-se na tabela 9.

Tabela 9: Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 161

Modelo R2 MAPE MAE RMSE BIC

SARIM A(1, 2, 3) × (0, 2, 3) 1 0,00003265 0,892 2,312 1,484 SARIM A(1, 2, 3) × (1, 2, 2) 1 0,00003300 0,893 2,303 1,502 SARIM A(1, 2, 3) × (2, 2, 3) 1 0,00003263 0,892 2,317 1,508 SARIM A(2, 2, 3) × (0, 2, 3) 1 0,00003254 0,893 2,311 1,495 SARIM A(3, 2, 2) × (0, 2, 3) 1 0,00003239 0,889 2,310 1,490 SARIM A(3, 2, 2) × (0, 2, 2) 1 0,00003313 0,900 2,302 1,512 SARIM A(3, 2, 3) × (0, 2, 2) 1 0,00003199 0,860 2,287 1,507 SARIM A(3, 2, 3) × (0, 2, 3) 1 0,00003221 0,874 2,294 1,491

O modelo que melhor se ajustou via modelagem Box & Jenkins com janela L = 161 foi o modelo SARIM A(1, 2, 3) × (1, 2, 2) com transforma¸c˜ao logar´ıtmica, pois possui o maior R2 e o menor BIC.

(42)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 41

3.3.2

2

o

caso : L = 240

Verificando-se os pares de diagrama de dispers˜ao para ver se h´a pares de autovetores pertencentes a componente harmˆonica. A figura 13 apresenta os 9 primeiros pares de autovetores sequenciais.

Figura 13: Diagrama de dispers˜ao dos autovetores sequenciais

´

E poss´ıvel perceber que n˜ao h´a pares de autovetores que tenham um formato que se aproxime de um pol´ıgono regular. Dessa forma, momentaneamente n˜ao se tem pares de autovetores pertencentes a componente harmˆonica.

(43)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 42

Figura 14: Os nove autovetores mais significantes com L = 240

Na figura 14 ´e poss´ıvel perceber que o primeiro autovetor pertence `a componente tendˆencia. J´a os autovetores 2, 3, 4, 5 e 6 pertencem `a componente harmˆonica e o restˆante pertencem a componente ruidosa.

No 2o caso, tem a seguinte decomposi¸c˜ao:

Tabela 10: Agrupamento das componentes Tendˆencia Harmˆonica Ru´ıdo

1 2 - 6 7 - 240

Sua matriz de correla¸c˜ao ´e dada na tabela 11.

Tabela 11: Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 240 Correla¸c˜ao Tendˆencia Harmˆonica Ru´ıdo

Tendˆencia 1,000 0,003 0,000

Harmˆonica 0,003 1,000 0,031

Ru´ıdo 0,000 0,031 1,000

Pode-se perceber na tabela 11 que as correla¸c˜oes s˜ao baixas. Portanto, foi garantido uma boa separa¸c˜ao entre as componentes. A partir de ent˜ao, foi feita a reconstru¸c˜ao.

(44)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 43

A figura 15 apresenta a s´erie original e a recontru¸c˜ao com L = 240.

Figura 15: Diagrama de dispers˜ao dos autovetores

Com a s´erie reconstru´ıda, foram feitas as modelagens via Holt-Winters e Box & Jen-kins.

A tabela 12 apresenta as estat´ısticas de aderˆencia para modelagem via Holt-Winters. Tabela 12: Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 240

Modelo R2 MAPE MAE RMSE BIC

Constante e sem sazonalidade 0,9999 0,0036650 77,670 88,990 89,560 Constante e com sazonalidade aditiva 0,9999 0,0036650 77,670 88,990 90,140 Constante e com sazonalidade multiplicativa 0,9999 0,0036650 77,670 88,990 90,140

Linear e sem sazonalidade 1,0000 0,0001413 03,135 05,893 05,969

Linear e com sazonalidade aditiva 1,0000 0,0007463 18,260 25,910 26,410 Linear e com sazonalidade multiplicativa 1,0000 0,0007325 17,870 24,750 25,240

O modelo que melhor se ajustou via modelagem Holt-Winters com janela L = 240 foi o modelo Linear sem Sazonalidade, pois possui o maior R2 e o menor M AP E, M AE, RM SE e BIC .

Ap´os a modelagem de Holt-Winters vem a modelagem via Box & Jenkins. Ao realizar o teste de Normalidade, temos:

Teste de Doornik-Hansen = 57,384, com p-valor 3, 46121e−013 Shapiro-Wilk W = 0,941425, com p-valor 7, 50742e−013

(45)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 44

Teste de Lilliefors = 0,0869011, com p-valor ≈ 0

Teste de Jarque-Bera = 30,5361, com p-valor 2, 33976e−007

De acordo com os testes realizados rejeita-se a hipotese nula, ent˜ao a s´erie n˜ao ´e normal. Contornando este problema aplica-se a transforma¸c˜ao logar´ıtmica a fim de nor-malizar a s´erie. Logo ap´os, faz-se o teste de ra´ız unit´aria de Dickey-Fuller Aumentado (ADF ).

De acordo com o teste, p-valor assint´otico = 0,9937. Com isso, n˜ao se rejeita a hip´otese nula, logo, aplica-se a primeira diferen¸ca. Acrescentando a primeira diferen¸ca e refazendo o teste de raiz unit´aria, obt´em-se p-valor assint´otico = 0, 1365 que n˜ao rejeita novamente a hip´otese nula. Aplicando a segunda diferen¸ca se obt´em p-valor assint´otico = 6, 103e−009 que rejeita a hip´otese nula.

A partir disso, a s´erie ´e estacion´aria com duas diferen¸cas. Sendo assim, tem-se:

ARIM A(p, d = 2, q)

Foram realizados v´arios testes de Box & Jenkins com d = 2. Os modelos que apre-sentaram os melhores resultados encontram-se na tabela 13.

Tabela 13: Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 240

Modelo R2 MAPE MAE RMSE BIC

SARIM A(1, 2, 3) × (0, 2, 3) 1 0,00003094 0,870 2,142 1,348 SARIM A(1, 2, 3) × (1, 2, 2) 1 0,00003087 0,863 2,147 1,355 SARIM A(1, 2, 3) × (2, 2, 3) 1 0,00003066 0,863 2,136 1,361 SARIM A(2, 2, 3) × (0, 2, 3) 1 0,00003081 0,869 2,136 1,353 SARIM A(3, 2, 2) × (0, 2, 3) 1 0,00002906 0,825 2,101 1,328 SARIM A(3, 2, 2) × (0, 2, 2) 1 0,00002935 0,822 2,106 1,333 SARIM A(3, 2, 3) × (0, 2, 2) 1 0,00002940 0,822 2,112 1,345 SARIM A(3, 2, 3) × (0, 2, 3) 1 0,00002911 0,829 2,106 1,336

O modelo que melhor se ajustou via modelagem Box & Jenkins com janela L = 240 foi o modelo SARIM A(3, 2, 2) × (0, 2, 3) com transforma¸c˜ao logar´ıtmica, pois possui o maior R2 e o menor BIC.

(46)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 45

3.3.3

3

o

caso : L = 241

Verificando-se os pares de diagrama de dispers˜ao para ver se h´a pares de autovetores pertencentes a componente harmˆonica. A figura 16 apresenta os 9 primeiros pares de autovetores sequenciais.

Figura 16: Diagrama de dispers˜ao dos autovetores sequenciais

´

E poss´ıvel perceber que n˜ao h´a pares de autovetores que tenham um formato que se aproxime de um pol´ıgono regular. Dessa forma, momentaneamente n˜ao se tem pares de autovetores pertencentes a componente harmˆonica.

Logo ap´os, verificasse os autovetores um a um para ver a qual componente ele pertence.

(47)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 46

Na figura 17 ´e poss´ıvel perceber que o primeiro autovetor pertence `a componente tendˆencia. J´a os autovetores 2, 3, 4 e 5 pertencem `a componente harmˆonica e o restˆante pertencem a componente ruidosa.

No 3o caso, tem-se a seguinte decomposi¸c˜ao:

Tabela 14: Agrupamento das componentes Tendˆencia Harmˆonica Ru´ıdo

1 2 - 6 7 - 241

Sua matriz de correla¸c˜ao ´e dada na tabela 15.

Tabela 15: Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 241 Correla¸c˜ao Tendˆencia Harmˆonica Ru´ıdo

Tendˆencia 1,000 0,003 0,000

Harmˆonica 0,003 1,000 0,031

Ru´ıdo 0,000 0,031 1,000

Pode-se perceber na tabela 15 que as correla¸c˜oes s˜ao baixas. Portanto, foi garantido uma boa separa¸c˜ao entre as componentes. A partir de ent˜ao, ´e feita a reconstru¸c˜ao.

A figura 18 apresenta a s´erie original e a recontru¸c˜ao com L = 241.

Figura 18: Diagrama de dispers˜ao dos autovetores

Com a s´erie reconstru´ıda, foram feitas as modelagens via Holt-Winters e Box & Jen-kins.

(48)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 47

A tabela 16 apresenta as estat´ısticas de aderˆencia para modelagem via Holt-Winters. Tabela 16: Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 241

Modelo R2 MAPE MAE RMSE BIC

Constante e sem sazonalidade 0,9999 0,0036650 77,670 89,000 89,57 Constante e com sazonalidade aditiva 0,9999 0,0036650 77,670 89,000 90,14 Constante e com sazonalidade multiplicativa 0,9999 0,0036650 77,670 89,000 90,14

Linear e sem sazonalidade 1,0000 0,0001414 03,134 05,897 5,973

Linear e com sazonalidade aditiva 1,0000 0,0007465 18,270 25,920 26,42 Linear e com sazonalidade multiplicativa 1,0000 0,0007221 17,540 24,480 24,95

O modelo que melhor se ajustou via modelagem Holt-Winters com janela L = 241 foi o modelo Linear sem Sazonalidade, pois possui o maior R2 e o menor M AP E, M AE,

RM SE e BIC .

Ap´os a modelagem de Holt-Winters vem a modelagem via Box & Jenkins. Ao realizar o teste de Normalidade, temos:

Teste de Doornik-Hansen = 57,3846, com p-valor 3, 46012e−013 Shapiro-Wilk W = 0,941425, com p-valor 7, 50702e−013

Teste de Lilliefors = 0,0869002, com p-valor ≈ 0

Teste de Jarque-Bera = 30,5362, com p-valor 2, 33963e−007

De acordo com os testes realizados rejeita-se a hipotese nula, ent˜ao a s´erie n˜ao ´e normal. Contornando este problema aplica-se a transforma¸c˜ao logar´ıtmica a fim de nor-malizar a s´erie. Logo ap´os, faz-se o teste de ra´ız unit´aria de Dickey-Fuller Aumentado (ADF ).

De acordo com o teste, p-valor assint´otico = 0,9935. Com isso, n˜ao se rejeita a hip´otese nula, logo, aplica-se a primeira diferen¸ca. Acrescentando a primeira diferen¸ca e refazendo o teste de raiz unit´aria, obt´em-se p-valor assint´otico = 0, 1504 que n˜ao rejeita novamente a hip´otese nula. Aplicando a segunda diferen¸ca se obt´em p-valor assint´otico = 1, 433e−008 que rejeita a hip´otese nula.

A partir disso, a s´erie ´e estacion´aria com duas diferen¸cas. Sendo assim, tem-se:

(49)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 48

Foram realizados v´arios testes de Box & Jenkins com d = 2. Os modelos que apre-sentaram os melhores resultados encontram-se na tabela 17.

Tabela 17: Estat´ısticas de Aderˆencia para os modelos de Box & Jenkins com L = 241

Modelo R2 MAPE MAE RMSE BIC

SARIM A(1, 2, 3) × (0, 2, 3) 1 0,00003069 0,862 2,128 1,344 SARIM A(1, 2, 3) × (1, 2, 2) 1 0,00003053 0,854 2,137 1,349 SARIM A(1, 2, 3) × (2, 2, 3) 1 0,00003068 0,859 2,134 1,364 SARIM A(2, 2, 3) × (0, 2, 3) 1 0,00003037 0,862 2,124 1,345 SARIM A(3, 2, 2) × (0, 2, 3) 1 0,00002879 0,816 2,081 1,319 SARIM A(3, 2, 2) × (0, 2, 2) 1 0,00002934 0,820 2,088 1,324 SARIM A(3, 2, 3) × (0, 2, 2) 1 0,00002908 0,816 2,103 1,338 SARIM A(3, 2, 3) × (0, 2, 3) 1 0,00002898 0,821 2,083 1,326

O modelo que melhor se ajustou via modelagem Box & Jenkins com janela L = 241 foi o modelo SARIM A(3, 2, 2) × (0, 2, 3) com transforma¸c˜ao logar´ıtmica, pois possui o maior R2 e o menor BIC.

3.3.4

4

o

caso : L = 252

Verificando-se os pares de diagrama de dispers˜ao para ver se h´a pares de autovetores pertencentes a componente harmˆonica. A figura 19 apresenta os 9 primeiros pares de autovetores sequenciais.

(50)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 49 ´

E poss´ıvel perceber que n˜ao h´a pares de autovetores que tenham um formato que se aproxime de um pol´ıgono regular. Dessa forma, momentaneamente n˜ao se tem pares de autovetores pertencentes a componente harmˆonica.

Logo ap´os, verificasse os autovetores um a um para ver a qual componente ele pertence.

Figura 20: Os nove autovetores mais significantes com L = 252

Na figura 20 ´e poss´ıvel perceber que o primeiro autovetor pertence `a componente tendˆencia. J´a os autovetores 2, 3, 4, 5 e 6 pertencem `a componente harmˆonica e o restˆante pertencem a componente ruidosa.

No 4o caso, tem-se a seguinte decomposi¸c˜ao:

Tabela 18: Agrupamento das componentes Tendˆencia Harmˆonica Ru´ıdo

1 2 - 6 7 - 252

Sua matriz de correla¸c˜ao ´e dada na tabela 19.

Tabela 19: Correla¸c˜ao para a decomposi¸c˜ao do modelo L = 252 Correla¸c˜ao Tendˆencia Harmˆonica Ru´ıdo

Tendˆencia 1,000 0,003 0,000

Harmˆonica 0,003 1,000 0,032

(51)

3.3 An´alise e modelagem da s´erie sob a abordagem SSA - An´alise Gr´afica 50

Pode-se perceber na tabela 19 que as correla¸c˜oes s˜ao baixas. Portanto, foi garantido uma boa separa¸c˜ao entre as componentes. A partir de ent˜ao, ´e feita a reconstru¸c˜ao.

A figura 21 apresenta a s´erie original e a recontru¸c˜ao com L = 252.

Figura 21: Diagrama de dispers˜ao dos autovetores

Com a s´erie reconstru´ıda, foram feitas as modelagens via Holt-Winters e Box & Jen-kins.

A tabela 20 apresenta as estat´ısticas de aderˆencia para modelagem via Holt-Winters.

Tabela 20: Estat´ısticas de Aderˆencia para os modelos de Holt-Winters, L = 252

Modelo R2 MAPE MAE RMSE BIC

Constante e sem sazonalidade 0,9999 0,0036630 77,660 89,01 89,58 Constante e com sazonalidade aditiva 0,9999 0,0036630 77,660 89,01 90,16 Constante e com sazonalidade multiplicativa 0,9999 0,0036630 77,660 89,01 90,16

Linear e sem sazonalidade 1,0000 0,0001406 03,125 5,845 05,92

Linear e com sazonalidade aditiva 1,0000 0,0007832 18,790 26,25 26,76 Linear e com sazonalidade multiplicativa 1,0000 0,0008251 20,230 27,19 27,72

O modelo que melhor se ajustou via modelagem Holt-Winters com janela L = 252 foi o modelo Linear sem Sazonalidade, pois possui o maior R2 e o menor M AP E, M AE,

RM SE e BIC .

Ap´os a modelagem de Holt-Winters vem a modelagem via Box & Jenkins. Ao realizar o teste de Normalidade, temos:

Referências

Documentos relacionados

Com a realização da Ficha de Diagnóstico, o professor deve averiguar as aprendizagens dos alunos já realizadas sobre números racionais não negativos – operações e propriedades.

A psicanálise foi acusada de normatizadora (FOUCAULT, 1996) por haver mantido o modelo familiar burguês nuclear como o centro de sua teoria como é manifestado

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

A grande vantagem em aplicar a SSA em detrimento aos algoritmos de suavização exponencial ou modelos de Box-Jenkins refere-se a sua simplificação no entendimento das séries temporais

Corporate Control and Policies Page 12 UNIVERSIDAD DE PIURA UNIVERSIDAD DEL PACÍFICO UNIVERSIDAD ESAN UNIVERSIDAD NACIONAL AGRARIA LA MOLINA UNIVERSIDAD NACIONAL

Outro aspecto, não menos importante, é a quase inexistente promoção de reuniões empresariais com o setor privado de ambos países, de seminários, simpósios,

A concentração de ATP total e a contagem de mesófilos aeróbios foram diferentes (p&lt;0,05) quando se comparou antes e após o procedimento de higienização, considerando todas