• Nenhum resultado encontrado

Analisando autovetores na abordagem singular spectrum analysis para a previsão de vazão de afluentes

N/A
N/A
Protected

Academic year: 2021

Share "Analisando autovetores na abordagem singular spectrum analysis para a previsão de vazão de afluentes"

Copied!
44
0
0

Texto

(1)

Douglas de Castro Silva

Analisando Autovetores na abordagem

Singular Spectrum Analysis para a Previs˜

ao

de Vaz˜

ao de Afluentes

Niter´oi - RJ, Brasil 16 de mar¸co de 2017

(2)

Universidade Federal Fluminense

Douglas de Castro Silva

Analisando Autovetores na

abordagem Singular Spectrum

Analysis para a Previs˜

ao de Vaz˜

ao de

Afluentes

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Mois´es Lima de Menezes

Niter´oi - RJ, Brasil 16 de mar¸co de 2017

(3)

Universidade Federal Fluminense

Douglas de Castro Silva

Analisando Autovetores na abordagem

Singular Spectrum Analysis para a Previs˜

ao

de Vaz˜

ao de Afluentes

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Ana-lisando Autovetores na abordagem Singular Spectrum Analysis para a Previs˜ao de Vaz˜ao de Afluentes”, defendida por Dou-glas de Castro Silva e aprovada em 16 de mar¸co de 2017, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:

Prof. Dr. Mois´es Lima de Menezes Departamento de Estat´ıstica – UFF

Prof. Dra. M´arcia Marques de Carvalho Departamento de Estat´ıstica – UFF

Profa. Dra. Keila Mara Cassiano Departamento de Estat´ıstica – UFF

(4)

M 149 Silva, Douglas de Castro

Analisando Autovetores na abordagem Singular Spectrum Analysis para a Previsão de Vazão de Afluentes /Douglas De Castro Silva. - Niterói: [s. n.], 2017.

??f.

Trabalho de Conclusão de Curso - (Bacharelado em Es- tatística) – Universidade Federal Fluminense, 2017.

1. Singular Spectrum Analysis. 2. Autovetores. 3. Vazão de Afluentes.

I. Título.

(5)

Resumo

Diante da atual situa¸c˜ao energ´etica brasileira, a previs˜ao de vaz˜ao de afluentes surge como uma ferramenta essencial no planejamento de longo prazo. Com mais de 70% da energia gerada no Brasil, as usinas hidrel´etricas tem uma fun¸c˜ao importante neste cen´ario e, dentre elas, a Usina Hidrel´etrica de Itaip´u ´e respons´avel por boa parte desta energia gerada. Como o pricipal afluente `a UHE de Itaip´u, o Rio Paran´a apresenta momentos de baixo e de alto fluxo de correnteza, aumentando e diminuindo sua vaz˜ao em ´epocas distintas. Para se ter um controle sobre a energia que poder´a ser gerada na usina ´e preciso ter um conhecimento pr´evio da vaz˜ao que o afluente poder´a servir. A an´alise de s´eries temporais tem se mostrado como uma ferramenta adequada para este tipo de previs˜ao e a literatura tem mostrado que filtragens de s´eries temporais melhoram a qualidade des-tas previs˜oes. Este trabalho objetiva avaliar o ganho preditivo da modelagem de s´eries temporais quando se aplica `a s´erie uma filtragem por Singular Spectrum Analysis (SSA), uma ferramenta em estat´ıstca que permite, dentre outras coisas, remover a componente de ru´ıdo ap´os uma decomposi¸c˜ao adequada e com isso, retornar uma s´erie filtrada menos ruidosa. Na ocasi˜ao, uma s´erie de m´edias mensais de vaz˜ao de afluentes do Rio Paran´a na Usina Hidrel´etrica de Itaip´u foi modelada via modelos de amortecimento exponen-cial de Holt-Winters sem e com a filtragem SSA e modelos de Box & Jenkins da classe ARIMA tamb´em sem e com a filtragem SSA. A filtragem SSA foi feita a partir da an´alise gr´afica dos autovetores e confirmada pela correla¸c˜ao ponderada. Todos os modelos foram comparados entre si de acordo com as estat´ısticas de aderˆencia Mean Absolute Percentage Error (MAPE) e Root Mean Square Error (RMSE), o crit´erio de sele¸c˜ao do melhor modelo (BIC) Bayesian Information Criterion e o coeficiente de determina¸c˜ao R2. Os resultados

obtidos mostram que os modelos de Box & Jenkins tem um poder preditivo maior que os modelos de Holt-Winters e que, ao aplicar a filtragem SSA, a acur´acia dos modelos ´e melhorada em todos os casos.

Palavras-chaves: Previs˜ao, S´eries Temporais, Singular Spectrum Analysis, Autovetores, Vaz˜ao de Afluentes, Filtragem, Modelagem, Box & Jenkins, Holt-Winters, ARIMA.

(6)

Dedicat´

oria

(7)

Sum´

ario

Lista de Figuras

Lista de Tabelas

1 Introdu¸c˜ao p. 10

1.1 Contextualiza¸c˜ao . . . p. 10 1.2 Energia Hidrel´etrica . . . p. 10 1.3 Previs˜ao de Vaz˜ao de Afluentes . . . p. 11 1.4 Proposta . . . p. 12 1.5 Estrutura . . . p. 13 2 Objetivos p. 14 3 Materiais e M´etodos p. 15 3.1 Banco de Dados . . . p. 15 3.2 Modelos de Holt-Winters . . . p. 16 3.3 Modelos de Box & Jenkins . . . p. 17 3.3.1 Modelo autorregressivo (AR) . . . p. 18 3.3.2 Modelo de m´edias m´oveis (M A) . . . p. 18 3.3.3 Modelo Autorregressivo e de M´edias M´oveis (ARM A) . . . p. 19 3.3.4 O modelo ARIM A . . . p. 19 3.3.5 Modelagem SARIM A . . . p. 19 3.3.6 Fun¸c˜ao de Auto Correla¸c˜ao (FAC) e Fun¸c˜ao de Auto Correla¸c˜ao

(8)

3.4 Diagn´ostico do modelo . . . p. 21 3.4.1 Estat´ısticas de Aderˆencia . . . p. 22 3.4.2 An´alise dos Res´ıduos . . . p. 23 3.5 Filtragem SSA . . . p. 23 3.5.1 Decomposi¸c˜ao . . . p. 24 3.5.2 Reconstru¸c˜ao . . . p. 25 3.6 An´alise Gr´afica dos Autovetores . . . p. 26 3.7 Resumo da Metodologia . . . p. 27

4 An´alise dos Resultados p. 29

4.1 Modelagem por Holt-Winters Sem Filtragem SSA . . . p. 29 4.2 Modelagem por Box & Jenkins Sem Filtragem SSA . . . p. 30 4.2.1 Teste de Normalidade . . . p. 30 4.2.2 Teste de Raiz Unit´aria . . . p. 30 4.2.3 An´alise do Correlograma . . . p. 30 4.2.4 Estat´ısticas de Aderˆencia para os Modelos de Box & Jenkins . . p. 32 4.3 Filtragem SSA . . . p. 32 4.3.1 An´alise de S´eries Temporais Com Filtragem SSA . . . p. 36 4.3.2 Modelagem de Holt-Winters Com Filtragem SSA . . . p. 36 4.3.3 Modelagem por Box & Jenkins com Filtragem SSA . . . p. 37 4.3.3.1 Teste de Normalidade . . . p. 37 4.3.3.2 Teste de Raiz Unit´aria . . . p. 38 4.3.3.3 Estat´ısticas de Aderˆencia . . . p. 38 4.3.4 An´alise dos Res´ıduos . . . p. 39

5 Conclus˜ao p. 41

(9)

Lista de Figuras

1 Gr´afico de Vaz˜ao de Afluentes da UHE de Itaip´u . . . p. 16 2 Fluxograma da Metodologia . . . p. 28 3 Fun¸c˜ao de Autocorrela¸c˜ao . . . p. 31 4 FAC e FACP Ap´os uma Diferen¸ca Sazonal . . . p. 31 5 Autovetores na Decomposi¸c˜ao SSA . . . p. 33 6 Diagrama de Dispers˜ao de pares de Autovetores na decomposi¸c˜ao SSA p. 34 7 Gr´aficos das Componentes da S´erie . . . p. 35 8 S´erie Origianl e S´erie Filtrada via SSA . . . p. 36 9 FAC dos res´ıduos . . . p. 40

(10)

Lista de Tabelas

1 Estat´ısticas descritivas de vaz˜ao de afluentes do Rio Paran´a . . . p. 16 2 Equa¸c˜oes B´asicas dos modelos de Holt-Winters . . . p. 17 3 Propriedades te´oricas da FAC e FACP . . . p. 21 4 Estat´ısticas de Aderˆencia dos Modelos . . . p. 29 5 Estat´ısticas de Aderˆencia dos Modelos . . . p. 32 6 Agrupamento das Componentes . . . p. 35 7 Correla¸c˜ao Ponderada Entre Agrupamentos . . . p. 35 8 Estat´ısticas de Aderˆencia dos Modelos Ap´os Filtragem SSA . . . p. 37 9 Estat´ısticas de Aderˆencia dos Melhores Modelos com e sem Filtragem SSA p. 37 10 Estat´ısticas de Aderˆencia dos Modelos de Box & Jenkins com Filtragem

SSA . . . p. 38 11 Estat´ısticas de Aderˆencia dos Modelos de Box & Jenkins sem e com

Filtragem SSA . . . p. 38 12 Estat´ısticas de Aderˆencia dos Modelos de Holt-Winters e de Box &

(11)

10

1

Introdu¸

ao

1.1

Contextualiza¸

ao

A energia el´etrica ´e um dos bens essenciais na evolu¸c˜ao humana. Desde a inven¸c˜ao da lˆampada, o ser humano vem se desenvolvendo ao longo do tempo. R´adio, televis˜ao, tele-fonia m´ovel, aparelhos hospitalares, o advento dos computadores, dentre outros, tˆem sua funcionalidade dependente da energia el´etrica. Durante todo o s´eculo XX, a oferta farta de energia, obtida principalmente a partir dos combust´ıveis f´osseis como petr´oleo e carv˜ao mineral, deu suporte ao crescimento e `as transforma¸c˜oes da economia mundial. J´a nos primeiros anos do s´eculo atual, o cen´ario mudou ao ser colocado `a prova por uma nova realidade: a necessidade do desenvolvimento sustent´avel. A disponibilidade energ´etica deveria se manter compat´ıvel com o acentuado aumento do consumo provocado por um novo ciclo de crescimento econˆomico, observado principalmente nos pa´ıses em desenvolvi-mento. Entretanto, as fontes tradicionais teriam que ser substitu´ıdas por recursos menos agressivos ao meio ambiente, dentre eles a energia hidrel´etrica.

1.2

Energia Hidrel´

etrica

A ´agua ´e o recurso natural mais abundante na Terra. Com um volume estimado de 1,36 bilh˜ao de quilˆometros c´ubicos km3 recobre 2/3 da superf´ıcie do planeta sob a forma

de oceanos, calotas polares, rios e lagos. Al´em disso, pode ser encontrada em aqu´ıferos subterrˆaneos, como o Guarani, no Sudeste brasileiro. A ´agua tamb´em ´e uma das poucas fontes para produ¸c˜ao de energia que n˜ao contribui para o aquecimento global o principal problema ambiental da atualidade.

A energia hidrel´etrica ´e gerada pelo aproveitamento do fluxo das ´aguas em uma usina na qual as obras civis que envolvem tanto a constru¸c˜ao quanto o desvio do rio e a forma¸c˜ao do reservat´orio s˜ao t˜ao ou mais importantes que os equipamentos instalados. Por isso, ao contr´ario do que ocorre com as usinas termel´etricas (cujas instala¸c˜oes s˜ao mais simples),

(12)

1.3 Previs˜ao de Vaz˜ao de Afluentes 11

para a constru¸c˜ao de uma hidrel´etrica ´e imprescind´ıvel a contrata¸c˜ao da chamada ind´ustria da constru¸c˜ao pesada.

Para produzir a energia hidrel´etrica ´e necess´ario integrar a vaz˜ao do rio, `a quantidade de ´agua dispon´ıvel em determinado per´ıodo de tempo e aos desn´ıveis do relevo, sejam eles naturais, como as quedas d’´agua, ou criados artificialmente (ANEEL, 2008).

A primeira hidrel´etrica do mundo foi constru´ıda no final do s´eculo XIX, quando o carv˜ao era o principal combust´ıvel e as pesquisas sobre petr´oleo ainda engatinhavam junto `

as quedas d’´agua das Cataratas do Ni´agara. At´e ent˜ao, a energia hidr´aulica da regi˜ao tinha sido utilizada apenas para a produ¸c˜ao de energia mecˆanica. Na mesma ´epoca, e ainda no reinado de D. Pedro II, o Brasil construiu a primeira hidrel´etrica, no munic´ıpio de Diamantina, utilizando as ´aguas do Ribeir˜ao do Inferno, afluente do rio Jequitinhonha, com 0,5 MW (Megawatt) de potˆencia e linha de transmiss˜ao de dois quilˆometros (ANEEL, 2008).

No Brasil, de acordo com o Banco de Informa¸c˜oes da Gera¸c˜ao (BIG) da Aneel, em novembro de 2008, existiam em opera¸c˜ao 227 CGHs (Cetrais geradoras hidrel´etricas), com potˆencia total de 120 MW (MegaWatt); 320 PCHs (Pequenas centrais hidrel´etricas, com 2,4 mil MW de potˆencia instalada) e 159 UHE com uma capacidade total instalada de 74,63 mil MW. Em novembro de 2008, as usinas hidrel´etricas, independentemente de seu porte, respondiam, portanto, por 75,68% da potˆencia total instalada de 102,26 mil MW no pa´ıs.

No passado, o parque hidrel´etrico chegou a representar 90% da capacidade instalada no Brasil. Esta redu¸c˜ao tem trˆes motivos: Primeiro, a necessidade da diversifica¸c˜ao da matriz el´etrica prevista no planejamento do setor el´etrico de forma a aumentar a seguran¸ca do abastecimento; segundo, a dificuldade em ofertar novos empreendimentos hidr´aulicos pela ausˆencia da oferta de estudos e invent´arios; terceiro, o aumento de entraves jur´ıdicos que protelam o licenciamento ambiental de usinas de fonte h´ıdrica e provocam o aumento constante da contrata¸c˜ao em leil˜oes de energia de usinas de fonte t´ermica, a maioria que queimam derivados de petr´oleo ou carv˜ao (ANEEL, 2008).

1.3

Previs˜

ao de Vaz˜

ao de Afluentes

A previs˜ao de vaz˜oes em tempo real consiste na utiliza¸c˜ao de modelos hidrol´ogicos para prever a vaz˜ao em tempos futuros. Esta previs˜ao pode ser utilizada ser utilizada como alertas hidrol´ogicos e para o planejamento da opera¸c˜ao de sistemas hidrel´etricos.

(13)

1.4 Proposta 12

O conhecimento antecipado de vaz˜ao de afluentes nos reservat´orios de gera¸c˜ao de energia el´etrica ´e fundamental para a opera¸c˜ao das comportas e para o planejamento da gera¸c˜ao de energia nas turbinas deste aproveitamento. Este conhecimento pode trazer benef´ıcios relacionados `a seguran¸ca da barragem, seguran¸ca das popula¸c˜oes ribeirinhas, redu¸c˜ao de alguns impactos ambientais e maior eficiˆencia na gera¸c˜ao de energia (WOOD et al., 2002).

Alguns pesquisadores tem feito previs˜oes usando diversas ferramentas em busca da melhor capacidade preditiva. Neto (2005) em sua pesquisa sobre previs˜ao de vaz˜ao de afluentes do rio S˜ao Francisco utilizou rede neurais de Elman (RNA) e obteve erro m´edio menor que 0,2% indicando que o uso das redes de Elman nesta previs˜ao foi adequado.

Santos (2015) em sua pesquisa sobre previs˜ao de vaz˜ao afluente m´edia mensal do rio Tocantins baseou-se nos modelos estoc´asticos do grupo SARIMA. Na ocasi˜ao, utilizou-se o modelo SARIM A(0, 0, 2) × (1, 2, 2) com coeficiente de Nasch-Sutclife (CNS) igual `a 0,91 com grande poder preditivo.

1.4

Proposta

Neste projeto ser´a utilizada a abordagen Singular Spectrum Analysis (SSA) para fil-trar s´eries de vaz˜ao de afluentes com base em dados mensais da vaz˜ao natural da Usina Hidrel´etrica de Itaip´u, no per´ıodo de 1931 a 2014, fornecidos pelo Operador Nacional do Sistema El´etrico (ONS). Na ocasi˜ao, ser´a utilizada a an´alise gr´afica dos autovetores em uma das fases SSA para obter s´eries filtradas e em seguida os modelos de Box & Jenkins e de Holt-Winters para modelar a s´erie original e a s´erie filtrada. Ao final, as s´eries mo-deladas ser˜ao testadas via estat´ısticas de aderˆencia para avaliar o seu poder preditivo. Na ocasi˜ao, ser˜ao utilizadas as medidas: MAPE (Mean Absolute Percentage Error), RMSE (Root Mean Squared Error), BIC (Bayesian Information Criterion) e R2 (Coeficiente de

Determina¸c˜ao). Para o estudo ser˜ao utilizados os softwares Forecast pro for Windows (FPW) para modelagem Holt-Winters e an´alise dos res´ıduos; CaterpillarSSA para fil-tragem SSA e an´alises gr´aficas; Microsoft Excel para organiza¸c˜ao gr´afica e estat´ısticas descritivas e GRETL para testes de normalidade e de estacionariedade e modelagem Box & Jenkins.

(14)

1.5 Estrutura 13

1.5

Estrutura

Este trabalho est´a organizado em cinco cap´ıtulos. No cap´ıtulo 1 est´a a introdu¸c˜ao com a contextualiza¸c˜ao do tema abordado. No cap´ıtulo 2 est˜ao os objetivos deste trabalho. Os materiais e m´etodos est˜ao no cap´ıtulo 3. No cap´ıtulo 4, est˜ao as an´alises dos resultados e no cap´ıtulo 5, est˜ao as principais conclus˜oes.

(15)

14

2

Objetivos

O objetivo principal deste trabalho ´e avaliar o ganho de preditivo de diversos modelos aplicados a s´erie de vaz˜ao de afluentes ap´os a filtragem SSA. Avaliar qual seria o melhor modelo em termos de ajustes para s´eries de vaz˜ao de afluentes dentre os modelos de Holt Winters e Box & Jenkins. Verificar o comportamento das s´eries de vaz˜ao de afluentes sob o efeito da filtragem. Implementar um modelo para ser utilizado no planejamento da opera¸c˜ao do sistema hidrel´etrico brasileiro.

(16)

15

3

Materiais e M´

etodos

3.1

Banco de Dados

Os dados utilizados para o estudo se referem `a Usina Hidrel´etrica de Itaip´u, que ´e uma usina hidrel´etrica binacional localizada no Rio Paran´a, na fronteira entre o Brasil e o Paraguai. O banco de dados escolhido ´e o relat´orio de atualiza¸c˜ao das s´eries de vaz˜oes m´edias mensais para o horizonte de 1931 a 2014 com 997 observa¸c˜oes. De forma geral, s˜ao apresentadas as vaz˜oes naturais mensais nos locais de aproveitamentos hidroel´etricos em opera¸c˜ao, em expans˜ao (considerados no planejamento hidroenerg´etico at´e 2020) e em outros locais de interesse ao SIN (Sistema Interligado Nacional).

As s´eries de vaz˜oes naturais mensais dos aproveitamentos da bacia do rio Paran´a foram obtidas no ˆambito do Projeto de Revis˜ao das S´eries de Vaz˜oes Naturais, coorde-nado pela ONS (Operador Nacional do Sistema El´etrico), que para este trabalho con-tou com o acompanhamento t´ecnico da Agˆencia Nacional de Energia El´etrica (ANEEL), da Agˆencia Nacional das ´Aguas (ANA), do Minist´erio das Minas e Energia (MME) e dos Agentes de Gera¸c˜ao respons´aveis pelos aproveitamentos das bacias hidrogr´aficas do Brasil. A vaz˜ao de afluentes ´e medida em m3/s. Os dados est˜ao dispon´ıveis em

http://www.ons.org.br/historico/index.aspx.

A figura 1 apresenta o gr´afico da s´erie m´edia mensal de vaz˜ao de afluentes da UHE de Itaip´u desde o ano de 1931 `a 2014.

A tabela 1 apresenta as principais estat´ısticas descritivas da s´erie utilizada. Nela, pode-se observar que as vaz˜oes tem grande variabilidade, o que indica instabilidade ao longo do tempo, justificando a necessidade de realizar boas previs˜oes.

(17)

3.2 Modelos de Holt-Winters 16 15000 20000 25000 30000 35000 Va zã o (m /s 2 ) 0 5000 10000 Va zã o (m /s 2 ) Tempo (meses)

Figura 1: Gr´afico de Vaz˜ao de Afluentes da UHE de Itaip´u Tabela 1: Estat´ısticas descritivas de vaz˜ao de afluentes do Rio Paran´a

Estat´ıstica Vaz˜ao de afluentes (m3/s)

M´aximo 31.630

M´ınimo 2.839

M´edia 10.301

Desvio Padr˜ao 4.776

3.2

Modelos de Holt-Winters

O m´etodo de Holt-Winters foi sugerido por Holt (1957) e Winters (1960), que traba-lharam no School of Industrial Administration em Carnegie Institute of Technology.

O m´etodo usa m´edias m´oveis ponderadas exponencialmente para atualizar as esti-mativas da m´edia ajustada sazonalmente (chamada de n´ıvel), inclina¸c˜ao e sazonalidade. Este modelo possui duas equa¸c˜oes de previs˜ao, a aditiva e a multiplicativa (Morettin e Toloi, 2004).

Segundo Lucio et al. (2010), este modelo possui duas equa¸c˜oes de previs˜ao: aditiva e multiplicativa. Os autores sugerem que o melhor crit´erio de escolha entre os fatores multiplicativos ou aditivos consiste em calcular medidas de precis˜ao, assim a op¸c˜ao recai

(18)

3.3 Modelos de Box & Jenkins 17

naquela que apresentar o(s) menor(es) erro(s). Outra poss´ıvel forma de indicar o modeloa ditivo est´a na presen¸ca de oscila¸c˜oes aproximadamente constantes na s´erie. Por´em, de acordo com Vasconcelos e Costa (2008), se as oscila¸c˜oes sazonais forem proporcionais ao n´ıvel da s´erie, o modelo multiplicativo ´e o mais indicado. A tabela 2 apresenta as equa¸c˜oes de atualiza¸c˜ao dos parˆametros dos modelos de Holt-Winters.

Tabela 2: Equa¸c˜oes B´asicas dos modelos de Holt-Winters Modelo Multiplicativo N´ıvel Lt= αSYt−2t + (1 − α) × (Lt−1+ Bt−1) Tendˆencia Bt= β(Lt− Lt−1) + (1 − β)Bt−1 Sazonalidade St = γLYtt + (1 − γ)St−2 Previs˜ao Ft+m = (Lt+ Bt+ m)St−2+m Modelo Aditivo N´ıvel Lt= α(Yt− St−2) + (1 − α) × (Lt−1+ Bt−1) Tendˆencia Bt= β(Lt− Lt−1) + (1 − β)Bt−1 Sazonalidade St= γ(Yt− Lt) + (1 − γ)St−2 Previs˜ao Ft+m = (Lt+ Bt+ m)St−2+m Onde : • S - Comprimento da sazonalidade; • Lt - N´ıvel da s´erie; • Bt - Tendˆencia • St - Componente sazonal;

• Ft+m - Previs˜ao m passos `a frente;

• Yt - Valor observado;

• α β γ - Parˆametros de amortecimento do n´ıvel, da tendˆencia e da sazonalidade, respec-tivamente.

3.3

Modelos de Box & Jenkins

Os modelos de Box & Jenkins, genericamente conhecidos por ARIM A (Auto Re-gressive Integrated Moving Averages) e na literatura em portuguˆes por Auto-regressivos Integrados de M´edias M´oveis, s˜ao modelos matem´aticos que visam captar o comporta-mento da correla¸c˜ao seriada ou autocorrela¸c˜ao entre os valores da s´erie temporal, e com

(19)

3.3 Modelos de Box & Jenkins 18

base nesse comportamento realizar previs˜oes futuras. Se essa estrutura de correla¸c˜ao for bem modelada, fornecer´a boas previs˜oes. Segundo Fava (2000), os modelos ARIM A resultam da combina¸c˜ao de trˆes componentes denominadas “filtros”: a componente au-torregressiva (AR), o filtro de integra¸c˜ao (I) e a componente de m´edias m´oveis (M A). Uma s´erie temporal pode ser modelada pelos trˆes filtros ou apenas um subconjunto deles. Para a modelagem de Box & Jenkins ´e necess´ario que a s´erie satisfa¸ca duas propriedades:

1. Estacionaridade: Conserva m´edia e variˆancia constantes ao longo do tempo. O teste de raiz unit´aria de Dickey-Fuller ´e utilizado para verificar a estacionaridade, onde a hip´otese nula ´e possuir raiz unit´aria. Deseja-se que o teste traga um p-valor menor que o n´ıvel de significˆancia que, em geral, ´e 0,05 para que a hip´otese nula seja rejeitada. Caso isso n˜ao aconte¸ca, procede-se com sucessivas diferen¸cas at´e obter a s´erie estacion´aria.

2. Normalidade: Deseja-se que a s´erie tenha distribui¸c˜ao normal com m´edia µ e variˆancia σ2. O teste de Kolmogorov-Smirnov ´e um dos testes utilizados, cuja hip´otese nula ´

e a de normalidade. Deseja-se que o p-valor encontrado seja maior que 0,05 para n˜ao rejeitarmos a hip´otese nula, caso contr´ario procede-se com transforma¸c˜oes lo-gar´ıtimicas na s´erie at´e que a s´erie tenha distribui¸c˜ao normal.

3.3.1

Modelo autorregressivo (AR)

Dizemos que Zt, t  Z ´e um processo autorregressivo de ordem p e escrevemos Zt ∼

AR(p) se podemos escrever o processo na seguinte forma: Zt= φ1Zt−1+· · ·+φpZt−p+at,

onde φ1, . . . , φp s˜ao parˆametros reais e at ´e componente aleat´oria i.i.d. com E(at) =

0 e V ar(at) = σ2.

3.3.2

Modelo de m´

edias m´

oveis (M A)

Considere um processo linear Zt, tZ, dizemos que este processo ´e de m´edias m´oveis

de ordem q, denotado por M A(q), se satisfizer a equa¸c˜ao de diferen¸cas

Zt = at− θ1at−1− · · · − θqat−q, (3.1)

(20)

3.3 Modelos de Box & Jenkins 19

3.3.3

Modelo Autorregressivo e de M´

edias M´

oveis (ARM A)

O modelo autorregressivo e de m´edias m´oveis ´e a jun¸c˜ao dos modelos AR(p) e M A(q). Denota-se por ARM A(p, q) um processo autorregressivo e de m´edias m´oveis de ordem (p, q) e pode ser representado em 3.2 .

Zt= φ1Zt−1+ φ2Zt−2+ . . . + φpZt−p+ at− θ1at−1+ θ2at−2+ . . . + θqat−q (3.2)

Usando o operador de defasagem B, tem-se em 3.3 .

(1 − φ1B − φ2B2− . . . − φpBp)zt= (1 − θ1B − θ2B2− . . . − θpBq)at (3.3)

3.3.4

O modelo ARIM A

O modelo ARIM A considera a tendˆencia da s´erie temporal e a n˜ao est´acionaridade, j´a que os modelos anteriores: AR, M A e ARM A s˜ao modelos para s´eries estacion´arias. O modelo ARIM A tem ordem (p, d, q) e pode ser representado por 3.4

φ(B)(1 − B)dZt= θ(B)at (3.4)

Sendo : φ(B) = 1 − φ1B − φ2B2− · · · − φpBp o polinˆomio (ou operador) autoregressivo

de ordem p; θ(B) = 1 − θ1B − θ2B2 − · · · − θqBq o polinˆomio (ou operador) de m´edias

m´oveis de ordem q, B o operador de retardado, tal que BjZt = Zt−j d ´e o n´umero de

diferen¸cas necess´arias para retirar a tendˆencia da s´erie Zte transform´a-la em estacion´aria

e at ´e a componente aleat´oria com distribui¸c˜ao normal i.i.d com m´edia zero e variˆancia

constante.

3.3.5

Modelagem SARIM A

Um dos modelos mais utilizados que consideram a sazonalidade de uma determinada serie temporal, ´e o modelo chamado ARIM A sazonal, ou SARIM A (Morettin e Toloi, 2004). Estes modelos s˜ao importantes por levarem em considerac˜ao a sazonalidade es-toc´astica dos dados. Quando o per´ıodo s = 12, o modelo denominado SARIM A de ordem (p, d, q) × (P, D, Q)12, ´e dado por 3.5

(21)

3.3 Modelos de Box & Jenkins 20

φ(B)Φ(B12)(1 − B)d(1 − B)D12Zt= θ(B)Θ(B)at, (3.5)

em que φ(B) ´e o operador autoregressivo (AR) de ordem p, θ(B) ´e o operador de m´edias m´oveis (M A) de ordem q, Φ(B) ´e o operador AR-sazonal de ordem P , Θ(B) ´e o operador M A-sazonal de ordem Q, (1 − B) ´e o operador de diferen¸ca, (1 − B)12 ´e o operador de

diferen¸ca sazonal e at´e um ru´ıdo branco.

3.3.6

Fun¸

ao de Auto Correla¸

ao (FAC) e Fun¸

ao de Auto

Cor-rela¸

ao Parcial (FACP)

A fun¸c˜ao de autocorrela¸c˜ao mede o grau de correla¸c˜ao de uma vari´avel, em um dado instante, consigo mesma, em um instante de tempo posterior ou anterior. Ela permite que se analise o grau de irregularidade de um sinal.

A an´alise da FAC e da FACP ´e de fundamental importˆancia para o procedimento de previs˜ao de s´eries temporais, pois ´e com ela que se identificam as ordens p e q de um modelo ARM A.

A FAC ´e a raz˜ao entre a autocovariˆancia e a variˆancia para um conjunto de dados, As equa¸c˜oes (3.6) e (3.7) apresentam a fun¸c˜ao de autocovariˆancia e a fun¸c˜ao de autocor-rela¸c˜ao (FAC) respectivamente de uma dada s´erie temporal.

γk = T −k X t=1 1 T − k(Zt− µ)(Zt+k− µ) (3.6) F AC = (ρk) = γk γ0 (3.7) (3.8)

Os modelos AR(p), M A(q) e ARM A(p, q) apresentam FAC com caracter´ısticas espe-ciais:

1. um processo AR(p) tem FAC infinita em extens˜ao que decai de acordo com expo-nenciais e/ou senoides amortecidas;

2. um processo M A(q) tem FAC finita, no sentido que ela apresenta um corte ap´os a defasagem q;

(22)

3.4 Diagn´ostico do modelo 21

3. um processo ARM A(p, q) tem FACP infinita que decai de acordo com exponencias e/ou senoides amortecidas ap´os a defasagem (q − p).

A FACP corresponde a correla¸c˜ao entre Zt e Zt−k e removendo o efeito das

ob-serva¸c˜oes Zt−1, Zt−2, . . . , Zt−k+1 e ´e denotada por φkk , ou seja

φkk = Corr(Zt, Zt−k/Zt−1, Zt−2, . . . , Zt−k+1).

A utiliza¸c˜ao das equa¸c˜oes de Yule-Walker ´e uma forma de obten¸c˜ao da FACP para pro-cessos autorregressivos estacion´arios.

          1 ρ1 ρ2 . . . ρp−1 ρ1 1 ρ1 . . . ρp−2 ρ2 ρ1 1 . . . ρp−3 .. . ... ... . .. ... ρp1 ρp−2 ρp−3 . . . 1                     φ1 φ2 φ3 .. . φp           =           ρ1 ρ2 ρ3 .. . ρp          

A equa¸c˜ao acima mostra as propriedades te´oricas das func˜oes de autocorrelac˜ao e autocorrela¸c˜ao parcial para alguns processos estacion´arios como auxiliar na identificac˜ao do modelo. A tabela 3 mostra as propriedades te´oricas da FAC e da FACP.

Tabela 3: Propriedades te´oricas da FAC e FACP

Processo FAC FACP

S´erie aleat´oria 0 0

AR(1), α > 0 decaimento exponencial 0, k > 1

M A(1) 0, k > 1 decaimento oscilat´orio ARM A(p, q) decaimento a partir de q decaimento a partir de p

3.4

Diagn´

ostico do modelo

Existem algumas maneiras para chegar `a uma conclus˜ao de qual ´e o melhor modelo para estimar a s´erie temporal escolhida. Usaremos as estat´ısticas de aderˆencia e a an´alise sobre os res´ıduos.

(23)

3.4 Diagn´ostico do modelo 22

3.4.1

Estat´ısticas de Aderˆ

encia

Para se escolher entre um m´etodo de previs˜ao ou outro ´e importante utilizar uma medida de erro com a finalidade de se encontrar aquele m´etodo que seja mais acurado. O erros a serem considerados como estat´ısticas de aderˆencia ser˜ao: RMSE (Root Mean Squared Error) ou a Raiz quadrada da Erro Quadr´atico M´edio; MAPE (Mean Absolute Percentage Error) ou Erro M´edio Percentual Absoluto. Os c´alculos de medidas de erro podem ser visualizados nas equa¸c˜oes abaixo:

RM SE = v u u t N X t=1 (Zt− bZt)2 N (3.9)

onde N ´e o n´umero de padr˜oes, Zt representa o valor observado no instante t, bZt

representa o valor ajustado no instante t.

M AP E = N X t=1 (Zt− bZt) Zt N × 100 (3.10)

onde N ´e o n´umero de padr˜oes, Zt representa o valor observado no instante t, bZt

representa o valor ajustado no instante t.

BIC (Crit´erio de Informa¸c˜ao Bayesiano - Bayesian Information Criterion)

BIC = −2 log Lp+ [(p + 1) + 1] log n (3.11)

O BIC aumenta conforme o SQE (Soma dos Quadrados dos Erros) aumenta. Al´em disso, o BIC penaliza modelos om muitas vari´aveis, quanto menor o valor de BIC, melhor.

SQE =

N

X

t=1

(Zt− bZt)2 (3.12)

(24)

3.5 Filtragem SSA 23

a melhor escolha ´e balancear o ajuste com a quantidade de vari´aveis.

O coeficiente de determina¸c˜ao, tamb´em chamado de R2, ´e uma medida de ajustamento de um modelo estat´ıstico. O R2 varia entre 0 e 1, indicando, em percentagem, o quanto

o modelo consegue explicar os valores observados. Quanto maior o R2, mais explicativo ´e

modelo, melhor ele se ajusta `a amostra.

R2 = 1 − PT t=1(Zt− ˆZt)2 PT t=1(Zt− ¯Z)2 ! (3.13)

3.4.2

An´

alise dos Res´ıduos

Ap´os um modelo ter sido ajustado a uma s´erie temporal deve-se verificar se ele fornece uma descri¸c˜ao adequada dos dados. Assim como em outros modelos estat´ısticos a id´eia ´e verificar o comportamento dos res´ıduos. ´E particularmente importante que os res´ıduos de um modelo estimado sejam serialmente n˜ao correlacionados. A evidˆencia de correla¸c˜ao serial nos res´ıduos ´e uma indica¸c˜ao de que uma ou mais caracter´ısticas da s´erie n˜ao foi adequadamente descrita pelo modelo. Consequentemente, duas maneiras ´obvias de verificar a adequa¸c˜ao do modelo consistem em representar graficamente os res´ıduos e o seu correlograma. O grafico temporal poder´a revelar a presen¸ca de dados discrepantes, efeitos de autocorrela¸c˜ao ou padr˜oes c´ıclicos enquanto que o correlograma permite uma an´alise mais detalhada da estrutura de autocorrela¸c˜ao indicando poss´ıveis termos faltantes no modelo.

3.5

Filtragem SSA

Singular Spectrum Analysis (SSA) ´e uma t´ecnica n˜ao param´etrica que permite de-compor uma s´erie temporal em sinal e ru´ıdo. E uma t´´ ecnica ´util para filtrar dados de s´eries temporais. Menezes et al. (2014) utilizaram trˆes metodologias na abordagem SSA: An´alise de componentes principais (ACP), ACP associado com An´alise de Cluster e An´alise Gr´afica dos Vetores Singulares. Em seu artigo ´e mostrado que o melhor m´etodo em SSA ´e a An´alise Gr´afica dos vetores singulares, que ser´a usado neste projeto. SSA ´e um m´etodo recente e poderoso em s´eries temporais que incorpora elementos de an´alise cl´assica de s´eries temporais, estat´ıstica multivariada, geometria multivariada, sistemas dinˆamicos e processamentos de sinais (Elsner, 1996). SSA tem sido aplicada com su-cesso em diversas ´areas: na matem´atica e f´ısica a economia e matem´atica financeira, na

(25)

3.5 Filtragem SSA 24

meteorologia e oceanografia a ciˆencias sociais (GOLYANDINA et al., 2001).

O m´etodo SSA ´e um procedimento que pode ser utilizado, dentre outras aplica¸c˜oes, na remo¸c˜ao de ru´ıdo e de s´eries temporais (Golyandina et al., 2001; Hassani et al., 2012). A vers˜ao b´asica do m´etodo SSA pode ser dividida em duas etapas: decomposi¸c˜ao e re-constru¸c˜ao.

3.5.1

Decomposi¸

ao

Segundo Menezes et al. (2014), a etapa de decomposi¸c˜ao pode ser subdividida em duas partes: Incorpora¸c˜ao e decomposi¸c˜ao em valores singulares (SVD – Singular Value Decomposition).

Seja Yt = [y1, . . . yT]1×T uma s´erie temporal e considere L tal que 2 ≤ L ≤ T de modo

que L ´e um parˆametro a ser estimado e ´e chamado de comprimento da janela (Golyandina et al., 2001). Entende-se por Incorpora¸c˜ao o procedimento no qual uma s´erie temporal YT ´e levada a uma matriz X chamada “Matriz Trajet´oria” dada por (3.14).

X =        y1 y2 y3 . . . yk y2 y3 y4 . . . yk+1 .. . ... ... . .. ... yL yL+1 yL+2 . . . yT        (3.14)

A matriz X ´e uma matriz Hankel, ou seja, os elementos de xi,j tal que i+j = constante

s˜ao iguais.

Considere S = XX0. Os autovalores de S dispostos em ordem de significˆancia λ1 ≥ · · · ≥ λL ≥ 0 s˜ao obtidos e os respectivos autovalores U1, . . . , UL s˜ao encontrados.

Considere V0 = (X0UL)/

λ, como S ´e positivo semi-definido, ent˜ao a matriz trajet´oria X pode ser expressa pela decomposi¸c˜ao em valores singulares (SVD) apresentada em (3.15):

X = E1+ E2+ · · · + EL, (3.15)

onde El =

λUlVl0, para todo l = 1, . . . , L. A cole¸c˜ao (

λl, Ul, Vl) ´e conhecida como

auto-tripla da expans˜ao SVD de X. Os elementos da autotripla s˜ao definidos respectivamente por: valor singular, vetor singular `a esquerda e vetor singular `a direita de X (Menezes et al., 2014). A contribui¸c˜ao de cada componente em (3.15) pode ser mensurada pela raz˜ao de autovalores λl/

PL

(26)

3.5 Filtragem SSA 25

3.5.2

Reconstru¸

ao

Segundo Menezes et al. (2014), a etapa de reconstru¸c˜ao est´a subdividida em duas partes: agrupamento e m´edia diagonal. A etapa de agrupamento consiste no procedimento de agrupar algumas sequˆencias de matrizes elementares resultantes da decomposi¸c˜ao SVD em grupos disjuntos e, ap´os isso, som´a-las, gerando novas matrizes elementares.

Considere a sequencia PL

l=1El de matrizes elementares da expans˜ao de SVD. Agrupe

as mesmas em m grupos disjuntos utilizando algum m´etodo, por exemplo, por meio de an´alise de componentes principais, an´alise gr´afica de vetores singulares ou agrupamento hier´arquico e assumir que o conjunto de ´ındices gerado ´e dado por {I1, . . . , Im}, de modo

que a expans˜ao (3.15) pode ser reescrita como em (3.16), sendo XIiarbitr´aria tal queXIi =

Ppi j=1XIij (Menezes et al., 2014). X = L X l=1 El = m X i=1 XIi (3.16)

O objetivo do agrupamento ´e diminuir o n´umero de componentes na expans˜ao da matriz trajet´oria X. A contribui¸c˜ao de cada componente ´e mensurada pela raz˜ao (3.17) (MENEZES et al., 2014). Ppi j=1λIij PL l=1λl . (3.17)

Considere a matriz trajet´oria X e assuma que L∗ = min(L, K) e K∗ = max(L, K). Considere x(i)l,k um elemento na linha l e coluna k na matriz XIi. O elemento y

(i) t da

componente hyt(i)i

1×T da s´erie temporal [yt]1×T ´e calculado por meio da m´edia diagonal

da matriz elementar XIi definida em (3.18), a partir da matriz elementar XIi.

yt(i)=                  t P l=1 x(i)l,t−l+1 t , se 1 ≤ t < L ∗ L∗ P l=1 x(i)l,t−l+1 L∗ , se L∗ ≤ t < K∗ T −K∗+1 P l=t−K∗+1 x(i)l,t−l+1 T −K∗+1 , se K∗ ≤ t ≤ T (3.18)

Cada componente hyt(i)i

1×T concentra parte da energia da s´erie temporal original

[yt]1×T que pode ser mensurada pela raz˜ao de autovalores pi P j=1 λIij/ d P l=1 λl. De acordo com

(27)

3.6 An´alise Gr´afica dos Autovetores 26

Hassani et al. (2012), podemos classificar as componentes SSA hyt(i)i

1×T

de uma s´erie temporal arbitr´aria [yt]1×T em trˆes categorais: tendˆencia, componentes harmˆonicas (ciclo

e sazonalidade) e ru´ıdo (GOLYANDINA et al., 2001).

Um dos principais conceitos estudados em SSA ´e a propriedade de separabilidade (Hassani et al., 2012). Tal propriedade caracteriza qu˜ao bem separados est˜ao as diferen-tes, componendiferen-tes, umas das outras. Uma boa medida de separabilidade ´e a Correla¸c˜ao Ponderada. Por correla¸c˜ao ponderada weighted correlation ou w-correla¸c˜ao, podemos en-tender como uma fun¸c˜ao que quantifica a dependˆencia linear entre duas componentes SSA YT(1) e YT(2) definida em (3.19) (MENZES et al., 2014).

ρ(w)ij = 

YT(i), YT(j)

w

||YT(i)||w||Y (j) T ||w

. (3.19)

onde ||YT(i)||w =

r  YT(i), YT(i) w ; ||YT(j)||w = r  YT(j), YT(j) w ;YT(i), YT(j) w = T P k=1 wky (i) k y (j) k e wk= min{k, L, T − k}.

Atrav´es da separabilidade, pode-se verificar estatisticamente se duas componentes SSA est˜ao bem separadas, em termos de dependˆencia linear. Segundo Hassani et al. (2012), o valor absoluto da w-correla¸c˜ao ´e pequeno, ent˜ao as componentes SSA corres-pondentes s˜ao classificadas como w-ortogonais (ou quase w-ortogonais); caso contr´ario, s˜ao ditas mal separadas. Salienta-se que comumente utiliza-se a correla¸c˜ao ponderada na fase de agrupamento SSA (GOLYANDINA et al., 2001).

3.6

An´

alise Gr´

afica dos Autovetores

A an´alise das coordenadas da s´erie temporal na base definida pelos vetores singulares resultantes da SVD permite identificar as componentes de tendˆencia e da sazonalidade da s´erie. O problema geral aqui consiste em identificar e separar as componentes oscilat´orias das componentes que fazem parte da tendˆencia. De acordo com Golyandina et al. (2001) a an´alise gr´afica de tais coordenadas aos pares permite identificar por meio visual as componentes harmˆonicas da s´erie.

As coordenadas da s´erie temporal em duas componentes ortogonais podem ser dispos-tas em um diagrama de dispers˜ao. Considere um harmˆonico puro com frequˆencia igual a ω , fase igual a δ , amplitude igual a ξ e per´ıodo ρ = 1/ω definido como um divisor do tamanho da janela L e K. Se o parˆametro ρ assume um valor inteiro, ent˜ao ρ ´e classificado

(28)

3.7 Resumo da Metodologia 27

como per´ıodo do harmˆonico. Por exemplo, as fun¸c˜oes seno e o cosseno com frequˆencias, amplitudes e fases iguais resultam em um diagrama de dispers˜ao que exibe um padr˜ao circular. Por sua vez, se ρ=1/ω ´e um inteiro, ent˜ao o diagrama de dispers˜ao exibe um pol´ıgono regular com ρ v´ertices. Para uma frequˆencia ω=m/n<0.5 com m e n inteiros e primos, os pontos s˜ao v´ertices de um pol´ıgono regular de n v´ertices (GOLYANDINA et al., 2001). Dessa forma, a identifica¸c˜ao dos componentes que s˜ao gerados por um harmˆonico ´e reduzida `a an´alise pict´orica do padr˜ao determinado nos diferentes pares de componentes.

3.7

Resumo da Metodologia

Uma s´erie de vaz˜ao de afluentes ser´a modelada via BJ (Box & Jenkins) e HW (Holt-Winters). Essa mesma s´erie tamb´em passar´a pela filtragem SSA, onde uma s´erie aproxi-mada ser´a obtida e tamb´em ser´a modelada por BJ (Box & Jenkins) e HW (Holt-Winters)). Ap´os isso, ser´a escolhido o melhor modelo e seus parˆametros atrav´es das estat´ısticas de aderˆencia: MAPE (Mean Absolute Percentage Error ), MAD (Mean Absolute Deviation), RMSE (Root Mean Squared Error ), BIC (Bayesian InformationCriterion) e R2 (Coefici-ente de Determina¸c˜ao). Ao todo ser˜ao comparados oito modelos, e o modelo que melhor se adequa aos dados, possuindo assim a melhor poder preditivo, ser´a aquele que apresen-tar a menor estat´ısticade aderˆencia, exceto o R2. Os softwares utilizados para o estudo

ser˜ao: FPW (Forecast Pro for Windows) e Gretl para fazer a modelagem Holt-Winters e Box & Jenkins e CaterpillarSSA para abordagem SSA. Os resultados obtidos atrav´es dos experimentos computacionais realizados ser˜ao comparados em termos das estat´ısticas de aderˆencia. A figura 2 apresenta o fluxograma proposto neste trabalho.

(29)

3.7 Resumo da Metodologia 28

(30)

29

4

An´

alise dos Resultados

Inicialmente, a s´erie original de m´edias mensais de vaz˜ao de afluentes do Rio Paran´a que abastece a UHE de Itaip´u foi submetida a an´alise de s´eries temporais, sendo modelada por cinco modelos da classe de Amortecimento Exponencial de Holt-Winters e por trˆes modelos da classe de modelos ARIMA de Box & Jenkins. Os modelos e as estat´ısticas de aderˆencia s˜ao apresentados nas se¸c˜oes 4.1 e 4.2.

4.1

Modelagem por Holt-Winters Sem Filtragem SSA

O primeiro m´etodo utilizado foi o de Holt-Winters. A Tabela 4 traz as estat´ısticas de aderˆencia para cada modalidade de Holt-Winters estudada. Com tendˆencia, sem tendˆencia, com sasonalidade multiplicativa, aditiva e as combina¸c˜oes plaus´ıveis para es-colher o melhor modelo em termos de ajustes. Na ocasi˜ao, HW-1 ´e o modelo de Holt-Winters sem tendˆencia e sazonalidade multiplicativa, HW-2 ´e o modelo de Holt-Winters com tendˆencia e sazonalidade aditiva, HW-3 ´e o modelo de Holt-Winters com tendˆencia e sazonalidade multiplicativa, HW-4 ´e o modelo de Holt-Winters com tendˆencia amortecida e sazonalidade aditiviva e HW-5 ´e o modelo de Holt-Winters com tendˆencia amortecida e sazonalidade multiplicativa.

Tabela 4: Estat´ısticas de Aderˆencia dos Modelos

M´etodo MAPE RMSE BIC R2

HW-1 0.1810 2614 2632 0.7019 HW-2 0.1946 2634 2662 0.6972 HW-3 0.1812 2615 2642 0.7018 HW-4 0.1945 2632 2668 0.6978 HW-5 0.1809 2614 2650 0.7019

A partir dos resultados da tabela 4, verifica-se que o modelo HW-1 (Holt-Winters sem tendˆencia e com sazonalidade multiplicativa) apresenta menores valores para MAPE, RMSE e BIC e maior R2, sendo este o modelo mais adequado dentre os avaliados.

(31)

4.2 Modelagem por Box & Jenkins Sem Filtragem SSA 30

4.2

Modelagem por Box & Jenkins Sem Filtragem

SSA

Para obter as modelagens por Box & Jenkins primeiramente deve-se analisar algumas hip´oteses b´asicas para a utiliza¸c˜ao do modelo.

4.2.1

Teste de Normalidade

Utiliza-se o teste de Kolmogorov-Smirnov para verificar a normalidade dos dados, neste teste foi gerado um p-valor de 1.35916e-020, tendo hip´otese nula como norma-lidade, temos a evidˆencia para rejeita-la, logo o banco de dados n˜ao ´e normal, sendo necess´aria uma transforma¸c˜ao logar´ıtimica.

4.2.2

Teste de Raiz Unit´

aria

Para verificar a estacionaridade dos dados utiliza-se o teste de Dickey-Fuller. O p-valor gerado no teste foi de 1.013e-005, que mostra que deve-se a rejeitar a hip´otese nula de raiz unit´aria, logo, indicando que a s´erie ´e estacion´aria.

4.2.3

An´

alise do Correlograma

Analisando a FAC (fun¸cao de autocorrela¸c˜ao) ´e poss´ıvel notar que a s´erie n˜ao ´e esta-cion´aria sazonalmente. Uma vez que tem uma decaimento lento de lag (defasagem) 12, mostrado na figura 3, implicando na necessidade de ser feita uma diferen¸ca sazonal. J´a na parte simples n˜ao h´a necessidade de fazermos essa diferen¸ca uma vez que o teste de Dickey-Fuller rejeitou a hipotese de raiz unit´aria.

(32)

4.2 Modelagem por Box & Jenkins Sem Filtragem SSA 31

Figura 3: Fun¸c˜ao de Autocorrela¸c˜ao

Analisando a parte simples nota-se que na FAC, um decaimento exponencial nos lags iniciais. Na FACP apresenta-se uma forte significˆancia no primeiro lag, sugerindo um modelo AR(1).

A figura 4 apresenta a FAC e a FACP da s´erie ap´os uma diferen¸ca sazonal.

(33)

4.3 Filtragem SSA 32

De acordo com a figura 4 da FAC e FACP respectivamente ap´os a primeira diferen¸ca sazonal, h´a uma maior significˆancia no lag 12 da FAC, e pela FACP um comportamento de decaimento exponencial de 12 em 12 meses. Este comportamento ´e tipico de um modelo MA(1) sazonal, logo o modelo SARIM A(1, 0, 0) × (0, 1, 1)12 mostra-se o mais indicado.

4.2.4

Estat´ısticas de Aderˆ

encia para os Modelos de Box &

Jen-kins

O modelo gerado pelo modo especialista do FPW sugere SARIM A(1, 0, 0)×(2, 0, 1)12,

por´em o mesmo indica pouca significˆancia no estimador do parametro A[24] sugerindo a retirada do mesmo, indicando um novo modelo SARIM A(1, 0, 0) × (1, 0, 1)12.

Ap´os todas as hip´oteses para o uso do modelo serem satisfeitas, podem ser feitas as modelagens necess´arias para comparar as estat´ısticas de aderˆencia como feito anterior-mente com os modelos de Holt-Winters.

A tabela 5 mostra as estat´ısticas de aderˆencia. Na ocasi˜ao, BJ-1 ´e o modelo SARIM A(1, 0, 0)× (2, 0, 1)12, BJ-2 ´e o modelo SARIM A(1, 0, 0)×(0, 1, 1)12e BJ-3 ´e o modelo SARIM A(1, 0, 0)×

(1, 0, 1)12.

Tabela 5: Estat´ısticas de Aderˆencia dos Modelos

M´etodo MAPE RMSE BIC R2

BJ-1 0.1669 2456 2016 0.7837 BJ-2 0.1645 2439 2001 0.7838 BJ-3 0.1671 2455 2009 0.7835

Atrav´es das estat´ısticas de aderˆencia da tabela 5, pode-se concluir que o melhor modelo em termos de ajustes dentre os Box & Jenkins testados ´e o SARIM A(1, 0, 0) × (0, 1, 1)12

pois possui os menores e erros (MAPE, RMSE e BIC) e maior qualidade preditiva anali-sada pelo maior R2.

O modelo SARIM A(1, 0, 0) × (0, 1, 1)12 ser´a avaliado contra o melhor modelo

encon-trado ap´os a filtragem SSA.

4.3

Filtragem SSA

Para a utiliza¸c˜ao da filtragem SSA, ´e necess´ario escolher o comprimento de janela (L). Segundo Golyandina et al. (2001) o valor ideal para o comprimento de janela ´e L = T /2.

(34)

4.3 Filtragem SSA 33

Com isso, o valor obtido ´e de L = 499. A figura 5 apresenta os 9 primeiros autovetores na decomposi¸c˜ao SSA. 170000 190000 210000 230000 250000 270000 1 22 43 64 85 1 0 6 1 2 7 1 4 8 1 6 9 1 9 0 2 1 1 2 3 2 2 5 3 2 7 4 2 9 5 3 1 6 3 3 7 3 5 8 3 7 9 4 0 0 4 2 1 4 4 2 4 6 3 4 8 4 1(83.818%) -100000 -80000 -60000 -40000 -20000 0 20000 40000 60000 80000 100000 2(3.861%) -100000 -50000 0 50000 100000 3(3.846%) -50000 -40000 -30000 -20000 -10000 0 10000 20000 30000 40000 4(0.370%) -40000 -30000 -20000 -10000 0 10000 20000 30000 5(0.341%) -40000 -30000 -20000 -10000 0 10000 20000 30000 40000 6(0.336%) -30000 -20000 -10000 0 10000 20000 30000 7(0.261%) -40000 -30000 -20000 -10000 0 10000 20000 30000 40000 8(0.260%) -25000 -20000 -15000 -10000 -5000 0 5000 10000 15000 20000 9(0.217%)

Figura 5: Autovetores na Decomposi¸c˜ao SSA

De acordo com a an´alise gr´afica dos autovetores, pode-se fazer o agrupamento das componentes em: Tendˆencia, harmˆonica e ru´ıdo.

De acordo com a figura 5, o autovetor 1 (83.818%) tem o comportamento de tendˆencia e os autovetores 2 e 3 tem um prov´avel comportamento harmˆonico. Para uma an´alise mais refinada, procura-se fazer o estudo do diagrama de dispers˜ao onde as componentes harmˆonicas apresentam um formato pol´ıgono regular.

(35)

4.3 Filtragem SSA 34

Na figura 6 pode-se ver que o pares de autovetores 1-2 como uma mistura de compor-tamento de tendˆencia com harmˆonica, 5-6 com comportamento de tendˆencia, 2-3 e 9-10 apresentam comportamento harmˆonico, enquanto os pares 157-158 e 224-225 apresentam um comportamento ruidoso.

Gráfico de Dispersão dos Autovetores 2-3

-100000 -80000 -60000 -40000 -20000 0 20000 40000 60000 80000 100000

Gráfico de Dispersão Autovetores 1-2 Gráfico de Dispersão Autovetores 9-10

Gráfico de Dispersão Autovetores 5-6 Gráfico de Dispersão Autovetores 157-158 Gráfico de Dispersão Autovetores 224-225

(36)

4.3 Filtragem SSA 35

Ap´os a an´alise gr´afica de todos autovetores, obtem-se o agrupamento das componen-tes. A tabela 6 apresenta o resultado obtido.

Tabela 6: Agrupamento das Componentes Tendˆencia Harmˆonica ru´ıdo 1, 4 - 8, 11 - 15 2 - 3, 9 - 10 20 - 21 22 - 23, 26 - 28 16 - 19, 24 - 25, 29 - 33 34 - 499

J´a a tabela 7 apresenta a correla¸c˜ao ponderada que mostra o qual bem separados est˜ao os grupos, justamente por apresentarem correla¸c˜oes baixas entre eles.

Tabela 7: Correla¸c˜ao Ponderada Entre Agrupamentos Tend. Harm. Ru´ıdo

Tend. 1 0,003 0,007

Harm. 0,003 1 0,040

Ru´ıdo 0,007 0,040 1

A figura 7 mostra os gr´aficos das componentes da s´erie em tendˆencia, harmˆonica e ru´ıdo obtidas na fase de agrupamento SSA.

5000 7000 9000 11000 13000 15000 17000 19000 0 100 200 300 400 500 600 700 800 900 1000 Tendência -6300 -4300 -2300 -300 1700 3700 5700 7700 Harmônica -6000 -4000 -2000 0 2000 4000 6000 8000 10000 12000 Ruidosa

Figura 7: Gr´aficos das Componentes da S´erie

Na reconstru¸c˜ao para a s´erie filtrada exclui-se a componente ruidosa e reconstr´oi-se a s´erie utilizando apenas as componetes tendˆencia e harmˆonica.

(37)

4.3 Filtragem SSA 36 20000 25000 30000 35000 va zã o ( m 3 /s ) 5000 10000 15000 20000 va zã o ( m 3 /s ) 0 Tempo (meses)

Original Filtrada SSA

Figura 8: S´erie Origianl e S´erie Filtrada via SSA

4.3.1

An´

alise de S´

eries Temporais Com Filtragem SSA

Ap´os a filtragem SSA, foram feitas as modelagens tal qual foram feitas sem essa ferramenta com o prop´osito deverificar se h´a uma melhora relevante nos resultados obtidos nos modelos.

4.3.2

Modelagem de Holt-Winters Com Filtragem SSA

Primeiramente foram testados os modelos de Holt-Winters com SSA baseado nas mesmas caracteristicas dos modelos sem SSA.

A Tabela 8 traz as estat´ısticas de aderˆencia para cada modalidade de Holt-Winters que foi utilizada. Com tendˆencia, sem tendˆencia, com sasonalidade multiplicativa, aditiva e as combina¸c˜oes plaus´ıveis para analisar de fato qual ´e a mais eficiente em termos de ajuste do modelo. Na ocasi˜ao, HW-1-SSA ´e o modelo de Holt-Winters sem tendˆencia e sazonalidade multiplicativa com a filtragem SSA, HW-2-SSA ´e o modelo de Holt-Winters com tendˆencia e sazonalidade aditiva com a filtraegm SSA, HW-3-SSA ´e o modelo de Holt-Winters com tendˆencia e sazonalidade multiplicativa com filtragem SSA, HW-4-SSA ´e o modelo de Holt-Winters com tendˆencia amortecida e sazonalidade aditiviva com filtragem SSA e HW-5-SSA ´e o modelo de Holt-Winters com tendˆencia amortecida e sazonalidade multiplicativa com filtragem SSA.

(38)

4.3 Filtragem SSA 37

Tabela 8: Estat´ısticas de Aderˆencia dos Modelos Ap´os Filtragem SSA

M´etodo MAPE RMSE BIC R2

HW-1-SSA 0.07682 959.6 966.2 0.9480 HW-2-SSA 0.07428 883.5 892.7 0.9559 HW-3-SSA 0.07701 964.9 974.9 0.9474 HW-4-SSA 0.07427 883.3 895.6 0.9559 HW-5-SSA 0.07678 959.4 972.8 0.9480

tendˆencia e sazonalidade aditiva ´e o que apresenta melhor ajuste. Mesmo apresentando MAPE e RMSE sensivelmente maiores que o modelo HW-4, o BIC, que ´e uma medida convencionalmente mais forte, ´e menor. O R2 dos dois modelos ´e o mesmo.

A tabela 9 mostra as estat´ısticas de aderˆencia do melhor modelo em termos de ajustes da classe de Holt-Winters sem a filtragem SSA e o melhor modelo com a filtragem.

Tabela 9: Estat´ısticas de Aderˆencia dos Melhores Modelos com e sem Filtragem SSA

M´etodo MAPE RMSE BIC R2

HW-1 0.18100 2614.0 2632.0 0.7019 HW-2-SSA 0.07428 883.5 892.7 0.9559

Percebe-se uma grande melhora entre o melhor modelo sem filtragem e o melhor modelo com filtragem, melhorando todas as estat´ısticas de aderˆencia. Com isso mostra-se o quanto a filtragem ´e efetiva na limpeza dos dados ajudando na modelagem da s´erie.

4.3.3

Modelagem por Box & Jenkins com Filtragem SSA

Para serem feitas as modelagens por Box & Jenkins com filtragem SSA primeiramente deve-se analisar as hip´oteses b´asicas para a utiliza¸c˜ao do modelo.

4.3.3.1 Teste de Normalidade

O teste de normalidade de Kolmogorov-Smirnov apresentou um p-valor de 2,52466e-012. Sendo hip´otese nula de normalidade, ent˜ao h´a evidˆencia para rejeita-la, de modo que a s´erie n˜ao ´e normal, sendio necess´aria a transforma¸c˜ao logaritma.

(39)

4.3 Filtragem SSA 38

4.3.3.2 Teste de Raiz Unit´aria

O teste ADF apresenta p-valor igual `a 0,00941. Com isso, a hip´otese nula de existˆencia de raiz unit´aria ´e rejeitada sendo, portanto, a s´erie estacion´aria e n˜ao ne-cessitando fazer diferen¸cas.

4.3.3.3 Estat´ısticas de Aderˆencia

As modelagens de Box & Jenkins ap´os a filtragem SSA foram geradas de acordo como o modelo escolhido pelo modo especialista do FPW e por suas varia¸c˜oes diminuindo o n´umero de parˆametros. A tabela 10 apresenta os resultados das estat´ısticas de aderˆencia dos modelos, sendo BJ1-SSA o modelo SARIM A(2, 0, 2) × (1, 0, 3)12 para a s´erie filtrada

SSA, BJ2-SSA o modelo SARIM A(2, 0, 1)×(1, 0, 2)12para a s´erie filtrada SSA e BJ3-SSA

o modelo SARIM A(1, 0, 1) × (1, 0, 2)12.

Tabela 10: Estat´ısticas de Aderˆencia dos Modelos de Box & Jenkins com Filtragem SSA

M´etodo MAPE RMSE BIC R2

BJ-1 - SSA 0,00841 91,62 97,69 0.9994 BJ-2-SSA 0,00879 98,65 102,1 0,9994 BJ-3-SSA 0,01778 207,1 208,7 0,9974

Como pode ser visto na tabela 10, o modelo SARIM A(2, 0, 2) × (1, 0, 3)12 apresenta

os menores valores das estat´ısticas de aderˆencia e o maior coeficiente de determina¸c˜ao R2,

sendo o melhor dentre os modelos de Box & Jenkins aplicados `a s´erie ap´os a filtragem SSA.

Ap´os esta etapa, os modelos que obtiveram o melhor desempenho dentre os modelos de Box & Jenkins sem SSA e com SSA s˜ao comparados e os resultados apresentados na tabela 11.

Tabela 11: Estat´ısticas de Aderˆencia dos Modelos de Box & Jenkins sem e com Filtragem SSA

M´etodo MAPE RMSE BIC R2

BJ-2 0,16450 2439,00 2001,00 0,7838 BJ-1 - SSA 0,00841 91,62 97,69 0,9994

Como pode ser visto na tabela 11, o modelo de Box & Jenkins da s´erie com friltragem SSA apresenta melhor desempenho que o modelo de Box & Jenkins da s´eries sem a filtragem.

(40)

4.3 Filtragem SSA 39

Esta an´alise tamb´em confirma a superioridade dos modelos de Holt-Winters da s´erie com filtragem SSA. Sendo assim, a conclus˜ao de que a filtragem SSA melhora o desem-penho da modelagem tanto na classe de amortecimento exponencial quanto na classde ARIMA.

O ´utimo passo desta an´alise consiste em verificar, via estat´ısticas de aderˆencia, qual das classes de mdelo usando SSA possui melhor desempenho.A tabela 12 apresenta os resultados esta compara¸c˜ao.

Tabela 12: Estat´ısticas de Aderˆencia dos Modelos de Holt-Winters e de Box & Jenkins com Filtragem SSA

M´etodo MAPE RMSE BIC R2

HW-2-SSA 0,07428 883,50 892,70 0,9559 BJ-1 - SSA 0,00841 91,62 97,69 0,9994

Como pode ser visto na tabela 12, o modelo de Box& Jenkins com a filtragem SSA tem desempenho superior ao modelo de Holt-Winters tamb´em com SSA, o que indica que, assim como a filtragem, a modelagem ARIMA se apresenta como ideal para esta s´erie.

4.3.4

An´

alise dos Res´ıduos

Ap´os definir o melhor modelo de acordo com as estat´ısticas de aderˆencia, a an´alise dos res´ıduos decide se o modelo escolhido ´e adequado para esta s´erie. A figura 9 mostra a o gr´afico da FAC dos res´ıduos.

Como pode ser observado na figura 9, os res´ıduos s˜ao n˜ao correlacionados, indicando que o modelo selecionado ´e adequado.

(41)

4.3 Filtragem SSA 40

(42)

41

5

Conclus˜

ao

Este projeto teve como objetivo avaliar a melhora da capacidade preditiva de modelos de s´eries temporais de duas classes diferentes sem e com o uso de uma filtragem Singular Spectrum Analysis com base na an´alise gr´afica do comportamento de autovetores na fase de decomposi¸c˜ao.

Na ocasi˜ao, uma s´erie temporal de m´edias mensais de vaz˜ao de afluentes do Rio Paran´a qua abastece a Usina Hidrel´etrica de Itaip´u foi modelada por cinco modelos diferentes da classe de amortecimento exponencial de Holt-Winters e o o melhor modelo foi seelcionado com base nas estat´ısticas de aderˆencia MAPE e RMSE, pelo crit´erio BIC e pelo coeficiente de determina¸c˜ao 2. Esta mesma s´erie foi modelada por trˆes modelos da classe de Box & Jenkins e o melhor tamb´em foi seleceionado com base nos mesmos crit´erios utilizados no caso do amortecimento exponencial.

Ap´os a an´alise com a s´erie original, a filtragem SSA foi feita e as modelagens com a s´erie filtrada seguiram os mesmos moldes das modelagens sem a filtragem. Em seguida, os modelos destacados sem a filtragem foram comparados com os modelos destacados ap´os a filtragem SSA tanto para a classe Holt-Winters quanto para a classe de Box & Jenkins. Ao final, os modelos de melhor desempenho dentre os melhores da classe Holt-Winters e Box & Jenkins foram comparados.

De acordo com estes resultados, pode-se concluir que o modelo de amortecimento exponencial de Holt-Winters mais adequado ´e o modelo com sazonalidade multiplicativa, mas quando a filtragem SSA ´e aplicada, o modelode Holt-Winters com a filtragem tem melhor desempenho. tamb´em conclui-se que a capacidade preditiva do modelo de Box & Jenkins com a filtragem SSA ´e melhor que a mesma avaliada no modelo sem a filtragem. Conclui-se tamb´em que o modelo de Box & Jenkins supera o modelo de Holt-Winters para esta s´erie.

Ent˜ao, chega-se a conclus˜ao de que a filtagem SSA melhora a capacidade preditiva do modelo e que os modelos de Box & Jenkins s˜ao mais adequados para modelagem e

(43)

5 Conclus˜ao 42

(44)

43

Referˆ

encias

[1] Agˆencia Nacional de Energia El´etrica (Aneel) – dispon´ıvel em www.aneel.gov.b [2] Wood, W., Maurer, P., Kumar, A., & D.P. Lettenmaier (2002). Long range

experi-mental hydrologic forecasting for the eastern U.S. Journal of Geophysical Research, 36, pp 70 - 86.

[3] Holt, C. (1957). Forecasting Trends and Seasonal by Exponentially Weighted Averages. Office of Naval Research Memorandum, pp. 52

[4] Winters, P(1960). Forecasting Sales by Exponentially Weighted Moving Avera-ges.Management Science. 6 (3), pp. 324 - 342. doi:10.1287/mnsc.6.3.324.

[5] Morettin, A.; Toloi, C.(1987) Previs˜ao de s´eries temporais. Atual Editora, S˜ao Paulo, 1987.

[6] Fava, L.(2000) Manual de econometria. In: Vasconcelos, M. A. S.; Alves.

[7] Menezes, M., Cassiano, K., Souza, R. M., Teixeira Jr., L., Pessanha, J. e Souza, R. C. (2014). Modelagem e Previs˜ao de Demanda de Energia com Filtragem SSA. Revista da Estat´ıstica da UFOP, 3 (2), pp. 170 - 187.

[8] Elsner, J. B. and Tsonis, A. (1996). Singular Spectrum Analysis. A New Tool in Time Series Analysis. Plenum Press, New York.

[9] Golynadina, N., Nekrutkin, V., and Zhihgljavsky, A. (2001). Analysis of time series structure: SSA and reletade techniques. Chapman&Hall/CRC, New York.

[10] Hassani, H., Heravi, S., and. Zhigljavsky, A. (2012). Forecasting UK Industrial Pro-duction with Multivariate Singular Spectrum Analysis, presentedat the 2012 Intrer-national Conference on the Singular Spectrum Analysis and its Applications, Beijing, China.

[11] Hipel, K. W. e McLeod, A. I. (1994). Time Series Modelling of Water Resources and Environmental Systems. Ed. Elsevier. Amsterdam, The Netherlands.

Referências

Documentos relacionados

O Documento Orientador da CGEB de 2014 ressalta a importância do Professor Coordenador e sua atuação como forma- dor dos professores e que, para isso, o tempo e

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

O programa Institucional de Bolsas de Iniciação à Docência (PIBID) tem sua importância na inserção dos discentes no cotidiano de escolas da rede pública de

O mecanismo de competição atribuído aos antagonistas como responsável pelo controle da doença faz com que meios que promovam restrições de elementos essenciais ao desenvolvimento

Por fim, na terceira parte, o artigo se propõe a apresentar uma perspectiva para o ensino de agroecologia, com aporte no marco teórico e epistemológico da abordagem

Para casos específicos, os contadores são procurados, como por exemplo a declaração do imposto de renda no qual muitos alegaram se tornar o período de maior contato, pois os

produtos e equipamentos não usuais, porém já fornecidos para o início de suas atividades. Outros equipamentos fornecidos como veiculos e máquinas instaladas tem vida

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1