• Nenhum resultado encontrado

Modelagem e Previsão de Séries Temporais de Precipitação Pluviométrica sob as Abordagens Singular Spectrum Analysis e Multi-channel Singular Spectrum

N/A
N/A
Protected

Academic year: 2021

Share "Modelagem e Previsão de Séries Temporais de Precipitação Pluviométrica sob as Abordagens Singular Spectrum Analysis e Multi-channel Singular Spectrum"

Copied!
57
0
0

Texto

(1)

Jo˜

ao Marcos Amorim dos Santos

Modelagem e Previs˜

ao de S´

eries Temporais

de Precipita¸

ao Pluviom´

etrica sob as

Abordagens Singular Spectrum Analysis e

Multi-channel Singular Spectrum Analysis

Niter´oi - RJ, Brasil 29 de Julho de 2016

(2)

Universidade Federal Fluminense

Jo˜

ao Marcos Amorim dos Santos

Modelagem e Previs˜

ao de S´

eries

Temporais de Precipita¸

ao

Pluviom´

etrica sob as Abordagens

Singular Spectrum Analysis e

Multi-channel Singular Spectrum

Analysis

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Mois´es Lima de Menezes

Niter´oi - RJ, Brasil 29 de Julho de 2016

(3)

Universidade Federal Fluminense

Jo˜ao Marcos Amorim dos Santos

Modelagem e Previs˜ao de S´eries Temporais

de Precipita¸c˜ao Pluviom´etrica sob as

Abordagens Singular Spectrum Analysis e

Multi-channel Singular Spectrum Analysis

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Mo-

delagem e Previs˜ao de S´eries Temporais de Precipita¸c˜ao Plu- viom´etrica sob as Abordagens Singular Spectrum Analysis e Multi-channel Singular Spectrum Analysis”, defendida por

Joa˜o Marcos Amorim dos Santos e aprovada em 29 de Julho de 2016, na cidade de Nitero´i, no Estado do Rio de Janeiro, pela banca examinadora constituída pelos professores:

Prof. Dr. Mois´es Lima de Menezes

Orientador

Departamento de Estatística – UFF

Profa. Dra. Keila Mara Cassiano

Departamento de Estatística - UFF

Prof. MSc. Francisco Carlos Santana de Azeredo Pinto

Departamento de Estat´ıstica - UFF

(4)

S237 Santos, João Marcos Amorim dos

2016 Modelagem e previsão de séries temporais de precipitação pluviométrica sob as abordagens singular spectrum analysis e multi-channel singular spectrum analysis /João Marcos Amorim dos Santos. - Niterói: [s. n.], 2016.

57 f.

Trabalho de Conclusão de Curso - (Bacharelado em Es- tatística) – Universidade Federal Fluminense, 2016.

1. Análise espectral 2. Modelagem. 3. Precipitação pluviométrica I. Título.

(5)

Resumo

A previs˜ao de precipita¸c˜oes pluviom´etrica ´e uma importante ferramenta no aux´ılio ao planejamento de a¸c˜oes e projetos. Prever o volume pluviom´etrico se tornou essencial dado a rela¸c˜ao da chuva com o ambiente em que vivemos, seja pela rela¸c˜ao deste ´ındice com a mobilidade urbana, agricultura, inunda¸c˜oes, eros˜oes, usinas hidrel´etricas. Gerar modelos preditivos de precipita¸c˜ao pluviom´etrica tem se tornado cada vez mais necess´ario, mediante as necessidades do crescimento global. Em pleno s´eculo XXI tem-se ouvido falar sobre a necessidade de produ¸c˜ao de energia limpa (ex. Usinas hidrel´etricas), melhor aproveitamento da ´agua, dado que algumas popula¸c˜oes tem sofrido com racionamento de ´

agua dado o baixo volume dos reservat´orios. Todos esses projetos dependem de previs˜oes de precipita¸c˜ao pluviom´etrica, e poder gerar modelos com melhor acur´acia tem grande valor para esses projetos. Dentre as maneiras de se melhorar a acur´acia de previs˜oes, tem-se a filtragem das s´eries, dentro das filtragens existem 2 m´etodos, Singular Spectrum Analysis (SSA) e Multi-channel Singular Spectrum Analysis (MSSA). Este estudo teve o objetivo de filtrar 5 s´eries de precipita¸c˜ao pluviom´etrica, cada uma de uma regi˜ao brasileira, e criar modelos de preditivos de Holt-Winters e Box-Jenkins, tanto para as s´eries sem filtro e para as s´eries filtradas pelos m´etodos SSA e MSSA, comparar as estat´ısticas de aderˆencia destes modelos, verificar se de fato a filtragem melhorou a acur´acia da previs˜ao, e se a metodologia MSSA ´e melhor que a SSA ou ambas tem pouca diferen¸ca nos resultados quando comparada as duas. Os resultados deste estudo mostram que realizar a filtragem das s´eries seja pelo m´etodo SSA ou MSSA melhorou muito a acur´acia do modelo, em todas as estat´ısticas de aderˆencia pode-se observar a melhora dos valores quando a s´erie passou por um dos filtros. Comparando os dois m´etodos de filtragem, SSA e MSSA, observou-se que o m´etodo MSSA se apresentou melhor na maioria das estat´ısticas de aderˆencia comparado ao SSA, por´em essa diferen¸ca entre ambos n˜ao foi muito grande. A conclus˜ao deste trabalho mostra que aplicar a filtragem SSA ou MSSA pode gerar melhores previs˜oes, que podem ser usados em diferentes projetos h´ıdricos.

Palavras-chaves: Precipita¸c˜ao Pluviom´etrica, S´eries Temporais, Singular Spectrum Analy-sis, Multi-Channel Singular Spectrum AnalyAnaly-sis, Filtragem, Modelagem, Box-Jenkins, Holt-Winters.

(6)

Dedicat´

oria

Assim diz o SENHOR ao seu ungido, a Ciro, a quem tomo pela m˜ao direita, para abater as na¸c˜oes diante de sua face, e descingir os lombos dos reis, para abrir diante dele as portas, e as portas n˜ao se fechar˜ao.

Eu irei adiante de ti, e endireitarei os caminhos tortuosos; quebrarei as portas de bronze, e despeda¸carei os ferrolhos de ferro.

Dar-te-ei os tesouros escondidos, e as riquezas encobertas, para que saibas que eu sou o Senhor, o Deus de Israel, que te chama pelo teu nome.

Por amor de meu servo Jac´o, e de Israel, meu eleito, eu te chamei pelo teu nome, pus o teu sobrenome, ainda que n˜ao me conhecesses.

Eu sou o Senhor, e n˜ao h´a outro; fora de mim n˜ao h´a Deus; eu te cingirei, ainda que tu n˜ao me conhe¸cas;

Para que se saiba desde o nascente do sol, e desde o poente, que fora de mim n˜ao h´a outro; eu sou o Senhor, e n˜ao h´a outro.

(7)

Agradecimentos

A Deus, pois at´e aqui me ajudou o Senhor.

Aos meus pais, Marcos Antˆonio e Sandra Maria, por toda compreens˜ao, ajuda e tudo que fizeram por mim para eu chegar at´e este momento.

`

A minha irm˜a Juliana Amorim, por n˜ao me tirar do s´erio mais do que as provas me tiravam.

A todos meus parentes, tios, tias, primos, primas, em especial ao Thomas Santos Bonif´acio, por compreenderem minhas ausˆencias nos eventos de fam´ılia devido minhas provas.

Aos meus amigos que fiz na faculdade, em especial ao Fernando Alencar e Igor Pinto, pelos momentos juntos na faculdade e as horas de estudos e jogos juntos.

Aos meus amigos que me ajudaram a passar no vestibular e sempre acreditaram no meu potencial, em especial ao Claudio Luiz.

`

A Universidade Federal Fluminense e todo seu corpo docente, em especial ao professor Mois´es Lima de Menezes por aceitar ser meu orientador e amigo, e ter me ajudado bastante neste trabalho de conclus˜ao de curso.

A todos professores que tive desde o pr´e escolar at´e hoje por acreditarem na educa¸c˜ao. `

A Claudia Cristina de Aguiar Pereira por ser minha orientadora no meu tempo de inicia¸c˜ao cient´ıfica na FIOCRUZ e sempre ter se preocupado com meus estudos.

A toda GERAV/BNDES por todo aprendizado em meu per´ıodo de est´agio e poder me inspirar em pessoas como vocˆes, em especial ao Luciano Machado e F´abio Brener Roitman por terem confiados em minha capacidade, me dando a oportunidade de fazer parte da GERAV/BNDES e serem meus coordenadores.

`

A banca examinadora, professor Francisco Carlos Santana de Azeredo Pinto e a pro-fessora Keila Mara Cassiano por participarem desde momento.

(8)

Sum´

ario

Lista de Figuras

Lista de Tabelas

1 Introdu¸c˜ao p. 14

1.1 Contextualiza¸c˜ao . . . p. 14 1.2 Precipita¸c˜oes pluviom´etricas no cen´ario brasileiro . . . p. 14 1.3 Importˆancia de gerar previs˜oes pluviom´etricas . . . p. 14 1.4 Proposta . . . p. 16 1.5 Estrutura do trabalho . . . p. 16 2 Objetivos p. 17 3 Materiais e M´etodos p. 18 3.1 Base de dados . . . p. 18 3.2 S´eries Temporais . . . p. 18 3.2.1 An´alise Descritiva . . . p. 19 3.3 Decomposi¸c˜ao serial . . . p. 19 3.4 Estacionariedade . . . p. 20 3.4.1 Processo Estacion´ario . . . p. 21 3.5 Fun¸c˜ao de Autocorrela¸c˜ao . . . p. 22 3.6 Correlograma . . . p. 23 3.7 Fun¸c˜ao de Autocorrela¸c˜ao Parcial (FACP) . . . p. 23

(9)

3.8 Modelagem Holt-Winters . . . p. 24 3.8.1 Estimadores de Holt-Winters com sazonalidade aditiva . . . p. 25 3.8.2 Estimadores de Holt-Winters com sazonalidade multiplicativa . p. 26 3.9 Modelagem de Box-jenkins . . . p. 26 3.9.1 Modelos auto-regressivos AR(p) . . . p. 26 3.9.2 Modelos de m´edias m´oveis M A(q) . . . p. 27 3.9.3 Modelos n˜ao estacion´arios . . . p. 27

3.9.3.1 Modelos auto-regressivos integrados de m´edias m´oveis

(ARIM A) . . . p. 28 3.9.3.2 Modelos Sazonais (SARIM A) . . . p. 29 3.9.4 FACP dos modelos de Box-Jenkins . . . p. 29 3.10 Singular Spectrum Analysis . . . p. 30 3.10.1 Decomposi¸c˜ao . . . p. 31 3.10.2 Reconstru¸c˜ao . . . p. 31 3.11 Multi-Channel Singular Spectrum Analysis (MSSA) . . . p. 33 3.12 Estat´ısticas de Aderˆencia . . . p. 34 3.13 Resumo da Metodologia . . . p. 36

4 An´alise dos Resultados p. 38

4.1 Dados originais . . . p. 38 4.2 Filtragem SSA e MSSA . . . p. 42 4.2.1 S´eries Filtradas . . . p. 50 4.2.1.1 Modelos de previs˜ao . . . p. 52 4.2.2 Estat´ısticas de aderˆencia . . . p. 52

5 Conclus˜ao p. 56

(10)

Lista de Figuras

1 Unidades da Federa¸c˜ao selecionadas . . . p. 19 2 Resumo da Metodologia . . . p. 37 3 S´erie hist´orica Rio Branco - AC . . . p. 38 4 S´erie hist´orica Recife - PE . . . p. 39 5 S´erie hist´orica Bras´ılia - DF . . . p. 39 6 S´erie hist´orica Rio de Janeiro - RJ . . . p. 40 7 S´erie hist´orica Porto Alegre - RS . . . p. 40 8 Os 9 primeiros vetores singulares na filtragem SSA para s´erie do Rio de

Janeiro e suas respectivas contribui¸c˜oes . . . p. 43 9 Componentes s´erie Rio Branco via SSA . . . p. 44 10 Componentes s´erie Recife via SSA . . . p. 45 11 Componentes s´erie Bras´ılia via SSA . . . p. 46 12 Componentes s´erie Rio de Janeiro via SSA . . . p. 47 13 Componentes s´erie Porto Alegre via SSA . . . p. 48 14 Componentes das 5 s´eria via MSSA . . . p. 49 15 Compara¸c˜ao entre a s´erie original e filtrada do Rio Branco via SSA . . p. 50 16 Compara¸c˜ao entre a s´erie original e filtrada de Recife via SSA . . . p. 50 17 Compara¸c˜ao entre a s´erie original e filtrada de Bras´ılia via SSA . . . . p. 51 18 Compara¸c˜ao entre a s´erie original e filtrada do Rio de Janeiro via SSA p. 51 19 Compara¸c˜ao entre a s´erie original e filtrada de Porto Alegre via SSA . . p. 51

(11)

Lista de Tabelas

1 Identifica¸c˜ao dos modelos . . . p. 30 2 Estat´ısticas da m´edia pluviom´etrica mensal . . . p. 41 3 Tabela de correla¸c˜ao entre as componentes da s´erie filtrada . . . p. 42 4 Modelos anterior e posterior `a filtragem das 5 s´eries . . . p. 52 5 Estat´ısticas de Aderˆencia dos Modelos . . . p. 53 6 Estat´ısticas de Aderˆencia dos Modelos (In Sample) . . . p. 54 7 Estat´ısticas de Aderˆencia dos Modelos (Out of Sample) . . . p. 55

(12)

12

1

Introdu¸

ao

1.1

Contextualiza¸

ao

Precipita¸c˜ao pluviom´etrica ´e um fenˆomeno meteorol´ogico que possui aleatoriedade em sua ocorrˆencia quanto em sua intensidade. O conhecimento sobre precipita¸c˜oes plu-viom´etricas ´e de grande importˆancia nos dias de hoje, assim como j´a era considerado no passado. Tal importˆancia est´a agregada ao fator do n´ıvel de chuva influenciar em diferentes ´areas do ambiente em que vivemos, seja ela na quest˜ao urbana, agr´ıcola ou da engenharia hidr´aulica (HEBERT et al., 2007) (BEIJO et al., 2005). As varia¸c˜oes no n´ıvel das precipita¸c˜oes pluviom´etricas est˜ao principalmente relacionadas ao clima de cada regi˜ao em estudo, devido seus diferentes tipos clim´aticos, esta¸c˜oes do ano, e a sazonalidade envolvida (JOSEVAL, 2010). O volume de precipita¸c˜oes pluviom´etrica ´e medido por um aparelho chamado pluviˆometro, o mesmo mede em mil´ımetro (mm), a altura da lˆamina de ´agua gerada pela chuva que caiu numa ´area de 1m2 em um dado per´ıodo. Sendo assim

quando diz-se que o n´ıvel de precipita¸c˜ao pluviom´etrica foi de 10 mil´ımetros significa que choveu 10 litros e uma ´area de 1m2.

1.2

Precipita¸

oes pluviom´

etricas no cen´

ario brasileiro

Quando se olha para o cen´ario brasileiro observa-se diferentes rela¸c˜oes com as preci-pita¸c˜ao pluviom´etrica, seja devido aos investimentos com usinas hidrel´etricas, dependˆencia na irriga¸c˜ao do plantio, n´ıvel dos rios, evacua¸c˜ao da popula¸c˜ao em ´areas de deslizamentos, log´ıstica em rela¸c˜ao ao transporte em dias chuvosos e melhor reaproveitamento da ´agua.

1.3

Importˆ

ancia de gerar previs˜

oes pluviom´

etricas

Prever volume de chuva se torna uma importante ferramenta no aux´ılio ao planeja-mento de a¸c˜oes e projetos voltados `a inunda¸c˜oes e eros˜ao (BERTONI; TUCCI, 2009).

(13)

1.3 Importˆancia de gerar previs˜oes pluviom´etricas 13

Muitas regi˜oes possuem moradores que habitam em ´areas que sofrem grandes desastres quando ocorrem n´ıveis elevados de chuva, devido a habitarem nas margens de rios, ´areas de encosta com poss´ıveis deslizamentos de terra entre outros fatores naturais envolvidos com volume de chuva (BRESSIANI, 2010).

O escoamento adequado do volume de ´agua de precipita¸c˜oes pluviais al´em de propor-cionar uma melhora na log´ıstica dos transportes, pode tamb´em ter o direcionamento dessa ´

agua para sistema h´ıdrico com baixo volume de abastecimento de ´agua, sendo assim ´aguas pluviais devem ser manejadas como uma das solu¸c˜oes para o abastecimento (COHIM et al., 2008).

Outras formas de melhor aproveitar o volume de ´agua nos centros urbanos, ´e por parte de uma educa¸c˜ao populacional, onde sejam apresentadas formas adequadas e plaus´ıveis de reaproveitamento da ´agua de chuva, seja ela para lavagem do quintal, do carro, roupa, uso sanit´ario ou outras poss´ıveis finalidades (SILVA, 2014) (GOLDENFUM, 2006). Al´em do reaproveitamento nos centros urbanos, os polos industriais, onde h´a uma grande con-centra¸c˜ao de consumo de ´agua para refrigera¸c˜ao de m´aquinas dentre outras finalidades, tamb´em pode fazer uso do recurso de reaproveitamento das ´aguas (GOLDENFUM, 2006). Desta forma, pode-se evitar o uso de ´agua pot´avel para essas atividades, principalmente devido ao baixo volumo apresentado nos reservat´orios (COHIM et al., 2008) (SILVA, 2014).

A produ¸c˜ao de energia brasileira tamb´em tem forte correla¸c˜ao com o n´ıvel de pre-cipita¸c˜oes de chuva (Trestani,2015), uma vez que mais de 60% da energia brasileira ´e proveniente de usinas hidrel´etricas, que depende da vaz˜ao dos rios, que depende do seu n´ıvel, que depende da precipita¸c˜ao pluviom´etrica. A produ¸c˜ao de energia hidrel´etrica no Brasil vem caindo ao longo dos anos devido a falta de chuva. Na compara¸c˜ao de 2013 em rela¸c˜ao a 2012, houve um decr´escimo de 5,4% na produ¸c˜ao de energia hidrel´etrica no Brasil apesar de a capacidade instalada ter aumentado 2% de 2013 a 2012 (EPE, 2015). A grande importˆancia da produ¸c˜ao de energia hidrel´etrica se deve ao fato de ser uma energia renov´avel, evitando a emiss˜ao de gases e poluentes que contribuem para o aquecimento global, um dos maiores problemas naturais enfrentado ao redor do mundo nos dias de hoje. A previs˜ao de precipita¸c˜ao pluviom´etrica ´e um importante fator nos investimentos e funcionamento de usinas hidrel´etricas devido ao volume que os rios podem apresentar em dias chuvosos. Tal previs˜ao tamb´em ´e muito importante para o planejamento energ´etico tendo em vista a necessidade das chuvas nas nascentes dos rios que des´aguam nas usinas hidrel´etricas.

(14)

1.4 Proposta 14

1.4

Proposta

Este projeto tem a proposta de apresentar diferentes modelos preditivos de preci-pita¸c˜ao pluviom´etrica baseado na metodologia Singular Spectrum Analysis (SSA) e Multi-channel Singular Spectrum Analysis (MSSA). Ap´os a filtragem, as s´eries ser˜ao modeladas pelos tradicionais modelos de Holt-Winters e Box-Jenkins. Ser˜ao geradas previs˜oes at´e 24 meses `a frente. Al´em dos modelos aplicados `as s´eries filtradas, os mesmos ser˜ao fei-tos com as s´eries originais, gerando assim, trˆes conjuntos de modelos com duas classes de modelos aplicados a cada s´erie de precipita¸c˜ao pluviom´etrica. Ap´os as modelagens e previs˜oes, estat´ısticas de aderˆencia ser˜ao utilizadas para avaliar o melhor modelo para an´alise e previs˜ao.

1.5

Estrutura do trabalho

Este trabalho est´a organizado em 5 cap´ıtulos. No cap´ıtulo 1 ´e apresentada a in-trodu¸c˜ao do trabalho abordando a importˆancia de se prever o volume de precipita¸c˜ao pluviom´etrica como diferentes quest˜oes no territ´orio brasileiro que dependem de tais pre-vis˜oes. No cap´ıtulo 2 s˜ao apresentados objetivos de estudo deste trabalho citando as abordagens que ser˜ao utilizadas. No cap´ıtulo 3 s˜ao apresentados os materiais e m´etodos dando enfoque aos processos anteriores a predi¸c˜ao dos modelos al´em dos modelos de amor-tecimento exponencial de Holt-Winters, os modelos de Box-Jenkins, metodologia SSA e MSSA, bem como as estat´ısticas de aderˆencia a serem utilizadas. No cap´ıtulo 4 s˜ao apre-sentando os resultados utilizando as filtragem SSA e MSSA, os modelos de Holt-Winters e Box-Jenkins, e as estat´ısticas de aderˆencia de cada um dos modelos. No cap´ıtulo 5 est˜ao resumidas as principais conclus˜oes do trabalho bem como as sugest˜oes e analises para futuros estudos sobre o tema.

(15)

15

2

Objetivos

Este projeto teve o objetivo de criar modelos de m´edias mensais de precipita¸c˜oes pluviom´etricas de diferentes regi˜oes brasileira com a abordagem SSA e MSSA, verificando se realizar a filtragem contribui pra melhora da capacidade preditiva dos modelos. A ideia ´e a de contribuir com o planejamento do uso da ´agua das chuvas para os diversos objetivos ao qual este bem ´e usado e demais projetos h´ıdricos que dependam de previs˜oes de precipita¸c˜ao pluviom´etrica.

(16)

16

3

Materiais e M´

etodos

3.1

Base de dados

O estudo foi realizado com observa¸c˜oes de m´edias mensais de precipita¸c˜oes plu-viom´etrica de diferentes regi˜oes do territ´orio brasileiro. Devido a sua dimens˜ao conti-nental, o Brasil possui diferentes caracter´ısticas clim´aticas, de maneira a gerar diferentes ´ındices pluviom´etricos. A sele¸c˜ao das esta¸c˜oes pluviom´etricas do estudo foi caracterizada pela busca de diferentes cen´arios regionais a qual cada uma est´a envolvida, seja por ser um cen´ario de inunda¸c˜ao, usinas hidrel´etricas (UHE), sistema h´ıdrico, polos industriais, grande centros urbanos, dentre outros fatores. Os dados s˜ao da Agˆencia Nacional de ´

aguas (ANA) e do Instituto Nacional de Meteorologia (INMET). Foi escolhida uma s´erie de um estado de cada regi˜ao brasileira a fim de representar cada regi˜ao, sendo assim foram usados dados de 5 esta¸c˜oes pluviom´etricas diferentes, cada uma dessa s´eries apresentar´a observa¸c˜ao m´edia mensal de precipita¸c˜ao pluviom´etrica de janeiro de 1970 `a dezembro de 2014. Na escolha das s´eries dentro das regi˜oes buscou-se preferencialmente s´eries das capitais dos Estados devido as capitais possu´ırem s´eries sem dados faltante no per´ıodo de janeiro de 1970 `a dezembro de 2014. A figura 1 apresenta o mapa do Brasil com as marca¸c˜oes em c´ırculo preto, das Unidades da Federa¸c˜ao, das esta¸c˜oes selecionadas no estudo.

3.2

eries Temporais

Uma s´erie temporal ´e um conjunto de observa¸c˜oes ordenada ao longo do tempo. Sua observa¸c˜ao pode ser discreta ou cont´ınua e a caracter´ıstica mais importante neste tipo de dados ´e a dependˆencia entre as observa¸c˜oes vizinha {Th−1; Th+1} e o interesse principal

(17)

3.3 Decomposi¸c˜ao serial 17

Figura 1: Unidades da Federa¸c˜ao selecionadas

3.2.1

An´

alise Descritiva

Ao se analisar uma ou mais s´eries temporais a constru¸c˜ao de gr´aficos que apresentem os dados de forma sequencial ao longo tempo ´e fundamental e pode revelar os respectivos padr˜oes da s´erie. A an´alise gr´afica pode ajudar a perceber 4 importantes componentes de uma s´erie temporal, tendˆencias, sazonalidade, componente c´ıclica e ru´ıdo. Al´em de facilitar a percep¸c˜ao de observa¸c˜ao discrepante e mudan¸ca estrutural no comportamento da s´erie. As demais estat´ısticas descritiva tais como m´edia, mediana, variˆancia, m´ınimo, m´aximo, s˜ao de grande importˆancia para reconhecimento dos dados.

• Tendˆencia (T) ´e o comportamento a longo prazo da s´erie em torno da m´edia, este efeito pode ser crescente ou decrescente, linear ou n˜ao linear.

• Sazonalidade(S) efeitos ligados `a varia¸c˜oes peri´odicas recorrentes que podem ocor-rer em per´ıodos espec´ıficos do ano.

• Ciclos (C) Semelhante a componente sazonal, s˜ao varia¸c˜oes peri´odicas que a priori n˜ao s˜ao associadas a neguma medida temporal, com intervalos superior `a um ano. • Ru´ıdo (R) Componente aleat´oria de grande instabilidade n˜ao explicada por

va-ria¸c˜oes c´ıclicas, sazonal ou de tendˆencia, sendo puramente aleat´oria.

3.3

Decomposi¸

ao serial

Uma decomposi¸c˜ao cl´assica de s´eries temporais permite que a s´erie seja escrita como uma soma ou multiplica¸c˜ao de componentes n˜ao observ´aveis. Assim, pode-se usar um

(18)

3.4 Estacionariedade 18

modelo aditivo – quando se sup˜oe que os componentes da s´erie temporal s˜ao somados para formar os dados – ou um modelo multiplicativo que sup˜oe que os componentes s˜ao multiplicados um pelo outro (MORETTIN; TOLOI, 2006)(SMAILES; McGrane, 2000).

De acordo com Silver (2000), “ a decomposi¸c˜ao cl´assica ´e ´util tanto para planejamento como para previs˜ao ”. Souza e Samohyl (2005) acrescentam que ela ´e uma ferramenta ´

util, pois, al´em de permitir previs˜oes, auxilia na tomada de decis˜ao acerca do m´etodo de previs˜ao mais adequado `as caracter´ısticas dos dados dispon´ıveis. (BOUZADA, 2012)

Zt = Tt+ St+ Ct+ RT (3.1)

Zt = Tt.St.Ct.RT (3.2)

3.4

Estacionariedade

Segundo Morettin e Toloi (2006), uma das suposi¸c˜oes mais frequentes que se faz a respeito de uma s´erie temporal ´e de que ela ´e estacion´aria, isso quer dizer que, ela se desenvolve no tempo aleatoriamente em torno de uma m´edia constante, formando um equil´ıbrio est´avel. Uma s´erie pode ser estacion´aria durante um per´ıodo muito longo, ou at´e mesmo ser estacion´aria apenas em per´ıodos muito curtos, mudando de n´ıvel ou inclina¸c˜ao.

A classe dos modelos ARIMA (Auto-Regressivos Integrados M´edias-M´oveis), ser˜ao capazes de descrever de maneira satisfat´oria s´eries estacion´arias e n˜ao-estacion´arias, mas que n˜ao apresentam comportamento explosivo. Este tipo de estacionariedade ´e chamado homogˆeneo; a s´erie pode ser estacion´aria, flutuando ao redor de um n´ıvel, por um certo tempo, depois mudar de n´ıvel e flutuar ao redor de um novo n´ıvel e assim por diante, ou ent˜ao mudar de inclina¸c˜ao, ou ambas as coisas.

Como a maioria dos procedimentos de an´alise estat´ıstica de s´eries temporais sup˜oem que estas sejam estacion´arias, devemos transformar os dados originais, se estes n˜ao for-mam uma s´erie estacion´aria. A transforma¸c˜ao mais comum consiste em tomar diferen¸cas sucessivas da s´erie original, at´e se obter uma s´erie estacion´aria. A primeira diferen¸ca de Zt´e definida por

(19)

3.4 Estacionariedade 19

a segunda diferen¸ca ´e dada por

∆2Zt= ∆ [∆Zt] = ∆ [Zt− Zt−1] ,

ou seja,

∆2Zt = Zt− 2Zt−1+ Zt−2.

De modo geral, a n-´esima diferen¸ca de Zt´e dada por

∆nZt = ∆∆n−1Zt .

Em situa¸c˜oes normais, ser´a suficiente tomar uma ou duas diferen¸cas para que a s´erie se torne estacion´aria.

3.4.1

Processo Estacion´

ario

Segundo Morettin e Toloi (2006), um processo Z ´e estacion´ario se ele se desenvolve no tempo de modo que a escolha de uma origem no tempo n˜ao ´e importante. Isso quer dizer que , as caracter´ısticas de Z(t+τ ), para todo τ , s˜ao as mesmas de Zt.

Tecnicamente, h´a duas formas de estacionariedade: fraca (ou ampla, ou de segunda ordem) e estrita (ou forte).

Uma s´erie temporal ´e dita estritamente estacion´aria se a distribui¸c˜ao de probabilidade conjunta de Z(t1), · · · , Z(tk) ´e a mesma de Z(t1+τ ), · · · , Z(tk+τ ). Ou seja, o deslocamento

da origem dos tempos por uma quantidade τ n˜ao tem efeito na distribui¸c˜ao conjunta que portanto depende apenas dos intervalos entre t1, · · · , tk, logo a m´edia µ(t) e a variˆancia

V (t)s˜ao constante, isto ´e.

µ(t) = µ σ2(t) = σ2 para todo t ∈ T

Do mesmo modo, todas as distribui¸c˜oes bi-dimensionais dependem de t2− t1. De fato

γ(t1, t2) = γ(t1+ t, t2+ t), fazendo t = −t2 vem que:

γ(t1, t2) = γ(t1 − t2, 0) = γ(τ ),

para τ = t1−t2. Logo, γ(t1, t2) ´e uma fun¸c˜ao de um ´unico argumento, no caso do processo

(20)

3.5 Fun¸c˜ao de Autocorrela¸c˜ao 20

Um processo ´e dito fracamente estacion´ario (ou estacion´ario de segunda ordem) se e somente se:

i E (Z(t)) = µ(t) = µ

ii E (Z2(t)) < ∞, para todo t ∈ T ;

iii γ(t1, t2) = CovZ(t1), Z(t2) ´e uma fun¸c˜ao de t1− t2.

3.5

Fun¸

ao de Autocorrela¸

ao

A Fun¸c˜ao de autocorrela¸c˜ao (FAC) busca medir a correla¸c˜ao entre as observa¸c˜oes de uma mesma vari´avel em diferentes horizontes de tempo, correla¸c˜oes entre observa¸c˜oes defasadas k = 1, 2, · · · per´ıodos de tempo. Assim, dadas n observa¸c˜oes z1, · · · , zn de uma

s´erie temporal discreta podemos formar os pares (z1, z2), · · · , (zn−1, zn). Considerando

z1, · · · , zn−1 e z2, · · · , zn como duas vari´aveis o coeficiente de correla¸c˜ao entre zt e zt+1

ser´a dado por:

r1 = Pn−1 t=1(zt− z1)(zt+1− z2) q Pn−1 t=1(zt− z1)2 Pn−1 t=1(zt+1− z2)2 (3.3)

as respectivas m´edias amostrais s˜ao

z1 = n−1 X t=1 zt n − 1 e z2 = n X t=2 zt n − 1

como o coeficiente r1mede as correla¸c˜oes entre as observa¸c˜oes ele ´e chamado de coeficiente

de autocorrela¸c˜ao ou coeficiente de correla¸c˜ao serial. ´

E usual simplificar a equa¸c˜ao 3.3 utilizando a m´edia de todas as observa¸c˜oes z =Pn

t=1zt/n, percebe-se que z1 ≈ z2 e assumindo variˆancia constante. Assim, a vers˜ao

simplificada de 3.3 fica r1 = Pn−1 t=1(zt− z)(zt+1− z) (n − 1)Pn t=1(zt− z)2/n (3.4) A equa¸c˜ao 3.4 pode ser generalizada para calcular a correla¸c˜ao entre observa¸c˜oes defasadas de k per´ıodos de tempo, rk= Pn−k t=1(zt− z)(zt+k− z) Pn t=1(zt− z)2 (3.5) A equa¸c˜ao 3.5 nos fornece o coeficiente de correla¸c˜ao de ordem k.

(21)

3.6 Correlograma 21

Outra forma de obtermos o mesmo resultado e de forma mais usual ´e pela autoco-variˆancia ck, definido pela f´ormula:

ck = n−k X t=1 (zt− z)(zt+k− z) n , k = 0, 1, 2, · · · (3.6)

e o coeficiente de autocorrela¸c˜ao fica sendo obtido pela f´ormula rk = cck0

3.6

Correlograma

Uma forma usual de apresentar os coeficientes de autocorrela¸c˜ao da s´erie ´e atrav´es de um correlograma. Correlograma ´e um gr´afico com os k primeiros coeficientes de au-tocorrela¸c˜ao rk. A fun¸c˜ao do correlograma na an´alise de s´eries temporais ´e auxiliar a

identifica¸c˜ao de caracter´ısticas da s´erie. Essas caracter´ısticas s˜ao por exemplo:

• Se uma s´erie ´e puramente aleat´oria os seus valores defasados n˜ao s˜ao correlacionados ,i.e. rk se aproxima de zero.

• Quando o correlograma possui decaimento muito lento das autocorrela¸c˜oes, evidˆencia a n˜ao estacionariedade da s´erie.

• Quando uma s´erie possui o fator sazonal, ser´a percept´ıvel no correlograma um padr˜ao na mesma frequˆencia do fator sazonal.

• Al´em de o correlograma da FAC e da fun¸c˜ao de autocovariˆancia parcial que ser´a apre-sentado na se¸c˜ao seguinte, auxiliar a identifica¸c˜ao do modelo param´etrico ARIMA.

3.7

Fun¸

ao de Autocorrela¸

ao Parcial (FACP)

Uma outra ferramenta utilizada no processo de identifica¸c˜ao do modelo ´e a fun¸c˜ao de autocorrela¸c˜ao parcial. Esta medida corresponde a correla¸c˜ao de Zt e Zt−k removendo o

efeito das observa¸c˜oes Zt−1, Zt−2, . . . , Zt−k+1 e ´e denotada por φkk, ou seja

φkk = Corr(Zt, Zt−l/zt−1, Zt−2, . . . , Zt−k+1)

Um m´etodo geral para encontrar a (FACP) para um processo estacion´ario com (FAC) ρk

(22)

3.8 Modelagem Holt-Winters 22

ρj = φk1ρj−1+ φk2ρ1+ · · · + φkkρj − 1, j = 1, 2, . . . , k

Desenvolvendo a equa¸c˜ao temos

ρ1 = φk1+ φk2ρ1+ · · · + φkkρj−1

ρ2 = φk1ρ1+ φk2+ · · · + φkkρj−2

..

. = ...

ρj = φk1ρj−1+ φk2ρj−2+ · · · + φkk

Resolvendo as equa¸c˜oes acima sucessivamente para k = 1, 2, ..., obtemos φkk da seguinte

maneira φ11= ρ1 φ22= 1 ρ1 ρ1 ρ2 1 ρ1 ρ1 1 =⇒ φ22= ρ2− ρ21 1 − ρ2 1 φ33= 1 ρ1 ρ1 ρ1 1 ρ2 ρ2 ρ1 ρ3 1 ρ1 ρ2 ρ1 1 ρ1 ρ2 ρ1 1 =⇒ φ33= ρ3+ ρ22ρ1+ ρ13− 2ρ1ρ2− ρ21ρ3 1 − 2ρ2 1− ρ22 em geral temos φkk= |P∗ k| |Pk|

onde Pk´e a matriz de autocorrela¸c˜ao, e Pk∗ ´e a matriz Pk com a ultima coluna substitu´ıda

pelo vetor de autocorrela¸c˜ao.

3.8

Modelagem Holt-Winters

O procedimento de alisamento exponencial (Holt-Winters) pode ser generalizado para s´eries que contenham tendˆencia e varia¸c˜ao sazonal. Segundo Morettin e Toloi (2006), existem dois tipos de procedimento cuja utiliza¸c˜ao depende das caracter´ısticas da s´erie

(23)

3.8 Modelagem Holt-Winters 23

considerada. Tais procedimentos s˜ao baseados em trˆes equa¸c˜oes com constantes de sua-viza¸c˜ao diferentes, que s˜ao associadas a cada uma das componentes do padr˜ao da s´erie: n´ıvel, tendˆencia e sazonalidade.

b

Zt(h) = µt+ Tt+ St+ at

Onde µt´e o n´ıvel, Tt´e a tendˆencia, St sazonalidade e at´e o ru´ıdo branco com m´edia zero

e variˆancia constante.

Existem duas varia¸c˜oes deste m´etodo, que diferem na natureza do componente sazonal. O m´etodo aditivo ´e preferido quando as varia¸c˜oes sazonais s˜ao mais ou menos constante atrav´es da s´erie, enquanto que o m´etodo multiplicativo ´e preferido quando as varia¸c˜oes sazonais est˜ao mudando proporcional ao n´ıvel da s´erie.

3.8.1

Estimadores de Holt-Winters com sazonalidade aditiva

No m´etodo aditivo a componente sazonal ´e expressa em termos absolutos na escala da s´erie observada, e na equa¸c˜ao de n´ıvel da s´erie ´e ajustada sazonalmente subtraindo o componente sazonal. ba1(t) = αZt−ρbm(t)(t − 1) + (1 − α) [ba1(t − 1) +ba2(t − 1)] ba2(t) = β [ba1(t) −ba1(t − 1)] + (1 − β)ba2(t − 1) ρm(t)(t) = γ [Zt−ba1(t)] + (1 − γ) ρm(t)(t − 1) Equa¸c˜ao de previs˜ao b Zt(h) = (ba1(t) + h ×ba2(t)) + ρm(t+h)(t) Onde : • ba1(t) ´e o n´ıvel em t

ba2(t) ´e a tendˆencia (inclina¸c˜ao) em t

(24)

3.9 Modelagem de Box-jenkins 24

3.8.2

Estimadores de Holt-Winters com sazonalidade

multipli-cativa

No m´etodo multiplicativo a componente sazonal ´e expressa em termos relativos (per-centuais) e da s´erie ´e ajustada sazonalmente dividindo-se atrav´es da componente sazonal.

b a1(t) = α " Zt b ρm(t)(t − 1)  # + (1 − α) × [ba1(t − 1) +ba2(t − 1)] b a2(t) = β [ba1(t) −ba1(t − 1)] + (1 − β)ba2(t − 1) ρm(t)(t) = γ  Zt b a1(t)  + (1 − γ) × ρm(t)(t − 1) Equa¸c˜ao de previs˜ao b Zt(h) = (ba1(t) + h ×ba2(t)] × ρm(t)(t) Onde : • ba1(t) ´e o n´ıvel em t

ba2(t) ´e a tendˆencia (inclina¸c˜ao) em t

• ρbm(t)(t) ´e o fator sazonal em t

3.9

Modelagem de Box-jenkins

A metodologia Box-Jenkins amplamente utilizada no ajuste de modelos param´etricos, consiste em ajustar modelos auto-regressivos integrados de m´edias m´oveis, ARIM A(p, d, q), a um conjunto de dados. Segundo Fava (2000), os modelos ARIM A resultam da com-bina¸c˜ao de trˆes componentes denominados “filtros”: o componente auto-regressivo (AR), o filtro de integra¸c˜ao (I) e o componente de m´edias m´oveis (MA). Uma s´erie pode ser modelada pelos trˆes filtros ou apenas um subconjunto deles, resultando em v´arios modelos abordados a seguir.

3.9.1

Modelos auto-regressivos AR(p)

Em um modelo auto-regressivo, a s´erie de dados hist´oricos Zt ´e descrita por seus

(25)

3.9 Modelagem de Box-jenkins 25 por: ˜ Zt= φ1Z˜t−1+ φ2Z˜t−2+ · · · + φpZ˜t−p+ at (3.7) onde, ˜ Zt = Zt− µ

O modelo 3.7 pode ser reescrito utilizando o operador de defasagem B, o operador de defasagem B ´e definido da seguinte forma:

BZt = Zt−1; BmZt= Zt−m (3.8)

ent˜ao utilizando a fun¸c˜ao 3.8 em 3.7 obtemos que:

φ(B) = 1 − φ1B − φ2B2− · · · − φpBp

φ(B) ˜Zt= at

3.9.2

Modelos de m´

edias m´

oveis M A(q)

Em um modelo de m´edias m´oveis, a s´erie Ztresulta da combina¸c˜ao dos ru´ıdos brancos

a do per´ıodo atual com aqueles ocorridos em per´ıodos anteriores. Assim, um modelo de m´edias m´oveis de ordem q ou M A(q) ´e dado por:

Zt = µ + at+ θ1at−1+ · · · + θqat−q (3.9) sendo ˜Zt = Zt− µ ˜ Zt= (1 − θ1B − · · · − θqBq)at = θ(B)at (3.10) onde θ(B) = 1 − θ1B − θ2B2− · · · − θqBq (3.11)

´e o operador de m´edias m´oveis de ordem q.

3.9.3

Modelos n˜

ao estacion´

arios

Quando uma s´erie temporal apresenta m´edia e variˆancia dependentes do tempo, ´e por-que ela n˜ao ´e estacion´aria. A n˜ao-estacionariedade de uma s´erie implica que a varia¸c˜ao

(26)

3.9 Modelagem de Box-jenkins 26

dos dados n˜ao permanece essencialmente constante sobre o tempo, isto ´e, as flutua¸c˜oes au-mentam ou diminuem com o passar do tempo, indicando que a variˆancia est´a se alterando. Para detectar a n˜ao-estacionariedade de uma s´erie, o comportamento temporal pode ser analisado graficamente, ou, ent˜ao, aplicando os testes estat´ısticos de raiz unit´aria. O teste de raiz unit´aria mais usado ´e o de Dickey-Fuller.

3.9.3.1 Modelos auto-regressivos integrados de m´edias m´oveis (ARIM A) Como a maioria dos procedimentos de an´alise estat´ıstica de s´eries temporais sup˜oe que estas sejam estacion´arias, ser´a necess´ario transform´a-las caso ainda n˜ao sejam. Se-gundo Morettin e Toloi (2006), a transforma¸c˜ao mais comum consiste em tomar diferen¸cas sucessivas da s´erie original at´e obter uma s´erie estacion´aria.

Segue que o operador de diferen¸ca ´e definido por :

∆Zt = Zt− Zt−1= (1 − B)Zt

B ´e o operador de transla¸c˜ao visto anteriormente. Logo segue-se que ∆ = 1 − B

No caso de duas diferen¸ca tem-se

∆2Zt = ∆ [∆Zt] = ∆ [Zt− Zt−1] = Zt− 2Zt−1+ Zt−2

De modo geral, a n-´esima diferen¸ca de Zt ´e

∆nZt= ∆∆n−1Zt



Segundo Morettin e Toloi (2006), em situa¸c˜oes normais ser´a suficiente tomar uma ou duas diferen¸cas para obter estacionariedade em uma s´erie. O n´umero d de diferen¸cas necess´arias para tornar a s´erie estacion´aria ´e denominado ordem de integra¸c˜ao. Ap´os obter estacionariedade diz-se que Zt segue um modelo auto-regressivo, integrado, de m´edias

m´oveis, ou modelo ARIM A(p, d, q), onde p ´e o polinˆomio auto-regressivo ´e q o polinˆomio de m´edias m´oveis.

(27)

3.9 Modelagem de Box-jenkins 27

3.9.3.2 Modelos Sazonais (SARIM A)

Os modelos ARIM A exploram a autocorrela¸c˜ao entre os valores da s´erie em instantes sucessivos, mas quando os dados s˜ao observados em per´ıodos inferiores a um ano, a s´erie tamb´em pode apresentar autocorrela¸c˜ao para uma esta¸c˜ao de sazonalidade s. Os modelos que contemplam as s´eries que apresentam autocorrela¸c˜ao sazonal s˜ao conhecidos como SARIM A.

Os modelos SARIM A contˆem uma parte n˜ao sazonal, com parˆametros (p, d, q), e uma sazonal,com parˆametros (P, D, Q)s . O modelo mais geral ´e dado pela equa¸c˜ao:

(1 − φ1B − · · · − φpBp)(1 − Φ1Bs− · · · − ΦpBP S)(1 − B)d(1 − Bs)DZt=

(1 − θ1B − · · · − θqBq)(1 − Θ1Bs− · · · − ΘQBsQ) (3.13)

em que:

• (1 − φ1B − · · · − φpBp) ´e a parte auto-regressiva n˜ao-sazonal de ordem p;

• (1 − Φ1Bs− · · · − ΦpBP S) ´e a parte auto-regressiva sazonal de ordem P e per´ıodo

sazonal s;

• (1 − B)d ´e parte de integra¸c˜ao n˜ao-sazonal de ordem d;

• (1 − Bs)D ´e parte de integra¸c˜ao sazonal de ordem D e per´ıodo sazonal s;

• (1 − θ1B − · · · − θqBq) ´e a parte n˜ao-sazonal de m´edias m´oveis de ordem q;

• (1 − Θ1Bs− · · · − ΘQBsQ) ´e a parte sazonal de m´edias m´oveis de ordem Q e per´ıodo

sazonal s.

3.9.4

FACP dos modelos de Box-Jenkins

Nos processos AR, MA e ARMA temos as seguintes (FACP) te´oricas: i) em um processo AR(p) a (FACP) ´e da forma:  φkk6= 0, se k < p

φkk= 0, se k > p

ii) em um processo M A(q) a (FACP) se comporta de maneira similar `a (FAC) de um processo AR(p), isto ´e, composta por exponenciais e\ou senoides amortecidas;

(28)

3.10 Singular Spectrum Analysis 28

iii) um processo ARM A(p, q) tem (FACP) que se comporta como a (FACP) de um processo MA puro. Devido aos fatores acima, segue que a (FACP) ´e ´util para identificar modelos AR puros, n˜ao sendo t˜ao ´util para identificar modelos M A e ARM A. Uma ma-neira simples de estimar as (FACP) de um processo consistem em substituir nas equa¸c˜oes de Yullie-Walker as (FAC) por suas estimativas

rj = ˆφk1rj−1+ · · · + ˆφkkrj−k, j = 1, . . . , k,

e resolver estas equa¸c˜oes para k = 1, 2, 3, · · ·

A (FAC) tamb´em ´e utilizada na identifica¸c˜ao dos parˆametros dos modelos de Box-Jenkins a tabela 1 mostra a rela¸c˜ao entre a (FAC) e a (FACP) na identifica¸c˜ao dos modelos.

Tabela 1: Identifica¸c˜ao dos modelos

AR MA ARMA

FAC Decai

exponencial-mente

Corte brusco ap´os a defasagem q

Decai exponencialmente ap´os a defasagem q FACP Corte brusco ap´os a

defasagem p

Decai exponencial-mente

Decai exponencialmente ap´os a defasagem p

3.10

Singular Spectrum Analysis

Singular Spectrum Analysis (SSA), ´e uma t´ecnica n˜ao param´etrica que permite de-compor uma s´erie temporal em sinal e ru´ıdo. E uma t´´ ecnica ´util para filtrar dados de s´eries temporais. Menezes et al., (2004) utilizaram trˆes metodologias na abordagem SSA: An´alise de componentes principais (ACP), ACP associado com An´alise de Cluster e An´alise Gr´afica dos Vetores Singulares. Em seu artigo ´e mostrado que o melhor m´etodo em SSA ´e a An´alise Gr´afica dos vetores singulares, que ser´a usado neste projeto. SSA ´e um m´etodo recente e poderoso em s´eries temporais que incorpora elementos de an´alise cl´assica de s´eries temporais, estat´ıstica multivariada, geometria multivariada, sistemas dinˆamicos e processamentos de sinais (ELSNER; TSONIS, 1996). SSA tem sido aplicada com su-cesso em diversas ´areas: na matem´atica e f´ısica a economia e matem´atica financeira, na meteorologia e oceanografia a ciˆencias sociais (GOLYNADINA et al., 2001).

(29)

3.10 Singular Spectrum Analysis 29

O m´etodo SSA ´e um procedimento que pode ser utilizado, dentre outras aplica¸c˜oes, na remo¸c˜ao de ru´ıdo e de s´eries temporais (GOLYNADINA et al., 2001; HASSANI et al, 2012). A vers˜ao b´asica do m´etodo SSA pode ser dividida em duas etapas: decomposi¸c˜ao e reconstru¸c˜ao.

3.10.1

Decomposi¸

ao

Segundo Menezes et al. (2014), a etapa de decomposi¸c˜ao pode ser subdividida em duas partes: Incorpora¸c˜ao e decomposi¸c˜ao em valores singulares (SVD – Singular Value Decomposition).

Seja Zt= [z1, . . . zT]1×T uma s´erie temporal (HAMILTON, 1994) e considere L tal que

2 ≤ L ≤ T de modo que L ´e um parˆametro a ser estimado e ´e chamado de comprimento da janela (GOLYANDINA et al., 2001). Entende-se por Incorpora¸c˜ao o procedimento no qual uma s´erie temporal ZT ´e levada a uma matriz X = [z1, . . . , zk]L×T, para todo

k ∈ [1, . . . , K], onde K = T − L + 1. A matriz X, conhecida como matriz trajet´oria ´e uma matriz Hankel, ou seja, os elementos de xi,j tal que i + j = constante s˜ao iguais

(HASSANI et al., 2012).

Considere S = XX0. Os autovalores de S dispostos em ordem de significˆancia λ1 ≥ · · · ≥ λL ≥ 0 s˜ao obtidos e os respectivos autovalores U1, . . . , UL s˜ao encontrados.

Considere V0 = (X0UL)/

λ, como S ´e positivo semi-definido, ent˜ao a matriz trajet´oria X pode ser expressa pela decomposi¸c˜ao em valores singulares (SVD) apresentada em (3.9):

X = E1+ E2+ · · · + EL, (3.14)

onde El =

λUlVl0, para todo l = 1, . . . , L. A cole¸c˜ao (

λl, Ul, Vl) ´e conhecida como

auto-tripla da expans˜ao SVD de X. Os elementos da autotripla s˜ao definidos respectivamente por: valor singular, vetor singular `a esquerda e vetor singular `a direita de X (MENEZES et al., 2014). A contribui¸c˜ao de cada componente em (3.9) pode ser mensurada pela raz˜ao de autovalores λl/

PL

l=1λl.

3.10.2

Reconstru¸

ao

Segundo Menezes et al. (2014), a etapa de reconstru¸c˜ao est´a subdividida em duas partes: agrupamento e m´edia diagonal. A etapa de agrupamento consiste no procedimento de agrupar algumas sequˆencias de matrizes elementares resultantes da decomposi¸c˜ao SVD

(30)

3.10 Singular Spectrum Analysis 30

em grupos disjuntos e, ap´os isso, som´a-las, gerando novas matrizes elementares. Considere a sequencia PL

l=1El de matrizes elementares da expans˜ao de SVD. Agrupe

as mesmas em m grupos disjuntos utilizando algum m´etodo, por exemplo, por meio de an´alise de componentes principais, an´alise gr´afica de vetores singulares ou agrupamento hier´arquico e assumir que o conjunto de ´ındices gerado ´e dado por {I1, . . . , Im}, de modo

que a expans˜ao (3.9) pode ser reescrita como em (3.10), sendo XIi arbitr´aria tal queXIi =

Ppi j=1XIij (MENEZES et al., 2014). X = L X l=1 El = m X i=1 XIi (3.15)

O objetivo do agrupamento ´e diminuir o n´umero de componentes na expans˜ao da matriz trajet´oria X. A contribui¸c˜ao de cada componente ´e mensurada pela raz˜ao (3.11) (MENEZES et al., 2014). Ppi j=1λIij PL l=1λl . (3.16)

Considere a matriz trajet´oria X e assuma que L∗ = min(L, K) e K∗ = max(L, K). Considere x(i)l,k um elemento na linha l e coluna k na matriz XIi. O elemento z

(i)

t da

componente hz(i)t i

1×T

da s´erie temporal [zt]1×T ´e calculado por meio da m´edia diagonal

da matriz elementar XIi definida em (3.12), a partir da matriz elementar XIi.

z(i)t =                  t P l=1 x(i)l,t−l+1 t , se 1 ≤ t < L ∗ L∗ P l=1 x(i)l,t−l+1 L∗ , se L∗ ≤ t < K∗ T −K∗+1 P l=t−K∗+1 x(i)l,t−l+1 T −K∗+1 , se K ∗ ≤ t ≤ T (3.17) Cada componente h zt(i) i

1×T concentra parte da energia da s´erie temporal original

[zt]1×T que pode ser mensurada pela raz˜ao de autovalores pi P j=1 λIij/ d P l=1 λl. De acordo com

Hassani et al. (2012), podemos classificar as componentes SSA hzt(i)i

1×T

de uma s´erie temporal arbitr´aria [zt]1×T em trˆes categorais: tendˆencia, componentes harmˆonicas (ciclo

e sazonalidade) e ru´ıdo (GOLYNADINA et al., 2001).

(31)

3.11 Multi-Channel Singular Spectrum Analysis (MSSA) 31

(HASSANI et al., 2012). Tal propriedade caracteriza qu˜ao bem separados est˜ao as dife-rentes, componentes, umas das outras. Uma boa medida de separabilidade ´e a Correla¸c˜ao Ponderada. Por correla¸c˜ao ponderada weighted correlation ou w-correla¸c˜ao, podemos en-tender como uma fun¸c˜ao que quantifica a dependˆencia linear entre duas componentes SSA ZT(1) e ZT(2) definida em (3.13) (MENEZES et al., 2014).

ρ(w)ij =  ZT(i), ZT(j)  w ||ZT(i)||w||Z (j) T ||w . (3.18) onde ||ZT(i)||w = r  ZT(i), ZT(i) w ; ||ZT(j)||w = r  ZT(j), ZT(j) w ;ZT(i), ZT(j) w = T P k=1 wkz (i) k z (j) k e wk= min{k, L, T − k}.

Atrav´es da separabilidade, pode-se verificar estatisticamente se duas componentes SSA est˜ao bem separadas, em termos de dependˆencia linear. Se o valor absoluto da w-correla¸c˜ao ´e pequeno (HASSANI et al., 2012), ent˜ao as componentes SSA correspondentes s˜ao classificadas como w-ortogonais (ou quase w-ortogonais); caso contr´ario, s˜ao ditas mal separadas. Salienta-se que comumente utiliza-se a correla¸c˜ao ponderada na fase de agrupamento SSA (GOLYNADINA et al., 2001).

3.11

Multi-Channel Singular Spectrum Analysis (MSSA)

A metodologia MSSA ´e uma extens˜ao do SSA para trabalhar com an´alise e previs˜ao de s´eries temporais multidimensionais. O procedimento MSSA segue a mesma estrutura do procedimento SSA com a diferen¸ca de fazˆe-lo usando um sistema de s´eries temporais em face de uma ´unica s´erie. Considere o sistema de s s´eries temporais de tamanho T .

Z(k) =zt(k)

T

t=1 (3.19)

Onde k = 1, . . . , s. O caso particular do procedimento MSSA para , equivale ao procedi-mento usando SSA (GOLYNADINA et al., 2001).

Escolhendo um ´unico tamanho de janela janela de defasagem, L para todas as s s´eries, onde 1 < L < T , na fase de incorpora¸c˜ao MSSA s˜ao obtidos k = T − L + 1 vetores defasados Xj(k) =



zj(k), . . . , zj+L−1(k) T

, j = 1, . . . , K para cada s´erie Z(k), k = 1, . . . , s. Assim, para cada s´erie Z(k) , ´e poss´ıvel obter atrav´es de um mapa invert´ıvel F(k), uma matriz de trajet´oria como em (3.13).

(32)

3.12 Estat´ısticas de Aderˆencia 32 X(k) =        z1(k) z(k)2 · · · zK(k) z2(k) z(k)3 · · · zK+1(k) .. . ... . .. ... zL(k) z(k)L+1 · · · zT(k)        (3.20)

A matriz trajet´oria da s´erie multidimensional Z(1), Z(2), · · · , Z(s)´e, ent˜ao, uma ma-triz de dimens˜ao Ls × K e tem a seguinte forma:

X =hX1(1) : . . . : XK(1) : . . . : X1(s): . . . : Xk(s)i

T

=X(1) : . . . : X(s)T (3.21)

O espa¸co trajet´oria (GOLYNADINA et al., 2001) ´e definido por um espa¸co linear spanado pelos vetores defasados (colunas da matriz trajet´oria X).

A partir de S = XXT, onde os autovalores de S em ordem de magnitude λ

1 ≥ · · · ≥

λLS ≥ 0, U1, . . . , ULS os respectivos autovalores associados, d = maxj : λj > 0 o posto da

matriz S e Vj =

XTU j

pλj

, j = 1, . . . , d. Denotando Ej =pλjUjVjT, ent˜ao o SVD da matriz

trajet´oria de X pode ser escrito por: X = E1+ · · · + Ed.

De forma an´aloga, a fase de agrupamento particiona o conjunto de ´ındices em sub-conjuntos disjuntos I1, . . . , Im de modo que a matriz trajet´oria pode ser reescrita no que

pode ser chamado de decomposi¸c˜ao agrupada:

X = XI1+ · · · + XIm (3.22)

Por fim a m´edia diagonal ´e aplicada a cada uma das s´eries decompostas em3.11 e ent˜ao o grupo de sinais reconstru´ıdos dado por eZ(k)=

e Z(k)T

t=1

, k = 1, . . . , s ´e obtido.

3.12

Estat´ısticas de Aderˆ

encia

MAE ´e Mean Absolute Error, apresenta o afastamento m´edio das previs˜oes em rela¸c˜ao aos valores observados.

(33)

3.12 Estat´ısticas de Aderˆencia 33 M AE = N X t=1 [|zt− ˆzt|] × 1 N Onde

• zT ´e o valor observado da s´erie

• ˆzT ´e o valor previsto da s´erie

• N ´e o n´umero de per´ıodos usados

MAPE ´e Mean Absolute Percentage Error, ´e calculado como a m´edia do erro percen-tual: M AP E = N X t=1  |zt− ˆzt| zt  × 1 N Onde

• zT ´e o valor observado da s´erie

• ˆzT ´e o valor previsto da s´erie

• N ´e o n´umero de per´ıodos usados

RMSE ´e Root Mean Squared Error, apresenta valores do erro nas mesmas dimens˜oes da vari´avel analisada:

RM SE = 2 v u u t  PN t=1(zt− ˆzt 2 N Onde

• zT ´e o valor observado da s´erie

• ˆzT ´e o valor previsto da s´erie

• N ´e o n´umero de per´ıodos usados

O coeficiente de determina¸c˜ao, tamb´em chamado de R2, ´e uma medida de ajustamento

(34)

3.13 Resumo da Metodologia 34

o modelo consegue explicar os valores observados. Quanto maior o R2, mais explicativo ´e o modelo, melhor ele se ajusta `a amostra.

R2 = 1 − PN t=1(zt− ˆzt) 2 PN t=1(zt− ¯zt) 2 ! Onde

• zT ´e o valor observado da s´erie

• ˆzT ´e o valor observado da s´erie

• ¯z ´e a m´edia dos valores observados

O Crit´erio de Informa¸c˜ao Bayesiano (BIC) ´e definido como:

BICp = −2log(Lp) + [(p + 1) + 1]log(N ).

O BIC aumentam conforme SQE aumenta. Al´em disso, o crit´erio penaliza modelos com muitas vari´aveis sendo que valores menores do BIC s˜ao prefer´ıveis.

SQE = PN

t=1(zt− ˆzt) 2

N

Como modelos com mais vari´aveis tendem a produzir menor SQE mas usam mais parˆametros, a melhor escolha ´e balancear o ajuste com a quantidade de vari´aveis.

3.13

Resumo da Metodologia

No Cap´ıtulo 2, foram expostos os objetivos deste projeto. A figura 1, mostra exata-mente o processo para modelagem via Holt-Winters e Box-Jenkins. Ser˜ao introduzidas v´arias s´eries originais onde as mesmas passar˜ao pela filtragem SSA e MSSA, onde ser˜ao divididas em 3 partes: Tendˆencia, Harmˆonica e Ru´ıdo. Ap´os a filtragem ser´a retirado o Ru´ıdo, onde a nova s´erie apenas com as partes: Tendˆencia e Harmˆonica ser´a analisada e feita a compara¸c˜ao com a mesma s´erie filtrada via MSSA e sem a filtragem SSA. A partir das s´eries: original e filtrada ser´a feita a modelagem Box-Jenkins e de Holt-Winters para an´alises. Os softwares utilizados para o estudo foram: FPW (Forecast Pro for Windows) para fazer a modelagem Holt-Winters e Box-Jenkins e CaterpillarSSA para abordagem SSA via an´alise gr´afica dos componentes principais. Os resultados obtidos ao longo dos experimentos computacionais realizados s˜ao comparados em termos das estat´ısticas de

(35)

3.13 Resumo da Metodologia 35

aderˆencia: MAPE (Mean Absolute Percentage Error) , RMSE (Root Mean Squared Er-ror), BIC (Bayesian Information Criterion) e R2 (coeficiente de determina¸c˜ao).

(36)

36

4

An´

alise dos Resultados

4.1

Dados originais

Ap´os toda prepara¸c˜ao necess´aria, foram feitas as an´alises gr´aficas e descritivas das s´eries das 5 regi˜oes brasileira no per´ıodo de janeiro de 1970 a dezembro de 2014. As figuras 3 a 7 apresentam os gr´aficos das s´eries em estudo.

Figura 3: S´erie hist´orica Rio Branco - AC

Observa-se na figura 3 que ao longo dos 45 anos a s´erie hist´oria de m´edia mensais de precipita¸c˜ao pluviom´etrica de Rio Branco, apresentou mudan¸ca ao longo dos anos, tendo apresentados picos superiores aos 14 mil´ımetros de chuva, e chegando a 16 mil´ımetros/m2. Em janeiro de 2014, o Acre registrou sua maior m´edia hist´orica de chuva no mˆes de janeiro no Estado.

A figura 4 mostra que a regi˜ao de Recife foi atingida por picos de precipita¸c˜ao plu-viom´etrica de 24 at´e 26 mil´ımetros, nos anos de 1973, 2004 e 2011, quando em

(37)

carac-4.1 Dados originais 37

Figura 4: S´erie hist´orica Recife - PE

ter´ıstica normal seu n´ıvel de precipita¸c˜ao tende estar perto de 15 mil´ımetros. O mˆes de abril de 1973 teve a maior m´edia de precipita¸c˜ao pluviom´etrica do Estado.

Figura 5: S´erie hist´orica Bras´ılia - DF

Observa-se na figura 5 que o n´ıvel de precipita¸c˜ao pluviom´etrica tende estar perto do 10 mil´ımetros, tendo atingido em alguns anos como 2006 o ´ındice de 17 mil´ımetros. O mˆes de outubro de 2006, foi o mais chuvoso para o mˆes citado da hist´oria de Bras´ılia.

Observa-se na figura 6 que o n´ıvel de precipita¸c˜ao pluviom´etrica na s´erie hist´orica do Rio de Janeiro se comportou em sua grande maioria com observa¸c˜oes de at´e 10 mil´ımetros, em alguns casos chegando at´e a 15 mil´ımetros, por´em no ano de 2007 observa-se o maior

(38)

4.1 Dados originais 38

Figura 6: S´erie hist´orica Rio de Janeiro - RJ

pico, no qual a s´erie atingiu os 20 mil´ımetros. Neste mesmo ano a cidade de Nova Friburgo foi uma das mais atingidas, e 12 munic´ıpios do estado decretaram situa¸c˜ao de emergˆencia.

Figura 7: S´erie hist´orica Porto Alegre - RS

A figura 7 mostra que dentre as s´eries de cada regi˜ao apresentada, Porto Alegre ´e a que possui os menores valores observados entre as s´eries, tendo no geral seu ´ındice perto dos 8 mil´ımetros, e tendo sua maior anomalia no ano de 1982, quando a s´erie registrou a m´edia pluviom´etrica mensal de 12 mil´ımetros. Neste mesmo ano o mundo estava sob um dos mais intenso epis´odios de El Ni˜no. Porto Alegre chegou a registrar 138,8 mil´ımetros de chuva em um ´unico dia.

(39)

4.1 Dados originais 39

A tabela 2 apresenta as m´edias e desvios padr˜ao das m´edias mensais pluviom´etricas no per´ıodo de janeiro de 1970 a dezembro de 2014.

Tabela 2: Estat´ısticas da m´edia pluviom´etrica mensal

Mˆes Estat´ıstica Rio Branco Recife Bras´ılia Rio de Janeiro Porto Alegre

Jan M´edia 9.27 3.30 7.27 8.53 3.45 Desvio Padr˜ao 3.08 2.17 3.56 3.97 1.69 Fev M´edia 10.22 5.00 6.65 5.73 3.86 Desvio Padr˜ao 2.73 3.48 3.18 3.20 1.73 Mar M´edia 8.33 6.93 6.56 5.28 3.26 Desvio Padr˜ao 2.99 3.96 2.66 2.54 1.61 Abr M´edia 6.10 9.93 4.44 3.69 3.39 Desvio Padr˜ao 2.72 5.72 2.47 1.75 1.84 Mai M´edia 3.08 10.29 0.99 2.15 3.45 Desvio Padr˜ao 1.67 4.57 0.86 1.01 1.98 Jun M´edia 1.26 12.75 0.32 1.34 4.72 Desvio Padr˜ao 1.20 4.42 0.67 0.99 2.65 Jul M´edia 1.16 11.37 0.24 1.39 4.42 Desvio Padr˜ao 1.11 4.62 0.57 1.01 2.33 Ago M´edia 1.69 6.68 0.57 1.45 4.28 Desvio Padr˜ao 1.16 3.49 0.78 1.33 2.19 Set M´edia 3.15 3.70 1.72 2.95 4.36 Desvio Padr˜ao 1.86 2.50 1.37 2.09 2.42 Out M´edia 4.91 2.06 5.27 4.54 3.90 Desvio Padr˜ao 2.04 1.49 3.16 1.80 2.14 Nov M´edia 6.65 1.32 7.90 7.89 3.53 Desvio Padr˜ao 2.39 0.81 2.76 3.12 2.14 Dez M´edia 8.13 1.93 8.05 9.57 3.35 Desvio Padr˜ao 2.23 1.48 2.80 2.79 1.48

Na tabela 2 pode-se perceber os meses com maiores volumes de chuva de cada regi˜ao. Observa-se que em Rio Branco o per´ıodo com maiores ´ındices pluviom´etricos est´a de dezembro a abril. Em Recife os maiores ´ındices est˜ao de abril a julho e neste mesmo per´ıodo ´e o per´ıodo de maior dispers˜ao entre as m´edias registradas. Bras´ılia apresenta seus maiores ´ındices no per´ıodo de novembro a mar¸co, e grande seca de maio a agosto, onde a m´edia est´a abaixo de 1 mm. O munic´ıpio do Rio de Janeiro tem seus maiores ´ındices pluviom´etricos no per´ıodo de novembro a janeiro, e pouca chuva de junho a agosto, onde a s´erie registra em m´edia menos de 2 mm de chuva. Porto Alegre de todas as s´eries foi a que apresentou menor varia¸c˜ao entre os meses, n˜ao tendo grande diferen¸ca entre os meses, por´em de junho a setembro chovendo um pouco mais que os demais meses.

(40)

4.2 Filtragem SSA e MSSA 40

4.2

Filtragem SSA e MSSA

Ap´os conhecer as caracter´ısticas das s´eries originais, foram realizadas as filtragens de cada uma das s´eries via SSA e MSSA. Com o objetivo de realizar a filtragem das s´eries originais, foi considerado o comprimento da janela L = T /2 = 270. A decomposi¸c˜ao das 3 componentes da s´erie, tendˆencia, harmˆonica e ru´ıdo, foram feitas pela an´alise gr´afica dos autovetores (ou vetores singulares). A figura 8 apresenta os 9 primeiros vetores singulares da s´erie do Rio de Janeiro, pelo m´etodo SSA, e sua repetitivas contribui¸c˜ao para s´erie. Atrav´es da figura 8 observa-se que o autovetor 1 corresponde a componente de tendˆencia, os autovetores 2 a 7 pertencem a componente harmˆonica e os demais autovetores foram considerados pertencente a componente ruidosa. O crit´erio utilizado para selecionar o melhor filtro foi aquele que nos deixava com a menor correla¸c˜ao entre as componentes.

A tabela 3 apresenta as correla¸c˜oes entre as componentes tendˆencia, harmˆonica e ruidosa, para cada uma das 5 s´eries pela filtragem SSA e pela filtragem MSSA.

Tabela 3: Tabela de correla¸c˜ao entre as componentes da s´erie filtrada

Filtragem S´erie Componente Tendˆencia Harmˆonica Ru´ıdo

SSA Rio Branco Tendˆencia 1 0 0,001 Harmˆonica 0 1 0,018 Ru´ıdo 0,001 0,018 1 Recife Tendˆencia 1 0 0,005 Harmˆonica 0 1 0,01 Ru´ıdo 0,005 0,01 1 Bras´ılia Tendˆencia 1 0,001 0,004 Harmˆonica 0,001 1 0,023 Ru´ıdo 0,004 0,023 1 Rio de Janerio Tendˆencia 1 0 0,001 Harmˆonica 0 1 0,013 Ru´ıdo 0,001 0,013 1 Porto Alegre Tendˆencia 1 0,004 0,001 Harmˆonica 0,004 1 0,053 Ru´ıdo 0,001 0,053 1 MSSA Rio Branco Tendˆencia 1 0 0,004 Recife Bras´ılia Harmˆonica 0 1 0,017 Rio de Janerio

Porto Alegre Ru´ıdo 0,004 0,017 1

(41)

4.2 Filtragem SSA e MSSA 41

Figura 8: Os 9 primeiros vetores singulares na filtragem SSA para s´erie do Rio de Janeiro e suas respectivas contribui¸c˜oes

os casos. Como a correla¸c˜ao foi muito pequena, pode-se dizer que cada componente est´a bem definida, ou seja, os vetores singulares est˜ao bem classificados.

As figuras 9 a 13 mostram o gr´afico de cada uma das componentes para cada s´erie pela filtragem SSA. A figura 14 mostra o gr´afico de cada uma das componentes pela filtragem MSSA.

Observa-se atrav´es das figuras 9 a 13, que cada uma das regi˜oes apresentam compor-tamento diferente entre si e que cada uma das 3 componentes est˜ao bem definidas. Ap´os se verificar a qualidade da separa¸c˜ao das componentes, o passo seguinte foi a elimina¸c˜ao da componente ruidosa, tendo cada s´erie filtrada apenas as componentes harmˆonica e tendˆencia.

(42)

4.2 Filtragem SSA e MSSA 42

Figura 9: Componentes s´erie Rio Branco via SSA

Na figura 14 pode-se observar a diferen¸ca dentro de cada gr´afico, pois a cada 540 pontos (janeiro de 1970 a dez de 2014) est´a contida a componente de uma s´erie, a ordem

(43)

4.2 Filtragem SSA e MSSA 43

Figura 10: Componentes s´erie Recife via SSA

´e Rio Branco, Recife, Bras´ılia, Rio de Janeiro e Porto Alegre e, como pode ser observado, as trˆes componentes est˜ao bem definidas.

(44)

4.2 Filtragem SSA e MSSA 44

(45)

4.2 Filtragem SSA e MSSA 45

(46)

4.2 Filtragem SSA e MSSA 46

(47)

4.2 Filtragem SSA e MSSA 47

(48)

4.2 Filtragem SSA e MSSA 48

4.2.1

eries Filtradas

Ap´os a elimina¸c˜ao da componente ruidosa de cada uma das s´eries, foram criados gr´aficos com a s´erie original e filtrada a fim de se observar o comportamento anterior e posterior ao filtro. As figuras 15 a 19 apresenta o gr´afico da s´erie original e filtrada de cada uma das s´eries. Observa-se que nas figuras 15 a 19 que o filtro tornou as s´eries mais homogˆeneas, as deixando mais suave e eliminando os picos observados nas s´eries originais. Os mesmo podem estar associados `a caracter´ısticas que apenas o fator do ´ındice pluviom´etrico n˜ao seria suficiente para explicar.

Figura 15: Compara¸c˜ao entre a s´erie original e filtrada do Rio Branco via SSA

(49)

4.2 Filtragem SSA e MSSA 49

Figura 17: Compara¸c˜ao entre a s´erie original e filtrada de Bras´ılia via SSA

Figura 18: Compara¸c˜ao entre a s´erie original e filtrada do Rio de Janeiro via SSA

(50)

4.2 Filtragem SSA e MSSA 50

4.2.1.1 Modelos de previs˜ao

Em posse das s´eries filtradas via SSA e MSSA, foram criados os modelos preditivos de cada uma delas. As s´eries, tanto original, quanto filtradas, foram modeladas pela metodologia Holt-Winters e Box-Jenkins. A tabela 4 mostra o melhor modelo por cada um dos dois m´etodos pelo programa Forecast For Windows (FPW) para cada uma das s´eries.

Tabela 4: Modelos anterior e posterior `a filtragem das 5 s´eries

S´erie Modelo Holt-Winters Box & Jenkins

Rio Branco

SSA H-W+, sem tendˆencia SARIM A(1, 0, 4)(1, 1, 1)12

MSSA H-W+, sem tendˆencia SARIM A(1, 1, 3)(1, 1, 2)12

Sem Filtro H-W+, sem tendˆencia SARIM A(0, 0, 0)(1, 0, 1)12

Recife

SSA H-W+ SARIM A(2, 0, 3)(1, 1, 3)12

MSSA H-W+, sem tendˆencia SARIM A(0, 1, 3)(1, 1, 2)12

Sem Filtro H-W×, sem tendˆencia SARIM A(1, 0, 0)(1, 0, 1)12

Bras´ılia

SSA H-W+ SARIM A(1, 0, 3)(1, 1, 3)12

MSSA H-W+, sem tendˆencia SARIM A(1, 1, 4)(1, 1, 2)12

Sem Filtro H, sem tendˆencia SARIM A(0, 0, 0)(2, 0, 1)12

Rio de Janeiro

SSA H-W+, sem tendˆencia SARIM A(2, 0, 2)(1, 1, 4)12

MSSA H-W+, sem tendˆencia SARIM A(0, 1, 3)(1, 1, 2)12

Sem Filtro H-W+, sem tendˆencia SARIM A(0, 0, 0)(2, 0, 1)12

Porto Alegre

SSA H, sem tendˆencia SARIM A(2, 0, 3)(2, 0, 2)12

MSSA H-W×, sem tendˆencia SARIM A(1, 1, 1)(0, 1, 4)12

Sem Filtro H-W+, sem tendˆencia SARIM A(1, 0, 0)(1, 0, 0)12

Na tabela 4 H-W significa que o modelo representado ´e de Holt-Winter e apenas H representa modelo de Holt (sem sazonalidade), o sinal de mais + indica sazonalidade aditiva e o sinal de × sazonalidade multiplicativa. Pode-se notar na tabela 4 que a maioria das s´eries s´eries foram modeladas pelo m´etodo de Holt-Winters sem tendˆencia. O fato dos modelos repetirem o n´umero de parˆametros, n˜ao se trata do mesmo modelo, pois os valores dos parˆametros se diferenciam.

4.2.2

Estat´ısticas de aderˆ

encia

Ap´os ajustar-se os modelos de Holt-Winters e Box-Jenkins para cada uma das s´eries, foram tiradas as estat´ısticas de aderˆencia de cada um dos 30 modelos, a fim de se comparar o melhor modelo e verificar a se a filtragem via SSA ou MSSA apresentou melhora no

(51)

4.2 Filtragem SSA e MSSA 51

ajuste do modelo, e se possui diferen¸ca na qualidade do ajuste entre os m´etodos SSA para o MSSA. Neste projeto ser´a utilizado as seguintes estat´ısticas de aderˆencia: MAPE, RMSE, BIC e R2 ajustado.

Tabela 5: Estat´ısticas de Aderˆencia dos Modelos

S´erie M´etodo Modelo MAPE RMSE BIC R2

Rio Branco

SSA Holt-Winters 0,6744 0,7918 0,8011 0,9412

Box-Jenkins 0,3290 0,4704 0,4899 0,9790

MSSA Holt-Winters 0,0515 0,1919 0,1942 0,9964

Box-Jenkins 0,0046 0,0198 0,0207 1,0000

Sem Filtro Holt-Winters 1,1260 2,2210 2,2470 0,6569

Box-Jenkins 1,0660 2,2230 2,2490 0,6564 Recife SSA Holt-Winters 0,3257 1,1400 1,1600 0,9216 Box-Jenkins 0,0946 0,3226 0,3400 0,9996 MSSA Holt-Winters 0,1759 0,7467 0,7554 0,9647 Box-Jenkins 0,0283 0,1119 0,1572 0,9983

Sem Filtro Holt-Winters 0,7856 3,5680 3,6100 0,5265

Box-Jenkins 0,6273 3,6130 2,6790 0,6032 Bras´ılia SSA Holt-Winters 0,2982 0,2378 0,2420 0,9940 Box-Jenkins 0,1210 0,0635 0,0666 0,9996 MSSA Holt-Winters 0,2876 0,1910 0,1932 0,9960 Box-Jenkins 0,0271 0,0289 0,0303 0,9999

Sem Filtro Holt-Winters 3,8670 3,5770 3,5980 0,1123

Box-Jenkins 1,8510 2,3570 2,3980 0,6177 Rio de Janeiro SSA Holt-Winters 0,1334 0,4196 0,4245 0,9785 Box-Jenkins 0,0324 0,1136 0,1430 0,9973 MSSA Holt-Winters 0,0591 0,2173 0,2199 0,9943 Box-Jenkins 0,0105 0,0418 0,0463 0,9997

Sem Filtro Holt-Winters 0,9572 2,3460 2,3730 0,5786

Box-Jenkins 0,9508 2,3450 2,3870 0,5781 Porto Alegre SSA Holt-Winters 0,0952 0,4183 0,4232 0,5017 Box-Jenkins 0,0068 0,0318 0,0335 0,9971 MSSA Holt-Winters 0,0536 0,2771 0,2804 0,7888 Box-Jenkins 0,0054 0,0289 0,0310 0,9976

Sem Filtro Holt-Winters 0,8139 2,0440 2,0680 0,0392

Box-Jenkins 0,8376 2,0810 2,0570 0,0187

Na tabela 5 pode-se observar que em todas as estat´ısticas de aderˆencia ter aplicado o filtro melhorou a qualidade dos ajustes, diminuindo os erros (MAPE, RMSE, BIC) e aumentando a qualidade preditiva do modelo (R2 ajustado). Nota-se tamb´em que

a filtragem MSSA se apresentou melhor que a filtragem SSA, por´em a diferen¸ca entre as duas foi baixa, e quando qualquer uma das duas foi aplicada, obtiveram-se grandes melhoras nos ajustes dos dados em compara¸c˜ao a s´erie original.

(52)

4.2 Filtragem SSA e MSSA 52

da amostra (in sample), chamado tamb´em de amostra de treinamento, e fora da amostra (out of sample) chamado amostra de teste, na primeira parte s˜ao utilizados 516 das 540 observa¸c˜oes como fase para criar os modelos e na segunda parte, 24 observa¸c˜oes finais como fase de teste dos modelos. Na primeira parte, os valores modelados s˜ao obtidos a partir dos dados hist´oricos da s´erie. Na segunda parte, os valores modelados s˜ao obtidos a partir dos valores anteriores do pr´oprio modelo, configurando-se assim, como previs˜oes que podem ser comparadas com valores reais podendo, desta forma, comparar os resultados tanto na modelagem como na previs˜ao.

Tabela 6: Estat´ısticas de Aderˆencia dos Modelos (In Sample)

S´erie M´etodo Modelo MAPE RMSE BIC R2

Rio Branco

SSA Holt-Winters 0,7196 0,8036 0,8134 0,9389

Box-Jenkins 0,2499 0,4017 0,4191 0,9846

MSSA Holt-Winters 0,0529 0,1956 0,1980 0,9963

Box-Jenkins 0,0069 0,0265 0,0276 0,9999

Sem Filtro Holt-Winters 1,1680 2,1730 2,2000 0,6650

Box-Jenkins 1,1650 2,1570 2,2100 0,6687 Recife SSA Holt-Winters 0,3313 1,1520 1,1740 0,9202 Box-Jenkins 0,0905 0,3099 0,3272 0,9942 MSSA Holt-Winters 0,1824 0,7630 0,7723 0,9631 Box-Jenkins 0,0250 0,0994 0,1370 0,9987

Sem Filtro Holt-Winters 0,8126 3,6110 3,6550 0,5270

Box-Jenkins 0,6140 3,7090 2,6630 0,6104 Bras´ılia SSA Holt-Winters 0,3124 0,2310 0,2353 0,9943 Box-Jenkins 0,0996 0,0510 0,0535 0,9997 MSSA Holt-Winters 0,2884 0,1864 0,1887 0,9961 Box-Jenkins 0,0341 0,0250 0,0260 0,9999

Sem Filtro Holt-Winters 3,6340 3,5420 3,5630 0,1228

Box-Jenkins 0,6154 2,3450 2,3880 0,6139 Rio de Janeiro SSA Holt-Winters 0,1192 0,3728 0,3773 0,9828 Box-Jenkins 0,0298 0,0981 0,1266 0,9978 MSSA Holt-Winters 0,0597 0,2182 0,2209 0,9942 Box-Jenkins 0,0104 0,0395 0,0454 0,9997

Sem Filtro Holt-Winters 0,9315 2,3300 2,3580 0,5913

Box-Jenkins 0,9396 2,3330 2,3610 0,5904 Porto Alegre SSA Holt-Winters 0,0987 0,4275 0,4327 0,4999 Box-Jenkins 0,0067 0,0302 0,0319 0,9975 MSSA Holt-Winters 0,0550 0,2823 0,2857 0,7803 Box-Jenkins 0,0049 0,0243 0,0291 0,9982

Sem Filtro Holt-Winters 0,8444 2,0500 2,0750 0,0267

Box-Jenkins 0,8571 2,0580 2,0700 0,0215

Como pode-se observar nas tabelas 6 e 7 a filtragem tamb´em MSSA e SSA se apre-sentaram melhor quando comparado aos modelos das s´eries originais, mostrando tamb´em

(53)

4.2 Filtragem SSA e MSSA 53

Tabela 7: Estat´ısticas de Aderˆencia dos Modelos (Out of Sample)

S´erie M´etodo Modelo MAD MAPE GRMAE

Rio Branco

SSA Holt-Winters 0,7010 0,4240 0,3900

Box-Jenkins 0,4560 0,1950 0,2360

MSSA Holt-Winters 0,1310 0,0330 0,0740

Box-Jenkins 0,1250 0,0390 0,0850

Sem Filtro Holt-Winters 2,4520 0,6570 0,5220

Box-Jenkins 2,5710 0,6700 0,5710 Recife SSA Holt-Winters 0,6570 0,1990 0,2920 Box-Jenkins 0,2850 0,0770 0,1640 MSSA Holt-Winters 0,1190 0,0350 0,0490 Box-Jenkins 0,1790 0,0820 0,0650

Sem Filtro Holt-Winters 1,9740 0,4660 0,4690

Box-Jenkins 2,0100 0,4410 0,6070 Bras´ılia SSA Holt-Winters 0,3600 0,2700 0,0850 Box-Jenkins 0,2450 0,2030 0,0560 MSSA Holt-Winters 0,2630 0,4390 0,2060 Box-Jenkins 0,1170 0,2690 0,0610

Sem Filtro Holt-Winters 3,2280 -

-Box-Jenkins 1,7300 - -Rio de Janeiro SSA Holt-Winters 0,8470 0,4470 0,7630 Box-Jenkins 0,2430 0,1120 0,2220 MSSA Holt-Winters 0,1550 0,0460 0,0990 Box-Jenkins 0,0560 0,0160 0,0320

Sem Filtro Holt-Winters 1,8620 0,8300 0,9930

Box-Jenkins 1,8570 0,8270 0,9560 Porto Alegre SSA Holt-Winters 0,0800 0,0200 0,5140 Box-Jenkins 0,0240 0,0060 0,1430 MSSA Holt-Winters 0,0950 0,0250 0,1800 Box-Jenkins 0,0520 0,0140 0,1300

Sem Filtro Holt-Winters 1,4700 -

-Box-Jenkins 1,5460 -

Referências

Documentos relacionados

Statistical relationships between the variability of the area covered by double tropopause events (DTs), the strength of the tropical upwelling, the total column ozone and of the

No final, os EUA viram a maioria das questões que tinham de ser resolvidas no sentido da criação de um tribunal que lhe fosse aceitável serem estabelecidas em sentido oposto, pelo

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do

Neste estudo foram estipulados os seguintes objec- tivos: (a) identifi car as dimensões do desenvolvimento vocacional (convicção vocacional, cooperação vocacio- nal,

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

• Os municípios provavelmente não utilizam a análise dos dados para orientar o planejamento de suas ações;. • Há grande potencialidade na análise dos micro dados do Sisvan

Todavia, nos substratos de ambos os solos sem adição de matéria orgânica (Figura 4 A e 5 A), constatou-se a presença do herbicida na maior profundidade da coluna

Quanto ao tratamento periodontal em pacientes com coagulopatas hereditárias, é correto afirmar: a Polimentos coronarianos devem ser realizados de maneira esporádica, pois