Jo˜
ao Marcos Amorim dos Santos
Modelagem e Previs˜
ao de S´
eries Temporais
de Precipita¸
c˜
ao Pluviom´
etrica sob as
Abordagens Singular Spectrum Analysis e
Multi-channel Singular Spectrum Analysis
Niter´oi - RJ, Brasil 29 de Julho de 2016
Universidade Federal Fluminense
Jo˜
ao Marcos Amorim dos Santos
Modelagem e Previs˜
ao de S´
eries
Temporais de Precipita¸
c˜
ao
Pluviom´
etrica sob as Abordagens
Singular Spectrum Analysis e
Multi-channel Singular Spectrum
Analysis
Trabalho de Conclus˜ao de Curso
Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.
Orientador: Prof. Mois´es Lima de Menezes
Niter´oi - RJ, Brasil 29 de Julho de 2016
Universidade Federal Fluminense
Jo˜ao Marcos Amorim dos Santos
Modelagem e Previs˜ao de S´eries Temporais
de Precipita¸c˜ao Pluviom´etrica sob as
Abordagens Singular Spectrum Analysis e
Multi-channel Singular Spectrum Analysis
Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Mo-
delagem e Previs˜ao de S´eries Temporais de Precipita¸c˜ao Plu- viom´etrica sob as Abordagens Singular Spectrum Analysis e Multi-channel Singular Spectrum Analysis”, defendida por
Joa˜o Marcos Amorim dos Santos e aprovada em 29 de Julho de 2016, na cidade de Nitero´i, no Estado do Rio de Janeiro, pela banca examinadora constituída pelos professores:
Prof. Dr. Mois´es Lima de Menezes
Orientador
Departamento de Estatística – UFF
Profa. Dra. Keila Mara Cassiano
Departamento de Estatística - UFF
Prof. MSc. Francisco Carlos Santana de Azeredo Pinto
Departamento de Estat´ıstica - UFF
S237 Santos, João Marcos Amorim dos
2016 Modelagem e previsão de séries temporais de precipitação pluviométrica sob as abordagens singular spectrum analysis e multi-channel singular spectrum analysis /João Marcos Amorim dos Santos. - Niterói: [s. n.], 2016.
57 f.
Trabalho de Conclusão de Curso - (Bacharelado em Es- tatística) – Universidade Federal Fluminense, 2016.
1. Análise espectral 2. Modelagem. 3. Precipitação pluviométrica I. Título.
Resumo
A previs˜ao de precipita¸c˜oes pluviom´etrica ´e uma importante ferramenta no aux´ılio ao planejamento de a¸c˜oes e projetos. Prever o volume pluviom´etrico se tornou essencial dado a rela¸c˜ao da chuva com o ambiente em que vivemos, seja pela rela¸c˜ao deste ´ındice com a mobilidade urbana, agricultura, inunda¸c˜oes, eros˜oes, usinas hidrel´etricas. Gerar modelos preditivos de precipita¸c˜ao pluviom´etrica tem se tornado cada vez mais necess´ario, mediante as necessidades do crescimento global. Em pleno s´eculo XXI tem-se ouvido falar sobre a necessidade de produ¸c˜ao de energia limpa (ex. Usinas hidrel´etricas), melhor aproveitamento da ´agua, dado que algumas popula¸c˜oes tem sofrido com racionamento de ´
agua dado o baixo volume dos reservat´orios. Todos esses projetos dependem de previs˜oes de precipita¸c˜ao pluviom´etrica, e poder gerar modelos com melhor acur´acia tem grande valor para esses projetos. Dentre as maneiras de se melhorar a acur´acia de previs˜oes, tem-se a filtragem das s´eries, dentro das filtragens existem 2 m´etodos, Singular Spectrum Analysis (SSA) e Multi-channel Singular Spectrum Analysis (MSSA). Este estudo teve o objetivo de filtrar 5 s´eries de precipita¸c˜ao pluviom´etrica, cada uma de uma regi˜ao brasileira, e criar modelos de preditivos de Holt-Winters e Box-Jenkins, tanto para as s´eries sem filtro e para as s´eries filtradas pelos m´etodos SSA e MSSA, comparar as estat´ısticas de aderˆencia destes modelos, verificar se de fato a filtragem melhorou a acur´acia da previs˜ao, e se a metodologia MSSA ´e melhor que a SSA ou ambas tem pouca diferen¸ca nos resultados quando comparada as duas. Os resultados deste estudo mostram que realizar a filtragem das s´eries seja pelo m´etodo SSA ou MSSA melhorou muito a acur´acia do modelo, em todas as estat´ısticas de aderˆencia pode-se observar a melhora dos valores quando a s´erie passou por um dos filtros. Comparando os dois m´etodos de filtragem, SSA e MSSA, observou-se que o m´etodo MSSA se apresentou melhor na maioria das estat´ısticas de aderˆencia comparado ao SSA, por´em essa diferen¸ca entre ambos n˜ao foi muito grande. A conclus˜ao deste trabalho mostra que aplicar a filtragem SSA ou MSSA pode gerar melhores previs˜oes, que podem ser usados em diferentes projetos h´ıdricos.
Palavras-chaves: Precipita¸c˜ao Pluviom´etrica, S´eries Temporais, Singular Spectrum Analy-sis, Multi-Channel Singular Spectrum AnalyAnaly-sis, Filtragem, Modelagem, Box-Jenkins, Holt-Winters.
Dedicat´
oria
Assim diz o SENHOR ao seu ungido, a Ciro, a quem tomo pela m˜ao direita, para abater as na¸c˜oes diante de sua face, e descingir os lombos dos reis, para abrir diante dele as portas, e as portas n˜ao se fechar˜ao.
Eu irei adiante de ti, e endireitarei os caminhos tortuosos; quebrarei as portas de bronze, e despeda¸carei os ferrolhos de ferro.
Dar-te-ei os tesouros escondidos, e as riquezas encobertas, para que saibas que eu sou o Senhor, o Deus de Israel, que te chama pelo teu nome.
Por amor de meu servo Jac´o, e de Israel, meu eleito, eu te chamei pelo teu nome, pus o teu sobrenome, ainda que n˜ao me conhecesses.
Eu sou o Senhor, e n˜ao h´a outro; fora de mim n˜ao h´a Deus; eu te cingirei, ainda que tu n˜ao me conhe¸cas;
Para que se saiba desde o nascente do sol, e desde o poente, que fora de mim n˜ao h´a outro; eu sou o Senhor, e n˜ao h´a outro.
Agradecimentos
A Deus, pois at´e aqui me ajudou o Senhor.
Aos meus pais, Marcos Antˆonio e Sandra Maria, por toda compreens˜ao, ajuda e tudo que fizeram por mim para eu chegar at´e este momento.
`
A minha irm˜a Juliana Amorim, por n˜ao me tirar do s´erio mais do que as provas me tiravam.
A todos meus parentes, tios, tias, primos, primas, em especial ao Thomas Santos Bonif´acio, por compreenderem minhas ausˆencias nos eventos de fam´ılia devido minhas provas.
Aos meus amigos que fiz na faculdade, em especial ao Fernando Alencar e Igor Pinto, pelos momentos juntos na faculdade e as horas de estudos e jogos juntos.
Aos meus amigos que me ajudaram a passar no vestibular e sempre acreditaram no meu potencial, em especial ao Claudio Luiz.
`
A Universidade Federal Fluminense e todo seu corpo docente, em especial ao professor Mois´es Lima de Menezes por aceitar ser meu orientador e amigo, e ter me ajudado bastante neste trabalho de conclus˜ao de curso.
A todos professores que tive desde o pr´e escolar at´e hoje por acreditarem na educa¸c˜ao. `
A Claudia Cristina de Aguiar Pereira por ser minha orientadora no meu tempo de inicia¸c˜ao cient´ıfica na FIOCRUZ e sempre ter se preocupado com meus estudos.
A toda GERAV/BNDES por todo aprendizado em meu per´ıodo de est´agio e poder me inspirar em pessoas como vocˆes, em especial ao Luciano Machado e F´abio Brener Roitman por terem confiados em minha capacidade, me dando a oportunidade de fazer parte da GERAV/BNDES e serem meus coordenadores.
`
A banca examinadora, professor Francisco Carlos Santana de Azeredo Pinto e a pro-fessora Keila Mara Cassiano por participarem desde momento.
Sum´
ario
Lista de Figuras
Lista de Tabelas
1 Introdu¸c˜ao p. 14
1.1 Contextualiza¸c˜ao . . . p. 14 1.2 Precipita¸c˜oes pluviom´etricas no cen´ario brasileiro . . . p. 14 1.3 Importˆancia de gerar previs˜oes pluviom´etricas . . . p. 14 1.4 Proposta . . . p. 16 1.5 Estrutura do trabalho . . . p. 16 2 Objetivos p. 17 3 Materiais e M´etodos p. 18 3.1 Base de dados . . . p. 18 3.2 S´eries Temporais . . . p. 18 3.2.1 An´alise Descritiva . . . p. 19 3.3 Decomposi¸c˜ao serial . . . p. 19 3.4 Estacionariedade . . . p. 20 3.4.1 Processo Estacion´ario . . . p. 21 3.5 Fun¸c˜ao de Autocorrela¸c˜ao . . . p. 22 3.6 Correlograma . . . p. 23 3.7 Fun¸c˜ao de Autocorrela¸c˜ao Parcial (FACP) . . . p. 23
3.8 Modelagem Holt-Winters . . . p. 24 3.8.1 Estimadores de Holt-Winters com sazonalidade aditiva . . . p. 25 3.8.2 Estimadores de Holt-Winters com sazonalidade multiplicativa . p. 26 3.9 Modelagem de Box-jenkins . . . p. 26 3.9.1 Modelos auto-regressivos AR(p) . . . p. 26 3.9.2 Modelos de m´edias m´oveis M A(q) . . . p. 27 3.9.3 Modelos n˜ao estacion´arios . . . p. 27
3.9.3.1 Modelos auto-regressivos integrados de m´edias m´oveis
(ARIM A) . . . p. 28 3.9.3.2 Modelos Sazonais (SARIM A) . . . p. 29 3.9.4 FACP dos modelos de Box-Jenkins . . . p. 29 3.10 Singular Spectrum Analysis . . . p. 30 3.10.1 Decomposi¸c˜ao . . . p. 31 3.10.2 Reconstru¸c˜ao . . . p. 31 3.11 Multi-Channel Singular Spectrum Analysis (MSSA) . . . p. 33 3.12 Estat´ısticas de Aderˆencia . . . p. 34 3.13 Resumo da Metodologia . . . p. 36
4 An´alise dos Resultados p. 38
4.1 Dados originais . . . p. 38 4.2 Filtragem SSA e MSSA . . . p. 42 4.2.1 S´eries Filtradas . . . p. 50 4.2.1.1 Modelos de previs˜ao . . . p. 52 4.2.2 Estat´ısticas de aderˆencia . . . p. 52
5 Conclus˜ao p. 56
Lista de Figuras
1 Unidades da Federa¸c˜ao selecionadas . . . p. 19 2 Resumo da Metodologia . . . p. 37 3 S´erie hist´orica Rio Branco - AC . . . p. 38 4 S´erie hist´orica Recife - PE . . . p. 39 5 S´erie hist´orica Bras´ılia - DF . . . p. 39 6 S´erie hist´orica Rio de Janeiro - RJ . . . p. 40 7 S´erie hist´orica Porto Alegre - RS . . . p. 40 8 Os 9 primeiros vetores singulares na filtragem SSA para s´erie do Rio de
Janeiro e suas respectivas contribui¸c˜oes . . . p. 43 9 Componentes s´erie Rio Branco via SSA . . . p. 44 10 Componentes s´erie Recife via SSA . . . p. 45 11 Componentes s´erie Bras´ılia via SSA . . . p. 46 12 Componentes s´erie Rio de Janeiro via SSA . . . p. 47 13 Componentes s´erie Porto Alegre via SSA . . . p. 48 14 Componentes das 5 s´eria via MSSA . . . p. 49 15 Compara¸c˜ao entre a s´erie original e filtrada do Rio Branco via SSA . . p. 50 16 Compara¸c˜ao entre a s´erie original e filtrada de Recife via SSA . . . p. 50 17 Compara¸c˜ao entre a s´erie original e filtrada de Bras´ılia via SSA . . . . p. 51 18 Compara¸c˜ao entre a s´erie original e filtrada do Rio de Janeiro via SSA p. 51 19 Compara¸c˜ao entre a s´erie original e filtrada de Porto Alegre via SSA . . p. 51
Lista de Tabelas
1 Identifica¸c˜ao dos modelos . . . p. 30 2 Estat´ısticas da m´edia pluviom´etrica mensal . . . p. 41 3 Tabela de correla¸c˜ao entre as componentes da s´erie filtrada . . . p. 42 4 Modelos anterior e posterior `a filtragem das 5 s´eries . . . p. 52 5 Estat´ısticas de Aderˆencia dos Modelos . . . p. 53 6 Estat´ısticas de Aderˆencia dos Modelos (In Sample) . . . p. 54 7 Estat´ısticas de Aderˆencia dos Modelos (Out of Sample) . . . p. 55
12
1
Introdu¸
c˜
ao
1.1
Contextualiza¸
c˜
ao
Precipita¸c˜ao pluviom´etrica ´e um fenˆomeno meteorol´ogico que possui aleatoriedade em sua ocorrˆencia quanto em sua intensidade. O conhecimento sobre precipita¸c˜oes plu-viom´etricas ´e de grande importˆancia nos dias de hoje, assim como j´a era considerado no passado. Tal importˆancia est´a agregada ao fator do n´ıvel de chuva influenciar em diferentes ´areas do ambiente em que vivemos, seja ela na quest˜ao urbana, agr´ıcola ou da engenharia hidr´aulica (HEBERT et al., 2007) (BEIJO et al., 2005). As varia¸c˜oes no n´ıvel das precipita¸c˜oes pluviom´etricas est˜ao principalmente relacionadas ao clima de cada regi˜ao em estudo, devido seus diferentes tipos clim´aticos, esta¸c˜oes do ano, e a sazonalidade envolvida (JOSEVAL, 2010). O volume de precipita¸c˜oes pluviom´etrica ´e medido por um aparelho chamado pluviˆometro, o mesmo mede em mil´ımetro (mm), a altura da lˆamina de ´agua gerada pela chuva que caiu numa ´area de 1m2 em um dado per´ıodo. Sendo assim
quando diz-se que o n´ıvel de precipita¸c˜ao pluviom´etrica foi de 10 mil´ımetros significa que choveu 10 litros e uma ´area de 1m2.
1.2
Precipita¸
c˜
oes pluviom´
etricas no cen´
ario brasileiro
Quando se olha para o cen´ario brasileiro observa-se diferentes rela¸c˜oes com as preci-pita¸c˜ao pluviom´etrica, seja devido aos investimentos com usinas hidrel´etricas, dependˆencia na irriga¸c˜ao do plantio, n´ıvel dos rios, evacua¸c˜ao da popula¸c˜ao em ´areas de deslizamentos, log´ıstica em rela¸c˜ao ao transporte em dias chuvosos e melhor reaproveitamento da ´agua.
1.3
Importˆ
ancia de gerar previs˜
oes pluviom´
etricas
Prever volume de chuva se torna uma importante ferramenta no aux´ılio ao planeja-mento de a¸c˜oes e projetos voltados `a inunda¸c˜oes e eros˜ao (BERTONI; TUCCI, 2009).
1.3 Importˆancia de gerar previs˜oes pluviom´etricas 13
Muitas regi˜oes possuem moradores que habitam em ´areas que sofrem grandes desastres quando ocorrem n´ıveis elevados de chuva, devido a habitarem nas margens de rios, ´areas de encosta com poss´ıveis deslizamentos de terra entre outros fatores naturais envolvidos com volume de chuva (BRESSIANI, 2010).
O escoamento adequado do volume de ´agua de precipita¸c˜oes pluviais al´em de propor-cionar uma melhora na log´ıstica dos transportes, pode tamb´em ter o direcionamento dessa ´
agua para sistema h´ıdrico com baixo volume de abastecimento de ´agua, sendo assim ´aguas pluviais devem ser manejadas como uma das solu¸c˜oes para o abastecimento (COHIM et al., 2008).
Outras formas de melhor aproveitar o volume de ´agua nos centros urbanos, ´e por parte de uma educa¸c˜ao populacional, onde sejam apresentadas formas adequadas e plaus´ıveis de reaproveitamento da ´agua de chuva, seja ela para lavagem do quintal, do carro, roupa, uso sanit´ario ou outras poss´ıveis finalidades (SILVA, 2014) (GOLDENFUM, 2006). Al´em do reaproveitamento nos centros urbanos, os polos industriais, onde h´a uma grande con-centra¸c˜ao de consumo de ´agua para refrigera¸c˜ao de m´aquinas dentre outras finalidades, tamb´em pode fazer uso do recurso de reaproveitamento das ´aguas (GOLDENFUM, 2006). Desta forma, pode-se evitar o uso de ´agua pot´avel para essas atividades, principalmente devido ao baixo volumo apresentado nos reservat´orios (COHIM et al., 2008) (SILVA, 2014).
A produ¸c˜ao de energia brasileira tamb´em tem forte correla¸c˜ao com o n´ıvel de pre-cipita¸c˜oes de chuva (Trestani,2015), uma vez que mais de 60% da energia brasileira ´e proveniente de usinas hidrel´etricas, que depende da vaz˜ao dos rios, que depende do seu n´ıvel, que depende da precipita¸c˜ao pluviom´etrica. A produ¸c˜ao de energia hidrel´etrica no Brasil vem caindo ao longo dos anos devido a falta de chuva. Na compara¸c˜ao de 2013 em rela¸c˜ao a 2012, houve um decr´escimo de 5,4% na produ¸c˜ao de energia hidrel´etrica no Brasil apesar de a capacidade instalada ter aumentado 2% de 2013 a 2012 (EPE, 2015). A grande importˆancia da produ¸c˜ao de energia hidrel´etrica se deve ao fato de ser uma energia renov´avel, evitando a emiss˜ao de gases e poluentes que contribuem para o aquecimento global, um dos maiores problemas naturais enfrentado ao redor do mundo nos dias de hoje. A previs˜ao de precipita¸c˜ao pluviom´etrica ´e um importante fator nos investimentos e funcionamento de usinas hidrel´etricas devido ao volume que os rios podem apresentar em dias chuvosos. Tal previs˜ao tamb´em ´e muito importante para o planejamento energ´etico tendo em vista a necessidade das chuvas nas nascentes dos rios que des´aguam nas usinas hidrel´etricas.
1.4 Proposta 14
1.4
Proposta
Este projeto tem a proposta de apresentar diferentes modelos preditivos de preci-pita¸c˜ao pluviom´etrica baseado na metodologia Singular Spectrum Analysis (SSA) e Multi-channel Singular Spectrum Analysis (MSSA). Ap´os a filtragem, as s´eries ser˜ao modeladas pelos tradicionais modelos de Holt-Winters e Box-Jenkins. Ser˜ao geradas previs˜oes at´e 24 meses `a frente. Al´em dos modelos aplicados `as s´eries filtradas, os mesmos ser˜ao fei-tos com as s´eries originais, gerando assim, trˆes conjuntos de modelos com duas classes de modelos aplicados a cada s´erie de precipita¸c˜ao pluviom´etrica. Ap´os as modelagens e previs˜oes, estat´ısticas de aderˆencia ser˜ao utilizadas para avaliar o melhor modelo para an´alise e previs˜ao.
1.5
Estrutura do trabalho
Este trabalho est´a organizado em 5 cap´ıtulos. No cap´ıtulo 1 ´e apresentada a in-trodu¸c˜ao do trabalho abordando a importˆancia de se prever o volume de precipita¸c˜ao pluviom´etrica como diferentes quest˜oes no territ´orio brasileiro que dependem de tais pre-vis˜oes. No cap´ıtulo 2 s˜ao apresentados objetivos de estudo deste trabalho citando as abordagens que ser˜ao utilizadas. No cap´ıtulo 3 s˜ao apresentados os materiais e m´etodos dando enfoque aos processos anteriores a predi¸c˜ao dos modelos al´em dos modelos de amor-tecimento exponencial de Holt-Winters, os modelos de Box-Jenkins, metodologia SSA e MSSA, bem como as estat´ısticas de aderˆencia a serem utilizadas. No cap´ıtulo 4 s˜ao apre-sentando os resultados utilizando as filtragem SSA e MSSA, os modelos de Holt-Winters e Box-Jenkins, e as estat´ısticas de aderˆencia de cada um dos modelos. No cap´ıtulo 5 est˜ao resumidas as principais conclus˜oes do trabalho bem como as sugest˜oes e analises para futuros estudos sobre o tema.
15
2
Objetivos
Este projeto teve o objetivo de criar modelos de m´edias mensais de precipita¸c˜oes pluviom´etricas de diferentes regi˜oes brasileira com a abordagem SSA e MSSA, verificando se realizar a filtragem contribui pra melhora da capacidade preditiva dos modelos. A ideia ´e a de contribuir com o planejamento do uso da ´agua das chuvas para os diversos objetivos ao qual este bem ´e usado e demais projetos h´ıdricos que dependam de previs˜oes de precipita¸c˜ao pluviom´etrica.
16
3
Materiais e M´
etodos
3.1
Base de dados
O estudo foi realizado com observa¸c˜oes de m´edias mensais de precipita¸c˜oes plu-viom´etrica de diferentes regi˜oes do territ´orio brasileiro. Devido a sua dimens˜ao conti-nental, o Brasil possui diferentes caracter´ısticas clim´aticas, de maneira a gerar diferentes ´ındices pluviom´etricos. A sele¸c˜ao das esta¸c˜oes pluviom´etricas do estudo foi caracterizada pela busca de diferentes cen´arios regionais a qual cada uma est´a envolvida, seja por ser um cen´ario de inunda¸c˜ao, usinas hidrel´etricas (UHE), sistema h´ıdrico, polos industriais, grande centros urbanos, dentre outros fatores. Os dados s˜ao da Agˆencia Nacional de ´
aguas (ANA) e do Instituto Nacional de Meteorologia (INMET). Foi escolhida uma s´erie de um estado de cada regi˜ao brasileira a fim de representar cada regi˜ao, sendo assim foram usados dados de 5 esta¸c˜oes pluviom´etricas diferentes, cada uma dessa s´eries apresentar´a observa¸c˜ao m´edia mensal de precipita¸c˜ao pluviom´etrica de janeiro de 1970 `a dezembro de 2014. Na escolha das s´eries dentro das regi˜oes buscou-se preferencialmente s´eries das capitais dos Estados devido as capitais possu´ırem s´eries sem dados faltante no per´ıodo de janeiro de 1970 `a dezembro de 2014. A figura 1 apresenta o mapa do Brasil com as marca¸c˜oes em c´ırculo preto, das Unidades da Federa¸c˜ao, das esta¸c˜oes selecionadas no estudo.
3.2
S´
eries Temporais
Uma s´erie temporal ´e um conjunto de observa¸c˜oes ordenada ao longo do tempo. Sua observa¸c˜ao pode ser discreta ou cont´ınua e a caracter´ıstica mais importante neste tipo de dados ´e a dependˆencia entre as observa¸c˜oes vizinha {Th−1; Th+1} e o interesse principal
3.3 Decomposi¸c˜ao serial 17
Figura 1: Unidades da Federa¸c˜ao selecionadas
3.2.1
An´
alise Descritiva
Ao se analisar uma ou mais s´eries temporais a constru¸c˜ao de gr´aficos que apresentem os dados de forma sequencial ao longo tempo ´e fundamental e pode revelar os respectivos padr˜oes da s´erie. A an´alise gr´afica pode ajudar a perceber 4 importantes componentes de uma s´erie temporal, tendˆencias, sazonalidade, componente c´ıclica e ru´ıdo. Al´em de facilitar a percep¸c˜ao de observa¸c˜ao discrepante e mudan¸ca estrutural no comportamento da s´erie. As demais estat´ısticas descritiva tais como m´edia, mediana, variˆancia, m´ınimo, m´aximo, s˜ao de grande importˆancia para reconhecimento dos dados.
• Tendˆencia (T) ´e o comportamento a longo prazo da s´erie em torno da m´edia, este efeito pode ser crescente ou decrescente, linear ou n˜ao linear.
• Sazonalidade(S) efeitos ligados `a varia¸c˜oes peri´odicas recorrentes que podem ocor-rer em per´ıodos espec´ıficos do ano.
• Ciclos (C) Semelhante a componente sazonal, s˜ao varia¸c˜oes peri´odicas que a priori n˜ao s˜ao associadas a neguma medida temporal, com intervalos superior `a um ano. • Ru´ıdo (R) Componente aleat´oria de grande instabilidade n˜ao explicada por
va-ria¸c˜oes c´ıclicas, sazonal ou de tendˆencia, sendo puramente aleat´oria.
3.3
Decomposi¸
c˜
ao serial
Uma decomposi¸c˜ao cl´assica de s´eries temporais permite que a s´erie seja escrita como uma soma ou multiplica¸c˜ao de componentes n˜ao observ´aveis. Assim, pode-se usar um
3.4 Estacionariedade 18
modelo aditivo – quando se sup˜oe que os componentes da s´erie temporal s˜ao somados para formar os dados – ou um modelo multiplicativo que sup˜oe que os componentes s˜ao multiplicados um pelo outro (MORETTIN; TOLOI, 2006)(SMAILES; McGrane, 2000).
De acordo com Silver (2000), “ a decomposi¸c˜ao cl´assica ´e ´util tanto para planejamento como para previs˜ao ”. Souza e Samohyl (2005) acrescentam que ela ´e uma ferramenta ´
util, pois, al´em de permitir previs˜oes, auxilia na tomada de decis˜ao acerca do m´etodo de previs˜ao mais adequado `as caracter´ısticas dos dados dispon´ıveis. (BOUZADA, 2012)
Zt = Tt+ St+ Ct+ RT (3.1)
Zt = Tt.St.Ct.RT (3.2)
3.4
Estacionariedade
Segundo Morettin e Toloi (2006), uma das suposi¸c˜oes mais frequentes que se faz a respeito de uma s´erie temporal ´e de que ela ´e estacion´aria, isso quer dizer que, ela se desenvolve no tempo aleatoriamente em torno de uma m´edia constante, formando um equil´ıbrio est´avel. Uma s´erie pode ser estacion´aria durante um per´ıodo muito longo, ou at´e mesmo ser estacion´aria apenas em per´ıodos muito curtos, mudando de n´ıvel ou inclina¸c˜ao.
A classe dos modelos ARIMA (Auto-Regressivos Integrados M´edias-M´oveis), ser˜ao capazes de descrever de maneira satisfat´oria s´eries estacion´arias e n˜ao-estacion´arias, mas que n˜ao apresentam comportamento explosivo. Este tipo de estacionariedade ´e chamado homogˆeneo; a s´erie pode ser estacion´aria, flutuando ao redor de um n´ıvel, por um certo tempo, depois mudar de n´ıvel e flutuar ao redor de um novo n´ıvel e assim por diante, ou ent˜ao mudar de inclina¸c˜ao, ou ambas as coisas.
Como a maioria dos procedimentos de an´alise estat´ıstica de s´eries temporais sup˜oem que estas sejam estacion´arias, devemos transformar os dados originais, se estes n˜ao for-mam uma s´erie estacion´aria. A transforma¸c˜ao mais comum consiste em tomar diferen¸cas sucessivas da s´erie original, at´e se obter uma s´erie estacion´aria. A primeira diferen¸ca de Zt´e definida por
3.4 Estacionariedade 19
a segunda diferen¸ca ´e dada por
∆2Zt= ∆ [∆Zt] = ∆ [Zt− Zt−1] ,
ou seja,
∆2Zt = Zt− 2Zt−1+ Zt−2.
De modo geral, a n-´esima diferen¸ca de Zt´e dada por
∆nZt = ∆∆n−1Zt .
Em situa¸c˜oes normais, ser´a suficiente tomar uma ou duas diferen¸cas para que a s´erie se torne estacion´aria.
3.4.1
Processo Estacion´
ario
Segundo Morettin e Toloi (2006), um processo Z ´e estacion´ario se ele se desenvolve no tempo de modo que a escolha de uma origem no tempo n˜ao ´e importante. Isso quer dizer que , as caracter´ısticas de Z(t+τ ), para todo τ , s˜ao as mesmas de Zt.
Tecnicamente, h´a duas formas de estacionariedade: fraca (ou ampla, ou de segunda ordem) e estrita (ou forte).
Uma s´erie temporal ´e dita estritamente estacion´aria se a distribui¸c˜ao de probabilidade conjunta de Z(t1), · · · , Z(tk) ´e a mesma de Z(t1+τ ), · · · , Z(tk+τ ). Ou seja, o deslocamento
da origem dos tempos por uma quantidade τ n˜ao tem efeito na distribui¸c˜ao conjunta que portanto depende apenas dos intervalos entre t1, · · · , tk, logo a m´edia µ(t) e a variˆancia
V (t)s˜ao constante, isto ´e.
µ(t) = µ σ2(t) = σ2 para todo t ∈ T
Do mesmo modo, todas as distribui¸c˜oes bi-dimensionais dependem de t2− t1. De fato
γ(t1, t2) = γ(t1+ t, t2+ t), fazendo t = −t2 vem que:
γ(t1, t2) = γ(t1 − t2, 0) = γ(τ ),
para τ = t1−t2. Logo, γ(t1, t2) ´e uma fun¸c˜ao de um ´unico argumento, no caso do processo
3.5 Fun¸c˜ao de Autocorrela¸c˜ao 20
Um processo ´e dito fracamente estacion´ario (ou estacion´ario de segunda ordem) se e somente se:
i E (Z(t)) = µ(t) = µ
ii E (Z2(t)) < ∞, para todo t ∈ T ;
iii γ(t1, t2) = CovZ(t1), Z(t2) ´e uma fun¸c˜ao de t1− t2.
3.5
Fun¸
c˜
ao de Autocorrela¸
c˜
ao
A Fun¸c˜ao de autocorrela¸c˜ao (FAC) busca medir a correla¸c˜ao entre as observa¸c˜oes de uma mesma vari´avel em diferentes horizontes de tempo, correla¸c˜oes entre observa¸c˜oes defasadas k = 1, 2, · · · per´ıodos de tempo. Assim, dadas n observa¸c˜oes z1, · · · , zn de uma
s´erie temporal discreta podemos formar os pares (z1, z2), · · · , (zn−1, zn). Considerando
z1, · · · , zn−1 e z2, · · · , zn como duas vari´aveis o coeficiente de correla¸c˜ao entre zt e zt+1
ser´a dado por:
r1 = Pn−1 t=1(zt− z1)(zt+1− z2) q Pn−1 t=1(zt− z1)2 Pn−1 t=1(zt+1− z2)2 (3.3)
as respectivas m´edias amostrais s˜ao
z1 = n−1 X t=1 zt n − 1 e z2 = n X t=2 zt n − 1
como o coeficiente r1mede as correla¸c˜oes entre as observa¸c˜oes ele ´e chamado de coeficiente
de autocorrela¸c˜ao ou coeficiente de correla¸c˜ao serial. ´
E usual simplificar a equa¸c˜ao 3.3 utilizando a m´edia de todas as observa¸c˜oes z =Pn
t=1zt/n, percebe-se que z1 ≈ z2 e assumindo variˆancia constante. Assim, a vers˜ao
simplificada de 3.3 fica r1 = Pn−1 t=1(zt− z)(zt+1− z) (n − 1)Pn t=1(zt− z)2/n (3.4) A equa¸c˜ao 3.4 pode ser generalizada para calcular a correla¸c˜ao entre observa¸c˜oes defasadas de k per´ıodos de tempo, rk= Pn−k t=1(zt− z)(zt+k− z) Pn t=1(zt− z)2 (3.5) A equa¸c˜ao 3.5 nos fornece o coeficiente de correla¸c˜ao de ordem k.
3.6 Correlograma 21
Outra forma de obtermos o mesmo resultado e de forma mais usual ´e pela autoco-variˆancia ck, definido pela f´ormula:
ck = n−k X t=1 (zt− z)(zt+k− z) n , k = 0, 1, 2, · · · (3.6)
e o coeficiente de autocorrela¸c˜ao fica sendo obtido pela f´ormula rk = cck0
3.6
Correlograma
Uma forma usual de apresentar os coeficientes de autocorrela¸c˜ao da s´erie ´e atrav´es de um correlograma. Correlograma ´e um gr´afico com os k primeiros coeficientes de au-tocorrela¸c˜ao rk. A fun¸c˜ao do correlograma na an´alise de s´eries temporais ´e auxiliar a
identifica¸c˜ao de caracter´ısticas da s´erie. Essas caracter´ısticas s˜ao por exemplo:
• Se uma s´erie ´e puramente aleat´oria os seus valores defasados n˜ao s˜ao correlacionados ,i.e. rk se aproxima de zero.
• Quando o correlograma possui decaimento muito lento das autocorrela¸c˜oes, evidˆencia a n˜ao estacionariedade da s´erie.
• Quando uma s´erie possui o fator sazonal, ser´a percept´ıvel no correlograma um padr˜ao na mesma frequˆencia do fator sazonal.
• Al´em de o correlograma da FAC e da fun¸c˜ao de autocovariˆancia parcial que ser´a apre-sentado na se¸c˜ao seguinte, auxiliar a identifica¸c˜ao do modelo param´etrico ARIMA.
3.7
Fun¸
c˜
ao de Autocorrela¸
c˜
ao Parcial (FACP)
Uma outra ferramenta utilizada no processo de identifica¸c˜ao do modelo ´e a fun¸c˜ao de autocorrela¸c˜ao parcial. Esta medida corresponde a correla¸c˜ao de Zt e Zt−k removendo o
efeito das observa¸c˜oes Zt−1, Zt−2, . . . , Zt−k+1 e ´e denotada por φkk, ou seja
φkk = Corr(Zt, Zt−l/zt−1, Zt−2, . . . , Zt−k+1)
Um m´etodo geral para encontrar a (FACP) para um processo estacion´ario com (FAC) ρk
3.8 Modelagem Holt-Winters 22
ρj = φk1ρj−1+ φk2ρ1+ · · · + φkkρj − 1, j = 1, 2, . . . , k
Desenvolvendo a equa¸c˜ao temos
ρ1 = φk1+ φk2ρ1+ · · · + φkkρj−1
ρ2 = φk1ρ1+ φk2+ · · · + φkkρj−2
..
. = ...
ρj = φk1ρj−1+ φk2ρj−2+ · · · + φkk
Resolvendo as equa¸c˜oes acima sucessivamente para k = 1, 2, ..., obtemos φkk da seguinte
maneira φ11= ρ1 φ22= 1 ρ1 ρ1 ρ2 1 ρ1 ρ1 1 =⇒ φ22= ρ2− ρ21 1 − ρ2 1 φ33= 1 ρ1 ρ1 ρ1 1 ρ2 ρ2 ρ1 ρ3 1 ρ1 ρ2 ρ1 1 ρ1 ρ2 ρ1 1 =⇒ φ33= ρ3+ ρ22ρ1+ ρ13− 2ρ1ρ2− ρ21ρ3 1 − 2ρ2 1− ρ22 em geral temos φkk= |P∗ k| |Pk|
onde Pk´e a matriz de autocorrela¸c˜ao, e Pk∗ ´e a matriz Pk com a ultima coluna substitu´ıda
pelo vetor de autocorrela¸c˜ao.
3.8
Modelagem Holt-Winters
O procedimento de alisamento exponencial (Holt-Winters) pode ser generalizado para s´eries que contenham tendˆencia e varia¸c˜ao sazonal. Segundo Morettin e Toloi (2006), existem dois tipos de procedimento cuja utiliza¸c˜ao depende das caracter´ısticas da s´erie
3.8 Modelagem Holt-Winters 23
considerada. Tais procedimentos s˜ao baseados em trˆes equa¸c˜oes com constantes de sua-viza¸c˜ao diferentes, que s˜ao associadas a cada uma das componentes do padr˜ao da s´erie: n´ıvel, tendˆencia e sazonalidade.
b
Zt(h) = µt+ Tt+ St+ at
Onde µt´e o n´ıvel, Tt´e a tendˆencia, St sazonalidade e at´e o ru´ıdo branco com m´edia zero
e variˆancia constante.
Existem duas varia¸c˜oes deste m´etodo, que diferem na natureza do componente sazonal. O m´etodo aditivo ´e preferido quando as varia¸c˜oes sazonais s˜ao mais ou menos constante atrav´es da s´erie, enquanto que o m´etodo multiplicativo ´e preferido quando as varia¸c˜oes sazonais est˜ao mudando proporcional ao n´ıvel da s´erie.
3.8.1
Estimadores de Holt-Winters com sazonalidade aditiva
No m´etodo aditivo a componente sazonal ´e expressa em termos absolutos na escala da s´erie observada, e na equa¸c˜ao de n´ıvel da s´erie ´e ajustada sazonalmente subtraindo o componente sazonal. ba1(t) = αZt−ρbm(t)(t − 1) + (1 − α) [ba1(t − 1) +ba2(t − 1)] ba2(t) = β [ba1(t) −ba1(t − 1)] + (1 − β)ba2(t − 1) ρm(t)(t) = γ [Zt−ba1(t)] + (1 − γ) ρm(t)(t − 1) Equa¸c˜ao de previs˜ao b Zt(h) = (ba1(t) + h ×ba2(t)) + ρm(t+h)(t) Onde : • ba1(t) ´e o n´ıvel em t
• ba2(t) ´e a tendˆencia (inclina¸c˜ao) em t
3.9 Modelagem de Box-jenkins 24
3.8.2
Estimadores de Holt-Winters com sazonalidade
multipli-cativa
No m´etodo multiplicativo a componente sazonal ´e expressa em termos relativos (per-centuais) e da s´erie ´e ajustada sazonalmente dividindo-se atrav´es da componente sazonal.
b a1(t) = α " Zt b ρm(t)(t − 1) # + (1 − α) × [ba1(t − 1) +ba2(t − 1)] b a2(t) = β [ba1(t) −ba1(t − 1)] + (1 − β)ba2(t − 1) ρm(t)(t) = γ Zt b a1(t) + (1 − γ) × ρm(t)(t − 1) Equa¸c˜ao de previs˜ao b Zt(h) = (ba1(t) + h ×ba2(t)] × ρm(t)(t) Onde : • ba1(t) ´e o n´ıvel em t
• ba2(t) ´e a tendˆencia (inclina¸c˜ao) em t
• ρbm(t)(t) ´e o fator sazonal em t
3.9
Modelagem de Box-jenkins
A metodologia Box-Jenkins amplamente utilizada no ajuste de modelos param´etricos, consiste em ajustar modelos auto-regressivos integrados de m´edias m´oveis, ARIM A(p, d, q), a um conjunto de dados. Segundo Fava (2000), os modelos ARIM A resultam da com-bina¸c˜ao de trˆes componentes denominados “filtros”: o componente auto-regressivo (AR), o filtro de integra¸c˜ao (I) e o componente de m´edias m´oveis (MA). Uma s´erie pode ser modelada pelos trˆes filtros ou apenas um subconjunto deles, resultando em v´arios modelos abordados a seguir.
3.9.1
Modelos auto-regressivos AR(p)
Em um modelo auto-regressivo, a s´erie de dados hist´oricos Zt ´e descrita por seus
3.9 Modelagem de Box-jenkins 25 por: ˜ Zt= φ1Z˜t−1+ φ2Z˜t−2+ · · · + φpZ˜t−p+ at (3.7) onde, ˜ Zt = Zt− µ
O modelo 3.7 pode ser reescrito utilizando o operador de defasagem B, o operador de defasagem B ´e definido da seguinte forma:
BZt = Zt−1; BmZt= Zt−m (3.8)
ent˜ao utilizando a fun¸c˜ao 3.8 em 3.7 obtemos que:
φ(B) = 1 − φ1B − φ2B2− · · · − φpBp
φ(B) ˜Zt= at
3.9.2
Modelos de m´
edias m´
oveis M A(q)
Em um modelo de m´edias m´oveis, a s´erie Ztresulta da combina¸c˜ao dos ru´ıdos brancos
a do per´ıodo atual com aqueles ocorridos em per´ıodos anteriores. Assim, um modelo de m´edias m´oveis de ordem q ou M A(q) ´e dado por:
Zt = µ + at+ θ1at−1+ · · · + θqat−q (3.9) sendo ˜Zt = Zt− µ ˜ Zt= (1 − θ1B − · · · − θqBq)at = θ(B)at (3.10) onde θ(B) = 1 − θ1B − θ2B2− · · · − θqBq (3.11)
´e o operador de m´edias m´oveis de ordem q.
3.9.3
Modelos n˜
ao estacion´
arios
Quando uma s´erie temporal apresenta m´edia e variˆancia dependentes do tempo, ´e por-que ela n˜ao ´e estacion´aria. A n˜ao-estacionariedade de uma s´erie implica que a varia¸c˜ao
3.9 Modelagem de Box-jenkins 26
dos dados n˜ao permanece essencialmente constante sobre o tempo, isto ´e, as flutua¸c˜oes au-mentam ou diminuem com o passar do tempo, indicando que a variˆancia est´a se alterando. Para detectar a n˜ao-estacionariedade de uma s´erie, o comportamento temporal pode ser analisado graficamente, ou, ent˜ao, aplicando os testes estat´ısticos de raiz unit´aria. O teste de raiz unit´aria mais usado ´e o de Dickey-Fuller.
3.9.3.1 Modelos auto-regressivos integrados de m´edias m´oveis (ARIM A) Como a maioria dos procedimentos de an´alise estat´ıstica de s´eries temporais sup˜oe que estas sejam estacion´arias, ser´a necess´ario transform´a-las caso ainda n˜ao sejam. Se-gundo Morettin e Toloi (2006), a transforma¸c˜ao mais comum consiste em tomar diferen¸cas sucessivas da s´erie original at´e obter uma s´erie estacion´aria.
Segue que o operador de diferen¸ca ´e definido por :
∆Zt = Zt− Zt−1= (1 − B)Zt
B ´e o operador de transla¸c˜ao visto anteriormente. Logo segue-se que ∆ = 1 − B
No caso de duas diferen¸ca tem-se
∆2Zt = ∆ [∆Zt] = ∆ [Zt− Zt−1] = Zt− 2Zt−1+ Zt−2
De modo geral, a n-´esima diferen¸ca de Zt ´e
∆nZt= ∆∆n−1Zt
Segundo Morettin e Toloi (2006), em situa¸c˜oes normais ser´a suficiente tomar uma ou duas diferen¸cas para obter estacionariedade em uma s´erie. O n´umero d de diferen¸cas necess´arias para tornar a s´erie estacion´aria ´e denominado ordem de integra¸c˜ao. Ap´os obter estacionariedade diz-se que Zt segue um modelo auto-regressivo, integrado, de m´edias
m´oveis, ou modelo ARIM A(p, d, q), onde p ´e o polinˆomio auto-regressivo ´e q o polinˆomio de m´edias m´oveis.
3.9 Modelagem de Box-jenkins 27
3.9.3.2 Modelos Sazonais (SARIM A)
Os modelos ARIM A exploram a autocorrela¸c˜ao entre os valores da s´erie em instantes sucessivos, mas quando os dados s˜ao observados em per´ıodos inferiores a um ano, a s´erie tamb´em pode apresentar autocorrela¸c˜ao para uma esta¸c˜ao de sazonalidade s. Os modelos que contemplam as s´eries que apresentam autocorrela¸c˜ao sazonal s˜ao conhecidos como SARIM A.
Os modelos SARIM A contˆem uma parte n˜ao sazonal, com parˆametros (p, d, q), e uma sazonal,com parˆametros (P, D, Q)s . O modelo mais geral ´e dado pela equa¸c˜ao:
(1 − φ1B − · · · − φpBp)(1 − Φ1Bs− · · · − ΦpBP S)(1 − B)d(1 − Bs)DZt=
(1 − θ1B − · · · − θqBq)(1 − Θ1Bs− · · · − ΘQBsQ) (3.13)
em que:
• (1 − φ1B − · · · − φpBp) ´e a parte auto-regressiva n˜ao-sazonal de ordem p;
• (1 − Φ1Bs− · · · − ΦpBP S) ´e a parte auto-regressiva sazonal de ordem P e per´ıodo
sazonal s;
• (1 − B)d ´e parte de integra¸c˜ao n˜ao-sazonal de ordem d;
• (1 − Bs)D ´e parte de integra¸c˜ao sazonal de ordem D e per´ıodo sazonal s;
• (1 − θ1B − · · · − θqBq) ´e a parte n˜ao-sazonal de m´edias m´oveis de ordem q;
• (1 − Θ1Bs− · · · − ΘQBsQ) ´e a parte sazonal de m´edias m´oveis de ordem Q e per´ıodo
sazonal s.
3.9.4
FACP dos modelos de Box-Jenkins
Nos processos AR, MA e ARMA temos as seguintes (FACP) te´oricas: i) em um processo AR(p) a (FACP) ´e da forma: φkk6= 0, se k < p
φkk= 0, se k > p
ii) em um processo M A(q) a (FACP) se comporta de maneira similar `a (FAC) de um processo AR(p), isto ´e, composta por exponenciais e\ou senoides amortecidas;
3.10 Singular Spectrum Analysis 28
iii) um processo ARM A(p, q) tem (FACP) que se comporta como a (FACP) de um processo MA puro. Devido aos fatores acima, segue que a (FACP) ´e ´util para identificar modelos AR puros, n˜ao sendo t˜ao ´util para identificar modelos M A e ARM A. Uma ma-neira simples de estimar as (FACP) de um processo consistem em substituir nas equa¸c˜oes de Yullie-Walker as (FAC) por suas estimativas
rj = ˆφk1rj−1+ · · · + ˆφkkrj−k, j = 1, . . . , k,
e resolver estas equa¸c˜oes para k = 1, 2, 3, · · ·
A (FAC) tamb´em ´e utilizada na identifica¸c˜ao dos parˆametros dos modelos de Box-Jenkins a tabela 1 mostra a rela¸c˜ao entre a (FAC) e a (FACP) na identifica¸c˜ao dos modelos.
Tabela 1: Identifica¸c˜ao dos modelos
AR MA ARMA
FAC Decai
exponencial-mente
Corte brusco ap´os a defasagem q
Decai exponencialmente ap´os a defasagem q FACP Corte brusco ap´os a
defasagem p
Decai exponencial-mente
Decai exponencialmente ap´os a defasagem p
3.10
Singular Spectrum Analysis
Singular Spectrum Analysis (SSA), ´e uma t´ecnica n˜ao param´etrica que permite de-compor uma s´erie temporal em sinal e ru´ıdo. E uma t´´ ecnica ´util para filtrar dados de s´eries temporais. Menezes et al., (2004) utilizaram trˆes metodologias na abordagem SSA: An´alise de componentes principais (ACP), ACP associado com An´alise de Cluster e An´alise Gr´afica dos Vetores Singulares. Em seu artigo ´e mostrado que o melhor m´etodo em SSA ´e a An´alise Gr´afica dos vetores singulares, que ser´a usado neste projeto. SSA ´e um m´etodo recente e poderoso em s´eries temporais que incorpora elementos de an´alise cl´assica de s´eries temporais, estat´ıstica multivariada, geometria multivariada, sistemas dinˆamicos e processamentos de sinais (ELSNER; TSONIS, 1996). SSA tem sido aplicada com su-cesso em diversas ´areas: na matem´atica e f´ısica a economia e matem´atica financeira, na meteorologia e oceanografia a ciˆencias sociais (GOLYNADINA et al., 2001).
3.10 Singular Spectrum Analysis 29
O m´etodo SSA ´e um procedimento que pode ser utilizado, dentre outras aplica¸c˜oes, na remo¸c˜ao de ru´ıdo e de s´eries temporais (GOLYNADINA et al., 2001; HASSANI et al, 2012). A vers˜ao b´asica do m´etodo SSA pode ser dividida em duas etapas: decomposi¸c˜ao e reconstru¸c˜ao.
3.10.1
Decomposi¸
c˜
ao
Segundo Menezes et al. (2014), a etapa de decomposi¸c˜ao pode ser subdividida em duas partes: Incorpora¸c˜ao e decomposi¸c˜ao em valores singulares (SVD – Singular Value Decomposition).
Seja Zt= [z1, . . . zT]1×T uma s´erie temporal (HAMILTON, 1994) e considere L tal que
2 ≤ L ≤ T de modo que L ´e um parˆametro a ser estimado e ´e chamado de comprimento da janela (GOLYANDINA et al., 2001). Entende-se por Incorpora¸c˜ao o procedimento no qual uma s´erie temporal ZT ´e levada a uma matriz X = [z1, . . . , zk]L×T, para todo
k ∈ [1, . . . , K], onde K = T − L + 1. A matriz X, conhecida como matriz trajet´oria ´e uma matriz Hankel, ou seja, os elementos de xi,j tal que i + j = constante s˜ao iguais
(HASSANI et al., 2012).
Considere S = XX0. Os autovalores de S dispostos em ordem de significˆancia λ1 ≥ · · · ≥ λL ≥ 0 s˜ao obtidos e os respectivos autovalores U1, . . . , UL s˜ao encontrados.
Considere V0 = (X0UL)/
√
λ, como S ´e positivo semi-definido, ent˜ao a matriz trajet´oria X pode ser expressa pela decomposi¸c˜ao em valores singulares (SVD) apresentada em (3.9):
X = E1+ E2+ · · · + EL, (3.14)
onde El =
√
λUlVl0, para todo l = 1, . . . , L. A cole¸c˜ao (
√
λl, Ul, Vl) ´e conhecida como
auto-tripla da expans˜ao SVD de X. Os elementos da autotripla s˜ao definidos respectivamente por: valor singular, vetor singular `a esquerda e vetor singular `a direita de X (MENEZES et al., 2014). A contribui¸c˜ao de cada componente em (3.9) pode ser mensurada pela raz˜ao de autovalores λl/
PL
l=1λl.
3.10.2
Reconstru¸
c˜
ao
Segundo Menezes et al. (2014), a etapa de reconstru¸c˜ao est´a subdividida em duas partes: agrupamento e m´edia diagonal. A etapa de agrupamento consiste no procedimento de agrupar algumas sequˆencias de matrizes elementares resultantes da decomposi¸c˜ao SVD
3.10 Singular Spectrum Analysis 30
em grupos disjuntos e, ap´os isso, som´a-las, gerando novas matrizes elementares. Considere a sequencia PL
l=1El de matrizes elementares da expans˜ao de SVD. Agrupe
as mesmas em m grupos disjuntos utilizando algum m´etodo, por exemplo, por meio de an´alise de componentes principais, an´alise gr´afica de vetores singulares ou agrupamento hier´arquico e assumir que o conjunto de ´ındices gerado ´e dado por {I1, . . . , Im}, de modo
que a expans˜ao (3.9) pode ser reescrita como em (3.10), sendo XIi arbitr´aria tal queXIi =
Ppi j=1XIij (MENEZES et al., 2014). X = L X l=1 El = m X i=1 XIi (3.15)
O objetivo do agrupamento ´e diminuir o n´umero de componentes na expans˜ao da matriz trajet´oria X. A contribui¸c˜ao de cada componente ´e mensurada pela raz˜ao (3.11) (MENEZES et al., 2014). Ppi j=1λIij PL l=1λl . (3.16)
Considere a matriz trajet´oria X e assuma que L∗ = min(L, K) e K∗ = max(L, K). Considere x(i)l,k um elemento na linha l e coluna k na matriz XIi. O elemento z
(i)
t da
componente hz(i)t i
1×T
da s´erie temporal [zt]1×T ´e calculado por meio da m´edia diagonal
da matriz elementar XIi definida em (3.12), a partir da matriz elementar XIi.
z(i)t = t P l=1 x(i)l,t−l+1 t , se 1 ≤ t < L ∗ L∗ P l=1 x(i)l,t−l+1 L∗ , se L∗ ≤ t < K∗ T −K∗+1 P l=t−K∗+1 x(i)l,t−l+1 T −K∗+1 , se K ∗ ≤ t ≤ T (3.17) Cada componente h zt(i) i
1×T concentra parte da energia da s´erie temporal original
[zt]1×T que pode ser mensurada pela raz˜ao de autovalores pi P j=1 λIij/ d P l=1 λl. De acordo com
Hassani et al. (2012), podemos classificar as componentes SSA hzt(i)i
1×T
de uma s´erie temporal arbitr´aria [zt]1×T em trˆes categorais: tendˆencia, componentes harmˆonicas (ciclo
e sazonalidade) e ru´ıdo (GOLYNADINA et al., 2001).
3.11 Multi-Channel Singular Spectrum Analysis (MSSA) 31
(HASSANI et al., 2012). Tal propriedade caracteriza qu˜ao bem separados est˜ao as dife-rentes, componentes, umas das outras. Uma boa medida de separabilidade ´e a Correla¸c˜ao Ponderada. Por correla¸c˜ao ponderada weighted correlation ou w-correla¸c˜ao, podemos en-tender como uma fun¸c˜ao que quantifica a dependˆencia linear entre duas componentes SSA ZT(1) e ZT(2) definida em (3.13) (MENEZES et al., 2014).
ρ(w)ij = ZT(i), ZT(j) w ||ZT(i)||w||Z (j) T ||w . (3.18) onde ||ZT(i)||w = r ZT(i), ZT(i) w ; ||ZT(j)||w = r ZT(j), ZT(j) w ;ZT(i), ZT(j) w = T P k=1 wkz (i) k z (j) k e wk= min{k, L, T − k}.
Atrav´es da separabilidade, pode-se verificar estatisticamente se duas componentes SSA est˜ao bem separadas, em termos de dependˆencia linear. Se o valor absoluto da w-correla¸c˜ao ´e pequeno (HASSANI et al., 2012), ent˜ao as componentes SSA correspondentes s˜ao classificadas como w-ortogonais (ou quase w-ortogonais); caso contr´ario, s˜ao ditas mal separadas. Salienta-se que comumente utiliza-se a correla¸c˜ao ponderada na fase de agrupamento SSA (GOLYNADINA et al., 2001).
3.11
Multi-Channel Singular Spectrum Analysis (MSSA)
A metodologia MSSA ´e uma extens˜ao do SSA para trabalhar com an´alise e previs˜ao de s´eries temporais multidimensionais. O procedimento MSSA segue a mesma estrutura do procedimento SSA com a diferen¸ca de fazˆe-lo usando um sistema de s´eries temporais em face de uma ´unica s´erie. Considere o sistema de s s´eries temporais de tamanho T .
Z(k) =zt(k)
T
t=1 (3.19)
Onde k = 1, . . . , s. O caso particular do procedimento MSSA para , equivale ao procedi-mento usando SSA (GOLYNADINA et al., 2001).
Escolhendo um ´unico tamanho de janela janela de defasagem, L para todas as s s´eries, onde 1 < L < T , na fase de incorpora¸c˜ao MSSA s˜ao obtidos k = T − L + 1 vetores defasados Xj(k) =
zj(k), . . . , zj+L−1(k) T
, j = 1, . . . , K para cada s´erie Z(k), k = 1, . . . , s. Assim, para cada s´erie Z(k) , ´e poss´ıvel obter atrav´es de um mapa invert´ıvel F(k), uma matriz de trajet´oria como em (3.13).
3.12 Estat´ısticas de Aderˆencia 32 X(k) = z1(k) z(k)2 · · · zK(k) z2(k) z(k)3 · · · zK+1(k) .. . ... . .. ... zL(k) z(k)L+1 · · · zT(k) (3.20)
A matriz trajet´oria da s´erie multidimensional Z(1), Z(2), · · · , Z(s)´e, ent˜ao, uma ma-triz de dimens˜ao Ls × K e tem a seguinte forma:
X =hX1(1) : . . . : XK(1) : . . . : X1(s): . . . : Xk(s)i
T
=X(1) : . . . : X(s)T (3.21)
O espa¸co trajet´oria (GOLYNADINA et al., 2001) ´e definido por um espa¸co linear spanado pelos vetores defasados (colunas da matriz trajet´oria X).
A partir de S = XXT, onde os autovalores de S em ordem de magnitude λ
1 ≥ · · · ≥
λLS ≥ 0, U1, . . . , ULS os respectivos autovalores associados, d = maxj : λj > 0 o posto da
matriz S e Vj =
XTU j
pλj
, j = 1, . . . , d. Denotando Ej =pλjUjVjT, ent˜ao o SVD da matriz
trajet´oria de X pode ser escrito por: X = E1+ · · · + Ed.
De forma an´aloga, a fase de agrupamento particiona o conjunto de ´ındices em sub-conjuntos disjuntos I1, . . . , Im de modo que a matriz trajet´oria pode ser reescrita no que
pode ser chamado de decomposi¸c˜ao agrupada:
X = XI1+ · · · + XIm (3.22)
Por fim a m´edia diagonal ´e aplicada a cada uma das s´eries decompostas em3.11 e ent˜ao o grupo de sinais reconstru´ıdos dado por eZ(k)=
e Z(k)T
t=1
, k = 1, . . . , s ´e obtido.
3.12
Estat´ısticas de Aderˆ
encia
MAE ´e Mean Absolute Error, apresenta o afastamento m´edio das previs˜oes em rela¸c˜ao aos valores observados.
3.12 Estat´ısticas de Aderˆencia 33 M AE = N X t=1 [|zt− ˆzt|] × 1 N Onde
• zT ´e o valor observado da s´erie
• ˆzT ´e o valor previsto da s´erie
• N ´e o n´umero de per´ıodos usados
MAPE ´e Mean Absolute Percentage Error, ´e calculado como a m´edia do erro percen-tual: M AP E = N X t=1 |zt− ˆzt| zt × 1 N Onde
• zT ´e o valor observado da s´erie
• ˆzT ´e o valor previsto da s´erie
• N ´e o n´umero de per´ıodos usados
RMSE ´e Root Mean Squared Error, apresenta valores do erro nas mesmas dimens˜oes da vari´avel analisada:
RM SE = 2 v u u t PN t=1(zt− ˆzt 2 N Onde
• zT ´e o valor observado da s´erie
• ˆzT ´e o valor previsto da s´erie
• N ´e o n´umero de per´ıodos usados
O coeficiente de determina¸c˜ao, tamb´em chamado de R2, ´e uma medida de ajustamento
3.13 Resumo da Metodologia 34
o modelo consegue explicar os valores observados. Quanto maior o R2, mais explicativo ´e o modelo, melhor ele se ajusta `a amostra.
R2 = 1 − PN t=1(zt− ˆzt) 2 PN t=1(zt− ¯zt) 2 ! Onde
• zT ´e o valor observado da s´erie
• ˆzT ´e o valor observado da s´erie
• ¯z ´e a m´edia dos valores observados
O Crit´erio de Informa¸c˜ao Bayesiano (BIC) ´e definido como:
BICp = −2log(Lp) + [(p + 1) + 1]log(N ).
O BIC aumentam conforme SQE aumenta. Al´em disso, o crit´erio penaliza modelos com muitas vari´aveis sendo que valores menores do BIC s˜ao prefer´ıveis.
SQE = PN
t=1(zt− ˆzt) 2
N
Como modelos com mais vari´aveis tendem a produzir menor SQE mas usam mais parˆametros, a melhor escolha ´e balancear o ajuste com a quantidade de vari´aveis.
3.13
Resumo da Metodologia
No Cap´ıtulo 2, foram expostos os objetivos deste projeto. A figura 1, mostra exata-mente o processo para modelagem via Holt-Winters e Box-Jenkins. Ser˜ao introduzidas v´arias s´eries originais onde as mesmas passar˜ao pela filtragem SSA e MSSA, onde ser˜ao divididas em 3 partes: Tendˆencia, Harmˆonica e Ru´ıdo. Ap´os a filtragem ser´a retirado o Ru´ıdo, onde a nova s´erie apenas com as partes: Tendˆencia e Harmˆonica ser´a analisada e feita a compara¸c˜ao com a mesma s´erie filtrada via MSSA e sem a filtragem SSA. A partir das s´eries: original e filtrada ser´a feita a modelagem Box-Jenkins e de Holt-Winters para an´alises. Os softwares utilizados para o estudo foram: FPW (Forecast Pro for Windows) para fazer a modelagem Holt-Winters e Box-Jenkins e CaterpillarSSA para abordagem SSA via an´alise gr´afica dos componentes principais. Os resultados obtidos ao longo dos experimentos computacionais realizados s˜ao comparados em termos das estat´ısticas de
3.13 Resumo da Metodologia 35
aderˆencia: MAPE (Mean Absolute Percentage Error) , RMSE (Root Mean Squared Er-ror), BIC (Bayesian Information Criterion) e R2 (coeficiente de determina¸c˜ao).
36
4
An´
alise dos Resultados
4.1
Dados originais
Ap´os toda prepara¸c˜ao necess´aria, foram feitas as an´alises gr´aficas e descritivas das s´eries das 5 regi˜oes brasileira no per´ıodo de janeiro de 1970 a dezembro de 2014. As figuras 3 a 7 apresentam os gr´aficos das s´eries em estudo.
Figura 3: S´erie hist´orica Rio Branco - AC
Observa-se na figura 3 que ao longo dos 45 anos a s´erie hist´oria de m´edia mensais de precipita¸c˜ao pluviom´etrica de Rio Branco, apresentou mudan¸ca ao longo dos anos, tendo apresentados picos superiores aos 14 mil´ımetros de chuva, e chegando a 16 mil´ımetros/m2. Em janeiro de 2014, o Acre registrou sua maior m´edia hist´orica de chuva no mˆes de janeiro no Estado.
A figura 4 mostra que a regi˜ao de Recife foi atingida por picos de precipita¸c˜ao plu-viom´etrica de 24 at´e 26 mil´ımetros, nos anos de 1973, 2004 e 2011, quando em
carac-4.1 Dados originais 37
Figura 4: S´erie hist´orica Recife - PE
ter´ıstica normal seu n´ıvel de precipita¸c˜ao tende estar perto de 15 mil´ımetros. O mˆes de abril de 1973 teve a maior m´edia de precipita¸c˜ao pluviom´etrica do Estado.
Figura 5: S´erie hist´orica Bras´ılia - DF
Observa-se na figura 5 que o n´ıvel de precipita¸c˜ao pluviom´etrica tende estar perto do 10 mil´ımetros, tendo atingido em alguns anos como 2006 o ´ındice de 17 mil´ımetros. O mˆes de outubro de 2006, foi o mais chuvoso para o mˆes citado da hist´oria de Bras´ılia.
Observa-se na figura 6 que o n´ıvel de precipita¸c˜ao pluviom´etrica na s´erie hist´orica do Rio de Janeiro se comportou em sua grande maioria com observa¸c˜oes de at´e 10 mil´ımetros, em alguns casos chegando at´e a 15 mil´ımetros, por´em no ano de 2007 observa-se o maior
4.1 Dados originais 38
Figura 6: S´erie hist´orica Rio de Janeiro - RJ
pico, no qual a s´erie atingiu os 20 mil´ımetros. Neste mesmo ano a cidade de Nova Friburgo foi uma das mais atingidas, e 12 munic´ıpios do estado decretaram situa¸c˜ao de emergˆencia.
Figura 7: S´erie hist´orica Porto Alegre - RS
A figura 7 mostra que dentre as s´eries de cada regi˜ao apresentada, Porto Alegre ´e a que possui os menores valores observados entre as s´eries, tendo no geral seu ´ındice perto dos 8 mil´ımetros, e tendo sua maior anomalia no ano de 1982, quando a s´erie registrou a m´edia pluviom´etrica mensal de 12 mil´ımetros. Neste mesmo ano o mundo estava sob um dos mais intenso epis´odios de El Ni˜no. Porto Alegre chegou a registrar 138,8 mil´ımetros de chuva em um ´unico dia.
4.1 Dados originais 39
A tabela 2 apresenta as m´edias e desvios padr˜ao das m´edias mensais pluviom´etricas no per´ıodo de janeiro de 1970 a dezembro de 2014.
Tabela 2: Estat´ısticas da m´edia pluviom´etrica mensal
Mˆes Estat´ıstica Rio Branco Recife Bras´ılia Rio de Janeiro Porto Alegre
Jan M´edia 9.27 3.30 7.27 8.53 3.45 Desvio Padr˜ao 3.08 2.17 3.56 3.97 1.69 Fev M´edia 10.22 5.00 6.65 5.73 3.86 Desvio Padr˜ao 2.73 3.48 3.18 3.20 1.73 Mar M´edia 8.33 6.93 6.56 5.28 3.26 Desvio Padr˜ao 2.99 3.96 2.66 2.54 1.61 Abr M´edia 6.10 9.93 4.44 3.69 3.39 Desvio Padr˜ao 2.72 5.72 2.47 1.75 1.84 Mai M´edia 3.08 10.29 0.99 2.15 3.45 Desvio Padr˜ao 1.67 4.57 0.86 1.01 1.98 Jun M´edia 1.26 12.75 0.32 1.34 4.72 Desvio Padr˜ao 1.20 4.42 0.67 0.99 2.65 Jul M´edia 1.16 11.37 0.24 1.39 4.42 Desvio Padr˜ao 1.11 4.62 0.57 1.01 2.33 Ago M´edia 1.69 6.68 0.57 1.45 4.28 Desvio Padr˜ao 1.16 3.49 0.78 1.33 2.19 Set M´edia 3.15 3.70 1.72 2.95 4.36 Desvio Padr˜ao 1.86 2.50 1.37 2.09 2.42 Out M´edia 4.91 2.06 5.27 4.54 3.90 Desvio Padr˜ao 2.04 1.49 3.16 1.80 2.14 Nov M´edia 6.65 1.32 7.90 7.89 3.53 Desvio Padr˜ao 2.39 0.81 2.76 3.12 2.14 Dez M´edia 8.13 1.93 8.05 9.57 3.35 Desvio Padr˜ao 2.23 1.48 2.80 2.79 1.48
Na tabela 2 pode-se perceber os meses com maiores volumes de chuva de cada regi˜ao. Observa-se que em Rio Branco o per´ıodo com maiores ´ındices pluviom´etricos est´a de dezembro a abril. Em Recife os maiores ´ındices est˜ao de abril a julho e neste mesmo per´ıodo ´e o per´ıodo de maior dispers˜ao entre as m´edias registradas. Bras´ılia apresenta seus maiores ´ındices no per´ıodo de novembro a mar¸co, e grande seca de maio a agosto, onde a m´edia est´a abaixo de 1 mm. O munic´ıpio do Rio de Janeiro tem seus maiores ´ındices pluviom´etricos no per´ıodo de novembro a janeiro, e pouca chuva de junho a agosto, onde a s´erie registra em m´edia menos de 2 mm de chuva. Porto Alegre de todas as s´eries foi a que apresentou menor varia¸c˜ao entre os meses, n˜ao tendo grande diferen¸ca entre os meses, por´em de junho a setembro chovendo um pouco mais que os demais meses.
4.2 Filtragem SSA e MSSA 40
4.2
Filtragem SSA e MSSA
Ap´os conhecer as caracter´ısticas das s´eries originais, foram realizadas as filtragens de cada uma das s´eries via SSA e MSSA. Com o objetivo de realizar a filtragem das s´eries originais, foi considerado o comprimento da janela L = T /2 = 270. A decomposi¸c˜ao das 3 componentes da s´erie, tendˆencia, harmˆonica e ru´ıdo, foram feitas pela an´alise gr´afica dos autovetores (ou vetores singulares). A figura 8 apresenta os 9 primeiros vetores singulares da s´erie do Rio de Janeiro, pelo m´etodo SSA, e sua repetitivas contribui¸c˜ao para s´erie. Atrav´es da figura 8 observa-se que o autovetor 1 corresponde a componente de tendˆencia, os autovetores 2 a 7 pertencem a componente harmˆonica e os demais autovetores foram considerados pertencente a componente ruidosa. O crit´erio utilizado para selecionar o melhor filtro foi aquele que nos deixava com a menor correla¸c˜ao entre as componentes.
A tabela 3 apresenta as correla¸c˜oes entre as componentes tendˆencia, harmˆonica e ruidosa, para cada uma das 5 s´eries pela filtragem SSA e pela filtragem MSSA.
Tabela 3: Tabela de correla¸c˜ao entre as componentes da s´erie filtrada
Filtragem S´erie Componente Tendˆencia Harmˆonica Ru´ıdo
SSA Rio Branco Tendˆencia 1 0 0,001 Harmˆonica 0 1 0,018 Ru´ıdo 0,001 0,018 1 Recife Tendˆencia 1 0 0,005 Harmˆonica 0 1 0,01 Ru´ıdo 0,005 0,01 1 Bras´ılia Tendˆencia 1 0,001 0,004 Harmˆonica 0,001 1 0,023 Ru´ıdo 0,004 0,023 1 Rio de Janerio Tendˆencia 1 0 0,001 Harmˆonica 0 1 0,013 Ru´ıdo 0,001 0,013 1 Porto Alegre Tendˆencia 1 0,004 0,001 Harmˆonica 0,004 1 0,053 Ru´ıdo 0,001 0,053 1 MSSA Rio Branco Tendˆencia 1 0 0,004 Recife Bras´ılia Harmˆonica 0 1 0,017 Rio de Janerio
Porto Alegre Ru´ıdo 0,004 0,017 1
4.2 Filtragem SSA e MSSA 41
Figura 8: Os 9 primeiros vetores singulares na filtragem SSA para s´erie do Rio de Janeiro e suas respectivas contribui¸c˜oes
os casos. Como a correla¸c˜ao foi muito pequena, pode-se dizer que cada componente est´a bem definida, ou seja, os vetores singulares est˜ao bem classificados.
As figuras 9 a 13 mostram o gr´afico de cada uma das componentes para cada s´erie pela filtragem SSA. A figura 14 mostra o gr´afico de cada uma das componentes pela filtragem MSSA.
Observa-se atrav´es das figuras 9 a 13, que cada uma das regi˜oes apresentam compor-tamento diferente entre si e que cada uma das 3 componentes est˜ao bem definidas. Ap´os se verificar a qualidade da separa¸c˜ao das componentes, o passo seguinte foi a elimina¸c˜ao da componente ruidosa, tendo cada s´erie filtrada apenas as componentes harmˆonica e tendˆencia.
4.2 Filtragem SSA e MSSA 42
Figura 9: Componentes s´erie Rio Branco via SSA
Na figura 14 pode-se observar a diferen¸ca dentro de cada gr´afico, pois a cada 540 pontos (janeiro de 1970 a dez de 2014) est´a contida a componente de uma s´erie, a ordem
4.2 Filtragem SSA e MSSA 43
Figura 10: Componentes s´erie Recife via SSA
´e Rio Branco, Recife, Bras´ılia, Rio de Janeiro e Porto Alegre e, como pode ser observado, as trˆes componentes est˜ao bem definidas.
4.2 Filtragem SSA e MSSA 44
4.2 Filtragem SSA e MSSA 45
4.2 Filtragem SSA e MSSA 46
4.2 Filtragem SSA e MSSA 47
4.2 Filtragem SSA e MSSA 48
4.2.1
S´
eries Filtradas
Ap´os a elimina¸c˜ao da componente ruidosa de cada uma das s´eries, foram criados gr´aficos com a s´erie original e filtrada a fim de se observar o comportamento anterior e posterior ao filtro. As figuras 15 a 19 apresenta o gr´afico da s´erie original e filtrada de cada uma das s´eries. Observa-se que nas figuras 15 a 19 que o filtro tornou as s´eries mais homogˆeneas, as deixando mais suave e eliminando os picos observados nas s´eries originais. Os mesmo podem estar associados `a caracter´ısticas que apenas o fator do ´ındice pluviom´etrico n˜ao seria suficiente para explicar.
Figura 15: Compara¸c˜ao entre a s´erie original e filtrada do Rio Branco via SSA
4.2 Filtragem SSA e MSSA 49
Figura 17: Compara¸c˜ao entre a s´erie original e filtrada de Bras´ılia via SSA
Figura 18: Compara¸c˜ao entre a s´erie original e filtrada do Rio de Janeiro via SSA
4.2 Filtragem SSA e MSSA 50
4.2.1.1 Modelos de previs˜ao
Em posse das s´eries filtradas via SSA e MSSA, foram criados os modelos preditivos de cada uma delas. As s´eries, tanto original, quanto filtradas, foram modeladas pela metodologia Holt-Winters e Box-Jenkins. A tabela 4 mostra o melhor modelo por cada um dos dois m´etodos pelo programa Forecast For Windows (FPW) para cada uma das s´eries.
Tabela 4: Modelos anterior e posterior `a filtragem das 5 s´eries
S´erie Modelo Holt-Winters Box & Jenkins
Rio Branco
SSA H-W+, sem tendˆencia SARIM A(1, 0, 4)(1, 1, 1)12
MSSA H-W+, sem tendˆencia SARIM A(1, 1, 3)(1, 1, 2)12
Sem Filtro H-W+, sem tendˆencia SARIM A(0, 0, 0)(1, 0, 1)12
Recife
SSA H-W+ SARIM A(2, 0, 3)(1, 1, 3)12
MSSA H-W+, sem tendˆencia SARIM A(0, 1, 3)(1, 1, 2)12
Sem Filtro H-W×, sem tendˆencia SARIM A(1, 0, 0)(1, 0, 1)12
Bras´ılia
SSA H-W+ SARIM A(1, 0, 3)(1, 1, 3)12
MSSA H-W+, sem tendˆencia SARIM A(1, 1, 4)(1, 1, 2)12
Sem Filtro H, sem tendˆencia SARIM A(0, 0, 0)(2, 0, 1)12
Rio de Janeiro
SSA H-W+, sem tendˆencia SARIM A(2, 0, 2)(1, 1, 4)12
MSSA H-W+, sem tendˆencia SARIM A(0, 1, 3)(1, 1, 2)12
Sem Filtro H-W+, sem tendˆencia SARIM A(0, 0, 0)(2, 0, 1)12
Porto Alegre
SSA H, sem tendˆencia SARIM A(2, 0, 3)(2, 0, 2)12
MSSA H-W×, sem tendˆencia SARIM A(1, 1, 1)(0, 1, 4)12
Sem Filtro H-W+, sem tendˆencia SARIM A(1, 0, 0)(1, 0, 0)12
Na tabela 4 H-W significa que o modelo representado ´e de Holt-Winter e apenas H representa modelo de Holt (sem sazonalidade), o sinal de mais + indica sazonalidade aditiva e o sinal de × sazonalidade multiplicativa. Pode-se notar na tabela 4 que a maioria das s´eries s´eries foram modeladas pelo m´etodo de Holt-Winters sem tendˆencia. O fato dos modelos repetirem o n´umero de parˆametros, n˜ao se trata do mesmo modelo, pois os valores dos parˆametros se diferenciam.
4.2.2
Estat´ısticas de aderˆ
encia
Ap´os ajustar-se os modelos de Holt-Winters e Box-Jenkins para cada uma das s´eries, foram tiradas as estat´ısticas de aderˆencia de cada um dos 30 modelos, a fim de se comparar o melhor modelo e verificar a se a filtragem via SSA ou MSSA apresentou melhora no
4.2 Filtragem SSA e MSSA 51
ajuste do modelo, e se possui diferen¸ca na qualidade do ajuste entre os m´etodos SSA para o MSSA. Neste projeto ser´a utilizado as seguintes estat´ısticas de aderˆencia: MAPE, RMSE, BIC e R2 ajustado.
Tabela 5: Estat´ısticas de Aderˆencia dos Modelos
S´erie M´etodo Modelo MAPE RMSE BIC R2
Rio Branco
SSA Holt-Winters 0,6744 0,7918 0,8011 0,9412
Box-Jenkins 0,3290 0,4704 0,4899 0,9790
MSSA Holt-Winters 0,0515 0,1919 0,1942 0,9964
Box-Jenkins 0,0046 0,0198 0,0207 1,0000
Sem Filtro Holt-Winters 1,1260 2,2210 2,2470 0,6569
Box-Jenkins 1,0660 2,2230 2,2490 0,6564 Recife SSA Holt-Winters 0,3257 1,1400 1,1600 0,9216 Box-Jenkins 0,0946 0,3226 0,3400 0,9996 MSSA Holt-Winters 0,1759 0,7467 0,7554 0,9647 Box-Jenkins 0,0283 0,1119 0,1572 0,9983
Sem Filtro Holt-Winters 0,7856 3,5680 3,6100 0,5265
Box-Jenkins 0,6273 3,6130 2,6790 0,6032 Bras´ılia SSA Holt-Winters 0,2982 0,2378 0,2420 0,9940 Box-Jenkins 0,1210 0,0635 0,0666 0,9996 MSSA Holt-Winters 0,2876 0,1910 0,1932 0,9960 Box-Jenkins 0,0271 0,0289 0,0303 0,9999
Sem Filtro Holt-Winters 3,8670 3,5770 3,5980 0,1123
Box-Jenkins 1,8510 2,3570 2,3980 0,6177 Rio de Janeiro SSA Holt-Winters 0,1334 0,4196 0,4245 0,9785 Box-Jenkins 0,0324 0,1136 0,1430 0,9973 MSSA Holt-Winters 0,0591 0,2173 0,2199 0,9943 Box-Jenkins 0,0105 0,0418 0,0463 0,9997
Sem Filtro Holt-Winters 0,9572 2,3460 2,3730 0,5786
Box-Jenkins 0,9508 2,3450 2,3870 0,5781 Porto Alegre SSA Holt-Winters 0,0952 0,4183 0,4232 0,5017 Box-Jenkins 0,0068 0,0318 0,0335 0,9971 MSSA Holt-Winters 0,0536 0,2771 0,2804 0,7888 Box-Jenkins 0,0054 0,0289 0,0310 0,9976
Sem Filtro Holt-Winters 0,8139 2,0440 2,0680 0,0392
Box-Jenkins 0,8376 2,0810 2,0570 0,0187
Na tabela 5 pode-se observar que em todas as estat´ısticas de aderˆencia ter aplicado o filtro melhorou a qualidade dos ajustes, diminuindo os erros (MAPE, RMSE, BIC) e aumentando a qualidade preditiva do modelo (R2 ajustado). Nota-se tamb´em que
a filtragem MSSA se apresentou melhor que a filtragem SSA, por´em a diferen¸ca entre as duas foi baixa, e quando qualquer uma das duas foi aplicada, obtiveram-se grandes melhoras nos ajustes dos dados em compara¸c˜ao a s´erie original.
4.2 Filtragem SSA e MSSA 52
da amostra (in sample), chamado tamb´em de amostra de treinamento, e fora da amostra (out of sample) chamado amostra de teste, na primeira parte s˜ao utilizados 516 das 540 observa¸c˜oes como fase para criar os modelos e na segunda parte, 24 observa¸c˜oes finais como fase de teste dos modelos. Na primeira parte, os valores modelados s˜ao obtidos a partir dos dados hist´oricos da s´erie. Na segunda parte, os valores modelados s˜ao obtidos a partir dos valores anteriores do pr´oprio modelo, configurando-se assim, como previs˜oes que podem ser comparadas com valores reais podendo, desta forma, comparar os resultados tanto na modelagem como na previs˜ao.
Tabela 6: Estat´ısticas de Aderˆencia dos Modelos (In Sample)
S´erie M´etodo Modelo MAPE RMSE BIC R2
Rio Branco
SSA Holt-Winters 0,7196 0,8036 0,8134 0,9389
Box-Jenkins 0,2499 0,4017 0,4191 0,9846
MSSA Holt-Winters 0,0529 0,1956 0,1980 0,9963
Box-Jenkins 0,0069 0,0265 0,0276 0,9999
Sem Filtro Holt-Winters 1,1680 2,1730 2,2000 0,6650
Box-Jenkins 1,1650 2,1570 2,2100 0,6687 Recife SSA Holt-Winters 0,3313 1,1520 1,1740 0,9202 Box-Jenkins 0,0905 0,3099 0,3272 0,9942 MSSA Holt-Winters 0,1824 0,7630 0,7723 0,9631 Box-Jenkins 0,0250 0,0994 0,1370 0,9987
Sem Filtro Holt-Winters 0,8126 3,6110 3,6550 0,5270
Box-Jenkins 0,6140 3,7090 2,6630 0,6104 Bras´ılia SSA Holt-Winters 0,3124 0,2310 0,2353 0,9943 Box-Jenkins 0,0996 0,0510 0,0535 0,9997 MSSA Holt-Winters 0,2884 0,1864 0,1887 0,9961 Box-Jenkins 0,0341 0,0250 0,0260 0,9999
Sem Filtro Holt-Winters 3,6340 3,5420 3,5630 0,1228
Box-Jenkins 0,6154 2,3450 2,3880 0,6139 Rio de Janeiro SSA Holt-Winters 0,1192 0,3728 0,3773 0,9828 Box-Jenkins 0,0298 0,0981 0,1266 0,9978 MSSA Holt-Winters 0,0597 0,2182 0,2209 0,9942 Box-Jenkins 0,0104 0,0395 0,0454 0,9997
Sem Filtro Holt-Winters 0,9315 2,3300 2,3580 0,5913
Box-Jenkins 0,9396 2,3330 2,3610 0,5904 Porto Alegre SSA Holt-Winters 0,0987 0,4275 0,4327 0,4999 Box-Jenkins 0,0067 0,0302 0,0319 0,9975 MSSA Holt-Winters 0,0550 0,2823 0,2857 0,7803 Box-Jenkins 0,0049 0,0243 0,0291 0,9982
Sem Filtro Holt-Winters 0,8444 2,0500 2,0750 0,0267
Box-Jenkins 0,8571 2,0580 2,0700 0,0215
Como pode-se observar nas tabelas 6 e 7 a filtragem tamb´em MSSA e SSA se apre-sentaram melhor quando comparado aos modelos das s´eries originais, mostrando tamb´em
4.2 Filtragem SSA e MSSA 53
Tabela 7: Estat´ısticas de Aderˆencia dos Modelos (Out of Sample)
S´erie M´etodo Modelo MAD MAPE GRMAE
Rio Branco
SSA Holt-Winters 0,7010 0,4240 0,3900
Box-Jenkins 0,4560 0,1950 0,2360
MSSA Holt-Winters 0,1310 0,0330 0,0740
Box-Jenkins 0,1250 0,0390 0,0850
Sem Filtro Holt-Winters 2,4520 0,6570 0,5220
Box-Jenkins 2,5710 0,6700 0,5710 Recife SSA Holt-Winters 0,6570 0,1990 0,2920 Box-Jenkins 0,2850 0,0770 0,1640 MSSA Holt-Winters 0,1190 0,0350 0,0490 Box-Jenkins 0,1790 0,0820 0,0650
Sem Filtro Holt-Winters 1,9740 0,4660 0,4690
Box-Jenkins 2,0100 0,4410 0,6070 Bras´ılia SSA Holt-Winters 0,3600 0,2700 0,0850 Box-Jenkins 0,2450 0,2030 0,0560 MSSA Holt-Winters 0,2630 0,4390 0,2060 Box-Jenkins 0,1170 0,2690 0,0610
Sem Filtro Holt-Winters 3,2280 -
-Box-Jenkins 1,7300 - -Rio de Janeiro SSA Holt-Winters 0,8470 0,4470 0,7630 Box-Jenkins 0,2430 0,1120 0,2220 MSSA Holt-Winters 0,1550 0,0460 0,0990 Box-Jenkins 0,0560 0,0160 0,0320
Sem Filtro Holt-Winters 1,8620 0,8300 0,9930
Box-Jenkins 1,8570 0,8270 0,9560 Porto Alegre SSA Holt-Winters 0,0800 0,0200 0,5140 Box-Jenkins 0,0240 0,0060 0,1430 MSSA Holt-Winters 0,0950 0,0250 0,1800 Box-Jenkins 0,0520 0,0140 0,1300
Sem Filtro Holt-Winters 1,4700 -
-Box-Jenkins 1,5460 -