Universidade Federal Fluminense Instituto de Matem´atica e Estat´ıstica
Curso de Estat´ıstica
Pablo Casais Moreira
´
Alcool combust´ıvel: disponibilidade, precifica¸
c˜
ao e seus
condicionantes
Niter´oi 2012
Pablo Casais Moreira
´
Alcool combust´ıvel: disponibilidade, precifica¸
c˜
ao e seus
condicionantes
Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.
Orientador: Valentin Sisko
D.Sc.
Niter´oi 2012
Pablo Casais Moreira
´
Alcool combust´ıvel: disponibilidade, precifica¸
c˜
ao e seus
condicionantes
Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.
Aprovado em
BANCA EXAMINADORA
Valentin Sisko
D.Sc.
Marco Aur´elio dos Santos Sanfins
D.Sc.
M´arcia Marques de Carvalho
Moreira, Pablo Casais
Álcool combustível: disponibilidade, precificação e seus condicionantes / Pablo Casais Moreira; Valentin Sisko,
orientador. Niterói, 2012.
64 f. : il.
Trabalho de Conclusão de Curso (Graduação em Estatísticaa ) – Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2012.
1. Análise de séries temporais. 2. Regressão com erros ARMA. 3. Álcool combustível. I. Sisko, Valentin, orientador. II. Universidade Federal Fluminense. Instituto de Matemática e Estatística. III. Título.
-Dedico esta monografia a minha m˜ae pela f´e e confian¸ca demonstrada. Ao Valentin Sisko pela paciˆencia demonstrada no decorrer do tra-balho. Aos amigos. Enfim, a todos que de al-guma forma tornaram este caminho mais f´acil de ser percorrido.
Resumo
A partir de meados do s´eculo passado o aumento excessivo do pre¸co do petr´oleo e da discuss˜ao mundial sobre a diminui¸c˜ao das emiss˜oes de CO2 e consequente diminui¸c˜ao
do efeito estufa pelo uso de energias renov´aveis, fez com que o Brasil buscasse a produ¸c˜ao de Biocombust´ıvel tendo como principal op¸c˜ao o etanol hidratado combust´ıvel. Este estudo tem por objetivo analisar a s´erie de pre¸cos do etanol hidratado combust´ıvel no Estado de S˜ao Paulo, no per´ıodo de julho de 2000 a janeiro 2013 com periodicidade mensal e descrever seu comportamento com previs˜oes a curto prazo. Ou seja, verificar se a dinˆamica temporal da vari´avel ´e melhor explicada por um processo ARIMA(p, d, q) ou por um modelo de regress˜ao com erros ARMA.O tratamento dos dados foi baseada na an´alise gr´afica e em testes estat´ısticos da pr´opria metodologia, atrav´es da qual, observou-se que o modelo ARIMA (10,0,0) com duas variaveis explicativas (etanol anidro combust´ıvel e pre¸co do a¸c´ucar) com atraso de uma observa¸c˜ao, respondeu como o melhor modelo dentre o conjunto de modelos testados para prever o pre¸co do etanol hidratado combust´ıvel. Palavras-chaves: an´alise de s´eries temporais, regress˜ao com erros ARMA, ´alcool com-bust´ıvel.
Agradecimentos
Aos meus pais, meus irm˜aos e ao Odin que, com muito carinho e apoio, n˜ao mediram esfor¸cos para que eu chegasse at´e esta etapa de minha vida.
Ao professor Valentin Sisko pela paciˆencia na orienta¸c˜ao que tornou poss´ıvel a conclus˜ao desta monografia.
A todos os professores da UFF, em especial, Ana Beatriz Monteiro Fonseca, Ludmilla da Silva Viana Jacobson, Maria Cristina Bessa Moreira e Luz Amanda Melgar Santander que foram t˜ao importantes na minha vida acadˆemica.
Aos amigos e colegas, em especial, Felipe Maia, Rodrigo, Paulinho, Guma, Bob, Marquinhos, Alberto, Andr´e, Andrey, Mariola, Leo(a), Kiese, Carol, Cissa, Nadine, Paola, Marcela, Dani, Luciana, Thalita, Juliana, Bia, Fernanda Galr˜ao, Bia Friedrich, Luana, Mariana, Jos´e, Bruno Cidade, Bruno Lucian, Clark, Victor Santos, Orelha, Pe-dro Classe A, Natan, Thiago, Paulista, Everson, Fabio, EvanPe-dro, Guilherme, Acelerado, Barrientos, Beto, Lucas Meireles, Bertinho, Gustavo Campos, Uba, Roger, Mayro, China. Pelo incentivo, pelo DCE, pelas chopadas, pelo futebol, pelas conversas no 7◦ andar e pelas horas atoa na escada.
“Praticamente,praticamente,50%.”
Sum´
ario
Lista de Figuras 7
Lista de Tabelas 9
1 Introdu¸c˜ao 10
1.1 Hist´oria do bioetanol no mercado nacional . . . 10
1.2 Pr´oAlcool - Programa Brasileiro de ´Alcool . . . 11
1.2.1 Fase Inicial . . . 12 1.2.2 Fase de Afirma¸c˜ao . . . 12 1.2.3 Fase de Estagna¸c˜ao . . . 12 1.2.4 Fase de Redefini¸c˜ao . . . 13 1.2.5 Fase Atual . . . 13 2 Material e M´etodos 15 2.1 Modelos para Series Temporais . . . 16
2.1.1 Processos estoc´asticos . . . 16
2.1.2 Processos estacion´arios . . . 16
2.2 T´ecnicas Descritivas . . . 17 2.2.1 Decomposi¸c˜ao Cl´assica . . . 18 2.2.2 Diferencia¸c˜ao . . . 18 2.3 Modelos Probabil´ısticos . . . 19 2.3.1 Modelos ARIMA . . . 19 2.4 Identifica¸c˜ao . . . 21
2.4.2 Crit´erio de Informa¸c˜ao de Akaike . . . 23
2.5 Estima¸c˜ao . . . 24
2.5.1 Ajustando Processos ARIMA . . . 24
2.6 Diagn´ostico . . . 24
2.6.1 An´alise dos Res´ıduos . . . 25
2.6.2 Testes sobre os res´ıduos . . . 25
2.7 Previs˜ao . . . 26
2.7.1 Intervalo de confian¸ca . . . 27
2.8 Modelo de regress˜ao com erros ARMA . . . 28
2.9 Dados . . . 29
3 Resultados 32 3.1 An´alise gr´afica e an´alise descritiva . . . 32
3.2 Estima¸c˜ao de modelos concorrentes e escolha do melhor modelo . . . 36
3.3 An´alise Residual . . . 38
3.4 Resultados gr´aficos e previs˜ao do modelo melhor ajustado . . . 40
4 Conclus˜oes 42 Referˆencias Bibliogr´aficas 43 Apˆendices 45 A Analise descritiva 46 B Estima¸c˜ao de modelos concorrentes e An´alise Residual 53 B.1 Modelo univariado . . . 53
Lista de Figuras
3.1 S´erie do pre¸co do etanol hidratado combust´ıvel no per´ıodo analisado. . . . 33
3.2 FAC do pre¸co etanol hidratado combust´ıvel. . . 33
3.3 Primeira diferen¸ca do pre¸co do etanol hidratado combust´ıvel no per´ıodo analisado. . . 34
3.4 FAC da primeira diferen¸ca pre¸co etanol hidratado combust´ıvel. . . 35
3.5 FACP da primeira diferen¸ca pre¸co etanol hidratado combust´ıvel. . . 35
3.6 FAC e FACP do melhor modelo ajustado para previs˜ao . . . 39
3.7 Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo melhor ajustado. 40 3.8 Previs˜ao para o pre¸co do etanol hidratado combust´ıvel. . . 41
A.1 S´erie do pre¸co gasolina no per´ıodo analisado. . . 46
A.2 S´erie da produ¸c˜ao de a¸c´ucar no per´ıodo analisado. . . 47
A.3 S´erie produ¸c˜ao de ´alcool no per´ıodo analisado. . . 48
A.4 S´erie da produ¸c˜ao de cana-de-a¸c´ucar no per´ıodo analisado. . . 49
A.5 S´erie do pre¸co etanol hidratado outros fins no per´ıodo analisado. . . 50
A.6 S´erie do pre¸co etanol anidro no per´ıodo analisado. . . 51
A.7 S´erie do pre¸co do a¸c´ucar no per´ıodo analisado. . . 52
B.1 FAC e FACP do modelo ajustado para ehc univariado. . . 54
B.2 Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo ehc univariado. . 55
B.3 Previs˜ao para o pre¸co do etanol hidratado combust´ıvel. . . 56
B.4 FAC e FACP do modelo ajustado para ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. . . 59
B.5 Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. . . 60
Lista de Tabelas
2.1 Propriedades te´oricas da fac e facp. . . 23
3.1 Estat´ısticas descritivas da s´erie do pre¸co do etanol hidratado combust´ıvel. . 32
3.2 Modelos ARIMA (p,d,q) concorrentes para o pre¸co do etanol hidratado combust´ıvel. . . 36
3.3 Modelos ARIMA (p,d,q) com atraso de 1 observa¸c˜ao concorrentes para o pre¸co do etanol hidratado combust´ıvel. . . 37
3.4 Modelos ARIMA (p,d,q) com atrasos de 2 observa¸c˜oes concorrentes para o pre¸co do etanol hidratado combust´ıvel. . . 37
3.5 Teste de Ljung-Box. . . 39
3.6 Estimativa do modelo versus o valor real observado. . . 41
3.7 Estimativas pontuais e intervalares do modelo versus o valor real. . . 41
10
1 Introdu¸
c˜
ao
Desde os prim´ordios da ´epoca colonial no Brasil, a economia brasileira foi caracterizada por ciclos econˆomicos de determinados produtos, como: extra¸c˜ao do pau-brasil, planta¸c˜oes de cana-de-a¸c´ucar, minera¸c˜ao de ouro, o boom do caf´e e a extra¸c˜ao da borracha natural, somente no tempo da virada do s´eculo XIX para o XX. Nos ´ultimos 30 anos e no ˆambito da moderniza¸c˜ao conservadora, a agricultura e o espa¸co rural passaram por mudan¸cas estruturais b´asicas e economicamente bem-sucedidas embora problem´aticas nos setores sociais e ecol´ogicos (Kohlhepp,2010). Neste trabalho daremos destaque `a cana-de-a¸c´ucar, que foi introduzida no Brasil no in´ıcio do s´eculo XVI, quando foi iniciada a instala¸c˜ao de engenhos de a¸c´ucar, a primeira ind´ustria implantada na nova possess˜ao de Portugal, que em pouco tempo substituiu a ind´ustria extrativa do pau-brasil. V´arios foram os motivos para a escolha da cana, entre eles a existˆencia do solo de massapˆe no Brasil, prop´ıcio para o cultivo da cana-de-a¸c´ucar, al´em de ser um produto muito bem cotado no com´ercio europeu destinado unicamente `a exporta¸c˜ao e capaz de gerar valios´ıssimos lucros, transformando-se no alicerce econˆomico da coloniza¸c˜ao portuguesa no Brasil entre os s´eculos XVI e XVII.
1.1
Hist´
oria do bioetanol no mercado nacional
No in´ıcio do s´eculo XX, entre os anos de 1905 e 1925, foram iniciados testes pioneiros para se verificar a viabilidade de utiliza¸c˜ao do bioetanol em motores, tendo sido realizadas na ´epoca algumas experiˆencias com movimenta¸c˜ao de ve´ıculos. Em 1931, atrav´es de decreto, o Governo Brasileiro estabeleceu a utiliza¸c˜ao do ´alcool em mistura `a gasolina, em propor¸c˜oes entre 2% e 5%, respeitada a disponibilidade regional do produto. Em 1961 esse intervalo de mistura foi elevado para de 5% a 10% e, atualmente a mistura est´a entre 20% a 25%. Durante a d´ecada de 1960, o interesse mundial pelo uso de bio-combust´ıveis diminuiu, principalmente pela descoberta de vastas reservas de petr´oleo no Oriente M´edio, o que gerava a expectativa de que os pre¸cos do petr´oleo e seus derivados se mantivessem em patamares considerados aceit´aveis. Ocorre que, em 1973, com a primeira crise do petr´oleo, a procura por fontes alternativas de energia retorna ao cen´ario mundial
1.2 Pr´oAlcool - Programa Brasileiro de ´Alcool 11 e o Brasil, em 1975, lan¸ca o Programa Nacional do ´Alcool (Pro´alcool)
Como o etanol tem um valor energ´etico menor do que o da gasolina, o pre¸co do etanol somente ser´a economicamente interessante se n˜ao custar mais que 70% do pre¸co da gasolina e se os grandes centros de consumo estiverem localizados nas proximidades do local de produ¸c˜ao, como em S˜ao Paulo (Xavier,2007).
´
Alcool hidratado x ´alcool anidro
O etanol hidratado carburante possui 93% de etanol puro e 7% de ´agua. Sua utiliza¸c˜ao no Brasil iniciou-se em 1979, com o lan¸camento dos carros a ´alcool, na se-gunda fase do Programa Nacional do ´Alcool (Pro´alcool). Atualmente, o etanol hidratado compete com a gasolina devido a fatores, como: redu¸c˜ao dos custos no setor, aumento do pre¸co do barril de petr´oleo e diferen¸cas de tributa¸c˜ao entre a gasolina e o etanol. O Etanol anidro ´e usado como aditivo em combust´ıveis, sendo composto por 99,5% de etanol puro e 0,5% de ´agua. A gasolina recebe 22% do produto para substituir o chumbo, elemento qu´ımico venenoso e prejudicial `a sa´ude e ao meio ambiente. Este tipo de etanol ´e menos poluente e, se for adicionado na propor¸c˜ao correta, n˜ao afeta o desempenho de motores. J´a existem estudos para incorpora¸c˜ao do etanol ao ´oleo diesel.
1.2
Pr´
oAlcool - Programa Brasileiro de ´
Alcool
Programa Nacional do ´Alcool ou Pro´alcool foi criado em 14 de novembro de 1975 pelo decreto n◦ 76.593, com o objetivo de estimular a produ¸c˜ao do ´alcool, visando o atendimento das necessidades do mercado interno e externo e da pol´ıtica de combust´ıveis automotivos. A decis˜ao de produ¸c˜ao de etanol a partir de cana-de-a¸c´ucar, al´em do pre¸co do a¸c´ucar, ´e pol´ıtica e econˆomica, envolvendo investimentos adicionais. Tal decis˜ao foi tomada em 1975, quando o governo federal decidiu encorajar a produ¸c˜ao do ´alcool em substitui¸c˜ao `a gasolina pura, com o objetivo de reduzir as importa¸c˜oes de petr´oleo, ent˜ao com um grande peso na balan¸ca comercial externa. Nessa ´epoca, o pre¸co do a¸c´ucar no mercado internacional vinha decaindo rapidamente, o que tornou conveniente a mudan¸ca de produ¸c˜ao de a¸c´ucar para ´alcool. Nesse trabalho dividiremos o Pro´alcool em cinco etapas:
1.2 Pr´oAlcool - Programa Brasileiro de ´Alcool 12
1.2.1
Fase Inicial
O esfor¸co foi dirigido, sobretudo para a produ¸c˜ao de ´alcool anidro para a mistura com gasolina. Nessa fase, o esfor¸co principal coube `as destilarias anexas. A produ¸c˜ao alcooleira cresceu de 600 milh˜oes de `/ano (1975-76) para 3,4 bilh˜oes de `/ano (1979-80). Os primeiros carros movidos exclusivamente a ´alcool surgiram em 1978.
1.2.2
Fase de Afirma¸
c˜
ao
O segundo choque do petr´oleo (1979-80) triplicou o pre¸co do barril de petr´oleo e as compras desse produto passaram a representar 46% da pauta de importa¸c˜oes brasileiras em 1980. O governo, ent˜ao, resolve adotar medidas para plena implementa¸c˜ao do Pro´ al-cool. S˜ao criados organismos como o Conselho Nacional do ´Alcool - CNAL e a Comiss˜ao Executiva Nacional do ´Alcool - CENAL para agilizar o programa. A produ¸c˜ao alcooleira atingiu um pico de 12,3 bilh˜oes de litros em 1986-87 (gr´afico 1), superando em 15% a meta inicial do governo de 10,7 bilh˜oes de `/ano para o fim do per´ıodo. A propor¸c˜ao de carros a ´alcool no total de autom´oveis de ciclo Otto (passageiros e de uso misto) produzidos no pa´ıs aumentou de 0,46% em 1979 para 26,8% em 1980, atingindo um teto de 76,1% em 1986.
1.2.3
Fase de Estagna¸
c˜
ao
O partir de 1986, o cen´ario internacional do mercado petrol´ıfero ´e alterado. Os pre¸cos do barril de ´oleo bruto ca´ıram de um patamar de US$ 30 a 40 para um n´ıvel de US$ 12 a 20. Esse novo per´ıodo, denominado “contra-choque do petr´oleo”, colocou em xeque os programas de substitui¸c˜ao de hidrocarbonetos f´osseis e de uso eficiente da energia em todo o mundo. Na pol´ıtica energ´etica brasileira, seus efeitos foram sentidos a partir de 1988, coincidindo com um per´ıodo de escassez de recursos p´ublicos para subsidiar os programas de est´ımulo aos energ´eticos alternativos, resultando num sens´ıvel decr´escimo no volume de investimentos nos projetos de produ¸c˜ao interna de energia. A oferta de ´alcool n˜ao pˆode acompanhar o crescimento descompassado da demanda, com as vendas de carro a ´alcool atingindo n´ıveis superiores a 95,8% das vendas totais de ve´ıculos de ciclo Otto para o mercado interno em 1985. Apesar de seu car´ater efˆemero, a crise de abastecimento de ´alcool do fim dos anos 1980 afetou a credibilidade do Pro´alcool, que, juntamente
1.2 Pr´oAlcool - Programa Brasileiro de ´Alcool 13 com a redu¸c˜ao de est´ımulos ao seu uso, provocou, nos anos seguintes, um significativo decr´escimo da demanda e, consequentemente, das vendas de autom´oveis movidos por esse combust´ıvel.
1.2.4
Fase de Redefini¸
c˜
ao
Os mercados de ´alcool combust´ıvel, tanto anidro quanto hidratado, encontram-se liberados em todas as suas faencontram-ses de produ¸c˜ao, distribui¸c˜ao e revenda sendo os seus pre¸cos determinados pelas condi¸c˜oes de oferta e procura. Questionou-se como o Brasil, sem a presen¸ca da gest˜ao governamental no setor, encontrar´a mecanismos de regula¸c˜ao para os seus produtos (altamente competitivos): a¸c´ucar para o mercado interno, a¸c´ucar para o mercado externo, etanol para o mercado interno e etanol para o mercado externo. Para a implementa¸c˜ao do Pro´alcool, foi estabelecido, em um primeiro instante, um processo de transferˆencia de recursos arrecadados a partir de parcelas dos pre¸cos da gasolina, diesel e lubrificantes para compensar os custos de produ¸c˜ao do ´alcool, de modo a viabiliz´a-lo como combust´ıvel. Assim, foi estabelecida uma rela¸c˜ao de paridade de pre¸cos entre o ´alcool e o a¸c´ucar para o produtor e incentivos de financiamento para as fases agr´ıcola e industrial de produ¸c˜ao do combust´ıvel. Com o advento do ve´ıculo a ´alcool hidratado, a partir de 1979, adotou-se pol´ıticas de pre¸cos relativos entre o ´alcool hidratado combust´ıvel e a gasolina, nos postos de revenda, de forma a estimular o uso do combust´ıvel renov´avel.
1.2.5
Fase Atual
Trinta anos depois do in´ıcio do Pro´alcool, o Brasil vive agora uma nova expan-s˜ao dos canaviais com o objetivo de oferecer, em grande escala, o combust´ıvel alternativo. O plantio avan¸ca al´em das ´areas tradicionais, do interior paulista e do Nordeste, e espalha-se pelos cerrados. A nova escalada n˜ao ´e um movimento comandado pelo governo, como a ocorrida no final da d´ecada de 70, quando o Brasil encontrou no ´alcool a solu¸c˜ao para en-frentar o aumento abrupto dos pre¸cos do petr´oleo que importava. A corrida para ampliar unidades e construir novas usinas ´e movida por decis˜oes da iniciativa privada, convicta de que o ´alcool ter´a, a partir de agora, um papel cada vez mais importante como combust´ıvel, no Brasil e no mundo. A tecnologia dos motores flex fuel veio dar novo fˆolego ao consumo interno de ´alcool. O carro que pode ser movido a gasolina, ´alcool ou uma mistura dos dois combust´ıveis foi introduzido no Pa´ıs em mar¸co de 2003 e conquistou rapidamente o
1.2 Pr´oAlcool - Programa Brasileiro de ´Alcool 14 consumidor. Hoje a op¸c˜ao j´a ´e oferecida para quase todos os modelos das ind´ustrias e, os autom´oveis bicombust´ıveis ultrapassaram pela primeira vez os movidos a gasolina na corrida do mercado interno. Diante do n´ıvel elevado das cota¸c˜oes de petr´oleo no mercado internacional, a expectativa da ind´ustria ´e que essa participa¸c˜ao se amplie ainda mais.
15
2 Material e M´
etodos
Uma s´erie temporal ´e uma cole¸c˜ao de observac˜oes feitas sequencialmente ao longo do tempo. A caracter´ıstica mais importante deste tipo de dados ´e que as observa¸c˜oes vizinhas s˜ao dependentes e estamos interessados em analisar e modelar esta dependˆencia. Enquanto em modelos de regress˜ao por exemplo a ordem das observa¸c˜oes ´e irrelevante para a an´alise, em s´eries temporais a ordem dos dados ´e crucial. Como a maior parte dos procedimentos estat´ısticos foi desenvolvida para analisar observa¸c˜oes independentes o estudo de s´eries temporais requer o uso de t´ecnicas espec´ıficas. Dados de s´eries temporais surgem em v´arios campos do conhecimento como Economia, Medicina, Epidemiologia, Meteorologia, etc. Algumas caracter´ısticas s˜ao particulares a este tipo de dados, por exemplo,
• Observa¸c˜oes correlacionadas s˜ao mais dif´ıceis de analisar e requerem t´ecnicas espec´ı-ficas;
• Precisamos levar em conta a ordem temporal das observa¸c˜oes;
• Fatores complicadores como presen¸ca de tendˆencias e varia˜ao sazonal ou c´ıclica podem ser dif´ıceis de estimar ou remover;
• A sele¸c˜ao de modelos pode ser bastante complicada, e as ferramentas podem ser de dif´ıcil interpreta¸c˜ao;
• ´E mais dif´ıcil de lidar com observa¸c˜oes perdidas e dados discrepantes devido `a na-tureza sequencial.
De um modo geral, os principais objetivos em se estudar s´eries temporais podem ser os seguintes,
• Descri¸c˜ao: Descrever propriedades da s´erie, e.g. o padr˜ao de tendˆencia, existˆencia de varia¸c˜ao sazonal ou c´ıclica, observa¸c˜oes discrepantes (outliers), altera¸c˜oes estruturais (e.g. mudan¸cas no padr˜ao da tendˆencia ou da sazonalidade), etc;
2.1 Modelos para Series Temporais 16 • Predi¸c˜ao: Predizer valores futuros com base em valores passados. Aqui assume-se que o futuro envolve incerteza, ou assume-seja as previs˜oes n˜ao s˜ao perfeitas. Por´em devemos tentar reduzir os erros de previs˜ao.
2.1
Modelos para Series Temporais
Os modelos utilizados para descrever s´eries temporais s˜ao processos estoc´ asti-cos, isto ´e, processos controlados por leis probabil´ısticas.
Qualquer que seja a classifica¸c˜ao que fa¸camos para os modelos de s´eries tempo-rais, podemos considerar um n´umero muito grande de modelos diferentes para descrever o comportamento de uma s´erie particular.
2.1.1
Processos estoc´
asticos
Um processo estoc´astico ´e uma fam´ılia de vari´aveis aleat´orias Z = {Z(t), t ∈ T },tal que para cada t ∈ T, Z(T ) ´e uma vari´avel aleat´oria.
Nestas condi¸c˜oes, um processo estoc´atisco ´e uma fam´ılia de vari´aveis aleat´orias (v.a). que suporemos definidas num mesmo espa¸co de probabilidade (Ω,A, P). O conjunto T ´e normalmente tomado como conjunto dos inteiros Z = {0, ±1, ±2, . . .} ou conjunto dos reais R. Tamb´em para cada t ∈ T, Z(T ) ser´a uma v.a real.
Como, para t ∈ T , Z(t) ´e uma v.a definida sobre Ω, na realidade Z(t) ´e uma fun¸c˜ao de dois argumentos, Z(t, w), t ∈ T, w ∈ Ω.
2.1.2
Processos estacion´
arios
Naquelas situa¸c˜oes em que se pretende utilizar modelos para descrever s´eries temporais, ´e mecess´ario introduzir suposi¸c˜oes simplificadoras, que nos conduza a analisar determinadas classes de processos estoc´asticos. Assim, podemos ter:
• processos estacion´arios ou n˜ao-estacion´arios, de acordo com independˆencia ou n˜ao relativamente `a origem dos tempos;
• processos normais (Gaussianos) ou n˜ao-normais, de acordo com as fdp que carac-terizam os processos;
2.2 T´ecnicas Descritivas 17 • processos Markovianos ou n˜ao-Markovianos, de acordo com a independˆencia dos
valores do processo, em dado instante, de seus valores em instantes precedentes.
Intuitivamente, um processo Z ´e estacion´ario se ele se desenvolve no tempo de modo que a escolha de uma origem dos tempos n˜ao ´e importante. Em outras palavras, as caracter´ısticas de Z(t + τ ), para todo τ , s˜ao as mesmas de Z(t). Tecnicamente, h´a duas formas de estacionaridade: fraca (ou ampla, ou de segunda ordem) e estrita (ou forte).
• Um processo estoc´astico Z = {Z(t), t ∈ T } diz-se estritamente estacion´ario se todas as distribui¸c˜oes finito-dimensionais permanecem as mesmas sob transl¸c˜oes no tempo, ou seja,
F (z1, . . . , zn; t1+ τ, . . . , tn+ τ ) = F (z1, . . . , zn; t1, . . . , tn), (2.1)
para quaisquer t1, . . . , tn, τ de T .
Isto significa em particular que todas as distribui¸c˜oes unidimensionais s˜ao invariantes sob transla¸c˜oes do tempo, logo a m´edia µ(t) e a variˆancia V (t) s˜ao constantes. Defini¸c˜ao 2.1.1. um processo estoc´astico Z = {Z(t), t ∈ T } diz-se fracamente esta-cion´ario ou estacion´ario de segunda ordem se somente se
i E({Z(t)} = µ(t), constante, para todo t ∈ T ; ii E({Z2(t)} < ∞, para todo t ∈ T ;
iii γ(t1, t2) = Cov{Z(t1, Z(t2)} ´e uma fun¸c˜ao de |t1− t2|.
2.2
T´
ecnicas Descritivas
Ao se analisar uma ou mais s´eries temporais a representa¸c˜ao gr´afica dos dados sequencialmente ao longo do tempo ´e fundamental e pode revelar padr˜oes de compor-tamento importantes. Tendˆencias de crescimento (ou decrescimento), padr˜oes c´ıclicos, altera¸c˜oes estruturais, observa¸c˜oes aberrantes, s˜ao muitas vezes facilmente identificados. Sendo assim, o gr´afico temporal deve ser sempre o primeiro passo e antecede qualquer an´alise.
2.2 T´ecnicas Descritivas 18
2.2.1
Decomposi¸
c˜
ao Cl´
assica
Conforme Ehlers 2009, muitas das propriedades observadas em uma s´erie tem-poral Zt podem ser captadas assumindo-se a seguinte forma de decomposi¸c˜ao
Zt= Tt+ Ct+ Rt,
onde Zt ´e uma componente de tendˆencia, Ct ´e uma componente c´ıclica ou sazonal e Rt´e
uma componente aleat´oria ou r´uido (a parte n˜ao explicada, que espera-se ser puramente aleat´oria). A componente c´ıclica se repete a cada intervalo fixo k, i.e.
. . . = Ct−2k = Ct−k = Ct+k = Ct+2k = . . . ,
assim, varia¸c˜oes peri´odicas podem ser captadas por esta componente.
2.2.2
Diferencia¸
c˜
ao
Um tipo especial de filtro, muito ´util para remover uma componente de tendˆ en-cia polinomial, consiste em diferenen-ciar a s´erie at´e que ela se torne estacion´aria. Para da-dos n˜ao sazonais, a primeira diferen¸ca ´e em geral suficiente para induzir estacionariedade aproximada. A nova s´erie y2, . . . , yn ´e formada a partir da s´erie original z1, . . . , zn como
yt = zt− zt−1= ∇zt.
Diferencia¸c˜ao de primeira ordem ´e a mais utilizada sendo que ocasionalmente uma diferencia¸c˜ao de segunda ordem pode ser requerida, i.e.
yt= ∇2zt= ∇(zt− zt−1) = zt− 2zt−1+ zt−2.
Al´em disso, independente do seu uso para induzir estacionariedade, a diferencia¸c˜ao pode ser muito ´util como ferramenta explorat´oria. Observa¸c˜oes discrepantes por exemplo po-dem ter um efeito dram´atico na s´erie diferenciada e uma representa¸c˜ao gr´afca ´e em geral suficiente para identificar tais pontos. O maior poblema, neste est´agio do procedimento ´e evitar um excesso de diferen¸cas. Segundo McLeod(1983):
• Um n´umero excessivo de diferen¸cas resulta em um valor negativo da autocorrela¸c˜ao de ordem 1 da s´erie diferen¸cada, neste caso ρ1 = −0, 5.
2.3 Modelos Probabil´ısticos 19 • Quando a s´erie ´e corretamente diferen¸cada, a variˆancia da s´erie transformada diminui,
por outro lado, excesso de diferen¸cas aumentar´a essa variˆancia.
2.3
Modelos Probabil´ısticos
A s´erie temporal, tamb´em denominada s´erie hist´orica, ´e uma sequˆencia de dados obtidos em intervalos regulares de tempo durante um per´ıodo espec´ıfico. Este conjunto pode ser obtido com as observa¸c˜oes peri´odicas do evento de interesse como, por exemplo, o valor m´aximo di´ario do pre¸co do a¸c´ucar no Estado de S˜ao Paulo, ou pelos processos de contagem como a produ¸c˜ao anual de cana-de-a¸c´ucar no Brasil. Se a s´erie hist´orica for denominada como Z, o valor da s´erie no momento t pode ser escrito como Zt(t = 1, 2, ..., n).
Os modelos utilizados para descrever s´eries temporais s˜ao processos estoc´ asti-cos, isto ´e, processos controlados por leis probabil´ısticas. Um processo estoc´astico ´e dito erg´odigo se apenas uma realiza¸c˜ao dele ´e suficiente para se obter todas as estat´ısticas.
Conforme Morretin & Toloi (1987), uma s´erie temporal ´e qualquer conjunto de observa¸c˜oes ordenadas no tempo. S´eries temporais s˜ao compostas por quatro elementos:
• Tendˆencia: verifica o sentido de deslocamento da s´erie ao longo de v´arios anos. • Ciclo: movimento ondulat´orio que ao longo de v´arios anos tende a ser peri´odico. • Sazonalidade: movimento ondulat´orio de curta dura¸c˜ao, em geral, inferior a um ano
associada, na maioria dos casos, a mudan¸cas clim´aticas.
• Ru´ıdo aleat´orio ou erro: compreende a variabilidade intr´ınseca aos dados e n˜ao pode ser modelado.
2.3.1
Modelos ARIMA
A hip´otese de erros n˜ao-correlacionados introduz s´erias limita¸c˜oes na validade dos modelos do tipo
Zt= f (t) + at, t = 1, . . . , N. (2.2)
Para descrever o comportamento de s´eries econˆomicas e socias, onde os erros observados s˜ao auto-correlacionados e influenciam a evolu¸c˜ao do processo.
2.3 Modelos Probabil´ısticos 20 Para estes casos, os modelos ARIMA s˜ao ´uteis para os prop´ositos que temos em vista. Trˆes classes de processos podem ser descritos pelo modelos ARIMA:
• Processos lineares estacion´arios, passiveis de representa¸c˜ao na forma:
Zt− µ = at+ ψ1at−1+ ψ2at−2+ . . . = ∞
X
k=0
ψkat−k, ψ0 = 1. (2.3)
Em 2.3 at´e ru´ıdo branco, µ = E(Zt) e ψ1, ψ2, . . . ´e uma seqˆencia de parˆametros tal
que
∞
X
k=0
ψk2 < ∞. (2.4)
Existem trˆes casos particulares do modelo 2.3: 1. processo auto-regressivo do ordem p: AR(p); 2. processo de m´edias m´oveis de ordem q: MA(q);
3. processo auto-regressivo e de m´edias m´oveis de ordem p e q: ARMA(p, q). • Processos lineares n˜ao estacion´ario homogˆenenos. Constituem uma generaliza¸c˜ao
dos processos lineares estacion´arios que sup˜oem que o mecanismo gerador da s´erie produz erros auto-correlacionados e que as s´eries sejam n˜ao-estacion´arias em nivel e/ou em inclina¸c˜ao. Estas s´eries podem tornar-se estacion´arias por meio de um n´umero finito (geralmente um ou dois) de diferen¸ca.
Estes processos s˜ao descritos de maneira adequada pelos chamados modelos auto-regressivos integrados e de m´edias m´oveis de ordem p, d e q : ARIMA(p,d,q), que podem ser generalizados pela inclus˜ao de um operador sazonal.
Uma metodologia bastante utilizada na an´alise de modelos param´etros ´e con-hecida como abordagem de Box e Jenkins(1970). Tal metodologia consiste em ajustar modelos auto-regressivos integrados de m´edias m´oveis, ARIMA(p,d,q), a um conjunto de dados.
A estrat´egia para a constru¸c˜ao do modelo ser´a baseada em um ciclo iterativo no qual a escolha da estrutura do modelo ´e baseada nos pr´oprios dados. Os est´agios do ciclo iterativo s˜ao:
2.4 Identifica¸c˜ao 21 • h´a identifica¸c˜ao de um modelo, com base na an´alise de autocorrela¸c˜oes,
autocorre-la¸c˜oes parciais e outros crit´erios;
• a seguir vem a fase de estima¸c˜ao, na qual os parˆametros do modelo identificado s˜ao estimados;
• finalmente, h´a a verifica¸c˜ao ou diagn´ostico do modelo ajustado, atrav´es de uma an´alise de res´ıduos, para se saber se este ´e adequado para os fins em vista (previs˜ao, por exemplo).
Caso o modelo n˜ao seja adequado, o ciclo ´e repetido, voltando-se `a fase de identifica¸c˜ao. Um procedimento que muita vezes ´e utilizado ´e identificar n˜ao s´o um ´unico modelo, mas alguns modelos que ser˜ao ent˜ao estimados e verificados. Se o prop´osito ´e a previs˜ao, escolher-se entre os modelos ajustados o melhor, por exemplo, no sentido de fornecer o menor erro quadr´atico m´edio de previs˜ao. Em geral os modelos postulados s˜ao parciomoniosos, pois contˆem um n´umero pequeno de parˆametros e as previs˜oes obtidas s˜ao bastante precisas, comparando-se favoravelmente com os demais m´etodos de previs˜ao.
2.4
Identifica¸
c˜
ao
2.4.1
Autocovariˆ
ancia e autocorrela¸
c˜
ao
Fun¸c˜ao de autocovariˆancia
Seja {Xt, t ∈ Z} um processo estacion´ario real discreto, de m´edia zero e fun¸c˜ao
de autocovariˆancia (facv) γτ = E{XtXt+τ}.
Proposi¸c˜ao 2.4.1. A facv γτ satisfaz as seguintes propriedades:
• γ0 > 0;
• γ − τ = γτ;
• |γτ| ≤ γ0;
• γτ ´e n˜ao negativa definida , no sentido que n X j=1 n X k=1 ajakγτj−τk ≥ 0; (2.5)
2.4 Identifica¸c˜ao 22 para quaisquer n´umeros reais a1, . . . , an e τ1, . . . , τn de Z.
Fun¸c˜ao de Autocorrela¸c˜ao
Segundo (Ehlers 2009), os coeficientes de autocorrela¸c˜ao amostral de uma s´erie temporal observada s˜ao uma ferramenta importante para descrever a s´erie. Analogamente, a fun¸c˜ao de autocorrela¸c˜ao te´orica (FAC) de um processo estoc´astico estacion´ario ´e uma ferramenta importante para acessar suas propriedades. Se um processo estoc´astico tem m´edia µ e variˆancia σ2, a correla¸c˜ao ser´a dada por:
ρ(τ ) = y(τ ) y(0) =
y(τ )
σ2 , (2.6)
e portanto ρ(o) = 1. As seguintes propriedades s˜ao facilmente verific´aveis.
• ρ(τ ) = ρ(−τ ); • −1 < ρ(τ ) < 1.
Fun¸c˜ao de Autocorrela¸c˜ao Parcial
Para um modelo AR(k), o ´ultimo coeficiente φkk e o j-´esimo coeficiente seja
φkj. Sabemos que
ρj = φk1ρj−1+ ρj−2φk2+ . . . + ρj−kφkk, j = 1, . . . , k, (2.7)
A partir das quais obtemos as equa¸c˜oes de Yule-Walker 1 ρ1 . . . ρk−1 ρ1 1 . . . ρk−2 .. . ρk−1 ρk−2 . . . 1 φk1 φk2 .. . φkk = ρ1 ρ2 .. . ρk
Resolvendo as equa¸c˜oes sucessicamente para k = 1, 2, 3, . . . obtemos de uma maneira geral φkk=
|P∗ k|
|Pk|
,
onde Pk´e a mateiz de autocorrela¸c˜ao e P∗k´e a matriz Pkcom a ultima coluna substituida
2.4 Identifica¸c˜ao 23 correlograma
Um gr´afico com os k primeiros coeficientes de autocorrela¸c˜ao como fun¸c˜ao de k ´
e chamado de correlograma e pode ser uma ferramenta poderosa para identificar caracter´ıs-ticas da s´erie temporal. Por´em isto requer uma interpreta¸c˜ao adequada do correlograma, i.e deve-se associar certos padr˜oes do correlograma como determinadas caracter´ısticas de uma s´erie temporal.
Prcesso FAC FACP
s´erie aleat´oria 0 0
AR(1), α > 0 decaimento exponencial 0, k > 1 AR(1), α < 0 decaimento oscilat´orio idem AR(p) decaimento para zero 0, k > p
MA(1) 0, k > 1 decaimento oscilat´orio ARMA(p,q) decaimento a partir de q decaimento a partir de p
Tabela 2.1: Propriedades te´oricas da fac e facp.
2.4.2
Crit´
erio de Informa¸
c˜
ao de Akaike
A escolha do modelo apropriado, do ponto de vista estat´ıstico, ´e um t´opico extremamente importante na an´alise de dados (Bozdangan, 1987). Buscasse o modelo mais parcimonioso, isto ´e, o modelo que envolva o m´ınimo de parˆametros poss´ıveis a serem estimados e que explique bem o comportamento da vari´avel resposta. Akaiki (1973, 1974) sugere escolher o modelo cujas ordens k e l minimizam o crit´erio
AIC(k, d, l) = N ln ˆσ2a+ N N − d2(k + l + 1 + δd0) + N ln 2π + N, (2.8) em que δd0 = 1, d = 0, 0, d 6= 0. e ˆσ2
a ´e o estimador de m´axima verossimilhan¸ca de σa2.
Para compra¸c˜ao de v´arios modelos, com N fixado, os dois ´ultimos termos da Equa¸c˜ao (2.8) podem ser abandonados. Levando-se em conta que, geralmente, identifi-camos a s´erie apropriadamente diferenciada, obtemos,
2.5 Estima¸c˜ao 24
AIC(k, l) = N ln ˆσa2+ 2(k + l + 2), (2.9) como crit´erio para determina¸c˜ao das ordens p e q. O que se faz, entao, ´e estipular valores limites superiores K e L para k e l e calcular Equa¸c˜ao (2.9) para todas as poss´ıveis combina¸c˜oes (k e l) com (0 ≤ k ≤ K) e (0 ≤ l ≤ L). Em geral, K e L s˜ao fun¸coes de N .
Podemos reescrever o AIC da seguinte forma
AIC(k, l) = ln ˆσk,l2 + 2(k + l)
N , (2.10)
pois os valores de k e l que minimizam esta ´ultima express˜ao s˜ao os mesmos que minimizam Equa¸c˜ao (2.9).
Dependendo dos Valores de K e L, muitos modelos tˆem que ser ajustados, a fim de ser obter o m´ınimo de AIC.
2.5
Estima¸
c˜
ao
2.5.1
Ajustando Processos ARIMA
Para estima¸c˜ao de parˆametros podem ser usados m´etodos de momentos, m´ıni-mos quadrados ou m´axima verossimilhan¸ca. No caso de um processo AR(p) com m´edia µ e t tendo distribui¸c˜ao normal, as estimativas obtidas usando o m´etodo de m´ınimos
quadra-dos coincidem com as estimativas obtidas usando o m´etodo de m´axima verossimilhan¸ca, usando a verossimilhan¸ca aproximada.
A forma exata da verossimilhan¸ca do modelo ARMA(p,q) ´e bastante compli-cada e foi desenvolvida por (Newbold, 1974). Para maximar est´a express˜ao (ou seu loga-ritmo) precissamos de algum algoritmo de otimiza¸c˜ao num´erica (por exemplo m´etodos de Newton-Raphson).
2.6
Diagn´
ostico
Ap´os identificar a ordem e estimar eficientemente os parˆametros de um modelo ´
2.6 Diagn´ostico 25 Pode-se fazer testes de sobreajustamento, que consistem em incluir parˆametros extras no modelo e verificar sua significˆancia estat´ıstica. No caso de modelos ARMA deve-se incluir um parˆametro de cada vez para evitar o problema de cancelamento de ra´ızes.
2.6.1
An´
alise dos Res´ıduos
Ap´os um modelo ter sido ajustado a uma s´erie temporal deve-se verificar se ele fornece uma descri¸c˜ao adequada dos dados. Assim como em outros modelos estat´ısticos a id´eia ´e verificar o comportamento dos res´ıduos onde
residuo = observa¸c˜ao - valor ajustado.
Se o modelo tiver um “bom”ajuste espera-se que os res´ıduos se distribuam aleatoriamente em torno de zero com variˆancia aproximadamente constante e sejam n˜ao correlacionados. Al´em disso, em modelos de s´eries temporais os res´ıduos est˜ao ordenados no tempo e ´e por-tanto natural trat´a-los tamb´em como uma s´erie temporal. ´E particularmente importante que os res´ıduos de um modelo estimado sejam serialmente n˜ao correlacionados. Evidˆencia de correla¸c˜ao serial nos res´ıduos ´e uma indica¸c˜ao de que uma ou mais caracter´ısticas da s´erie n˜ao foi adequadamente descrita pelo modelo. Consequentemente, duas maneiras ´ ob-vias de verificar a adequa¸c˜ao do modelo consistem em representar graficamente os res´ıduos e o seu correlograma.
2.6.2
Testes sobre os res´ıduos
Ao inv´es de olhar para as autocorrela¸c˜oes residuais individualmente pode-se testar se um grupo de autocorrela¸c˜oes ´e significativamente diferente de zero atrav´es das chamadas estat´ısticas Q. Para modelos ARMA Box & Jenkins (1970) sugeriram o uso do teste de Box-Pierce para as hip´oteses
H0 : ρ(1) = . . . = ρ(m) = 0,
H1 : ρ(k) 6= 0, para algum k ∈ {1, . . . , m},
sendo a estat´ıstica de teste dada por
Q = n
m
X
k=1
2.7 Previs˜ao 26 Na pr´atica o n´umero m de autocorrela¸c˜oes amostrais ´e tipicamente escolhido entre 15 e 30. Se o modelo ajustado for apropriado ent˜ao Q ter´a distribui¸c˜ao aproximada-mente qui-quadrado com m − p − q graus de liberdade.
Teste de normalidade
Os teste de normalidade s˜ao usados para determinar se um conjunto de dados de uma vari´avel aleat´oria, ´e bem modelado por uma distribui¸c˜ao normal ou n˜ao, ou para calcular a probabilidade de uma vari´avel aleat´oria estar normalmente distribu´ıda.
Teste de Box-Pierce
Box e Pierce (1970) sugeriram um teste para autocorrela¸c˜oes dos res´ıduos estimados que, apesar de n˜ao detectar quebras espec´ıficas no comportamento de ru´ıdo branco, pode indicar se esses valores s˜ao muito altos. Uma varia¸c˜ao desse teste foi sugerida por Ljung e Box (1978). Se omodelo for apropriaado, a estat´ıstica
Q = n(n + 2) m X k=1 r2 k n − k.
Ter´a aproximadamente uma distrui¸c˜ao χ2 com m − p − q graus de liberdade. A hip´otese de ru´ıdo branco dos res´ıduos ´e rejeitada para valores grandes de Q. Em geral basta utilizar as 10 ou 15 primeiras ˆrk.
2.7
Previs˜
ao
A previs˜ao para um modelo ARIMA (p, d, q) pode ser escrita na forma de equa¸c˜ao de diferen¸cas
Zt+h= ϕ1Zt+h−1+ . . . + ϕp+dZt+h−p−d − θ1at+h−1− . . . − θqat+h−q + at+h. (2.11)
Para expressar a previs˜ao ˆZh tomaremos a esperan¸ca condicional em 2.11, obtemos
ˆ
Z(h) = ϕ1[Zt+h−1] + . . . + ϕp+d[Zt+h−p−d]
− θ1[at+h−1] − . . . − θq[at+h−q] + [at+h],
2.7 Previs˜ao 27 para h ≥ 1. Aqui devemos utilizar os seguintes fatos
[Zt+k] = ˆZt(k), k > 0, (2.13)
[Zt+k] = Zt+k, k ≤ 0, (2.14)
[at+k] = 0, k > 0, (2.15)
[at+k] = at+k, k ≤ 0. (2.16)
• note que os termos de m´edias m´oveis desaparecem para h > q;
• para calcular ˆZt(h) precisamos de ˆZt(h − 1), ˆZt(h − 2), . . . que s˜ao calculados
recur-sivamente;
• existe uma certa aproxima¸c˜ao quando utilizamos esse procedimento, pois, na pr´atica, s´o conhecemos um n´umero finito de dados passados. Portanto, na realidade, a nossa previs˜ao ´e E[Zt+h|Zt, . . . , Z1], que ´e diferente da previs˜ao otima E[Zt+h|Zt, Zt−1, . . .].
Entretanto, as duas f´ormulas fornecem resultados semelhantes para um valor grande de t. Essa aproxima¸c˜ao ´e introduzida quando atribu´ımos valores inicias para calcular os valores da sequˆencia at;
• as informa¸c˜oes at s˜ao calculadas recursivamente.
2.7.1
Intervalo de confian¸
ca
A variˆancia do erro de previs˜ao, que ´e dada por V (h) = (1 + ψ2
1 + ψ22+ . . . +
ψ2h−1)σ2a. Para podermos determinar um intervalo de confian¸ca para Zt+h ser´a necess´ario
fazer uma suposi¸c˜ao adicional para os erros, ou seja, al´em de supor que E(at) = 0,
V ar(at) = σ2a para todo t e E(atas) = 0, t 6= s , iremos supor que at ∼ N(0, σa2), para
cada t. Segue que, dados os passados e presentes da s´erie, Zt, Zt−1, . . . , a distribui¸c˜ao
condicional de Zt+k ser´aN( ˆZt(h), V (h)). Logo,
U = Zt+k− ˆZ(h)
[V (h)]1/2 ∼ N(0, 1), (2.17)
e fixado o coeficiente de confian¸ca γ, podemos encontrar um valor υγ tal que P (−υγ <
U < υγ) = γ, ou seja, com probalidade γ.
ˆ
2.8 Modelo de regress˜ao com erros ARMA 28 Em V (h), o valor σ2
a n˜ao ´e conhecido e ´e substitu´ıdo por sua estimativa ˆσa2 obtida no
estagio de estima¸c˜ao do modelo. Deste modo, obtemos
ˆ Z(h) − υγσˆa+ " 1 + h−1 X j=1 ψj2 #1/2 ≤ Zt+k ≤ ˆZ(h) − υγˆσa+ " 1 + h−1 X j=1 ψ2j #1/2 . (2.19)
2.8
Modelo de regress˜
ao com erros ARMA
Os modelos de regress˜ao com erros ARMA s˜ao utilizados principalmente para captar influˆencias ou rea¸c˜oes na s´erie em estudo por meio de vari´aveis externas ou explica-tivas. A representa¸c˜ao gen´erica dos modelos de Regress˜ao com erros ARMA ´e apresentada na forma:
yt= β1x1,t+ β2x2,t+ . . . + βnxn,t+ Zt. (2.20)
Onde Yt´e a vari´avel resposta, Xi,t s˜ao as vari´aveis explicativas ou externas ou
de entrada, e Zt ´e o erro modelado por um processo ARMA tendo os res´ıduos t como
ru´ıdo branco, conforme Makridakis et al. (1998), Reinsel (1997), entre outros. Segundo Makridakis et al. (1998), a seq¨uˆencia de trabalho para este processo ´e:
• Ajustar o modelo de regress˜ao com um proxy model (modelo substituto ou modelo inicial) com modelagem AR(1) ou AR(2) para os erros (Zt).
• Se os erros a partir desta regress˜ao se apresentarem n˜ao estacion´arios, e diferen¸cas parecerem apropriadas, aplica-se ent˜ao uma diferen¸ca a todas as vari´aveis, resposta e explicativas. Da´ı ajusta-se o modelo utilizando a mesma modelagem inicial para os erros, desta vez com as vari´aveis diferenciadas.
• Se os erros a partir desta regress˜ao se apresentarem n˜ao estacion´arios, e diferen¸cas parecerem apropriadas, aplica-se ent˜ao uma diferen¸ca a todas as vari´aveis, resposta e explicativas. Da´ı ajusta-se o modelo utilizando a mesma modelagem inicial para os erros, desta vez com as vari´aveis diferenciadas.
• Reajusta-se o modelo completo usando o novo modelo ARMA para os erros. • Verifica-se a hip´otese de ru´ıdo branco para os residuos.
2.9 Dados 29 O m´etodo dos m´ınimos quadrados ´e freq¨uentemente usado para estimar o mod-elo (2.20). Se Zt ´e uma s´erie de ru´ıdo branco, ent˜ao o m´etodo m´ınimos quadrados
or-din´arios produz estimativas consistentes. Na pr´atica, ´e comum que Zt sejam serialmente
correlacionados. Neste caso, temos um modelo de regress˜ao com erros ARMA, e as esti-mativas de β pode n˜ao ser consistentes.
Um crit´erio de sele¸c˜ao de modelos a ser utilizado ´e o crit´erio AIC proposto por Akaike, sendo: AIC = −2 log L + 2m , onde L ´e a verossimilhan¸ca, onde m ´e o n´umero de parˆametros do modelo, (m = p + q), n ´e o n´umero de observa¸c˜oes da s´erie e σ2 ´e a
variˆancia dos t.
2.9
Dados
O banco de dados ´e constitu´ıdo por 8 vari´aveis (produ¸c˜ao de cana-de-a¸c´ucar, produ¸c˜ao de a¸c´ucar, produ¸c˜ao de ´alcool, pre¸co do etanol anidro combust´ıvel, pre¸co do etanol hidratado combust´ıvel, pre¸co do etanol hidratado para outros fins,pre¸co do a¸c´ucar, pre¸co da gasolina).
• S´erie: Produ¸c˜ao de cana-de-a¸c´ucar Tamanho da amostra: 62 observa¸c˜oes Periodicidade: anual
Per´ıodo: 1941-2011 Unidade: Toneladas Local: Brasil
Nome da vari´avel: Pdc
Fonte: Anu´ario Estat´ıstico da Agroenergia 2010.
• S´erie: Produ¸c˜ao de a¸c´ucar
Tamanho da amostra: 61 observa¸c˜oes Periodicidade: anual
Per´ıodo: 1948-1998 Unidade: Toneladas Local: Brasil
2.9 Dados 30 Nome da vari´avel: Prodda
Fonte: Associa¸c˜ao dos produtores de bioenergia do estado do PR. • S´erie: Pre¸co do etanol anidro combust´ıvel
Tamanho da amostra: 473 observa¸c˜oes Periodicidade: semanal
Per´ıodo: 2000-2013 Moeda: Real Unidade: Litro
Local: Estado de S˜ao Paulo Nome da vari´avel: Eac
Fonte: Uni˜ao dos produtores de bioenergia. • S´erie: Pre¸co do etanol hidratado combust´ıvel
Tamanho da amostra: 653 observa¸c˜oes Periodicidade: semanal
Per´ıodo: 2000-2013 Moeda: Real Unidade: Litro
Local: Estado de S˜ao Paulo Nome da vari´avel: Ehc
Fonte: Uni˜ao dos produtores de bioenergia. • S´erie: Pre¸co do etanol hidratado para outros fins
Tamanho da amostra: 653 observa¸c˜oes Periodicidade: semanal
Per´ıodo: 2000-2013 Moeda: Real Unidade: Litro
Local: Estado de S˜ao Paulo Nome da vari´avel: Ehof
Fonte: Uni˜ao dos produtores de bioenergia. • S´erie: Pre¸co do a¸c´ucar
Tamanho da amostra: 3908 observa¸c˜oes Periodicidade: di´aria
2.9 Dados 31 Per´ıodo: 1997-2013
Moeda: Real
Unidade: Saca de 50 kg Local: Estado de Goi´as Nome da vari´avel: Pda
Fonte: Uni˜ao dos produtores de bioenergia. • S´erie: Pre¸co da gasolina
Tamanho da amostra: 13 observa¸c˜oes Periodicidade: anual
Per´ıodo: 1994-2007 Moeda: Real Unidade: Litro
Local: Regi˜ao sudeste Nome da vari´avel: Pdg
Fonte: Instituto de Pesquisa Econˆomica Aplicada. • S´erie: Produ¸c˜ao de ´alcool
Tamanho da amostra: 60 observa¸c˜oes Periodicidade: anual
Per´ıodo: 1951-2011 Unidade: m3
Local: Brasil
Nome da vari´avel: Pdal
32
3 Resultados
Nesta se¸c˜ao apresenta-se o desenvolvimento dos passos metodol´ogicos. Para que seja poss´ıvel alcan¸car o objetivo proposto transformamos o banco de dados fazendo com que somente as vari´aveis com a mesma periodicidade fossem aproveitadas para analises, ou seja, transformamos as vari´aveis de periodicidade di´aria ou semanal em vari-´
aveis de periodicidade mensal, vari´aveis de periodicidade anual foram analisadas a parte e seus resultados seguem em Apˆendice A. A metodologia de modelos de regress˜ao com erros ARMA foi implementada no Software R conforme (Tsay 2010, Se¸c˜ao 2.9).
3.1
An´
alise gr´
afica e an´
alise descritiva
Com a finalidade de conhecer o comportamento do etanol hidratado com-bust´ıvel no decorrer do per´ıodo analisado, apresenta-se na Tabela 3.1 algumas estat´ıs-ticas descritivas da s´erie do pre¸co do etanol hidratado combust´ıvel (Ehc), assim como seu gr´afico temporal na Figura 3.1 .
Estat´ıstica Resultado (R$) M´edia 0.7968 Mediana 0.7516 Desvio padr˜ao 0.2235 Coeficiente de varia¸c˜ao 0.2805 M´ınimo 0.3381 M´aximo 1.4606
Tabela 3.1: Estat´ısticas descritivas da s´erie do pre¸co do etanol hidratado combust´ıvel.
Pela an´alise descritiva, observa-se variabilidade do pre¸co no decorrer do per´ıodo, pois o valor m´ınimo ´e R$ 0.3381, e o valor m´aximo ´e R$ 1.4606. Na figura 3.1 observa-se que a s´erie parece ter um comportamento n˜ao estacion´ario, apresentando uma leve tendˆencia de crescimento ao longo do per´ıodo estudado.
3.1 An´alise gr´afica e an´alise descritiva 33 0 50 100 150 0.0 0.5 1.0 1.5 07/2000 a 01/2013
preço do Ehc em Reais(R$)
Figura 3.1: S´erie do pre¸co do etanol hidratado combust´ıvel no per´ıodo analisado. ´
e a an´alise da Fun¸c˜ao de Autocorrela¸c˜ao (FAC) da s´erie de pre¸cos do etanol hidratado combust´ıvel, representada na Figura 3.2. A FAC amostral apresenta um decaimento
0 5 10 15 20 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag A CF
Figura 3.2: FAC do pre¸co etanol hidratado combust´ıvel.
muito lento, mostrando que a s´erie ´e n˜ao estacion´aria. Portanto, utilizaremos um filtro para remover o componente de tendˆencia, consiste em diferenciar a s´erie at´e que ela se
3.1 An´alise gr´afica e an´alise descritiva 34 torne estacion´aria. Como podemos notar pelo gr´afico temporal na Figura 3.3 e da FAC amostral na Figura 3.4 e de acordo com McLeod (1983), somente a primeira diferencia¸c˜ao foi suficiente para torna a s´erie estacion´aria. Portanto, pela inspe¸c˜ao da Figura 3.4 e da Figura 3.5 sugere-se a utiliza¸c˜ao dos modelos ARMA para capturar e modelar essa s´erie de dados. Os passos restantes da metodologia para o modelo univariado seguem no Apˆendice B.1. 0 50 100 150 −1.0 −0.5 0.0 0.5 1.0 08/2000 a 01/2013
Figura 3.3: Primeira diferen¸ca do pre¸co do etanol hidratado combust´ıvel no per´ıodo anal-isado.
3.1 An´alise gr´afica e an´alise descritiva 35 0 5 10 15 20 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag A CF
Figura 3.4: FAC da primeira diferen¸ca pre¸co etanol hidratado combust´ıvel.
5 10 15 20 −0.2 −0.1 0.0 0.1 0.2 Lag P ar tial A CF
3.2 Estima¸c˜ao de modelos concorrentes e escolha do melhor modelo 36
3.2
Estima¸
c˜
ao de modelos concorrentes e escolha do
melhor modelo
Com o intuito de encontrar o melhor modelo que represente corretamente o processo gerador de cada s´erie, estimaram-se diversos modelos, os quais foram denom-inados de modelos concorrentes, pois os mesmos apresentaram a condi¸c˜ao de ser ru´ıdo branco. Ap´os a estima¸c˜ao dos modelos concorrentes utilizou-se o Crit´erio de Informa¸c˜ao de Akaike (AIC) para a escolha do modelo representativo da s´erie em estudo. Como j´a foi mencionado na Se¸c˜ao 2.9, Ehc significa pre¸co do etanol hidratado combust´ıvel, Eac sig-nifica pre¸co do etanol anidro combust´ıvel, Ehof sigsig-nifica pre¸co do etanol hidratado para outros fins, e Pda significa pre¸co do a¸c´ucar.
Vari´aveis explicativas Modelos AIC sem vari´avel explicativa ARIMA(7,0,0) -334.68
Ehof ARIMA(1,0,0) -635.35
Eac ARIMA(2,0,0) -430.31
Pda ARIMA(3,0,0) -357.80
Ehof e Eac ARIMA(1,0,0) -634.95 Ehof e Pda ARIMA(1,0,0) -633.46 Eac e Pda ARIMA(4,0,0) -452.53 Ehof e Eac e Pda ARIMA(1,0,0) -633.10
Tabela 3.2: Modelos ARIMA (p,d,q) concorrentes para o pre¸co do etanol hidratado com-bust´ıvel.
3.2 Estima¸c˜ao de modelos concorrentes e escolha do melhor modelo 37
Vari´aveis explicativas Modelos AIC
Ehof ARIMA(7,0,0) -329.96
Eac ARIMA(7,0,0) -348.21
Pda ARIMA(4,0,0) -333.13
Ehof e Eac ARIMA(7,0,0) -346.13 Ehof e Pda ARIMA(7,0,0) -332.51 Eac e Pda ARIMA(10,0,0) -349.98 Ehof e Eac e Pda ARIMA(10,0,0) -347.99
Tabela 3.3: Modelos ARIMA (p,d,q) com atraso de 1 observa¸c˜ao concorrentes para o pre¸co do etanol hidratado combust´ıvel.
Vari´aveis explicativas Modelos AIC
Ehof ARIMA(7,0,0) -329.81
Eac ARIMA(7,0,0) -326.66
Pda ARIMA(7,0,0) -328.97
Ehof e Eac ARIMA(4,0,0) -323.18 Ehof e Pda ARIMA(7,0,0) -327.99 Eac e Pda ARIMA(7,0,0) -327.21 Ehof e Eac e Pda ARIMA(10,0,0) -347.99
Tabela 3.4: Modelos ARIMA (p,d,q) com atrasos de 2 observa¸c˜oes concorrentes para o pre¸co do etanol hidratado combust´ıvel.
3.3 An´alise Residual 38 Utilizando o crit´erio de Informa¸c˜ao de Akaike, o melhor modelo ajustado para o pre¸co do etanol hidratado combust´ıvel ´e denotado por meio da Equa¸c˜ao (3.1). Por´em devido ao fato do modelo melhor ajustado utilizar uma vari´avel explicativa sem atraso, ele n˜ao poder´a ser usado para prever o pre¸co do etanol hidratado combustiv´el.
C1,t = 0.9483C2,t−1+ t, t = −0.1974t−1, σa2 = 0.0008138. (3.1)
Onde,
C1,t = Ehct− Ehct−1,
C2,t = Ehoft− Ehoft−1.
Dentre os modelos que podem ser usados para previs˜ao do pre¸co do etanol hidratado combust´ıvel o melhor modelo ajustado ´e
C1,t = −0.2232C3,t−1+ 0.0041C4,t−1+ t, t = 0.4258t−1− 0.3995t−2+ 0.1573t−3− 0.2295t−4− 0.0321t−5 −0.1194t−6− 0.1206t−7− 0.0196t−8− 0.0731t−9− 0.1427t−10, σa2 = 0.004662. Onde, C1,t = Ehct− Ehct−1, C3,t = Eact− Eact−1, C4,t = Pdat− Pdat−1.
3.3
An´
alise Residual
Foi aplicado o teste de Ljung-Box no melhor modelo ajustado para previs˜ao, pode-se perceber o bom ajuste do modelo, mostrando-se bom para realizar previs˜oes.
Para verificar a normalidade dos res´ıduos, foi realizado o Teste de Shapiro-wilk que verifica as seguintes hip´oteses:
H0 : Res´ıduos possuem distribui¸c˜ao normal.
3.3 An´alise Residual 39 0 5 10 15 20 −0.2 0.6 Lag A CF 5 10 15 20 −0.15 0.10 Lag P ar tial A CF
Figura 3.6: FAC e FACP do melhor modelo ajustado para previs˜ao
Lag χ2 Gdl P-valor
15 2.549351 4 0.6358211 20 5.948226 9 0.7450887 30 16.365027 19 0.6328013 Tabela 3.5: Teste de Ljung-Box.
3.4 Resultados gr´aficos e previs˜ao do modelo melhor ajustado 40 Obtivemos a estat´ıstica de teste W = 0.9738 e p-valor = 0.00594.O p-valor baixo mostra evidˆencias para a rejei¸c˜ao da hip´otese nula, ou seja, os dados n˜ao s˜ao nor-malmente distribuidos. Tamb´em pode-se verificar o histograma dos res´ıduos do melhor modelo escolhido e o gr´afico Normal Q-Q Plot: Com esta an´alise residual, pode-se
afir-Histogram of z z Density −0.2 −0.1 0.0 0.1 0.2 0.3 0 3 6 −2 −1 0 1 2 −0.2 0.1 Normal Q−Q Plot Theoretical Quantiles Sample Quantiles
Figura 3.7: Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo melhor ajustado.
mar que o modelo escolhido ´e adequado aos dados,como verificado no teste de Ljung-Box, porem temos evidˆencias para acreditar que os dados n˜ao s˜ao normalmente distribuidos, o que nos leva a ter uma certa cautela ao analisarmos o intervalo de confina¸ca para previs˜ao de obersava¸coes futuras.
3.4
Resultados gr´
aficos e previs˜
ao do modelo melhor
ajustado
Devido o modelo melhor ajustado para se fazer previs˜oes utilizar vari´aveis ex-plicativas com atraso de uma observa¸c˜ao, so ´e poss´ıvel fazer previs˜ao para um passo a frente, para dois ou mais passos precisariamos prever antes o valor das vari´aveis explica-tivas o que diminuiria a qualidade e a confian¸ca dos resultados. A previs˜ao um passo a frente para o pre¸co do etanol hidratado combust´ıvel utilizando o modelo ARIMA(10,0,0) com duas variaveis explicativas (Eac e Pda) com atraso de uma observa¸c˜ao e o valor real
3.4 Resultados gr´aficos e previs˜ao do modelo melhor ajustado 41 da vari´avel em estudo, est˜ao expostas em valores, na Tabela 3.6.
Data Estimativa pontual Valor real Fev 2013 1.210613 1.239075
Tabela 3.6: Estimativa do modelo versus o valor real observado.
Data IC Inferior Estimativa pontual IC Superior Valor real Fev 2013 1.076791 1.210613 1.344435 1.239075 Tabela 3.7: Estimativas pontuais e intervalares do modelo versus o valor real.
Anos
Preço do Etanol hidr
atado comb ustív el 2000 2004 2008 2012 0.0 0.5 1.0 1.5 2.0 * * * *
Figura 3.8: Previs˜ao para o pre¸co do etanol hidratado combust´ıvel.
Para comprovar as expectativas em torno da qualidade do modelo escolhido a fim de se fazer a previs˜ao de pre¸cos, foi feito o teste de verifica¸c˜ao da qualidade da previs˜ao como mostrado em valores, na Tabela 3.7 e graficamente na Figura 3.8, os pontos em vermelho indicam os limites do intervalo de confian¸ca,o ponto em marrom indica a estimativa pontual e o ponto em azul indica o valor real observado para o mˆes de fevereiro de 2013.
42
4 Conclus˜
oes
A pesquisa foi realizada por meio da an´alise de s´eries temporais, utilizando dados do pre¸co do etanol hidratado e de series auxiliares que ajudasem a explicar o com-portamento da s´erie em estudo, todos os pre¸co s˜ao referentes ao Estado de S˜ao Paulo, no per´ıodo de julho de 2000 a janeiro de 2013. O trabalho foi um pouco limitado pelo fato de que para se utilizar a metodologia de regress˜ao com erros ARMA, o banco de dados n˜ao pode ser totalmente aproveitado e o pre¸co da gasolina que provavelmente ajudaria a explicar melhor o pre¸co do etanol hidratado combust´ıvel n˜ao foi utilizada como var-i´avel explicativa uma vez que sua periodicidade era diferente da s´erie em estudo. Com base nos resultados e an´alises apresentadas verificou-se que a utiliza¸c˜ao de m´etodos de previs˜ao estoc´asticos, tal como os m´etodos Box-Jenkins ou Regress˜ao com erros ARMA informaram estimativas proxima da realidade. Dessa forma, deixa-se como sugest˜ao para futuros trabalhos, a inclus˜ao de mais vari´aveis explicativas para ajudar a captar as demais caracter´ısticas da s´erie em estudo, vari´aveis como o n´umero de carros flex fuel, pre¸co do petr´oleo, cota¸c˜ao do dolar e vari´aveis macroeconˆomicas. Outro ponto importante que n˜ao foi abordado nesse trabalho ´e se a produ¸c˜ao de etanol pode prejudicar a produ¸c˜ao de alimentos no Brasil.
Referˆ
encias Bibliogr´
aficas
[1] ALCOPAR - Associa¸c˜ao dos produtores de bioenergia do estado do PR. Dispon´ıvel em http://www.alcopar.org.br. Consultado em 1/02/2013.
[2] BOZDONGAN. H. Model selection and Akaike’s Information Criterion (AIC): The general theory and its analytical extensions. Psychometrika. v.52, n.3, 345-370, 1987. [3] EHLERS, R. S., Apostila An´alise de S´eries Temporais. Quinta edi¸c˜ao. Curitiba,
UFPR, 2009.
[4] IPEA - Instituto de Pesquisa Econˆomica Aplicada. Dispon´ıvel em http://www.ipea. gov.br. Consultado em 1/02/2013.
[5] KOHLHEPP, G. An´alise da situa¸c˜ao da produ¸c˜ao de etanol e biodiesel no Brasil, Estudos Avan¸cados, S˜ao Paulo, v.24, n.68, 2010.
[6] MAKRIDAKIS ET AL., S.; Wheelwright, S.; Hyndman, R.J. Forecasting: methods and applications. Third Edition, New York, John Wiley & Sons, Inc., 1998.
[7] MCLEOD, G. Box-Jenkins in Pratice. Lancaster, Gwilym Jenkins and Partners Ltd. 1983.
[8] Minist´erio da Agricultura. Dispon´ıvel em http://www.agricultura.gov.br. Consul-tado em 1/02/2013.
[9] MORRETIN, P. A.; TOLOI, C. M. C. An´alise de S´eries Temporais. S˜ao Paulo, Edgard Bl¨ucher. 2004.
[10] MORRETIN, P. A.; TOLOI, C. M. C. Previs˜ao de s´eries temporais. Segunda edi¸c˜ao, S˜ao Paulo, Atual Editora, 1987.
[11] REINSEL, G.C. Elements of Multivariate Time Series Analysis. Second Edition, New York, Springer, 1997.
[12] TSAY, R. S. Analysis of Financial Time Series. Third Edition, New Jersey, John Wiley & Sons, Inc., 2010.
REFERˆENCIAS BIBLIOGR ´AFICAS 44 [13] UDOP - Uni˜ao dos produtores de Bioenergia. Dispon´ıvel em http://www.udop.com.
br. Consultado em 1/02/2013.
[14] XAVIER, M. The Brazilian sugarcane ethanol experience. Issue analysis 3, Washing-ton, DC, 2007.
Apˆ
endices
46
A Analise descritiva
Pre¸co da Gasolina 2 4 6 8 10 12 14 0.5 1.0 1.5 2.0 2.5 1994 a 2007preço da gasolina em Reais(R$)
Figura A.1: S´erie do pre¸co gasolina no per´ıodo analisado.
> summary(pdg[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max. 0.5200 0.7751 1.5850 1.4880 2.0780 2.5400
A Analise descritiva 47 Produ¸c˜ao de A¸c´ucar
0 10 20 30 40 50 60 0.0e+00 1.0e+07 2.0e+07 3.0e+07 1949 a 2009 T oneladas
Figura A.2: S´erie da produ¸c˜ao de a¸c´ucar no per´ıodo analisado.
> summary(prodda[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max.
A Analise descritiva 48 Produ¸c˜ao de ´Alcool 0 10 20 30 40 50 60 0.0e+00 1.0e+07 2.0e+07 1951 a 2011 m³
Figura A.3: S´erie produ¸c˜ao de ´alcool no per´ıodo analisado.
> summary(pdal[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max.
A Analise descritiva 49 Produ¸c˜ao de Cana-de-a¸c´ucar
0 10 20 30 40 50 60 70 0e+00 1e+08 2e+08 3e+08 4e+08 5e+08 6e+08 1941 a 2011 T oneladas
Figura A.4: S´erie da produ¸c˜ao de cana-de-a¸c´ucar no per´ıodo analisado.
> summary(pdc[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max.
A Analise descritiva 50 Etanol hidratado outros fins
0 100 200 300 400 500 600 0.4 0.6 0.8 1.0 1.2 1.4 1.6 07/2000 a 01/2013
preço do Ehof em Reais(R$)
Figura A.5: S´erie do pre¸co etanol hidratado outros fins no per´ıodo analisado.
> summary(ehof[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max. 0.3600 0.6700 0.8000 0.8372 0.9900 1.6220
A Analise descritiva 51 Etanol anidro combust´ıvel
0 100 200 300 400 500 600 0.0 0.5 1.0 1.5 2.0 2.5 3.0 07/2000 a 01/2013
preço do Eac em Reais(R$)
Figura A.6: S´erie do pre¸co etanol anidro no per´ıodo analisado.
> summary(eac[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max. 0.3758 0.6672 0.8521 0.8915 1.0580 2.7260
A Analise descritiva 52 Pre¸co do A¸c´ucar
0 1000 2000 3000 4000 10 20 30 40 50 60 70 05/1997 a 01/2013
preço do açúcar em Reais(R$)
Figura A.7: S´erie do pre¸co do a¸c´ucar no per´ıodo analisado.
> summary(pda[,2])
Min. 1st Qu. Median Mean 3rd Qu. Max. 8.31 21.33 28.12 33.54 46.06 76.98
53
B Estima¸
c˜
ao de modelos concorrentes e
An´
alise Residual
B.1
Modelo univariado
> require(xts)
> raw <- read.delim2("etanol hidratado.txt") > data <- as.Date(raw$Data)
> dados <- raw$Valor > a <- xts(dados, data)
> ehc_mes <-apply.monthly(a, mean) > ehc=coredata(ehc_mes)
> fit <- arima((diff(ehc)), order = c(7,0,0),include.mean=F) > fit
Call:
arima(x = (diff(ehc)), order = c(7, 0, 0), include.mean = F)
Coefficients:
ar1 ar2 ar3 ar4 ar5 ar6 ar7
0.2603 -0.3287 0.1872 -0.1461 -0.0428 -0.1144 -0.1737 s.e. 0.0804 0.0824 0.0868 0.0871 0.0864 0.0818 0.0793
sigma^2 estimated as 0.005626: log likelihood = 175.34, aic = -334.68
Teste de Ljung-Box
> p<- 7 > q<- 0 > u <- c()
B.1 Modelo univariado 54 + { LB <- Box.test(resid(fit), i, type = "Ljung-Box", fitdf=p+q+1)
+ u <- c(u, i, LB$statistic, LB$parameter, LB$p.value) } > u <- matrix(u, ncol=4, byrow=T)
> colnames(u)<- c("Lag", "$\\chi^2$", "GdL", "P-valor") > rownames(u)<-c()
> u
Lag $\\chi^2$ GdL P-valor [1,] 15 9.514905 7 0.2177695 [2,] 20 12.386525 12 0.4151576 [3,] 30 20.846573 22 0.5302369 > > 0 5 10 15 20 −0.2 0.4 1.0 Lag A CF 5 10 15 20 −0.15 0.05 Lag P ar tial A CF
B.1 Modelo univariado 55 Teste de normalidade
> z=fit$residuals > shapiro.test(z)
Shapiro-Wilk normality test
data: z W = 0.9712, p-value = 0.003037 Histogram of z z Density −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 0 2 4 6 −2 −1 0 1 2 −0.2 0.1 0.3 Normal Q−Q Plot Theoretical Quantiles Sample Quantiles
Figura B.2: Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo ehc univariado.
B.1 Modelo univariado 56
Anos
Preço do Etanol hidr
atado comb ustív el 2000 2002 2004 2006 2008 2010 2012 2014 0.0 0.5 1.0 1.5 2.0 * * * *
Figura B.3: Previs˜ao para o pre¸co do etanol hidratado combust´ıvel.
Data IC Inferior Estimativa pontual IC Superior Valor real Fev 2013 1.009398 1.156408 1.303418 1.239075 Tabela B.1: Estimativas pontuais e intervalares do modelo versus o valor real.
B.2 Modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. 57
B.2
Modelo ehc com a vari´
avel explicativa ehof sem
atraso nas oberva¸
c˜
oes.
> raw <- read.delim2("etanol hidratado.txt") > data <- as.Date(raw$Data)
> dados <- raw$Valor > a <- xts(dados, data)
> ehc_mes <-apply.monthly(a, mean) > ehc=coredata(ehc_mes)
> raw <- read.delim2("etanol hidratado outros fins.txt") > data <- as.Date(raw$Data)
> dados <- raw$Valor > a <- xts(dados, data)
> ehof_mes <-na.omit(apply.monthly(a, mean)) > ehof=coredata(ehof_mes)
> fit=arima(diff(ehc), order = c(1,0,0),xreg=diff(ehof),include.mean=F) > fit
Call:
arima(x = diff(ehc), order = c(1, 0, 0), xreg = diff(ehof), include.mean = F)
Coefficients:
ar1 diff(ehof)
-0.1974 0.9483
s.e. 0.0798 0.0266
sigma^2 estimated as 0.0008138: log likelihood = 320.68, aic = -635.35
Teste de Ljung-Box
> p<- 1 > q<- 0 > u <- c()
B.2 Modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. 58 + { LB <- Box.test(resid(fit), i, type = "Ljung-Box", fitdf=p+q+1)
+ u <- c(u, i, LB$statistic, LB$parameter, LB$p.value) } > u <- matrix(u, ncol=4, byrow=T)
> colnames(u)<- c("Lag", "$\\chi^2$", "GdL", "P-valor") > rownames(u)<-c()
> u
Lag $\\chi^2$ GdL P-valor [1,] 15 11.53499 13 0.566092 [2,] 20 16.93137 18 0.527828 [3,] 30 36.45503 28 0.131373 > > Teste de normalidade > z=fit$residuals > shapiro.test(z)
Shapiro-Wilk normality test
data: z
B.2 Modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. 59 0 5 10 15 20 −0.2 0.4 1.0 Lag A CF 5 10 15 20 −0.15 0.05 Lag P ar tial A CF
Figura B.4: FAC e FACP do modelo ajustado para ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes.
B.2 Modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes. 60 Histogram of z z Density −0.20 −0.15 −0.10 −0.05 0.00 0.05 0.10 0 4 8 −2 −1 0 1 2 −0.20 −0.05 Normal Q−Q Plot Theoretical Quantiles Sample Quantiles
Figura B.5: Histograma e gr´afico Q-Qplot dos res´ıduos para o modelo ehc com a vari´avel explicativa ehof sem atraso nas oberva¸c˜oes.