• Nenhum resultado encontrado

UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS AMANDA CAROLINE MARTIN

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS AMANDA CAROLINE MARTIN"

Copied!
58
0
0

Texto

(1)

UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS

DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS

AMANDA CAROLINE MARTIN

ANÁLISE DE SÉRIES TEMPORAIS PARA PREVISÃO DA EVOLUÇÃO DO NÚMERO DE AUTOMÓVEIS NO MUNICÍPIO DE JOINVILLE-SC

JOINVILLE – SC – BRASIL 2015

(2)

UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS

DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS

AMANDA CAROLINE MARTIN

ANÁLISE DE SÉRIES TEMPORAIS PARA PREVISÃO DA EVOLUÇÃO DO NÚMERO DE AUTOMÓVEIS NO MUNICÍPIO DE JOINVILLE-SC

Trabalho de Graduação apresentado à Universidade do Estado de Santa Catarina, como requisito parcial para obtenção do título de Engenheira de Produção e Sistemas.

Orientadora: Prof. Elisa Henning, Dra. Coorientadora: Prof. Olga M. F. C. Walter, Msc.

JOINVILLE – SC – BRASIL 2015

(3)

AMANDA CAROLINE MARTIN

ANÁLISE DE SÉRIES TEMPORAIS PARA PREVISÃO DA EVOLUÇÃO DO NÚMERO DE AUTOMÓVEIS NO MUNICÍPIO DE JOINVILLE-SC

Trabalho de Graduação apresentado à Universidade do Estado de Santa Catarina, como requisito parcial para obtenção do título de Engenheira de Produção e Sistemas.

Banca Examinadora

Orientadora:

______________________________________________________ Doutora Elisa Henning

Universidade do Estado de Santa Catarina

Coorientadora:

______________________________________________________ Mestre Olga Maria Formigoni Carvalho Walter

Universidade do Estado de Santa Catarina

Membro:

______________________________________________________ Doutora Andrea Cristina Konrath

Universidade Federal de Santa Catarina

(4)

AGRADECIMENTOS

Agradeço minha família, em especial meus pais, Rogério e Tânia, por todo o carinho, dedicação e esforço com que conduziram minha educação e por todo o suporte e confiança em mim depositada. À minha irmã, Bruna, por ser um exemplo a ser seguido em diversas situações da vida.

Ao meu namorado, Matheus, por toda a paciência e incentivo ao longo dos anos, por me compreender nas horas difíceis e ausências, por se manter ao meu lado em todos os momentos, apoiando minhas decisões e acreditando na minha vitória, antes mesmo de ingressar na faculdade.

À Elisa, por sempre ter sido uma orientadora excelente, da iniciação científica ao TCC e mostrando como é interessante o estudo estatístico. À Olga, por suas fundamentais contribuições para a elaboração deste trabalho.

(5)

RESUMO

Em um ambiente cada vez mais competitivo, produzir a quantidade necessária é um dos fatores fundamentais para manter a sustentabilidade da empresa. Ao se tratar de previsão de crescimento do número de automóveis, os benefícios vão além da previsibilidade para o setor automobilístico, pois pode auxiliar também aos setores públicos na tomada de decisão. Existem diversos métodos para prever demanda ou crescimento. As séries temporais consideram os dados de determinada variável ordenados cronologicamente e podem fornecer informações futuras através de alguns métodos, como os autorregressivos integrados de média móvel (ARIMA) ou suavização exponencial. Este trabalho teve como objetivo principal comparar o crescimento do número de automóveis entre o município de Joinville e o estado de Santa Catarina e, principalmente, propor modelos de previsão por meio de séries temporais para os dados de Joinville, a fim de identificar o método que melhor se ajusta à série estudada. Para a série mensal de número de automóveis, caminhonetas, camionetes e utilitários no município de Joinville – SC, entre janeiro de 2003 e março de 2014, foram propostos modelos ARIMA, modelos de suavização exponencial e combinação de modelos e previsões. Constatou-se que, para esta série, os modelos autorregressivos integrados de média móvel apresentaram os menores erros dentro e fora da amostra e, portanto, o modelo SARIMA(0,2,1)𝑥(1,0,0)12 foi o mais adequado para realizar as previsões, com erro U-Theil de 0,44.

Palavras-chave: séries temporais, previsão de demanda, automóveis, Santa Catarina, Joinville.

(6)

LISTA DE FIGURAS

Figura 1- ACF de um AR(1)... 18

Figura 2 - PACF de um AR(1) ... 18

Figura 3 - Função de autocorrelação e autocorrelação parcial de um MA(3) ... 18

Figura 4 - Metodologia Box-Jenkins ... 21

Figura 5 - Funções de autocorrelação e autocorrelação parcial de um ruído branco ... 25

Figura 6 - Comparativo de crescimento de Joinville x Santa Catarina ... 31

Figura 7 - Apresentação da Série Temporal ... 33

Figura 8 - Decomposição da série temporal ... 34

Figura 9 - Diferenciações da Série Não Estacionária ... 35

Figura 10 - Resíduos do Modelo II ... 36

Figura 11 - ACF e PACF da série temporal diferenciada duas vezes ... 36

Figura 12 - Resíduos do modelo rejeitado. ... 36

Figura 13 - Resíduos do Modelo III ... 37

Figura 14 - Resíduos do Modelo IV ... 37

Figura 15 - ACF e PACF da série temporal diferenciada uma vez ... 38

Figura 16 - Resíduos do Modelo V ... 38

Figura 17 - Resíduos do Modelo VI ... 39

Figura 18 - Resíduos do Modelo A ... 40

Figura 19 - Resíduos do Modelo B ... 41

(7)

LISTA DE TABELAS

Tabela 1 - Comparativo entre os modelos AR(p), MA(q) e ARMA(p,q) ... 19

Tabela 2 - Métodos de Suavização Exponencial ... 23

Tabela 3 - Comparativo entre Joinville e Santa Catarina ... 32

Tabela 4 – Diferenciações regulares ... 35

Tabela 5 - Modelos rejeitados e com duas diferenciações ... 37

Tabela 6 - Modelos rejeitados e com uma diferenciação ... 38

Tabela 7 – Comparativo entre os modelos ARIMA ... 39

Tabela 8 – Comparativo entre os modelos ETS ... 41

Tabela 9 – Métodos de suavização exponencial rejeitados. ... 42

Tabela 10 - Modelos utilizados na Combinação 1 ... 43

Tabela 11 – Erros da Combinação 1 ... 44

Tabela 12 – Modelos utilizados na combinação 2. ... 44

Tabela 13 – Erros da combinação 2... 44

Tabela 14 – Modelos utilizados na combinação 3. ... 45

Tabela 15 – Erros da combinação 3... 45

Tabela 16 – Comparação entre as combinações ... 45

Tabela 17 - Erros de Previsão ... 46

(8)

LISTA DE ABREVIATURAS

ACF Autocorrelation Function - Função de Autocorrelação Amostral

ADF Teste Aumentado de Dickey Fuller

ARIMA Autoregressive Integrated Moving Average - Processo Autoregressivo

Integrado de Média Móvel CH Teste Canova e Hansen

DETRAN Departamento Estadual de Trânsito

ETS Error, Trend, Seasonal– Erro, Tendência, Sazonalidade

HW Suavização Exponencial de Holt-Winters KPSS Teste de Kwiatkowski, Phillips, Schmidt e Shin MAE Mean Absolute Error- Erro Médio Absoluto

MAPE Mean Absolute Percent Error - Erro Médio Percentual Absoluto

ME Mean Error- Erro Médio

MMS Médias Móveis Simples

MSE Mean Squared Error- Erro Médio Quadrático

OCSB Teste Osborn, Chui, Smith e Birchenhall

PACF Partial Autocorrelation Function - Função de Autocorrelação Amostral Parcial

PP Teste de Phillips-Perron

RMSE Root Mean Squared Error- Raiz do Erro Médio Quadrático

SEH Suavização Exponencial de Holt SES Suavização Exponencial Simples VAR Vetores Autoregressivos

(9)

SUMÁRIO 1. INTRODUÇÃO ... 10 1.1 OBJETIVO GERAL ... 11 1.2 OBJETIVOS ESPECÍFICOS ... 11 1.3 ESTRUTURA DO TRABALHO ... 11 2. REVISÃO BIBLIOGRÁFICA ... 13 2.1 Previsão de demanda ... 13

2.1.1 Métodos de Previsão de Demanda ... 13

2.2 SÉRIES TEMPORAIS ... 14

2.2.1 Componentes das séries temporais ... 15

2.3 PROCESSO AUTOREGRESSIVO INTEGRADO DE MÉDIA MÓVEL ... 17

2.3.1 Modelagem de séries temporais estacionárias ... 17

2.3.2 Modelagem de séries temporais não estacionárias ... 19

2.3.3 Metodologia Box-Jenkins ... 20

2.4 SUAVIZAÇÃO EXPONENCIAL ... 22

2.4.1 Métodos de Suavização Exponencial ... 22

2.4.2 Classificação geral dos métodos de suavização exponencial. ... 23

2.5 COMBINAÇÃO DE MODELOS ... 24

2.6 AVALIAÇÃO DOS MODELOS ... 25

2.6.1 Diagnóstico dos modelos ... 25

2.6.2 Erros de Previsão ... 26

3. PROCEDIMENTOS METODOLÓGICOS ... 29

3.1 CLASSIFICAÇÃO DA PESQUISA ... 29

3.2 COLETA E PROCEDIMENTOS PARA ANÁLISE DOS DADOS ... 29

4. COMPARAÇÃO ENTRE SANTA CATARINA E JOINVILLE ... 31

(10)

5.1 MODELOS PROPOSTOS ... 34

5.1.1 Modelos Autoregressivos Integrados de Média Móvel ... 34

5.1.2 Modelos de Suavização exponencial ... 40

5.2 COMBINAÇÃO DOS MODELOS ... 43

6. CONSIDERAÇÕES FINAIS ... 48

7. REFERÊNCIAS BIBLIOGRÁFICAS ... 50

APÊNDICE A - MODELO I - ARIMA(𝟏, 𝟐, 𝟑)(𝟐, 𝟎, 𝟏)𝟏𝟐 ... 53

APÊNDICE B - MODELO ARIMA(𝟏, 𝟏, 𝟑)(𝟏, 𝟎, 𝟎)𝟏𝟐 ... 54

APÊNDICE C – MODELO ARIMA (𝟏, 𝟏, 𝟏)(𝟏, 𝟎, 𝟎)𝟏𝟐 ... 55

APÊNDICE D – MODELO ARIMA(𝟎, 𝟏, 𝟏)(𝟏, 𝟎, 𝟎)𝟏𝟐 ... 56

(11)

1. INTRODUÇÃO

A grande competitividade existente na atualidade leva as empresas a buscarem métodos para produzirem de maneira mais eficiente e eficaz. Neste contexto, produzir a quantidade certa e na hora adequada é fundamental para manter a sustentabilidade empresarial. De acordo com Slack, Chambers e Johnston (2009), prever a demanda é necessário para melhorar o planejamento para o futuro.

A previsão é definida como um processo que busca informações futuras de vendas (MOREIRA, 2008). Os métodos para previsão de demanda são os mais variados e dependem dos dados pretéritos e também do período para o qual se deseja prever. Há, porém, duas classificações principais para estes métodos, que são quantitativos (baseados em modelos matemáticos) e qualitativos (subjetivos, que dependem da intuição).

Os métodos quantitativos que merecem destaque são os modelos econométricos, que utilizam variáveis causais e as séries temporais, que não utilizam teorias subjacentes, apenas consideram os dados passados (MORETTIN; TOLOI, 2006).

As séries temporais, que são sucessões de valores de determinada variável ao longo do tempo e, necessariamente, são ordenadas cronologicamente. A aplicação de previsões realizadas a partir de análise de séries temporais é relevante para o planejamento econômico e de negócios, planejamento de produção e otimização de processos industriais (BOX; JENKINS; REINSEL, 1994). Portanto, realizar previsões reduzirá o grau de incerteza e auxiliará na tomada de decisões. Assim, contribuirá para que a empresa, por exemplo, produza a quantidade adequada no momento oportuno, oferecendo maior acurácia na produção e adaptando-a às variações de mercado.

O estudo de séries temporais para previsão de crescimento de automóveis vai além da possibilidade de indústrias automobilísticas e revenda de carros preverem seu mercado futuro. Utilizar métodos de previsão para esta série de dados pode auxiliar o poder público em sua tomada de decisões, especialmente relacionada à infraestrutura, planejamento de tráfego e definição de políticas públicas devido à expansão da frota.

Portanto, entender o padrão de crescimento da frota de automóveis e encontrar um método para prever essa evolução é importante em diversos aspectos. Justifica-se, então, a importância da realização deste trabalho, que pretende responder à problemática de compreender a taxa de crescimento de automóveis, bem como prever o aumento desta categoria.

(12)

1.1 OBJETIVO GERAL

O objetivo do trabalho é analisar o crescimento da frota de automóveis em Joinville - SC. Para alcançar este objetivo será identificado um modelo de previsão para estimar a frota futura de automóveis em Joinville. Para tanto, utilizar-se-ão modelos de previsão através de séries temporais, especificadamente modelos autorregressivos integrados de média móvel e modelos de suavização exponencial.

1.2 OBJETIVOS ESPECÍFICOS

Para alcançar o objetivo proposto, tem-se os seguintes objetivos específicos:

 comparação do crescimento da frota municipal com a do estado de Santa Catarina;

 revisão bibliográfica;

 ajuste e avaliação dos modelos propostos;

 combinação entre modelos;

 escolha do modelo ou combinação para realização da previsão.

1.3 ESTRUTURA DO TRABALHO

O trabalho foi estruturado em sete capítulos, sendo o primeiro destinado à introdução do assunto e definição dos objetivos da pesquisa. O Capítulo 2 foi dividido em seis seções, sendo a primeira destinada à definição e do conceito “previsão” e a importância da mesma; a segunda tem por objetivo explicar o que são séries temporais; a terceira e a quarta seção explicam os dois modelos de previsão através de séries temporais a serem utilizados no trabalho: modelos autorregressivos integrados de média móvel e suavização exponencial; a quinta explora os métodos de combinação de modelos; e, por fim, a sexta seção define como é processo de escolha do método de previsão.

O Capítulo 3 refere-se à metodologia utilizada para a realização da pesquisa e procedimentos para coleta de dados. Por sua vez, o Capítulo 4 apresenta o comparativo de crescimento da frota de automóveis licenciados em Joinville versus Santa Catarina, a fim de identificar semelhanças ou diferenças na taxa de crescimento.

(13)

A série temporal estudada é apresentada no Capítulo 5. Neste capítulo estão, também, os diversos modelos propostos e análise de erro de cada um dos aceitos para posterior combinação de modelos. Já o Capítulo 6 apresenta o modelo com maior acurácia e, portanto, escolhido para realização de previsões. Os valores previstos, erros de previsão, erros percentuais e o gráfico de valores observados também são mostrados neste capítulo.

Por fim, o Capítulo 7 possui as considerações finais de todo o trabalho, demonstrando resumidamente a metodologia e os modelos escolhidos.

(14)

2. REVISÃO BIBLIOGRÁFICA

2.1 PREVISÃO DE DEMANDA

A previsão de demanda é um processo para estimar as condições futuras de vendas, mercado ou outros fatores que podem influenciar na estratégia de uma companhia. Segundo Moreira (2008, p. 293) “A previsão da demanda é, pois, um processo racional de busca de informações acerca do valor das vendas futuras de um item ou de um conjunto de itens”. Já para Martins e Laugeni (2005, p. 226), previsão é:

Processo metodológico para determinação de dados futuros baseados em modelos estatísticos, matemáticos ou econométricos ou ainda em modelos subjetivos apoiados em uma metodologia de trabalho clara e previamente definida.

Portanto, a previsão de demanda é útil para avaliar as vendas futuras e variações de mercado. Apesar de sujeitas a erros, as previsões são necessárias ao planejamento para o futuro (SLACK; CHAMBERS; JOHNSTON, 2009). Em um contexto empresarial, a estimativa do cenário futuro é importante para que a empresa seja capaz de planejar suas vendas e adaptar-se às variações de mercado.

Em um cenário competitivo, aplicar corretamente metodologias pode diminuir a imprecisão das previsões (SOUZA; SAMOHYL; MIRANDA, 2008) e permitir que a empresa produza com maior assertividade.

No âmbito proposto neste trabalho, de demanda por automóveis, a importância da previsão vai além da análise de mercado, que pode favorecer o setor automobilístico (produção e revenda). Acredita-se que prever o crescimento do número de automóveis beneficia o poder público, pois pode colaborar na elaboração de políticas devido à expansão da frota, além de contribuir significativamente para o planejamento de tráfego viário.

É importante destacar que a previsão não é, por si só, uma decisão, é apenas um meio de informação que auxiliará na toma de decisões (MORETTIN; TOLOI, 2006).

2.1.1 Métodos de Previsão de Demanda

Existem diversos métodos de previsão de demanda e suas utilizações estão sujeitas a disponibilidade de dados, tempo e recursos, assim como ao horizonte de previsão (MOREIRA, 2008).

(15)

As duas classificações mais comuns para os métodos de previsão são qualitativas e quantitativas (SLACK; CHAMBERS; JOHNSTON, 2009). Os métodos qualitativos são baseados em experiências ou intuição de gerentes ou consumidores, ou seja, são modelos subjetivos (LEMOS, 2006). Já os métodos quantitativos utilizam modelos matemáticos para se obter as previsões.

Entre os métodos quantitativos destacam-se os modelos causais e os de séries temporais (TAKEDA, 2012). Os métodos causais avaliam as causas e efeitos entre as variáveis, já as séries temporais simplesmente utilizam de dados passados para prever o futuro, sem considerar as variáveis causais.

Em economia, segundo Morettin e Toloi (2006), existem dois procedimentos que são predominantemente utilizados. De acordo com estes mesmos autores, além das séries temporais, que não recorrem à teorias subjacentes, utilizam-se de modelos econométricos, fortemente baseados em teorias econômicas.

Neste trabalho, o foco será dado aos métodos quantitativos, mais precisamente à análise de séries temporais, com ênfase na metodologia Box-Jenkins (modelos autoregressivos) e Suavização Exponencial.

De acordo com Moreira (2008), apesar de existirem distintos métodos de previsão, algumas características são comuns a todos: o comportamento do passado interfere no comportamento do futuro, ou seja, as previsões consideram de alguma maneira experiências anteriores e os resultados não são perfeitos, pois quanto maior o horizonte de predição, maior será o erro associado.

2.2 SÉRIES TEMPORAIS

Segundo Downing e Clark (2006, p. 299), “As séries temporais (ou históricas) são conjuntos de medidas de uma mesma grandeza, relativas a vários períodos consecutivos”. Ou seja, a série temporal é uma sucessão de valores de uma determinada variável observada em intervalos regulares de tempo. A variável de controle é o tempo e as séries temporais são ordenadas cronologicamente (SILVA; SILVA, 1999) e variar a ordem pode modificar a informação contida na série.

Os dados das séries temporais podem ser coletados em intervalos regulares de tempo, e podem ser observações diárias, mensais, trimestrais, anuais, entre outros. Como exemplo para as séries temporais é possível citar o preço das ações, valores de exportações, Produto

(16)

Interno Bruto (PIB), temperatura, vendas médias de determinado item, temperatura média, batimentos cardíacos, enfim, uma infinidade de séries históricas e ordenadas cronologicamente podem ser reconhecidas como séries temporais.

Box, Jenkins e Reinsel (1994) citam quatro principais aplicações para a previsão por intermédio de séries temporais: planejamento econômico e de negócios, planejamento de produção, inventário e controle de produção e, por fim, controle e otimização de processos industriais.

Realizar previsões por meio de um método estatístico reduz o grau de imprecisão sobre os valores futuros, o que auxilia na tomada de decisões. De acordo com Tubino (2007), a demanda futura será uma projeção dos valores pretéritos e não sofre influência de outras variáveis. Pode-se dizer que uma das desvantagens da série temporal é ela considerar apenas as observações passadas para realizar as previsões, sem considerar as variações causais (SLACK; CHAMBERS; JOHNSTON, 2009).

Para alcançar uma melhor previsão, os modelos para séries temporais devem ser estocásticos (BOX; JENKINS; REINSEL, 1994). Processos estocásticos, ou aleatórios, são aqueles controlados por leis probabilísticas (MORETTIN; TOLOI, 2006).

De acordo com Gujarati e Porter (2011), existem cinco métodos mais comuns para previsão econômica por meio de séries temporais: métodos de suavização exponencial, modelos de regressão uniequacionais, modelos de regressão de equação simultânea, processo autoregressivo integrado de média móvel (ARIMA) e modelos de vetores autorregressivos (VAR). O presente trabalho se concentrará apenas nos métodos de suavização exponencial e processo autoregressivo integrado de média móvel (ARIMA).

Os modelos podem ser automáticos, gerados a partir de software computacional, ou não-automáticos, gerados por meio da observação do pesquisador e integração às fórmulas de cada modelo, geralmente a parte matemática é realizada, também, com o auxílio de um software. Para este trabalho serão realizados dois modelos automáticos e um modelo proposto pelo pesquisador, com auxílio do programa R (R CORE TEAM, 2014).

2.2.1 Componentes das séries temporais

De acordo com Souza, Samohyl e Miranda (2008) e Hyndmann e Athanasopolus (2013) as séries temporais possuem três padrões básicos: tendência, sazonalidade e ciclo. A tendência ocorre quando se verifica que os dados crescem ou diminuem ao longo do tempo.

(17)

Podem existir casos em que a tendência mude de direção, por exemplo, ir de uma tendência crescente para um decrescente. Já as séries que permanecem constantes ao longo do tempo não possuem tendência.

A sazonalidade ocorre quando a série sofre influência de fatores sazonais, por exemplo, o semestre ou dia do ano, sendo o período sempre conhecido. A componente sazonal, no entanto, não esta presente em séries anuais, visto que já são dados médios e que ocultam as variações sazonais (DOWNING; CLARK, 2006).

Diferentemente da sazonalidade, as variações cíclicas ocorrem em períodos não conhecidos. Segundo Silva e Silva (1999, p. 96) as variações sazonais “são movimentos cíclicos que se completam em um ano” enquanto as variações cíclicas “são movimentos cíclicos que se completam em período superior a um ano”.

Downing e Clark (2006) também consideram a existência de outra componente, a irregular, pelo fato de haver algum movimento que não é explicável por tendência ou ciclos. De acordo com Silva e Silva (1999) essas variações irregulares ocorrem por acaso e contribuem para aumento ou queda de valores da série, e a contribuição para o acontecimento pode ser, por exemplo, de sobretaxas alfandegárias ocasionais e até guerras.

A principal característica que deve possuir uma série temporal é ela ser estacionária, ou seja, além de ser estocástico, o processo deve estar em equilíbrio em relação a uma média e com variância constante (BOX; JENKINS; REINSEL, 1994). Segundo Gujarati e Porter (2006), uma série não estacionária permite o estudo do seu comportamento apenas no período considerado, ou seja, não é possível utilizar para outros períodos, tornando-se de pouco valor para realizar previsões.

Existe um tipo especial de série temporal estacionária, o ruído branco ou processo puramente aleatório. O processo será um ruído branco se tiver média zero, variância constante e a série não possuir correlação (GUJARATI; PORTER, 2006).

Dificilmente as séries temporais são estacionárias, por exemplo, as séries financeiras apresentam tendências e, então, deve-se agir sobre os dados para tornar estacionária (MORETTIN; TOLOI, 2006). A partir de diferenciações é possível tornar a série estacionária. Para analisar as séries temporais e verificar como as observações futuras são influenciadas pelas do passado, se utilizam as funções de autocorrelação amostral (ACF) e autocorrelação amostral parcial (PACF). A ACF (ou correlograma) proporciona a estrutura de dependência linear da série, ou seja, como uma observação influência sobre as posteriores. Já a PACF (ou correlograma parcial) mostra o grau de associação linear direta entre observações separadas por k períodos.

(18)

Segundo Ehlers (2009), através do correlograma é possível verificar as seguintes propriedades das séries temporais: aleatoriedade, sazonalidade, correlação e estacionariedade Já a tendência pode ser observada através do gráfico da série.

2.3 PROCESSO AUTOREGRESSIVO INTEGRADO DE MÉDIA MÓVEL

Para facilitar o entendimento de um processo autoregressivo integrado de média móvel (ARIMA), diversos autores optam por explicar separadamente cada componente. Assim, considerando-se uma série estacionária, existem algumas formas para modelá-la, como processo autoregressivo (AR), processo de média móvel (MA) e processo autoregressivo de médias móveis (ARMA). Os modelos ARIMA são utilizados para séries estacionárias, bem como os modelos SARIMA, que consideram uma componente sazonal (BOX; JENKINS; REINSEL, 1994; MORETTIN; TOLOI, 2006; EHLERS, 2009; GUJARATI; PORTER, 2011; HYNDMAN; ATHANASOPOULOS, 2013).

Para identificar facilmente os modelos, serão analisadas a função de autocorrelação amostral (ACF) e função de autocorrelação amostral parcial (PACF). Este trabalho utilizará apenas a observação dos correlogramas para definir o processo, sem considerar as equações que os envolvem. Portanto, optou-se por omitir as equações da revisão bibliográfica.

Os métodos descritos para modelagem de séries temporais estacionárias (item 2.3.1), séries temporais não estacionárias (item 2.3.2) e a metodologia Box-Jenkins (2.3.3) foram extraídos dos estudos de Box, Jenkin e Reinsel (1994), Morettin e Toloi (2006), Ehlers (2009), Gujarati e Porter (2011) e Hyndman e Athanasopoulos (2013).

2.3.1 Modelagem de séries temporais estacionárias

Conforme descrito anteriormente, existem diversas maneiras de se modelar as séries temporais.

I. Processo autoregressivo (AR)

Os processos autoregressivos são aqueles em que uma observação depende das observações anteriores. Esses processos são identificados como AR(p), onde p é a sua ordem. Em linhas gerais, um AR(p) possui uma observação que depende de p observações anteriores. A ACF decresce exponencialmente ou de acordo com uma onda senóide amortecida e a PACF apresenta p picos significativos.

(19)

Como exemplo, a Figura 1 a seguir ilustra a ACF de um AR(1) e a Figura 2 a PACF de um AR(1), onde cada observação depende da anterior.

Figura 1- ACF de um AR(1)

Fonte: Ehlers (2009).

A Figura 1 apresenta um modelo AR(1), sendo que a imagem à esquerda possui a ACF que decresce lentamente e a imagem da direita apresenta uma ACF que decresce de acordo com um padrão de onda senoidal. Já a Figura 2 mostra que há somente um pico significativo.

Figura 2 - PACF de um AR(1)

Fonte: Box, Jenkins e Reinsel (1994).

O pico significativo corresponde à primeira barra da Figura 2, que está fora dos limites superior e inferior, representados por linhas horizontais pontilhadas.

II. Processo de média móvel (MA)

Um processo de média móvel (MA) absorve os impactos de uma perturbação externa com rapidez muito maior que um processo AR(p), por possuir memória mais curta.

Para um MA(q), a ACF e PACF serão bastante similares aos apresentados por AR(p), no entanto, são contrárias. Ou seja, a PACF será decrescente exponencialmente enquanto a ACF possuirá q picos significativos. Um exemplo de MA(3) pode ser visualizado na Figura 3, que decresce em PACF e possui três picos significativos em ACF, ou seja, fora dos limites.

Figura 3 - Função de autocorrelação e autocorrelação parcial de um MA(3)

(20)

III. Processo autoregressivo de médias móveis (ARMA)

A série estacionária pode possuir características tanto de um AR(p) quanto de um MA(q) e, então, pode ser descrito como um modelo ARMA(p,q).

Identifica-se um modelo ARMA (p,q) por meio dos seus correlogramas. Para ambos, a ACF e PACF decrescem exponencialmente ou de maneira senoidal. Para encontrar p e q, avalia-se individualmente a ACF e a PACF: a ACF será definida por q picos de MA enquanto a PACF será definida por p picos de AR.

Um modelo AR(p) também pode ser representado por um ARMA(p,0), assim como um modelo MA(q) pode ser visto com um ARMA (0,q). A Tabela 1 abaixo é útil para sintetizar as informações de identificação dos três primeiros modelos apresentados:

Tabela 1 - Comparativo entre os modelos AR(p), MA(q) e ARMA(p,q)

Modelo Padrão típico ACF Padrão típico PACF

AR(p) Declina exponencialmente ou com um padrão de onda senóide amortecida ou ambos

Picos significativos até p defasagens

MA(q) Apresentam picos significativos até

q defasagens

Declina exponencialmente

ARMA(p,q) Queda exponencial Queda exponencial

Fonte: Gujarati e Porter (2011).

2.3.2 Modelagem de séries temporais não estacionárias

Considerando que a série é não estacionária, torna-se necessário diferenciá-la para encontrar a estacionariedade, assim é possível utilizar um modelo autorregressivo integrado de média móvel (ARIMA) para a série (GUJARATI; PORTER, 2011).

A diferenciação para eliminar a componente de tendência, causa de não estacionariedade, é bastante simples. Da observação atual, diminui-se a anterior. A primeira diferença da série 𝑋𝑡 é apresentada na Equação 1:

𝛥𝑋𝑡 = 𝑋𝑡− 𝑋(𝑡−1). (1)

A segunda diferença é dada pelas Equações 2 e 3:

𝛥2𝑋 𝑡 = 𝛥 𝛥𝑋𝑡 = 𝛥 𝑋𝑡− 𝑋 𝑡−1 ; 𝛥2𝑋 𝑡 = 𝑋𝑡− 2𝑋𝑡−1+ 𝑋𝑡−2, (2) (3)

(21)

𝛥𝑛𝑋

𝑡 = 𝛥(𝛥𝑛−1𝑋𝑡). (4)

Os modelos ARIMA (p.d.q) diferem-se dos modelos ARMA(p,q) apenas pela diferenciação que ocorre d vezes, até tornar a série estacionária. Normalmente apenas uma ou duas diferenciações são necessárias para que a série se torne estacionária. Estabelecida uma série estacionária após d diferenciações, segue-se o procedimento de identificação de um modelo ARMA(p,q).

As séries sazonais apresentam uma parte regular e outra sazonal, sendo representada por ARIMA(p,d,q)x(P,D,Q)s, sendo s o período sazonal da série e podem ser chamados de modelo SARIMA.

A sazonalidade é também uma causa de não estacionariedade da série e, caso necessário, deve haver diferenciações para torná-la estacionária. Em um cenário que há sazonalidade, mas a série é não estacionária também por outros motivos, só será necessário diferenciá-la sazonalmente caso a diferenciação da parte regular não a tenha tornado estacionária na parte sazonal. Esse processo será melhor descrito no item 2.3.3.

A diferenciação da parte sazonal é representada por D e é similar à parte regular, no entanto, ocorre nos períodos sazonais. Por exemplo, considera-se um s de doze meses, então a primeira diferenciação será conforme Equação 5:

𝛥12𝑋𝑡 = 𝑋𝑡− 𝑋 𝑡−12 . (5)

A maneira para identificar um modelo SARIMA é bastante similar a que ocorre em um modelo ARIMA: observam-se as funções de autocorrelação amostral e autocorrelação amostra parcial, no entanto, os períodos avaliados são múltiplos de s.

2.3.3 Metodologia Box-Jenkins

Para facilitar o processo de escolha do melhor modelo, pode-se proceder de acordo com a metodologia iterativa Box-Jenkis (Figura 4), constituída de quatro fases após conhecimento das classes gerais dos modelos, apresentados nos itens anteriores.

I. Identificação do modelo

Na primeira etapa da metodologia Box-Jenkins utilizam-se as funções de autocorrelação amostral e autocorrelação amostral parcial para identificação do modelo. Esta pode ser considerada a etapa crítica da metodologia Box-Jenkins, pois uma mesma série temporal pode ser identificada por distintos modelos.

(22)

Primeiramente os dados são representados graficamente e identificada se a série é estacionaria ou não. Caso a série não seja estacionária devido à tendência ou variância, faz-se diferenciações sucessivas até que o fator de não estacionariedade seja eliminado. Em séries sazonais será necessário diferenciar caso as ACF e PACF ainda apresentem pontos fora das bandas de confiança para a série já diferenciada regularmente.

A série pode ser diferenciada apenas regularmente, apenas sazonalmente, em ambas as partes ou em nenhuma, eis a importância de representar graficamente a série inicial. Ressalta-se, no entanto, que o primeiro passo é eliminar a não estacionariedade da parte regular e, então, verificar a necessidade da diferenciação na parte sazonal (caso a série seja sazonal).

II. Estimação

Após escolhido um modelo, estimam-se os seus coeficientes, normalmente através de métodos computacionais.

III. Diagnóstico

Após as etapas 1 e 2, realiza-se o diagnóstico do modelo para saber se é adequado. Esta etapa corresponde à análise dos resíduos, descrita no item 2.6.1 e aos erros dentro da amostra, ou seja, estimados a partir do modelo, sem relação com a previsão. Os erros estão descritos no item 2.6.2. O modelo mais adequado é aquele que possui o menor erro, os resíduos normais e não correlacionados. Caso não seja encontrado um modelo adequado, volta-se à fase de identificação do modelo, visto que a metodologia Box-Jenkins é iterativa.

IV. Previsão

A partir do modelo considerado adequado é possível realizar a previsão dos valores futuros. Conforme será explicado no item 2.6.2, é possível reservar algumas observações para avaliar o erro também da previsão, ou seja, fora da amostra, que auxiliará na escolha do mais acertado.

Figura 4 - Metodologia Box-Jenkins

(23)

2.4 SUAVIZAÇÃO EXPONENCIAL

Assim como os modelos autoregressivos integrados de média móvel, os métodos de previsão por suavização exponencial não consideram as variações causais. Segundo Morettin e Toloi (2006), este método visa identificar o padrão da série, através da suavização dos seus extremos, que representam a aleatoriedade.

A suavização decompõe a série em tendência e sazonalidade e atribui pesos diferentes às observações, valorizando os dados mais atuais. (SOUZA; SAMOHYL; MIRANDA, 2008).

2.4.1 Métodos de Suavização Exponencial

Existem quatro métodos mais comuns de suavização exponencial: médias móveis simples (MMS), suavização exponencial simples (SES), suavização exponencial de Holt (SEH) e suavização exponencial sazonal de Holt-Winters (HW). Estes quatro métodos serão descritos, conforme exposto por Souza, Samohyl e Miranda (2008), Morettin e Toloi (2006), Ehlers (2009) e Hyndman e Athanasopoulos (2013).

I. Médias Móveis Simples

O método de médias móveis simples (MMS) é utilizado para as séries de dados sem padrão sazonal e tendência. Neste método supõe-se que todas as observações são de igual importância, portanto o peso atribuído a elas é o mesmo. As previsões futuras serão a média simples dos dados observados.

Este é um método de simples aplicação e pode ser aplicado quando se tem um pequeno número de observações. No entanto, este método muitas vezes não é adequado, pois se acredita que as observações mais recentes são de maior importância para realizar previsões.

II. Suavização Exponencial Simples

O método de suavização exponencial simples (SES) também é utilizado apenas em séries sem tendência ou sazonalidade. No entanto, diferentemente do MMS, no SES as observações possuem pesos distintos, atribuindo-se valores maiores às observações mais recentes, enquanto o peso atribuído às mais antigas decai exponencialmente.

Quanto maior o peso atribuído, menor é a suavização. Portanto, menores pesos proporcionam previsões mais estáveis.

(24)

III. Suavização Exponencial de Holt

Os dois métodos anteriores não funcionam para séries que possuem tendência. O método de suavização exponencial de Holt (SEH) é bastante similar ao SES, a diferença é que este método suaviza não só o nível, mas também modela a tendência da série. Portanto, a realização de previsões se dá atribuindo pesos para as duas componentes.

IV. Suavização Exponencial sazonal de Holt-Winters

O método de suavização exponencial sazonal de Holt-Winters (HW) considera, além da tendência, a sazonalidade da série. Este método possui, então, três componentes: nível, crescimento e sazonalidade.

O fator sazonal pode ser aditivo ou multiplicativo. No método aditivo, a sazonalidade é somada à tendência da série, já no método multiplicativo, a sazonalidade é multiplicada pela tendência.

2.4.2 Classificação geral dos métodos de suavização exponencial.

Para classificar os métodos de suavização exponencial, deve-se considerar o comportamento da tendência e da sazonalidade da série. A tendência pode ser caracterizada em cinco tipos: nenhuma, aditiva, aditiva amortecida, multiplicativa e multiplicativa amortecida; já a sazonalidade é classificada em: nenhuma, aditiva e multiplicativa. Ao considerar essas variações, pode-se verificar a existência de 15 métodos, conforme Tabela 2.

Tabela 2 - Métodos de Suavização Exponencial

Tendência Sazonalidade

Nenhuma Aditiva Multiplicativa

Nenhuma NN NA NM

Aditiva NA AA AM

Aditiva Amortecida AaN AaA AaM

Multiplicativa MN MA MM

Multiplicativa Amortecida MaN MaA MaM

Fonte: Souza, Samohyl e Miranda (2008).

O método NN é o de suavização exponencial simples, o AN é o método de Holt, AA é Holt-Winters Aditivo e AM é Holt-Winters Multiplicativo.

Para cada um dos métodos existem erros, aditivos ou multiplicativos. Um modelo MNN é a suavização simples com erro multiplicativo, indicado pelo M. Já um modelo ANN é a suavização simples com erro aditivo, indicado pelo A.

(25)

Logo, pode-se considerar a Tabela 2 duas vezes, uma para o erro aditivo e outra pelo multiplicativo. No entanto, algumas das combinações não são válidas para selecionar o modelo, devido a dificuldade numérica. São eles: MMA, MMaA, ANM, AAM, AAaM, AMN, AMA, AMM, AMaN, AMaA e AMaM. Portanto, para erro aditivo, pode-se trabalhar com seis modelos e, para o erro multiplicativo, treze modelos.

2.5 COMBINAÇÃO DE MODELOS

Com dois ou mais modelos propostos de previsão, é possível utilizar-se de métodos de combinação para incorporar esses distintos modelos. De acordo com Clemen (1989), a combinação de modelos pode levar a uma melhora significativa da acurácia das previsões. Segundo Werner e Ribeiro (2006), isso ocorre pois cada técnica aplicada sofre influência de outros fatores e, ao combiná-las, contribuem com diferentes informações que podem diminuir os erros de previsão.

Os métodos de combinação foram apresentados inicialmente por Bates e Granger (1969). As previsões que serão incorporadas podem ser objetivas, subjetivas ou ambas, sendo que a as objetivas englobam os procedimentos com base matemática, já as subjetivas são baseadas no julgamento humano (WERNER; RIBEIRO, 2006).

Para o presente trabalho, serão utilizados apenas os métodos de combinação objetiva, com foco específico ao método proposto por Bates e Granger (1969), de combinação linear de duas previsões, conforme Equação 6 abaixo:

𝐹𝑐 = 𝑤𝐹1+ 1 − 𝑤 𝐹2, (6)

onde: 𝐹𝑐 = combinação das previsões; 𝐹1 e 𝐹2= previsões individuais; 𝑤 = peso atribuído à previsão.

Os pesos podem ser iguais, sendo então a combinação uma média aritmética das previsões individuais. No entanto, também é possível atribuir pesos diferentes às previsões, ou seja, dedicar menor importância àquela com maior variabilidade. A obtenção dos pesos é baseada nas variâncias dos erros das previsões e correlação dos mesmos (MARTINS, WERNER, 2013). Este método pode ser visualizado a partir da Equação 7:

𝑤 = 𝜎2 2− 𝜌𝜎 1𝜎2 𝜎12+𝜎 22− 2𝜌𝜎1𝜎2, (7)

(26)

𝜎12 e 𝜎

22 = variância dos erros de previsão de F1 e F2, respectivamente.

De acordo com Mancuso (2013), muitos autores optam pela combinação através de média simples em relação à média ponderada. Em contrapartida, outros definem os métodos de variância mínima como mais acurados.

Será realizada, portanto, entre os modelos de menor erro, a combinação por média simples e variância mínima para verificar qual dos dois métodos será mais adequado para a série observada.

2.6 AVALIAÇÃO DOS MODELOS

Realizam-se duas etapas para a avaliação dos modelos de previsão. A primeira consiste no diagnóstico do modelo e diz respeito à análise residual, que informará se o modelo proposto atende as condições estabelecidas (estas condições estarão melhor descritas no item 2.6.1); a segunda etapa é a análise dos erros de previsão. Realizado o diagnóstico e comprovada a adequação dos resíduos, efetua-se um estudo dos erros de previsão, para definição do modelo que melhor representa a série temporal.

2.6.1 Diagnóstico dos modelos

A diferença entre uma observação é seu valor ajustado é chamado de resíduo (MONTGOMERY; RUNGER, 2003). Se o modelo proposto representa adequadamente os dados, então, os resíduos devem possuir as características de um ruído branco. Um ruído branco é um tipo especial de série estacionária, que possui média zero, variância constante e não é serialmente correlacionado (GUJARATI; PORTER, 2006).

Utiliza-se a ACF e PACF para a verificação residual inicial e espera-se que ele tenha a aparência de um ruído branco, apresentado na Figura 5.

Figura 5 - Funções de autocorrelação e autocorrelação parcial de um ruído branco

(27)

Se os resíduos não são um ruído branco, entende-se que há informação que deve ser incorporada ao modelo proposto. Segundo Ehlers (2009), deve-se incluir no modelo informações caso haja autocorrelação nas defasagens 1 ou 2 ou, então, nos períodos sazonais. O mesmo ocorre para a autocorrelação parcial. Caso a defasagem ocorra em outros pontos, não há evidências suficientes para rejeitar o modelo.

No entanto, a análise visual das funções de autocorrelação amostral e do correlograma parcial para realizar o diagnóstico do modelo nem sempre é suficiente. Realizam-se testes para comprovação da normalidade e correlação entre os resíduos.

Para análise da normalidade de resíduos pode-se utilizar, entre outros, os testes Shapiro Wilk e Jarque Bera. Já para verificação da correlação residual, pode-se realizar os testes Box-Pierce e Ljung-Box. Estes testes podem ser realizados de maneira automática por meio de softwares e, portanto, optou-se por suprimir as fórmulas. A interpretação dos resultados dos testes dar-se-á com os testes de hipóteses.

Em um teste de hipóteses existe a hipótese nula (𝐻0), que será testada, e a alternativa (𝐻1), a qual afirma que 𝐻0é falsa (DOWNING; CLARK, 2006). Verifica-se, a partir do valor p (probabilidade de significância), a aceitação das hipóteses. Segundo Barbetta, Reis e Bornia (2008), escolhe-se um nível de significância (α), normalmente de 5%, referente à probabilidade de erro de rejeitar 𝐻0sendo esta verdadeira. Como regra, tem-se:

Valor p > α  aceita 𝐻0 Valor p ≤ α  rejeita 𝐻0

Sendo, para os testes de normalidade, 𝐻0 = resíduos apresentam distribuição normal e, para os testes de correlação, 𝐻0 = resíduos não são correlacionados.

De acordo com Morettin e Toloi (2006, p. 205) “o ciclo de identificação, estimação e verificação deve ser continuado, até que um modelo satisfatório seja encontrado”.

2.6.2 Erros de Previsão

Após o diagnóstico dos modelos realizado por meio da análise de resíduos e comprovada adequação, estima-se o erro de previsão dos modelos considerados adequados. O melhor modelo é aquele que apresentar o menor erro.

Os erros podem ser analisados dentro e fora da amostra. Os erros fora da amostra correspondem ao comparativo de previsão versus valores reais; já os erros dentro da amostra são obtidos a partir da estimação do modelo, sem comparação com valores reais. Para que

(28)

seja possível realizar a análise fora da amostra, algumas observações devem ser reservadas. No caso proposto, das 142 observações, 130 serão utilizadas para estimar o modelo e as outras 12 para verificar o erro gerado relacionado à previsão.

As previsões não são exatas e o erro associado é maior quanto maior for o horizonte de predição (MOREIRA, 2008). Entende-se por erro a diferença entre valor previsto e o ocorrido de acordo com a Equação 8:

𝑒𝑡 = 𝑃𝑡− 𝑂𝑡, (8)

onde: et = erro de previsão no período t; 𝑃𝑡 = valor previsto no período t;

𝑂𝑡 = valor observado no período t, quando não é conhecido, utiliza-se o valor aceito.

De acordo com Souza, Samohyl e Miranda(2008) existem distintas maneiras de se avaliar a qualidade das previsões, sendo os índices de erro mais conhecidos descritos abaixo:

I. Erro Médio

O erro médio – Mean Error (ME) é considerado a medida de erro mais simples e frágil para avaliar a adequação dos modelos, o erro médio pode ser descrito conforme Equação 9 abaixo.

ME =1

n et ≅ 0 n

t=1 . (9)

O valor assumido é próximo a zero, pois os erros possuem valores positivos e negativos e, somados, se cancelam. Esta é a razão pelo método não ser tão eficaz. O erro médio pode identificar viés de previsão, por exemplo, quando se está muito otimista em relação às vendas, o ME apresentará valor positivo, bem como em um cenário negativo, o ME aparecerá negativo.

II. Erro Absoluto Médio

O erro absoluto médio – Mean Absolute Error (MAE) trata o erro como uma distância, então, não possui sinal, pois considera o valor absoluto. A maneira de calcular, apresentada na Equação 10, é bastante similar ao ME, no entanto, o somatório dos erros individuais está na forma absoluta.

MAE =1

n |et| n

t=1 . (10)

Essa medida de erro é mais adequada que o erro médio e funciona bem para verificar a precisão dos modelos de previsão. Entende-se que quanto menor o MAE, melhor o modelo.

III. Erro Quadrático Médio

O erro quadrático médio – Mean Squared Error (MSE) é também uma medida bastante utilizada e similar ao MAE, pois considera o erro sem sinal. No entanto, em vez de

(29)

considerar o erro em termos absolutos, utiliza-se o erro quadrado, conforme Equação 11.

MSE =1n nt=1et2. (11)

Considera-se a medida de erro mais utilizada por estatísticos e é frequentemente atribuída em funções de perda ou custo.

Como desvantagem nota-se que essa medida de erro valoriza os erros menores, mas penaliza os métodos que possuem erros um pouco maiores, assim, utiliza-se a Raiz do Erro Médio Quadrático (Root Mean Squared Error – RMSE) para tornar as unidades mais similares. O RMSE é apresentado na Equação 12.

RMSE = MSE. (12)

IV. Erro Médio Percentual Absoluto

O erro médio percentual absoluto – Mean Absolute Percent Error (MAPE)é outra medida de erro de previsão que considera os valores absolutos, conforme Equação 13 abaixo:

ME =1 n | et Ot| n t=1 . (13)

Pode-se dizer que é o critério mais utilizado, pois considera os erros em termos percentuais. Ou seja, quando se diz que uma previsão teve erro de X%, refere-se ao MAPE. No entanto, para séries onde os valores observados for igual a zero o erro médio percentual absoluto é infinito, faz-se necessária, portanto, a utilização de outros métodos para avaliar a adequação dos modelos de previsão.

V. Estatística U de Theil

Pode-se dizer que a é o melhor critério de todos os apresentados, porém o mais complexo. É também uma medida de erro que considera termos percentuais, conforme mostra a Equação 14 abaixo: U2= et+1 Ot 2 n−1 t=1 Ot+1−Ot Ot 2 n−1 t=1 . (14)

Espera-se que os valores de U2 variem sempre entre 0 e 1 para indicar modelos de previsão adequados, sendo melhores as previsões que se aproximam de 0. Erro superior a 1 indica que o modelo proposto possui erro superior ao passeio aleatório (EHLERS, 2009).

(30)

3. PROCEDIMENTOS METODOLÓGICOS

3.1 CLASSIFICAÇÃO DA PESQUISA

Com este trabalho pretende-se determinar modelos estatísticos de previsão, por meio da análise de séries temporais, que melhor se adaptem ao padrão de crescimento do número de automóveis e outras categorias de veículos no município. Espera-se, também, compreender a demanda por automóveis nos últimos doze anos no município de Joinville, SC, e compará-la à demanda catarinense.

Pinheiro (2010) classifica a pesquisa em quatro pontos de vistas: da natureza, da abordagem do problema, dos objetivos e dos procedimentos técnicos.

Do ponto de vista da natureza, pode-se classificar a pesquisa como aplicada, pois visa obter conhecimento que poderá ser utilizado na prática. Já do ponto de vista da abordagem do problema, a pesquisa é quantitativa, devido à característica dos dados.

As pesquisas podem ser classificadas com base nos seus objetivos em três grupos: exploratórias, descritivas e explicativas (GIL, 2002). O objetivo é o resultado que se almeja alcançar e pode ser geral ou específico (FACHIN, 2001). Neste contexto, pode-se classificar a pesquisa como descritiva e exploratória. Descritiva, pois os dados são interpretados e possuem forma de levantamento e exploratória porque possibilita maior informação sobre determinado o assunto (ANDRADE, 2001).

Segundo a maneira pela qual se obtém os dados, ou seja, os procedimentos técnicos utilizados, a pesquisa pode ser classificada como ex-post facto e estatística. Caracteriza-se como ex-post facto pois os dados foram obtidos “a partir do fato passado” (GIL, 2002) e como estatística porque representa e explica, por meio de gráficos e quadros, as observações quantitativas (FACHIN, 2001).

3.2 COLETA E PROCEDIMENTOS PARA ANÁLISE DOS DADOS

Os dados foram obtidos na página de internet do Detran-SC (DETRAN, 2015), que possui uma base de constantemente atualizada com os todas as categorias de veículos emplacados em cada município do estado. As informações utilizadas neste trabalho são observações mensais desde janeiro de 2003 a fevereiro de 2015.

(31)

A proposta inicial consistia em avaliar o número de automóveis no município de Joinville, SC, e realizar posterior análise de séries temporais para verificar o crescimento da demanda. No entanto, durante a coleta de dados observou-se que era relevante incluir outras três categorias à análise: caminhonetes, camionetas e utilitários, responsáveis por uma média aproximada de 8% do total de veículos em Joinville e 9% no Estado de Santa Catarina. Optou-se, também, por selecionar as observações mensais de Santa Catarina – das mesmas categorias – apenas para realizar um comparativo entre evolução da frota da cidade mais populosa do estado x total da frota de estado.

A análise dos dados foi realizada com o auxílio do software R (R CORE TEAM, 2014). Para a análise de séries temporais, fez-se uso da função “forecast” (HYNDMAN; KHANDAKAR, 2008) um pacote adicional gratuito do R, com o qual é possível realizar as previsões de demanda pelos métodos ARIMA e Suavização Exponencial, bem como fazer a combinação dos modelos. O método de utilização do software para obter os modelos é explicado por Hyndman e Athanasopoulos (2013).

Este trabalho possui três modelos diferentes para a previsão de demanda: modelo ARIMA, proposto a partir da interpretação de dados e automático com auxílio do pacote

forecast, modelo de suavização exponencial, proposto e automático e a combinação entre dois

modelos de menor erro. Foi realizada a análise dos resíduos para verificar a adequação dos modelose também avaliados os erros de previsão dentro e fora da amostra (ME, MAE, RMSE e MAPE) além da estatística U de Theil. Para a verificação dos erros de previsão, as 12 últimas observações foram reservadas.

(32)

4. COMPARAÇÃO ENTRE SANTA CATARINA E JOINVILLE

A partir da página de Internet do Detran-SC foi possível obter os dados mensais de toda a frota de veículos do Estado de Santa Catarina e do município de Joinville. Os valores estão compreendidos desde janeiro de 2003 a fevereiro de 2015.

No entanto, dentre todas as categorias de veículos, estudou-se apenas os automóveis, caminhonetes, camionetas e utilitários, que correspondem a aproximadamente a 68,4% da frota de Santa Catarina e 73,4% da de Joinville.

Em um primeiro momento foi realizado um estudo a fim de comparar o aumento do número dos veículos selecionados em Santa Catarina e em Joinville. A evolução pode ser verificada na Figura 6.

Figura 6 - Comparativo de crescimento de Joinville x Santa Catarina

Fonte: Primária (2015).

Dentre as categorias analisadas, entre 2003 e 2015, o aumento foi bastante similar para Santa Catarina e Joinville. A análise mensal também não mostrou diferença entre o crescimento estadual e municipal, assim como os meses onde a taxa de menor e maior crescimento foram as mesmas. Estes valores aparecem na Tabela 3.

Comparativo de crescimento Joinville x Santa Catarina

0 50 100 150 150000 200000 250000 150000 200000 250000 1500000 2000000 2500000 3000000 Joinville Santa Catarina

(33)

Tabela 3 - Comparativo entre Joinville e Santa Catarina

Informações Joinville Santa Catarina

Crescimento 130,6% 138,4%

Média mensal 0,58% 0,60%

Maior crescimento Dez 2014 (1,50%) Dez 2014 (1,26%) Menor crescimento Set 2005 (0,14%) Set 2005 (0,31%)

Fev 2015 (0,31%)

Fonte: Primária (2015).

Interessante ressaltar que, para o estado, a segunda menor taxa de crescimento dentre o período analisado ocorreu em janeiro de 2015, o que representa uma queda no crescimento do número de automóveis, caminhonetes, camionetas e utilitários emplacados em SC no primeiro trimestre deste ano.

Observa-se, portanto, que o padrão de crescimento da demanda para o município de Joinville segue praticamente o mesmo padrão que o estado, visto que o aumento total dos últimos 12 anos é bastante similar, bem como os períodos de queda e aumento de crescimento foram os mesmos. O total de automóveis, camionetas, caminhonetes e utilitários em Joinville corresponde a 8,8% do total destas categorias no estado de Santa Catarina.

(34)

5. ANÁLISE DE SÉRIES TEMPORAIS PARA FROTA JOINVILENSE

A série temporal considerada para o estudo corresponde ao conjunto de observações mensais desde janeiro de 2003 a março de 2014 dos automóveis, caminhonetes, camionetas e utilitários do município de Joinville – SC. Estas quatro categorias representam aproximadamente 73,4% do total de automóveis da cidade e, para facilitar a sua referência no decorrer da análise da série, serão denominadas apenas por automóveis. A Figura 7 apresenta o gráfico das funções de autocorrelação amostral e autocorrelação amostral parcial, bem como o comportamento dos dados ao longo dos meses.

As observações a partir de abril de 2014 até março de 2015 foram guardadas para avaliar a acurácia das previsões fora da amostra. Ou seja, estas últimas 12 observações serão utilizadas para a validação do modelo.

Figura 7 - Apresentação da Série Temporal

Fonte: Primária (2015).

A série é não estacionária, visto que uma tendência crescente é facilmente identificável na Figura 7. Pode-se, também, decompor a série para verificar os componentes de sazonalidade e efeito aleatório, como mostra a Figura 8.

carros 2004 2006 2008 2010 2012 2014 120000 180000 240000 0 5 10 15 20 25 30 35 -0 .2 0 .0 0 .2 0 .4 0 .6 0 .8 1 .0 Lag A C F 0 5 10 15 20 25 30 35 -0 .2 0 .0 0 .2 0 .4 0 .6 0 .8 1 .0 Lag P A C F

(35)

Figura 8 - Decomposição da série temporal

Fonte: Primária (2015).

Para esta série de dados, nota-se que a componente tendência é bastante similar aos dados observados e identifica-se que existe sazonalidade, pois esta componente apresenta padrão repetitivo, observado no terceiro gráfico da Figura 8. O último gráfico apresentado na figura de decomposição da série temporal corresponde à componente aleatória presente na série. Portanto, a não estacionariedade da série se deve não só ao fato de ela possuir tendência, mas também por existir sazonalidade.

5.1 MODELOS PROPOSTOS

Para a estimação do melhor modelo para realização de previsões, foram propostos alguns modelos entre os autorregressivos integrados de média móvel e os de suavização exponencial.

5.1.1 Modelos Autoregressivos Integrados de Média Móvel

Os resultados apresentados no item 5 mostraram que a série é não estacionária. Sabe-se, porém, que é possível obter a estacionariedade através de diferenciações. Realizaram-se três testes automáticos no R: Teste de Kwiatkowski, Phillips, Schmidt e Shin (KPSS), Teste Aumentado de Dickey Fuller (ADF) e Teste de Phillips-Perron (PP). O objetivo foi verificar o número necessário de diferenciações na parte regular, conforme Tabela 4.

120000 180000 240000 ob se rve d 120000 180000 240000 tre nd -2 00 0 200 400 600 se aso na l -4 00 0 200 2004 2006 2008 2010 2012 2014 ra nd om Time

Decomposition of additive time series

Tempo S az o n al A le at ó ri o Te n d ên ci a O b serv ad o

(36)

Tabela 4 – Diferenciações regulares

Teste KPSS ADF PP

Diferenciações 2 2 1

Fonte: Primária (2015).

Um teste apontou a necessidade de apenas uma diferenciação, os demais mostraram ser necessário diferenciar duas vezes. Foi realizada, então, a primeira e segunda diferenciação, apresentadas no primeiro e segundo gráfico da Figura 9, respectivamente.

Figura 9 - Diferenciações da Série Não Estacionária

Fonte: Primária (2015).

Realizaram-se os testes Osborn, Chui, Smith e Birchenhall (OCSB) e Teste Canova e Hansen (CH) para verificar a necessidade de diferenciação sazonal após a realização da primeira e da segunda diferenciação regular. Em ambos os casos houve indicação de que não seria necessário realizar a diferenciação.

Parte-se, então, para a proposição de modelos. Pode-se supor modelos a partir da análise dos gráficos ou gerar modelos automáticos através de software.

O software R possui funções para propor automaticamente modelos autorregressivos. O primeiro modelo automático proposto foi através da função “auto.arima” (HYNDMAN; KHANDAKAR, 2008) que gerou um ARIMA(1,2,3)𝑥(2,0,1)12, denominado Modelo I.

Os resíduos apresentam característica de ruído branco, são normais e não correlacionados. No entanto, o erro U-Theil fora da amostra apresentou um valor superior a um e, portanto, essa informação é suficiente para descartar o modelo para realizar previsões. As informações referentes ao Modelo I estão no Apêndice A.

O modelo gerado a partir da função “auto.arima” possui alguns atalhos a fim de acelerar a velocidade computacional de geração do modelo e, portanto, o modelo proposto

(37)

nem sempre é o mais adequado. Existe um método de eliminar estes atalhos e obter um modelo diferente (HYNDMAN; ATHANASOPOLUS, 2013). O Modelo gerado é um ARIMA(0,2,1)𝑥(1,0,1)12, denominado Modelo II, com resíduos normais e não correlacionados. Os erros do modelo são adequados e os resíduos podem ser considerados um ruído branco, pois, conforme Figura 10, não apresenta defasagens significativas.

Figura 10 – Resíduos do Modelo II

Fonte: Primária, 2015.

Parte-se, então, para a proposição de modelos através da análise da ACF e da PACF da série temporal. A Figura 11 apresenta os correlogramas para a série diferenciada duas vezes.

Figura 11 - ACF e PACF da série temporal diferenciada duas vezes

Fonte: Primária, 2015.

Através da análise dos gráficos da Figura 11, foram propostos sete modelos, quatro foram descartados por possuírem erro U-Theil>1. Outro modelo foi descartado por seus resíduos não serem ruído branco, ou seja, possuem picos significativos, conforme figura 12.

Figura 12 – Resíduos do modelo rejeitado.

Fonte: Primária, 2015.

Os cinco modelos rejeitados estão sumarizados na Tabela 5.

2004 2006 2008 2010 2012 2014 -6 00 -2 00 200 600 0 5 10 20 30 -0 .2 0. 0 0. 1 0. 2 Lag A C F 0 5 10 20 30 -0 .2 0. 0 0. 1 0. 2 Lag P A C F diff2 2004 2006 2008 2010 2012 2014 -1 50 0 -5 00 500 1500 0 5 10 20 30 -0 .6 -0 .2 0. 2 0. 6 Lag A C F 0 5 10 20 30 -0 .6 -0 .2 0. 2 0. 6 Lag P A C F modelo$residuals 2004 2006 2008 2010 2012 2014 -6 0 0 0 400 0 5 10 20 30 -0 .4 -0 .2 0 .0 0 .2 Lag A C F 0 5 10 20 30 -0 .4 -0 .2 0 .0 0 .2 Lag P A C F

(38)

Tabela 5 - Modelos rejeitados e com duas diferenciações

Modelo Motivo para rejeição

ARIMA(0,2,1)𝑥(2,0,1)12 Erro elevado (U-Theil = 1.052162) ARIMA(0,2,2)𝑥(2,0,1)12 Erro elevado (U-Theil = 1.06197) ARIMA(3,2,4)𝑥(3,0,1)12 Erro elevado (U-Theil = 1.066333) ARIMA(3,2,4)𝑥(2,0,1)12 Erro elevado (U-Theil = 1.086244) ARIMA(1,2,0)𝑥(1,0,0)12 Resíduo não é ruído branco (Figura 12)

Fonte: Primária (2015).

Os outros dois modelos aceitos foram denominados Modelo III e Modelo IV. O Modelo III é representado por um ARIMA(0,2,1)𝑥(3,0,0)12, apresenta resíduos normais, não correlacionados e características de um ruído branco, apresentado na Figura 13. Portanto, é um bom modelo para realizar previsões.

Figura 13 – Resíduos do Modelo III

Fonte: Primária (2015).

Já o Modelo IV é um ARIMA(0,2,1)𝑥(1,0,0)12 possui característica de um ruído branco (Figura 14) e os resíduos não são correlacionados. No entanto, a comprovação da sua normalidade foi reprovada no teste Jarque-Bera e aprovada em Shapiro-Wilk.Optou-se por aceitar o Modelo III como adequado visto que diversos autores consideram o método de comprovação de normalidade através de testes Shapiro-Wilk mais eficaz (RAZALI; WAH, 2011; THADEWALD; BÜNING, 2007; GHASEMI; ZAHEDIASL, 2012).

Figura 14 - Resíduos do Modelo IV

Fonte: Primária (2015). modelo$residuals 2004 2006 2008 2010 2012 2014 -6 0 0 0 400 800 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag A C F 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag P A C F modelo$residuals 2004 2006 2008 2010 2012 2014 -5 0 0 0 500 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag A C F 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag P A C F

(39)

38

Optou-se, também, por identificar modelos com base na série temporal com apenas uma diferenciação, conforme Figura 14. Para a série com apenas uma diferenciação foram propostos oito modelos.

Figura 15 - ACF e PACF da série temporal diferenciada uma vez

Fonte: Primária (2015)

Do total de modelos propostos para a série com apenas uma diferenciação, seis foram rejeitados devido a erros ou resíduos, conforme Tabela 6. Os correlogramas para os modelos rejeitados devido ao resíduo não ser ruído branco são apresentados nos Apêndices B, C e D.C.

Tabela 6 - Modelos rejeitados e com uma diferenciação

Modelo Motivo para rejeição

ARIMA(1,1,0)(1,0,0)12 Resíduos correlacionados ARIMA(1,1,4)(1,0,0)12 Resíduos correlacionados ARIMA(1,1,3)(1,0,0)12 Resíduo não é ruído branco ARIMA(1,1,1)(1,0,0)12 Resíduo não é ruído branco ARIMA(0,1,1)(1,0,0)12 Resíduo não é ruído branco ARIMA(1,1,4)(0,0,1)12 Resíduos correlacionados

Fonte: Primária (2015).

Os outros dois modelos aceitos serão denominados Modelo V e Modelo VI. O Modelo V é um ARIMA(1,1,4)(1,0,1)12, erros aceitáveis, resíduos não correlacionados, normais e comportamento de um ruído branco, conforme Figura 16.

Figura 16 – Resíduos do Modelo V

Fonte: Primária (2015) 2004 2006 2008 2010 2012 2014 500 1500 0 5 10 20 30 -0 .2 0 .0 0 .2 0 .4 0 .6 Lag A C F 0 5 10 20 30 -0 .2 0 .0 0 .2 0 .4 0 .6 Lag P A C F modelo$residuals 2004 2006 2008 2010 2012 2014 -6 0 0 0 400 800 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag A C F 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag P A C F

(40)

39 O Modelo VI é um ARIMA(1,1,1)(1,0,1)12 e, assim com o modelo V, é considerado adequado a partir da análise dos resíduos (Figura 17).

Figura 17 – Resíduos do Modelo VI

Fonte: Primária (2015)

Realizou-se, então, um comparativo entre os erros dos seis modelos aceitos para verificar qual é o mais adequado. Estes valores estão na Tabela 7.

Tabela 7 – Comparativo entre os modelos ARIMA

*NA: Não aplicável

Fonte: Primária (2015).

A partir da Tabela 5 pode-se observar que o modelo automático (Modelo II) é o que apresentou os maiores erros. Observa-se, também, que os modelos com apenas uma diferenciação regular foram mais adequados que o modelo automático e o Modelo III, ambos com duas diferenciações.

O modelo mais adequado dentre todos os ARIMA aceitos é o Modelo IV, pois apresenta os menores erros.

A grande quantidade de modelos propostos ocorreu devido à dificuldade de encontrar um padrão nos correlogramas das séries diferenciadas. Dependendo da maneira que se observou as funções de autocorrelação e autocorrelação parcial, pode-se sugerir que ambos decresciam, ou que apenas um deles era decrescente. Portanto, foi possível propor vários

2004 2006 2008 2010 2012 2014 -6 0 0 -2 0 0 200 600 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag A C F 0 5 10 20 30 -0 .2 0 .0 0 .1 0 .2 Lag P A C F Valor p 0,6152 Modelo IV Modelo V 0,5051 0,5746 0,1717 0,4387

Valor p Valor p Valor p Valor p

Norma l

Análise dos Resíduos

(1,1,1)(1,0,1)[12]

Modelo VI

(0,2,1)(1,0,1)[12] (0,2,1)(3,0,0)[12] (0,2,1)(1,0,0)[12] (1,1,4)(1,0,1)[12]

Modelo II Modelo III

Shapiro Wilk Jarque Bera 0,7754 0,9413 0,6152 0,3871 0,9012 0,8741 0,2642 0,2957 0,04522 0,1274 0,3751 0,5051 0,5746 0,1717 0,4387 Norma l Correl Ljung-Box Box-Pierce

Dentro Fora Dentro Fora Dentro Fora Dentro Fora Dentro Fora ME 1,11 -925,19 -1,26 -883,25 6,78 -408,21 23,30 -832,72 23,09 -820,52 MAE 177,21 928,19 178,86 883,25 204,59 408,21 173,02 832,72 176,56 820,52 MSE 15,12 32,22 15,42 31,09 16,18 21,53 14,99 30,48 15,08 30,34 MAPE 0,10 0,35 0,10 0,33 0,12 0,15 0,10 0,31 0,10 0,31 U-Theil NA 0,99 NA 0,93 NA 0,44 NA 0,89 NA 0,88 Picos não

significativos Ruído branco Ruído branco

Picos não significativos Picos não significativos 0,7778 0,9419 0,3923 0,9023 0,8754 0,7754 0,9413 0,3871 0,9012 0,8741 Correl Err os Correlograma

Referências

Documentos relacionados

No final, os EUA viram a maioria das questões que tinham de ser resolvidas no sentido da criação de um tribunal que lhe fosse aceitável serem estabelecidas em sentido oposto, pelo

Oncag, Tuncer & Tosun (2005) Coca-Cola ® Sprite ® Saliva artificial Compósito não é referido no estudo 3 meses 3 vezes por dia durante 5 minutos Avaliar o efeito de

O fortalecimento da escola pública requer a criação de uma cultura de participação para todos os seus segmentos, e a melhoria das condições efetivas para

Não obstante a reconhecida necessidade desses serviços, tem-se observado graves falhas na gestão dos contratos de fornecimento de mão de obra terceirizada, bem

Nessa perspectiva, o objetivo geral deste trabalho é o de analisar a proposta curricular do Curso de Especialização em Gestão e Avaliação da Educação Pública, oferecido

intitulado “O Plano de Desenvolvimento da Educação: razões, princípios e programas” (BRASIL, 2007d), o PDE tem a intenção de “ser mais do que a tradução..

De acordo com o Consed (2011), o cursista deve ter em mente os pressupostos básicos que sustentam a formulação do Progestão, tanto do ponto de vista do gerenciamento

Portanto, conclui-se que o princípio do centro da gravidade deve ser interpretado com cautela nas relações de trabalho marítimo, considerando a regra basilar de