• Nenhum resultado encontrado

Séries temporais

N/A
N/A
Protected

Academic year: 2021

Share "Séries temporais"

Copied!
22
0
0

Texto

(1)

Nuno Fidalgo

Séries Temporais

1

Introdução

Metodologia clássica popular para a previsão a curto prazo.

Previsão dos futuros valores da série

temporal com base nos valores passados da própria variável e dos seus erros.

A metodologia adotada em TPRE também se designa por Box-Jenkings (modelos ARIMA) ARIMA –

Auto-regressivos (AR), integrados (I) e

média móvel (MA)

0 1 2 3 4 5 6 7 8 9 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 2000 3000 4000 5000 6000 238 245 252 259 266 273 280 287 294 301 308 315 322 329 336 343 350 Consumos de gás em Lisboa

(2)

Requisitos básicos

3

Muitos modelos requerem estacionaridade. Série estacionária – média e variância constantes

Se existir uma tendência (“trend”) pode

ajustar-se o desvio por uma curva, subtraindo o valor da curva à série (métodos de

decomposição).

Se a variância não for constante extrair o logaritmos ou uma potência da série Diferenciar a série pode levar a uma série estacionária

ver métodos integrativos ARIMA(0,d,0).

MWH Log(MWH) x(t) – x(t-1) Série diferenciada: x’(t) = x(t) – x(t-1) Série original: x(t)

Diferenciação

diferenciação Aumento de escala Série diferenciada: x’(t) = x(t) – x(t-1) Série original: x(t)

(3)

Diferenciação – conceito e notação

5

Diferenciação de primeira ordem para uma primeira diferença

Diferenciação de primeira ordem para uma segunda diferença

Diferenciação de segunda ordem

1

)

1

(

'

t

=

B

X

t

=

X

t

X

t

X

2 2

)

1

(

'

t

=

B

X

t

=

X

t

X

t

X

(

1

) (

1 2

)

2

)

1

(

'

t

=

B

X

t

=

X

t

X

t

X

t

X

t

X

Modelos

Modelos auto-regressivos (AR) ou ARIMA(p,0,0)

O valor presente Xt é uma função linear dos valores passados Xt-p A ordem da auto-regressão depende do valor mais antigo p, que corresponde ao número de variáveis da regressão.

φn são os coeficientes de regressão, constantes e reais. para encontrar

estes valores podem ser usadas técnicas de mínimos quadrados.

t p t p t t t

X

X

X

a

X

=

δ

+

φ

1 1

+

φ

2 2

+

L

+

φ

+

(

)

t p p t

B

B

B

X

a

φ

φ

φ

δ

+

=

1

1

2 2

L

(4)

Modelos

7

Modelos de média móvel (MA) ou ARIMA(0,0,q)

O valor presente Xt é uma função linear dos valores presente e passados dos resíduos (erros ou ruídos) at-q

Diferente dos modelos AR que dependem dos valores passados da série Xt-p

A ordem do modelo depende do valor mais antigo do erro q, que é o número de variáveis do modelo.

θm são os coeficientes de regressão. O sinal negativo é apenas uma

questão de convenção. q t q t t t t a a a a X = −θ1 1−θ2 2 −L−θ

(

q q

)

t t B B B a X = 1−θ1 −θ2 2 −L−θ

Modelos

Modelos mistos ARMA ou ARIMA(p,0,q)

O valor presente Xt é uma função linear dos valores passados da série Xt-1

.. Xt-pe dos valores passados dos erros at-1 .. at-q

A ordem do modelo depende do valor mais antigo dos elementos da série

Xt-pe do erro at-q, ou seja, depende de p e de q

φ

n e θm são os coeficientes de regressão

q t q t t t p t p t t t

X

X

X

a

a

a

a

X

=

δ

+

φ

1 1

+

φ

2 2

+

L

+

φ

+

θ

1 1

θ

2 2

L

θ

(

)

(

)

t q q t p p

B

X

B

B

B

a

B

B

φ

φ

δ

θ

θ

θ

φ

=

+

1 2 2

L

1

1 2 2

L

1

(5)

Modelos

9

Modelos mistos ARIMA ou ARIMA(p,d,q)

Quando a série não é estacionária recorre-se à diferenciação de ordem d

A ordem da auto-regressão depende do valor mais antigo dos elementos da série p e do erro q e da ordem de diferenciação d

(

)

(

)(

)

(

)(

)

t q q t p p d I d a B B B B X B B B B B 43 42 1 4 4 4 4 3 4 4 4 4 2 1 L 43 42 1 4 4 4 4 3 4 4 4 4 2 1 L 3 2 1 MA sasonal 30 1 MA(q) médiamóvel 2 2 1 AR sasonal 7 1 AR(p) siva autoregres 2 2 1 ) ( 1 1 1 1 1− −

φ

φ

− −

φ

−Φ =

δ

+ −

θ

θ

− −

θ

−Θ

Modelos – exemplos

ARIMA(1,0,1) ARIMA(1,1,1) 1 1 1 1 − + − − + = t t t t X a a X δ φ θ

(

1−φ1B

)

Xt =δ +

(

1−θ1B

)

at

(

1−φ1B

)(

1−B

)

Xt =δ +

(

1−θ1B

)

at Xt =δ +

(

1+φ1

)

Xt−1−φ1Xt−2 +at −θ1at−1 ⟺ ⟺ AR(1) Diferenciação de 1ª ordem MA(1)

(6)

Cálculo dos parâmetros do modelo

11

Como determinar os parâmetros da expressão

Organizar variáveis na folha de cálculo

Atenção aos atrasos Xt-1, Xt-2,… at-1, at-2, …

Inicializar parâmetros (variáveis do Solver): δ, φ1, θ1 Calcular Xt (estimado)

Considerar at = 0

Calcular erro quadrático e soma dos erros quadráticos Grandeza a minimizar: soma dos erros quadráticos

(

1

+

1

)

−1

1 −2

+

1 −1

+

=

t t t t t

X

X

a

a

X

δ

φ

φ

θ

Pode ignorar-se ao estimar os parâmetros

Cálculo dos parâmetros do modelo

Exemplo

(

)

1 1 2 1 1 1

1

+

+

+

=

t t t t t

X

X

a

a

X

δ

φ

φ

θ

δ φ1 θ1 0.5040 -0.0445 1.6528 xt medido xt-1 xt-2 at at-1 xt estimado at 2 100 90 100 87.02 90 100 85.94 87.02 90 -1.72 0 87.66 2.95 86.26 85.94 87.02 -3.08 -1.72 89.33 9.46 94.93 86.26 85.94 3.10 -3.08 91.83 9.62 90.32 94.93 86.26 0.40 3.10 89.92 0.16 89.64 90.32 94.93 -0.74 0.40 90.37 0.55 93.35 89.64 90.32 1.96 -0.74 91.39 3.85 89.94 93.35 89.64 -0.51 1.96 90.45 0.26 90.43 89.94 93.35 -1.00 -0.51 91.43 1.01 94.46 90.43 89.94 1.89 -1.00 92.57 3.58 93.35 94.46 90.43 1.69 1.89 91.66 2.85 88.81 93.35 94.46 -2.30 1.69 91.11 5.28 91.31 88.81 93.35 -2.01 -2.30 93.32 4.05 95.21 91.31 88.81 0.18 -2.01 95.03 0.03 94.15 95.21 91.31 -1.09 0.18 95.24 1.19 97.62 94.15 95.21 1.12 -1.09 96.50 1.25 96.74 97.62 94.15 0.62 1.12 96.12 0.38 95.43 96.74 97.62 -0.83 0.62 96.26 0.69 97.64 95.43 96.74 0.28 -0.83 97.36 0.08 soma (at2) 47.23 Determinado com base na fórmula (ignorando at) Grandeza a minimizar (Solver) Parâmetros de regressão (variáveis a alterar no Solver)

(7)

Identificação dos modelos ARIMA

13

Os slides anteriores mostram como ajustar os parâmetros da regressão dos modelos ARIMA

Apenas falta saber como identificar os modelos, isto é, como estabelecer a equação de base, identificando p, d e q de ARIMA(p,d,q)

Identificação dos modelos

– conceitos base

Covariância

Até que ponto é que a variação de Y está associada à variação de Z?

Correlação

ρ

ρ = normalização da covariância para [–1; 1],

dividindo pela média geométrica das variâncias de Y e Z

)

Z

(

V

)

Y

(

V

)

Z

,

Y

(

Cov

=

ρ

= − − = N 1 k k k Y)(Z Z) Y ( N 1 ) Z , Y (

(8)

Identificação dos modelos

– conceitos base

15

Auto-correlação (ACF)

Correlação – é uma medida da dependência linear entre 2 variáveis.

Se for relativa à própria variável com atraso k, Xt-k, diz-se auto-correlação de ordem k. ) X ( V ) X , X ( Cov ) X , X ( t k t t k k t t − = ρ = − ρ -0,4 -0,2 0 0,2 0,4 0,6 0,8 1 1,2 ACF

Identificação dos modelos

– conceitos base

Auto-correlação Parcial (PACF)

Apenas com ACF é difícil discriminar entre modelos AR(p). Por

exemplo, entre AR(2) e AR(3) ou entre AR(3) e AR(4)

Analisemos o seguinte caso, AR(1): X

t

=

φ

X

t-1

+ a

t

Dado que Xt-1 tem toda a informação para determinar Xt-1 então Xt-2, Xt-3, ... não interessam. Uma regressão linear de Xtem Xt-1, converge para φ. Uma regressão linear de Xtem Xt-2, converge para φ2. Contudo, se a regressão linear for de Xtem Xt-1 e Xt-2, o coeficiente de Xt-2 converge para zero, dado que Xt-1 faz “todo o

trabalho” na previsão de Xt. Ou seja, é como se a correlação entre Xte Xt-2 fosse zero.

PACF ultrapassa esta dependência em cadeia, eliminando o efeito dos

elementos intermédios (dentro do time lag)

A PACF de atraso k corresponde à autocorrelação entre Xte Xt-kque não é explicada pelos atrasos de 1 a k.

(9)

Identificação dos modelos

17

Autoregressivas (AR) e média móvel (MA)

Que diferenças?

O modelo AR inclui termos de atraso na própria série

O modelo MA inclui termos de atraso no ruído ou resíduos

Como decidir qual usar?

ACF e PACF

Séries temporais

Para identificar tipo e determinar p e q

MA(q)

AR(p)

ARMA(p,q)

ACF

Desprezável

após q

Decai

Decai

após q

PACF

Decai

Desprezável

após p

Decai

após p

∗ Decaimento acentuado tipo exponencial ou sinusoide atenuada

Séries não-estacionárias: ACF permanece elevado para 6 ou mais

lags ⇒ diferenciar a série e reanalisar;

(10)

Exemplos

19

Modelos autoregressivos de 1ª ordem: AR(1) ou ARIMA(1,0,0)

Exemplos

(11)

Exemplos

21

Modelos autoregressivos de 2ª ordem: AR(2) ou ARIMA(2,0,0)

Exemplos

(12)

AR(2) ou ARIMA(2,0,0)

Exemplos

23 ACF PACF MA(2) ou ARIMA(0,0,2)

Exemplos

ACF PACF

(13)

Exemplos

25

Exemplos ARMA(1,1) ou ARIMA(1,0,1)

ACF PACF Nem sempre é evidente !

Exemplos

ARMA(2,2) ou ARIMA(2,0,2) ACF Valor empírico Valor teórico PACF

(14)

Sazonalidade

27

Sazonalidade

S a le s Ye a r M onth 1972 1971 1970 1969 1968 1967 1966 1965 1964 1963 Ja n Ja n Ja n Ja n Ja n Ja n Ja n Ja n Ja n Ja n 1100 1000 900 800 700 600 500 400 300 200 Time S e r ie s P lot of S a le s

Sazonalidade

Lag A u to c o rr e la ti o n 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0

Autocorrelation Function for Sales

(with 5% significance limits for the autocorrelations)

Sazonalidade nos time lag 12, 24 e 36 ACF P a rt ia l A u to c o rr e la ti o n 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0

Partial Autocorrelation Function for Sales

(with 5% significance limits for the partial autocorrelations) PACF

(15)

Sazonalidade

ACF e PACF para exemplos ARIMA(p,d,q)4 sazonal

Nem sempre é fácil identificar os modelos… Nos integrativos, o decaimento é normalmente “lento e linear”.

ARIMA(0,1,0)4

ARIMA(1,0,0)4

29

Sazonalidade

Exemplos ARIMA(p,d,q)4 sazonal

ARIMA(1,0,0)4

ARIMA(0,0,1)4

(16)

Identificação de modelos

31

Para identificar tipo e determinar p e q

MA(q)

AR(p)

ARMA(p,q)

ACF

Desprezável

após q

Decai

Decai

após q

PACF

Decai

Desprezável

após p

Decai

após p

∗ Decaimento acentuado tipo exponencial ou sinusoide atenuada

Séries não-estacionárias: ACF permanece elevado para 6 ou mais

lags ⇒ diferenciar a série e reanalisar;

Identificação de modelos

Para identificar tipo e determinar p e q (cont.)

Séries não-estacionárias: ACF permanece elevado para 6 ou mais lags ⇒ diferenciar a série e re-analisar;

Processos sazonais: picos em lags periódicos;

Nos modelos ARMA(p,q) contar os lags mais elevados que um dado limite

O SPSS atribui esse limite

No final (após especificação do modelo), analisar sempre o ACF e PACF do resíduo para verificar se contém informação;

Podem ocorrer picos ocasionais (isolados) para grandes lags: à partida deverão ser ignorados.

(17)

Identificação de modelos

33

Mais exemplos…

Obs: Os exemplos seguintes são puros (teóricos). ACF e PACF de

dados reais raramente são tão “limpos” como estes.

ARIMA(0,0,1) ou MA(1)

Identificação de modelos

ARIMA(0,0,1) ou MA(1) ARIMA(0,0,2) ou MA(2)

(18)

Identificação de modelos

35 ARIMA(1,0,0) ou AR(1) ARIMA(1,0,0 ou AR(1)

Identificação de modelos

ARIMA(1,0,1)

Nem sempre é trivial…

ARIMA(2,0,0)

ou

(19)

Caso real

37

Talvez ARIMA (1, 1, 0):

• o PACF tem um pico no lag 1 (e, a partir daí, decai rapidamente) ⇒ AR(1); • o ACF permanece elevado após bastantes lags ⇒ integrativo.

Série real: inscrições da universidade de Oregon 1962–2004

Síntese

Construção de um modelo ARIMA

Observar gráficos (linhas); identificar estacionaridade; identificar sazonalidade

Tornar a série estacionária:

1. Subtrair média e dividir por desvio padrão ou

2. Aplicar transformações logarítmicas ou potências ou

3. Aplicar diferenciação para garantir estacionaridade e/ou para extrair sazonalidade

Observar ACF e PACF para identificar o tipo de modelo ARMA Determinar os parâmetros do modelo ARMA

Construir o modelo completo; fazer a previsão; validar o modelo; avaliar o desempenho do modelo

Obs: A identificação de modelos baseada na análise de ACF e PACF não é infalível mas, normalmente, permite obter informações sobre modelos adequados. Nas séries reais ou com muito ruído, as conclusões poderão ser menos claras.

Outras medida para identificação de modelos: Akaike’s information criterion (AIC), Bayesian Information Criterion (BIC), Hannan-Quinn Criteria (HQIC),…

(20)

Síntese

39

Construção de um modelo ARIMA

Fazer gráfico da série temporal Identificar possível modelo Não •Eliminar tendência ou •aplicar log… ou •diferenciar série Previsões Não Sim Estacionária ? Sim Diagnóstico OK?

Exemplo

(21)

Exemplo

41 ACF e PACF O decaimento linear do ACF sugere processo não estacionário

Exemplo

Diferenciar série A diferenciação tornou a série (mais) estacionária

(22)

Exemplo

43

ACF e PACF (para a série diferenciada)

O ACF decai agora mais rapidamente.

O PACF é desprezável após o lag 2, comportamento típico do modelo autoregressivo de 2ª ordem AR(2). ARIMA (2,1,0) Modelo AR(2) da série diferenciada Integrada (1 diferenciação)

Referências

Documentos relacionados

Figura 7.6: Desempenho do algoritmo paralelo homogˆeneo com a vers˜ao paralela do MaxScore, as pol´ıticas de threshold e partic¸˜oes com tamanho de 32 docIDs para o lote de

Caso a licitante qualificada como microempresa ou empresa de pequeno porte melhor classificada desista ou não se manifeste no prazo estabelecido, serão convocadas

A embalagem procura cumprir as funções básicas de uma embalagem secundária como segurança, fácil empilhamento e arma- zenagem, sem deixar de lado o apelo visual que busca se

(n.º2 do artigo 130.º do RJACSR) 5.7.3 As instalações sanitárias não têm acesso direto com as zonas de serviço, salas de refeição ou salas destinadas ao serviço de bebidas,

A Justa causa ainda é uma das principais dúvidas do empregador e algumas questões suscitam discussão: quais os principais atos/fatos que configuram a justa causa, o

‰ No gráfico a seguir está uma série não estacionária, para a qual são necessárias duas diferenças até encontrar uma série estacionária. 500 1000 1500 2000

São utilizados os métodos quantitativos de séries temporais: médias móveis simples, ponderada e exponencial; suavização exponencial; regressão linear auto- regressiva;

PoDeroso, MAs não oMnIPoTenTe Se Mearsheimer e Walt apresentam bases sólidas para realçar a pressão do lobby e de Israel para atacar o Irão, é mais frágil a sua