ANÁLISE DE SÉRIES TEMPORAIS

(1)

Ralph S. Silva

http://www.im.ufrj.br/ralph/seriestemporais.html

Departamento de Métodos Estatísticos

Instituto de Matemática

(2)

Referências

I Brockwell, P. J. e Davis, R. A. (2010). Introduction to Time Series and Forecasting, 2nd Edition, Springer.

I Morettin, P. A. e Toloi, C. M. C. (2004). Análise de Séries Temporais,

Editora Edgar Blücher.

I West, M. e Harrison, J. (1997). Bayesian Forecasting and Dynamic

(3)

Ementa

I Introdução;

I Processos estacionários;

I Modelos ARMA;

I Análise espectral;

I Modelagem e previsão com processos ARMA;

I Modelos de séries temporais não estacionários e sazonal;

I Séries temporais multivariadas; e

(4)

Introdução

I UmaSérie Temporalé um conjunto de observações yt, cada uma observada no tempo específico t.

I Uma série temporal é tempo-discreta se o conjunto de índices de tempo

for um conjunto discreto, por exemplo T = {1, 2, 3, . . .}.

I Uma série temporal é tempo-contínua se as observações ocorrem

continuamente em um intervalo de tempo, por exemplo T ∈ [0, 1].

I Neste curso trataremos de séries temporais a tempo-discreto.

I Utilizaremos o programa R e vários de seus pacotes.

I R: https://www.r-project.org/

I Talvez precisemos também dos programas OpenBUGS e JAGS (através

do pacote rjags do R).

I OpenBUGS: http://www.openbugs.net I JAGS: http://mcmc-jags.sourceforge.net/

(5)

Revisão: alguns conceitos e propriedades

Momentos ordinários: m′ℓ=E(Yℓ) = ∫︁ ∞ −∞ yℓf (y )dy . Definimos 𝜇Y =m′

1=E(Y ) como a média.

Momentos centrais: mℓ=E[(Y − 𝜇Y)ℓ] = ∫︁ ∞ −∞ (Y − 𝜇Y)ℓf (y )dy . Definimos 𝜎2

(6)

O coeficiente de assimetria é definido por S(Y ) = E[︂ (Y − 𝜇Y) 3 𝜎3 Y ]︂

e o coeficiente de curtose por

K (Y ) = E[︂ (Y − 𝜇Y) 4 𝜎4 Y ]︂ .

I A quantidade K (Y ) − 3 é chamada de excesso de curtose porque

K (Y ) = 3 para a distribuição normal.

I Uma distribuição com excesso de curtose positivo é dita ter caudas

pesadas (leptocúrtica).

I Uma distribuição com excesso de curtose negativo é dita ter caudas

(7)

Momentos amostrais

Suponha que {Y1,Y2, . . . ,YT} seja uma amostra aleatória de Y com T

observações.

I Média amostral:𝜇Y_̂︀ = 1

T ∑︁T t=1Yt. I Variância amostral:_̂︀𝜎2Y = 1 T − 1 ∑︁T t=1(Yt−𝜇Ŷ︀ ) 2_.

I O coeficiente de assimetria amostral:

̂︀ S(Y ) = 1 (T − 1) ̂︀ 𝜎3 Y ∑︁T t=1(Yt−𝜇Ŷ︀ ) 3 .

I O coeficiente de curtose amostral:

̂︀ K (Y ) = 1 (T − 1)_̂︀𝜎4 Y ∑︁T t=1(Yt−𝜇ŷ︀) 4 .

(8)

I Sob a hipótese de normalidade (hipótese de que os dados são provenientes de uma distribuição normal), temos que

̂︀

S(Y ) ≈ 𝒩 (0; 6/T ) e K (Y ) ≈ 𝒩 (3; 24/T )̂︀

para T “suficientemente grande”.

I Suponha que {Y1,Y2, . . . ,YT} seja uma amostra aleatória de Y com T

observações. Então, podemos testar

H0: S(Y ) = 0

H1: S(Y ) ̸= 0.

I A estatística da razão t-Student da assimetria amostral é dada por

t = S(Y )̂︀

√︀6/T ≈ 𝒩 (0, 1).

I Rejeitamos H0ao nível 𝛼 de significância se |t| > z𝛼/2, sendo z𝛼/2o

(9)

I Para testar o excesso de curstose dos retornos, consideramos

H0: K (Y ) − 3 = 0

H1: K (Y ) − 3 ̸= 0.

I A estatística da razão t-Student da assimetria amostral é

t = K (Y ) − 3̂︀

√︀24/T ≈ 𝒩 (0, 1).

I Rejeitamos H0ao nível 𝛼 de significância se |t| > z𝛼/2, sendo z𝛼/2o

percentil 100(1 − 𝛼/2) da distribuição normal padrão.

I Temos também o teste deJarque e Berapara normalidade com

JB = Ŝ︀ 2_{(Y )} 6/T + ( ̂︀K (Y ) − 3)2 24/T ≈ 𝜒 2 2 para T “grande”. I Rejeitamos H0(normalidade) se JB > 𝜒⋆ 1−𝛼, sendo 𝜒⋆1−𝛼o percentil 100(1 − 𝛼) da distribuição 𝜒2 2.

(10)

Séries temporais

Definição

Umasérie temporalpara dados observados {yt} é uma especificação da distribuição conjunta (ou possivelmente somente de médias e covariâncias)

de uma sequência de variáveis aleatórias {Yt} na qual {yt} é uma

realização.

A distribuição conjunta de uma sequência de variáveis aleatórias

(Y1,Y2, . . . ,YT)pode ser expressa por

Pr(Y16 y1;Y26 y2; · · · ;YT 6 yT), para − ∞ < y1,y2, . . . ,yT < ∞.

Observação: a distribuição conjunta pode conter muitos parâmetros para serem estimados!

Uma alternativa é trabalhar com o primeiro e o segundo momentos: E(Yt)e

E(YtYt+h), t = 1, 2, . . . e h = 0, 1, 2, . . .

(11)

Exemplo 1: venda mensal de vinho tinto australiano

(⇒) Mês Milhares de Litros 1980 1982 1984 1986 1988 1990 1992 0.5 1.0 1.5 2.0 2.5 3.0 ● ●● ● ● ● ● ● ● ●●● ● ●● ● ● ● ●● ● ● ●● ● ● ● ●● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●●● ● ● ● ●● ●● ● ● ● ●● ● ● ● ● ●●● ● ● ● ● ●● ● ●● ●●● ●● ● ●● ● ● ●●● ●● ● ● ● ● ●● ● ● ●_● ● ● ● ●● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ●● ● ●● ● ●● ●

I Vendas em quilolitros de jan/1980 a out/1991 (T = 142 observações).

I Tendência crescente; sazonalidade; altas em julho (inverno); baixas em

(12)

Exemplo 2: número de mortes mensais por acidente nos EUA

(⇒) Mês Milhares de Mor tes 1973 1974 1975 1976 1977 1978 1979 7 8 9 10 11 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●

I Milhares de mortes de jan/1973 a dez/1978 (T = 72 observações).

I Sazonalidade; altas em julho; baixas em fevereiro.

(13)

Exemplo 3: problema de detecção de sinal

● ● ●● ●_● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●_● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ●●● ● ●● ● ● ● ● ● ● ● ●●_● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●_● ● ●● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●_● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● 0 5 10 15 20 −2 −1 0 1 2 Tempo Sinal e Ruído

(14)

Exemplo 4: população dos EUA, 1790-1990

(⇒) Ano Milhões de Habitantes 1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 0 20 40 60 80 100 120 140 160 180 200 220 240 ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ●

(15)

Exemplo 5: número de greves por ano nos EUA, 1951-1980

(⇒) Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 3.5 4.0 4.5 5.0 5.5 6.0 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

(16)

Exemplo 6: modelo ruído branco

(⇒)

Sequência de variáveis aleatórias Yt com E(Yt) =0 (média zero),

Var(Yt) = 𝜎2< ∞(variância constante) e Cov(Yt,Yt+h) =0 (não

correlacionadas) para t = 1, 2, . . . e h > 1. Notação: Yt ∼ ℛℬ(0, 𝜎2).

Tempo V alor Obser v ado 0 100 250 400 550 700 850 1000 −4 −3 −2 −1 0 1 2 3 4

(17)

Exemplo 7: modelo passeio aleatório

(⇒)

Soma acumulada de variáveis aleatórias Xt ∼ ℛℬ(0, 𝜎2

)com 𝜎2< ∞. Y0=0 e Yt =X1+X2+ · · · +Xt =Yt−1+Xt, para t = 1, 2, . . . Tempo V alor Obser v ado 0 100 250 400 550 700 850 1000 −20 −10 0 10 20

(18)

Modelos com tendência

I Exemplo 8: Rever o exemplo da população dos EUA, 1790-1990. (⇐)

I Apresenta uma tendência quadrática (crescente).

I Aparentemente não existe sazonalidade ou ciclos.

I Podemos sugerir um modelo da forma:

Yt =mt+ 𝜀t,

em que 𝜀t ∼ ℛℬ(0, 𝜎2

)e mt é uma função (contínua) com mudanças suaves.

Para o exemplo acima, podemos sugerir que

mt = 𝛽0+ 𝛽1t + 𝛽2t2

e estimar os parâmetros 𝛽0, 𝛽1e 𝛽2por mínimos quadrados.

(Mostrar exemplo no R: exemplo_08.r) Tabela:Estimativas de mínimos quadrados.

Parâmetro Estimativa Erro Padrão Valor t Valor p

𝛽0 6,95792 1,99853 3,482 0.00266

𝛽1 -2,15987 0,41844 -5,162 6.55e-05 𝛽2 0,65063 0,01847 35,223 < 2e-16

(19)

Exemplo 9: nível do lago Huron

(⇒) Ano Nív el 1880 189019001910 192019301940 195019601970 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0 11.0 12.0 ● ● ● ● ● ●● ● ●●● ● ● ● ●_● ●● ●● ● ● ●● ● ● ● ●● ●●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ●●● ● ● ● ● ● ● ●●● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●●

I Possível tendência linear decrescente.

(20)

Exemplo 9: nível do lago Huron - resíduos da regressão linear

Ano Resíduos 1880 189019001910 192019301940 195019601970 −2.5 −2.0 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 2.5 ● ● ● ● ● ●● ● ●●● ● ● ● ●_● ●● ●● ● ● ●● ● ● ● ●● ●●● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ●●● ● ● ● ● ● ● ● ●●●_● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●●

I Verifica-se a ausência de tendência nos resíduos.

I Observa-se certa suavidade dos resíduos - indicada por valores

consecutivos somente negativos e outros somente positivos.

(21)

Modelos com sazonalidade - regressão harmônica

Suponha que Ytseja uma série temporal sem tendência e com sazonalidade.

Um modelo possível é dado por:

Yt =st+ 𝜀t,

em que 𝜀t∼ ℛℬ(0, 𝜎2

)e st é uma função periódica de t com período d

(st−d=st).

Uma escolha conveniente é dada pela regressão harmônica:

st = 𝛽0+ J ∑︁ j=1 [𝛼jcos(𝜔jt) + 𝛾jsen(𝜔jt)] em que

I 𝛽0, 𝛼je 𝛾j, para j = 1, . . . , J, são parâmetros desconhecidos; e

I 𝜔j, para j = 1, . . . , J, são frequências fixas, cada uma sendo um múltiplo

(22)

Exemplo 10: número de mortes mensais por acidente nos EUA

(⇐) I Número de observações: n = 72; I Observações mensais; I Número de harmônicos: k = 2; e I Período: d = 12. Assim, 𝜔1=2𝜋 12 = 𝜋 6 e 𝜔2= 4𝜋 12 = 𝜋 3. Portanto, fazemos I x1t = cos(𝜔1t); I x2t =sen(𝜔1t); I x3t = cos(𝜔2t); e I x4t =sen(𝜔2t) para t = 1, . . . , 72.

Finalmente, ajustamos um modelo de regressão por mínimos quadrados.

(23)

Modelos com sazonalidade - variáveis binárias

Novamente, temos que

Yt =st+ 𝜀t, em que 𝜀t ∼ ℛℬ(0, 𝜎2)

Agora, seja d a frequência sazonal (período).

Sejam D1t,D2t, . . . ,Ddt as variáveis binárias sazonais tal que

{︂

Djt =1, se o d for o j-ésimo período

Djt =0, caso contrário, para j = 1, 2, . . . , d .

Em qualquer tempo t somente uma das variáveis binárias D1t,D2t, . . . ,Ddt

assume o valor 1 (as restantes 0).

Suponha que d = 12 para dados mensais. Então,

st = ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ 𝛽1, se t =janeiro; 𝛽2, se t =fevereiro; .. . ... 𝛽12, se t =dezembro. = ∑︁12 𝛽jDjt.

(24)

Exemplo 11: número de mortes mensais por acidente nos EUA

I Número de observações: T = 72;

I Observações mensais;

I Período: d = 12.

Finalmente, ajustamos um modelo de regressão por mínimos quadrados.

(25)

Modelagem de séries temporais

I Examinar as principais características de uma séries temporal através

de seu gráfico:

I tendência; I sazonalidade;

I qualquer mudança brusca no comportamento; e I qualquer valor aberrante (outlier).

I Remover possíveis tendências e sazonalidade para obter uma série

estacionáriados resíduos.

I Transformar os dados se necessário (log(y ),√y ) ou Box-Cox.

I As componentes de tendência e sazonalidade podem ser removidas por

diferenciação, por exemplo substituindo a série {Yt} por

{Wt =Yt− Yt−d} para algum inteiro positivo d .

I O objetivo é sempre obter uma sérieestacionária.

I Escolher um (ou vários) modelo(s) para ajustar a série temporal

(estacionária).

(26)

Modelos estacionários e a função de autocorrelação

Uma série temporal {Yt, t = 0, ±1, ±2, . . .} é dita ser estacionária se tiver

propriedades similares a série defasada {Yt+h, t = 0, ±1, ±2, . . .}, para

cada h.

De outra maneira, uma série temporal {Yt} é estritamente estacionária se a

distribuição conjunta de (Yt,Yt+1, . . . ,Yt+k)for identica a

(Yt+h,Yt+1+h, . . . ,Yt+k +h), para todo t, k e h inteiros positivos.

Agora, focaremos nos momentos de primeira e segunda ordens de {Yt}.

Definição:

Seja {Yt} uma série temporal tal que E(Yt) < ∞. A função média de {Yt} é

𝜇Y(t) = E(Yt).

A função de covariância de {Yt} é

𝛾Y(r , s) = Cov(Yr,Ys)=E [(Yr− 𝜇Y(r ))(Ys− 𝜇Y(s))]

(27)

Definição:

Dizemos que {Yt} é umasérie temporal (fracamente) estacionáriase

1. 𝜇Y(t) é independente de t, e

2. 𝛾Y(t + h, t) é independente de t para cada h.

Observações:

I Uma série temporal {Yt, t = 0, ±1, ±2, . . .} é estritamente

estacionária se (Y1, . . . ,Yn)e (Y1+h, . . . ,Yn+h)têm a mesma

distribuição conjunta para todos os inteiros h e n > 0.

I Se {Yt} é estritamente estacionária com E(Yt) < ∞para todo t, então

{Yt} também é fracamente estacionária.

I Sempre que usarmos o termo função de covariância com referência a

uma série temporal estacionária {Yt}, estaremos nos referindo na

verdade a função de 𝛾Y, de uma variável, definida por

𝛾Y(h) , 𝛾Y(0, h) = 𝛾Y(t + h, t).

(28)

Definição:

Seja {Yt} uma série temporal estacionária.

I Afunção de autocovariância(ACVF) de {Yt} na defasagem h é

𝛾Y(h) = Cov(Yt+h,Yt).

I Afunção de autocorrelação(ACF) de {Yt} na defasagem h é

𝜌Y(h) , 𝛾Y(h)

(29)

Exemplo: ruído i.i.d.

Se {Yt} é uma série temporal ruído i.i.d. tal que E(Y2

t) = 𝜎2< ∞, então

1. E(Yt) =0 para todo t; e

2. 𝛾Y(h) =

{︂

𝜎2, se h = 0;

0, se h ̸= 0,

não dependem de t. Logo, {Yt} é estacionária.

Notação: Yt ∼ ℐℐ𝒟(0, 𝜎2_).

Exemplo: ruído branco (⇐)

Se {Yt} é uma sequência de variáveis aleatórias não correlacionadas, cada

uma com média 0 e variância 𝜎2, então claramente {Yt} é estacionária com

𝛾Y(h) =

{︂

𝜎2, se h = 0;

0, se h ̸= 0.

Esta sequência é chamada de ruído branco.

(30)

Exemplo: passeio aleatório (⇐)

Se {Yt} é um passeio aleatório, então E(Yt) =0 e E(Yt2) = 𝜎

2

t < ∞ para todo t e para h > 0.

E(Yt) = E(Y0) +E(X1) + · · · +E(Xt) =0 + 0 + · · · + 0 = 0

𝛾Y(h) = Cov(Yt+h,Yt) =Cov(Yt +Xt+1+ · · · +Xt+h,Yt) =Cov(Yt,Yt) =t𝜎2.

(31)

Exemplo: processo MA(1)

Considere o modelo definido por

Yt = 𝜃𝜀t−1+ 𝜀t, t = 0, ±1, ±2, . . .

em que 𝜀t∼ ℛℬ(0, 𝜎2₎_{e 𝜃 um valor real. Então,}

I E(Yt) =E(𝜃𝜀t−1+ 𝜀t) = 𝜃E(𝜀t−1) +E(𝜀t) =0;

I E(Yt2) =E((𝜃𝜀t−1+ 𝜀t)

2

) = 𝜃2E(𝜀2t−1) +2𝜃E(𝜀t−1𝜀t) +E(𝜀

2 t) = 𝜎 2 (1 + 𝜃2); I 𝛾Y(h) = ⎧ ⎨ ⎩ 𝜎2_{(1 + 𝜃}2_), _{se h = 0;} 𝜎2_𝜃, _{se h = ±1;} 0, se |h| > 1, pois

𝛾Y(1) = Cov(Yt,Yt+1) =Cov(𝜃𝜀t−1+ 𝜀t, 𝜃𝜀t+ 𝜀t+1) = 𝜃Cov(𝜀t, 𝜀t) = 𝜃𝜎2.

Portanto, {Yt} é estacionária.

A função de autocorrelação é 𝜌Y(h) =

⎧ ⎨ ⎩ 1, se h = 0; 𝜃/(1 + 𝜃2 ), se h = ±1; 0, se |h| > 1.

(32)

Exemplo: processo AR(1)

Se assumirmos que {Yt} é uma série estacionária satisfazendo a equação

Yt= 𝜑Yt−1+ 𝜀t, t = 0, ±1, ±2, . . .

em que 𝜀t∼ ℛℬ(0, 𝜎2_{), |𝜑| < 1 e 𝜀t} _{não correlacionado com Ys} _{para cada}

s < t, então

I E(Yt) =E(𝜑Yt−1+ 𝜀t) = 𝜑E(Yt−1) +E(𝜀t) =0 pois E(Yt) =E(Yt−1).

I 𝛾Y(h) = Cov(Yt,Yt−h) =Cov(𝜑Yt−1,Yt−h) +Cov(𝜀t,Yt−h) =

𝜑𝛾Y(h − 1) + 0 = 𝜑h𝛾Y(0).

I 𝜌Y(h) =𝛾Y(h)

𝛾Y(0)= 𝜑

|h|_,_{para h = 0, ±1, ±2, . . . pois 𝛾Y}_{(h) = 𝛾Y}_(−h).

I 𝛾Y(0) = Cov(Yt,Yt) =Cov(𝜑Yt−1+ 𝜀t, 𝜑Yt−1+ 𝜀t) = 𝜑2𝛾Y(0) + 𝜎2 _⇒

𝛾Y(0) = 𝜎

2

(33)

Função de autocorrelação amostral

Definição:

Sejam {y1,y2, . . . ,yT} observações de uma série temporal.

I A média amostral é dada por

y = 1 T n ∑︁ t=1 yT.

I A função de autocovariância amostral é dada por

̂︀ 𝛾(h) = 1 T T −|h| ∑︁ t=1 (yt+|h|− y )(yt− y ), −T < h < T .

I A função de autocorrelação amostral é dada por

̂︀

𝜌(h) = ̂︀𝛾(h)

̂︀

(34)

Observações:

1. O divisor T (não T − |h|) garante que a matriz de autocovariância

amostral ̂︀ΓT , [̂︀𝛾(i − j)]Ti,j=1é não negativa definida.

2. Assim como a matriz de autocovariância amostral, a matriz de

autocorrelação amostral ̂︀RT , [̂︀𝜌(i − j)]T

i,j=1é não negativa definida.

3. As funções de autocovariância e autocorrelação amostrais podem

calculadas para qualquer conjunto de dados {y1,y2, . . . ,yT} e não estão

restritas as séries temporais estacionárias.

4. Em amostras finitas,𝜌(h) é um estimador tendencioso de 𝜌(h). A_̂︀

tendência é da ordem de 1/T , o que pode ser significativo quando o tamanho amostral T é pequeno.

5. Se {Yt} for uma sequência i.i.d. com E(Y2

t) < ∞, então𝜌(h) é̂︀

assintoticamente normal com média 0 e variância 1/T para todo inteiro positivo e fixo h, isto é, para T suficientemente grande, temos

̂︀

𝜌(h)√T ≈ 𝒩 (0, 1).

(35)

Teste de Portmanteau

I Queremos testar H0: 𝜌(1) = 𝜌(2) = · · · = 𝜌(m) = 0 contra H1: 𝜌(j) ̸= 0

para algum j ∈ {1, 2, . . . , m}. I A estatística do teste é Q⋆(m) = T∑︁m j=1[𝜌(j)]̂︀ 2 , (Box e Pierce).

I Sob a hipótese que {Yt} é uma sequência i.i.d. com certas condições

nos momentos, Q⋆_{(m) tem distribuição assintótica qui-quadrado com m}

graus de liberdade.

I Para amostras finitas, podemos aumentar o poder do teste ao considerar

Q(m) = T (T + 2)∑︁m j=1 [𝜌(j)]_̂︀ 2 T − j , (Ljung e Box). I Rejeitamos H0se Q(m) > 𝜒m 𝛼, sendo 𝜒m𝛼o percentil 100(1 − 𝛼) da

distribuição qui-quadrado com m graus de liberdade.

(36)

Exemplo 12: ruído branco

0 5 10 15 20 25 30 35 40 45 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

Figura:Estimativa da função de autocorrelação para dados simulados de um processo ruído branco.

(37)

Exemplo 13: vendas de vinho tinto australiano

(⇐) 0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

Figura:Estimativa da função de autocorrelação para os dados de vendas de vinho tinto australiano.

I Com presença de tendência, |𝜌(h)| decrescerá devagar a medida que h cresce.̂︀ I Com presença de sazonalidade, |𝜌(h)| terá uma periodicidade igual da série.̂︀

(38)

Exemplo 14: nível do lago Huron

(⇐) 0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

I Uma função constante parece ser um modelo inapropriado.

I Autocorrelações significativas em três defasagens.

I Exibe um decaimento geométrico. Temos𝜌(2)/̂︀ 𝜌(̂︀1) w 0, 76 ê︀𝜌(3)/𝜌(̂︀2) w 0, 61. Um modelo AR(1) com 𝜑 w 0, 76 parece ser apropriado para os resíduos.

(39)

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● −2.5 −1.5 −0.5 0.5 1.5 2.5 −2.5 −1.5 −0.5 0.5 1.5 2.5 e ^ t−1 e^t

I Podemos verificar através do gráfico dê︀et−1ê︀et que existe uma

possível relação linear entre essas duas variáveis.

I Propõe-se o modelo et = 𝛽0+ 𝛽1et−1+ 𝜀⋆

(40)

0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

I Resultado do ajuste do modelo AR(1).

I Ainda parece ter dependência. Propõe-se o modelo

et = 𝛽0+ 𝛽1et−1+ 𝛽2et−2+ 𝜀⋆

(41)

0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

I Resultado do ajuste do modelo AR(2).

I As autocorrelações de “todas” as defasagens não são significativas.

(42)

Estimação e eliminação das componentes de tendência e sazonalidade

O modelo de decomposição clássica é dado por

Yt =mt+st+ 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2).

Trataremos de duas abordagens para remover tendência e sazonalidade:

1. estimando mt e st; e

(43)

Modelo de tendência sem sazonalidade:

Yt =mt+ 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2

).

Método 1: estimação da tendência

(a) Suavização com um filtro de médias móveis finito.Seja q um inteiro não negativo e considere a média móvel de dois lados

Zt = 1 2q + 1 q ∑︁ j=−q Yt−j

(44)

Então, para q 6 t 6 n − q, Zt = 1 2q + 1 q ∑︁ j=−q mt−j+ 1 2q + 1 q ∑︁ j=−q 𝜀t−j w mt

se mtfor aproximadamente linear no intervalo [t − q, t + q] e se a média dos

erros neste intervalo estiver próxima de zero. A média móvel portanto nos fornece estimativas

mt = 1 2q + 1 q ∑︁ j=−q Yt−j.

Definimos Yt , Y1para t < 1 e Yt , Ynpara t > n para poder aplicar a

(45)

Exemplo 15: número de greves por ano nos EUA

(⇐) Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 3.5 4.0 4.5 5.0 5.5 6.0 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

(46)

Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 −1.0 −0.5 0.0 0.5 1.0 ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 1 2 3 4 5 6 7 8 9 10 −0.4 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF

I Série de resíduos (et =yt−mt̂︀) via médias móveis.

I ACF dos resíduos (sem dependência significativa).

(47)

(b) Suavização exponencial. Para qualquer valor fixo 𝛼 ∈ [0, 1], a média

móvel unilateralmt̂︀, t = 1, . . . , n é defindo pelas recursões

̂︀

mt = 𝛼Yt+ (1 − 𝛼)mt−1̂︀

̂︀

m1 = Y1.

(Mostrar exemplo no R: exemplo_16.r)

(c) Ajuste polinomial. Definimos mt como um polinômio em t da forma

mt = 𝛽0+ 𝛽1t + 𝛽2t2+ · · · + 𝛽ktk.

O ajuste pode ser feito por mínimos quadrados. A série temporal sem tendência é dada pelos resíduos da regressão.

(48)

Método 2: Eliminação da tendência por diferenciação

O operador diferença ∇ de primeira ordem (ou defasagem 1) é definido por

∇Yt , Yt− Yt−1= (1 − B)Yt

sendo B o operador de defasagem (para trás), BYt , Yt−1.

As potências dos operadores acima são definidas de maneira similar:

I Bj_Yt

, Yt−j, para j > 1; e

I ∇j

Yt = ∇(∇j−1Yt), para j > 1 com ∇0, Yt.

Polinômios em B e ∇ são manipulados de maneira similar as funções polinomiais de variáveis reais.

∇2Yt = ∇(∇Yt) = (1 − B)(1 − B)Yt

= (1 − 2B + B2)Yt =Yt− 2Yt−1+Yt−2

Se mt = 𝛽0+ 𝛽1t, então ∇mt =mt− mt−1= 𝛽0+ 𝛽1t − (𝛽0+ 𝛽1(t − 1)) = 𝛽1.

Se Yt =mt+ 𝜀t sendo mt =∑︀k_j=1𝛽jtje 𝜀t, então a aplicação de ∇k resulta

em

∇kYt=k !𝛽k + ∇k𝜀t,

(49)

Exemplo 17: população dos EUA

Ano Milhões de Habitantes 1820 1840 1860 1880 1900 1920 1940 1960 1980 −8 −6 −4 −2 0 2 4 6 8 10 ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●_●

(50)

Modelos com tendência e sazonalidade

Xt =mt+st + 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2) I t = 1, . . . , n; I período d ; I st+d=st; e I ∑︀d j=1sj=0.

Método 1: eliminação via médias móveis

Dado a amostra {x1, . . . ,xn}, acomponente de tendênciaé estimada ao

aplicar um filtro de médias móveis especialmente escolhido para eliminar a componente de sazonalidade e diminuir o ruído.

Se o período d for par (d = 2q), então usamos ̂︀

mt = (0, 5xt−q+xt−q+1+ · · · +xt+q−1+0, 5xt+q)/d , q < t 6 n − q.

(51)

O segundo passo é estimar acomponente sazonal. Para cada k = 1, . . . , d ,

calculamos a médias 𝜔k dos desvios {(xk +jd−mk +jd),̂︀ q < k + jd 6 n − q}.

Visto que estes desvios não necessariamente somam zero, estimamos a

componente sazonal sk como

̂︀sk = 𝜔k− 1 d d ∑︁ i=1 𝜔i, k = 1, . . . , d ê︀sk =̂︀sk −d, k > d .

A série com asazonalidade removidaé dada por

zt =xt−̂︀st, t = 1, . . . , n.

Finalmente, reestimamos a componente de tendência por um dos métodos

já apresentados usando a série zt. A série de ruídos é dada por

̂︀

𝜀t =xt−mt̂︀ −̂︀st, t = 1, . . . , n.

(52)

Método 2: eliminação por diferenciação

Defina ooperador diferença de defasagemd como

∇dXt =Xt− Xt−d= (1 − Bd)Xt.

Não confundir com ∇d _{= (1 − B)}d_.

Aplicando o operador ∇d ao modelo,

Xt =mt+st+ 𝜀t,

sendo que {st} tem período d , obtemos

∇dXt =mt− mt−d+ 𝜀t− 𝜀t−d,

que resulta em uma nova série ∇dXtcom tendência (mt− mt−d)e ruído

(𝜀t− 𝜀t−d).

A componente de tendência pode então ser removida pelos métodos descritos anteriormente, em particular pela aplicação da série de potências de ∇.