Ralph S. Silva
http://www.im.ufrj.br/ralph/seriestemporais.html
Departamento de Métodos Estatísticos
Instituto de Matemática
Referências
I Brockwell, P. J. e Davis, R. A. (2010). Introduction to Time Series and Forecasting, 2nd Edition, Springer.
I Morettin, P. A. e Toloi, C. M. C. (2004). Análise de Séries Temporais,
Editora Edgar Blücher.
I West, M. e Harrison, J. (1997). Bayesian Forecasting and Dynamic
Ementa
I Introdução;
I Processos estacionários;
I Modelos ARMA;
I Análise espectral;
I Modelagem e previsão com processos ARMA;
I Modelos de séries temporais não estacionários e sazonal;
I Séries temporais multivariadas; e
Introdução
I UmaSérie Temporalé um conjunto de observações yt, cada uma observada no tempo específico t.
I Uma série temporal é tempo-discreta se o conjunto de índices de tempo
for um conjunto discreto, por exemplo T = {1, 2, 3, . . .}.
I Uma série temporal é tempo-contínua se as observações ocorrem
continuamente em um intervalo de tempo, por exemplo T ∈ [0, 1].
I Neste curso trataremos de séries temporais a tempo-discreto.
I Utilizaremos o programa R e vários de seus pacotes.
I R: https://www.r-project.org/
I Talvez precisemos também dos programas OpenBUGS e JAGS (através
do pacote rjags do R).
I OpenBUGS: http://www.openbugs.net I JAGS: http://mcmc-jags.sourceforge.net/
Revisão: alguns conceitos e propriedades
Momentos ordinários: m′ℓ=E(Yℓ) = ∫︁ ∞ −∞ yℓf (y )dy . Definimos 𝜇Y =m′1=E(Y ) como a média.
Momentos centrais: mℓ=E[(Y − 𝜇Y)ℓ] = ∫︁ ∞ −∞ (Y − 𝜇Y)ℓf (y )dy . Definimos 𝜎2
O coeficiente de assimetria é definido por S(Y ) = E[︂ (Y − 𝜇Y) 3 𝜎3 Y ]︂
e o coeficiente de curtose por
K (Y ) = E[︂ (Y − 𝜇Y) 4 𝜎4 Y ]︂ .
I A quantidade K (Y ) − 3 é chamada de excesso de curtose porque
K (Y ) = 3 para a distribuição normal.
I Uma distribuição com excesso de curtose positivo é dita ter caudas
pesadas (leptocúrtica).
I Uma distribuição com excesso de curtose negativo é dita ter caudas
Momentos amostrais
Suponha que {Y1,Y2, . . . ,YT} seja uma amostra aleatória de Y com T
observações.
I Média amostral:𝜇Ŷ︀ = 1
T ∑︁T t=1Yt. I Variância amostral:̂︀𝜎2Y = 1 T − 1 ∑︁T t=1(Yt−𝜇Ŷ︀ ) 2.
I O coeficiente de assimetria amostral:
̂︀ S(Y ) = 1 (T − 1) ̂︀ 𝜎3 Y ∑︁T t=1(Yt−𝜇Ŷ︀ ) 3 .
I O coeficiente de curtose amostral:
̂︀ K (Y ) = 1 (T − 1)̂︀𝜎4 Y ∑︁T t=1(Yt−𝜇ŷ︀) 4 .
I Sob a hipótese de normalidade (hipótese de que os dados são provenientes de uma distribuição normal), temos que
̂︀
S(Y ) ≈ 𝒩 (0; 6/T ) e K (Y ) ≈ 𝒩 (3; 24/T )̂︀
para T “suficientemente grande”.
I Suponha que {Y1,Y2, . . . ,YT} seja uma amostra aleatória de Y com T
observações. Então, podemos testar
H0: S(Y ) = 0
H1: S(Y ) ̸= 0.
I A estatística da razão t-Student da assimetria amostral é dada por
t = S(Y )̂︀
√︀6/T ≈ 𝒩 (0, 1).
I Rejeitamos H0ao nível 𝛼 de significância se |t| > z𝛼/2, sendo z𝛼/2o
I Para testar o excesso de curstose dos retornos, consideramos
H0: K (Y ) − 3 = 0
H1: K (Y ) − 3 ̸= 0.
I A estatística da razão t-Student da assimetria amostral é
t = K (Y ) − 3̂︀
√︀24/T ≈ 𝒩 (0, 1).
I Rejeitamos H0ao nível 𝛼 de significância se |t| > z𝛼/2, sendo z𝛼/2o
percentil 100(1 − 𝛼/2) da distribuição normal padrão.
I Temos também o teste deJarque e Berapara normalidade com
JB = Ŝ︀ 2(Y ) 6/T + ( ̂︀K (Y ) − 3)2 24/T ≈ 𝜒 2 2 para T “grande”. I Rejeitamos H0(normalidade) se JB > 𝜒⋆ 1−𝛼, sendo 𝜒⋆1−𝛼o percentil 100(1 − 𝛼) da distribuição 𝜒2 2.
Séries temporais
DefiniçãoUmasérie temporalpara dados observados {yt} é uma especificação da distribuição conjunta (ou possivelmente somente de médias e covariâncias)
de uma sequência de variáveis aleatórias {Yt} na qual {yt} é uma
realização.
A distribuição conjunta de uma sequência de variáveis aleatórias
(Y1,Y2, . . . ,YT)pode ser expressa por
Pr(Y16 y1;Y26 y2; · · · ;YT 6 yT), para − ∞ < y1,y2, . . . ,yT < ∞.
Observação: a distribuição conjunta pode conter muitos parâmetros para serem estimados!
Uma alternativa é trabalhar com o primeiro e o segundo momentos: E(Yt)e
E(YtYt+h), t = 1, 2, . . . e h = 0, 1, 2, . . .
Exemplo 1: venda mensal de vinho tinto australiano
(⇒) Mês Milhares de Litros 1980 1982 1984 1986 1988 1990 1992 0.5 1.0 1.5 2.0 2.5 3.0 ● ●● ● ● ● ● ● ● ●●● ● ●● ● ● ● ●● ● ● ●● ● ● ● ●● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●●● ● ● ● ●● ●● ● ● ● ●● ● ● ● ● ●●● ● ● ● ● ●● ● ●● ●●● ●● ● ●● ● ● ●●● ●● ● ● ● ● ●● ● ● ●● ● ● ● ●● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ●● ● ●● ● ●● ●I Vendas em quilolitros de jan/1980 a out/1991 (T = 142 observações).
I Tendência crescente; sazonalidade; altas em julho (inverno); baixas em
Exemplo 2: número de mortes mensais por acidente nos EUA
(⇒) Mês Milhares de Mor tes 1973 1974 1975 1976 1977 1978 1979 7 8 9 10 11 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●I Milhares de mortes de jan/1973 a dez/1978 (T = 72 observações).
I Sazonalidade; altas em julho; baixas em fevereiro.
Exemplo 3: problema de detecção de sinal
● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ●●● ● ●● ● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● 0 5 10 15 20 −2 −1 0 1 2 Tempo Sinal e RuídoExemplo 4: população dos EUA, 1790-1990
(⇒) Ano Milhões de Habitantes 1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 0 20 40 60 80 100 120 140 160 180 200 220 240 ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ●Exemplo 5: número de greves por ano nos EUA, 1951-1980
(⇒) Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 3.5 4.0 4.5 5.0 5.5 6.0 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●Exemplo 6: modelo ruído branco
(⇒)Sequência de variáveis aleatórias Yt com E(Yt) =0 (média zero),
Var(Yt) = 𝜎2< ∞(variância constante) e Cov(Yt,Yt+h) =0 (não
correlacionadas) para t = 1, 2, . . . e h > 1. Notação: Yt ∼ ℛℬ(0, 𝜎2).
Tempo V alor Obser v ado 0 100 250 400 550 700 850 1000 −4 −3 −2 −1 0 1 2 3 4
Exemplo 7: modelo passeio aleatório
(⇒)Soma acumulada de variáveis aleatórias Xt ∼ ℛℬ(0, 𝜎2
)com 𝜎2< ∞. Y0=0 e Yt =X1+X2+ · · · +Xt =Yt−1+Xt, para t = 1, 2, . . . Tempo V alor Obser v ado 0 100 250 400 550 700 850 1000 −20 −10 0 10 20
Modelos com tendência
I Exemplo 8: Rever o exemplo da população dos EUA, 1790-1990. (⇐)
I Apresenta uma tendência quadrática (crescente).
I Aparentemente não existe sazonalidade ou ciclos.
I Podemos sugerir um modelo da forma:
Yt =mt+ 𝜀t,
em que 𝜀t ∼ ℛℬ(0, 𝜎2
)e mt é uma função (contínua) com mudanças suaves.
Para o exemplo acima, podemos sugerir que
mt = 𝛽0+ 𝛽1t + 𝛽2t2
e estimar os parâmetros 𝛽0, 𝛽1e 𝛽2por mínimos quadrados.
(Mostrar exemplo no R: exemplo_08.r) Tabela:Estimativas de mínimos quadrados.
Parâmetro Estimativa Erro Padrão Valor t Valor p
𝛽0 6,95792 1,99853 3,482 0.00266
𝛽1 -2,15987 0,41844 -5,162 6.55e-05 𝛽2 0,65063 0,01847 35,223 < 2e-16
Exemplo 9: nível do lago Huron
(⇒) Ano Nív el 1880 189019001910 192019301940 195019601970 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0 11.0 12.0 ● ● ● ● ● ●● ● ●●● ● ● ● ●● ●● ●● ● ● ●● ● ● ● ●● ●●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ●●● ● ● ● ● ● ● ●●● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●●I Possível tendência linear decrescente.
Exemplo 9: nível do lago Huron - resíduos da regressão linear
Ano Resíduos 1880 189019001910 192019301940 195019601970 −2.5 −2.0 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 2.5 ● ● ● ● ● ●● ● ●●● ● ● ● ●● ●● ●● ● ● ●● ● ● ● ●● ●●● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ●●● ● ● ● ● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ●●I Verifica-se a ausência de tendência nos resíduos.
I Observa-se certa suavidade dos resíduos - indicada por valores
consecutivos somente negativos e outros somente positivos.
Modelos com sazonalidade - regressão harmônica
Suponha que Ytseja uma série temporal sem tendência e com sazonalidade.
Um modelo possível é dado por:
Yt =st+ 𝜀t,
em que 𝜀t∼ ℛℬ(0, 𝜎2
)e st é uma função periódica de t com período d
(st−d=st).
Uma escolha conveniente é dada pela regressão harmônica:
st = 𝛽0+ J ∑︁ j=1 [𝛼jcos(𝜔jt) + 𝛾jsen(𝜔jt)] em que
I 𝛽0, 𝛼je 𝛾j, para j = 1, . . . , J, são parâmetros desconhecidos; e
I 𝜔j, para j = 1, . . . , J, são frequências fixas, cada uma sendo um múltiplo
Exemplo 10: número de mortes mensais por acidente nos EUA
(⇐) I Número de observações: n = 72; I Observações mensais; I Número de harmônicos: k = 2; e I Período: d = 12. Assim, 𝜔1=2𝜋 12 = 𝜋 6 e 𝜔2= 4𝜋 12 = 𝜋 3. Portanto, fazemos I x1t = cos(𝜔1t); I x2t =sen(𝜔1t); I x3t = cos(𝜔2t); e I x4t =sen(𝜔2t) para t = 1, . . . , 72.Finalmente, ajustamos um modelo de regressão por mínimos quadrados.
Modelos com sazonalidade - variáveis binárias
Novamente, temos que
Yt =st+ 𝜀t, em que 𝜀t ∼ ℛℬ(0, 𝜎2)
Agora, seja d a frequência sazonal (período).
Sejam D1t,D2t, . . . ,Ddt as variáveis binárias sazonais tal que
{︂
Djt =1, se o d for o j-ésimo período
Djt =0, caso contrário, para j = 1, 2, . . . , d .
Em qualquer tempo t somente uma das variáveis binárias D1t,D2t, . . . ,Ddt
assume o valor 1 (as restantes 0).
Suponha que d = 12 para dados mensais. Então,
st = ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ 𝛽1, se t =janeiro; 𝛽2, se t =fevereiro; .. . ... 𝛽12, se t =dezembro. = ∑︁12 𝛽jDjt.
Exemplo 11: número de mortes mensais por acidente nos EUA
I Número de observações: T = 72;
I Observações mensais;
I Período: d = 12.
Finalmente, ajustamos um modelo de regressão por mínimos quadrados.
Modelagem de séries temporais
I Examinar as principais características de uma séries temporal através
de seu gráfico:
I tendência; I sazonalidade;
I qualquer mudança brusca no comportamento; e I qualquer valor aberrante (outlier).
I Remover possíveis tendências e sazonalidade para obter uma série
estacionáriados resíduos.
I Transformar os dados se necessário (log(y ),√y ) ou Box-Cox.
I As componentes de tendência e sazonalidade podem ser removidas por
diferenciação, por exemplo substituindo a série {Yt} por
{Wt =Yt− Yt−d} para algum inteiro positivo d .
I O objetivo é sempre obter uma sérieestacionária.
I Escolher um (ou vários) modelo(s) para ajustar a série temporal
(estacionária).
Modelos estacionários e a função de autocorrelação
Uma série temporal {Yt, t = 0, ±1, ±2, . . .} é dita ser estacionária se tiver
propriedades similares a série defasada {Yt+h, t = 0, ±1, ±2, . . .}, para
cada h.
De outra maneira, uma série temporal {Yt} é estritamente estacionária se a
distribuição conjunta de (Yt,Yt+1, . . . ,Yt+k)for identica a
(Yt+h,Yt+1+h, . . . ,Yt+k +h), para todo t, k e h inteiros positivos.
Agora, focaremos nos momentos de primeira e segunda ordens de {Yt}.
Definição:
Seja {Yt} uma série temporal tal que E(Yt) < ∞. A função média de {Yt} é
𝜇Y(t) = E(Yt).
A função de covariância de {Yt} é
𝛾Y(r , s) = Cov(Yr,Ys)=E [(Yr− 𝜇Y(r ))(Ys− 𝜇Y(s))]
Definição:
Dizemos que {Yt} é umasérie temporal (fracamente) estacionáriase
1. 𝜇Y(t) é independente de t, e
2. 𝛾Y(t + h, t) é independente de t para cada h.
Observações:
I Uma série temporal {Yt, t = 0, ±1, ±2, . . .} é estritamente
estacionária se (Y1, . . . ,Yn)e (Y1+h, . . . ,Yn+h)têm a mesma
distribuição conjunta para todos os inteiros h e n > 0.
I Se {Yt} é estritamente estacionária com E(Yt) < ∞para todo t, então
{Yt} também é fracamente estacionária.
I Sempre que usarmos o termo função de covariância com referência a
uma série temporal estacionária {Yt}, estaremos nos referindo na
verdade a função de 𝛾Y, de uma variável, definida por
𝛾Y(h) , 𝛾Y(0, h) = 𝛾Y(t + h, t).
Definição:
Seja {Yt} uma série temporal estacionária.
I Afunção de autocovariância(ACVF) de {Yt} na defasagem h é
𝛾Y(h) = Cov(Yt+h,Yt).
I Afunção de autocorrelação(ACF) de {Yt} na defasagem h é
𝜌Y(h) , 𝛾Y(h)
Exemplo: ruído i.i.d.
Se {Yt} é uma série temporal ruído i.i.d. tal que E(Y2
t) = 𝜎2< ∞, então
1. E(Yt) =0 para todo t; e
2. 𝛾Y(h) =
{︂
𝜎2, se h = 0;
0, se h ̸= 0,
não dependem de t. Logo, {Yt} é estacionária.
Notação: Yt ∼ ℐℐ𝒟(0, 𝜎2).
Exemplo: ruído branco (⇐)
Se {Yt} é uma sequência de variáveis aleatórias não correlacionadas, cada
uma com média 0 e variância 𝜎2, então claramente {Yt} é estacionária com
𝛾Y(h) =
{︂
𝜎2, se h = 0;
0, se h ̸= 0.
Esta sequência é chamada de ruído branco.
Exemplo: passeio aleatório (⇐)
Se {Yt} é um passeio aleatório, então E(Yt) =0 e E(Yt2) = 𝜎
2
t < ∞ para todo t e para h > 0.
E(Yt) = E(Y0) +E(X1) + · · · +E(Xt) =0 + 0 + · · · + 0 = 0
𝛾Y(h) = Cov(Yt+h,Yt) =Cov(Yt +Xt+1+ · · · +Xt+h,Yt) =Cov(Yt,Yt) =t𝜎2.
Exemplo: processo MA(1)
Considere o modelo definido por
Yt = 𝜃𝜀t−1+ 𝜀t, t = 0, ±1, ±2, . . .
em que 𝜀t∼ ℛℬ(0, 𝜎2)e 𝜃 um valor real. Então,
I E(Yt) =E(𝜃𝜀t−1+ 𝜀t) = 𝜃E(𝜀t−1) +E(𝜀t) =0;
I E(Yt2) =E((𝜃𝜀t−1+ 𝜀t)
2
) = 𝜃2E(𝜀2t−1) +2𝜃E(𝜀t−1𝜀t) +E(𝜀
2 t) = 𝜎 2 (1 + 𝜃2); I 𝛾Y(h) = ⎧ ⎨ ⎩ 𝜎2(1 + 𝜃2), se h = 0; 𝜎2𝜃, se h = ±1; 0, se |h| > 1, pois
𝛾Y(1) = Cov(Yt,Yt+1) =Cov(𝜃𝜀t−1+ 𝜀t, 𝜃𝜀t+ 𝜀t+1) = 𝜃Cov(𝜀t, 𝜀t) = 𝜃𝜎2.
Portanto, {Yt} é estacionária.
A função de autocorrelação é 𝜌Y(h) =
⎧ ⎨ ⎩ 1, se h = 0; 𝜃/(1 + 𝜃2 ), se h = ±1; 0, se |h| > 1.
Exemplo: processo AR(1)
Se assumirmos que {Yt} é uma série estacionária satisfazendo a equação
Yt= 𝜑Yt−1+ 𝜀t, t = 0, ±1, ±2, . . .
em que 𝜀t∼ ℛℬ(0, 𝜎2), |𝜑| < 1 e 𝜀t não correlacionado com Ys para cada
s < t, então
I E(Yt) =E(𝜑Yt−1+ 𝜀t) = 𝜑E(Yt−1) +E(𝜀t) =0 pois E(Yt) =E(Yt−1).
I 𝛾Y(h) = Cov(Yt,Yt−h) =Cov(𝜑Yt−1,Yt−h) +Cov(𝜀t,Yt−h) =
𝜑𝛾Y(h − 1) + 0 = 𝜑h𝛾Y(0).
I 𝜌Y(h) =𝛾Y(h)
𝛾Y(0)= 𝜑
|h|,para h = 0, ±1, ±2, . . . pois 𝛾Y(h) = 𝛾Y(−h).
I 𝛾Y(0) = Cov(Yt,Yt) =Cov(𝜑Yt−1+ 𝜀t, 𝜑Yt−1+ 𝜀t) = 𝜑2𝛾Y(0) + 𝜎2 ⇒
𝛾Y(0) = 𝜎
2
Função de autocorrelação amostral
Definição:Sejam {y1,y2, . . . ,yT} observações de uma série temporal.
I A média amostral é dada por
y = 1 T n ∑︁ t=1 yT.
I A função de autocovariância amostral é dada por
̂︀ 𝛾(h) = 1 T T −|h| ∑︁ t=1 (yt+|h|− y )(yt− y ), −T < h < T .
I A função de autocorrelação amostral é dada por
̂︀
𝜌(h) = ̂︀𝛾(h)
̂︀
Observações:
1. O divisor T (não T − |h|) garante que a matriz de autocovariância
amostral ̂︀ΓT , [̂︀𝛾(i − j)]Ti,j=1é não negativa definida.
2. Assim como a matriz de autocovariância amostral, a matriz de
autocorrelação amostral ̂︀RT , [̂︀𝜌(i − j)]T
i,j=1é não negativa definida.
3. As funções de autocovariância e autocorrelação amostrais podem
calculadas para qualquer conjunto de dados {y1,y2, . . . ,yT} e não estão
restritas as séries temporais estacionárias.
4. Em amostras finitas,𝜌(h) é um estimador tendencioso de 𝜌(h). Â︀
tendência é da ordem de 1/T , o que pode ser significativo quando o tamanho amostral T é pequeno.
5. Se {Yt} for uma sequência i.i.d. com E(Y2
t) < ∞, então𝜌(h) é̂︀
assintoticamente normal com média 0 e variância 1/T para todo inteiro positivo e fixo h, isto é, para T suficientemente grande, temos
̂︀
𝜌(h)√T ≈ 𝒩 (0, 1).
Teste de Portmanteau
I Queremos testar H0: 𝜌(1) = 𝜌(2) = · · · = 𝜌(m) = 0 contra H1: 𝜌(j) ̸= 0
para algum j ∈ {1, 2, . . . , m}. I A estatística do teste é Q⋆(m) = T∑︁m j=1[𝜌(j)]̂︀ 2 , (Box e Pierce).
I Sob a hipótese que {Yt} é uma sequência i.i.d. com certas condições
nos momentos, Q⋆(m) tem distribuição assintótica qui-quadrado com m
graus de liberdade.
I Para amostras finitas, podemos aumentar o poder do teste ao considerar
Q(m) = T (T + 2)∑︁m j=1 [𝜌(j)]̂︀ 2 T − j , (Ljung e Box). I Rejeitamos H0se Q(m) > 𝜒m 𝛼, sendo 𝜒m𝛼o percentil 100(1 − 𝛼) da
distribuição qui-quadrado com m graus de liberdade.
Exemplo 12: ruído branco
0 5 10 15 20 25 30 35 40 45 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CFFigura:Estimativa da função de autocorrelação para dados simulados de um processo ruído branco.
Exemplo 13: vendas de vinho tinto australiano
(⇐) 0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CFFigura:Estimativa da função de autocorrelação para os dados de vendas de vinho tinto australiano.
I Com presença de tendência, |𝜌(h)| decrescerá devagar a medida que h cresce.̂︀ I Com presença de sazonalidade, |𝜌(h)| terá uma periodicidade igual da série.̂︀
Exemplo 14: nível do lago Huron
(⇐) 0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CFI Uma função constante parece ser um modelo inapropriado.
I Autocorrelações significativas em três defasagens.
I Exibe um decaimento geométrico. Temos𝜌(2)/̂︀ 𝜌(̂︀1) w 0, 76 ê︀𝜌(3)/𝜌(̂︀2) w 0, 61. Um modelo AR(1) com 𝜑 w 0, 76 parece ser apropriado para os resíduos.
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● −2.5 −1.5 −0.5 0.5 1.5 2.5 −2.5 −1.5 −0.5 0.5 1.5 2.5 e ^ t−1 e^t
I Podemos verificar através do gráfico dê︀et−1ê︀et que existe uma
possível relação linear entre essas duas variáveis.
I Propõe-se o modelo et = 𝛽0+ 𝛽1et−1+ 𝜀⋆
0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF
I Resultado do ajuste do modelo AR(1).
I Ainda parece ter dependência. Propõe-se o modelo
et = 𝛽0+ 𝛽1et−1+ 𝛽2et−2+ 𝜀⋆
0 5 10 15 20 25 30 35 40 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF
I Resultado do ajuste do modelo AR(2).
I As autocorrelações de “todas” as defasagens não são significativas.
Estimação e eliminação das componentes de tendência e sazonalidade
O modelo de decomposição clássica é dado por
Yt =mt+st+ 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2).
Trataremos de duas abordagens para remover tendência e sazonalidade:
1. estimando mt e st; e
Modelo de tendência sem sazonalidade:
Yt =mt+ 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2
).
Método 1: estimação da tendência
(a) Suavização com um filtro de médias móveis finito.Seja q um inteiro não negativo e considere a média móvel de dois lados
Zt = 1 2q + 1 q ∑︁ j=−q Yt−j
Então, para q 6 t 6 n − q, Zt = 1 2q + 1 q ∑︁ j=−q mt−j+ 1 2q + 1 q ∑︁ j=−q 𝜀t−j w mt
se mtfor aproximadamente linear no intervalo [t − q, t + q] e se a média dos
erros neste intervalo estiver próxima de zero. A média móvel portanto nos fornece estimativas
mt = 1 2q + 1 q ∑︁ j=−q Yt−j.
Definimos Yt , Y1para t < 1 e Yt , Ynpara t > n para poder aplicar a
Exemplo 15: número de greves por ano nos EUA
(⇐) Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 3.5 4.0 4.5 5.0 5.5 6.0 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●Ano Milhares de Gre v es 1950 1956 1962 1968 1974 1980 −1.0 −0.5 0.0 0.5 1.0 ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 1 2 3 4 5 6 7 8 9 10 −0.4 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 Defasagem A CF
I Série de resíduos (et =yt−mt̂︀) via médias móveis.
I ACF dos resíduos (sem dependência significativa).
(b) Suavização exponencial. Para qualquer valor fixo 𝛼 ∈ [0, 1], a média
móvel unilateralmt̂︀, t = 1, . . . , n é defindo pelas recursões
̂︀
mt = 𝛼Yt+ (1 − 𝛼)mt−1̂︀
̂︀
m1 = Y1.
(Mostrar exemplo no R: exemplo_16.r)
(c) Ajuste polinomial. Definimos mt como um polinômio em t da forma
mt = 𝛽0+ 𝛽1t + 𝛽2t2+ · · · + 𝛽ktk.
O ajuste pode ser feito por mínimos quadrados. A série temporal sem tendência é dada pelos resíduos da regressão.
Método 2: Eliminação da tendência por diferenciação
O operador diferença ∇ de primeira ordem (ou defasagem 1) é definido por
∇Yt , Yt− Yt−1= (1 − B)Yt
sendo B o operador de defasagem (para trás), BYt , Yt−1.
As potências dos operadores acima são definidas de maneira similar:
I BjYt
, Yt−j, para j > 1; e
I ∇j
Yt = ∇(∇j−1Yt), para j > 1 com ∇0, Yt.
Polinômios em B e ∇ são manipulados de maneira similar as funções polinomiais de variáveis reais.
∇2Yt = ∇(∇Yt) = (1 − B)(1 − B)Yt
= (1 − 2B + B2)Yt =Yt− 2Yt−1+Yt−2
Se mt = 𝛽0+ 𝛽1t, então ∇mt =mt− mt−1= 𝛽0+ 𝛽1t − (𝛽0+ 𝛽1(t − 1)) = 𝛽1.
Se Yt =mt+ 𝜀t sendo mt =∑︀kj=1𝛽jtje 𝜀t, então a aplicação de ∇k resulta
em
∇kYt=k !𝛽k + ∇k𝜀t,
Exemplo 17: população dos EUA
Ano Milhões de Habitantes 1820 1840 1860 1880 1900 1920 1940 1960 1980 −8 −6 −4 −2 0 2 4 6 8 10 ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●Modelos com tendência e sazonalidade
Xt =mt+st + 𝜀t, 𝜀t ∼ ℛℬ(0, 𝜎2) I t = 1, . . . , n; I período d ; I st+d=st; e I ∑︀d j=1sj=0.Método 1: eliminação via médias móveis
Dado a amostra {x1, . . . ,xn}, acomponente de tendênciaé estimada ao
aplicar um filtro de médias móveis especialmente escolhido para eliminar a componente de sazonalidade e diminuir o ruído.
Se o período d for par (d = 2q), então usamos ̂︀
mt = (0, 5xt−q+xt−q+1+ · · · +xt+q−1+0, 5xt+q)/d , q < t 6 n − q.
O segundo passo é estimar acomponente sazonal. Para cada k = 1, . . . , d ,
calculamos a médias 𝜔k dos desvios {(xk +jd−mk +jd),̂︀ q < k + jd 6 n − q}.
Visto que estes desvios não necessariamente somam zero, estimamos a
componente sazonal sk como
̂︀sk = 𝜔k− 1 d d ∑︁ i=1 𝜔i, k = 1, . . . , d ê︀sk =̂︀sk −d, k > d .
A série com asazonalidade removidaé dada por
zt =xt−̂︀st, t = 1, . . . , n.
Finalmente, reestimamos a componente de tendência por um dos métodos
já apresentados usando a série zt. A série de ruídos é dada por
̂︀
𝜀t =xt−mt̂︀ −̂︀st, t = 1, . . . , n.
Método 2: eliminação por diferenciação
Defina ooperador diferença de defasagemd como
∇dXt =Xt− Xt−d= (1 − Bd)Xt.
Não confundir com ∇d = (1 − B)d.
Aplicando o operador ∇d ao modelo,
Xt =mt+st+ 𝜀t,
sendo que {st} tem período d , obtemos
∇dXt =mt− mt−d+ 𝜀t− 𝜀t−d,
que resulta em uma nova série ∇dXtcom tendência (mt− mt−d)e ruído
(𝜀t− 𝜀t−d).
A componente de tendência pode então ser removida pelos métodos descritos anteriormente, em particular pela aplicação da série de potências de ∇.