Método 9: Extensão do algoritmo de Durbin-Levinson
3. Estimação dos parâmetros dos processos de memória longa
3.1. Estimação semi-paramétrica
3.1.1. Métodos locais
3.1.1.1. Estimadores do tipo GPH
Estimador GPH
Seja {Xt} um processo ARFIMA(p, d, q), isto é um processo linear que satisfaz a igualdade
Q(BX\-BYX, =®{B)st
para d ei- - , - [ onde {s,} é um ruído branco. 2 2
A função de densidade espectral deste processo é dada pela expressão:
/M = />í2 s i n U^
\^J•2d
onde/» é a função de densidade espectral de um processo ARMA(p, q).
SejamX,,..., X„, n observações de {X,}. O periodograma I(o>) é definido pela expressão
ú)e[-7r, n\
»-i
l(a>) = — R(0)+ 2 ^ R(s)cos(sa>) In s=\
sendo R(s) a função de auto-covariância amostrai,
R(s) = -:Z{XI-Xlxi+S-X} s = 0,±l,...,±(n-\),
n ,=,
onde X é a média amostrai.
log[/k)]=log(/„(0))-^log 2sin co,
2 ,
+ log-ÍM
/.(O)<^ log /(ó)y ) = log fu (O) - d log 2 sin
Se m for escolhido de tal forma que
m ■>o, as frequências de Fourier
Ú)J=- 2jg ->0. Então, o termo log /.(O) é desprezável. Logo,
log/(«J* log/„(())-</log
Considere-se a regressão linear
2 sin , 2 , /(«>;)
7R
+ log j J\, j = \,2,...,m onde Yj = a + bXj + ej, j=\,...,m Yj= log l(û)j), X;= l o g 2 sinJ J
a = log/„(0) - c, è = - d, e} = log + c e c = £,og7R
Aplicando o método dos mínimos quadrados à equação de regressão linear (3. 3) obtém-se m i —\ M lGPH
ti*!-*)2
7 = 1 (3.2) (3.3)Geweke & Porter-Hudak (1983) propuseram m = na, 0 < a < 1.
Suponha-se que {X,} é um processo estacionário Gausseano com </e]-0.5, 0.5[. Hurvich et al. (1998) obtiveram expressões para o viés, a variância e EQM assimptóticos de dGPH em
função do número de ordenadas do periodograma usadas na regressão. Além disso provaram a consistência do estimador e estabeleceram a sua normalidade assimptótica.
Sejam m o número de observações usadas na regressão linear e n a dimensão da amostra.
m rrüogm
Pressuposto 3.1.2: /j(o) = 0, \fM <B2 <«> e | / ; M | < * 3 < « > / « " '«*> ° « ™ vizinhança de zero.
Teorema 3.1.1: (Hurvich et al. (1998)) Suponha-se que os pressuposto 3.1.1 e 3.1.2 são
válidos. Então, r\dGm -d)=- 2x2 / ; ( 0 ) m; 9 /„(0)«2 + o 1 m Kn2 j + 0 ' log m ' V m / var Í3 \ *24/n 2 r n Vw; EgM \dGPH)=E\dGPH-a) - o, )f(0)\ n* 24m 1 n (log3 Jwjl + o
'm
4ï m
+ o v " y \mCorolário 3.1.1: (Hurvich et ai. (1998)) Suponha-se que os pressupostos 3.1.1 e 3.1.2 são
válidos. Então o estimador dGPH é um estimador consistente de d.
Como a escolha de m influencia o viés, a variância e o erro quadrático médio do estimador dGPH, convém usar um valor de m que minimize o EQM. Hurvich et ai. (1998) chegaram à
conclusão de que a escolha óptima para m é
ont
m y =
r 27 ^
128/r2 v
/;(°)y
desde que / ; ( 0 ) * 0 .
Com esta escolha de m, o EQM(dGPH ) é O í j \
n5
v y
No entanto, o mop' não pode ser calculado na prática porque é preciso conhecer a verdadeira
função de densidade espectral.
4A Teorema 3.1.2: (Hurvich et ai. (1998)) Se m = o\n
4^{d
GPH-d)-^N
e log(n) = o(m) então,
Estimador de Reisen
Reisen (1994) propôs um novo estimador para d, dsp,o qual é obtido usando o mesmo
processo eom que foi obtido o estimador dGPH, mas em vez de se usar o periodograma I{co\ o
qual não é um estimador consistente da função de densidade espectral, vai-se usar o periodograma amaciado
onde Mu) é o gerador da janela de Parzen definida pela expressão
Portanto, onde k(u) = \-6u2 +6\u\
2(l-HT
i i 1 \u\<- 1 ' 2- < y < i
2 ' 'W>i
A = - —t&j-xfo
±{xt-xj
Xy=log 2 sin — i mYj=\ogf
s(e>j)*
x =-,
yL
XJ
m j=\ Reisen (1994) mostrou que para d < 0 e para <y# 0, n,var(<îj« 0.53928- M (3.4)
í=i
M, geralmente designado por "ponto de truncamento", é função de n e deve ser escolhido de
forma a que à medida que n -> -o, M-+ co e ^ -» 0. Reisen (1994) usou m = n" (0 < a < 1)
Estimador "pooled"
)
Observando (3.1), constata-se que o periodograma nas frequências altas &(s- m+1,...,
continua a conter informação sobre d, embora /„(**), nestes casos, deixe de poder ser considerada uma constante. Portanto, a regressão usual que se baseia no logaritmo do periodograma pode estar a pôr de parte alguma informação sobre as observações. Pode-se corrigir esta situação usando mais intervalos de frequências, além daquele que corresponde a
uma vizinhança de zero e em simultâneo permitir a variação de/„(»).
O método de obtenção do estimador de d, dpooled baseia-se na regressão do logaritmo do
periodograma usando um maior número de frequências de Fourier, û>, = — , J = 1, - , TL
c o m L - > oo e — -> O, sendo T o número de ordenadas do periodograma usadas na n
regressão para a obtenção de dGPH.
Seja {Xt} um processo estacionário Gausseano de memória longa com função de densidade
espectral M °n d e " * < d < V> Q^a) é U i m fonÇã° S i I n é t r i C a , ^ ^ ^ ^ ^ ^
positiva, contínua, limitada em todo o seu domínio, excepto em zero, e com derivada de terceira ordem finita. No domínio do tempo {Ai} tem a forma (1 - B)dXt = ut onde {ut} é uma
série temporal estacionária com função de densidade espectral/^©).
Usando uma representação do logaritmo do periodograma diferente da que foi usada no caso do estimador dGPH obtém-se a expressão:
\n(l(cos)) = \n(fu(tos)) -2dhi
= Info
(AJ-2dta 2 sin
l-e Ki), + ln / ( » . ) . ' » >
u
+ lniM]. JfJaã
) + ln v, ; +in —r—-TfM) \JMJ)
, CUS e Bj, (3. 5) onde sendo 7 ( ^ ) = |M<^)|2 *J inn i=\Bj =
W-
À>-ã<m'*x'+™
\"-
î0<°'*Ti\
^ o = 0 , 7 = 0 são os conjuntos de frequências de Fourier que vão ser usados.Esta representação permite que as frequências de a* onde o periodograma é calculado estejam na vizinhança de um conjunto de frequências Xj para; = 0, 1,..., f-\, onde f é o parâmetro que determina o número total de conjuntos distintos de frequências de Fourier que vão ser
usados.
Shimotsu & Phillips (2002) propuseram estimar o parâmetro d em (3. 5) através de uma regressão linear usando L+í conjuntos B0, .... BL, onde L é um número tal que à medida que
n -> oo, L -> oo e L /T —» 0. Escrevendo (3. 5) da forma Ysj= jUj + dXsj + T]Sj + Esj, s=l,..., T; j = 0,1,..., L com para c^eBj e 4sin 'd>V> v 2 y , 7 »= l n
7KÏ
. ^ = l n,/k) -v(i)
/ /y= l n /a( ly) + ç / ( l )onde ^(l) = r'(l) = - y = -0.57721566... sendo ya constante de Euler. Obtém-se o estimador dpooled através da seguinte expressão
/=o Spooled L . \~ ' ~J
Ií,;
jjcffl.eSjl ffl,
S,lfc"
J^
ondex = - y x = - - y in
4sin ' I D . V * V ^ Jonde </ é o estimador de d obtido usando apenas o conjunto Bj.
Notar que à medida que a dimensão da amostra n aumenta, dpooled usa um número cada vez
maior de conjuntos Bj, j = 0, ..., L. No entanto, este estimador continua a usar apenas as TL
pertence à classe dos estimadores semi-paramétricos e em simultâneo usa um número crescente de conjuntos Bj. Pressuposto 3.1.3: r -> «, »->*>, — = — ; T* T\nT In2 H Pressuposto 3.1.4: — + — — + — > u • ->0 Pressuposto 3.1.5:
/„'(0) = 0, / » > C 0 >0, | /H' H < C , < ^ , | / ; H < C2 < o o , | / ; H < C3 < co, Va, e [O, *]
Nos dois teoremas seguintes vai-se assumir que n = 277* com T e f inteiros, sendo portanto, f definido pela igualdade f = nl{2T) ( quando « é par). Logo, qualquer escolha de T afecta a amplitude dos intervalos considerados na definição dos conjuntos Bh a sua velocidade de
contracção e o número de conjuntos Bj usados na regressão.
Teorema 3.1.3: (Shimotsu & Phillips (2002;; Se os pressupostos 3.1.3 - 3.1.5 se verificam,
então
-n
2f;{0)T
2L
7\dpooled -d ) = ÍT2L\ V n J 6(1 + 3 ) / » n2 [d pooled h 24(i + s j r + °[T + 0^in
3r^
V T j EQM\dpooled)= xA Í/;(O)V rt236(1 + S)
2U(0)J "
424(1+ H)r
+ o'r
4z,
n + o v " y^in
6r^
. T2 + 0 rTL\n3T^ f\ \ + o T) ondeS = X[-y(i + lXlnO' + l)-lny)
2+l]* 0,0803.
7=1
Notar que o EQM tende para zero à medida n -> oo e portanto dpooled é um estimador
consistente.
A variância assimptótica deste estimador é inferior à variância assimptótica do estimador GPH, reflectindo o grande número de ordenadas do periodograma que são usadas na
regressão. No entanto, o estimador dpookd apresenta um viés assimptótico mais elevado que o
estimador GPH devido ao facto de/„(ó>) não ser constante nos conjuntos Bj para; > 0.
Através de um estudo simulado, usando amostras de dimensão finita, realizado por Shimotsu & Phillips (2002) verificou-se que o estimador dpooled é melhor que o estimador GPH quando
fu(a>) tem "picos" perto da origem e tem um desempenho pior quando fu(oJ) muda
monoticamente de Ó>= 0 para 6>= n, embora a diferença seja pequena.
O teorema seguinte estabelece a normalidade assimptótica do estimador dpooled.
Teorema 3.1.4: (Shimotsu & Philips (2002;; Suponha-se que os pressupostos 3.1.3-3.1.5 se
verificam. Além disso, se T = O(n0S-£)para algum e>0eL = O(ln f), tem-se
4r{d
pooled-d\-i-+.
24(1 +S)y
Estimador dr
Seja {X,} um processo Gausseano estacionário de memória longa com função de densidade espectral
g(o)) = \co[2d gu{co),
onde -V2< d < lÁ e gu(.) é uma função par em [-n, n\ que é contínua em zero com
0 < g„(0) < oo e g(co) é integrável em ]-K, 4 -
O estimador descrito nesta subsecção é um estimador do parâmetro de memória longa d, dr e
é definido como sendo o coeficiente de -21og(q) sendo obtido através do método dos mínimos quadrados aplicado à regressão do logaritmo do periodograma, log Ij calculado em oi, numa constante, e m ^ e of, ^,..., ofr para; = 1,..., m (sendo m um inteiro positivo tal
que m<\- e n é a dimensão da amostra) e para algum inteiro não negativo r, onde
(Q.- ?^L, sendo n a dimensão da amostra e X} = -21og(6^).
; n
O termo dominante da expressão do viés do estimador dGPH (teorema 3.1.1) resulta do termo
log
/.(O)
Supondo que o pressuposto 3.1.2 se verifica, obtém-se através da expansão em série de Taylor a igualdade
1 0 8
U(0) 2 /.(O) '''
É o primeiro termo que se encontra do lado direito da igualdade anterior que é responsável pelo termo dominante do viés do estimador dGPH. Este termo pode ser eliminado através da
adição de cq ao modelo de regressão linear
'fM,r
log/, =log/(<»J)=(log/;(0)-C)-2<ff, +log
/.(o)
+ £, (3.6)onde
e, =log + C,
X7= l o g 2sin —
e C = 0.577216... é a constante de Euler.
Além disso, termos de viés adicionais podem ser eliminados através da adição dos termos af,..., <92r para r > 2 ao modelo de regressão linear (3. 6).
Quando r = 0, dr é assimptóticamente equivalente ao estimador dGPH.
Vai-se assumir que a mnção gu é "suave" de ordem s na frequência zero. Seja [s] a parte
inteira de s. Uma fimção real h definida na vizinhança de zero é "suave" de ordem s > 0 em zero se h é [s] vezes continuamente diferenciável em alguma vizinhança de zero e as suas derivadas de ordem [s] denotadas por hls] satisfazem a condição
h^(co)-h^(0]<c\co\s-[s]
para alguma constante c < oo e para todo o ^ n a vizinhança de zero.
Pressuposto 3.1.6: m = m(n) -> œ e m ->0.
Pressuposto 3.1.7: gu é uma função par em [-n, n] que é "suave" de ordem s em zero para
O pressuposto anterior permite a seguinte representação em série de Taylor em torno de zero de \og(gu(cq)) até ao termo [*]:
log
gÁ°))h
^k\ ' v Jj sl2\ h l \ (2k)\ J V J k=\ min{[£/2],/-} LÛ (2k)i
J J (3.7) (3.8) (3.9) onde * , = [s/2] i=min{p72],/•}+! J~Lk (2*)! cof +0(a)sj) = l{s>2 + 2r) /2+2r (2 + 2r)-fl»r+o(<)
sendo a - min{j, 4 + 2r}, 6à = —-F log gu (co) |ffl=0 e 1 representa a função indicatriz6.dû)
0(.) verifica-se uniformemente para/ = 1,..., m e para todo o n.
Se s é um inteiro, então (3. 7) - (3. 9) verificam-se com <9(.) substituído por o(.). Seja Qkj = af onde 0)j = paray = 1,..., mek=l,2,
Sejam log /, X, Qk, Res vectores coluna de dimensão m cujos y-ésimos elementos são log Ij,
Xj, Qk,j, Rj e ej, respectivamente, onde ej =log-^- + C (C = 0.577216... é a constante de
Euler) e gj = g(cq). Seja Q a matriz mxr cuja &-ésima coluna é Q2k para fc=l,..., r. Seja 1OT um
vector coluna de uns de dimensão m e seja b o vector coluna de dimensão r cujo &-ésimo
elemento é b2iJ(2k)\ para k = 1,..., min- ,r > e 0 para & = min• r\+\,...,r.
Combinando (3. 9) com(3. 6) ( com/„ substituído porgu e -2X} p o r ^ ) obtém-se:
Sejam
onde
\ogI = (\oggu(0)-Ch+^d + Qb + R + e
X*=X-\mXeQ*=Q-\mQ'
(3.10)
X = -Xt\mzQ=-Q'\m.
m m A igualdade (3. 10) é equivalente ao modelo de regressão linear
logI = Klm+X*d + Q*b + R + e (3.11)
onde
K = hgg(o)-C + Xd + Q'b.
O estimador de d, dr, é o coeficiente de X* obtido pelo método dos mínimos quadrados
aplicado à regressão do log(7) em \m, X e Q :
dr={xtíMQ.Xt)XXttMQAogI
onde
Me.=Im-Q*(Q«Q')-lQ\
sendo lm a matriz identidade m x m.
(Para r = 0, defina-se MQ. =Im).
O valor esperado de dr é dado pela expressão
E(d
r)= d +
[X*'MQ.X'Y X*'M
(f{R + E(e)).
O termo Q*b de (3. 11), o qual inclui termos afk para k = 1, ..., min{[.s/2], r) na expansão em í,
série de Taylor de log não aparece na igualdade anterior porque é eliminado pela «,(0)
inclusão de Q* na regressão (3. 11). Consequentemente, o viés de dr é de ordem inferior
relativamente ao viés de dGPH .
Seja fir um vector coluna de dimensão r cujo A>ésimo elemento é
2 k Ir 1 ' (2k + lf
e seja 77 uma matriz rxr cujo elemento (/, k) é
kk>+a+i|£+i)la+i)p"u"1--r-
Para r = 0 defina-se jur = 0 e 77 = 1 •
Defina-se a quantidade cr que vai ser usada nas expressões da variância e do viés do
estimador dr , no próximo teorema, através da expressão
Seja Çr um vector coluna de dimensão r cujo £-ésimo elemento é 2k(3 + 2r) hrk ~ {ir + 2k + 3X2À: + l) para& = 1,..., r. Defina-se (2x)2+2r(2 + 2r)cr( , x ~ 2 ( 3 + 2r)!(3 + 2 r )1 ^ ' ^ "
Considere-se o teorema seguinte que estabelece as expressões assimptóticas para o viés e para a variância do estimador dr.
Teorema 3.1.5: (Andrews & Guggenberger (2003)) Suponha-se que os pressupostos 3.1.6 e
3.1.7 se verificam. Então, a) E(dr-d)=\(s>2 + 2r)trb2+2r^(l + o(l))+0 rm^ \n J + 0 (\ 3 A log m v m J n1 cr b) \w\dr)= í o v ; 24 m Km,
Se s é um inteiro, a alínea a) verifica-se com O
ím^
\n J
substituído por o fm^
\n J
. Em
particular, de s = 2 + 2r, a alínea a) verifica-se com O
í a\ m yn j substituído por (m"^ yn j í 2+2r A ' m
, „
2+2r \n JComparando os resultados deste teorema com o teorema 3.1.1. verifica-se que o viés do estimador dr converge mais rapidamente para zero que o viés do estimador dGPH, enquanto
que a variância destes dois estimadores difere apenas por uma constante multiplicativa cr.
A escolha óptima de m, isto é, a escolha de m que maximiza a convergência para zero do EQMé m ~ n 20/(2^+1) onde <f> = min{s, 2 + 2r) m~ n 20/(20+1) significa que
n m
2^/(2^+1)
converge para uma constante positiva finita à medida que n - * o .
Suponha-se que m oc «rpara algum 0 < / < l e s > 2 + 2r. Então, o EQM de dr é: 4+4r EQM(l)=T2rbl2r^(l + o(l)) + O n n ) K Cr + ^ ( U o ( l ) ) 24 w
Se f > (2 + 2r)l (3 + 2r), então o termo 0(.) na expressão anterior é de ordem inferior relativamente aos outros dois termos. Ignorando #(.), o valor de m que minimiza o EQM é dado pela expressão
V _ 2 _ y/(5+4r) ™opt = 7T2Cr 24(4 + 4 r »2 2 + .n (4+4r)/(5+4r 2r J onde [A] representa a parte inteira de A.
A expressão anterior traduz a escolha óptima de m apenas quando xr # 0, b2+2r ^ 0 e cr< c o .
Pressuposto 3.1.8: m = o{nu,{2*+x)), onde (j> = min{s, 2 + 2r}, s > 1, e s é da mesma forma
que no pressuposto 3.1.7.
Teorema 3.1.6: (Andrews & Guggenberger (2003)) Suponha-se que os pressupostos 3.1.7 e
3.1.8 são válidos. Então,
4m\^
r-dj-
->N ( n0 , — c2 ^ r24 quando n—>oa
Estimador de Robinson
Nesta secção vai-se estudar a estimação de modelos de séries temporais múltiplas, os quais permitem que elementos da matriz de densidade espectral tendam para infinito ou para zero na frequência zero.
SejaX, um vector de dimensão G comg-ésimo elemento Xgh g = 1,..., G. Vai-se assumir que
Xt tem matriz de densidade espectral dada por
O (g, h) - ésimo elemento d e / i » é a densidade espectral cruzada deXg/ eXht quando g*he
é denotada por fgh{oo). O g-ésimo elemento da diagonal deJ[ú)),fgg(oo) é a função de densidade
espectral de Xgt.
Para Cg, dg satisfazendo 0 < Cg< oo, - lÁ < dg < Vi, assuma-se que à medida que a>-+ 0+
fM~
ci
CO-2d,
para g = 1,..., G. O símbolo "~" significa que
Cga>
tende para 1.
O periodograma de Xgh t = 1,..., « é 4(<y), g - 1,..., G.
Seja J um inteiro fixo maior ou igual a 1. Defina-se
Y^-loglpM+j-À, g=h~,G, k=l + J,l + U,..,
m.Na teoria assimptótica, à medida que n tende para infinito, / e m também tendem para infinito e Um -> 0.
T , • • m ~ l > ■ 4- •
Vai-se assumir que e um inteiro.
Definam-se as variáveis não observáveis Ugy por
Y(p=c^-dg{2\ogcok)+U^ , g=l,...,G, k=l + J,l + U,...,m,
onde
4J )= l o g Cg+ ^ ( j )
sendo y/a função digama definida pela igualdade y/(z)=—logT(z).
dz
Os estimadores de c{j) = (c\J\ ..., c^j e d = (d\, ..., dG)' obtidos pelo método dos mínimos
quadrados são c 'J' e d^' dados por
= vec^'Z^(z^'Z^y}
7.-(■>)
d (J)
Empilhando as colunas de uma matriz quadrada L = [L^ J. ; umas em cima das outras, pode-se definir
onde 2P = (ZM, Zl+2J ..., Zm)\ Y* = (Y^, ..., YG(\ Zk = (1, - 21og(û*))' e Y(J) _ (y(J) yC) yiJ) Y
Jg ~\Ig,l+J> ÂgJ+2J> — ' Jg, m) •
:(J)
Seja cg( ' o g-ésimo elemento de c{ '. Cg pode ser estimado através da igualdade