Estimadores do tipo GPH

Método 9: Extensão do algoritmo de Durbin-Levinson

3. Estimação dos parâmetros dos processos de memória longa

3.1. Estimação semi-paramétrica

3.1.1. Métodos locais

3.1.1.1. Estimadores do tipo GPH

Estimador GPH

Seja {Xt} um processo ARFIMA(p, d, q), isto é um processo linear que satisfaz a igualdade

Q(BX\-BYX, =®{B)st

para d ei- - , - [ onde {s,} é um ruído branco. 2 2

A função de densidade espectral deste processo é dada pela expressão:

/M = />í2 s i n U^

\^J

•2d

onde/» é a função de densidade espectral de um processo ARMA(p, q).

SejamX,,..., X„, n observações de {X,}. O periodograma I(o>) é definido pela expressão

ú)e[-7r, n\

»-i

l(a>) = — R(0)+ 2 ^ R(s)cos(sa>) In s=\

sendo R(s) a função de auto-covariância amostrai,

R(s) = -:Z{XI-Xlxi+S-X} s = 0,±l,...,±(n-\),

n ,=,

onde X é a média amostrai.

log[/k)]=log(/„(0))-^log 2sin co,

2 ,

_{+ log-}

ÍM

/.(O)

<^ log /(ó)y ) = log fu (O) - d log 2 sin

Se m for escolhido de tal forma que

m _■>o, as frequências de Fourier

Ú)J=- 2jg ->0. Então, o termo log /.(O) é desprezável. Logo,

log/(«J* log/„(())-</log

Considere-se a regressão linear

2 sin , 2 , /(«>;)

7R

+ log j J\, j = \,2,...,m onde Yj = a + bXj + ej, j=\,...,m Yj= log l(û)j), X;= l o g 2 sin

J J

a = log/„(0) - c, è = - d, e} = log + c e c = £

,og7R

Aplicando o método dos mínimos quadrados à equação de regressão linear (3. 3) obtém-se m i —\ M lGPH

**ti!-)**2

7 = 1 (3.2) (3.3)

Geweke & Porter-Hudak (1983) propuseram m = na, 0 < a < 1.

Suponha-se que {X,} é um processo estacionário Gausseano com </e]-0.5, 0.5[. Hurvich et al. (1998) obtiveram expressões para o viés, a variância e EQM assimptóticos de dGPH em

função do número de ordenadas do periodograma usadas na regressão. Além disso provaram a consistência do estimador e estabeleceram a sua normalidade assimptótica.

Sejam m o número de observações usadas na regressão linear e n a dimensão da amostra.

m rrüogm

Pressuposto 3.1.2: /j(o) = 0, \fM <B2 <«> e | / ; M | < * 3 < « > / « " '«*> ° « ™ vizinhança de zero.

Teorema 3.1.1: (Hurvich et al. (1998)) Suponha-se que os pressuposto 3.1.1 e 3.1.2 são

válidos. Então, r\dGm -d)=- 2x2 / ; ( 0 ) m; 9 /„(0)«2 + o 1 m Kn2 j + 0 ' log m ' V m / var Í3 \ *_24/n2 r n Vw; EgM \dGPH)=E\dGPH-a) - o, )f(0)\ n* 24m 1 n (log3 Jwjl + o

'm

ï m

_{+ o} v " y \m

Corolário 3.1.1: (Hurvich et ai. (1998)) Suponha-se que os pressupostos 3.1.1 e 3.1.2 são

válidos. Então o estimador dGPH é um estimador consistente de d.

Como a escolha de m influencia o viés, a variância e o erro quadrático médio do estimador dGPH, convém usar um valor de m que minimize o EQM. Hurvich et ai. (1998) chegaram à

conclusão de que a escolha óptima para m é

ont

m y =

r 27 ^

128/r2 _v

/;(°)y

desde que / ; ( 0 ) * 0 .

Com esta escolha de m, o EQM(dGPH ) é O í j \

v y

No entanto, o mop' não pode ser calculado na prática porque é preciso conhecer a verdadeira

função de densidade espectral.

4A Teorema 3.1.2: (Hurvich et ai. (1998)) Se m = o\n

4^{d

GPH

-d)-^N

e log(n) = o(m) então,

Estimador de Reisen

Reisen (1994) propôs um novo estimador para d, dsp,o qual é obtido usando o mesmo

processo eom que foi obtido o estimador dGPH, mas em vez de se usar o periodograma I{co\ o

qual não é um estimador consistente da função de densidade espectral, vai-se usar o periodograma amaciado

onde Mu) é o gerador da janela de Parzen definida pela expressão

Portanto, onde k(u) = \-6u2 +6\u\

2(l-HT

i i 1 \u\<- 1 ' 2

- < y < i

2 ' '

W>i

A = - —

t&j-xfo

±{xt-xj

Xy=log 2 sin — i m

Yj=\ogf

(e>j)*

x =

-,

L

J

m j=\ Reisen (1994) mostrou que para d < 0 e para <y# 0, n,

var(<îj« 0.53928- M (3.4)

í=i

M, geralmente designado por "ponto de truncamento", é função de n e deve ser escolhido de

forma a que à medida que n -> -o, M-+ co e ^ -» 0. Reisen (1994) usou m = n" (0 < a < 1)

Estimador "pooled"

)

Observando (3.1), constata-se que o periodograma nas frequências altas &(s- m+1,...,

continua a conter informação sobre d, embora /„(**), nestes casos, deixe de poder ser considerada uma constante. Portanto, a regressão usual que se baseia no logaritmo do periodograma pode estar a pôr de parte alguma informação sobre as observações. Pode-se corrigir esta situação usando mais intervalos de frequências, além daquele que corresponde a

uma vizinhança de zero e em simultâneo permitir a variação de/„(»).

O método de obtenção do estimador de d, dpooled baseia-se na regressão do logaritmo do

periodograma usando um maior número de frequências de Fourier, û>, = — , J = 1, - , TL

c o m L - > oo e — -> O, sendo T o número de ordenadas do periodograma usadas na n

regressão para a obtenção de dGPH.

Seja {Xt} um processo estacionário Gausseano de memória longa com função de densidade

espectral M °n d e " * < d < V> Q^a) é U i m fonÇã° S i I n é t r i C a , ^ ^ ^ ^ ^ ^

positiva, contínua, limitada em todo o seu domínio, excepto em zero, e com derivada de terceira ordem finita. No domínio do tempo {Ai} tem a forma (1 - B)dXt = ut onde {ut} é uma

série temporal estacionária com função de densidade espectral/^©).

Usando uma representação do logaritmo do periodograma diferente da que foi usada no caso do estimador dGPH obtém-se a expressão:

\n(l(cos)) = \n(fu(tos)) -2dhi

= Info

(AJ-2d

ta 2 sin

l-e Ki), + ln / ( » . ) . ' » >

u

+ ln

iM]. JfJaã

) + ln v, ; +in —r—-T

fM) \JMJ)

, CUS e Bj, (3. 5) onde sendo 7 ( ^ ) = |M<^)|2 *J inn i=\

Bj =

W-

À>-ã<m'*x'+™

\"-

î0<

**°'*Ti\**

^ o = 0 , 7 = 0 são os conjuntos de frequências de Fourier que vão ser usados.

Esta representação permite que as frequências de a* onde o periodograma é calculado estejam na vizinhança de um conjunto de frequências Xj para; = 0, 1,..., f-\, onde f é o parâmetro que determina o número total de conjuntos distintos de frequências de Fourier que vão ser

usados.

Shimotsu & Phillips (2002) propuseram estimar o parâmetro d em (3. 5) através de uma regressão linear usando L+í conjuntos B0, .... BL, onde L é um número tal que à medida que

n -> oo, L -> oo e L /T —» 0. Escrevendo (3. 5) da forma Ysj= jUj + dXsj + T]Sj + Esj, s=l,..., T; j = 0,1,..., L com para c^eBj e 4sin 'd>V> v 2 y , 7 »= l n

7KÏ

. ^ = l n

,/k) -v(i)

/ /y= l n /a( ly) + ç / ( l )

onde ^(l) = r'(l) = - y = -0.57721566... sendo ya constante de Euler. Obtém-se o estimador dpooled através da seguinte expressão

/=o Spooled L . \~ ' ~J

Ií,;

jjcffl.eSjl ffl

,

,lfc"

^

onde

x = - y x = - - y in

4sin ' I D . V * V ^ J

onde </ é o estimador de d obtido usando apenas o conjunto Bj.

Notar que à medida que a dimensão da amostra n aumenta, dpooled usa um número cada vez

maior de conjuntos Bj, j = 0, ..., L. No entanto, este estimador continua a usar apenas as TL

pertence à classe dos estimadores semi-paramétricos e em simultâneo usa um número crescente de conjuntos Bj. Pressuposto 3.1.3: r -> «, »->*>, — = — ; T* T\nT In2 H Pressuposto 3.1.4: — + — — + — > u • ->0 Pressuposto 3.1.5:

/„'(0) = 0, / » > C 0 >0, | /H' H < C , < ^ , | / ; H < C2 < o o , | / ; H < C3 < co, Va, e [O, *]

Nos dois teoremas seguintes vai-se assumir que n = 277* com T e f inteiros, sendo portanto, f definido pela igualdade f = nl{2T) ( quando « é par). Logo, qualquer escolha de T afecta a amplitude dos intervalos considerados na definição dos conjuntos Bh a sua velocidade de

contracção e o número de conjuntos Bj usados na regressão.

Teorema 3.1.3: (Shimotsu & Phillips (2002;; Se os pressupostos 3.1.3 - 3.1.5 se verificam,

então

-n

f;{0)T

L

7\dpooled -d ) = ÍT2L\ V n J 6(1 + 3 ) / » n2 [d pooled h 24(i + s j r + °[T + 0

^in

r^

V T j EQM\dpooled)= xA Í/;(O)V rt2

36(1 + S)

U(0)J "

24(1+ H)r

+ o

'r

z,

n + o v " y

^in

r^

. T2 + 0 rTL\n3T^ f\ \ + o T) onde

S = X[-y(i + lXlnO' + l)-lny)

+l]* 0,0803.

7=1

Notar que o EQM tende para zero à medida n -> oo e portanto dpooled é um estimador

consistente.

A variância assimptótica deste estimador é inferior à variância assimptótica do estimador GPH, reflectindo o grande número de ordenadas do periodograma que são usadas na

regressão. No entanto, o estimador dpookd apresenta um viés assimptótico mais elevado que o

estimador GPH devido ao facto de/„(ó>) não ser constante nos conjuntos Bj para; > 0.

Através de um estudo simulado, usando amostras de dimensão finita, realizado por Shimotsu & Phillips (2002) verificou-se que o estimador dpooled é melhor que o estimador GPH quando

fu(a>) tem "picos" perto da origem e tem um desempenho pior quando fu(oJ) muda

monoticamente de Ó>= 0 para 6>= n, embora a diferença seja pequena.

O teorema seguinte estabelece a normalidade assimptótica do estimador dpooled.

Teorema 3.1.4: (Shimotsu & Philips (2002;; Suponha-se que os pressupostos 3.1.3-3.1.5 se

verificam. Além disso, se T = O(n0S-£)para algum e>0eL = O(ln f), tem-se

4r{d

pooled

-d\-i-+.

24(1 +S)y

Estimador dr

Seja {X,} um processo Gausseano estacionário de memória longa com função de densidade espectral

g(o)) = \co[2d gu{co),

onde -V2< d < lÁ e gu(.) é uma função par em [-n, n\ que é contínua em zero com

0 < g„(0) < oo e g(co) é integrável em ]-K, 4 -

O estimador descrito nesta subsecção é um estimador do parâmetro de memória longa d, dr e

é definido como sendo o coeficiente de -21og(q) sendo obtido através do método dos mínimos quadrados aplicado à regressão do logaritmo do periodograma, log Ij calculado em oi, numa constante, e m ^ e of, ^,..., ofr para; = 1,..., m (sendo m um inteiro positivo tal

que m<\- e n é a dimensão da amostra) e para algum inteiro não negativo r, onde

(Q.- ?^L, sendo n a dimensão da amostra e X} = -21og(6^).

; n

O termo dominante da expressão do viés do estimador dGPH (teorema 3.1.1) resulta do termo

log

/.(O)

Supondo que o pressuposto 3.1.2 se verifica, obtém-se através da expansão em série de Taylor a igualdade

1 0 8

U(0) 2 /.(O) '''

É o primeiro termo que se encontra do lado direito da igualdade anterior que é responsável pelo termo dominante do viés do estimador dGPH. Este termo pode ser eliminado através da

adição de cq ao modelo de regressão linear

'fM,r

log/, =log/(<»J)=(log/;(0)-C)-2<ff, +log

/.(o)

+ £, (3.6)

onde

e, =log + C,

X7= l o g 2sin —

e C = 0.577216... é a constante de Euler.

Além disso, termos de viés adicionais podem ser eliminados através da adição dos termos af,..., <92r para r > 2 ao modelo de regressão linear (3. 6).

Quando r = 0, dr é assimptóticamente equivalente ao estimador dGPH.

Vai-se assumir que a mnção gu é "suave" de ordem s na frequência zero. Seja [s] a parte

inteira de s. Uma fimção real h definida na vizinhança de zero é "suave" de ordem s > 0 em zero se h é [s] vezes continuamente diferenciável em alguma vizinhança de zero e as suas derivadas de ordem [s] denotadas por hls] satisfazem a condição

h^(co)-h^(0]<c\co\s-[s]

para alguma constante c < oo e para todo o ^ n a vizinhança de zero.

Pressuposto 3.1.6: m = m(n) -> œ e m ->0.

Pressuposto 3.1.7: gu é uma função par em [-n, n] que é "suave" de ordem s em zero para

O pressuposto anterior permite a seguinte representação em série de Taylor em torno de zero de \og(gu(cq)) até ao termo [*]:

log

gÁ°))h

^k\ ' v Jj sl2\ h l \ (2k)\ J V J k=\ min{[£/2],/-} L

Û (2k)i

J J (3.7) (3.8) (3.9) onde * , = [s/2] i=min{p72],/•}+! J~Lk (2*)! cof +0(a)sj) = l{s>2 + 2r) /2+2r (2 + 2r)

-fl»r+o(<)

sendo a - min{j, 4 + 2r}, 6à = —-F log gu (co) |ffl=0 e 1 representa a função indicatriz6.

dû)

0(.) verifica-se uniformemente para/ = 1,..., m e para todo o n.

Se s é um inteiro, então (3. 7) - (3. 9) verificam-se com <9(.) substituído por o(.). Seja Qkj = af onde 0)j = paray = 1,..., mek=l,2,

Sejam log /, X, Qk, Res vectores coluna de dimensão m cujos y-ésimos elementos são log Ij,

Xj, Qk,j, Rj e ej, respectivamente, onde ej =log-^- + C (C = 0.577216... é a constante de

Euler) e gj = g(cq). Seja Q a matriz mxr cuja &-ésima coluna é Q2k para fc=l,..., r. Seja 1OT um

vector coluna de uns de dimensão m e seja b o vector coluna de dimensão r cujo &-ésimo

elemento é b2iJ(2k)\ para k = 1,..., min- ,r > e 0 para & = min• r\+\,...,r.

Combinando (3. 9) com(3. 6) ( com/„ substituído porgu e -2X} p o r ^ ) obtém-se:

Sejam

onde

\ogI = (\oggu(0)-Ch+^d + Qb + R + e

X*=X-\mXeQ*=Q-\mQ'

(3.10)

X = -Xt\mzQ=-Q'\m.

m m A igualdade (3. 10) é equivalente ao modelo de regressão linear

logI = Klm+X*d + Q*b + R + e (3.11)

onde

K = hgg(o)-C + Xd + Q'b.

O estimador de d, dr, é o coeficiente de X* obtido pelo método dos mínimos quadrados

aplicado à regressão do log(7) em \m, X e Q :

dr={xtíMQ.Xt)XXttMQAogI

onde

Me.=Im-Q*(Q«Q')-lQ\

sendo lm a matriz identidade m x m.

(Para r = 0, defina-se MQ. =Im).

O valor esperado de dr é dado pela expressão

E(d

)= d +

[X*'MQ.X'

**Y X*'M**

{R + E(e)).

O termo Q*b de (3. 11), o qual inclui termos afk para k = 1, ..., min{[.s/2], r) na expansão em í,

série de Taylor de log não aparece na igualdade anterior porque é eliminado pela «,(0)

inclusão de Q* na regressão (3. 11). Consequentemente, o viés de dr é de ordem inferior

relativamente ao viés de dGPH .

Seja fir um vector coluna de dimensão r cujo A>ésimo elemento é

2 k Ir 1 ' (2k + lf

e seja 77 uma matriz rxr cujo elemento (/, k) é

kk>+a+i|£+i)la+i)p"u"1--r-

Para r = 0 defina-se jur = 0 e 77 = 1 •

Defina-se a quantidade cr que vai ser usada nas expressões da variância e do viés do

estimador dr , no próximo teorema, através da expressão

Seja Çr um vector coluna de dimensão r cujo £-ésimo elemento é 2k(3 + 2r) hrk ~ {ir + 2k + 3X2À: + l) para& = 1,..., r. Defina-se (2x)2+2r(2 + 2r)cr( , x ~ 2 ( 3 + 2r)!(3 + 2 r )1 ^ ' ^ "

Considere-se o teorema seguinte que estabelece as expressões assimptóticas para o viés e para a variância do estimador dr.

Teorema 3.1.5: (Andrews & Guggenberger (2003)) Suponha-se que os pressupostos 3.1.6 e

3.1.7 se verificam. Então, a) E(dr-d)=\(s>2 + 2r)trb2+2r^(l + o(l))+0 rm^ \n J + 0 (\ 3 A log m v m J n1 cr b) \w\dr)= í o v ; 24 m Km,

Se s é um inteiro, a alínea a) verifica-se com O

ím^

\n J

substituído por o fm^

\n J

. Em

particular, de s = 2 + 2r, a alínea a) verifica-se com O

í a\ m yn j substituído por (m"^ yn j í 2+2r A ' m

, „

2+2r \n J

Comparando os resultados deste teorema com o teorema 3.1.1. verifica-se que o viés do estimador dr converge mais rapidamente para zero que o viés do estimador dGPH, enquanto

que a variância destes dois estimadores difere apenas por uma constante multiplicativa cr.

A escolha óptima de m, isto é, a escolha de m que maximiza a convergência para zero do EQMé m ~ n 20/(2^+1) onde <f> = min{s, 2 + 2r) m~ n 20/(20+1) significa que

n m

2^/(2^+1)

converge para uma constante positiva finita à medida que n - * o .

Suponha-se que m oc «rpara algum 0 < / < l e s > 2 + 2r. Então, o EQM de dr é: 4+4r EQM(l)=T2rbl2r^(l + o(l)) + O n n ) K Cr + ^ ( U o ( l ) ) 24 w

Se f > (2 + 2r)l (3 + 2r), então o termo 0(.) na expressão anterior é de ordem inferior relativamente aos outros dois termos. Ignorando #(.), o valor de m que minimiza o EQM é dado pela expressão

V _ 2 _ y/(5+4r) ™opt = 7T2Cr 24(4 + 4 r »2 2 + .n (4+4r)/(5+4r 2r J onde [A] representa a parte inteira de A.

A expressão anterior traduz a escolha óptima de m apenas quando xr # 0, b2+2r ^ 0 e cr< c o .

Pressuposto 3.1.8: m = o{nu,{2*+x)), onde (j> = min{s, 2 + 2r}, s > 1, e s é da mesma forma

que no pressuposto 3.1.7.

Teorema 3.1.6: (Andrews & Guggenberger (2003)) Suponha-se que os pressupostos 3.1.7 e

3.1.8 são válidos. Então,

4m\^

-dj-

->N ( n0 , — c2 ^ r

24 quando n—>oa

Estimador de Robinson

Nesta secção vai-se estudar a estimação de modelos de séries temporais múltiplas, os quais permitem que elementos da matriz de densidade espectral tendam para infinito ou para zero na frequência zero.

SejaX, um vector de dimensão G comg-ésimo elemento Xgh g = 1,..., G. Vai-se assumir que

Xt tem matriz de densidade espectral dada por

O (g, h) - ésimo elemento d e / i » é a densidade espectral cruzada deXg/ eXht quando g*he

é denotada por fgh{oo). O g-ésimo elemento da diagonal deJ[ú)),fgg(oo) é a função de densidade

espectral de Xgt.

Para Cg, dg satisfazendo 0 < Cg< oo, - lÁ < dg < Vi, assuma-se que à medida que a>-+ 0+

fM~

i

-2d,

para g = 1,..., G. O símbolo "~" significa que

Cga>

tende para 1.

O periodograma de Xgh t = 1,..., « é 4(<y), g - 1,..., G.

Seja J um inteiro fixo maior ou igual a 1. Defina-se

Y^-loglpM+j-À, g=h~,G, k=l + J,l + U,..,

Na teoria assimptótica, à medida que n tende para infinito, / e m também tendem para infinito e Um -> 0.

T , • • m ~ l > ■ 4- •

Vai-se assumir que e um inteiro.

Definam-se as variáveis não observáveis Ugy por

Y(p=c^-dg{2\ogcok)+U^ , g=l,...,G, k=l + J,l + U,...,m,

onde

4J )= l o g Cg+ ^ ( j )

sendo y/a função digama definida pela igualdade y/(z)=—logT(z).

Os estimadores de c{j) = (c\J\ ..., c^j e d = (d\, ..., dG)' obtidos pelo método dos mínimos

quadrados são c 'J' e d^' dados por

= vec^'Z^(z^'Z^y}

.-(■>)

d (J)

Empilhando as colunas de uma matriz quadrada L = [L^ J. ; umas em cima das outras, pode-se definir

onde 2P = (ZM, Zl+2J ..., Zm)\ Y* = (Y^, ..., YG(\ Zk = (1, - 21og(û*))' e Y(J) _ (y(J) yC) yiJ) Y

Jg ~\Ig,l+J> ÂgJ+2J> — ' Jg, m) •

:(J)

Seja cg( ' o g-ésimo elemento de c{ '. Cg pode ser estimado através da igualdade

Cf =exp(cf-

4/)).

No documento Processos de memória longa e métodos de estimação do parâmetro que controla a memória longa (páginas 44-58)

Método 9: Extensão do algoritmo de Durbin-Levinson

3. Estimação dos parâmetros dos processos de memória longa

3.1. Estimação semi-paramétrica

3.1.1. Métodos locais

3.1.1.1. Estimadores do tipo GPH

/M = />í2 s i n U^

2 ,

ÍM

log/(«J* log/„(())-</log

7R

J J

,og7R

ti*!-*)2

'm

ï m

/;(°)y

4^{d

-d)-^N

2(l-HT

- < y < i

W>i

t&j-xfo

±{xt-xj

Yj=\ogf

(e>j)*

-,

L

J

= Info

ta 2 sin

u

iM]. JfJaã

fM) \JMJ)

W-

À>-ã<m'*x'+™

\"-

°'*Ti\

7KÏ

,/k) -v(i)

Ií,;

,

,lfc"

^

x = - y x = - - y in

-n

f;{0)T

L

^in

r^

36(1 + S)

U(0)J "

24(1+ H)r

'r

z,

^in

r^

S = X[-y(i + lXlnO' + l)-lny)

+l]* 0,0803.

4r{d

-d\-i-+.

U(0) 2 /.(O) '''

'fM,r

/.(o)

gÁ°))h

Û (2k)i

-fl»r+o(<)

E(d

)= d +

Y X*'M

{R + E(e)).

kk>+a+i|£+i)la+i)p"u"1--r-

ím^

, „

4m\^

-dj-

fM~

i

Y^-loglpM+j-À, g=h~,G, k=l + J,l + U,..,

= vec^'Z^(z^'Z^y}

**ti!-)**2

**°'*Ti\**

**Y X*'M**