Os modelos ARCH foram brevemente apresentados na Se¸c˜ao 4.2.2. Quando conhecemos a distribui¸c˜ao de ϵt, podemos estimar o modelo (4.2) pelo m´etodo
de m´axima verossimilhan¸ca. Problemas de estima¸c˜ao surgem quando essa distribui¸c˜ao ´e desconhecida. Para esses casos, Li e Turtle (2000) propuseram uma abordagem de equa¸c˜oes de estima¸c˜ao.
A equa¸c˜ao (4.3) serve como ponto de partida para a constru¸c˜ao da fun¸c˜ao de estima¸c˜ao. A partir dela temos que, dado Ft−1, uma fun¸c˜ao de estima¸c˜ao
condicionalmente n˜ao viciada para α = (α0, α1, . . . , αp)⊤ ´e dada por
ut= y2t − ht.
Dado Ft−1, t = 1,· · · , T , temos que as fun¸c˜oes de estima¸c˜ao ut, t = 1,· · · , T
s˜ao n˜ao viciadas e n˜ao correlacionadas. A partir desse resultado, podemos obter uma fun¸c˜ao de estima¸c˜ao linear ´otima gerada por ut (Godambe, 1985).
Note que E ( ∂ut ∂α|Ft−1 ) =−∂ht ∂α, al´em disso, Var(ut|Ft−1) = E (u2t|Ft−1) = E (yt4|Ft−1)− h2t.
Desse modo, uma fun¸c˜ao de estima¸c˜ao linear ´otima pode ser obtida por Ψ∗(α) = T ∑ i=1 ∂ht ∂αVar −1(u t|Ft−1)ut. (4.10)
O problema ´e conhecer E (yt4|Ft−1). Se admitirmos que yt|Ft−1 segue uma
distribui¸c˜ao normal, pode-se provar que E (y4
t|Ft−1) = 3h2t (veja Engle, 1982
para maiores detalhes). Nesse caso, a fun¸c˜ao (4.10) se reduz a Ψ(α) = T ∑ i=1 1 2h2 t ∂ht ∂αut= T ∑ i=1 1 2h2 t Xtut, (4.11)
sendo Xt = (1, yt−1,· · · , yt−p)⊤. No caso de normalidade, a fun¸c˜ao de es-
tima¸c˜ao (4.11) equivale `a fun¸c˜ao escore e, consequentemente os estimadores coincidem com os estimadores de m´axima verossimilhan¸ca. A fun¸c˜ao (4.11) pode ser utilizada mesmo quando a distribui¸c˜ao de yt|Ft−1 n˜ao ´e normal.
Li e Turtle (2000) mostram, sob condi¸c˜oes gerais de regularidade que o estimador de α obtido a partir de (4.11) ´e consistente, assintoticamente normal, com matriz de covariˆancia assint´otica dada por J−1, sendo
J = 1 n n ∑ t=1 1 h2 t(γ2t+ 2) ∂ht ∂α ∂ht ∂α⊤,
em que γ2t ´e o excesso de curtose de yt.
Em Li e Turtle (2000) s˜ao apresentadas outras equa¸c˜oes de estima¸c˜ao para a modelos ARCH de regress˜ao, simula¸c˜oes e algumas aplica¸c˜oes.
Equa¸c˜oes de estima¸c˜ao para
dados circulares longitudinais
O estudo de dados circulares ´e bastante antigo e tem sua origem no estudo da posi¸c˜ao de corpos celestes (ver Bernoulli, 1734, por exemplo). Como exemplos de vari´aveis circulares temos: a dire¸c˜ao tomada por animais ap´os certo tratamento, a dire¸c˜ao do vento, a dire¸c˜ao de correntes mar´ıtimas em graus, o hor´ario de falha de um sistema, o hor´ario de entrada de pacientes em uma UTI, etc. Fisher (1993) analisa 24 conjuntos de dados circulares reais.
Uma vari´avel circular difere de uma n˜ao-circular (doravante denominada linear), pela singularidade de sua m´etrica. Como ilustra¸c˜ao, suponha que se tenha observado dois ˆangulos: o primeiro sendo 150 e o segundo 350. Pode-se questionar sobre qual seria o valor do ˆangulo m´edio dessas observa¸c˜oes. Ao se calcular a m´edia aritm´etica chega-se a 250, o que parece ser bastante razo´avel.
Suponha agora que a origem dos ˆangulos seja modificada atrav´es da aplica¸c˜ao de uma rota¸c˜ao de −250. Os valores transformados passam a ser 3500 e 100,
que tˆem 1800 como m´edia aritm´etica. Esse valor est´a muito distante dos ob- servados. Baseando-se nos dados, pode-se intuir que o valor “m´edio” deveria ser 00 1. Na verdade, a distˆancia entre duas observa¸c˜oes de uma vari´avel
circular, a < b, ´e dada por min{|a − b| (mod m); |a + m − b| (mod m)}. O procedimento padr˜ao na an´alise de dados com essa natureza ´e, atrav´es de uma transforma¸c˜ao linear, convertˆe-los em ˆangulos e analis´a-los nessa es- cala. A partir de agora, n˜ao faremos distin¸c˜ao entre os termos “circular” e
1valor que corresponde `a denominada m´edia circular dos dados, cujo conceito ser´a
apresentado na Se¸c˜ao 5.1
“angular” e consideraremos a vari´avel j´a convertida em ˆangulos. Em Jam- malamadaka e SenGupta (2001), Mardia e Jupp (2000)2, Batschelet (1981) e Fisher (1993), encontra-se uma grande variedade de t´ecnicas e modelos probabil´ısticos para dados circulares.
Exemplo 11 Ranvaud et al (1983) realizaram um estudo sobre os meca-
nismos de orienta¸c˜ao de pombos-correio. Os dados que ser˜ao analisados neste texto, correspondem `a diferen¸ca entre a dire¸c˜ao, em ˆangulo, tomada por pombos-correio ap´os 30, 60 e 90 segundos da soltura e o ˆangulo corres- pondente `a sua posi¸c˜ao no momento em que desaparecem no horizonte. Eles s˜ao parte de um estudo mais amplo realizado por v´arios anos na cidade de Camocim, localizada a 300 km de Fortaleza, no Estado do Cear´a. Essa ci- dade foi escolhida para o estudo pois, na ´epoca da realiza¸c˜ao do experimento, o equador magn´etico da Terra encontrava-se pr´oximo a essa cidade o que seria um controle natural do efeito do campo magn´etico na orienta¸c˜ao das aves.
O Exemplo 11 traz um caso t´ıpico em que a vari´avel resposta (diferen¸ca de ˆangulos) ´e circular.
5.1
Representa¸c˜ao gr´afica e conceitos b´asicos
Usualmente, uma observa¸c˜ao y de uma vari´avel circular pode ser represen- tada graficamente em um c´ırculo de raio unit´ario na posi¸c˜ao (1, y), quando se utiliza coordenadas polares, ou (cos(y), sen(y)), quando se utiliza coordena- das cartesianas. A Figura 5.1 ´e uma representa¸c˜ao gr´afica de uma observa¸c˜ao
y, de uma vari´avel circular numa circunferˆencia de raio unit´ario.
A m´edia circular de um conjunto de dados circulares, yi, i = 1, 2, . . . , n,
´e dada por ˆ µ = arctan (S/C) , se S ≥ 0 e C > 0, arctan (S/C) + π, se C < 0, arctan (S/C) + 2π, se S < 0 e C > 0, (5.1) onde S = n ∑ i=1 sen(yi) e C = n ∑ i=1
cos(yi). Uma interpreta¸c˜ao da m´edia circular
pode ser obtida quando se considera cada observa¸c˜ao como um vetor de
2Trata-se, na verdade, de uma vers˜ao ampliada e revisada de um cl´assico da ´area que
y
cos(y) sen(y)
Figura 5.1: Representa¸c˜ao gr´afica de uma observa¸c˜ao circular numa circun- ferˆencia de raio unit´ario
R
Figura 5.2: Representa¸c˜ao gr´afica de trˆes observa¸c˜oes circulares e de sua correspondente m´edia circular e comprimento da resultante
comprimento um e dire¸c˜ao yi. Nesse caso, a m´edia circular corresponde `a
dire¸c˜ao do vetor resultante.
Uma medida de concentra¸c˜ao bastante utilizada na an´alise de dados cir- culares ´e o comprimento do vetor resultante,
R =√S2+ C2.
Em uma amostra de tamanho n, quando todas as observa¸c˜oes s˜ao coinciden- tes, tem-se que R = n; esse ´e o caso de concentra¸c˜ao m´axima dos dados (vari- abilidade m´ınima). Outro caso limite se d´a quando os ˆangulos encontram-se uniformemente distribu´ıdos no c´ırculo, onde, R = 0; trata-se do caso de concentra¸c˜ao m´ınima (variabilidade m´axima). Cabe salientar que quando a variabilidade ´e m´axima, a m´edia circular n˜ao est´a definida. Usualmente utiliza-se, como medida de concentra¸c˜ao dos dados, o comprimento da resul- tante m´edia, definido por
R = R
n, (5.2)
que tem a vantagem de variar no intervalo [0, 1].
A Figura 5.2 traz a representa¸c˜ao gr´afica da resultante e da m´edia circular (ˆangulo indicado na figura) calculadas para um conjunto de 3 observa¸c˜oes.