Capítulo 2
MODELOS E OUTLIERS EM SÉRIES
TEM-PORAIS
2.1 MODELOS PARA SÉRIES TEMPORAIS
Consideremos uma série temporal, xt
(
t=1, ... ,n)
. A série segue um modeloautore-gressivo de médias móveis ARMA(p,q) com E x
( )
t = µ se
(
xt−µ) (
−φ1 xt−1−µ)
− −/ φp(
xt p− −µ)
= +et θ1et−1+ +/ θq t qe− , (2.1.1)onde os et's são variáveis aleatórias independentes identicamente distribuídas N 0
(
2)
,σ . Os parâmetros desconhecidos são então
φ =
(
φ1, ... ,φp)
′, θ =(
)
′
θ1,...,θq , µ e σ.
O lado esquerdo de (2.1.1) é a chamada parte autoregressiva, pois xt depende dos seus
valores anteriores (desfasados) xt−1,...,xt p− . O lado direito é a parte de médias móveis,
pois o ruído actual no período t é uma combinação linear dos e et, t−1,...,et q− originais,
os quais não podem ser observados directamente.
O modelo geral ARMA(p,q) é, no entanto, de difícil tratamento numérico por causa da parte de médias móveis. Afortunadamente, o modelo AR(p), de muito mais fácil tratamento, dado que apenas contem a parte autoregressiva, constitui muitas vezes uma boa aproximação do modelo ARMA, se estivermos dispostos a considerar um valor para
xt = +µ φ1
(
xt−1−µ)
+ +/ φp(
xt−p−µ)
+et, (2.1.2)o qual pode ainda ser representado como
xt =φ1xt−1+ +Λ φpxt p− + +γ et, (2.1.3)
em que o intercepto γ = µ
(
1− − −φ1 / φp)
. Um exemplo simples, mas frequente é omodelo AR(1)
xt =φxt−1+ +γ et. (2.1.4)
Estes modelos podem ser representados de um outro modo, recorrendo ao operador de diferença, B , definido por B xk t =xt k− . Assim o modelo ARMA(p,q) (2.1.1) pode ser
representado por φ( )B x
(
t− µ)
=θ( )B et, (2.1.5) onde φ( )B φ B φ B φpB p = −1 1 − 2 − − 2 Λ e θ( )B θ B θ B θqB q = −1 1 − 2 − − 2 Λsão dois po-linómios em B de graus, respectivamente p e q . Considerando que os popo-linómios têm raízes fora do circulo unitário, o que assegura que o modelo é estacionário e invertível, pode-se expressar (2.1.5) em termos de representação de médias móveis,
x ( )( )B B e t = +µ t θ φ (2.1.6) = + +µ
(
1 ψ1 +ψ2 2+)
B B / et,
(
1 1) (
1 1)
(
1 1 2)
2 −θ B− −θqB = −φ B− −φ B +ψ B+ψ B + q p p / / / .Em termos de uma representação autoregressiva (omitindo o termo constante por conveniência de notação), (2.1.5) pode-se expressar como
φ( )( ) θ B B xt =et (2.1.7)
(
1+π1 +π2 2+)
= B B / xt et,saindo os coeficientes πj, j=1 2, ,... da relação,
(
1+π1B+π2B2+/)
(
1−θ1B− −/ θqBq) (
= −1 φ1B− −/ φpBp)
.Por causa da invertibilidade de θ( )B , estes coeficientes decaem e tornam-se
pratica-mente 0 para algum desfasamento p*. Deste modo o modelo ARMA(p,q) pode ser aproximado por um AR(p* )
xt ixt i e i p t = − + =
∑
π 1 * , (2.1.8) habitualmente considera-se p* = +p q.Se a série xt não é estacionária, então a parte autoregressiva do modelo ARMA(p,q)
deverá incluir um operador que induza a estacionaridade, ou seja, o operador de diferenciação (ou produtos desse operador) da forma (1−B . Deste modo, em vez da )
modelização de xt, consideramos
Habitualmente apenas é exigido um operador de diferenciação, no entanto, poderá ser necessário repetir o operador, digamos d vezes. Temos então, os modelos mistos autoregressivos e de médias móveis integrados ARIMA(p,d,q)
φ( )(B 1−B x)d t =θ( )B et, (2.1.9)
essencialmente (2.1.9) diz que a d -ésima diferença (1−B)d xt é estacionária e pode ser
representada por um modelo ARMA(p,q).
O método dos mínimos quadrados (MQ) é geralmente utilizado para estimar o vector de parâmetros β=
(
µ φ, 1, ... ,φ θp, 1, . .. ,θq)
′. Obtemos o estimador dos MQ, β∃, pelaminimização da soma do quadrado dos resíduos rt
( )
t p n 2 1 β = +∑
. (2.1.10)Em processos AR(p) o método dos MQ conduz-nos a um problema de estimação linear. Assim, dada uma colecção de observações z z1, 2,..., e considerando que zzn t
segue um modelo AR(p) com média nula, pode-se representar o processo como
zt =xt′φ+et com xt =
(
zt zt zt p)
′ −1, −2, ... , − e φ =(
)
′ φ1,... ,φp . Considerando as n observações, temos(
n− p)
equações Z=Xφ+e, (2.1.11) onde Z=(
zp+1, ... ,zn)
′, e=(
)
′ + ep 1,... ,en eX x x x = = − + − − − + ′ + ′ ′ z z z z z z z z z p p p p n n n p p p n 1 1 1 2 1 2 1 2 ... ... ... 0 0 / 0 0 .
Então o estimador dos mínimos quadrados condicional a z1,...,zp de φ é definido pela
solução φ∃ que minimiza rt
( )
t p n 2 1 φ = +∑
, em que rt( )
φ = −zt tφ ′x e pode ser representado numa forma explicita
φ = (X X′ )−1X Z′ , (2.1.12)
O estimador dos MQ, φ∃, é assintóticamente normal e eficiente quando a distribuição do ruído et é Gaussiana, o mesmo é verdade para o estimador de escala do ruído, σ,
obtido de modo similar a partir da minimização da soma do quadrado dos resíduos. Em contraste com os modelos AR, a estimação dos parâmetros dos modelos MA e ARMA é sempre um problema não linear em que os estimadores não assumem uma forma explicita. Suponha-se que zt são observações correspondentes a um processo ARMA(p,q). Então temos
φ( )B zt =θ( )B et, (2.1.13)
Neste caso, o estimador dos mínimos quadrados, β=
( )
φ θ, , condicional a z1,...,zp ea ep =ep−1= =Λ ep q− +1 =0 minimiza (2.1.10) onde os resíduos rt
( )
β são definidos por
rt
( )
β = ( ) ( )B B zt−
θ 1φ
Escrevemos rt em vez de rt
( )
β quando isso não cause confusão. Os resíduos podem sercalculados por recorrência
rt = −zt φ1zt−1− −Λ φp t pz− +
+θ1rt−1+ +Λ θq t qr− , (2.1.15)
para t≥ +p 1, com as condições inicias rp =rp−1= =Λ rp q− +1=0.
Se considerarmos at j
( )
r ( )B B z ( )B r t j j t t j − β = = − − = − − − ∂ ∂φ θ 1 φ 1 , bt j( )
rt ( ) ( )B B B z ( )B r j j t t j − β = = − = − − ∂ ∂θ θ 2 φ θ 1 dt( )
β =[
at( )
β at p( )
β bt( )
β bt q( )
β]
′ −1 , ... , − , −1 , ..., − , (2.1.16)a solução β∃ de (2.1.10) satisfaz o vector equação rt t
( )
t p n d β = +∑
1 = 0. (2.1.17)2.2 MODELOS GERADORES DE OUTLIERS
Frequentemente nas séries temporais são encontradas observações que surgem como discordantes face às restantes. Algumas, podem-se dever a erros grosseiros de medição, outras podem resultar da influência de intervenções exógenas, por exemplo, greves, alterações súbitas na estrutura dos mercados, alterações inesperadas em certas condições de um sistema físico ou outras. Como resultado algumas observações surgem como discordantes e são designadas como outliers.
A primeira questão que se coloca ao estudar os outliers prende-se pois com a sua classificação. Fox (1972) introduziu os conceitos de outlier do tipo I e tipo II, vulgari-zados na literatura, respectivamente como aditivos e inovadores. O primeiro tipo de outlier corresponde à situação em que ocorre um erro grosseiro de medição ou gravação afectando uma única observação. No caso de um IO, verifica-se um choque num determinado período, apresentando-se o ruído como discordante. Nesta situação o efeito do outlier propaga-se a múltiplas observações. Os AO parecem, no entanto, constituir os outliers mais frequentes, por exemplo, Kleiner, Martin e Thompson (1979) escreveram "our experience indicates that, although AO outliers are much more frequent, IO type outliers occasionally occur". Numa perspectiva recente, veja-se por exemplo Chen e Liu (1993a, 1993b), são também englobados na categoria de outliers as alterações da estrutura da série, nomeadamente, alterações de nível: permanentes (LS) e transitórias (TC).
Uma outra questão prende-se com o tipo de modelo gerador dos outliers a consi-derar. Denby e Martin (1979) e Bustos e Yohai (1986), entre outros, consideraram os AO e IO como contaminantes gerados por uma dada distribuição de probabilidades, propondo modelos para os outliers em relação com o modelo de contaminação por mistura (veja-se Barnett, 1994).
Fox (1972) propôs modelos paramétricos em relação com o modelo conhecido na literatura como deslizamento da média. Chang Tiao e Chen (1988), Tsay (1988) Chen e Liu (1993a) adoptando a formulação de Fox (1972) consideraram os outliers como casos particulares do modelo geral de intervenção de Box e Tiao (1975).
2.2.1 Modelo de contaminação por mistura
Os dois modelos considerados por Denby e Martin (1979) e por Bustos e Yohai (1986) para os dois tipos diferentes de outliers são:
Modelo IO
Dizemos que zt é uma série temporal ARMA(p,q) de acordo com o modelo IO se zt
satisfaz (2.1.5) mas os et`s têm uma distribuição F com cauda pesada aproximadamente
normal - por exemplo F é uma normal contaminada, dada por
F = −(1 ε)N
(
0σ2)
+εG, , (2.2.1)
onde ε é parâmetro de mistura e G é uma distribuição arbitrária com uma dispersão superior a σ [por exemplo, G= N
(
0 2)
,τ com τ2 ≥σ2
]. Isto significa que os ruídos et, com probabilidade 1−ε, são provenientes de uma N 0
(
2)
,σ e com probabilidade ε de uma distribuição arbitrária G com uma dispersão superior. As observações cujos et`s
são provenientes de G podem ser considerados outliers. Neste caso as observações zt
seguem um processo ARMA(p,q).
Modelo AO
Em presença deste tipo de outliers a série observada zt, não é ela mesmo um processo
ARMA. Em vez disso, temos
zt = +xt vt, (2.2.2)
onde xt é um processo ARMA satisfazendo (2.1.5) com et ∼N
(
0)
2
,σ e vt é uma
se-quência de variáveis independentes da sese-quência xt. As variáveis vt têm distribuição H ,
dada por
onde δ0 é uma distribuição degenerada na origem e G é uma distribuição arbitrária. Deste modo, o processo xt ARMA(p,q) é ele próprio observado com probabilidade
1−ε, e com probabilidade ε a observação é um processo xt [ARMA(p,q)] com adição
de um erro com distribuição G .
Então no modelo IO, ruídos ocasionais et têm variância maior que os restantes e
podem aparecer como outliers. No modelo AO uma componente aleatória adicional sobrepõe-se ocasionalmente ao processo subjacente exibindo a observação um com-portamento de outlier.
2.2.2 Modelo paramétrico
Quando numa série temporal, estão presentes outliers, o processo xt ARMA(p,q) sofre
uma perturbação. Neste caso, assume-se que a série observada zt, segue um modelo
paramétrico do tipo
zt = f t( )+xt, (2.2.4)
onde f t é uma função representando a intervenção exógena, tal como os outliers. ( )
Assume-se que f t é da forma ( )
f t( ) ( )( )B B t T =ω ωβ ξ( ) , (2.2.5) onde ξt T ( ) = 1 para t =T =0 t≠T
é uma variável indicadora do período T em que ocorre a perturbação,
ω( )B ω B ... ωsB δ .
s
= −1 1 − − =0 8 e β( )B β B βrB r
= −1 1 − −... são polinómios, respecti-vamente, de grau s e r, ω é uma constante representando o impacto inicial da
pertur-bação e a razão ω( )B /β( )B descreve o seu comportamento dinâmico. A função f t ( )
pertence ao modelo de intervenção de Box e Tiao (1975) e é uma forma geral podendo ser especificada de modo a descrever múltiplas perturbações, nomeadamente os AO, IO, LS e TC.
Considere-se que o processo xt ARMA(p,q) é ele próprio observado em t≠T,
contudo, nalgum instante de tempo T um outlier de um dos quatros tipos que se seguem é observado: Considerando na equação (2.2.5) ω( )( ) β B B =1
a série observada zt será então dada por
(AO) zt xt t T
= +ωξ( )
. (2.2.6)
Este é o modelo para um outlier aditivo. Considerando ω( )( ) ( )( ) β θ φ B B B B =
temos o modelo para um outlier inovador:
(IO) z x ( )( )B B t t t T = +θ φ ωξ( ). (2.2.7)
Estes modelos podem ser rescritos em termos de sequência inovadora et como se segue:
(AO) z ( )( )B B e t t t T =θ + φ ωξ( ), (2.2.8) e (IO) z ( )( )B
{
}
B e t t t T =θ + φ ωξ( ) . (2.2.9)Então o caso AO pode ser considerado um modelo de erro grosseiro já que apenas o nível da T -ésima observação é afectada. Repare-se que apenas a série observada zt sofre
o impacto do outlier não sendo afectado o processo subjacente ARMA(p,q). Geralmente este outlier surge como resultado de um erro de medição ou de gravação. Por outro lado, um IO representa um choque extraordinário no período T influenciando z zT, T+1,...
através do sistema dinâmico θ( ) ( )B /φ B , neste caso o outlier ocorre na série associado a xt. Por exemplo, em processos de produção industrial isto corresponde a uma
perturbação no sistema subjacente. Os outliers IO, ao contrário dos AO, claramente transmitem o seu efeito a observações posteriores.
Considerando o modelo (2.2.5) e fazendo
ω( )( ) ( ) β B B = −B 1 1
temos então o modelo para uma alteração permanente de nível
(LS) z x ( ) B t t t T = + −1 1 ωξ ( ) , (2.2.10)
O modelo declara que uma alteração de nível de magnitude ω ocorre no período t=T e a alteração é permanente, pois zt =xt para t <T mas zt = +xt ω para t ≥T.
Considerando em (2.2.5) ω( )( ) ( ) β δ B B = − B 1 1 0< <δ 1
temos o modelo para uma alteração transitória de nível (TC) z x ( ) B t t t T = + −1 1 δ ωξ ( ) . (2.2.11)
O modelo descreve uma perturbação que afecta zt para todos os t≥T. Contudo, o efeito declina exponencialmente a uma taxa δ com um impacto inicial ω. Como δ <1, o efeito eventualmente desaparece. Por esta razão, este modelo é designado como de alteração transitória.
É de realçar que, excepto no caso dos IO, os efeitos dos outliers na série observada são independentes do modelo subjacente. Por outro lado, os AO e LS são dois casos limite de um TC, respectivamente com δ =0 e δ =1.
Exemplo 2.1
Para ilustrar o efeito de cada tipo de outlier, simulámos um processo AR(1) sujeito a diferentes perturbações [veja-se Hudak e Liu (1992)]. Neste sentido, foram simuladas 65 observações a partir do modelo
xt =0 6, xt−1+et, com σ =1 0. .
Fig. 2.1 - Dados de um processo AR(1) simulado
Para ilustrar as suas consequências foram introduzidos diferentes tipos de outliers no período T=30 com um efeito ω =5.
O gráfico da série contaminada (traço descontínuo) com um AO em conjunto com a série sem outliers é mostrado na figura 2.2. Deste modo, os valores das observações mantêm-se inalterados excepto o da observação T=30.
Fig. 2.2 - AO em T=30
De modo similar, foi introduzido um IO no período T=30. A série resultante conjuntamente com a original é mostrada na figura 2.3. Pode-se verificar que os valores observados do período T=30 a T=38 situam-se todos acima dos correspondentes à
série original, o que confirma que os IO, ao contrário dos AO, transmitem o seu efeito a observações posteriores.
Fig. 2.3 - IO em T=30
No caso da alteração de nível (LS), a partir da figura 2.4, constatamos que após o período T=30 o nível médio da serie contaminada é superior ao da série original. Ex-cepto neste aspecto as duas séries são idênticas.
Fig. 2.4 - LS em T=30
Considerando uma alteração temporária de nível, em que δ é relativamente próximo de 1, δ =0 8. , o efeito do outlier é apenas visível num certo número de períodos (de
Fig. 2.5 - TC em T=30
Geralmente, uma série temporal pode conter, digamos k outliers de tipos diferentes, e temos então o seguinte modelo geral:
zt xt jL Bj( ) t T j k j = + =
∑
ω ξ( ) 1 , (2.2.12)ou em termos de sequência inovadora
z L B ( )( )B B e t j j t T j k t j = + =
∑
ω ( )ξ( ) θφ 1 , (2.2.13) com: L B ( )( )B B j( )= θ φ para um IO, ( ) L Bj =1 para um AO, ( ) ( ) L B B j = − 1 1 para um LS, ( ) ( ) L B B j = − 1 1 δ para um TC, (0< <δ 1), em t=Tj.No caso de se considerar que xt segue um modelo misto autoregressivo e de médias
móveis integrado (ARIMA) a formulação do modelo com outliers seria semelhante. Assim o modelo (2.2.13) viria
z L B( ) ( ( )) ( )B B B e t j j t T j k d t j = + − =
∑
ω ξ θ φ ( ) 1 1 , (2.2.14) com: L B( ) ( ( )) ( )B B B j = d − θ φ 1 para um IO, ( ) L Bj =1 para um AO, ( ) ( ) L B B j = − 1 1 para um LS , ( ) ( ) L B B j = − 1 1 δ para um TC , (0< <δ 1), em t=Tj.2.3 EFEITOS DA PRESENÇA DE OUTLIERS
A abordagem tradicional aos modelos ARMA assume que os resíduos são normalmente distribuídos; consequentemente, a minimização da soma do quadrado dos resíduos conduz a estimadores que são assintóticamente equivalentes aos estimadores de máxima verosimilhança. No entanto a presença de outliers pode enviesar seriamente as estimativas dos MQ dos parâmetros ARMA. Inclusive, pode traduzir-se numa especi-ficação incorrecta do tipo de modelo subjacente à série, dado o enviesamento que a presença dos outliers provoca nas estimativas das autocorrelações.
Consideremos um modelo AR(1) com um AO
O parâmetro ω deverá ser relacionado com o desvio padrão de xt, σx.
No sentido de evidenciarmos os problemas causados pelos AO consideremos um gráfico com os pontos zt versus zt−1. No caso do processo AR(1) temos (n−1 pares de )
pontos. Se ω =0 (ou seja, se não estiver presente nenhum outlier) os pares
(
zt−1,zt)
dispersam-se desde a origem ao longo de uma linha com inclinação φ, o qual pode ser estimado pelo método dos MQ.
Fig. 2.6 - Gráfico de zt versus zt−1 (i) sem outliers (ii) com um AO no períodoT
Um outlier aditivo no período T , zT, dá origem no gráfico a dois pontos discordantes, nomeadamente A=
(
zT−1,zT)
e B=(
zT,zT+1)
. O primeiro é um outlier na variávelres-posta [veja-se Rousseeuw e Leroy (1987)] e está em média ω unidades afastado da linha de regressão traduzindo-se pois num resíduo elevado
rT =zT −φzT−1= xT + −ω φxT−1=eT+ω, (2.3.2)
no entanto a sua influência sobre o estimador dos MQ é diminuta, não provocando uma alteração significativa na inclinação da linha de regressão. O ponto B=
(
zT,zT+1)
,traduz-se também num resíduo discordante pois
rT+1= zT+1−φzT = xT+1−φ
(
xT +ω)
=eT+1−φω, (2.3.3)mas, mais importante, este par representa um ponto de alavanca ("leverage") elevado, isto porque a variável regressora zT =xT +ω é discordante face às restantes, afectando
consideravelmente a estimativa de φ. Como consequência o coeficiente de inclinação estimado φ∃ tenderá a aproximar-se de zero. Isto dá-nos uma explicação intuitiva da razão porque os AO tem um efeito bastante negativo no estimador dos MQ.
Também no quadro de um AR(1), Guttman e Tiao (1978) estudaram as propriedades do estimador dos MQ, φ∃, sob o modelo AO. Concluíram que o enviesamento devido à presença do outlier de efeito ω numa amostra de dimensão n é aproximadamente −
( ) (
1n φ ω σx)
2, (2.3.4) com σx2 σ2(
φ2)
1
= / − . Este enviesamento pode ser bastante considerável. Por exemplo, se n=50,
(
ω σx)
=3 e φ =0 5. , o enviesamento é de −0 09. e com φ =0 9. é de −0 16. .Ledolter (1987b), estudou o efeito de um AO nas estimativas dos parâmetros de um processo ARMA, mas considerou como modelo gerador de outliers o modelo de contaminação por mistura, visto anteriormente, no qual a frequência de outliers é pro-porcional à dimensão da amostra. Neste caso o modelo ARMA com outliers AO é dado por
zt = +xt vt, φ( )B xt =θ( )B et, (2.3.5)
onde os vt são variáveis aleatórias assumindo o valor nulo com probabilidade 1−ε e
seguem uma distribuição N 0
(
2)
,τ com probabilidade ε. Além disso, assume-se que as sequências vt e et são independentes. Este modelo constitui pois uma versão estocástica
do modelo paramétrico para outliers aditivos.
Num processo AR(1) a estimativa do parâmetro φ∃ coincide com a autocorrelação da amostra de ordem um, ρ1( )z . Por outro lado, sabe-se que a autocorrelação da amostra
( )
ρk z constitui uma estimativa consistente da autocorrelação teórica, ρk( )z . A variância
E z
( ) (
t2 E xt vt)
2 x2 v2 2(
2)
2 1 = + =σ +σ =σ / −φ +ετ , E z z(
t t k−) (
= E xt +vt)(
xt k− +vt k−)
=φ σk x2 =φ σk 2(
−φ2)
1 / k ≥1.Então as autocorrelações são dadas por
ρ( ) φσ σ σ φ φ σ σ σ 1 2 2 2 2 2 2 z x x v v x v = + = − +
(
)
= − + − φ φ ε τ σ 1 1 2 1 x , ρk( ) φ ρ( ) k z = −1 1 z k ≥1.Isto demonstra que o enviesamento assintótico em φ = ρ1( )z é dado por
( )
(
)
E x φ φ φ ε τ σ − = − + − 1 1 2 1 . (2.3.6)Para exemplificar, considere-se φ =0 5. , ε =0 02. e
(
τ σx)
=3 0. . Neste caso oenvie-samento é de −0 076. .
A autocorrelação ρk( ) também demonstra que a presença de um outlier aditivo z
poderá traduzir-se numa especificação incorrecta do tipo de modelo subjacente à série. Por exemplo, segundo Ledolter (1987b) o modelo AR(1) com um AO pode ser facil-mente confundido com um modelo ARMA(1,1).
O mesmo principio pode ser usado para demonstrar que os AO podem afectar os estimadores usuais dos parâmetros no modelo ARMA. As primeiras p+q autocorre-lações ρ ρ1, 2,...,ρp q+ no modelo ARMA(p,q), podem ser definidas como funções dos
parâmetros ARMA e, inversamente, os parâmetros podem-se exprimir em termos dessas autocorrelações. Substituindo essas autocorrelações pelas estimativas da amostra temos os estimadores dos momentos, os quais resultam da resolução das conhecidas equações de Yule-Walker. Para os processos AR o método é relativamente simples, para processos ARMA, as equações são não lineares nos parâmetros, dai a sua complexidade de resolução.
Os estimadores dos momentos são estimadores consistentes dos parâmetros ARMA na ausência de outliers. No entanto, Ledolter (1987b) concluiu que as equações de Yule-Walker não providenciam estimadores consistentes em presença de um AO. Isto porque a autocorrelação da amostra ρk( )z em modelos ARMA(p,q) com AO não constitui um
estimador consistente da autocorrelação teórica do processo ARMA sem outliers, ( )
ρk x . Considere-se, como exemplo, o caso em que xt em (2.3.5) segue um modelo
MA(1) com variância σx2
(
θ σ2)
21 = + e autocorrelação de ordem um ( )
(
)
ρ1 θ θ 2 1x = − / + . Na presença de um AO, a autocorrelação de ordem um é dada por
ρ ( ) σ ρ σ σ θ θ σ σ σ 1 2 1 2 2 2 2 2 2 1 z x x x v x x v = + = − + + ( ) .
Por exemplo, com ε =0 05. ,
(
τ σx)
=3 0. e θ =0 8. a autocorrelação sem e com outliers,é respectivamente, ρ1( )x = −0 4. e ρ1( )z = −0 336. . Por outro lado, a estimativa de θ que se obtém pelo método dos momentos é de θ =∃ 0 39, o que constitui um desvio . considerável do verdadeiro valor θ =0 8. .
No caso da presença de um IO e considerando o gráfico de zt versus zt−1, o ponto
(
)
Fig. 2.7 - Gráfico de zt versus zt−1, com um IO no períodoT
Posteriormente o IO resulta em pontos
(
zt−1,zt)
que se aproximam da linha de regressão original com inclinação φ. Deste modo, o IO traduz-se num outlier na variável resposta e num certo número de "bons" pontos de alavanca, os quais têm inclusive a característica de melhorarem a precisão da estimativa dos MQ, compensando o efeito do outlier.Outra forma de ilustrar porque é que os outliers inovadores não afectam significati-vamente os estimadores dos coeficientes ARMA é considerar como modelo IO, o mo-delo de contaminação por mistura
φ( )B zt =θ( )B e
(
t+vt)
no qual a distribuição do ruído et+vt tem uma cauda mais pesada que a normal. Whittle
(1962) e Box e Jenkins (1976) demonstraram que a distribuição assintótica dos es-timadores dos MQ, β∃, não depende da distribuição dos distúrbios. Demonstraram ainda que a distribuição de n
(
β β−)
converge para uma distribuição normal com matriz de covariância que depende apenas dos parâmetros ARMA. Deste modo, os IO não afectam significativamente os estimadores dos MQ.Balke (1993) estudou o efeito nos estimadores dos MQ da presença de um outlier por alteração de nível. Assim considerou um LS ocorrendo no período T+1 de efeito ω, gerado pelo modelo (2.2.10) em que a componente regular de zt segue um modelo
E
( )
φ φ(
φ ω)
(n*2 T T n) / σ − = 1− − 2 2 , E( )
(
(
)
)
(
)
(n T T) n σ σ φ φ σ φ φ ω 2 2 2 2 2 2 2 2 1 1 − = − − + − − , (2.3.7) onde(
)
( ) σ σ φ ω *2 = − + − 2 2 2 2 1 n T T n . Exemplo 2.2Considere-se os dados simulados do exemplo 2.1, em que um outlier foi introduzido no período T=30. Estimando os parâmetros obtemos os seguintes resultados
CASO φ∃ D.P. de φ∃ σ∃ SEM OUTLIERS ,59319 ,10146 1,1226 AO ,50349 ,10888 1,3013 IO ,61922 ,09895 1,2837 LS ,95417 ,04175 1,4056 TC ,63450 ,09993 1,2978
Pode-se observar a influência que o outlier tem na estimação dos parâmetros. Assim, dependendo do tipo de outlier, pode-se constatar diferentes efeitos ao nível das estimativas de φ e σ. Repare-se que o IO tem a influência mais reduzida, como seria de esperar.