Capítulo 6
PREVISÃO EM SÉRIES TEMPORAIS COM
OUTLIERS
São substancialmente reduzidos os estudos em séries temporais sobre o efeito dos ou-tliers na previsão. Hillmer (1984) estudou a forma de controlar e ajustar as previsões na presença de outliers sob o modelo ARIMA, Ledolter (1989) estudou o efeito dos AO. Ambos concluíram que os intervalos de previsão são particularmente sensíveis aos outliers aditivos. Contudo, as previsões não são substancialmente afectadas excepto se os outliers ocorrerem próximo da origem da previsão, nomeadamente devido ao (i) efeito carry-over do outlier na origem ou próximo da origem da previsão e (ii) ao en-viesamento das estimativas dos parâmetros do modelo provocado pela sua presença.
Na abordagem de Chen e Liu (1993b), que faremos particular referência, são estu-dadas as questões que se colocam em termos de previsão quando é utilizado o proce-dimento iterativo de estimação dos parâmetros e detecção de outliers, referido no capí-tulo. Nos estudos de Hillmer (1984) e Ledolter (1989) apenas são considerados os outliers aditivos e inovadores. Como os outliers inovadores não afectam as previsões, o seu interesse principal reside no efeito dos outliers aditivos. Chen e Liu (1993b) consideram também os dois outros tipos de outliers, nomeadamente, alterações tempo-rárias (TC) e alterações de nível (LS). O seu objectivo é determinar o efeito dos outliers na previsão quando ocorrem no fim da série temporal (origem da previsão), ou próximo do fim da série. Estudaram também a perda de precisão quando, pelo procedimento iterativo, o tipo de outlier não é correctamente determinado.
6.1 EFEITO DE UM OUTLIER NA PREVISÃO NUM MODELO ARIMA COM COEFICIENTES CONHECIDOS
Considere-se um processo xt seguindo um modelo ARIMA de ordem p, d e q ; ou seja,
φ( )(B 1−B x)d t =θ( )B et, (6.1.1)
onde B , φ( )B e θ( )B são os operadores habituais.
Considere-se ainda os quatro tipos de outliers: inovador (IO), aditivo (AO) alteração de nível permanente (LS) e temporária (TC). Assumindo que apenas ocorre um outlier na série em t=T e que ξt T ( ) = 1 em t=T e ξt T ( ) = 0 em t ≠T, a série observada zt
pode-se exprimir como anteriormente zt xt L B( ) t T = +ω ξ( ) , (6.1.2) com ( ) ( ) ( ) ( ) L B B B d B = − θ φ 1 para um IO ( ) L B =1 para um AO ( ) ( ) L B B = − 1 1 para um LS ( ) ( ) L B B = − 1 1 δ para um TC (0< <δ 1)
Considere-se o modelo (6.1.2) e assuma-se que os coeficientes do modelo ARIMA são conhecidos. A previsão que minimiza o erro quadrático médio (MEQM) em m
z mn( ) x mn( ) L B( ) n m T
= +ω ξ( )+
, (6.1.3)
onde x mn( ) é a previsão MEQM em m passos de xn m+ com origem em t=n. Em geral,
esta previsão é dada por
x mn( ) x x m n m n =π1 +π2 −1+ ( ) ( ) / . (6.1.4)
As ponderações π são obtidas pela seguinte fórmula de recorrência: πjm πj m π πh jm h h m j ( ) ( ) , ,... = + − + − = = −
∑
1 1 1 1 2 (6.1.5) e πj πj ( )1 = são as ponderações πobtidas a partir do modelo (6.1.1), as quais satisfazem a condição (1−B) ( )dφ B =θ( ) ( )B π B . Alternativamente, a previsão x mn( ) pode ser
calculada utilizando
x mn( )=ψmen +ψm+1en−1+/ , (6.1.6)
onde os ψj`s são as ponderações ψ obtidas a partir do modelo (6.1.1), satisfazendo a
condição (1−B) ( ) ( )dφ Bψ B =θ( )B . O erro de previsão em m passos, quando os pa-râmetros ARIMA e o efeito do outliers é conhecido é dado por
εn( )m =zn m+ −z mn( )=xn m+ −x mn( ). (6.1.7)
Habitualmente, a informação referente à presença ou ao tipo de outlier é desconhe-cida. Uma aproximação para ultrapassar esta dificuldade consiste em aplicar o proce-dimento iterativo para detectar os outliers e estimar os parâmetros do modelo. Neste
caso, tendo como base o outlier detectado empiricamente, a previsão MEQM em m
passos com origem em t=n é dada por z mn( ) x mn( ) L B( ) n m( )
T
= +ω ξ + , (6.1.8)
onde x mn( ) é a previsão MEQM em m passos baseada nas observações ajustadas e ω∃,
( )
L B e T são as estimativas, respectivamente, do efeito, tipo e localização do outlier. É ∃ de realçar que x mn( ) representa a previsão da série não contaminada (ou série ajustada),
em geral, esta é obtida através do ajustamento do efeito outlier com base na localização, tipo e dimensão do outlier detectado. O tipo e localização do outlier determinado empiricamente, L B e ( ) T , são os mesmos que ∃ L B e T se o tipo de outlier foi ( ) correctamente detectado bem como a sua localização, caso contrário podem ser diferentes. Então, neste caso o erro de previsão é dado por
εn( )m =zn m+ −z mn( ) =xn m+ −x mn( )+
(
L B( ) n m+ − L B( ) +)
T n m T ω ξ( ) ω ξ( ) (6.1.9)Um outlier que ocorra no meio da série, em geral, é correctamente detectado. Contudo, se ocorrer próximo do fim da série é difícil de identificar dada a insuficiência de dados. Em particular, quando o outlier ocorre no último período da série, os testes estatísticos usados para determinar o tipo de outlier baseados nas razões de verosimi-lhança são idênticos para os quatro tipos de outlier e como tal o seu tipo não pode ser identificado empiricamente. Noutras situações, um outlier pode ocorrer um ou dois períodos antes da origem da previsão. Também nestes casos, o procedimento de detec-ção de outliers pode não conseguir identificar correctamente o tipo de outlier.
6.2 ERROS DE PREVISÃO QUANDO UM OUTLIER OCORRE PRÓXIMO DA ORIGEM DE PREVISÃO
6.2.1 A origem da previsão é identificada como um outlier
Assumindo que os coeficientes do modelo ARIMA são conhecidos, o efeito de um outlier descrito pela equação (6.1.2) pode ser calculado com base na série dos resíduos estimados r∃t, em que
rt =π( )B zt, (6.2.1)
onde π( )B é um polinómio em π obtido com base no modelo (6.1.1). Na origem da previsão t =n, a estimativa do efeito do outlier (para todos os tipos) e a estatística de teste são, respectivamente,
ω =∃ ∃rn (6.2.2) e ∃ ∃ ∃ λ ω σ = , (6.2.3)
onde σ∃ é uma estimativa de σ. Nesta situação, mesmo considerando que se pode testar se a observação em t=n é um outlier, é necessário um critério de decisão para de-terminar qual o tipo do outlier.
Dependendo da decisão quanto ao tipo de outlier, a previsão em m passos z m∃n( ) pode ser calculada com base na equação (6.1.8)
(2) IO z mn( )IO = x mn( )IO +ωψ m, (3) AO z mn( )AO = x mn( )AO, (6.2.4) (4) TC z mn( )TC x mn( )TC m = +ωδ , (5) LS z mn( )LS =x mn( )LS +ω.
A notação x mn( )NO (igual a z mn( )NO) representa a previsão MEQM em m passos de
zn m+ sem ajustamento do efeito outlier, e x mn( )TP (TP= AO IO LS TC, , , ) é a previsão
MEQM em m passos de xn m+ baseada nas observações ajustadas considerando que existe
um outlier.
Repare-se que no caso do outlier ocorrer na origem da previsão, o efeito estimado do outlier ( )ω é o mesmo para qualquer tipo de outlier, e o seu impacto pode ser observado apenas em t =n. Então, neste caso, a decisão quanto ao tipo de outlier apenas afecta a extrapolação do seu efeito a observações futuras, não afectando a observação ajustada na origem da previsão.
A equação (6.2.4) mostra que a previsão com ajustamento do efeito do outlier con-siste na soma da previsão da série não contaminada e do efeito do outlier em observa-ções futuras. Quando a origem da previsão é detectada como um outlier, o procedimento iterativo de detecção de outliers consegue fornecer uma estimativa para a primeira componente, mas dificilmente fornece informação completa acerca da segunda.
Pode-se ainda, exprimir a previsão em m passos ajustada ao efeito outlier z mn( )TP em
função de uma previsão típica sem ajustamento do efeito outlier:
(2) IO z mn( )IO =z mn( )NO, (3) AO z mn( )AO =z mn( )NO +ωψ m, (6.2.5) (4) TC z mn( )TC z mn( )NO
(
)
m m = +ω δ −ψ , (5) LS z mn( )LS =z mn( )NO +ω(
1−ψm)
.A equação (6.2.5) mostra a diferença entre as previsões sem o ajustamento do outlier e aquelas com o ajustamento do outlier. É de realçar que na situação de um IO, a previsão em m passos ajustada é idêntica à previsão se não fosse efectuado nenhum ajustamento. Isto explica porque é quando um outlier produz um efeito que segue o padrão da memória ψ não é necessário proceder a nenhum ajustamento para obter uma previsão exacta. Esta é pois a razão pela qual os modelos ARIMA comportam-se relativamente bem em termos de previsão quando a série está sujeita a um IO.
Para obter as propriedades estatísticas dos erros de previsão, necessitamos de ex-primir a previsão da série não contaminada em termos de previsão do processo subja-cente como é descrito pela equação (6.1.4). A série ajustada pode ser obtida substituindo os outliers detectados na equação (6.1.2). Então
( ) ( )( ) ( ) x m x m x m n TP n m n m = + − − ψ ω ω ψ ω outlier ocorre em t = n
outlier não ocorre em t = n (6.2.6)
com TP=AO, TC, IO, LS e
( ) ( ) ( ) x m x m x m n NO n m n = + ψ ω outlier ocorre em t = n
onde x mn( ) é definido pela equação (6.1.4). Com base na equação (6.2.7), Chen e Liu
(1993b) derivaram os erros de previsão consoante o tipo de outlier especificado. Os termos da diagonal na tabela 6.1 dão-nos os erros de previsão quando o tipo de outlier é correctamente especificado, os elementos fora da diagonal dão-nos o erro de previsão quando o tipo de outlier é incorrectamente determinado. Em particular, na primeira linha, temos os erros de previsão quando não é afectado nenhum ajustamento para os outliers. Dá-nos então o enviesamento devido a um outlier não detectado na origem da previsão. O erro associado a um outlier incorrectamente especificado depende de memória do processo, ψm, e do seu tipo.
Actual Previsão NO IO AO NO εn( )m εn( )m εn( )m −ωψm IO εn( )m εn( )m εn( )m −ωψm AO εn( )m +ωψ m εn( )m +ωψ m εn( ) (m + ω ω ψ− ) m TC εn( ) ω ψ
(
m δ)
m m + − εn( ) ω ψ(
m δ)
m m + − εn( ) (ω ω ψ) m ωδ m m + − − LS εn( )m +ω ψ(
m−1)
εn( )m +ω ψ(
m−1)
εn( ) (m + ω ω ψ− ) m−ωActual Previsão TC LS NO εn( ) ω ψ
(
m δ)
m m − − εn( )m −ω ψ(
m−1)
IO εn( ) ω ψ(
m δ)
m m − − εn( )m −ω ψ(
m−1)
AO εn( ) (ω ω ψ) m ωδ m m + − + εn( ) (m + ω ω ψ− ) m+ω TC εn( ) (ω ω ψ)(
m δ)
m m + − − εn( ) (ω ω ψ) m(
ω ωδ)
m m + − + − LS εn( ) (ω ω ψ) m(
ω ωδ)
m m + − − − εn( ) (m + ω ω ψ− )(
m−1)
Tabela 6.1 - Continuação Considerando que ω=ω+ e e n n outlier ocorre em t = noutlier não ocorre em t = n (6.2.8)
pode-se obter o erro quadrático médio (EQM) de previsão, (tabela 6.2.) E
[
z ( )]
n+ −m zn m 2 .A primeira linha da tabela mostra o efeito dos vários outliers quando não é conside-rado nenhum procedimento de detecção e ajustamento do seu efeito. Pode-se verificar que o outlier correctamente detectado produz o EQM mais reduzido. Para uma de-terminada linha, a razão entre os EQM´s e o EQM mais pequeno dá-nos informação acerca da perda de eficiência devido a uma decisão incorrecta quanto ao tipo de outlier. Quando um IO é incorrectamente identificado como não sendo um outlier, ou uma observação é ilegitimamente identificada como um IO, não se verifica nenhuma perda de eficiência. Este resultado leva-nos a concluir que provavelmente não é necessário
detectar um outlier IO no contexto da previsão, resultado avançado por Ledolter (1989). No entanto, quando um IO é incorrectamente identificado como um AO, LS, ou TC verifica-se uma perda de eficiência ao nível do EQM.
Actual Previsão NO IO AO NO σε2( )m σε2( )m σε2( )m +ψ ωm2 2 IO σε2( )m σε2( )m σε2( )m +ψ ωm2 2 AO σε2( )m +ψ σm2 2 σε ( ) ψ σ
(
ω)
2 2 2 2 m + m + σε ( ) ψ σ 2 2 2 m + m TC σε2( )(
ψ δ)
σ 2 2 m m m + − σε2( )(
ψ δ)
(
σ ω)
2 2 2 m m m + − + σε2( )(
ψ δ)
σ ω δ 2 2 2 2 m m m m + − + LS σε2( )(
ψ)
σ 2 2 1 m + m− σε( )(
ψ)
(
σ ω)
2 2 2 2 1 m + m− + σε ( )(
ψ)
σ ω 2 2 2 2 1 m + m− +Tabela 6.2- EQM de previsão quando o outlier ocorre na origem da previsão
Actual Previsão TC LS No σε2( )
(
ψ δ)
ω 2 2 m + m− m σε2( )m +(
ψm−1)
2ω2 IO σε2( )(
ψ δ)
ω 2 2 m + m− m σε2( )m +(
ψm−1)
2ω2 AO σε2( )m ψ σm2 2 ω δ2 2 m + + σε2( )m +ψ σm2 2 +ω2 TC σε( )(
ψ δ)
σ 2 2 2 m m m + − σε( )(
ψ δ)
σ ω(
δ)
2 2 2 2 2 1 m m m m + − + − LS σε2( )(
ψ)
σ ω(
δ)
2 2 2 2 1 1 m + m− + − m σε2( )m +(
ψm−1)
2σ2 Tabela 6.2 - ContinuaçãoEm geral, a perda de eficiência devido a uma incorrecta especificação do tipo de outlier depende das (i) ponderações do processo subjacente, ψ, (ii) do efeito do outlier,
como IO ou não-outlier, ou quando AO é incorrectamente identificado como um TC ou um LS, o EQM da previsão é sempre superior ao que resultaria da identificação correcta se ω σ> . Quando um TC ou um LS é incorrectamente identificado como um AO, TC, LS, o EQM aumenta se ω σ
(
ψ)
δ > − − + 2 1 1 1 m m .6.2.2 Outlier ocorrendo k períodos antes da origem da previsão
Quando o outlier ocorre k períodos antes da origem da previsão n, a observação zt
pode-se exprimir como
z x ( ) i k x L B i k t i n i n i n i n k − − − −− = + >≤ ω ξ( ) (6.2.9)
Os resíduos que se obtêm filtrando a série zt com os parâmetros do modelo conhecidos,
podem-se exprimir como
r e ( ) ( ) i k e B L B i k t i n i n i n i n k − − − −− = + >≤ ≤ ωπ ξ( ) 0 (6.2.10)
Um outlier erradamente identificado pode resultar de uma localização correctamente detectada mas de especificação errada do seu tipo, ou de ambos, tipo e localização in-correctos. No seu estudo, Chen e Liu (1993b) consideram apenas o caso em que a lo-calização é a correcta mas o tipo de outlier é erradamente especificado.
Quando o outlier é detectado k períodos antes da origem da previsão n, as estima-tivas para os diferentes tipos de outlier são
(IO) ω∃IO =r∃n k− , λ∃ ω∃ σ IO IO = (AO) ω π ( ) π π AO n k n k k n AO r r r SS = − − 1 − +1− −/ , ( )
(
)
/ λ ω σ π AO AO AO SS = (TC)(
)
(
)
( ) ωTC δ π πδ δ π π n k n k k k k n TC r r r SS = − + − − + + + − − − − 1 1 1 1 / / ( )(
)
/ λ ω σ π TC TC TC SS = (LS) ω(
π)
( )(
π π)
π LS n k n k k n LS r r r SS = − + −1 1 − +1+ + − − −/ 1 1 / ( )(
)
/ λ ω σ π LS LS LS SS = onde SS( )π AO = +1 π1 + +πk 2 / 2 SS( )TC(
)
(
)
k k k π = + δ π− + + δ −δ π− − −π 1 1 2 / 1 1 / 2 SS( )π LS = + −1(
1 π1)
+ + − − −(
1 π πk)
2 1 2 / /( ) ( ) x z i k z L B i k t i n i n i TP n i n k − − − −− = − >≤ ω ξ = ( ) ( ) > + − ≤ − − −− −− x i k x L B L B i k n i n i n i n k TP n i n k ω ξ( ) ω ξ( ) (6.2.11)
A previsão em m passos da série ajustada ao efeito do outlier pode-se exprimir como
x mn( )TP x mn( ) i
[
L B( ) ( ) L B( ) ( )]
m n i n k TP n i n k i k = + + −− − −− =∑
π 1 ω ξ ω ξ 0 , (6.2.12)onde x mn( ) é a previsão MEQM do processo subjacente xt. Como na equação (6.1.8)
pode-se exprimir z mn( )TP como
z mn( )TP x mn( )TP TPL B( ) n m( ) n k
= +ω ξ +−
(6.2.13)
Então o erro de previsão definido pela equação (6.1.13) pode ser rescrito como
εn( )m =zn m+ −z mn( )TP =
{
xn m+ −x mn( )}
−[
−]
+ −− −− =∑
πi ω ξ ω ξ m n i n k TP n i n k i k L B L B 1 0 ( ) ( ) ( ) ( ) +{
ωL B( )ξn m(+n k− ) −ω TPL B( )ξn m(+n k− )}
. (6.2.14)As três componentes na expressão acima representam (i) a incerteza intrínseca dos erros de previsão associados ao processo subjacente à série temporal, (ii) erros amostrais no
ajustamento do efeito do outlier nas observações e (iii) erro associado à extrapolação do efeito do outlier.
6.3 DETECÇÃO DE OUTLIERS PRÓXIMOS OU NA ORIGEM DA PREVISÃO
Quando os outliers ocorrem próximo da origem da previsão, o procedimento usual de detecção de outliers pode não ser muito eficaz devido à falta de informação. Uma es-tratégia para ultrapassar esta limitação consiste na redução do nível critico usado para detectar outliers presentes na origem ou próximo da origem da previsão.
As estimativas dos parâmetros do modelo podem ser afectadas pela escolha do valor critico no procedimento iterativo de detecção de outliers e estimação conjunta dos parâmetros do modelo e efeito dos outliers, conforme foi referido no capítulo 4. Se o valor critico é elevado, a potência da detecção de outliers será baixa. O caso extremo de um valor critico bastante elevado, seria equivalente a não se detectar nenhum outlier. Quando é utilizado um valor critico baixo, a potência da detecção de outliers aumenta. Contudo, a possibilidade de ocorrer um erro do tipo I (detecção de outliers ilegítimos) aumenta também. Como resultado, as estimativas dos parâmetros do modelo baseados no procedimento de estimação conjunta podem ser enviesadas devido ao ajustamento de outliers ilegítimos.
Para o objectivo de estimação, gostaríamos de obter estimativas precisas dos parâ-metros do modelo, e também conseguir uma potência elevada na detecção de outliers durante o período de previsão. Para atingir estes objectivos, Chen e Liu (1993a) reco-mendam a seguinte estratégia: (i) para a estimação do modelo, utilize-se um valor critico moderado no processo de estimação conjunta; (ii) para a previsão, use-se o modelo estimado em (i), mas empregue-se um valor critico mais reduzido na detecção de outliers.
Exemplo 6.1
Consideremos os totais mensais (em milhares), de Janeiro de 1949 a Dezembro de 1960, de passageiros de linhas aéreas internacionais [Hudak e Liu (1992)]:
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez 1949 112 118 132 129 121 135 148 148 136 119 104 118 1950 115 126 141 135 125 149 170 170 158 133 114 140 1951 145 150 178 163 172 178 199 199 184 162 146 166 1952 171 180 193 181 183 218 230 242 209 191 172 194 1953 196 196 236 235 229 243 264 272 237 211 180 201 1954 204 188 235 227 234 264 302 293 259 229 203 229 1955 242 233 267 269 270 315 364 347 312 274 237 278 1956 284 277 317 313 318 374 413 405 355 306 271 306 1957 315 301 356 348 355 422 465 467 404 347 305 336 1958 340 318 362 348 363 435 491 505 404 359 310 337 1959 360 342 406 396 420 472 548 559 463 407 362 405 1960 417 391 419 461 472 535 622 606 508 461 390 432
Fig. 6.1 - Passageiros de linhas aéreas internacionais
Um modelo apropriado para esta colecção de dados, não considerado nenhum pro-cedimento de detecção de outliers, seria um ARIMA(0,1,1)´(0,1,1)12; ou seja,
Considerando agora o procedimento iterativo de detecção e estimação conjunta dos efeitos dos outliers e parâmetros ARIMA, através do comando OESTIM do sistema estatístico do SCA, teríamos os seguintes resultados
SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- AIRLINE ---
VARIABLE TYPE OF ORIGINAL DIFFERENCING
VARIABLE OR CENTERED
1 12
LNAIRPAS RANDOM ORIGINAL (1-B )(1-B )
--- PARAMETER LABEL VARIABLE NAME NUM./ DENOM.
FACTOR ORDER CONST- RAINT VALUE STD ERROR T VALUE 1 TH1 LNAIRPAS MA 1 1 NONE .3180 .0875 3.63 2 TH2 LNAIRPAS MA 2 12 NONE .4824 .0773 6.24
SUMMARY OF OUTLIER DETECTION AND ADJUSTMENT
TIME ESTIMATE T-VALUE TYPE
29 0.095 4.08 AO 54 -0.097 -3.55 LS 47 -0.080 -3.44 AO
TOTAL NUMBER OF OBSERVATIONS... 132 EFFECTIVE NUMBER OF OBSERVATIONS... 119 RESIDUAL STANDART ERROR (WITH OUTLIER ADJUSTMENT)... 0.332230E+03 RESIDUAL STANDART ERROR (WITHOUT OUTLIER ADJUSTMENT).... 0.384778E+03
Foram detectados três outliers, nenhum deles próximo da origem da previsão (considerada como t=132). Repare-se que com a correcção introduzida pelo ajusta-mento considerando os outliers, a redução verificada em σ∃ é de aproximadamente 14%. Vamos agora calcular as previsões em um passo com origens de 132 até 143, através do comando OFORECAST do SCA. Dado que é não possível distinguir o tipo de outlier detectado na origem da previsão, vamos considerar que se trata de um AO.
RESIDUAL STANDART ERROR (USES DATA UP TO THE FIRST FORECAST ORIGIN) = .33223E-01
TIME ESTIMATE T-VALUE TYPE
29 0.095 4.08 AO 54 -0.097 -3.55 LS 47 -0.080 -3.44 AO --- 1 FORECASTS, BEGINNING AT 132 ---
TIME FORECAST STD. ERROR ACTUAL IF KNOWN
133 6.0410 0.0332 6.0331
Neste caso, os outliers detectados coincidem com os obtidos através do comando OESTIM. A previsão efectuada para t=133 (com o ajustamento indicado) é 6 0410. . Se considerarmos a origem da previsão em t=133 obtemos:
RESIDUAL STANDART ERROR (USES DATA UP TO THE FIRST FORECAST ORIGIN) = .33223E-01
TIME ESTIMATE T-VALUE TYPE
29 0.095 4.08 AO 54 -0.097 -3.55 LS 47 -0.080 -3.44 AO --- 1 FORECASTS, BEGINNING AT 133 ---
TIME FORECAST STD. ERROR ACTUAL IF KNOWN
134 5.9846 .0332 5.9687
Veja-se que são detectados os mesmos outliers quando a origem da previsão é t=134. Contudo, é detectado um outlier adicional quando a origem da previsão é t=135. É de notar que o outlier detectado em t=135 tem uma estatística-t 2 79. (em valor ab-soluto), a qual é superior a 2 5. , mas inferior a 3 0. .
RESIDUAL STANDART ERROR (USES DATA UP TO THE FIRST FORECAST ORIGIN) = .33223E-01
TIME ESTIMATE T-VALUE TYPE
29 0.095 4.08 AO 54 -0.097 -3.55 LS 47 -0.080 -3.44 AO 135 -0.093 -2.79 AO --- 1 FORECASTS, BEGINNING AT 135 ---
TIME FORECAST STD. ERROR ACTUAL IF KNOWN
136 6.1037 .0332 6.1334
O outlier detectado, de acordo com as nossas especificações, é tratado como um AO. A previsão para t=136 é agora baseada no modelo estimado e nos outliers detectados. Em subsequentes origens da previsão não são detectados outliers adicionais e o outlier em t=135 é continuamente detectado como um AO.
Na tabela 6.3 temos os valores observados, as previsões em um passo sem (comando FORECAST no sistema SCA) e com procedimento de detecção de outliers (OFORECAST), os erros de previsão e a resultante raiz do erro quadrático médio (REQM ou RMSE).
OFORECAST paragraph FORECAST paragraph
Actual Step-ahead Forecast Step-ahead Forecast t value forecast error forecast error 133 6,0331 6,0410 -0,0079 6,0386 -0,0550 134 5,9687 5,9846 -0,0159 5,9851 -0,0164 135 6,0379 6,1306 -0,0927 6,1311 -0,0932 136 6,1334 6,1037 0,0297 6,0440 0,0894 137 6,1570 6,1715 -0,0145 6,1429 0,0141 138 6,2823 6,3052 -0,0229 6,2971 -0,0148 139 6,4329 6,4214 0,0115 6,4160 0,0169 140 6,4069 6,4446 -0,0377 6,4397 -0,0328 141 6,2305 6,2343 -0,0038 6,2391 -0,0086 142 6,1334 6,1018 0,0316 6,1030 0,0304 143 5,9661 5,9960 -0,0299 5,9945 -0,0284 144 6,0684 6,0810 -0,0126 6,0825 -0,0141 --- --- RMSE 0,0343 0,0416
Veja-se que a REQM para a previsão com o comando OFORECAST é cerca de 17 5. % inferior à do comando FORECAST. A diferença é causada pelo resultado da previsão em um passo para t=136. Fomos informados pelo comando OFORECAST que um outlier ocorreu em t=135. Como resultado, a previsão dada por ambos os comandos FORECAST e OFORECAST é superior ao valor actual sensivelmente no mesmo montante. Contudo, detectando um outlier em t=135, a previsão OFORECAST para t=136 é mais exacta do que aquela do comando FORECAST. Deste modo, o comando OFORECAST consegue adaptar-se à ocorrência de novos outliers e aumentar a exactidão das previsões.