• Nenhum resultado encontrado

Frequentemente, encontramos observações discordantes em séries temporais. A sua

N/A
N/A
Protected

Academic year: 2021

Share "Frequentemente, encontramos observações discordantes em séries temporais. A sua"

Copied!
6
0
0

Texto

(1)

Capítulo 1

INTRODUÇÃO

Frequentemente, encontramos observações discordantes em séries temporais. A sua presença pode facilmente afectar os procedimentos convencionais de análise, nomea-damente podem enviesar seriamente as estimativas dos mínimos quadrados (MQ) dos parâmetros ARMA. O impacto destas observações designadas por outliers é, no entanto, muitas vezes omitido pela falta ou conhecimento de métodos para as detectar e as acomodar ao processo subjacente à série.

São ainda relativamente escassos os estudos sobre o tema dos outliers em séries temporais, comparativamente, por exemplo, ao que se passa no domínio da regressão linear. Uma das razões prende-se com a complexidade do tema associado à multiplici-dade de instrumentos de análise das sucessões cronológicas. A análise pode ser feita no domínio tempo, com os correspondentes modelos ARMA, ou no domínio frequência (análise espectral), a qual tem uma perspectiva diferente: em vez de se concentrar na estrutura de dependência entre os valores respeitantes a diferentes períodos de tempo, procura investigar em que medida diferentes frequências ou componentes periódicas contribuem para a variabilidade das sucessões cronológicas. No domínio tempo, a complexidade da análise resulta da multiplicidade de modelos subjacentes às séries, pode-se ter modelos autoregressivos (AR), de médias móveis (MA), autoregressivos de médias móveis (ARMA) ou ainda autoregressivos de médias móveis integrados (ARIMA). Esta diversidade traduz-se na necessidade de ajustar os diversos mecanismos de detecção e acomodação de outliers aos diversos modelos, o que dificulta bastante o tratamento do tema. Por outro lado, enquanto que nos modelos de regressão linear um

(2)

outlier é independente das observações adjacentes, o mesmo não se verifica nas séries temporais já que as observações estão correlacionadas. Face às dificuldades, ainda não se encontrou uma formulação que se possa considerar aceite de modo suficientemente geral. Muito ainda haverá a fazer.

Dada a multiplicidade de instrumentos de análise das séries temporais, restringimos a nossa atenção aos estudos efectuados no domínio tempo, e aos correspondentes modelos ARMA. Nomeadamente porque são relativamente reduzidos os trabalhos nas outras áreas de estudo.

Este trabalho tem como objectivo apresentar as principais linhas de rumo da inves-tigação nesta área. Pretendemos, sobretudo, apresentar um conjunto de instrumentos que permitam detectar e acomodar outliers. Num outro sentido, estudámos alguns dos princi-pais "packages" de análise estatística disponíveis comercialmente, tendo como objectivo verificar a forma como eram tratados os outliers nos respectivos módulos de séries temporais (veja-se o capítulo 7). Dada a limitação desses "packages" estatísticos, de-senvolvemos alguns programas informáticos que permitem determinar o valor de al-gumas estatísticas de detecção.

A dificuldade de formulação começa com o próprio tipo de outlier que devemos considerar. Fox (1972) introduziu os conceitos de outlier do tipo I e tipo II, vulgarizados na literatura, respectivamente como aditivos (AO - "additive outlier") e inovadores (IO - "innovational outlier"), os quais têm sido os considerados pela maioria dos autores. No entanto, numa perspectiva recente, veja-se por exemplo Chen e Liu (1993a, 1993b), são também englobados na categoria de outliers as alterações da estrutura da série, nomeadamente, alterações de nível: permanentes (LS - "level shift") e transitórias (TC - "temporary change").

Outro foco de divergência entre os autores prende-se com o modelo gerador de outliers considerado, Fox (1972) propôs modelos paramétricos, em relação com o

(3)

mo-Tiao e Chen (1988) e Tsay (1988) adoptando a formulação de Fox (1972) consideraram os outliers como casos particulares do modelo geral de intervenção de Box e Tiao (1975). Noutro sentido, Denby e Martin (1979) considerando os outliers como con-taminantes gerados por uma dada distribuição de probabilidades, propuseram modelos em relação com o modelo de contaminação por mistura. Este tema será analisado no capítulo 2.

Uma abordagem ao problema dos outliers consiste em limitar a sua influência na modelação de séries temporais. Neste sentido Denby e Martin (1979) consideraram um procedimento robusto para estimar os parâmetros do modelo na presença de outliers. Nesta abordagem, às observações discordantes são atribuídas, no processo de estimação, ponderações inferiores. Contudo, todos os tipos de outliers são tratados da mesma ma-neira, isto explica, em parte, porque é que os métodos robustos funcionam bem em alguns casos e mal noutros.

Denby e Martin (1979), Martin (1981) e Martin e Yohai (1984) propuseram e tudaram estimadores robustos para os modelos autoregressivos conhecidos como es-timadores M (tipo máxima verosimilhança) e M generalizados (GM). Estes eses-timadores e mesmo os estimadores dos MQ comportam-se relativamente bem em presença de IO. Quando os AO aparecem isto já não é verdade, os estimadores M não são robustos, nesta situação os estimadores GM constituem uma opção para obter estimadores robustos em modelos AR(p). Contudo, tal não se verifica em modelos ARMA com uma componente de médias móveis, um simples outlier num determinado período contaminará todos os termos subsequentes nas equações de estimação. Deste modo, no contexto dos modelos ARMA, Martin, Samarov e Vandaele (1981) propuseram um procedimento iterativo de estimação para o caso AO tendo por base os estimadores GM.

Bustos e Yohai (1986) sugeriram dois estimadores robustos para os modelos ARMA baseados nas autocovariâncias dos resíduos e autocovariâncias dos resíduos truncados,

(4)

respectivamente estimadores RA e TRA. Estes últimos, constituindo estimadores robustos para os modelos ARMA com uma componente de médias móveis.

No capítulo 3 apresentam-se os diversos métodos de estimação robusta.

Outra abordagem alternativa consiste em identificar os outliers, e depois estimar os parâmetros do modelo tendo em consideração o outlier detectado. Fox (1972) desen-volveu um teste razão de verosimilhança para detectar AO e IO num modelo autoregres-sivo puro. Chang, Tiao e Chen (1988) estenderam o teste a modelos ARMA e utilizaram-no num procedimento iterativo para detectar múltiplos outliers e estimação dos parâmetros do modelo ARMA. Tsay (1988) generalizou o método considerando alterações de nível transitórias e permanentes. Em dois artigos recentes, Chen e Liu (1993a) e Balke (1993) introduziram melhoramentos ao procedimento. Este método iterativo tem sido bastante utilizado por variados autores, com resultados bastante en-corajadores.

No procedimento iterativo os outliers incluindo as alterações de nível são tratados de uma maneira unificada. Isto é conseguido adoptando a abordagem paramétrica para descrever o impacto da observação discordante. Sob o modelo paramétrico, o impacto da perturbação é medida por um parâmetro o qual pode ser estimado e testado. O pro-cedimento segue uma linha de operação em duas etapas: identificação da localização e do tipo de outlier, e então ajustamento do seu efeito no intuito de estimação dos parâ-metros do modelo, consistindo em ciclos de especificação-estimação-detecção-remoção para tratar as perturbações mais significativas. O procedimento iterativo é apresentado no capítulo 4.

No capítulo 5 são apresentados diagnósticos alternativos ao método de detecção de outliers baseado no teste razão de verosimilhança usado no procedimento iterativo. Rosado (1984) propôs medidas de diagnóstico que se baseiam na análise do compor-tamento dos resíduos. Lee e Hui (1993), no contexto de um modelo AR(p), propuseram

(5)

matriz de projecção, designadas como medidas de alavanca ("leverages"). Abraham e Chuang (1989) propuseram uma medida do efeito da eliminação das observações outlier no valor estimado dos resíduos, as estatísticas Q. As quais permitem não só detectar mas também distinguir um AO de um IO. É ainda proposto um procedimento, em quatro etapas, para modelar as séries temporais em presença de outliers, no qual um processo ARMA(p,q) é aproximado por um AR(p+q).

Uma área de estudo directamente relacionada com a detecção de outliers, embora diferente, é o estudo das observações influentes. Um outlier pode ou não afectar con-sideravelmente as estimativas dos parâmetros do modelo, como os coeficientes ARMA e a variância do ruído. Chernick, Downing e Pike (1982) sugeriram que deveriam ser procurados outliers influentes examinando a matriz da função de influência das auto-correlações estimadas. Peña (1990) no quadro dos modelos ARMA, apresentou estatís-ticas indicadoras de AO e IO que têm forte influência no valor dos coeficientes es-timados, as quais se baseiam na substituição das observações discordantes por valores interpolados. No quadro dos modelos AR(p) Yatawara e Lin (1994) propuseram uma estatística para detecção de múltiplos outliers.

Num estudo extenso, Bruce e Martin (1989), no contexto dos modelos ARMA, propuseram dois diagnósticos com base na função de influência empírica. O diagnóstico DV mede a alteração na variância estimada do ruído, e o diagnóstico DC mede a alteração nos coeficientes ARMA estimados. Os autores concluem que é preferível a utilização do primeiro na estratégia de detecção. No caso de múltiplos e consecutivos outliers os autores propõem um diagnóstico de detecção baseado na eliminação iterativa de k observações. Por último, refira-se o trabalho de Ledolter (1990), no qual são aplicadas às séries temporais as medidas de deslocamento da verosimilhança introduzidas por Cook (1986, 1987). Com base nelas o autor propôs uma estatística simples de diagnóstico.

(6)

São relativamente reduzidos os estudos sobre previsão em presença de outliers em séries temporais. No entanto, a precisão da previsão poderá ser afectada devido ao (i) efeito "carry-over" do outlier no período de previsão e (ii) enviesamento das estimativas dos parâmetros do modelo.

Chen e Liu (1993b), com base no procedimento iterativo de estimação dos parâ-metros e detecção de outliers, estudaram o efeito dos outliers em termos da previsão, quando ocorrem no fim da série temporal (origem da previsão) ou próximo do fim da série. Concluíram que as previsões são particularmente sensíveis aos AO. Contudo, não são particularmente afectadas excepto se os outliers ocorrerem próximo da origem da previsão. Exploram também a perda de precisão na previsão quando o tipo de outlier não é correctamente determinado ou especificado. Este tema da previsão será abordado no capítulo 6.

Referências

Documentos relacionados

O Wyse VDA é uma solução de software para thin clients da Wyse e PCs compatíveis que oferece a melhor experiência de usuário para a largura de banda de rede alocada ao

Nossa estrutura organizacional é interdenominacional, ou seja, somos uma organização que aceita membros do corpo de Cristo de diversas bandeiras

É o instrumento de comunicação oficial entre os Chefes dos Poderes Públicos, notadamente as mensagens enviadas pelo Chefe do Poder Executivo ao Poder Legislativo para informar

Este trabalho buscou, através de pesquisa de campo, estudar o efeito de diferentes alternativas de adubações de cobertura, quanto ao tipo de adubo e época de

Apesar do glicerol ter, também, efeito tóxico sobre a célula, ele tem sido o crioprotetor mais utilizado em protocolos de congelação do sêmen suíno (TONIOLLI

16gicos adotados, uma variação, maior ou menor, na dinâmica de sala de aula e na duração das fases descritas na Metodologia descrita no capitulo IV. Parte da

Uma em cada onze espécies de mamíferos existentes no mundo é encontrada no Brasil (522 espécies), juntamente com uma em cada seis espécies de aves (1.622), uma em cada quinze

São Pedro e Santiago São Pedro e Santiago Bombarral Rio Maior Aljubarrota (Prazeres) Leiria Costa da Caparica Corroios Palmela Palmela Pinhal Novo São Sebastião São Sebastião