• Nenhum resultado encontrado

1. R EVISÃO DA L ITERATURA E E NQUADRAMENTO T EÓRICO

2.2. N OÇÕES G ERAIS NO E STUDO DE S ÉRIES T EMPORAIS

2.2.5. C RITÉRIOS DE C OMPARAÇÃO / S ELECÇÃO DE M ODELOS

Para finalizar esta abordagem geral a conceitos e ideias chave no estudo de séries temporais, vejamos alguns critérios usados numa das etapas subjacentes à modelação.

Uma das questões mais importantes no que respeita aos modelos auto-regressivos é precisamente o da escolha da sua ordem. Não existindo uma reposta, unanimemente aceite, é necessário recorrer a testes/critérios que nos permitam fazer opções com vista à escolha, o mais adequada possível, da ordem do modelo, dada a extrema importância de uma escolha apropriada.

Nesta linha, diversos critérios /estatísticas são apresentados na literatura para selecção de modelos, tendo estes como objectivo equilibrar o risco da escolha, por um lado de uma ordem menor que a real, provocando tal facto inconsistência na estimação dos parâmetros, por outro, de uma ordem superior, conduzindo ao incremento da variância desses estimadores. O equilíbrio em causa é feito através da atribuição de um custo/penalização pela exclusão/introdução de variáveis adicionais.

Na prática, os critérios baseados no máximo da função de verosimilhança são os mais utilizados, com maior ênfase para o Teste da Razão de Verosimilhança (LR), Critério de Informação de Akaike (AIC) e Critério de Informação Bayesiana (BIC). Se o LR é apropriado para testar dois modelos, desde que um dos modelos seja um caso especial do

outro, qualquer um dos dois critérios comparam o ajuste dentro da amostra, medido pela variância dos resíduos, contra o número de parâmetros estimados.

Analisemos, ainda que de um modo muito superficial, cada um dos três critérios acima referidos.

2.2.5.1. TESTE DA RAZÃO DE VEROSIMILHANÇA

No que respeita a modelos de regressão linear, existe um claro interesse em saber o valor da Soma dos Quadrados dos Resíduos (SQR), sendo que um valor alto da SQR sugere que a variável independente é importante, caso contrário, a variável independente não é útil na previsão da variável dependente.

Na regressão logística a ideia é a mesma: comparar os valores observados da variável dependente com os valores obtidos dos modelos (previsões) com e sem uma dada variável. A comparação dos valores observados com os valores preditos é baseada no logaritmo da verosimilhança, requerendo o LR a estimação do modelo restrito (sem inclusão da variável no modelo) e não restrito (com a inclusão da variável no modelo).

Com efeito, denotando por e por os vectores de parâmetros sem e com inclusão

da variável no modelo, respectivamente, podemos calcular o valor maximizado da função

verosimilhança sem e com a variável, denotado por e , respectivamente.

De um modo mais formal, estando o teste LR baseado no logaritmo da razão entre as

duas verosimilhanças, isto é, na diferença entre o e , temos:

Assim, para testar a existência de relação, caso o valor da estatística seja maior que o valor crítico ao nível de significância desejado, rejeitamos a hipótese nula de exclusão no modelo.

2.2.5.2. CRITÉRIO DE INFORMAÇÃO DE AKAIKE

O Critério de informação Akaike foi desenvolvido pela Hirotsugu Akaike, tendo sido publicado, pela primeira vez, em 1974 no trabalho "A new look at the statistical model

identification".

Esta estatística, permite fazer uma selecção do(s) modelo(s) que melhor se ajusta(m), pois avalia a qualidade de ajuste do modelo estimado. Contrariamente a outros testes já referidos, esta estatística não fornece um teste de um modelo no sentido usual de testar

uma hipótese nula que traduza a adequabilidade do modelo aos dados num sentido absoluto.

O valor da estatística referente ao AIC incorpora duas componentes, uma que valoriza a precisão do ajuste e uma outra que penaliza, por meio de uma função crescente, os modelos com um maior número de parâmetros. Deste modo, a variação nos valores da estatística de AIC, relativa a cada um dos modelos em análise, deve-se ao logaritmo das razões de verosimilhança entre os modelos, penalizando-se os modelos pelo número de parâmetros.

Em sentido lato, sendo o número de parâmetros do modelo e o valor maximizado

da função de verosimilhança, o valor de AIC é dado por:

Em suma, o AIC representa a distância relativa do modelo proposto ao modelo verdadeiro, ou de uma outra forma, a discrepância no ajuste do modelo proposto aos dados. Com efeito, o melhor modelo é aquele que apresenta um valor de AIC mais baixo.

2.2.5.3. CRITÉRIO DE INFORMAÇÃO BAYESIANA

O Critério de Informação Bayesiana, por vezes também referido como o Critério de Informação de Schwarz (SIC ou SC) por ter sido proposto por Gideon E. Schwarz no trabalho ―Estimating the Dimension of a Model‖, em 1978, é um dos mais utilizados na comparação de modelos. Este critério baseia-se, em parte, na função de verosimilhança, estando intimamente relacionado com AIC, mas incorporando um formalismo bayesiano. Se ambos os critérios permitem a comparação entre modelos, penalizando os modelos com maior número de parâmetros, no modelo bayesiano de Schwarz, essa penalização é mais rigorosa.

Basicamente, a ideia associada é partir-se de um modelo de regressão com vários lags e, gradualmente, ir reduzindo o número de lags até que se encontra aquele valor (número de lags) que minimize o valor do BIC.

De um modo mais formal, o valor da estatística associada a BIC é descrito por:

sendo o número de parâmetros do modelo, a dimensão da amostra e o valor

Se tivermos em conta a perspectiva bayesiana, o termo referente à função verosimilhança (identificado na expressão anterior), tendo em conta o exposto na secção 1.2., ganha uma forma característica descrita na expressão seguinte:

onde:

 é a função de verosimilhança

 é o vector de parâmetros na -ésima iteração (num total de iterações)

 é o numero de parâmetros do modelo

 é a dimensão da amostra

Observe-se que o primeiro termo do BIC avalia o ajuste do modelo e o segundo termo corresponde à penalização de acordo com o número de parâmetros. Com efeito, é possível inferir que quanto menor for o valor do BIC, melhor será o modelo, tal como no AIC.

2.2.5.4. COMPARAÇÃO DOS CRITÉRIOS

Face às considerações feitas em cada caso, podemos concluir que os três critérios apresentados, apesar de conceitualmente diferentes no que respeita à forma de avaliar os modelos, utilizam o mesmo critério estatístico (maximização da função de verosimilhança) como medida do ajustamento, definindo valores críticos diferentes. Esta é a diferença fundamental entre os três processos.

Com o LR, considera-se por hipótese que o modelo mais simples é o de melhor ajuste,

até que, dado um nível de significância , se observem diferenças estatísticas para um

modelo mais completo.

Por seu lado, utilizando-se o AIC admite-se que, do conjunto de modelos avaliados, nenhum modelo é considerado ―modelo verdadeiro‖, isto é, o que realmente descreve a relação entre a variável dependente e as variáveis explicativas, pelo que se tenta escolher o modelo que minimize as divergências. Já no BIC, está implícito que existe o modelo que descreve a relação entre as variáveis envolvidas (um ―modelo verdadeiro‖) e o critério tenta maximizar a probabilidade de escolha do verdadeiro modelo. Sublinhe-se finalmente, quando confrontamos os dois critérios, o modelo seleccionado usando a estatística BIC tende a ser mais parcimonioso comparativamente ao seleccionado pelo AIC.