• Nenhum resultado encontrado

3.2. Estimação do Modelo

3.3.3. Aplicação do Modelo

Na selecção das variáveis do Modelo é seguida uma metodologia step-by-step onde se começa com o Modelo só com constante e, a cada passo, adiciona-se uma nova variável.

Este procedimento permite seleccionar um conjunto de variáveis tendo por base um outro conjunto mais lato de forma a construir, de forma inteligente, um modelo estatisticamente robusto [5]. Para tal, define-se uma série de critérios de selecção de variáveis que potenciam a obtenção de um modelo o mais satisfatório possível tendo por base a maximização da função de verosimilhança.

Em cada passo selecciona-se a variável que maximiza a função de verosimilhança. Após a selecção do Modelo é feito em cada passo uma filtragem à existência de variáveis não significativas estatisticamente (teste de Wald).

O processo de selecção ocorre de forma iterativa de acordo com uma sequência de passos interligados entre si. O objectivo é iniciar o processo de selecção no passo 0 sem qualquer variável seleccionada e finalizá-lo no passo k, seleccionando em cada passo intermédio a “melhor” das variáveis disponíveis. No final pretende-se obter um conjunto formado pelas melhores variáveis explicativas do incumprimento (variável dependente).

A decisão de prosseguir em cada passo é tomada tendo por base o Critério de Akaike: se o valor do coeficiente de Akaike é menor no passo p do que o era no passo p-1, deve efectuar-se o passo, senão o processo termina e o Modelo obtido no passo p-1 é o modelo final.

Além deste critério de paragem, sempre que não existam mais modelos válidos (de acordo com os princípios enunciados no início desta descrição) o processo termina igualmente.

Este procedimento procura guardar o histórico que suplanta todas as decisões tomadas. Apresenta-se abaixo, de forma resumida, o algoritmo utilizado na selecção do Modelo e na estimação dos parâmetros de ajustamento.

33

x : representa o número de variáveis explicativas no Modelo e k

x : representa o número de variáveis incluídas no Modelo no passo k do algoritmo. Os passos do método stepwise apresentam-se como segue:

§ Passo 0

No início do processo, ajusta-se o modelo de regressão logística apenas com a constante, calculando-se o valor da estatística de máxima verosimilhança l e o 0

valor do critério de informação AIC . 0

§ Passo 1

Posteriormente, procede-se à estimação de x modelos univariados (para cada uma das variáveis potencialmente explicativas) e ao cálculo do valor da estatística de máxima verosimilhança l e o valor do critério de informação 1i

1 i

AIC , onde iÎ

{

1,...,x

}

representa o índice da variável explicativa.

Condiciona-se a escolha do melhor modelo ao grupo de modelos univariados que apresentam as seguintes condições:

· Coeficiente estatisticamente significativo para a variável explicativa. Para o efeito, utiliza-se o teste de Wald de significância individual das variáveis explicativas.

· Coeficiente com tendência (positiva ou negativa) coerente com a teoria económica. Por exemplo, para uma variável de tendência crescente, ou positivamente relacionado com o rating, é expectável um coeficiente positivo.

Comparando o valor do critério AIC de cada um dos modelos univariados viáveis, selecciona-se o que apresenta maior valor de verosimilhança.

Para finalizar o passo, armazena-se a variável x e o valor 1 AIC do critério AIC 1

34

§ Passo k

O passo k tem por base a construção de x-xk-1 modelos multivariados. Os modelos analisados no passo k incluem xk-1 variáveis seleccionadas nos k-1

passos anteriores e uma nova variável, seleccionada de entre as que se encontram fora do modelo.

Para cada um dos novos modelos analisados estima-se o valor da estatística de máxima verosimilhança l e o valor do critério de informação ik AIC , com ik

{

1,..., -1

}

Î xk

i .

Condiciona-se a escolha do melhor modelo ao grupo de modelos univariados que apresentam as seguintes condições:

· As variáveis explicativas são não correlacionadas entre si: sempre que uma das variáveis não presentes no modelo calculado no passo k-1 está correlacionada com qualquer uma das que constituem esse modelo (correspondendo a correlação a um coeficiente de correlação superior ou igual a 0.6, em valor absoluto), essa variável é excluída da análise e o modelo respectivo é considerado inviável. Esta condição assegura que no modelo final não coexistirão variáveis correlacionadas. Caso todas as variáveis ‘externas’ ao modelo no passo k-1 se encontrem correlacionadas com variáveis presentes nesse modelo o processo de

stepwise termina, utilizando-se o modelo calculado no passo anterior.

· As variáveis explicativas são todas individualmente consideradas como estatisticamente significativas: ao incluir outra variável no modelo, e embora o modelo no seu global seja significativo, podem existir variáveis no modelo que tenham decrescido o nível da sua significância individual. Portanto, interessa determinar a significância individual de cada uma das variáveis incluídas no modelo e retirar do modelo variáveis que não sejam significativas, caso existam. Para determinar a significância individual de cada uma das variáveis utiliza-se o teste de

35

Wald. A hipótese nula do teste de Wald é de não significância da

variável, pelo que a rejeição desta hipótese implica a relevância da variável para explicar o nível de rating. São excluídas do modelo todas as variáveis que apresentem um p-value superior a 5% (o que corresponde à não rejeição da hipótese nula).

· O comportamento das variáveis explicativas é congruente com a teoria económica: Para cada modelo, verifica-se o sinal do coeficiente da variável no modelo.

· Caso o sinal do coeficiente se encontre de acordo com a teoria económica definida, o modelo é considerado válido (relativamente a esta condição). Por exemplo, uma variável para a qual se tenha definido uma tendência teórica crescente deve ter um coeficiente associado positivo. · Caso o sinal do coeficiente contrarie a teoria económica definida, esse

modelo é considerado inválido.

· Se neste passo todos os modelos considerados resultarem inválidos, o processo stepwise de selecção de variáveis termina.

Comparando o valor do critério AIC de cada um dos modelos multivariados viáveis, selecciona-se o que apresenta maior valor de verosimilhança.

Para finalizar o passo, armazena-se a variável x e o valor k AIC do critério k

AIC do modelo multivariado seleccionado.

O modelo seleccionado no passo k é considerado apenas se a estimação do mesmo não implicar um aumento (ou manutenção) do valor do critério de informação AIC. Ou seja, o passo k é válido apenas na condição de:

1 -

< k k AIC AIC

· Caso a condição não se verifique, o processo de stepwise termina, utilizando como modelo final o modelo estimado no passo anterior k-1.

36 · Se o critério for satisfeito, procede-se para o passo seguinte (ou seja, faz-

se k = k+1) e repete-se o mesmo procedimento. FIM do algoritmo

No final da aplicação do algoritmo obtém-se um modelo que cumpre os seguintes requisitos:

§ As variáveis são seleccionadas segundo um critério iterativo racional e prático, assegurando que todas as variáveis utilizadas são explicativas. Ou seja, para todas as variáveis, rejeita-se a hipótese nula do teste de Wald (de não significância da variável explicativa).

§ As variáveis seleccionadas não são redundantes para o modelo, garantindo-se que a sua contribuição acresce valor às estimativas realizadas com base no modelo.

§ As variáveis seleccionadas não são correlacionadas duas a duas. Caso sejam correlacionadas, as variáveis não podem ser consideradas em conjunto.

37

Documentos relacionados