Testes de Validação em modelos estimados por Pooled

3. METODOLOGIA DE PESQUISA

( − )⁄ − ú â

Testes de Validação em modelos estimados por Pooled

3. METODOLOGIA DE PESQUISA

3.5. Tratamento dos Dados

3.5.5. Testes de Validação

3.5.5.1. Testes de Validação em modelos estimados por Pooled

A maioria dos pressupostos que devem ser atendidos para a validação de um modelo

pode ser verificada por meio do modelo Pooled que é estimado via Mínimos Quadrados

Ordinários (MQO). Para a estimação do MQO de forma consistente alguns pressupostos

precisam ser atendidos (Johnston & Dinardo, 1998; Heij et al., 2004; Gujarati & Porter, 2011.):

(i) o valor médio do termo de erro deve ser igual a 0;

(ii) os parâmetros devem ser lineares;

(iii) as variáveis explicativas devem apresentar exogeneidade e independência em

relação aos erros;

(iv) os resíduos devem seguir uma distribuição normal;

(v) os resíduos devem ser homocedásticos;

(vi) os resíduos não podem ser autocorrelacionados;

(vii) as variáveis independentes devem apresentar ausência de multicolinearidade

perfeita; e

(viii) o modelo deve ser corretamente especificado.

Assim, os seguintes testes foram realizados no modelo Pooled para verificação do

atendimento a esses pressupostos e a consequente validação do modelo:

v Teste de multicolineariedade: O problema de multicolinearidade decorre da

existência de correlação entre duas ou mais variáveis independentes, ou seja, do

estabelecimento de uma relação linear entre elas. Segundo Gujarati e Porter

(2011), considerando uma regressão com k variáveis explicativas X

, X

, ..., X

,

existe uma relação linear perfeita se a condição exposta na Equação 15 for

satisfeita.

⋯ 0 (15)

em que λ

, λ

, ..., λ

são constantes tais que nem todas são simultaneamente zero;

permitindo assim que um das variáveis seja escrita como combinação linear das

demais. Ainda conforme os autores, diz-se que as variáveis X estão

intercorrelacionadas, mas não perfeitamente, se a relação ocorrer como

demonstrado na Equação 16.

⋯ 0 (16)

v em que ε

é um termo de erro estocástico, cuja presença demonstra que a

combinação linear das variáveis Xs não será perfeita, pois dependerá do valor

desse termo de erro. Desta forma, o problema de multicolinearidade pode

ocasionar a impossibilidade de estimação dos parâmetros do modelo de

regressão, se ela for perfeita; elevar a variância dos estimadores de MQO; e

tornar as estimativas imprecisas. O teste mais conhecido para detectar a

existência de multicolinearidade é o VIF (Variance Inflation Fator) ou fator de

inflação da variância calculado conforme a Equação 17.

1

1

(17)

em que R

é o R

da regressão de X

como função das demais variáveis

explicativas do modelo. O VIF é o fator que aumenta a variância de um

estimador em decorrência da colinearidade existente nos regressores. Quanto

mais se aproxima de 1, o VIF aproxima-se do infinito e da multicolinearidade

perfeita (Heit et al., 2004; Gujarati & Porter, 2011). Portanto, o ideal é o que

VIF apresente os menores valores possíveis, Gujarati e Porter (2011) sugerem

que o valor seja inferior a 10, mas o mais indicado é que seja bem próximo a 1,

pois se R

for igual a zero o VIF será igual a 1 e não existirá colinearidade.

v Teste de heterocedasticidade: como visto o MQO presume a

homocedasticidade dos resíduos do modelo, ou seja, uma variância uniforme

para todas as observações, caso isso não ocorra tem-se no modelo o problema

de heterocedasticidade. Esse problema pode decorrer da incorreta especificação

do modelo, da presença de outliers e de dados muito heterogêneos. Apesar de

ainda permitir que a estimação dos parâmetros seja realizada de forma não

viesada, a estimação das variâncias desses parâmetros e consequentes dos seus

erros-padrão ocorre por meio de uma fórmula viesada (Gujarati & Porter, 2011).

Desta forma, os testes baseados nessas estimativas, dada a presença de

heterocedasticidade, serão ineficientes e inválidos. A heterocedasticidade pode

ser identificada pela avaliação da natureza do problema, testes gráficos e por

testes formais robustos como Breusch-Pagan-Godfrey. Considerando um

modelo com k variáveis explicativas como demonstrado na Equação18, esse

teste assume que se a variância dos resíduos (σ

) não for constante ela pode ser

escrita como função de variáveis não estocásticas, como as próprias variáveis

⁽¹⁷⁾

₍₂₂₎