América do Norte Europa Ásia América do Norte
4 MODELOS DE DADOS EM PAINEL
4.1 Modelos de efeito fixo
Conforme apresentado acima, ao tratarmos de modelos de efeitos fixos, estamos considerando a hipótese que as diferenças entre as
N unidades cross-section são capturadas no intercepto Di, ou seja,
segundo Greene (2003, p.287)32 “cada Di é tratado como um parâmetro
desconhecido a ser estimado”.
Sendo yi e X vetores com T observações para cada i-ésima
unidade cross-section, i ser a T×1 coluna de valores das variáveis binárias (0 ou i) e estando Hi associado a um vetor Tu1 de distúrbio,
temos:
i iE
D
i iy
X
i
İ
(4.5) ou y = [X d1d2... dn]ª º
H
« »
¬ ¼
ȕ
Į
(4.6)tendo em di a representação da variável dummy da i-ésima unidade
cross-section e irá valer um (1) quando i = n e a zero (0), quando do
contrário. Logo, considerando D = [d1 d2 ... dn] como uma matriz
n×Tun, o modelo é assim desenvolvido:
E
D
y X
D
İ
(4.7)Esta equação é normalmente conhecida como modelo least square dummy variable (LSDV), tendo K parâmetros no vetor X e n colunas em D e esta regressão terá o total de K+n parâmetros. Devemos tomar cuidado com o problema da multicolinearidade perfeita entre as variáveis dummies, isto é, sempre que formos estimar um modelo deste tipo, devemos excluir uma variável da amostra para que não ocorra o problema da armadilha das variáveis binárias. O modelo LSDV não trabalha com todas as variáveis dummies do modelo.
Neste modelo, segundo Marques (2000, p. 10) e Baltagi (2005, p. 13) a estimação do modelo LSDV por OLS irá gerar parâmetros BLUE33, apesar de incorrer em perdas de graus de liberdade dada a inclusão de variáveis binárias e que pode vir a ocasionar problemas de multicolinearidade. Desta forma, tanto o coeficiente angular (E) quanto o intercepto (D) apresentam variância mínima, maior eficiência e são não-viesados, uma vez que os resíduos, ou erro, apresentam distribuição normal, média zero (0), variância constante e não são correlacionados.
Além desta maneira de estimarmos o modelo de efeito fixo, podemos também utilizar o modelo de efeito fixo de transformação interna e o modelo de efeito fixo entre grupo, os quais serão analisados em detalhe, logo abaixo. Ambas as estratégias reportam o mesmo coeficiente angular (E) para as variáveis explicativas não binárias, mas existem vantagens e desvantagens nos usos destes dois modelos.
O modelo LSDV pode apresentar problemas a partir do momento que, mantendo T fixo, aumentamos a quantidade de unidades cross-section. Neste caso, apenas os estimadores das variáveis explicativas serão consistentes, enquanto o coeficiente das variáveis binárias serão inconsistentes, devido ao aumento no numero desses parâmetros com o aumento das unidades de corte transversal. Nestas circunstancias, estimar o modelo de efeito fixo por LSDV é ineficaz, sendo necessária a adoção de outro método de regressão.
O modelo de transformação interna não utiliza variáveis binárias, apresentando um ganho de graus de liberdade em relação ao modelo anterior e utiliza a diferença entre o valor das variáveis no grupo e suas respectivas médias, assumindo assim a seguinte forma funcional:
it it it it it it
y
y
x
x
İ
İ
(4.8)Os parâmetros estimados por transformação interna terão os mesmos valores que aqueles obtidos por LSDV, mas apesar de eliminar o problema da incidência de parâmetros, ele apresenta algumas desvantagens em relação ao anterior. Como nenhuma variável dummy é utilizada, o modelo apresentara maiores graus de liberdade, o que resulta em um baixo MSE e incorretos desvios padrões dos coeficientes estimados. Devido à exclusão do intercepto, o R2 reportado estará errado. (Apesar da exclusão da variável binária, é possível calcular o valor desta usando a fórmula
d y Ex
it)Outra possibilidade para se estimar modelos de efeito fixo é o modelo de efeito entre grupos ou modelo de regressão média geral que utiliza a média da variável dependente e das explicativas para calcular os parâmetros do modelo, tomando como hipóteses, a não existência de efeitos de grupo ou de tempo. A seguir segue sua forma funcional:
N T i i i 1 t 1
0
D
J
¦
¦
(4.9)Como este modelo utiliza a média do grupo, cada unidade cross-section será representada por apenas uma observação n, e por isto, este modelo irá apresentar mais graus de liberdade do que ambos os modelos anteriores (nuT). Este modelo também reporta R2 incorreto.
No modelo LSDV proposto anteriormente, estabelecemos com fixo o tempo e que as variáveis binárias diferem somente entre unidades cross-section, mas segundo Greene (2003, p. 291), o modelo de efeito fixo também pode ser estimado em relação ao tempo, bastando para isto, utilizarmos variáveis binárias para tempo ao invés das de grupo e ainda há outra possibilidade, que seria a expansão o modelo LSDV, utilizando ao mesmo tempo variáveis dummies de tempo e de grupo.
Para a análise do modelo de efeito fixo no tempo, o qual investigar o quanto o tempo cronológico afeta o intercepto, deve ser adotada a mesma lógica e procedimentos iguais aos utilizados no modelo com variáveis binárias de indivíduos. Portanto, assim como no modelo que utiliza dummies para indivíduos, neste também podemos estimar os parâmetros através do modelo de transformação interna e do modelo de regressão média modelo de regressão média. Para Marques (2000, p.11) dada a analogia de estimação de ambos os modelos, “as
propriedades dos estimadores LSDV mantêm-se, com a variante de o estimador de D ser consistente desde que N ĺ´
Em relação ao modelo LSDV expandido, ou seja, quando se utiliza ao mesmo tempo variáveis binárias de individuo e de tempo, este procedimento tenta retratar o comportamento das unidades cross-section de forma mais real. Ou seja, este modelo evidenciam como questões estruturais e cronológicas influenciam no comportamento de cada individuo. Conforme Greene (2003, p.291), o modelo pode ser assim apresentado: 0 1
:
( , ) 0
:
( , ) 0z
i it i itH
Cov
x
H
Cov
x
H
H
(4.10)Mas deve ser imposta as seguintes restrições para que se evite o problema da multicolinearidade (armadilha das dummies):
N T i i i 1 t 1
0
D
J
¦
¦
(4.11)Neste caso, a estimação por transformação interna, não será possível, visto que, com a eliminação dos efeitos individuais temporais, não será possível a estimação de variáveis que não variem no tempo ou de indivíduo para indivíduo. (Marques, 2000, p. 11).
Apesar de ser um modelo mais geral, ele apresenta uma grande perda de graus de liberdade e também por se tratar de um modelo estático, ele pode não capturar efeitos em alguns períodos passados, dentro da amostra analisada.
Uma vez definido o modelo, deve ser verificada a validade do mesmo. Para a realização deste teste devemos comparar o modelo OLS pooled, ou modelo restrito por apresentar apenas um intercepto geral, com o modelo LSDV irrestrito, o que implica na realização de um teste F ou um simples Teste Chow. Por estarmos interessados em determinar diferenças entre grupos, será testada a hipótese nula (Ho) aonde todos os
termos constantes são iguais, ou seja, o melhor modelo a ser estimado é o OLS modelo pooled. Portanto, a razão F utilizada para este teste é segundo Greene (2003 p. 289) 2 2 2
(
) / (
1)
(
1,
)
(1
) / (
)
LSDV Pooled LSDV
R
R
n
F n
nT
n k
R
nT
n k
(4.12)Segundo Duarte et al (2007, p.5) o modelo LSDV é preferível em relação ao modelo pooled, “[...] quando o intercepto está
correlacionado com as variáveis explicativas em qualquer período de tempo[...]” e quando temos disponíveis, todos os dados de uma determinada população, uma vez que o intercepto é tratado como um parâmetro fixo.
Apesar das facilidades de utilização de modelos de efeito fixo, Gujarati (2006, p.520-521) chama a atenção para alguns problemas que podem surgir, que estão relacionados com a perda de graus de liberdade, diminuindo a consistência dos parâmetros. Isto, devido ao grande número de variáveis explicativas pode ocorrer problemas de multicolinearidade, afetando os estimadores. O efeito da inclusão de variáveis que não mudam com o tempo podem não ser captados e a suposição de que os erros sejam homocedásticos pode não estar correta, levando a conclusões enganosas.