• Nenhum resultado encontrado

Variáveis instrumentais

No documento Ensaio sobre pobreza e desigualdade (páginas 44-48)

3 ASPECTOS METODOLÓGICOS

3.2 Metodologia

3.2.4 Variáveis instrumentais

Os modelos de dados em painel de efeitos fixos e de efeitos aleatórios apresentados anteriormente não resolvem o problema de endogeneidade, ou seja, qualquer situação em que uma variável explicativa é correlacionada com o termo de erro (WOOLDRIGDE, 2009). A simultaneidade é uma das fontes tradicionais de endogeneidade e ocorre quando uma ou mais das variáveis explicativas são determinadas pela variável dependente no modelo, ou seja, influencia , mas também influencia . Neste caso, a variável explicativa

e o termo de erro , geralmente, possuem correlação entre si.

Para resolver este problema, pode-se utilizar o método de variáveis instrumentais e obter estimadores consistentes, mesmo na presença de endogeneidade. Para descrever esta abordagem, o modelo de regressão simples é escrito como:

(13)

Onde acredita-se que e são correlacionados, ou seja:

(14)

Para poder obter estimadores consistentes de e quando e são correlacionados, algumas informações adicionais são necessárias. A informação vem por meio de uma nova variável que satisfaz certas propriedades. Supõe-se que exista uma variável observável que satisfaça duas hipóteses:

 Hipótese 01 – A variável observável é não correlacionado com o termo de erro , de modo que:

O que significa que a variável observável é uma variável exógena na equação (13), ou seja, a variável não deve ter efeito algum sobre a variável dependente e também não deve ser correlacionada com outros fatores que afetam .

 Hipótese 02 – A variável observável é correlacionado com a variável explicativa , de modo que:

O que significa que a variável observável tem relação, positiva ou negativa, com a variável explicativa endógena .

Essa condição pode ser testada, dada uma amostra aleatória de uma população. O modo mais simples de testá-la é estimando uma regressão simples entre as variáveis e

Então, como , a hipótese 02 é válida somente se . Assim, deve ser possível rejeitar a hipótese nula ) e não rejeitar a hipótese alternativa ( ) – a um nível de significância suficientemente baixo. Se isso de fato ocorre, então, a segundo hipótese é válida.

Obedecendo as duas hipóteses apresentadas, a variável observável pode ser chamada de variável instrumental para .

Uma vez que se tem uma variável instrumental que obedeça as hipóteses apresentadas acima, ela pode ser usada para estimar os parâmetros da equação (13) de forma consistente. As hipóteses apresentadas acima servem para identificar o parâmetro . A identificação de um parâmetro neste com texto significa que é possível escrever em termos de momentos populacionais os quais podem ser estimados usando uma amostra de dados. Para escrever em termos de covariâncias populacionais, é utilizada a equação (13). A covariância entre as variáveis e é:

Sob a hipótese 01, e sob a hipótese 02, . Assim:

A equação (15) mostra que é a covariância populacional entre e dividida pela covariância populacional entre e , o que mostra que é identificado. O estimador de variáveis instrumentais de é:

O estimador de variáveis instrumentais de é simplesmente:

Onde o estimador é o estimador de variáveis instrumentas.

Aplicando a lei dos grandes números, tem-se que o estimador de variáveis instrumentais é consistente para : , dado que as hipóteses 01 e 02 são satisfeitas. Se alguma destas duas hipóteses não for válida, o estimador de variáveis instrumentais não é consistente.

O estimador de variáveis instrumentais do modelo de regressão simples pode ser estendido para um modelo de regressão múltipla. Considerando o caso onde somente uma das variáveis explicativas é correlacionada com o erro, tem-se o modelo linear padrão com duas variáveis explicativas:

(17)

Onde a variável dependente é certamente endógena, já que ela é correlacionada com o termo de erro . As variáveis e são as variáveis explicativas e é o temo de erro. Assume-se que o valor esperado de é zero: . Na equação (17), a variável é exógena, ou seja, não é correlacionada com o termo de erro enquanto que a variável

suspeita-se ser endógena, ou seja, é correlacionada com o termo de erro .

Se a equação (17) for estimada por OLS, todos os estimadores serão viesados e inconsistentes. Será, então, necessário encontrar uma variável instrumental, denominada , para que não esteja presente na equação (17) e que seja exógena. Portanto, os pressupostos chave são que o valor esperado do termo de erro seja zero e que e não são correlacionadas com o termo de erro. Assim:

(18) (19) (20)

(21)

Dadas as suposições apresentadas acima, os estimadores , e são obtidos resolvendo:

(22) (23) (24)

As equações (22)-(24) são um conjunto de equações lineares nas três incógnitas , e . Os estimadores são chamados estimadores de variáveis instrumentais.

Ainda, é necessário que a variável instrumental seja correlacionada com , mas o sentido em que estas duas variáveis são correlacionadas é complicado pela presença de na equação (17), por isso, é necessário que esta correlação seja parcial. A maneira mais simples de expor essa condição é escrever a variável explicativa endógena como uma função linear das variáveis exógenas e do termo de erro, da seguinte forma:

(25)

Onde, os parâmetros são parâmetros desconhecidos e, por definição:

(26) (27) (28)

Em outras palavras, e são correlacionados, esta correlação pode ser positiva ou negativa, mas não pode ser nula.

Ao adicionar mais variáveis explicativas exógenas ao modelo, o modelo estrutural pode ser escrito como:

(29)

Onde a variável explicativa é correlacionada com o termo de erro . Seja uma variável não encontrada na equação (29) e exógena. Portanto, assume-se que:

(30) (31)

E:

(32)

É necessário que:

Sob as hipóteses (30) e (31), é um instrumento válido para a variável explicativa endógena .

No documento Ensaio sobre pobreza e desigualdade (páginas 44-48)

Documentos relacionados