• Nenhum resultado encontrado

Mínimos Quadrados em Dois Estágios (Two Stage Least Squares – 2SLS)

No documento Ensaio sobre pobreza e desigualdade (páginas 48-53)

3 ASPECTOS METODOLÓGICOS

3.2 Metodologia

3.2.5 Mínimos Quadrados em Dois Estágios (Two Stage Least Squares – 2SLS)

Na seção anterior, foi considerada a existência de uma única variável explicativa endógena , juntamente com uma variável instrumental para ela. Geralmente, porém, existe mais do que uma variável exógena que pode estar correlacionada com a variável explicativa endógena , o que significa que estas variáveis são instrumentos válidos para .

Considere o modelo estrutural já apresentado anteriormente pela equação (17), o qual apresenta uma variável explicativa endógena e uma variável explicativa exógena. Suponha, agora, que existam mais duas variáveis exógenas: e , as quais não aparecem na equação e não são correlacionadas com o termo de erro . Assim:

(33)

Se as variáveis e são ambas correlacionadas com a variável explicativa , é possível usá-las como variáveis instrumentais. Neste caso, existem dois estimadores de variáveis instrumentais e nenhum deles será, em geral, eficiente. Uma vez que cada um dos , e é não correlacionado com o termo de erro , qualquer combinação linear é também não correlacionada com e, portanto, qualquer combinação linear das variáveis exógenas é uma variável instrumental válida.

Para encontrar a melhor variável instrumental, escolhe-se a combinação linear mais altamente correlacionada com a variável explicativa . Esta combinação linear é dada por uma equação para na forma reduzida, assim:

(34) Onde: (35) (36) (37) (38)

Então, a melhor variável instrumental para é a combinação linear de na equação (34), chamada :

(39)

Para que esta variável instrumental não seja perfeitamente correlacionada com é necessário que ou seja diferente de zero.

Esta é a primeira suposição de identificação, uma vez assumido que todos as variáveis são exógenas. A equação (34) é não identificada se e . É possível testar a

hipótese contra a hipótese alternativa usando uma

estatística .

A equação (34) divide a variável explicativa em duas partes. Uma delas é , que é a parte de que é não correlacionada com o termo de erro . A outra parte é , que é possivelmente correlacionada com o termo de erro , é por isso que é possivelmente endógena.

Considerando os dados sobre , é possível calcular para cada observação, dado que os parâmetros populacionais são conhecidos. Na prática, isso não ocorre, porém, é possível estimar a equação para na forma reduzida por OLS. Assim, usando a amostra, é possível regredir contra , e e obter os valores ajustados:

(40)

Isto é, tem-se para cada . A este ponto, é preciso verificar se e são conjuntamente significantes na equação (34) a um baixo nível de significância; se isto ocorre, a estimação usando variáveis instrumentais é uma perda de tempo.

Uma vez obtida , é possível usá-la como instrumento para . As três equações usadas para estimar , e são:

(41) (42) (43)

Resolvendo estas três equações com três incógnitas, têm-se os estimadores de variáveis instrumentais.

Com múltiplos instrumentos, o estimador de variáveis instrumentais é também chamado de estimado de mínimos quadrados em dois estágios (Two Stage Least Squares –

instrumento para , as estimativas de , e usando variáveis instrumentais são idênticas às estimativas usando OLS da regressão de contra e , na equação:

(33’)

Em outras palavras, é possível obter o estimador 2SLS em dois estágios. O primeiro estágio é a regressão da equação (40), onde são obtidos os valores estimados de . O segundo estágio é a regressão de contra e usando OLS. Como é utilizado em vez de , as estimações por 2SLS podem ser substancialmente diferentes das estimações por

OLS.

A regressão de contra e pode ser interpretada da seguinte forma: o valor estimado da variável explicativa é a versão estimada de e este última é não correlacionado com o termo de erro . Portanto, o método 2SLS remove de sua correlação com antes de fazer a regressão de contra e por OLS. Isto é considerado verdadeiro colocando dentro da equação (17):

(44)

Agora, o termo de erro composto tem média zero e é não correlacionado com e , é por isso que a regressão de contra e usando OLS funciona.

Ao adicionar mais variáveis explicativas exógenas ao modelo, o modelo estrutural pode ser escrito como:

(45)

Assume-se que cada variável exógena é não correlacionada com o termo de erro . Alem disso, é necessário que pelo menos uma variável exógena não esteja presente na equação (45) e seja parcialmente correlacionada com a variável explicativa . Essas duas suposições asseguram a consistência. Para que os erros padrão e as estatísticas usuais do método de 2SLS sejam assintoticamente válidos é necessário, ainda, considerar a hipótese de homocedasticidade: a variância do erro estrutural não pode ser dependente de nenhumas das variáveis exógenas.

O método de 2SLS também pode ser usado em modelos com mais de uma variável explicativa endógena. Considere o modelo a seguir:

(46) Onde: (47) (48) (49) (50)

As variáveis e são variáveis explicativas endógenas, as quais podem ser correlacionadas com o termo de erro .

Para estimar a equação (46) pelo método de 2SLS é preciso de pelo menos duas variáveis exógenas que não apareçam na equação (46), mas que sejam correlacionadas com as variáveis explicativas e . Supondo que existam duas variáveis exógenas e .

Então, é necessário que tanto como apareçam nas equações de e nas formas reduzidas. Esta condição é necessária para a identificação, mas não é suficiente. Supondo que aparece em cada uma das equações na forma reduzida, mas não aparece em equação alguma. Neste caso, não existem duas variáveis exógenas parcialmente correlacionadas com e e o método de 2SLS não apresentará estimadores de consistentes.

Geralmente, quando existe mais de uma variável explicativa endógena no modelo de regressão, a identificação pode falhar. Neste caso, deve-se impor uma condição necessária para a identificação, chamada condição de ordem.

Segundo esta condição, é necessário que haja, pelo menos, tantas variáveis exógenas excluídas quanto variáveis explicativas endógenas existentes no modelo. Para checar tal condição, é necessário apenas contar a quantidade de variáveis exógenas e endógenas.

No documento Ensaio sobre pobreza e desigualdade (páginas 48-53)

Documentos relacionados