• Nenhum resultado encontrado

Dos pressupostos da análise de regressão, a exogeneidade dos regressores, ou seja, a ausência de correlação entre as variáveis explicativas e o termo de erro, talvez seja a mais difícil de ser observada, uma vez que o termo de erro não é uma variável observável (BARROS et al., 2010). Wooldridge (2002) explica que uma variável explicativa é tida como endógena quando, em um modelo econométrico, está relacionada com o termo de erro. Para o autor, a endogeneidade de uma variável pode ser decorrente principalmente de três fatores: omissão de variáveis, que ocorre quando não se inclui no modelo variáveis de controle que podem estar relacionadas com a variável dependente e explicativas; erros de mensuração, que ocorrem quando não se dispõe de uma proxy capaz de captar com exatidão um construto que está sendo utilizado como variável explicativa; e simultaneidade, que ocorre quando uma variável explicativa na equação é função da variável dependente, havendo o efeito da causalidade reversa. Nos três casos, o não tratamento da endogeneidade dos regressores pode comprometer os resultados da regressão, tornando os parâmetros estimados enviesados ou inconsistentes (BARROS et al., 2010).

A forma padrão para se mitigar os problemas de endogeneidade dos regressores consiste na utilização de variáveis instrumentais (IV) (BARROS et al., 2010; WOOLDRIDGE, 2002). Se X, na Equação 2, é uma variável potencialmente correlacionada com o termo de erro μ, W será uma variável instrumental se W, na Equação 3, correlacionada com X, não for correlacionada com o termo de erro μ. Deste modo, W seria exógena. A modelagem por meio de equações instrumentais, segundo Barros et al. (2010), consiste em, inicialmente, estimar os parâmetros da relação entre X e W, conforme a Equação 3, assumindo-se que o termo de erro ε não é correlacionado com o instrumento W e que é diferente de zero.

= + + (3) Em seguida, utiliza-se os parâmetros e para construir uma variável resultante da projeção de X em função de W, aqui denominada Z, tal que � = + . Por fim, substitui- se X em (2) por Z, como descrito na Equação 4. Como não há correlação entre W e �, também não existirá correlação entre Z e �. De fato, Z pode ser entendido como a parcela de X não correlacionada com �, permitindo a estimação consistente do parâmetro original de interesse (BARROS et al., 2010; WOOLDRIDGE, 2002). Quando há mais de um instrumento para X, este procedimento é realizado para todos os instrumentos.

� = + � + � (4) Embora a modelagem de sistemas de equações com uso de variáveis instrumentais resolva, ou pelo menos mitigue, os problemas decorrentes da endogeneidade dos regressores, não é fácil ao pesquisador da área de finanças encontrar variáveis que satisfaçam os requisitos necessários para ser utilizadas como instrumentos (BARROS et al., 2010). Quando se trabalha com uma base de dados em painel, como neste estudo, pode-se recorrer ao método generalizado de momentos, ou simplesmente GMM (generalized method of moments). A abordagem GMM utiliza como instrumentos variáveis defasadas das próprias variáveis possivelmente endógenas, destacando-se as modelagens de GMM em primeiras diferenças (GMM-DIF) e sistêmico (GMM-SYS) (BARROS et al., 2010). Apesar destas modelagens terem sido desenvolvidas para aplicação em modelos dinâmicos, as mesmas podem ser aplicadas em modelos estáticos (BARROS et al., 2010).

O GMM-DIF, desenvolvido por Arellano e Bond (1991), trabalha a partir das diferenças entre as variáveis do modelo e sua primeira defasagem temporal, com o intuito de excluir o efeito da heterogeneidade não observada. Em seguida, procede-se à instrumentalização das variáveis possivelmente endógenas por meio do método generalizado de momentos.

O GMM-SYS surgiu como uma complementação ao GMM-DIF, e foi inicialmente explanado por Arellano e Bover (1995), sendo concluído por Blundell e Bond (1998). Segundo os autores, os instrumentos do GMM-DIF podem ser pouco relacionados com as variáveis possivelmente endógenas, quando o coeficiente do intercepto tende à unidade e quando há uma variância dos efeitos fixos da empresa (BLUNDELL; BOND; 1998). Para contornar este problema, pode-se realizar uma transformação em níveis, ou seja, em vez de transformar os

regressores para expurgar os efeitos fixos, como no GMM-DIF, transformam-se os instrumentos em diferenças para fazê-los exógenos aos efeitos fixos. O GMM-SYS é uma combinação das transformações em primeiras diferenças com as transformações em níveis, resultando em um sistema de equações (BLUNDELL; BOND; WINDMEIJER, 2000).

Neste estudo utilizou-se a rotina xtabond2 no software Stata 12® para a implementação do GMM-SYS. Desenvolvido por David Roodman em 2003, o xtabond2 permite a utilização de GMM em primeiras diferenças e em níveis, além de variáveis instrumentais exógenas. A rotina também permite reportar testes de autocorrelação de resíduos e de validade dos instrumentos. Inicialmente insere-se a lista de variáveis dependente e independentes, seguidas pelo conjunto de opções disponibilizadas pela rotina, dentre as quais está o uso de instrumentos em GMM (gmmstyle) e de variáveis instrumentais exógenas (ivstyle). Por padrão, a opção gmmstyle considera instrumentos de GMM em diferenças e em níveis.

Segundo Roodman (2009), o tratamento padrão para variáveis estritamente exógenas é o ivstyle – iv(varlist). As variáveis pré-determinadas, das quais não se espera simultaneidade com a variável dependente, mas se admite possível endogeneidade por omissão de variáveis ou erros de mensuração (BARROS et al., 2010), são instrumentalizadas por GMM de t-1 até a última defasagem temporal – gmm(varlist, lag(1 .)). As variáveis endógenas, das quais se espera efeitos de simultaneidade com a variável dependente, são, por padrão, instrumentalizadas com GMM a partir de t-2 – gmm(varlist, lag(2 .)).

Neste trabalho, a exemplo de Silveira et al. (2010), foram consideradas endógenas em todas as estimações as variáveis de controle métricas (tamanho, rentabilidade, dívida total, tangibilidade e valor de mercado) e a emissão de ADR. Para as variáveis de estrutura de propriedade foram estimados dois modelos, considerando-as endógenas e pré-determinadas. As variáveis indicativas da identidade e da nacionalidade do acionista controlador, além de tratadas como endógenas e pré-determinadas, foram também estimadas como estritamente exógenas. As variáveis de tempo (ano da observação) foram tratadas como estritamente exógenas.

Dentre as outras opções do xtabond2, este trabalho utilizou twostep, robust e small. Os comandos twostep e robust são utilizados para estimar o GMM-SYS com efeitos fixos em duas etapas com correção de variância para amostras finitas, proposto por Windmaijer (2005) e indicado para a correção de heterocedasticidade dos resíduos. O comando small, por sua vez, produz correção nos estimadores para amostras pequenas, resultando em estimações realizadas na distribuição t em vez de z para os coeficientes e na distribuição F em vez de χ2 para a adequação do modelo (ROODMAN, 2009).

O output do xtabond2 reporta ainda os testes de autocorrelação de Arellano e Bond e os testes de validade dos instrumentos de Sargan/Hansen. Os testes de Arellano e Bond identificam a existência de autocorrelação dos resíduos de primeira e segunda ordem em diferenças – AR(1) e AR(2), respectivamente. De acordo com Roodman (2009), para verificar a existência de autocorrelação em níveis, deve-se observar AR(2), dado que é esperada a autocorrelação negativa de primeira ordem – AR(1). O teste de Sargan utiliza a distribuição χ2 para testar a hipótese nula de que os instrumentos são exógenos. Entretanto, quando se trabalha com estimações em GMM de duas etapas, como nesta pesquisa, o teste J de Hansen é mais adequado (ROODMAN, 2009). Roodman (2009) ainda alerta para a inconsistência do teste J de Hansen para modelos com muitos instrumentos. Deste modo, devem-se evitar modelos que contenham mais instrumentos que grupos. Adicionalmente, o xtabond2 reporta o teste de diferença em Sargan/Hansen, que testa a hipótese nula de exogeneidade para subconjuntos de instrumentos (ROODMAN, 2009).