• Nenhum resultado encontrado

Principais abordagens: Pooled OLS, FD, FE e RE

PARTE I FUNDAMENTAÇÃO E DESENHO DE PESQUISA

3 FUNDAMENTAÇÃO METODOLÓGICA

3.3.4 Principais abordagens: Pooled OLS, FD, FE e RE

Ao decidir como regredir dados TSCS, o pesquisador está balanceado considerações teóricas com viabilidades empíricas. As questões temporais e espaciais acima expostas informam a escolha de um modelo. As quatro abordagens que serão descritas aqui são as mais tradicionais em análise de painel de dados, aplicadas comumente a TSCS também. Pooled OLS, em especial, tem sido explorado com mais frequência em estudos TSCS, embora questões de correlação serial e heterogeneidade motivem o uso de outras modelagens.

3.3.4.1 Pooled OLS

Ao reunir todas as observações coletadas ao longo do tempo em uma mesma regressão linear (“pooling”), tem-se Pooled OLS. Ao aplicar tal abordagem, supõe-se que todas as unidades observadas podem ser contempladas pela mesma equação, i.e.: ignoram-se idiossincrasias das unidades.

Como se viu anteriormente, dados TSCS frequentemente irão violar as premissas Gauss- Markov, sobretudo em sua estrutura de erros. Para superar duas dessas violações,

heterocedasticidade de painel e erros contemporaneamente correlacionados, Beck & Katz (1995) recomendam usar “panel corrected standard errors” (PCSE) no lugar dos erros padrão OLS. O PSCE já supõe que não há correlação serial no erro, para se concentrar apenas na correlação espacial. Esse procedimento terá boas propriedades se T > 15.

Diferente das outras três modelagens que serão apresentadas aqui, Pooled OLS não dispõe de estratégias para lidar com erros persistentes inerentes às unidades, ao que se chama também de heterogeneidade não-observada ou efeito fixo do termo de erro. Todas as demais decompõem o fator de erro em um componente fixo e outro variável.

3.3.4.2 First Differences

First differenced equations (FD) são equações Pooled OLS habituais, porém nas quais

todas as variáveis foram diferenciadas, isto é, subtraídas de seu valor no período temporal anterior. Essa subtração é eficiente em lidar sobretudo com problemas dinâmicos dos dados, como correlação serial e estacionariedade. Todavia, por subtrair observações aos pares, FD também reduz a variabilidade dos dados e assim aumenta os erros padrão, sendo portanto mais recomendado para grandes bases de dados. Ademais, a subtração entre períodos significa que todos fatores constantes ao longo do tempo ou variando na mesma intensidade desaparecerão. Essa limitação impossibilita o uso de diversas variáveis relevantes em Ciência Política e RI, como dummies, distâncias geográficas e variáveis de crescimento constante (e.g.: contagem de anos) (WOOLDRIDGE, 2013, p. 462–463). O uso de FD é uma das soluções drásticas recomendadas por Beck (2008) quando a aplicação de LDVs não consegue remover a correlação serial de erros.

3.3.4.3 Fixed effects

Fixed effects (FE) ou efeitos fixos são também uma regressão Pooled OLS. Assim como

a FD, ela busca livrar-se do componente fixo do erro, porém através da within transformation (subtrair observações da média) ao invés da diferenciação. Essa transformação também impede o uso de fatores invariantes no tempo.

Um dos benefícios frequentemente citados da FE em comparação com Pooled OLS é que, enquanto este postula apenas um intercepto para toda a amostra, aquele leva em consideração que cada país pode ter seu próprio intercepto. Green et al. (2001) argumentam que modelos Pooled OLS são demasiado populares em estudos de RI sobre interações interestatais,

em que uma díade de países é a unidade de análise. Eles contendem que esse método é inadequado, pois constrói um modelo com apenas um intercepto, falhando assim em capturar os efeitos fixos de cada par interestatal, ou seja, ignoram o problema dos efeitos fixos não- modelados (GREEN; KIM; YOON, 2001, p. 442).

Em comparação com FE, Pooled OLS terá estimadores viesados, já que não lida com o fator fixo do termo de erro. Ao usar FE, que introduz variáveis dummies para capturar as especificidades de cada painel, o modelo se torna menos viesado, porém também menos eficiente, já que a introdução das dummies consume graus de liberdade.

3.3.4.4 Random effects

Random effects (RE) diferem de FE e FD, pois não são um caso de Pooled OLS após

certa transformação, mas de Generalized Least Squares (GLS). Aqui se supõe que o fator fixo do componente de erro não está correlacionado com as VIs e, portanto, não precisa ser eliminado. Modelos RE são calculados levando em conta a proporção da variância entre os efeitos fixos/idiossincráticos e a variância dos erros. Quando há pouca variância nos efeitos fixos, as estimativas de RE se aproximarão de Pooled OLS e, no caso contrário, de FE. Essa informação é recuperada no estimador de efeitos aleatórios (θ), que assume valores de 0 a 1. Quando o estimador se aproxima de 0, as estimativas de RE estarão mais próximas de Pooled

OLS e quanto mais de 1, de FE. Uma das vantagens de RE é permitir a inclusão de variáveis

que não variam com o tempo. Em contraponto, a suposição que não há relação entre o componente fixo do erro e as VIs é difícil de sustentar na prática.

Beck (2001, p. 284) argumenta que para TSCS geralmente é o caso que FE são mais apropriados que RE, pois este é mais recomendado quando se consideram as unidades como uma amostra de uma população mais ampla, e aquele quando se busca fazer inferências restritas às unidades. Pesquisas TSCS, por terem N < T, geralmente preocupam-se mais com um conjunto restrito de nações, ao invés de tentar generalizações para uma população hipotética.

Uma deficiência dos FE em comparação com RE é que os efeitos fixos impossibilitam o uso de variáveis que não mudam com o tempo. Mesmo as que variam muito lentamente também são afetadas, porque o efeito fixo absorve o poder explicativo delas. Outra diferença significativa é que estimadores RE sempre terão algum viés, podendo só ser eficientes. A escolha entre FE e RE é portanto frequentemente entre eficiência (RE) e não-viesamento (FE).

A comparação direta entre os resultados das regressões Pooled OLS, FD, FE e RE é sempre informativa, pois aponta para os diferentes resultados obtidos a depender do que se faz com o erro fixo. Isso pois a Pooled OLS mantém o fator fixo totalmente inserido no componente de erro, RE mantém uma parcela, e FE e FD eliminam completamente o fator fixo (WOOLDRIDGE, 2013, p. 494).

3.4 REPLICABILIDADE E TRANSPARÊNCIA

Entendendo a ciência como uma empreitada pública e coletiva, a disponibilização dos dados desta tese é uma etapa importante para assegurar sua transparência, confiabilidade e contribuição com o acúmulo de conhecimento do campo (KING; KEOHANE; VERBA, 1994). Assim, compartilho da preocupação em tornar publicamente acessíveis os dados utilizados para fins de replicação (KING, 1995), exceto aqueles para os quais essa publicização não é permitida – e.g.: dados de circulação restrita e protegidos sob direitos de propriedade.

Mais especificamente, os dados originais relativos à atenção de política externa brasileira e turca, compreendendo a metrificação da diplomacia presidencial e presença diplomática desses países ao longo dos anos, serão publicados sob a forma de uma base independente, intitulada Rising Powers Diplomatic Network (RPDN).

3.5 SÍNTESE

Neste capítulo, situei a tese ontológica e epistemologicamente como uma investigação de corte positivista, que intenta detectar, através da observação empírica, padrões que possam ser generalizáveis. Foi também estabelecido que o método adotado será o comparativo, com recurso às ferramentas estatísticas comuns aos dados TSCS.

O objetivo desta fundamentação metodológica foi embasar a escolha das abordagens e expedientes utilizados, bem como evidenciar quais os potenciais e limitações inerentes à estratégia desenvolvida. Lançadas as bases metodológicas da pesquisa, é chegado o momento de estabelecer sobre elas o desenho de pesquisa. Destarte, sigo no próximo capítulo com a apresentação e discussão do desenho de pesquisa adotado.