• Nenhum resultado encontrado

Número de observações: large n x small n

PARTE I FUNDAMENTAÇÃO E DESENHO DE PESQUISA

3 FUNDAMENTAÇÃO METODOLÓGICA

3.2.2 Número de observações: large n x small n

Pesquisas large n são geralmente quantitativas, dado que métodos estatísticos conseguem contemplar mais facilmente um conjunto numeroso de observações. Por abarcar um número elevado de casos, naturalmente são pobres em detalhamento e profundidade, mas ricas generalidade e em alcance inferencial. Assim, suas explicações são mais satisfatórias quando se quer entender o comportamento de uma relação causal numa população em geral. São, portanto, mais recomendadas para mensurar os efeitos das causas (i.e.: “o quanto X afeta Y?” ou “o quanto de Y pode ser explicado por X?”), sendo também chamados de “orientados a variáveis” ou “orientados à população” (MAHONEY, 2008; RAGIN, 2004).

Pesquisas small n possuem um número restrito de casos. Elas se valem principalmente dos métodos qualitativos, privilegiando profundidade e conhecimento do contexto ao invés de generalização e parcimônia. Graças ao seu foco intenso em poucos casos, é uma pesquisa que se preocupa mais com a produção de resultados específicos. Em outras palavras, preocupa-se com as causas dos efeitos (i.e.: “o que causa Y?”), sendo por isso também chamadas de “configurativas” ou “orientadas a casos” (MAHONEY, 2008; RAGIN, 2004).

3.2.2.1 Trade-off na escolha da quantidade de casos

A pesquisa comparada tem diante de si diferentes objetivos a atingir: precisão (nível de detalhamento); generalidade (grau de abrangência da explicação) e parcimônia (explicar muitos casos a partir de poucas causas) (PRZEWORSKI; TEUNE, 1970). Não é possível persegui-los todos ao mesmo tempo. Pesquisas parcimoniosas e gerais não serão precisas, pois para recobrir um número elevado de casos não se pode mobilizar muitas variáveis. Simetricamente, mais

precisão exige mais detalhamento, implicando, portanto, menor generalização e parcimônia. Há um trade-off entre esses objetivos, que impacta diretamente na escolha da quantidade de casos: a análise de muitos casos exigirá graus maiores de abstração conceitual, ao passo que a de poucos casos permitirá maior concretude e especificidade (LANDMAN, 2008, p. 25).

Tal preocupação com a orientação ou a casos ou a variáveis está presente neste estudo. Por um lado, como exposto no Capítulo 2, a literatura acumulou ao longo da última década numerosas variáveis e hipóteses sobre a liderança regional e é meu objetivo pôr à prova esse rol de determinantes. Por outro, o campo das RI, e sobretudo um subcampo do regionalismo como este, é fortemente marcado pela singularidade dos poucos casos relevantes (KING, 2001). Por isso, é preciso detalhar com mais clareza qual a opção que adoto e suas potencialidades. 3.2.2.2 Classificando esse estudo

3.2.2.2.1 Definições

Para definir se esta tese observa muitos ou poucos casos, é preciso, antes de tudo, estabelecer algumas precisões terminológicas. Portanto, defino a seguir como entendo e aplico os termos “unidade de observação”, “observação” e “caso”, a partir de seus usos convencionais na literatura.

A unidade de observação é o nível imediato de coleta dos dados, para os quais são registrados os valores de todas as observações. A observação, por sua vez, é o registro singular do valor de cada variável estudada. O caso, por fim, é composto por várias unidades de observação agrupadas.

Estudos em Política Comparada e RI tradicionalmente têm no Estado-nação soberano sua unidade de observação mais frequente. Este não pode ser o modelo para a atual tese, já que analiso o fenômeno da liderança e esta só existe entre um Estado dito líder e outro liderado, ou seja, em uma díade. Portanto, para esta pesquisa a unidade de observação é a díade-ano, as observações correspondem ao registro do valor das variáveis de interesse para o respectivo par a cada ano, e os casos são o conjunto de todas as díades-anos para cada país líder. Assim, a tese abrange dois casos de liderança regional (Brasil e Turquia), compostos cada um por várias unidades de observação (e.g.: o caso brasileiro compreende todas as díades-ano do Brasil e seus vizinhos sul-americanos), e essas unidades de observação reúnem as observações dos valores de todas as variáveis de interesse. Usando o jargão de bases de dados, as variáveis são colunas,

as unidades de observação as linhas, as observações as células, e os casos são um conjunto de linhas.

Feitas essas definições, pode-se afirmar que esta tese faz uma comparação entre casos e intracasos: os casos brasileiro e turco serão comparados entre si, mas, como cada caso é observado ao longo do tempo, eles serão também comparados consigo próprios (e.g.: a liderança brasileira nos anos 1990 vs. nos anos 2000). Por observar variação entre casos e ao longo do tempo, esta tese não pode ser classificada como um estudo de caso, sendo ao invés um estudo de dados em painel ou, mais especificamente, Time-Series Cross-Sectional (TSCS), de acordo com a classificação de Gerring (2004, p. 343). Os aspectos computacionais do TSCS serão tratados na Seção 3.3 deste capítulo. Por ora, é importante destacar a utilidade de um estudo deste corte ao invés do estudo de caso.

3.2.2.2.2 Porque um estudo large n e TSCS é útil neste campo

Como exposto na revisão teórica do Capítulo 2, os estudos de caso individuais e as comparações de poucos países são as abordagens predominantes no estudo da liderança regional. Tal predominância pode ser explicada por alguns fatores: só há alguns poucos países pertencentes à classe das PRs ou aos BRICS, o que torna estudos aprofundados de um ou dois casos uma escolha natural (FLEMES; NOLTE, 2010); também, PRs são um fenômeno (relativamente) novo na política mundial e, como um campo de pesquisa jovem, requer esforços de construção de teoria, os quais são, novamente, o produto de estudos em profundidade.49

Há mais de uma década o tópico tem recebido tratamento específico na literatura acadêmica. Pode-se afirmar que avançou de um momento inicial interpretativo para um mais preocupado com testes e validações. A evolução do campo se deixa acompanhar através das tendências da literatura especializada. Os primeiros artigos do tema tomavam como ponto de partida as limitações de teorias estabelecidas (sobretudo middle-powermanship e regionalismo) para explicar o comportamento dos países emergentes e tentavam propor novas categorias (HURRELL, 2006; JORDAAN, 2003; SCHOEMAN, 2000; SOARES DE LIMA; HIRST, 2006). Nos anos seguintes, viu-se um esforço de consolidação teórica mais intenso, voltado à proposta de tipologias generalizáveis (DESTRADI, 2010; NOLTE, 2010; PRYS, 2010). Em anos mais recentes, proliferaram as aplicações destas tipologias e seus corolários teóricos a

49 O status theory-building deste campo pode ser constatado, por exemplo, na abundância de trabalhos classificatórios e tipológicos, lidando principalmente com quais características devem ser consideradas ao definir uma potência regional. Uma revisão extensa de tais propostas é feita no Capítulo 2.

diferentes casos, no intuito de confirmar ou nuançar os predicados da teoria. Nota-se, em especial, um esforço em alargar o espaço conceitual, através de estudos de países que tradicionalmente não são considerados potências emergentes ou regionais (ALDEN; LE PERE, 2009; BURGES, 2015; DAL, 2016; FLEMES, 2010a; GODEHARDT; NABERS, 2011a; MALAMUD; RODRIGUEZ, 2013; MOURÓN; ONUKI, 2015).

Se utilizarmos a classificação de Lijphart (1971) para estudos de caso50, é possível

afirmar que a primeira década de pesquisa foi dominada por estudos interpretativos e “geradores de hipóteses”, isto é, buscando desenvolver generalizações teóricas aplicáveis a mais casos. Análises mais recentes seriam “confirmadoras/refutadoras de teoria” (theory

conforming/infirming), preocupando-se com testes e validação da teoria. O presente trabalho

participa desta última categoria.

Conquanto a transição da pauta de pesquisa de um instante para o seguinte represente uma evolução, a predominância de estudos small n implica que várias das hipóteses e argumentos teóricos gerados ao longo do tempo tiveram seu alcance inferencial limitado (FLEMES; NOLTE, 2010). Isto é, suas conclusões se restringem a contextos específicos e ainda não foram testadas em um número mais amplo de observações.

Gerring (2004, p. 352–353) argumenta que em campos onde naturalmente abundam os estudos de caso, a utilidade de um novo estudo de caso é marginal. Também, em campos científicos amadurecidos, em que testes de hipótese são mais oportunos que incursões exploratórias, e quando o objetivo final é a causalidade e não apenas a descrição, convém trocar o estudo de caso por comparações entre unidades, e é isto que busco fazer.

Ademais, as relações exteriores das PRs têm sido frequentemente analisadas enfatizando seletos episódios diplomáticos notáveis, tais como mediação internacional, gerenciamento de crises, ou conflitos na região. A preferência empírica pelo high politics tem seu ônus: atitudes dramáticas são sempre mais raras que as banais, de modo que a diplomacia eventualmente retorna ao rotineiro, o que deixa o analista com um punhado de eventos memoráveis por ano. Estes são repetidamente revisitados pelos acadêmicos, para testar numerosas e variadas proposições causais. Confrontar diversas variáveis com poucas observações, todavia, leva ao problema de indeterminação (KING; KEOHANE; VERBA, 1994), isto é, “muitas variáveis, N pequeno” (LIJPHART, 1971, p. 686).51

50 Lijphart (1971) classifica os estudos de caso em seis tipos: (1) ateóricos; (2) interpretativos; (3) produtores de hipóteses; (4) confirmadores da teoria; (5) refutadores da teoria e (6) estudos de casos desviantes.

51 Quando há poucas observações, é difícil defender que um fenômeno se produz por um motivo e não por outro. Assim, encontramos na literatura sobre potências regionais análises que, observando o mesmo caso, chegam a conclusões opostas. Tomando como exemplo a África do Sul, a não-resolução da crise do Zimbábue é, para alguns

Um estudo large n é uma contribuição oportuna e significativa para o campo, ao permitir o teste dos vários argumentos teóricos elaborados até aqui contra uma população vasta de casos. Note-se que estudos utilizando dados quantitativos já foram conduzidos anteriormente, sobretudo entre os países BRICS, cujas capacidades e peso econômico são habitualmente vetores de comparação (CHEN; DE LOMBAERDE, 2014; JACOBS; VAN ROSSEM, 2014; VALENCIA; RUVALCABA, 2010). Todavia, pesquisas desse corte têm caráter mormente descritivo. Ainda são poucas as pesquisas com foco causal que utilizam não só dados, mas métodos quantitativos (LEMKE, 2010; MONTENEGRO; MESQUITA, 2017; THIES; NIEMAN, 2017) ou esquematizações formais para teste de hipóteses sobre liderança regional (DESTRADI; GUNDLACH, 2014).

Esta tese inova ao oferecer um estudo large n. Embora sejam apenas dois os casos comparados para a relação liderança-seguidores, deles se extrai um número alto de observações. Isso porque para cada caso é observado, em primeiro lugar, a evolução da atenção diplomática do líder regional, resultando em um amplo atlas descritivo, que cataloga o quanto cada país do mundo, a cada ano, recebeu em termos de atenção de política externa, para cada um desses dois líderes. Em seguida, testa variáveis causais, observando valores para díades entre o líder e seus seguidores em cada região. Desse modo, é uma comparação entre poucos casos, porém orientada a variáveis. Principalmente, esta estratégia permitirá o teste de hipóteses falsificáveis acerca do fenômeno da liderança regional.

Não obstante, note-se que este desenho de pesquisa compartilha algumas características dos estudos orientados a casos, tipicamente small n. Esses são geralmente caracterizados pela escolha intencional dos seus casos. Certamente, esta tese comunga dessa orientação. Ao invés de tentar amealhar todos os casos concebíveis em uma população de possíveis líderes regionais ou extrair uma amostra aleatória, concentrei-me em dois casos que, por suas idiossincrasias, prometem um valor analítico expressivo.

A justificativa pormenorizada da escolha dos casos brasileiro e turco exige uma revisão da literatura substantiva sobre a política externa dos dois países e, por esse motivo, será oferecida mais adiante na Parte II da tese. Como o presente capítulo ocupa-se de aspectos metodológicos, resta visitar o seguinte problema: como garantir que determinadas unidades são comparáveis?

sinal da impotência de Pretoria (ALDEN; SOKO, 2005) e para outros prova de sua liderança adaptada ao contexto (PRYS, 2009).

3.2.3 O que é comparável?

Sobre o que é comparável, Sartori (1991) aponta que entidades são comparáveis com

respeito às características que compartilham. Se não compartilham nenhum atributo, são

incomparáveis, se todos, são idênticas, e nos dois cenários a comparação é inútil. Para toda situação entre esses extremos, ela é viável.

Como esta tese propõe vínculos causais, é importante também evidenciar algumas pressuposições que permitem estabelecer relações causa-efeito a despeito do “problema fundamental da inferência”, qual seja, que é impossível ver um fenômeno ocorrendo e não ocorrendo simultaneamente em uma mesma unidade (RUBIN, 1974). Para a atual discussão sobre comparativismo, uma das pressuposições relevantes é a homogeneidade das unidades.

Duas unidades são homogêneas quando seus valores esperados na variável dependente (VD) são os mesmos se a variável independente (VI) assume certo valor. Dito de outra forma, as unidades comparadas não são distintas entre si no que diz respeito à sua reação, ainda que em muitos outros aspectos possam diferir. Forçosamente, no mundo real essa pressuposição dificilmente poderá ser estabelecida com firmeza, permanecendo no âmbito dos axiomas. Destarte, se supõe que a variável de interesse possui um efeito constante em todos os casos estudados. Evidentemente, as unidades observadas empiricamente irão apresentar valores muito discrepantes. O pressuposto da homogeneidade, porém, irá levar-nos a deduzir que, se o efeito causal é considerado constante entre unidades, os diferentes valores observados se devem não à incomensurabilidade das mesmas, mas à ação concorrente de outros fatores e variáveis sobre cada unidade. Por essa razão, fica novamente atestada a necessidade de atingir a condição

ceteris paribus como forma de controlar fatores idiossincráticos.

Resumindo, supõe-se que unidades são comparáveis com respeito às características que compartilham e que, no esforço de observar conjuntamente suas reações à variável de interesse, considera-se que elas reagirão ceteris paribus de forma semelhante aos mesmos estímulos. A partir dessa premissa inicial, percebe-se que comparações sempre terão de lidar com uma medida importante de heterogeneidade entre os casos. Assim, é preciso atentar para o problema da relatividade contextual e como a singularidade de cada caso dificulta e condiciona o exercício comparativo.

3.2.3.1 Equivalência

De acordo com Landman (2008, p. 33–36), o problema da relatividade contextual afeta dois elementos da pesquisa comparada: conceitos e sua operacionalização. No primeiro caso, a preocupação é se os conceitos usados significam a mesma coisa em diferentes contextos. A segunda diz respeito a como os conceitos podem ser medidos de forma válida em contextos diferentes. O autor destaca que a preocupação não deve ser chegar a conceitos e operacionalizações “idênticas”, mas sim “equivalentes”, de modo que sua comparação seja significativa.

3.2.3.1.1 Conceitos: as palavras designam as mesmas coisas em lugares diferentes?

Ao comparar casos distintos, uma das primeiras preocupações é se os conceitos utilizados são compatíveis em todos os contextos. Por exemplo, “cooperação para o desenvolvimento” é um termo utilizado por vários candidatos a líder regional para descrever seus investimentos e projetos bilaterais. Embora o nome seja o mesmo, os tipos de práticas que são agrupadas embaixo dessa rubrica variam enormemente de país a país (MILANI; DUARTE, 2015). Como garantir que os conceitos significam a mesma coisa em diferentes contextos?

Landman (2008, p. 33–36) lista três posturas intelectuais quanto ao problema da equivalência: (1) Universalista: visão nomotética, segundo a qual conceitos podem viajar a qualquer contexto. É característica de marcos teóricos que pressupõem uma homogeneidade entre unidades de análise (ex.: racionalistas/utilitaristas; funcionalistas; estruturalistas). (2) Relativista: todo conceito é localmente determinado, de modo que uma ciência comparativa “geral” é difícil ou mesmo impossível. Aproximam-se deste polo a etnografia, antropologia e a tradição interpretativista. (3) Posição intermediária: sugere que comparativistas relativizem ou hibridizem conceitos para permitir sua adequação contextual. Esta última é a posição adotada nesta tese.

Para Sartori (1991, p. 252), conceitos já são “generalizações disfarçadas”, ambicionando recolher vários casos e percepções singulares debaixo de um mesmo rótulo. O autor, contudo, alerta para o risco de o pesquisador, na busca por aumentar o número de casos sob análise, estique e deforme um conceito (“concept stretching”) ao ponto de esvaziá-lo de qualquer precisão semântica, tornando-o operacionalmente inútil.

Mesmo casos aparentemente únicos são potencialmente generalizáveis, pois encerram sob nomes próprios (e.g.: “Alemanha no entre-guerras”, “África nos anos 1960”, etc.) um

conjunto de fatores causais. Estes podem ser transportados de um contexto a outro de modo a se alcançar uma teoria mais geral, restando os fatores únicos e irreplicáveis como um resíduo da explicação teórica. Por isso, Adam Przeworski & Henry Teune (1970) defendem que o elo entre observações contextualizadas e teorias gerais está na substituição dos nomes próprios por variáveis relevantes (quando se acredita que dada classe de eventos sociais pode ser expandida para além de um sistema específico), e que este é o fim da pesquisa comparada. Para eles, o êxito em comparar um mesmo elemento em situações diferentes depende dos critérios de

confiabilidade e validade, já que para substituir nomes próprios de sistemas sociais por

variáveis analíticas é preciso assegurar-se que estas de fato capturam o fenômeno de interesse. Confiabilidade diz respeito a se as mensurações produzem os mesmos registros consistentemente. Por exemplo, se outros pesquisadores utilizando os mesmos expedientes nas mesmas condições obterão os mesmos números. Trata-se de uma preocupação com consistência e variabilidade. Validade significa que as variáveis utilizadas de fato capturam o conceito de interesse em todos os casos. Trata-se de uma preocupação com representatividade e conexão teoria-empiria.52

3.2.3.1.2 Operacionalização: encontrando os mesmos fenômenos em contextos diferentes

Segundo Jum Nunnally & Ira Bernstein (1994, p. 3), um dos significados de mensurar é representar os atributos de um objeto numericamente. Trata-se da parte da empreitada científica que zela pela precisão. A mensuração precede a inferência, já que esta se erige sobre as informações medidas. Przeworski & Teune (1970, p. 94–96) afirmam que boa parte dos fenômenos políticos de interesse (e.g.: “poder”) não podem ser medidos diretamente, apenas inferidos. Neste caso, recorre-se a outros indicadores observáveis que, espera-se, estarão relacionados com o fenômeno inobservável. A isto os autores chamam de “mensurações inferidas”.

Em política comparada, boas mensurações são fundamentais, pois são elas que subsidiarão qualquer comparação efetiva entre unidades. Todavia, são também desafiadoras, por conta das diferenças entre unidades e seus contextos. Isto é, inferências construídas a partir das mesmas observações, aplicadas a vários casos, podem não ser igualmente válidas em todos os contextos estudados.

52 A confiabilidade pode ser uma condição necessária para a validade, mas nunca suficiente. Uma medida consistente permanecerá inválida se não se puder provar vínculo entre o que é medido e o conceito desejado. Alguns autores subdividem a validade em diferentes componentes (e.g.: validade de face, validade de critério, etc.). Ver Nunnally & Berstein (1994), Chambliss & Schutt (2015) para uma discussão.

É preciso ter em mente que validade e confiabilidade são particularmente trabalhosas fora de um contexto experimental – como é o caso das Ciências Sociais. Isso pois o pesquisador, desejando encontrar no mundo empírico determinado conceito (e.g.: “cooperação para o desenvolvimento”), coleta valores de algum indicador (“volume de investimentos diretos”), mas estes valores são produzidos não somente pelo conceito de interesse, mas por uma miríade de confounders (“reserva de capital no país investidor”, “clima de investimento no país receptor”, “preferências dos investidores”, etc.). Por esse motivo, Blalock (1961, p. 347, tradução minha) afirma que uma “medida satisfatória de um conceito teoricamente definido pede uma teoria de como outras variáveis estão operando”.53

Indicadores não existem no vácuo. Dados empíricos são gerados através de ambientes nos quais operam múltiplas forças e é, portanto, preciso ter consciência de como estas impactam e condicionam aqueles. Cada contexto possui uma dinâmica própria engendrando a distribuição, significado e funcionamento dos fenômenos que serão diretamente observados. Muitos fenômenos de um sistema sequer existem em outros. Por isso, para Przeworski & Teune (1970, p. 106) o problema da equivalência existe porque mensurações inferidas são válidas apenas em relação a cada sistema e não automaticamente em relação a outros sistemas. Com isso em mente, os autores aconselham que “inferências feitas a partir de indicadores para conceitos devem ser modificadas de acordo com o sistema no qual eles foram observados” (PRZEWORSKI; TEUNE, 1970, p. 104, tradução minha).54 Ou seja, deve-se buscar a equivalência entre sistemas para assim garantir a comparabilidade.

Supondo que, para qualquer conceito teórico de interesse, há um número de indicadores observáveis aos quais se pode recorrer, a equivalência será uma função da semelhança entre esses conjuntos de indicadores observados em cada sistema (PRZEWORSKI; TEUNE, 1970, p. 117). Os casos que comparo são desafiadores no que tange à compatibilidade dos indicadores, dadas as grandes diferenças nos sistemas políticos e contextos regionais. Embora os conceitos possam ser os mesmos, os indicadores disponíveis em cada região para acessá-los empiricamente não o são em todas as instâncias. Por exemplo, em qualquer região, a polaridade regional (conceito) pode ser definida como a parcela de recursos de poder material detida por cada país (indicadores), ou a solidariedade regional (conceito) como distância ideológica entre chefes de Estado ao longo de uma dimensão de polarização política (indicadores). Na América