• Nenhum resultado encontrado

CAPÍTULO 2 – O DESAFIO TEÓRICO-METODOLÓGICO DOS ESTUDOS

2.3 Principais Contribuições 50 

2.3.2 Federalist Papers 51 

Os “Federalist Papers”, publicados entre 1787 e 1788, eram uma série de 85 ensaios dirigidos à população de Nova Iorque com o objetivo de convencê-la a ratificar a Constituição norte-americana. A autoria era assinada como Publius, e era sabido que se tratava de autoria coletiva de três pessoas que se revezavam na escrita: Hamilton, Madison e Jay. A dúvida sobre a autoria era relativa a 12 ensaios, mas provas externas restringiam a disputa apenas entre Hamilton e Madison.

Os primeiros estudos sobre esse caso foram feitos em 1940 por Mosteller, em parceria com outro pesquisador, e tinham seu foco principal em métodos estatísticos. Eles começaram pela análise de extensão de frase, mas depois de muito trabalho de contagem acabaram por concluir que a média em Hamilton e Madison era praticamente a mesma, de 35 palavras por frase. Os resultados desanimaram Mosteller, que parou a investigação para só retomá-la com Wallace na década de 1960 (1964). Dessa vez, optaram por investigar o vocabulário de Hamilton e Madison, partindo das 30 palavras mais usadas nos textos de autoria comprovada de ambos. O método foi eficaz, e os dados apontaram que Madison era o autor dos 12 ensaios.

Segundo Hockey113, esse estudo transformou-se num clássico dos trabalhos sobre

autoria, em parte porque os antecedentes históricos são bem documentados e porque o conjunto de textos não é tão grande para projetos escolares nem tão pequeno para a análise estatística. Para Hockey, as duas maiores contribuições metodológicas desse estudo são:

a) a investigação e comparação de sinônimos; e

b) o contexto geral do problema, tendo apenas dois candidatos com farto material para comparação da parte de ambos, de mesmo gênero sobre o mesmo assunto. Mesmo com a questão da autoria resolvida, outros autores retomaram os Federalist Papers para testar novas metodologias. Foram eles: Merriam; Holmes e Forsyth; e Tweedie, Singh e Holmes. Hockey considera os primeiros trabalhos como fundadores, no sentido de que deram a base sobre o que contar. Embora reconheça que Mendenhall encontrou algo de interessante no estudo da extensão das palavras, ela relativiza essa importância usando o argumento de C. B. Williams de que o tamanho das palavras está relacionado ao contexto114.

113 HOCKEY, op. cit. 114 HOCKEY, op. cit., p. 109.

A mensuração de extensão de frase traz consigo o problema da definição de frase. Para os programas em geral, é a pontuação forte que determina início e fim de frase. Assim, pode- se ter problemas com abreviaturas, que podem ser codificadas (ou lematizadas) à parte. Há outros aspectos a serem observados e vários cuidados a serem tomados para evitar esses problemas. Em nosso caso, porém, como usamos um corpus muito grande, esses erros acabam por formar uma fatia insignificante na contagem do todo, e não vale a pena o tempo despendido para procurar cada caso.

A mensuração de extensão de frase, segundo Hockey, começou com W. C. Wake, em 1948, mas foram A. Q. Morton e seus colaboradores quem mais usaram esse recurso em seu estudo sobre a prosa grega. Outros casos do uso desse tipo de recurso deixaram dúvidas quanto a sua eficácia.

J. N. Binongo, graças a um estudo sobre o estilo de um escritor filipino publicado em 1994, concluiu que um mesmo autor pode variar bastante o tamanho de frase de um trabalho para outro. (Acreditamos que em Machado de Assis é o que acontece, ao compararmos o estilo do início de sua carreira, repleto de diálogos, ao estilo maduro, mais narrativo.) O que acabou por ajudar Binongo a distinguir o estilo de seu autor foi a lista de palavras mais usadas – no caso, ele optou por observar as 36 palavras mais frequentes.

A frequência das palavras, particularmente a das “common words”, pode ser considerada como o melhor discriminador para fins de investigação de autoria, porque este tipo de palavra é relativamente independente do tema abordado e elas são frequentes o suficiente para serem observadas mesmo em um corpus pequeno115. Como exemplo, Hockey

cita os marcadores de autoria dos Federalist Papers, em sua maioria palavras comuns, ao contrário das Junius Letters, em que Ellegård teria encontrado a maior dificuldade no fato de não ter focado especificamente esse tipo de palavra. O uso desse recurso aparece também no trabalho de Burrows.

Outro tipo de estudo usa muitas palavras comuns, separando os homógrafos e dividindo as palavras de acordo com sua função. Um exemplo é o de Kenny, The Aristotelian Ethics. O pesquisador escolheu uma série de discriminadores que acabam por cobrir 60% do vocabulário do corpus. São 36 partículas, 19 preposições, vários pronomes, advérbios, demonstrativos e artigos definidos.

2.3.3 Análise multidimensional ou multivariada

Ao invés de se basear em um ou dois fatores, a análise multidimensional ou multivariada investiga a relação entre muitos objetos diferentes, com muitas variáveis. Exemplos são os trabalhos de Biber e Frischer e colaboradores.

Hockey116 afirma que algumas técnicas de estudo multidimensional operam mediante a

redução das diferentes variáveis a um pequeno número de fatores subjacentes, que são carregados positiva ou negativamente com alguma das variáveis em estudo. O primeiro fator ou dimensão contém a maior quantidade de informação e, dependendo da natureza dos dados, a maior parte das variáveis pode ser representada por um pequeno número de fatores – às vezes, somente dois. É então possível examinar as relações entre os objetos ou variáveis colocando-os em um diagrama que mostre as relações espaciais como acontecem em algumas funções disponíveis no Hyperbase, a exemplo da análise fatorial e seus diagramas e gráficos correspondentes.

Para Hockey, não há regras rígidas para os estudos de autoria, o que vale é a máxima de que “mais é melhor”, ou seja, “mais textos, mais testes”117.

Estelle Irizarry tem um estudo sobre a obra The misfortune’s of Alonso Ramirez, de Carlos de Siguenza Góngora. Este autor afirmava que seu livro era a transcrição de uma narrativa (oral) de um marinheiro analfabeto, o próprio Ramirez do título. Para verificar a veracidade da afirmação de Góngora, a pesquisadora comparou o romance com três textos narrativos do autor. Ela constatou que o romance era composto de frases mais curtas, mas que não havia diferenças significativas na extensão das palavras. Além disso, a autora listou as palavras mais e menos usadas e pôde observar também construções sintáticas e morfológicas; para que fossem analisadas, estas precisariam aparecer, no mínimo, cinco vezes em uma mostra de 4 mil palavras. Por fim, Irizarry constatou que várias palavras e expressões ocorriam com maior frequência nas narrativas do que no romance. Após vários testes, a pesquisadora concluiu que é muito provável que Ramirez seja, de fato, uma pessoa, e não apenas personagem.

Dixon e Mannion, um estudioso das Humanas e um matemático, estudaram onze ensaios periódicos publicados postumamente atribuídos a Oliver Goldsmith. Para a investigação de autoria foram usados textos de Goldsmith e de quatro outros autores.

116 HOCKEY, op. cit., p. 116. 117 HOCKEY, op. cit., p. 117.