• Nenhum resultado encontrado

CAPÍTULO 2 – O DESAFIO TEÓRICO-METODOLÓGICO DOS ESTUDOS

2.1 Um Novo Campo 41 

A especificidade do campo dos estudos auxiliados por computador em Ciências Humanas está intimamente ligada à maneira de configurar o objeto sobre o qual se debruça – em nosso caso, o texto literário – e de obter e analisar dados sobre ele. Com essa finalidade, são desenvolvidos programas especialmente para esse tipo de pesquisa.

As investigações que aliam o uso do computador a métodos estatísticos de análise de dados para o estudo de textos têm quase meio século em países como França, Inglaterra e Estados Unidos. Há uma extensa bibliografia, há um número significativo de programas desenvolvidos e disponíveis no mercado, além dos inúmeros estudiosos que fazem parte dessa comunidade acadêmica.

No Brasil trata-se de um campo incipiente: praticamente não há bibliografia em língua portuguesa90, e mesmo a produção do exterior não está disponível nas livrarias do país. Em

função disso, apresentamos a seguir um panorama do estado da arte nesse campo no mundo e, a partir daí, um balanço histórico desses estudos e uma relação detalhada das principais obras em duas tradições – de língua inglesa e de língua francesa.

2.1.1 Características

Michel Bernard91 lista uma série de características dos trabalhos dessa natureza. Uma

das principais é a interdisciplinaridade. Esse é o tipo de trabalho que envolve profissionais de várias áreas. No caso dos programas de análise textual (que geralmente são focados na estatística textual), isso acontece desde o primeiro momento, pois, para a concepção e o desenvolvimento da ferramenta, são necessários profissionais da computação e da estatística,

90 Os títulos relacionados à área tratam de linguística, não de literatura.

91 BERNARD, Michel. Introduction aux études littéraires assistées par ordinateur. Paris: Presses Universitaires de France, 1999.

bem como da linguística e mesmo da literatura92. Além disso, há profissionais especializados

para a assistência técnica, assim como para a manutenção dos equipamentos e dos programas. O envolvimento de máquinas sofisticadas e de uma série multidisciplinar de pesquisadores faz com que esse tipo de pesquisa se caracterize também por seu alto custo.

Como a ferramenta de estatística textual é aplicável a textos de qualquer natureza, pesquisadores de várias áreas – como Psicologia, Sociologia, Direito, História, Publicidade, Jornalismo, além da Linguística e da Literatura – acabam por se encontrar, mesmo que por computador, a fim de trocar informações e experiências. Bernard destaca o trabalho em equipe como uma marca dessa nova comunidade científica, unida pela tecnologia e pelas possibilidades abertas pela rapidez e precisão no levantamento de dados proporcionados por ela. O fato de muitos artigos dessa área serem publicados sob autoria coletiva é o exemplo citado por Bernard – será o fim da solidão do pesquisador?

Foi na área da Linguística que se originaram os estudos que unem análise de texto, estatística e, mais recentemente, informática. As possibilidades geradas pela confluência dessas áreas de conhecimento estimularam seus profissionais e pesquisadores a desenvolver conjuntamente tecnologias para levantamento, tratamento e análise de dados textuais – aplicáveis a qualquer texto, independentemente de sua natureza (jurídico, político, jornalístico, etc.).

A natureza interdisciplinar faz com que a estatística textual acabe por ser útil a muitos campos do conhecimento. Salem e Lebart93 dividem essas áreas de aplicação, por tipos de

abordagem do texto, em três grupos principais. Um deles é a análise de conteúdo, muito usada nas pesquisas na área de Comunicação, mais especificamente no Jornalismo. Os pioneiros foram B. Berenson e P. F. Lazarsfeld, com o trabalho The analysis of communications content (Universidades de Chicago e Nova Iorque), publicado em 194894. Outro é o da inteligência

artificial, área mais ligada à indústria, que desenvolve programas de tradução e comandos de voz para facilitar a interface entre usuário e máquina, programas especiais para portadores de deficiência, entre outros produtos. E um terceiro é a Linguística, que engloba lexicologia, lexicometria, morfologia, filologia, etc.

Hoje um dos principais produtos da estatística textual são os bancos de dados textuais: grandes compilações de textos em suporte eletrônico que servem tanto a trabalhos acadêmicos

92 É o caso do Hyperbase. O professor Etienne Brunet, que criou e desenvolveu o programa, tem formação na área literária, onde atua, mas é também estatístico e programador autodidata.

93 LEBART, Ludovic; SALEM, Andre. Statistique textuelle. Paris: Dunod, 1994. 94 LEBART; SALEM, op. cit.

quanto à democratização do acesso do público à literatura e a textos de outra natureza (jurídico, político, etc.).

Quanto aos estudos literários e de linguagem, particularmente, Raymond Siemens divide a aplicação da computação em dois grupos, com base nos resultados: aqueles nos quais o computador é usado para produzir, por meio da manipulação do texto, apoio convencional para pesquisas futuras (dicionários, concordâncias, etc.); e aqueles nos quais o computador é usado para a análise de trabalhos específicos de literatura (análise temática, estudos estilísticos)95. Há vasta bibliografia nessa área, principalmente em inglês e em francês, ainda

não disponível no Brasil.

2.1.2 Publicações e fontes

No exterior, as publicações mais importantes em inglês são duas revistas especializadas que tiveram origem em associações para o estudo da aplicação da computação (em sentido amplo) na área de Humanas: uma é a Computers and the Humanities96

(CTH), que acaba de mudar de nome para Language Resources and Evaluation, publicação internacional da Association for Computers and the Humanities (ACH), editada na Holanda pela Springerlink. Seu primeiro número foi publicado em 1966 e hoje tem quatro edições por ano, com a opção de versão impressa ou eletrônica. Outra é a Literary and Linguistic Computing97 (LLC), editada pela Oxford University Press, uma publicação da Association for

Literary and Linguistic Computing (ALLC), fundada em 1973. Seu primeiro número saiu em novembro de 1986. Também publica textos de autores do mundo inteiro e tem quatro edições anuais.

As duas associações mantêm uma parceria que fica explícita não só no sítio da LLC como também na promoção de encontros internacionais. O primeiro encontro promovido pela ALLC foi em 1970, em Cambridge, e depois anualmente até 1988, quando firmou uma parceria com a ACH para atuarem em conjunto. O primeiro evento conjunto foi realizado na Universidade de Toronto, no Canadá, em 1989. Desde então as conferências anuais se alternam entre Europa e Estados Unidos.

95 SIEMENS, Raymond G. A new computer-assisted literary criticism? Computers and the Humanities, n. 36, p. 259-267, 2002, p. 259.

96 http://www.springerlink.com/(03wgzpidh5yqtlekaksccvn4)/app/home/journal.asp. 97 http://llc.oxfordjournals.org/.

Na França, também há encontros periódicos a cada dois anos da comunidade acadêmica que trabalha na área. São as Journées d’Analyse Statistique des Donées Textuelles (JADT), que tiveram sua primeira edição em Barcelona, na Espanha, em 1992, organizada pelo mesmo grupo de pesquisadores de diversas universidades francesas que editam a revista especializada Lexicometrica. Outros periódicos especializados, em francês, são as revistas Corpus e Loxias, ambas produzidas por pesquisadores da Universidade Sophia Antipolis, de Nice.

Além das revistas, há ainda as listas de discussão especializadas que, com a internete, tornaram-se mais uma fonte de informação para o pesquisador.

2.1.3 No Brasil

As áreas de Letras e Linguística já se apropriaram da tecnologia dos computadores e da internete de variadas formas como ferramentas para seu trabalho. No Brasil, temos uma comunidade científica nessas áreas que vem, há algum tempo, discutindo o papel das novas tecnologias e as mudanças trazidas por elas no âmbito do ensino da literatura, na divulgação de textos literários via rede mundial de computadores (internete), bem como seu papel na produção literária feita em meio digital e pensada para ser consumida nesse tipo de suporte.

Entre as áreas que se destacam no Brasil nesse campo, encontram-se principalmente bases de dados com digitalização de textos (transformação de textos impressos em arquivos eletrônicos), bibliotecas digitais, bancos de dados sobre literatura98, edições eletrônicas,

produção literária em computador (principalmente para autores iniciantes que não conseguem editoras dispostas a publicar seus escritos). Porém, o uso de programas de computador para auxiliar num trabalho de análise textual de obra literária ainda é praticamente inédito no país.

Na UFSC, há projetos que estão sendo desenvolvidos junto ao Nupill, que, além da parceria com o Centre de Recherche Hubert de Phalèse, da Universidade de Paris III (Sorbonne Nouvelle), trouxe os professores Etienne Brunet (criador do Hyperbase) e Carlos Maciel (criador da base de dados Portext), ambos da Universidade de Nice (Sophia Antipolis), para palestras e cursos sobre o estudo da literatura com as novas tecnologias. Ainda na UFSC,

98 Três atividades desenvolvidas pelo Núcleo de Pesquisa em Informática, Linguística e Literatura (Nupill), na UFSC.

há trabalhos sendo desenvolvidos na área da Linguística de Corpus que também usam essas tecnologias.