ALEITURADOARQUIVODIGITALNAANÁLISEDODISCURSO Claudia M. Wanderley
Centro de Memória Unicamp
Resumo: Propomos um modo de articular a leitura da análise automática do discurso de Michel Pêcheux (PÊCHEUX, 1969) como o que viabiliza que uma máquina leia o discurso humano. Este é um lugar de encontro entre a leitura no discurso e, na ciência da informação, uma leitura automática, pensada como espaço de análise.
Discurso, Tecnologia, Leitura
1. Tecnologia da perspectiva discursiva 1.1 Deredec e AAD69
Em nossa proposta de pesquisa, desenvolvida no pós-doutorado1 entre 2004 e 2006 no Laboratoire de Traitement Automatique des Langues, a compreensão da noção de automatização (PÊCHEUX, 1969) e a possibilidade de sua re-leitura, seja no processo de análise automática do discurso seja no processo de formulação automática de efeitos discursivos, tem papel central.
Cito Pêcheux, (PÊCHEUX, inédito, p.19) em seu projeto para o Laboratório de Psicologia Social: Reflexions sur les conditions d’apparition d’une science des idéologies [disponível Universidade Paris VII]
“Nous entrevoyons ici une deuxiéme face de la demande sociale, dont l’importance est considérable: produire um produt technique), c’est toujours produire pour quelqu’un; en d’autres termes, la demande qui émane des rapports sociaux détermine en une seule fois non seulement la production de l’objet mais encore la manière dont il sera consommé, de telle manière qu’on peut dire: les conditions d’existence du produit technique sont aussi son destin”
A questão da produção de uma tecnologia explicitamente ligada à necessidade de consumí-la aponta para questões importantes das ciências da informação, quando
1 "!# $" %&'(% )*+ ,-'. % '/01 2!)'..3 2 .* 4561 798 3 %3. ' : 1 ;5<5=
pensamos que Pêcheux é também um produtor de “tecnologia da linguagem” (WANDERLEY, 2003, p. 45). Um aspecto deste autor normalmente pouco explorado no Brasil e na França, o Pêcheux ligado às Ciências da Informação; um filósofo e um cientista da informação que no mesmo gesto pensa a produção do instrumento digital e o seu uso. O esforço do pensador em propor um espaço de entremeio para uma interlocução cuidadosa com as ciências humanas através do discurso; a formalização necessária que se organiza ao matematizar relações de sentido em algoritmos; o esforço computacional em materializar o sentido de sua proposta em um instrumento, na construção do software de análise automática, através de AAD e Deredec2; a disposição para a conversa inter-disciplinar ao disponibilizar para os pesquisadores de Paris 7 seu instrumento de análise automática são práticas complementares na Análise do Discurso. São, de fato, a mesma proposta em diferentes níveis de realização intelectual. O círculo de afinidades intelectuais de Pêcheux, a amplitude de sua produção e sua constante disposição para ser atravessado por novas questões, por diferentes perspectivas, formam um quadro de pesquisa apaixonante. Seu texto nos dá pistas da compreensão de uma demanda existente, à qual ele foi capaz de elaborar, formalizar, automatizar, apontar um caminho de reflexão, enfim produzir referências em todas as instâncias intelectuais da época para colocar em questão de forma refletida a produção das ciências humanas.
1.2. O Panorama
No início da década de 70, na França, só existiam dois programas (ou softwares) capazes de análise automática de textos, que estavam disponíveis para os pesquisadores de ciências humanas: o de Michel Pêcheux, por via de um cálculo discursivo, digamos, e o de Ludovic Lebart, com base em um cálculo estatístico. Assim, Michel Pêcheux é um dos dois autores que inaugura a tradição da automatização da linguagem na França. Este fato nos mostra uma atualidade do autor e
2 $"!5JK5!);581LNM'.M)L5O. P2B%Q6R1STRU"8@ VL5 LN6 W(AX8% 1LNM'.MY 0'.% 6%PO. %V Z0M1 '. VP. %'Y) 6 %I
!5JK)!5B;[O%%W(A\]2 0./0M11.8 10O )O ^0
uma disposição fora do comum para estar ligado a seu tempo, para fazer uso dos recursos tecnológicos disponíveis.
A automatização proposta por Michel Pêcheux foi bem sucedida, dentro das possibilidades tecnológicas da época, do papel ainda germinal dos recursos eletrônicos, e de sua utilização pouco permeável. Curiosamente, nos arquivos da universidade Paris VII que mostram a consulta ao sistema, não há traços de lingüistas que tenham feito uso deste programa. Os pesquisadores que foram buscar o recurso da análise automática são, na sua maioria, provenientes de áreas como sociologia, antropologia, ou mesmo da psicologia. Fato este que nos aponta os vários aspectos desconhecidos do contexto da Analyse Automatique du Discours 1969 (AAD69) que precisam ser explorados, particularmente no que diz respeito à questão da automatização. Por exemplo, seria interessante perguntar a que tipo de demanda Pêcheux responde quando projeta o programa AAD e Déredec. Esta é uma das questões que buscaremos responder posteriormente.
1.3. AAD e seu desenvolvimento
Em nossa pesquisa, no intuito de trazer a discussão de Michel Pêcheux para o cenário atual de tratamento de textos, na França, trabalhamos com analistas do discurso e produtores de softwares de análise automática franceses.
Nos dois grupos nos deparamos com um certo desconhecimento relativo às questões do que estamos chamando de discurso eletrônico, ou do vínculo de Pêcheux com o digital. Como, na França, o trabalho de automatização de Pêcheux foi abandonado no início da década de 80, logo após sua morte, por falta de condições institucionais de avançar o desenvolvimento do programa, os analistas do discurso na França consideram o objeto da automatização em Pêcheux um assunto anacrônico. Na visão de uma geração de pesquisadores que trabalhou com Pêcheux este foi um caminho abandonado.
Por outro lado, os grupos que trabalham na produção de analisadores automáticos são herdeiros da via de análise automática pelo cálculo estatístico, e portanto pouco compreendem da dimensão discursiva de análise automática. Eles, no entanto, têm a oferecer uma rica história de relações com textos e sua matematização, desde sua preparação para a análise automática, até as várias possibilidades de funções
estatísticas que nos permitem trabalhar com textos eletrônicos. Uma grande diversidade de softwares está disponível para realizarmos análises, dependendo do gênero do texto e das perguntas que precisam ser respondidas em cada análise automática é um programa diferente a ser utilizado. Desde textos literários, textos políticos, textos traduzidos junto a sua versão original, textos em questionários, ou respostas abertas, há grupos investidos em criar recursos para que se possa ler e “interpretar” automaticamente os dados dos textos. As questões relativas ao que chamamos de discursivo não são contempladas nestes trabalhos. E, também nestes grupos, as questões que propusemos evidenciaram a existência de preocupações a respeito da linguagem, e de sua “manipulação” automática que até então não tinham sido levantadas no meio de trabalho das análises automáticas baseadas na estatística.
É nesta lacuna da produção intelectual e tecnológica francesa que instalei minha questão, e pontos - muitas vezes cegos - de conversa com os dois grupos. Tenho certeza de que a história da Análise de Discurso, ou o modo como ela se formula, no Brasil permitiu a elaboração e compreensão desta idéia da leitura discursiva através da máquina.
Um fato que contribuiu para o estranhamento dos pesquisadores franceses em relação ao vínculo entre a noção de “discurso” e “ciências da informação”, é que este vínculo funciona transversalmente, ou no entremeio como se diz comumente no jargão da AD, e permite a formulação de questões que vão do aspecto epistemológico da constituição de uma ferramenta eletrônica/digital (o que implica em reflexões sobre questões de tecnologia da linguagem) até a compreensão discursiva de um recurso eletrônico prático.
Neste sentido, para desenvolver este tipo de memória de recursos eletrônicos, creio que seria necessário desenvolver dentro da ordem da história das ciências da linguagem, uma reflexão de seus instrumentos, na história da automatização da linguagem. E sobretudo, organizar este tipo de memória com sobriedade para compreender que os produtos do discurso eletrônico têm necessariamente uma vida curta. Mas que a reflexão que embasa este produto pode ser útil em problemas semelhantes hoje. O interessante no trabalho do Michel Pêcheux é que ele mantém o rastro de sua reflexão, ele nos deixa ver os problemas que o incomodam e que o fazem pensar na formulação de soluções através das TICs.
Ao olhar retrospectivamente, o esforço de Pêcheux e seu bem sucedido programa de análise automática é de um alcance fortíssimo para os recursos tecnológicos disponíveis. Ao olhar projetivamente, é a partir do raciocínio de Pêcheux em AAD 69, da compreensão dos algoritmos e da re-formulação de algumas funções destes algoritmos que trabalhei em desenvolvi diferentes objetos no digital como, por exemplo, o princípio de registro do fio de leitura dos pesquisadores no software micro-ISIS (Centro de Documentação Urbana - CEDU), a arquitetura de um software parafrástico para a Enciclopédia Discursiva da Cidade – Endici- (CNPq, 2000-2002), ou hoje a localização de softwares para o português (Centro de Memória). E isto se dá através de uma memória discursiva de relação com as ciências da informação, de um arquivo ainda a ser explorado. Não é da ordem da memória do objeto, do software ou de suas adaptações, mas de uma memória de relações possíveis entre a computação e o discurso. É uma reflexão que ganha visibilidade com instrumentos muitas vezes já ultrapassados. Embora seja necessário dizer que o código LISP elaborado por Plainte (que dá no DÉREDEC) se mantém ativo no software de análise semântica chamado SÉMATO, disponível online inclusive. Ou seja a reflexão se sustenta, hoje, com outros recursos tecnológicos. É uma outra abordagem da AAD69, que não se pensou na
França. É esta re-apropriação da discussão de análise automática de Pêcheux, que trabalhei no pós-doutorado, que me trouxe para meu objeto de trabalho atual que é a questão do multilinguismo e multiculturalismo no espaço digital.
Michel Pêcheux, através de sua proposta de uma análise automática do discurso abriu para os lingüistas uma porta de formulação para a leitura automática da informação e todas as questões que daí decorrem; e para a ciência da computação abre possíveis vínculos com campos da psicologia social, antropologia, sociologia, psicanálise, políticas públicas, linguística, entre outros.
A lingüística computacional é uma área na qual esta reflexão pode ganhar uma materialidade eletrônica, pode se organizar como um software, um macro, um serviço Internet voltado para a linguagem, máquinas de busca, ontologias, etc. No entanto, epistemologicamente há uma distinção fundamental entre nossos princípios e instrumentos teóricos. Pêcheux formulou uma teoria, uma reflexão e um cálculo que propunham que uma máquina interpretasse textos levando em consideração essas relações de sentido não lineares, recursivas, e é por isso que este encontro é tão interessante.
Em termos de lingüística computacional, a língua portuguesa pode ser considerada um idioma em que se investe pouco, ainda há muito por fazer. No Brasil, até onde sei, o trabalho brasileiro em lingüística computacional está ligado à filiação americana, o que muda razoavelmente o quadro das funções das ferramentas e dos objetivos a serem alcançados com os instrumentos. Por exemplo, o trabalho de lingüística computacional na França é voltado para a língua francesa e depois são desenvolvidos aplicativos que podem ser trabalhados por uma segunda língua, ao passo que no Brasil a relação com a língua inglesa é muito presente, mesmo na interface para usuário brasileiro dos softwares. Isso, ao meu ver, aponta para uma diferente política de produção de instrumentos lingüísticos, que deve ser estudada e melhor compreendida de forma a que possamos fazer um uso produtivo do encontro destas duas linhas de trabalho.
5. Considerações abertas
Fundamentalmente diria que os resultados que considero mais importantes hoje, fazendo esta re-leitura, dizem respeito a um direcionamento do investimento
intelectual, na relação entre o discurso e as ciências da informação. Na relação com a questão da automatização da análise do discurso, e da proposta de Pêcheux, eu considero que quatro autores franceses hoje têm preocupações que, de forma atualizada, avançam esta discussão de Michel Pêcheux: Jacqueline Leon (Universidade Paris 7), Pierre Plainte (Lingüística Computacional na Université do Québec em Montréal), Sophie David (MoDyCO - Laboratoire Modèles, Dynamiques, Corpus– Nanterre), e Mireille Lagarrigue (Universidade Paris 10), sem dúvida para nos situarmos minimamente em relação a esta discussão um texto importante é Strategies for textual description, de Lecomte, Léon e Marandin (1984). Os integrantes da equipe de Pêcheux que trabalhavam com a Análise Automática, enveredaram por pesquisas que davam continuidade à uma faceta da proposta inicial. Portanto, ainda pensando neste vínculo entre discurso e computação, o projeto está aí, diferente mas parecido.
Percebemos que leitura, análise, automatização e discurso funcionam como pontos de ancoragem para a compreensão um do outro a partir da presença da máquina como leitora e analista [do discurso]. É no deslocamento da leitura do sujeito para a leitura da máquina que é possível descolar da subjetividade e compreender processos de subjetivação, e o retorno do trabalho de leitura feito pela máquina para o sujeito leitor permite a vínculo com este outro, que é também é um sujeito social, um sujeito de linguagem muito curioso, que é o computador. Nesse jogo entre sujeito humano e sujeito máquina, se dá uma percepção da noção de leitura. E é justamente este “gesto datado sócio-historicamente a ser empreendido por um sujeito em uma dada posição”(cf. Introdução do Leitura(s) no Discurso e na Ciência da Informação) o que nos interessa refletir a respeito.
Bibliografia:
LECOMTE, A.; LÉON, J.; MARANDIN, J.M., 1984. Analyse du discours: stratégie de description textuelle/Strategies for textual description. Mots, 9, 143-165. Consulta em setembro 2010: http://books.google.com.br/books?id=wRcdOvRggbQC&pg=PA216&lpg=PA216&dq= DEREDEC+Pecheux&source=bl&ots=ehRTFoIq3h&sig=_QfF0Mkymmaa89g7- Jgnl2LbRxY&hl=pt-BR&ei=ci6QTL32BYO88gbzzvCkDQ&sa=X&oi=book_result&ct=result&resnum=1 &ved=0CBUQ6AEwAA#v=onepage&q&f=false
PÊCHEUX, M. Reflexions sur les conditions d’apparition d’une science des idéologies [disponível Universidade Paris VII] , inédito.