• Nenhum resultado encontrado

PARTE I METODOLOGIA E ANÁLISE DA PESQUISA DE CAMPO

6.2. PROCEDIMENTOS DE ANÁLISE DOS DADOS

6.2.1- ALCESTE: Aspectos Teóricos e Metodológicos86

Para o desenvolvimento da análise dos dados foi utilizado o software ALCESTE (Analise Lexicale par Contexte d’un Ensemble de Segments de Texte). Trata-se de um programa de computador para pesquisa qualitativa que distingue diferentes tipos de discurso em textos naturais, através da realização de uma análise estatística automática (Bauer & Gaskell, 2002). Este pesquisador utilizou este programa durante o desenvolvimento do seu mestrado; portanto, já detinha algum conhecimento sobre a sua utilização.

O recurso do uso da informática na análise de dados textuais tornou-se presente na França no final da década passada. A análise de dados textuais ou estatística textual é uma metodologia que visa descobrir a informação essencial contida num texto87. O ALCESTE tem origem francesa, mas está devidamente adaptado para a análise de textos em português. Atualmente, as línguas contempladas são o inglês, o francês, o italiano, o português e o espanhol (Kronberger & Wagner, 2002).

O software ALCESTE foi desenvolvido em 1979 por Max Reinert (1983;1990; 1993; 1998) para ser utilizado no sistema operacional windows. Os objetivos do programa são: a) realizar de maneira automática a análise de diálogos, de questões abertas de enquetes socioeconômicas, de um conjunto de textos diversos: obras literárias, artigos de revistas, romances, etc; b) obter uma primeira classificação estatística dos enunciados simples do corpus estudado, em função da distribuição de palavras dentro do enunciado, a fim de apreender as palavras que lhes são mais características.

Após a análise textual das produções semânticas dos sujeitos, realiza-se a reconstituição do discurso coletivo, utilizando para tanto a relação entre as palavras, a

86

Os Aspectos Técnicos das Etapas de Análise do Alceste estão apresentados no Anexo 4. 87

RIBEIRO, Aldry Sandro. ALCESTE: Análise Quantitativa de Dados Textuais. Laboratório de Psicologia Escolar (PED/IP/UnB). Mimeo. s/d.

freqüência com que aparecem e suas associações em classe de palavras. Depois, recorre- se aos enunciados, que permitem identificar o contexto em que se inserem as classes de palavras. O contato com o contexto semântico permite indicar as questões levantadas pelos sujeitos durante a entrevista. No entanto, não é uma técnica para testar hipóteses a priori, mas um método para exploração e descrição. Segundo Bauer, a análise de texto faz uma ponte entre o formalismo estatístico e a análise qualitativa dos materiais, constituindo-se em uma “técnica híbrida” (Bauer & Gaskell, 2002). O ALCESTE além de “uma técnica é também uma metodologia, porque o programa integra uma grande quantidade de métodos estatísticos sofisticados em um todo orgânico que se ajusta perfeitamente ao seu objetivo de análise de discurso” (Bauer & Gaskell, 2002: 426).

O programa não dá conta do sentido e contexto, como o fazem os métodos manuais de análise qualitativa, como é o caso da análise de conteúdo clássica de Laurence Bardin. Mas a vantagem é que dentro de um curto espaço de tempo, o pesquisador pode conseguir uma visão geral do volumoso corpus de dados (Bardin, 1977). Para a utilização deste programa o texto deve ser suficientemente grande. Ele “é útil para dados de um texto de no mínimo 10.000 palavras, até documentos tão volumosos como 20 exemplares de Madame Bovary” (Kronberger & Wagner, 2002:427). Nesta pesquisa, o corpus de dados utilizado para análise foi de 83.513 palavras.

Os dados analisados pelo ALCESTE devem mostrar ordem, homogeneidade tópica e coerência sobre o que se fala para se criar um quadro de referência. Uma característica do programa é que pontos diferentes de referência produzem diferentes maneiras de falar, ou seja, o uso de um vocabulário específico é percebido como uma fonte para detectar maneiras de pensar sobre o objeto. Portanto, o objetivo é distinguir classes de palavras que representam diferentes formas de discurso sobre um tópico de interesse. Uma afirmação é considerada uma expressão de um ponto de vista, uma unidade de sentido que liga um conteúdo com a intenção, a crença, o desejo e a cosmovisão de um sujeito (Bauer & Gaskell, 2002).

A definição de uma afirmação no ALCESTE pode ser sintática, pragmática, semântica ou cognitiva. Como nem todas as palavras carregam informações relevantes, o programa utiliza um dicionário que divide o corpus em um grupo de “palavras com função”, tais como artigos, preposições, conjunções, pronomes e verbos auxiliares e um grupo de “palavras com conteúdo”, tais como substantivos, verbos, adjetivos e advérbios. É exatamente esse último grupo de palavras que o programa trabalha. É ele

que contém o sentido do discurso. As “palavras com função” são excluídas da primeira análise, mas servem como informação adicional. O objetivo é investigar as semelhanças e dessemelhanças estatísticas das palavras, a fim de identificar padrões repetitivos de linguagem. Contanto, para cada palavra são apresentadas a freqüência absoluta da classe, a percentagem da palavra na classe e o qui-quadrado (X2).

Ao analisar o corpus das entrevistas, o programa identifica as Unidades de Contexto Inicial (UCIs, ou seja, cada entrevista) e, posteriormente, com o objetivo de evitar ambigüidades, as afirmações são operacionalizadas como Unidades de Contexto Elementar (UCEs). Essas são segmentos do texto original ou frases dos respondentes, em que estão inseridas as palavras selecionadas para a formação da classe. Assim, cada classe é composta de várias UCEs em função de uma classificação segundo distribuição dos vocabulários destas UCEs. Segundo a professora Ângela Almeida (PSI/UnB) “o ALCESTE é uma análise de similitude de textos, de pequenos textos”.88

O programa busca verificar a existência de recorrências, baseadas em contextos de semelhança, identificando os contextos-tipos, ou seja, os contextos que se repetem nas entrevistas. Nesse momento, a análise das UCEs permite reconstituir o sentido de cada palavra e possibilita construir um significado para a classe.89 As UCEs são constituídas de enunciados lingüísticos e estes são definidos como proposições e frases, nos quais o pensamento é anunciado, sendo que o termo pensamento é tomado como sendo um ato particular do espírito que se refere a um objeto (Reinert, 1990).

Para Reinert (1990) o traço do locutor no enunciado é o resultado de uma interferência entre duas entidades: o mundo e si mesmo. Essa dupla dimensão se emaranha nuclearmente no enunciado pelo que é chamado representação. A idéia, nesse sentido, não é simplesmente ligada a representação de um objeto, mas é ligada a maneira pela qual o sujeito a apresenta em função de sua própria identidade, e também de sua dimensão. O traço lingüístico do enunciado constitui a menor unidade de texto suscetível de descrever a representação ligada ao sujeito.

Em pesquisas no campo da lingüística, as classes são interpretadas como campos lexicais (Cros, 1993) ou contextos semânticos. Para Veloz, Nascimento-Schulze e Camargo (1998), em vista do estatuto que conferem às manifestações lingüísticas, as

88

Entrevista concedida ao pesquisador dessa tese em dezembro de 2003. 89

IMAGE. ALCESTE: um software de análise de dados textuais. Disponível em: www.image.cict.fr/alceste.html. Acesso em: 10 de dezembro de 2007.

classes podem indicar representações sociais ou campos de imagens sobre um dado objeto, ou somente aspectos de uma mesma representação.

O ALCESTE divide gradativamente um conjunto de palavras dentro de classes lexicais de maneira que as diferenças entre as classes são maximizadas e as diferenças dentro das classes são minimizadas. Desta forma, palavras que ocorrem muito freqüentemente não são necessariamente descartadas. Algumas retornam fortemente ligadas a uma dada classe, tomando-se como base o valor do qui-quadrado (Soubiale & Roussiau, 1998).

Na identificação dos contextos-tipos o método empregado pelo ALCESTE é a Classificação Hierárquica Descendente (CHD), que separa estes contextos-tipos em classes/categorias e apresenta as relações entre elas; portanto, é um procedimento interativo. O programa realiza uma listagem de palavras para cada classe. A força da associação entre cada palavra e sua classe é expressa pelo valor do qui-quadrado (X2) e todas as palavras que excedem determinado valor do qui-quadrado são listadas. Quanto maior esse valor, mais importante é a palavra para a construção estatística da classe. Constituída a lista de palavras, constitui-se também a fonte básica para interpretar as classes (Bauer & Gaskell, 2002).

Em seguida, efetua-se a Análise de Correspondência (AC), que permite descrever as ligações existentes entre diferentes variáveis qualitativas, em busca de uma idéia global ou de grandes fatores dos dados recolhidos, o que permite, por um lado, visualizar as oposições existentes nas falas produzidas pelos sujeitos e, por outro lado, as relações entre as falas dos sujeitos e as variáveis suplementares (sexo, idade, escolaridade, etc.). A Análise de Correspondência constitui uma

representação espacial das relações entre classes, onde suas posições refletem sua relação em termos de proximidade. Três gráficos são construídos: o primeiro representa as relações entre as palavras com conteúdo, o segundo representa as palavras com função, e o terceiro projeta as variáveis passivas, isto é, os atributos dos respondentes, no espaço de palavras com conteúdo e das classes de discurso (Kronberger & Wagner, 2002).

Sinteticamente, os termos podem assim ser definidos (Reinert, 1998):

A) Unidade de Contexto Inicial (UCI): Unidade a partir da qual o programa