Alceste (Analyse Lexicale par Contexte d’um Ensemble de Segments de Texte)

3. MÉTODO

3.3 Tratamento dos dados

3.3.1 Alceste (Analyse Lexicale par Contexte d’um Ensemble de Segments de Texte)

O conteúdo produzido pela segunda parte do roteiro de entrevista foi analisado com a ajuda do software Alceste, programa utilizado para análise de dados textuais. Esse software, descrito por Menandro (2004) como uma técnica e uma metodologia, visa a apreensão de informações essenciais contidas em um conjunto de textos conexos e volumosos. Dessa forma, a aplicação do programa pode ser realizada em dados provenientes de diversos procedimentos de coleta que tenham em comum a linguagem verbal (entrevistas, diálogos, artigos de imprensa, ensaios literários), como afirmou Soares (2005).

Ao analisar um dado conjunto de textos, o Alceste fornece uma “primeira classificação estatística dos enunciados simples do corpus estudado” (Oliveira, Gomes e Marques, 2005, p. 158), em função da distribuição das palavras nesses enunciados. Para tanto, “o método utilizado nesta forma de modelização consiste em classificar e recortar o corpus em unidades relativamente arbitrárias, e verificar a distribuição de vocabulário específico em unidades” (Soares, 2005, p. 552).

É relevante destacar que a análise realizada pelo programa é considerada apenas a distribuição das chamadas “palavras plenas”, ou “palavras com sentido” (verbos, substantivos, adjetivos e advérbios), em suas formas reduzidas, ou seja, sem as desinências gramaticais e/ou alguns sufixos. Por exemplo, na forma reduzida analisada

Análise Lexical por Contexto de um Conjunto de Segmentos de Texto. Além dos artigos que citamos no corpo do texto, um texto bastante elucidativo e didático sobre o programa é o de Martha de Alba - Alba (2004) El método Alceste y sus aplicacións al studio de las Representaciones Sociales del spacio urbano: el caso de la ciudad del México. Papers on Social Representations, 13, 1.1-1.20 (http://psr.jku.at/)

filh+, podem estar representadas as palavras plenas filho, filha, filhos, filhas, filhinho, etc. Para a correta identificação dessas expressões reduzidas, o programa gera em seu relatório final um “dicionário” que contém as formas reduzidas e as respectivas palavras plenas referentes a cada classe encontrada com a indicação no número de vezes que cada uma delas aparece.

As unidades básicas de análise com que o programa Alceste trabalha são:

1. Unidades de Contexto Inicial (UCI): correspondem a divisões primárias do grupo

de textos analisados. As UCIs são determinadas pelo próprio pesquisador e pela natureza de sua pesquisa, sendo identificadas por meio de linhas com asterisco que sinalizam o início de cada uma delas (****espaço simples*). As variáveis introduzidas nas linhas estreladas (destacadas nos exemplos a seguir em negrito) são determinadas também pelo pesquisador, de acordo, com os dados coletados e seus interesses de pesquisa. Desse modo, essas unidades podem especificar apenas cada entrevista coletada (**** *suj_12), ou ainda podem identificar três ou mais variáveis relevantes, como por exemplo, sexo e idade do participante e uma questão específica de um questionário em questão (**** *suj01 *sex_mas *id_35 *quest_01).

No caso do material da presente pesquisa, cada uma das quatro entrevistas de cada grupo (de esposas e de maridos) foi considerada uma UCI e identificada por meio de linhas com asteriscos (ex: **** *suj_01). Em cada grupo de entrevistas foram inseridas, então, quatro destas linhas.

2. Unidades de Contexto Elementares (UCE): frases dimensionadas pelo programa

de acordo com o tamanho do corpus, de sua pontuação e da ordem de aparição no texto (Menandro, 2004, Oliveira et al, 2005). A UCE corresponde à idéia de frase dimensionada em função do comprimento e da pontuação. É a partir dela que o Alceste realiza o trabalho de classificação (Oliveira et al, 2005).

Destacamos, a seguir, duas UCEs identificadas pelo Alceste (retiradas do artigo de Oliveira et al , 2005). O primeiro número refere-se à linha em que a Unidade se encontra no corpus analisado, a segunda ao valor de qui-quadrado (X2), que indica a força de relação com a classe. O símbolo (#) marca as palavras mais fortemente relacionadas à classe.

688 33 nao e #uma #doença que ele tem, se ele e #diabetico, se ele e #hipertenso, ou se ele tem um #cancer, a #hipertensao e o #diabetes e um detalhe, um detalhe #importante, mas antes-de tudo, seu #joao #hipertenso ou a minha #crianca que esta com #baixo #peso.

315 26 acho que não me #lembro de nenhum de nenhum #conceito de #enfermagem da #faculdade. #sair da #faculdade e #entrar o

mercado_de_trabalho foi um #caos, porque fazemos a #faculdade achando que nao sabemos nada.

3. Classe ou contexto lexical: corresponde a um tema extraído da análise do corpus. A

cada classe correspondem UCEs específicas identificadas por meio do vocabulário (formas plenas e reduzidas) contido nelas. A força de relação com que cada UCE e/ou palavra se relaciona a uma classe é determinado pelo valor do qui-quadrado (X2).

As classes são construídas pelo programa por meio da análise denominada

Classificação Hierárquica Descendente (CHD), que origina uma classificação

definitiva do vocabulário específico de cada classe, com freqüência, porcentagem e força de relação de determinada palavra com o contexto no qual foi inserida.

Ao final da classificação, o Alceste organiza os dados das classes e suas distribuições sob a forma de um dendrograma (ilustrado na Figura 1), representação gráfica em forma de árvore, que indica o número de classes, suas estruturas e a forma de relação entre elas (proximidade e/ou oposição).

---|----|----|----|----|----|----|----|----|----| Cl. 4 ( 23uce) |---+ 20 |---+ Cl. 1 ( 106uce) |---+ | 15 | Cl. 2 ( 32uce) |---+ | 10 |---+ Cl. 3 ( 43uce) |---+ 18

Figura 1: Exemplo de dendrograma de classes estáveis resultante da CHD. (ilustração fictícia)

Um segundo tipo de tratamento realizado pelo Alceste é a Análise Fatorial de

Correspondência (AFC), a qual, segundo Ribeiro (2000) é uma técnica que descreve

tabelas por meio do cruzamento entre o vocabulário e as classes. Essa análise possibilita visualizar, a partir de um plano fatorial (Figura 2), a distribuição e a relação entre as classes, e também entre as formas reduzidas identificadas pela CHD.

+---|---|---|---+---|---|---|---+ 19 | cala+ cade+educ+ obrigac+|suspend | 18 | reclama efilhosdar | | 17 | presente calogo+forma | | 16 | usura dama+ | | 15 | centro_oeste _ca | | 14 | fama nunca+ | | 13 | missa | | 12 | falt+coloc+ acredit+ | | 11 | delicadeza+ | | 10 | | | 9 | sentid+ | | 8 | | | 7 | | | 6 | sincronismo | | 5 | cadência+ | comove 4 | | papel| 3 | | banh+ | 2 | | entendpnegocio deu+ | 1 | | preguic+ onde 0 +---continu+---|---jeitoespecialmente 1| viajante | sosdeipass diad

2 | | oravez+ c heg+ 3 | | rit+volt fal+ vou 4 | segund+ me | | 5 | partido | quer+ fic+.separ+ | 6 | ach+ | | 7 | bastan | | 8 | ruimuma+ | fez | 9 | aspecto+ propria | uniforme+ | 10 | sozinn+ | poder+| 11 | supermulher+ | sossega gente | 12 | maior pod+ relacionamendess+ | convers+ | 13 | fal+lado ment+viv+ | | 14 | gent+ vida acertad+ | 15 | | | +---|---|---|---+---|---|---|---+

Figura 2: Exemplo de representação gráfica resultante da AFC. (ilustração fictícia em tamanho reduzido)

Para que os dados possam ser analisados corretamente pelo software, deve-se cuidar para que a formatação do corpus do texto siga as seguintes regras:

1. Todos os dados devem estar em um único arquivo do Word, formatado em letra courier new, tamanho 10, com espaçamento simples entre linhas. Esse corpus deve conter um mínimo de 70.000 caracteres;

2. Separar as entrevistas pelas linhas com asteriscos;

3. Corrigir possíveis erros de digitação utilizando o recurso do Word;

4. Substituir o hífen (-) por traço baixo (_), como em ex_esposa; e também para ligar palavras compostas interessantes para a análise (salário_mínimo);

5. Palavras e siglas em letra maiúscula que interessem à análise devem ser colocadas em letra minúscula (crp substitui CRP). Por outro lado, tudo o que não se quer analisar (perguntas do entrevistador, por exemplo) deve ser eliminado ou colocado em caixa alta, para não ser analisado pelo programa;

6. Suprimir do corpo do texto: aspas, apóstrofes, cifrões, sinal de porcentagem e asteriscos;

7. Salvar texto devidamente formatado no formato “somente texto com quebra de linha”, cuidando para que o nome do arquivo não tenha espaço em branco entre as palavras. (Ribeiro, 2000)

CLASSE 1

CLASSE 3

Assim, com o objetivo de alcançar uma maior coesão nos dois corpi submetidos à análise do Alceste, buscou-se suprimir as repetições de palavras em uma mesma frase (Ex: “eu tentava, tentava, tentava”, passou a ser apenas “eu tentava”). Expressões que eram de interesse para a análise, como dona de casa e chefe de família, foram unidas por traço baixo (chefe_de_família, boa_esposa).

Devemos destacar aqui que o trabalho do Alceste se revela proveitoso quando em “parceria” com o do pesquisador, uma vez que o primeiro oferece uma “topografia do discurso” (Kalampalikis, 2003, citado por Menandro, 2004), ao organizar e destacar conteúdos e temas do corpus, enquanto o segundo irá interpretar e dar significados ao produto gerado pelo software.

O procedimento de Análise de Conteúdo (Bardin, 2002), foi utilizado como meio de complementar as temáticas propostas pelo Alceste.

3.3.2_{Análise de conteúdo}

A análise de conteúdo é um recurso metodológico que, de acordo Minayo (1993), “articula a superfície descrita e analisada com os fatores que determinam suas características: variáveis psicossociais, contexto cultural, contexto e processo de produção da mensagem” (p. 203). Segundo Bardin, a análise de conteúdo constitui:

Um conjunto de técnicas de análise de comunicações visando obter, por procedimentos, sistemáticos e objetivos de descrição do conteúdo das mensagens, indicadores (quantitativos ou não) que permitam a inferência de conhecimentos relativos às condições de produção/recepção (variáveis inferidas) destas mensagens (Bardin, 2002, p. 42).

Dentre as técnicas que podem ser desenvolvidas na análise de conteúdo, foi utilizada, no presente trabalho, a análise categorial. Essa técnica busca identificar e analisar os “núcleos de sentido”, ou temas, que compõem o texto analisado. Os temas são entendidos, então, como “unidades de significação” encontradas no texto analisado durante as leituras guiadas por uma teoria específica (Bardin, 2002).

O processo de construção das categorias é iniciado por meio da leitura flutuante do material a ser analisado a fim de se obter uma visão geral do conteúdo. Em seguida, são realizadas leituras mais acuradas com o objetivo de identificar os temas presentes no conjunto textual.

No documento Maridos Dominadores, Esposas (in)subordinadas: As implicações do Empoderamento Feminino e da Masculinidade hegemônica na Violência Conjugal (páginas 41-46)