1. HISTÓRICO DOS TEXTOS QUESTIONADOS
2.4. Análise Multidimensional
Nesta seção, apresentaremos a Análise Multidimensional que servirá
como ferramenta metodológica utilizada neste trabalho, a fim de identificar a autoria de textos questionados. A Análise Multidimensional é uma abordagem da Linguística de Corpus que tem como precursor Biber (1998; BIBER & CONRAD, 2009). Assim, pode-se definir a Análise Multidimensional como:
“Uma abordagem para análise de corpus que usa procedimentos estatísticos (principalmente análise fatorial), visando o mapeamento das associações entre um conjunto variado de características linguísticas dentro do corpus de estudo. Também usa de procedimentos automáticos e semiautomáticos para análise do corpus, tais como etiquetagem morfossintática (part of speech tagging)” (BERBER SARDINHA, 2004, p. 300).
A Análise Multidimensional é, então, “um procedimento estatístico usado para o agrupamento de dados com base em sua ocorrência” (BERBER SARDINHA, p. 300). As principais características da Análise Multidimensional segundo Berber Sardinha (2004) são: a) baseia-se em corpora, isto é, pretende descrever grande número de textos autênticos; b) é essencialmente computacional, pois utiliza ferramentas automáticas e semiautomáticas a para rotulação das características de interesse nos textos; c) presta-se à descrição de conjuntos de textos ou registros em vez de textos individuais; d) tem um caráter essencialmente comparativo, pois promove o contraste entre textos e registros; e) é multidimensional, ao reconhecer que a variação entre textos e registros pode ser mais adequadamente descrita por meio de múltiplos parâmetros; f) utiliza aparato quantitativo na descrição, que permite a especificação da coocorrência dos traços linguísticos de modo objetivo.
55 As características linguísticas quando ocorrem de forma insistente nos agrupamentos indicam padrões no uso da língua em determinados registros, e são aferidos por meio da estatística. Ressalta-se que a estatística como uma ferramenta de análise é relevante, pois possibilita indicar a probabilidade dos traços em estudo, neste trabalho o idioleto, ocorrer/coocorrer o que para análise de autoria é primordial. Para Biber (1988) os estudos que antecedem a Análise Multidimensional objetivavam analisar a coocorrência de poucos traços linguísticos, como também interpretá-los de forma intuitiva, ou seja, as variáveis textuais podiam ser examinadas baseando-se em poucos parâmetros, o que não garantia uma visão mais aprofundada dos dados. A proposta de Biber (1988) utilizando a Análise Multidimensional é inovadora, pois verifica a variação textual por meio das características linguísticas através de procedimento estatístico, agrupando os dados de acordo com a ocorrência/coocorrência, resultando em fatores. Por conseguinte, o conjunto de características linguísticas (Fator) é analisado com a verificação das ocorrências nos textos, resultando na interpretação das dimensões.
Biber (1988) distingue duas abordagens para análise linguística nos moldes da Análise Multidimensional, a macro e a micro. Ainda segundo ele a análise macroscópica identifica as dimensões textuais subjacentes em um conjunto de textos, permitindo uma visão geral da variação linguística, além de fornecer uma estrutura para a discussão das semelhanças e diferenças entre determinados textos e gêneros, tanto falados como escritos. Por outro lado, a análise microscópica permite fornecer uma descrição detalhada das funções comunicativas de características linguísticas específicas, como por exemplo: marcadores de destaque informacional ou pronomes em primeira pessoa como marcadores de envolvimento pessoal. Desse modo, a análise microscópica não é capaz de identificar os parâmetros gerais de variação linguística dentro de um conjunto de textos (dimensões) porque se restringe à análise de poucos recursos linguísticos em textos individuais (BIBER, 1988). Por isso, as análises macroscópica e microscópica são necessárias para identificar as funções comunicativas de características linguísticas individuais. As abordagens micro e
56 macro, aqui indicadas, estão vinculadas e correlacionadas, ou seja, uma depende da outra. Enquanto a macroanálise se destaca pela seleção e agrupamento de características linguísticas dos registros, a microanálise, por outro lado, permite a interpretação dessas características linguísticas por meio das dimensões que estão subjacentes ao corpus. Isto é, uma abordagem está vinculada a outra na medida em que a microanálise interpreta funcionalmente as características linguísticas que sobressaem na macroanálise (BIBER, 1988). Em suma, a análise microscópica, segundo Biber (1998), contribui para análise macroscópica de duas formas:
1. “Identifica potencialmente importantes características linguísticas e distinções de gênero a serem incluídos em uma macroanálise”.
2. “Fornece análises funcionais detalhadas das características linguísticas individuais, que permitem a interpretação da dimensão textual em termos funcionais” (BIBER, 1988).
Segundo Biber (1988, p. 8) “os falantes de uma língua possuem, além do conhecimento lexical, conhecimento o sobre a estrutura e o uso da língua, usando-a conforme a exigência funcional e situacional”. Em outras palavras, a escolha léxico-gramatical ocorre de acordo com a situação que o falante da língua está inserido. Por isso, a proposta da Análise Multidimensional fornece métodos que visam análises mais completas, pois é importante que a descrição seja alicerçada em características situacionais e em traços linguísticos, já que uma análise abrangente leva em consideração vários traços, não somente traços isolados. Tais afirmativas vão ao encontro do nosso trabalho já que a Análise Multidimensional permite fornecer traços e compará-los a fim de revelar características próprias de cada autor, além de analisar registros com mesmo contexto situacional.
Assim, o conjunto de textos selecionados para este trabalho (172), sendo 160 de autoria comprovada e 12 textos de autoria questionada, servirão como base para analisarmos multidimensionalmente as características linguísticas dos textos, calculadas as recorrências e extração das co-ocorrências nos corpora,
57 permitindo identificar as dimensões de variação entre os registros e se as características linguísticas (idioleto) de alguns dos autores se aproxima dos textos questionados. Após submetermos os corpora à análise linguística, acreditamos que as características individuais, nos textos pesquisados dos autores, serão reveladas pelos padrões de coocorrência. Análise Multidimensional se apresenta, então, como uma metodologia de peso na linguística atual, entretanto no Brasil ela ainda é virtualmente desconhecida (BERBER SARDINHA, 2000), porém é ideal para nossa pesquisa.