• Nenhum resultado encontrado

2. FUNDAMENTAÇÃO TEÓRICA

2.2. ANÁLISE MULTIDIMENSIONAL

2.2.1. ANÁLISE FATORIAL

A AMD envolve um processo estatístico multivariado – ou seja, capaz de lidar com múltiplas variáveis de natureza linguística ou situacional, desde que sejam quantificáveis e adequadas à pesquisa a ser realizada.

Os fatores, que são revelados pelo processo da análise fatorial, podem ser definidos como “grupo[s] de variáveis que coocorrem significativamente do ponto de vista estatístico” (BERBER SARDINHA, 2004, p.304). Os fatores inicialmente são extraídos pelo pesquisador, que avalia os eigenvalues15 de cada fator para a seleção

do número final de fatores mais relevantes à pesquisa. Eigenvalues são o índice de variância compartilhada por cada fator que determinam a dispersão estatística dos valores estudados. Baseando-se tanto nos resultados estatísticos e em técnicas de aferição quanto em critérios inerentes à própria pesquisa, chega-se o número final de fatores mais apropriado para representar o conjunto de dados estudado na análise fatorial. Os fatores “representam alguma área dos dados originais que podem ser resumidos e generalizados” (Biber, 1988, p. 79). Ao serem interpretados com base em sua função comunicativa, tais fatores tornam-se dimensões, que, ao serem avaliadas qualitativamente, permitem, segundo Berber Sardinha (2004, p. 304), “visualizar características partilhadas por uma porção significativa de dados”. Da interpretação dos fatores, portanto, emergem funções comunicativas na forma de dimensões de variação, que são padrões de coocorrência de elementos lexicogramaticais que subjazem aos registros de uma língua (BIBER, 2009). Como tal, capturam o espaço de variação dos textos, sintetizam-no e mostram a proximidade ou distância entre os registros investigados.

Em estudos linguísticos baseados em corpora e que utilizam a AMD como metodologia, uma dimensão, de acordo com Berber Sardinha (2010, p. 304-305) pode ser definida como

[...] o estatuto que um fator assume assim que é interpretado do ponto de vista de sua função comunicativa. Uma dimensão permite visualizar características em comum partilhadas por uma porção significativa de dados. A interpretação do fator leva em conta tanto as características linguísticas quanto as características partilhadas pelos registros que estão representados no fator. As dimensões permitem redefinir o quadro inicial de registros.

Um traço significativo da AMD é a utilização de análises quantitativas, além das

interpretações qualitativas, em sua abordagem. As investigações baseadas em

corpora que seguem as diretrizes da AMD estão firmemente embasadas em análises

estatísticas, mais notadamente a análise fatorial, o que traz à AMD o embasamento metodológico e científico que a destaca das demais linhas de pesquisa de investigação linguística. A análise fatorial é, na verdade, um conjunto de procedimentos estatísticos que objetivam a investigação de correlações entre grupos de variáveis. Loewen e Gonulal (2015, p. 182) reiteram que, para atingir tal objetivo, “a análise fatorial busca determinar o menor número de variáveis que ainda consigam explicar uma quantidade significativa de variância no conjunto de dados”16, isto é, o propósito da análise fatorial é reduzir os dados iniciais (para assim torná-los geríveis para a pesquisa) em um conjunto de variáveis que apresentem comportamentos similares. Com a utilização da análise fatorial para a investigação linguística de grandes quantidades de textos, é possível observar relações entre as variáveis que não poderiam ser notadas apenas com a leitura dos textos.

A análise fatorial é dividida em dois tipos (Figura 2): a exploratória (EFA)17 e a confirmatória (CFA)18. A principal diferença entre essas duas modalidades de análise fatorial, além do fato de esses procedimentos estatísticos requererem programas computacionais diferentes para serem executados, é que, na análise fatorial exploratória, como o próprio nome sugere, o pesquisador não tem nenhuma expectativa a respeito dos fatores que serão revelados por sua pesquisa; já na análise fatorial confirmatória, que geralmente é baseada em estudos prévios nos quais fatores foram revelados, o pesquisador realiza sua investigação com a premissa de que o perfil e o número de fatores revelados sigam um padrão predeterminado, como, por exemplo, os resultados de uma pesquisa anterior (LOEWEN; GONULAL, 2015, p. 184).

A Análise Fatorial Exploratória é também vista como um termo geral que engloba dois tipos de análise: a Análise de Componentes Principais (PCA19), e a Análise Fatorial Exploratória (EFA), conforme mostrado na Figura 2. Para alguns

16 Tadução minha, do original, “[...] factor analysis seeks to determine the fewest number of variables

that will still explain a substantial amount of variance in the data.

17 EFA, do inglês “Exploratory Factor Analysis”. 18 CFA, do inglês “Confirmatory Factor Analysis”. 19 PCA, do inglês “Principal Components Analysis”.

estatísticos, a PCA é um tipo de EFA, enquanto outros consideram as duas análises como completamente distintas. A diferença prática entre elas é o modo como cada uma considera a variação dos dados linguísticos encontrada: a PCA inclui toda a variação encontrada em sua análise, como, por exemplo, aquela que é específica para cada variável e aquela comum entre todas as variáveis, sem fazer distinção entre uma e outra variação. Na EFA, são incluídas apenas a variação presente nos coeficientes de correlação, isto é, a variação comum entre as variáveis. Frequentemente, as duas análises chegam a resultados bastante similares, mas, em alguns casos, pode haver diferenças significativas. Nessas instâncias, a EFA demonstra ter uma maior precisão no cálculo das cargas das variáveis. Por isso, Loewen e Gonulal (2015) sugerem que a EFA seja a melhor opção para análises exploratórias pois, para alguns casos, essa análise apresenta resultados superiores e, para os demais casos, ela apresenta resultados similares. Tal sugestão se aplica à análise fatorial utilizadas na pesquisa aqui apresentada.

FIGURA 2 – TIPOS DE ANÁLISE FATORIAL

Fonte: Adaptado de Loewen e Gonulal (2015, p. 184)

É interessante notar que as dimensões de variações já existem de forma

Análise Fatorial Análise Fatorial Exploratória A.F. Exploratória (EFA) Máxima Verossimilhança Fatoração dos Eixos Principais Análise de Componentes Principais (PCA) Análise Fatorial Confirmatória

latente, elas são apenas reveladas pela Análise Multidimensional, ou seja, as variáveis estudadas coocorrem (ou não) naturalmente nos textos pertencentes ao corpus de pesquisa, e registros diferem ou se assemelham espontaneamente quando tais textos são criados e não quando eles são agrupados de modo tendencioso para servir aos propósitos da pesquisa. O que a AMD proporciona com seu “olhar em larga escala” é justamente a percepção de como textos, que aparentemente pertencem a modalidades distintas de utilização da linguagem, podem conter traços semelhantes e como também os textos de um mesmo registro podem variar entre si.