• Nenhum resultado encontrado

2 A CONCORDÂNCIA NOMINAL DE NÚMERO NO PORTUGUÊS

4.4 TRATAMENTO ESTATÍSTICO DOS DADOS

As pesquisas sociolinguísticas lidam com uma extensa quantidade de dados variáveis, produzidos em situações reais de comunicação, que podem ser condicionados por contextos linguísticos e/ou extralinguísticos. Dessa maneira, como a variação não é regida por regras categóricas, mas variáveis, é propício, segundo Sankoff (1988), o uso de métodos estatísticos.

Nesta pesquisa, visando encontrar a sistematicidade da língua, submetemos nossos dados ao tratamento quantitativo através do Goldvarb X (SANKOFF; TAGLIAMONTE; SMITH, 2005), versão mais atual do pacote Varbrul que consiste em “um conjunto de programas de análise multivariada, especificamente estruturado para acomodar dados de variação sociolinguística” (GUY; ZILLES, 2007, p. 105).

De forma concisa, após o pesquisador efetuar a codificação dos dados relevantes para o fenômeno variável, o programa computacional fornece a frequência absoluta e a frequência relativa tanto das variantes quanto dos fatores levantados. Além disso, por meio da análise de regressão logística, o Goldvarb X realiza testes de significância estatística, comparando, concomitantemente, diversas variáveis independentes através das funções step-up e step-dowm (SANKOFF, 1988).

Na primeira função, a ferramenta computacional, inicialmente, calcula o input, média global corrigida de uma dada variante, e um log likelihood, medida de adequação das frequências observadas e esperadas. Depois, analisa todos os grupos de fatores primeiro isoladamente, atribuindo um log likelihood e um nível de significância a cada um dos grupos, e realiza a seleção de um deles, se houver significância estatística. Posteriormente, faz a análise do grupo de fatores selecionado com os demais, de dois a dois, também atribuindo um log likelihood e um nível de significância a cada par, e, então, escolhe o segundo grupo estatisticamente significativo. O processo de comparação dos grupos de fatores selecionados com os demais – três a três, quatro a quatro e, assim, sucessivamente – continua até que todos eles sejam selecionados ou até que nenhum deles alcance nível de significância menor do que 0,05. Na segunda função, por outro lado, é feito o caminho inverso, isto é, o instrumento estatístico testa os grupos de fatores e elimina os que não são estatisticamente

significantes (cf. GUY; ZILLES, 2007, p. 164-167; SANKOFF, 1988, p 991-992; SCHERRE; NARO, 2013, p. 147-178).

Nesses testes são gerados pesos relativos (PR) que revelam os efeitos de cada fator sobre uma determinada variante (GUY; ZILLES, 2007). Em análises binárias, como a deste trabalho, os valores dos pesos, que variam entre 0 e 1, mostram se um dado fator favorece (PR > 0,5), desfavorece (PR < 0,5) ou, ainda, se tem efeito neutro ou intermediário (PR = 0,5) sobre a variante examinada.

O programa, portanto, realiza um levantamento de dados estatísticos, sendo tarefa do linguista

a responsabilidade de descobrir quais são os fatores relevantes, de levantar e codificar os dados empíricos corretamente e, sobretudo, de interpretar os resultados numéricos dentro de uma visão teórica da língua. O progresso da ciência linguística não está nos números em si, mas no que a análise dos números pode trazer para nosso entendimento das línguas humanas (NARO, 2013b, p. 25).

No nosso caso, o Goldvarb X quantifica as ocorrências de presença e ausência de concordância nominal para que analisemos o fenômeno a partir de uma perspectiva variacionista, buscando verificar a influência exercida pelos fatores no uso ou não da marcação de plural.

5 ANÁLISE DA FALA CAPIXABA: O LINGUÍSTICO E O SOCIAL

Neste capítulo, vamos apresentar e discutir os resultados de nossa pesquisa. Antes, porém, é válido mencionar que, na análise estatística, realizamos três etapas de análise distintas para observar a atuação de mecanismos estruturais e sociais sobre a presença ou ausência de marcas explícitas de plural. Na primeira, analisamos nossos dados com os fatores da variável estilo amalgamados em fala casual e fala monitorada. Na segunda, examinamos os fatores da variável estilo agrupados segundo a Árvore da Decisão (LABOV, 2001a). Na terceira, por fim, efetuamos uma análise com os fatores da variável estilo organizados segundo a árvore remodelada. No Quadro 7, a seguir, temos a sequência de seleção das variáveis independentes feita pelo Goldvarb X para todas as rodadas31.

QUADRO 7 – ORDEM DE SELEÇÃO DAS VARIÁVEIS INDEPENDENTES PARA A ANÁLISE DO LINGUÍSTICO E DO SOCIAL (TODOS OS INFORMANTES DA AMOSTRA PORTVIX)

Ordem de seleção Estilo casual versus estilo monitorado Árvore da Decisão laboviana Árvore da Decisão remodelada 1ª Posição relativa e linear Posição relativa e linear Posição relativa e linear

2ª Marcas precedentes Marcas precedentes Marcas precedentes

3ª Faixa etária Faixa etária Faixa etária

4ª Escolaridade Escolaridade Escolaridade

5ª Saliência fônica Saliência fônica Saliência fônica

6ª Sexo/gênero Sexo/gênero Estilo

7ª Estilo Estilo Sexo/gênero

Como podemos observar, todos os grupos de fatores submetidos ao teste estatístico foram considerados estatisticamente significativos. Em todas as rodadas, as duas primeiras variáveis selecionadas foram posição relativa e linear e marcas

precedentes, o que mostra que a concordância nominal é mais condicionada por aspectos linguísticos do que sociais em Vitória.

Nos demais grupos de fatores, vemos que há apenas uma diferença na ordem de seleção: na rodada que o estilo é analisado com dois fatores e na que é analisado de acordo com a Árvore da Decisão laboviana, sexo/gênero é a sexta variável mais relevante e o estilo é a última; na rodada que os fatores do estilo são agrupados conforme a árvore remodelada, o estilo passa a ocupar a sexta posição. Assim, tendo em vista que a análise da variável estilística mais adequada é a da Árvore da Decisão remodelada, pelo fato de dar conta de um maior número de dados, utilizaremos aqui os resultados dessa rodada.

A seguir, apresentaremos a frequência global de concordância nominal encontrada na fala capixaba e, logo após, os resultados das variáveis linguísticas e sociais, respeitando a ordem de seleção estatística de cada grupo. Sempre que possível, realizaremos uma análise comparativa entre os nossos resultados e os obtidos por Scherre e Naro, para o Rio de Janeiro; por Fernandes (1996)32, para a Região Sul;

por Lopes, N. da S. (2001)33, para Salvador; por Martins (2013), para a microrregião

do Alto Solimões; e por Lopes, L. de O. J. (2014), para Santa Leopoldina.