• Nenhum resultado encontrado

Eu vi tu ontem na feira, mas tu não me viu/viste/visse.

4 O MODELO TEÓRICO: A TEORIA DA VARIAÇÃO LINGUÍSTICA

5.6 O PROCESSAMENTO ESTATÍSTICO DOS DADOS: O GOLDVARB

Já foi enfatizada neste texto a relevância da aplicação de procedimentos estatísticos para medir a influência de fatores linguísticos e extralinguísticos sobre fatos em variação na língua. Como informa Naro (2007, p. 16): “O problema central que se coloca para a Teoria da Variação é a avaliação do quantum com que cada categoria postulada contribui para a realização de uma ou de outra variante das formas em competição”.

A análise estatística isola e mede separadamente o efeito de um fator “[...] quando tal fator nunca se apresenta isoladamente nos dados [...]” (NARO, 2007, p. 17), de modo que, como assegura o próprio Labov (2008 [1972]), a aplicação de métodos

55

Neste caso, assim como no seguinte, não foi possível saber se o falante estava se referindo a um interlocutor genérico ou a uma terceira pessoa, também, genérica.

quantitativos proporcionam um estudo mais detalhado do processo de mudança linguística.

Neste trabalho, utilizou-se como ferramenta estatística para o tratamento da regra variável o programa Goldvarb, versão para Windows do pacote de programas Varbrul56

(SANKOFF, 1988; PINTZUK, 1988), que é descrito por Guy e Zilles (2007, p. 105) como “um conjunto de programas computacionais de análise multivariada, especificamente estruturado para acomodar dados de variação sociolinguística”.

O programa Goldvarb opera de forma semelhante às versões anteriores, possibilitando a realização de análises multidimensionais. Assim, considerando que os fatos linguísticos podem receber influência de um único fator ou de diversos grupos de fatores ao mesmo tempo, o programa testa a influência individual de cada fator. Esse tratamento dos dados é importante, porque determina “a natureza e a extensão de cada um [dos] efeitos condicionadores, permitindo ‘predizer’ probabilisticamente a taxa aproximada de uso [...] dadas as informações sobre as características sociais da pessoa, da situação social e do contexto” (GUY, 1998, p. 28).

Para obter o cálculo das frequências brutas, o Goldvarb fornece três modelos de análises, definidos de acordo com o número de variantes levantadas para a variável dependente: o modelo binário (com duas variantes), o modelo ternário (com três variantes) e o eneário (com quatro ou cinco variantes). Entretanto, os pesos relativos e, consequentemente, a seleção dos grupos estatisticamente relevantes para aplicação da regra variável são fornecidos apenas em modelo binário.

O peso relativo (P.R.) é uma medida numérica cujos valores são assim interpretados: quanto mais próximo de 1 for o peso para determinado fator, maior sua atuação na aplicação da regra; por sua vez, quanto mais próximo de zero, menor a influência do fator. Quando o peso relativo é igual a 0,50, significa que aquele fator tem atuação nula para o uso da variante. Embora seja essa a forma comum de interpretar os resultados, o aconselhável é que a análise seja feita

56

comparativamente, observando-se a diferença entre os pesos relativos dos fatores de um mesmo grupo.

A variável dependente descrita neste trabalho é eneária, comportando quatro formas alternantes, como visto. A análise multivariada, como já explicitado, será feita através de dois esquemas analíticos: no primeiro, confrontam-se as formas pronominais lhe e te, por representarem variantes mais produtivas em Santo Antônio de Jesus para a representação do OD e do OI de segunda pessoa, e, no segundo esquema, as formas de OD preenchidas com clíticos em oposição ao preenchimento com o pronome tônico você.

Antes de submeter o arquivo ao cálculo dos pesos relativos é necessário eliminar alguns problemas comuns na análise estatística. Um deles é o knockout, que ocorre quando um fator apresenta uso ou desuso categórico de uma das variantes. A análise estatística é impedida nesse caso porque esses percentuais indicam inexistência de variação, de modo que não é possível exprimir pesos relativos. O pesquisador pode eliminar o fator ou amalgamá-lo a outro fator. Outro problema com que se pode deparar é a existência de single group, terminologia empregada para indicar a existência de um único fator em um grupo. A correção neste caso é feita com a eliminação do grupo, já que só houve ocorrências para um dos fatores considerados.

A confiabilidade dos resultados produzidos pelos cálculos do peso relativo em comparação à frequência bruta reside no fato de que o peso mede o efeito simultâneo de cada fator em relação à aplicação da regra, ao passo que esta última não leva em conta a interação entre os fatores; apenas fornece a taxa real de ocorrências. Naro (2007, p. 19) afirma que “[...] as freqüências brutas, embora concretas e intuitivamente bastante ‘reais’, podem ser falaciosas, porque seu cálculo não leva em conta as inter-relações existentes entre as categorias que atuam numa regra variável”.

A seleção dos grupos de fatores é feita com base no nível de significância, que é o modo de medir as probabilidades de atuação dos fatores selecionados e deve ser analisado em relação à hipótese nula, segundo a qual a variação estudada seria

aleatória. Assim, quanto menor o valor obtido, maior será a probabilidade de a hipótese nula ser considerada verdadeira e de os fatores selecionados apresentarem relevância estatística para explicar a variação estudada. Convencionou-se 0,05 como ponto de corte. O grupo que alcançar um valor acima deste deverá ser eliminado por não apresentar relevância estatística.

Em síntese, o programa computacional fornece informações quantitativas importantes para guiar o pesquisador na análise dos fenômenos linguísticos, quais sejam: a) as frequências brutas; b) o peso relativo para cada um dos fatores das variáveis independentes; c) a seleção das variáveis; e d) o nível de significância. É oportuno lembrar que, a estatística é apenas uma ferramenta valiosa que auxilia o pesquisador no entendimento do comportamento de fenômenos linguísticos variáveis. Isso quer dizer que em nada substitui o papel do linguista, a quem cabe a análise qualitativa dos dados.