• Nenhum resultado encontrado

O tratamento estatístico dos dados

No documento GERUZA DE SOUZA GRAEBIN (páginas 110-115)

5.3 P RESSUPOSTOS METODOLÓGICOS

5.3.2 O tratamento estatístico dos dados

Estudos lingüísticos que têm como referencial teórico a Sociolingüística Variacionista, também chamada de ‘Sociolingüística Quantitativa’, têm lançado mão de modelos estatísticos para lidar com os dados da fala em uso. Esses modelos, propostos por Labov (1969), Cedergren & Sankoff (1974), Pascale Rousseau & Sankoff (1978) (apud Naro, 2003:19-25), indicam para o pesquisador, por meio de resultados numéricos, o índice de variação do fenômeno estudado e a seleção dos grupos de fatores lingüísticos e extralingüísticos que favorecem ou desfavorecem o uso de uma variante. O mais usado, historicamente conhecido como regras variáveis é, segundo Sankof (1988: 984), o modelo ideal para o estudo de variação lingüística. O modelo de regra variável é extremamente proveitoso para indicar tendências lingüísticas em grupos sociais, porque, como escrevem Guy & Zilles (2007: 102,103)

#A # # " # ' & $ # <# > # # A # ' = # ' ' $ - " ' # 1 < & 6 & $

A terminologia regra variável, destaca Tagliamonte (2006: 131), é conseqüência dos primeiros diálogos entre a sociolingüística e a fonologia gerativa das décadas de 60 e 70,

e “tem mais a ver com o fato de a variação ser sistemática (i.e governada por regra) do que com um formalismo específico”.59

O programa computacional mais utilizado pelos sociolingüistas tem sido o Varbrul2S (Pintzuk, 1988), que roda no antigo DOS. Entretanto, versões mais recentes adaptaram esse programa para o sistema operacional Windows. Nesta pesquisa fizemos uso, na maior parte do tempo, da versão mais recente do programa, denominada Goldvarb-X (Sankoff; Tagliamonte & Smith, 2005). Recorremos à versão mais antiga para fazer buscas e gerar listas por meio do T-SORT.

Guy (2007b: 69,70) ressalta que, embora o programa seja um recurso sofisticado à disposição do lingüista, ele é apenas um instrumento; os números, em si, não são o objetivo final da pesquisa, mas sim “identificar e explicar fenômenos lingüísticos” (Guy, 2007a: 31). De fato, Guy & Zilles (2007: 73) afirmam que o uso de métodos estatísticos “tem permitido demonstrar o quão central a variação pode ser para o entendimento de questões como identidade, solidariedade ao grupo local, comunidade de fala, prestígio e estigma, entre tantas outras”. Observam (2007: 107) também que modelos matemáticos sofisticados têm sido usados como um instrumento de trabalho por ciências como a física. Nesse sentido, a busca do suporte estatístico pela sociolingüística tem como finalidade o entendimento mais profundo dos fenômenos lingüísticos.

9 ' & # ! ' #

1$$$6$ ! # "

A # <# # #

! # #

$

O programa Goldvarb-X tem como princípio a análise multivariada, ou seja, é capaz de investigar as múltiplas variáveis que podem estar influenciando a variável lingüística em estudo (cf. Guy & Zilles, 2007: 105). Além disso, é ideal para o estudo de fala em uso porque consegue trabalhar com dados distribuídos de maneira não-uniforme, conforme Guy (2007a: 34):

59 Tradução nossa: “the reference to variation as ‘rule’ has more to do with variation being systematic (i.e rule- governed) than with any specific formalism”.

_ " 'J ' ! '

& & # # #

# & #

<# & # $

O uso do programa estatístico tem como objetivo principal refutar a hipótese nula, i.e, de que as variáveis independentes estipuladas não atuam de modo significativo sobre a variável dependente (cf. Sankoff, 1988: 987, Tagliamonte, 2006: 132). No caso das ciências sociais (e, conseqüentemente, para o Varbrul), a hipótese nula é rejeitada quando o valor da significância estatística, simbolizada por p, é menor do que 0,05 – menos de uma chance em vinte de ser verdadeira (cf. Guy & Zilles, 2007: 96).

Antes de calcular a significância e fazer as correlações entre todas as variáveis, o programa gera, a partir das informações passadas a ele pelo pesquisador, as freqüências absolutas e relativas da variável dependente em cada um dos fatores estudados. Tais números, obtidos na primeira etapa da análise estatística, dão uma idéia ao pesquisador da distribuição da variável dependente e podem fornecer as primeiras pistas para o entendimento do fenômeno. Entretanto, como observa Naro (2003: 19), “as freqüências brutas, embora concretas e intuitivamente bastante ‘reais’, podem ser falaciosas, porque seu cálculo não leva em conta as inter-relações existentes entre as categorias que atuam numa regra variável”.

As inter-relações são calculadas na última etapa do processo estatístico, quando todos os fatores invariantes ou categóricos – knockout - já foram devidamente observados e resolvidos pelo pesquisador dos fenômenos lingüísticos variáveis. Então, os pesos relativos, “os efeitos dos fatores de cada grupo em relação ao nível geral de ocorrência das variantes” (Guy & Zilles, 2007: 211), são projetados pelo programa.

O cálculo dos pesos relativos é feito a partir de um complexo processo estatístico do tipo step-up/step-down (cf. Guy & Zilles, 2007: 164-167, Tagliamonte, 2006: 140-145). No processo step-up, cada um dos grupos de fatores é adicionado individualmente. Para isso, o programa calcula o valor do input ou média corrigida, que “é a medida geral do nível de aplicação da regra” (Tagliamonte, 2006: 141).60 Então, em cada nível da análise, o programa

correlaciona o input do grupo de fatores selecionado com todos os grupos de fatores, gerando outros valores: o log likelihood - ou teste de máxima verossimilhança (uma medida de erro poderosa) – e a significância (p). O grupo de fatores com os melhores valores, geralmente aquele cujos resultados foram mais próximos de 0, é escolhido. Assim, o programa dá continuidade a esse processo de combinação entre os grupos de fatores até que todos sejam analisados. Finalmente, o programa indica qual foi a melhor etapa da análise quantitativa do step-up, mostrando os grupos estatisticamente relevantes. Dá-se início, então, ao processo inverso, chamado de step-down, no qual o programa faz novos testes estatísticos para verificar se de fato os grupos não selecionados são eliminados e se os selecionados não são eliminados, ou seja, faz uma espécie de “prova dos nove”. Ao final desse processo, o programa indica qual foi a melhor etapa da análise quantitativa do step-down e fornece uma lista dos grupos eliminados.

Geralmente, os valores dos pesos relativos são os mesmos na melhor rodada do step-up e na do step-down. Segundo Guy & Zilles (2007: 166), eles podem não coincidir quando “se trata de uma análise complexa (com muitos grupos de fatores), e quando os grupos não são completamente ortogonais”, ou seja, não co-ocorrem livremente. Em análises binárias, os pesos relativos com valores próximos de 1,0 são favoráveis à variante eleita como aplicação da regra; os próximos a 0,0 como inibidores; e os próximos de 0,5 como neutros ou de efeito intermediário, a depender do número de dados (cf. Naro, 2003: 24). A interpretação dos pesos relativos depende de cada pesquisa e estes não devem ser vistos isoladamente. Como observa Sankoff (1988: 989): “é a comparação de quaisquer dois fatores em um grupo de fatores (medida pelas suas diferenças) que é importante, e não seus valores individuais”61.

Nesta pesquisa, a variável em questão não é binária, mas ternária, já que a pronúncia das vogais médias /e/ e /o/ na comunidade de fala estudada pode ser realizada de três formas distintas: (i) com a média-fechada [e o]; (ii) com a média-aberta [E O] e (iii) com a alta [i u]. Alguns exemplos são:

61 Tradução de Maria Marta Pereira Scherre: “It is the comparison of the effects of any two factors in a factor group (as measured by their difference) which is important, and not their individual values.”

melhor ~ mèlhor ~ milhor propaganda ~ pròpaganda dezesseis ~ dizesseis

No entanto, por motivos que explicitaremos no capítulo seguinte, optamos por realizar rodadas binárias. Os resultados de cada uma das rodadas serão apresentados em tabelas. Nelas será possível conferir quais as variantes incluídas na rodada, as freqüências e os pesos relativos de cada fator, além de exemplos extraídos do corpus.

6 A

NÁLISE DOS

D

ADOS

No documento GERUZA DE SOUZA GRAEBIN (páginas 110-115)

Documentos relacionados