4 ANÁLISE DE CORPUS
5.4 Análise Estatística e Design Experimental
5.4.2 A Linguagem como um Efeito Fixo: Problemas e Soluções
5.4.2.3 Lidando com a Falácia da Linguagem como um Efeito Fixo
Embora a principal forma proposta por Clark (1973) para se lidar com a variação resultante do efeito dos itens fosse estatística, essa variação também pode ser controlada de forma experimental (Raaijmakers & cols., 1999) e é exatamente essa forma de controle que o presente estudo adotou. Nesse caso, a preocupação é tentar impedir que a variação resultante do efeito dos itens possa afetar a média entre as diferentes condições experimentais. Tendo isso em mente, no presente estudo, foram utilizados diversos controles para tentar reduzir a variação entre os itens, afinal, em todas as condições experimentais foram mantidos constantes o número de sílabas das palavras (todas dissílabas), a correspondência grafema- fonema (todas regulares), a classe gramatical (apenas substantivos), o número de vizinhos transpostos (apenas um por condição experimental) e a freqüência de ocorrência média (todas de baixa freqüência de ocorrência, com média geral de 10,11 ocorrências por milhão de palavras). Além disso, entre as condições experimentais as palavras foram pareadas de acordo com o fonema inicial.
Pode-se argumentar que o extenso conjunto de controles utilizado, por si só, já é suficiente para reduzir sobremaneira a variação resultante do efeito dos itens. No entanto, nesse estudo, foi possível o uso de uma estratégia mais efetiva. As palavras-estímulo do presente trabalho foram subdivididas em quatro listas dentro de cada condição experimental, de forma que as palavras representando a „lista 1‟, em uma determinada condição experimental, foram pareadas de acordo com o fonema inicial e balanceadas de acordo com a freqüência de ocorrência média, com as palavras que representam a „lista 1‟ nas demais condições experimentais, o mesmo ocorrendo para as palavras representantes das listas 2, 3 e 4. Dessa forma, pode-se considerar que no nível das listas, as mesmas foram pareadas de
acordo com a freqüência de ocorrência e com o fonema inicial. Isso permite que as quatro listas de palavras, ao invés de serem aninhadas dentro das condições experimentais, possam ser cruzadas entre as condições experimentais, o que impede que o efeito principal das listas afete a diferença entre as médias. Isso pode ser observado no seguinte exemplo: imagine que a „lista 1‟, no geral, seja reconhecida mais rapidamente do que as demais listas. Ora, como existem palavras representando a „lista 1‟, em todas as condições experimentais, qualquer que seja a diferença de rapidez dessa lista de palavras em relação às outras, ela estará distribuída entre as condições experimentais e não afetará a diferença entre as médias. Sendo assim, da mesma forma que existem designs “entre-sujeitos” e “intra-sujeitos”, pode-se dizer que existem designs “entre-itens” e “intra-itens”. Porém, no caso desse estudo, o design é “intra- listas”, pois o pareamento entre os itens ocorreu no nível das listas e não no nível dos itens individuais.
Tendo subdividido os estímulos experimentais em quatro listas, além de controlar experimentalmente o efeito da variação dos itens, tornou-se também possível utilizar os mesmos participantes nos quatro experimentos desenvolvidos nesse estudo. Isso ocorreu devido ao esquema de contrabalanceamento das listas que foi adotado, em que cada participante foi exposto a apenas uma das listas por condição experimental. Assim, cada participante foi exposto a apenas um quarto dos estímulos (palavras alvo) por experimento, o que permitiu que ele participasse dos quatro experimentos, sendo que, em cada um deles, foi exposto a uma ordem de listas diferente (e conseqüentemente, devido à natureza do pareamento desenvolvido, a um conjunto de palavras diferentes). Para a análise dos dados desse design um tanto complexo, adotou-se a recomendação de Pollatsek e Well (1995 – anexo B, p.793) de incluir dois fatores entre sujeitos („D‟ e „E‟) na análise de variância para capturar a estrutura do contrabalanceamento das listas e permitir a extração da variação referente ao efeito principal das listas e da variação referente à interação entre listas e
tratamento. Dessa forma, conforme proposto por Pollatsek e Well, para todas as análises desenvolvidas, a variação referente ao efeito principal das listas foi extraída do termo de erro (afinal, devido ao esquema de contrabalanceamento utilizado essa variação não contribui para diferenças entre as condições experimentais) e a variação referente à interação entre listas e tratamento foi adicionada ao termo de erro (o que permitiu o acréscimo de dois graus de liberdade aos testes, aumentando o poder estatístico). É importante ressaltar que os fatores „D‟ e „E‟ não têm qualquer significado teórico, eles foram incluídos nas análises apenas para permitir que o esquema de contrabalanceamento das listas fosse levado em consideração na análise estatística, permitindo uma análise mais poderosa (com maior número de graus de liberdade). De qualquer forma, o efeito da interação entre as listas e o tratamento foi tão reduzido nesse estudo que os dois tipos de análise estatística desenvolvidos apresentaram virtualmente os mesmos resultados (ANOVA em que foram extraídas do termo de erro as variações referentes ao efeito principal das listas e a interação entre listas e tratamento; e, ANOVA em que foi extraída a variação referente ao efeito principal das listas, porém a variação referente à interação entre listas e tratamento foi adicionada ao termo de erro), ou seja, nenhum resultado que era estatisticamente significante deixou de ser e vice-versa. Assim sendo, para facilitar a visualização dos dados, na análise dos resultados, foram considerados apenas os fatores „N‟ e „NF‟ e os testes estatísticos foram desenvolvidos com o auxílio do programa SPSS for Windows versão 16.0, sendo incorporadas nas análises estatísticas as recomendações de Pollatsek e Well (1995), pois representam a forma mais poderosa de análise dos dados. A Tabela 10 apresenta o esquema de contrabalanceamento utilizado bem como sua relação com „D‟, „E‟, „N‟ e „NF‟.
Tabela 10 - Esquema de contrabalanceamento de listas para um design onde „N‟ e „NF‟ são fatores com medidas repetidas e „D‟ e „E‟ fatores entre sujeitos
N1 N2 Grupos NF1 NF2 NF1 NF2 D1E1 L1 L2 L3 L4 D1E2 L2 L1 L4 L3 D2E1 L3 L4 L1 L2 D2E2 L4 L3 L2 L1
Nota. N1 = apenas 1 vizinho ortográfico; N2 = 4 ou mais vizinhos ortográficos; NF1 = sem vizinhos ortográficos de maior freqüência de ocorrência; NF2 = um vizinho ortográfico de maior freqüência de ocorrência; L = lista e seu respectivo número; D e E = fatores que capturam a estrutura do esquema de contrabalanceamento das listas.