• Nenhum resultado encontrado

CAPÍTULO 4 Critérios para a elaboração do estudo experimental: concepção, aplicação e revisão das provas, tratamento dos dados e organização da amostra

70 O corpus do Português Fundamental foi recolhido pelo Centro de Linguística da

4.5. Tratamento dos dados

4.5.2. Tratamento estatístico dos dados

Segundo Maroco (2003), a aplicação de testes estatísticos pressupõe a definição prévia das hipóteses ou dos objectivos que visam responder ao problema levantado no estudo, da amostragem, da amostra de dados e da relação a estabelecer entre estes (emparelhada ou independente) e, por fim, das variáveis. Segue-se uma breve descrição de cada um destes aspectos.

A partir da revisão da literatura realizada no presente trabalho, são levantadas as questões de investigação e respectivas hipóteses, com vista à verificação e eventual validação das mesmas. Para responder a estes objectivos, define-se o tipo de estudo a realizar como sendo transversal. Neste, todas as medições são feitas num único momento, não existindo, portanto, período de acompanhamento longitudinal dos indivíduos.

Os dados deste estudo são primários já que foram recolhidos directamente pelo investigador através de métodos laboratoriais. Nos processos experimentais, aplicados no presente estudo, exerce-se um controle directo sobre os factores que potencialmente afectam a característica ou o conjunto de características em análise.

Quanto à amostragem, a do presente estudo define-se como sendo não- probabilística (ou não aleatória). Neste tipo de amostragem a probabilidade de um determinado elemento pertencer à mesma não é igual à dos restantes elementos (não seguindo, portanto, os princípios básicos da teoria das probabilidades). Assim, este tipo de amostragens pode não ser representativo da população, embora constitua o método experimental preferencial na área da investigação social, dada a inexequibilidade das restantes alternativas (Maroco, 2003). Neste estudo, a amostragem é ainda considerada conveniente e heterogénea. Nas convenientes, os elementos são seleccionados pela sua conveniência, acessibilidade e outros factores afins. Nas heterogéneas (ou de diversidade), as amostragens são constituídas de modo a que todas as características ou atributos estejam presentes, independentemente das proporções com que estas se encontram na população. Quanto à forma como os dados se relacionam, as amostras do presente estudo são emparelhadas por recorrerem aos mesmos sujeitos experimentais, tendo como base critérios unificadores dos elementos das amostras de dados (Maroco, 2003). O tratamento estatístico deste tipo de amostras passa pelo emparelhamento dos dados apurados em função de factores identificados como potenciais promotores de um determinado efeito. Assim, o emparelhamento entre amostras só é utilizado quando o investigador assume a existência de outras fontes de variabilidade não directamente relacionadas com o factor em estudo mas que podem interferir com os seus efeitos. Por outro lado, sabe-se que, dependendo do tipo de variáveis que constituem os dados, estas podem ser expressas em três escalas distintas: nominal, ordinal, intervalar e de razão. Os dados qualitativos exprimem-se nas duas primeiras escalas e os dados quantitativos nas duas últimas. Dependendo do acontecimento a medir, as variáveis do presente estudo são quantitativas e qualitativas. Nestas incluem-se as variáveis nominais (por exemplo os valores dicotómicos

atribuídos às respostas certas com 1 e erradas com 0) e as variáveis ordinais (por exemplo os valores registados relativamente à escolaridade). Enquanto que, nas variáveis qualitativas, a escala de medida apenas indica a sua presença em categorias de classificação discreta e mutuamente exclusivas, nas variáveis quantitativas a escala remete para uma medida que permite a ordenação e a quantificação de diferenças entre elas (Maroco, 2003). Neste trabalho, encontram-se variáveis de razão, ainda designadas “por rácio”. Estas assumem valores quantitativos cuja relação exacta entre eles é possível definir por estas integrarem uma escala que possui um zero absoluto (distinguindo-se assim das variáveis intervalares).

No presente estudo, procede-se inicialmente à análise descritiva dos resultados e posteriormente à análise inferencial dos mesmos. Para o tratamento estatístico dos dados recolhidos é utilizado o programa SPSS (Statistical Package for the Social Sciences) versão 18.0, de acordo com as orientações sugeridas em Maroco (2003),

considerando um nível de significância para a análise inferencial de 0,05.

A estatística descritiva realizada neste trabalho tem como objectivo representar o comportamento dos sujeitos testados relativamente ao seu desempenho em tarefas de escrita e de leitura (numa primeira fase, com vista à organização da amostra) e entre tarefas de CS, perante estímulos linguísticos fonologicamente controlados, ilustrando esse comportamento com gráficos e tabelas. A estatística descritiva tem uma presença transversal a todo o tratamento de dados apurados neste trabalho dada a importância da análise mais qualitativa e até mais individual dos dados, recorrendo-se assim a extracção de valores absolutos, mínimos e máximos, médias, percentagens e desvios- padrão, já que só assim se torna possível a leitura e a interpretação de comportamentos individuais e/ou marginais. Por outras palavras, para realização da análise estatística descritiva dos resultados apurados no presente estudo, recorre-se ao cálculo de

frequências105, de medidas de tendência central106 e de medidas de dispersão107, de acordo com Maroco (2003), Gageiro e Pestana (2005).

Tal como já referido na secção anterior, na fase inicial do tratamento dos dados, procede-se à análise dos resultados que proporcionam a organização da amostra (ver secção 4.6.2), tendo esta começado por uma análise descritiva e culminado numa divisão em quartis108. Realiza-se a análise por quartis com base na variável desempenho nas provas de leitura e de escrita (Provas B) e não nas variáveis

escolaridade nem idade por estas não se revelarem tão satisfatórias (principalmente

pela dispersão dos comportamentos observados nos 1º e 2º anos bem como nos 6 e 7 anos, respectivamente). Por outras palavras, a divisão da amostra em função da escolaridade ou da idade correlaciona-se igualmente com o desempenho da CS da

amostra testada, contudo, esta correlação revela-se menos significativa do que a análise proporcionada pelos quartis (para mais detalhes sobre a análise efectuada e aqui referida, consulte-se a secção 4.6.2).

A prossecução do tratamento estatístico para métodos inferenciais pressupõe a aplicação de testes paramétricos ou não paramétricos. Quando as amostras são grandes (n ≥ 30), está garantida a aproximação da distribuição normal dos resutados (segundo teorema de limite central, Maroco, 2003), como tal, é possível recorrer a testes

105 As frequências indicam a quantidade de vezes que um dado valor foi observado.

106 As medidas de tendência central caracterizam o valor da variável sob estudo que ocorre

com mais frequência (média amostral e moda).

107 As medidas de dispersão ou de variabilidade analisam a dispersão das observações em

torno das estatísticas de tendência central ou na amostra (mínimo, máximo e desvio padrão).

108 Na estatística descritiva, um quartil constitui qualquer um dos três valores que divide o

conjunto ordenado de dados em quatro partes iguais e assim cada parte representa 1/4 da amostra ou população (Maroco, 2003). A comparação de aspectos populacionais, através do recurso à média, variância e outras técnicas afins, apresenta-se efectivamente como uma das necessidades mais recorrentes em estatística. Este tipo de análise é particularmente útil para testar a significância de factores capazes de influenciar a resposta da variável de medida.