• Nenhum resultado encontrado

Capítulo III – Metodologia da Investigação

4. Técnicas de análise de dados

4.1. Análise estatística

“No momento da interpretação, dispomos de uma coleção de discursos individuais, a partir dos quais é necessário construir um único discurso” (Ghiglione & Matalon, 1993, p.3).

Após a recolha dos dados, tal como advoga Coutinho (2011), pretendemos organizar e descrever os resultados de forma clara quer à comunidade científica, quer ao público em geral, identificar o que é típico e atípico e evidenciar diferenças, relações e/ou padrões.

167

Para De Ketele e Rogiers (1993), o tratamento dos resultados obtidos deve ser, também, pertinente, válido e fiável. Pertinente significa, neste caso, ter a certeza de que não nos enganamos no tipo de tratamento a efetuar, tendo em conta os seus objetivos; válido pois deve assegurar-nos de que o tratamento que efetuamos é efetivamente aquele que pretendemos; fiável, exprime, neste caso, que deve permitir redigir conclusões com bases sólidas.

Numa primeira fase da análise utilizamos as estatísticas descritivas que têm como função obter uma primeira leitura dos dados capaz de dar uma ideia da dispersão, forma, estrutura da distribuição (Coutinho, 2011).

Como referem De Ketele e Rogiers (1993), os métodos de recolha de informação condicionam, posteriormente, as estratégias do respetivo tratamento. Outra condicionante é o tipo de variáveis em estudo. Para estes autores uma variável é uma “quantidade ou qualidade suscetível de flutuação, isto é, suscetível de tomar diferentes valores chamados modalidades” (Ibidem, p.93).

Em termos metodológicos temos, neste estudo, variáveis independentes (sexo; idade; grupo disciplinar; habilitações académicas; tempo de serviço; situação profissional) e variáveis dependentes (itens: 1 a 71).

Do ponto de vista matemático ou de medição, temos variáveis qualitativas (sexo; grupo disciplinar; habilitações académicas; situação profissional) e quantitativas (idade; tempo de serviço). No caso das variáveis dependentes (itens: 1 a 71), apesar de serem medidas numa escala de Likert, mensurando, por isso, construtos contínuos, podem, de acordo com Coutinho (2011) ser transformadas em variáveis quantitativas discretas, pois a escala permite apenas valores de 1 a 5, associados à variável. Sendo consideradas como variáveis discretas, são passíveis de serem medidas com maior precisão, sendo este um procedimento aceite de forma generalizada.

Neste estudo, a escolha das medidas estatísticas a calcular prendeu-se ainda com a escala de medida de variáveis. Assim consideramos variáveis nominais, as variáveis “sexo”, “grupo disciplinar” e “situação profissional”, por serem variáveis puramente qualitativas (Martins, 2011); variáveis ordinais, as variáveis “idade”, “habilitações académicas” e “tempo de serviço”, por ser “possível ordenar, de forma crescente ou decrescente, as suas diversas categorias (Ibidem, p.17) e variáveis intervalares, as variáveis dependentes (itens 1 a 71). Neste tipo de variável, de escala intervalar, “as diferenças entre valores numéricos adjacentes

168

na escala indicam diferenças iguais na quantidade da escala medida (Hill & Hill, 2012, p.112), indicando a posição dos inquiridos e quanto se distanciam entre si em relação a um determinada fenómeno (Coutinho, 2011).

Moreira (2006, p.50) chama a atenção para o facto de “a classificação de uma dada variável num dado nível de medida nem sempre é clara nem está isenta de controvérsia. Estes casos são particularmente frequentes na discussão entre os níveis ordinal e intervalar.” Enquanto uns autores, a propósito de escalas de avaliação de tipo Likert, advogando que os intervalos entre o “Discordo totalmente” e o “Discordo” e entre o “Concordo” e o “Concordo totalmente” podem não ser igualmente espaçados, consideram as variáveis em questão como variáveis ordinais, Moreira (2006, p.50) afirma que há outros autores, entre os quais ele próprio, que defendem que “as diferenças entre os intervalos não deverão, na generalidade dos casos, ser muito grandes, pelo que a distorção produzida pelo facto de se pressupor que eles são iguais acabará por se revelar menor”, devendo optar-se, neste caso, por considerar as variáveis medidas pela escala de Likert, como variáveis intervalares, por assim permitirem a utilização de técnicas estatísticas tais como o cálculo da média aritmética e coeficientes de correlação.

Para as variáveis independentes, que caracterizam a amostra, escolhemos apresentar os dados em tabelas de frequência e gráficos de barras, que já apresentamos no ponto 3.3.1 deste capítulo. Para isso foi necessário, em primeiro lugar, codificá-las, utilizando um código numérico, isto é, atribui-se um número a cada resposta possível a cada item, como por exemplo, para a variável sexo: feminino = 1 e masculino = 2. “Este número é como que um outro nome que se atribui ao dado, mas é mais reduzido e, por conseguinte, mais fácil de registar, de tratar e de recuperar” (Tuckman, 2000, p.381).

Para as variáveis de tipo intervalar, após leitura atenta de literatura relativa ao assunto e seguindo a orientação de autores como Coutinho (2011) e Tuckman (2000), escolhemos, para as respostas a cada item do questionário, determinar as frequências relativas, em percentagem, de cada nível de concordância com a afirmação do item; a média aritmética (

x

) das pontuações das respostas a cada questão; o desvio-padrão, como medida de variabilidade associada à média, para aferir a dispersão dos dados (Ghiglione & Matalon, 1993).

A descrição dos resultados obtidos é feita pelas subcategorias que compõem as duas grandes categorias pelas quais se dividem as questões do inquérito, procurando, assim, como

169

refere Black (1999, citado por Coutinho, 2011, p.131), “transformar os dados em informação”.

Em cada tabela, optamos por apresentar os itens por ordem decrescente dos valores da média aritmética, que mede o grau de concordância dos inquiridos com as afirmações de cada questão, de acordo com a interpretação apresentada no Quadro 4.

Valor da Média Grau de concordância

1,00 a 2,75 Discordância 2,76 a 3,25 Indefinição avaliativa 3,26 a 5,00 Discordância

Quadro 4 – Critérios de interpretação do grau de concordância

Ainda, em cada uma das tabelas, é indicado o desvio-padrão, que mede o grau de dispersão dos dados de cada item, relativamente à média. Em termos práticos, o desvio- padrão mede o grau de consenso das respostas dadas pelos professores inquiridos, para cada item, de acordo com a seguinte interpretação:

Valor do

Desvio-Padrão Grau de consenso

0 – 0,40 Alto consenso 0,41 – 0,70 Consenso alto/moderado 0,71 – 1,00 Consenso

moderado/ baixo > 1,00 Baixo consenso

Quadro 5 – Critérios de interpretação do grau de consenso

Para facilitar a leitura dos valores numéricos obtidos, quando o grau de concordância não é consensual, optámos por realçar o valor do desvio-padrão.

A numeração dos itens, apresentada nas tabelas, corresponde à numeração de cada um deles no questionário.

Dada a natureza deste estudo, as medidas estatísticas que escolhemos, têm como função, não tanto a extrapolação de resultados para o universo dos professores de matemática do 2.º e do 3.º ciclos, porque não temos como objetivo inferir resultados para a população, a

170

partir da amostra, mas circunscrevem-se, sobretudo, a um melhor conhecimento da amostra. Aliás, Ghiglione e Matalon (1993, p.328) referem que é pouco habitual, no âmbito das Ciências Sociais, haver condições de “especificar suficientemente uma hipótese para fazer predições sobre a forma que a relação deveria tomar”. Nestes casos, Barbetta (2002, p.261) defende que se torna “mais interessante estudar o nível de associação descrito pela própria amostra”.

Para medir o grau de correlação/associação entre duas variáveis dependentes, do tipo intervalar, calculamos o coeficiente de correlação de Pearson r (Moreira, 2006) e o coeficiente de determinação r2xy (Coutinho, 2011).

Hill e Hill (2012, p.202) referem que “um coeficiente de correlação é uma estatística descritiva que indica a natureza da relação entre duas variáveis.” No caso do coeficiente de correlação de Pearson, o valor deve estar entre -1 e +1. O sinal positivo ou negativo indica o sentido da relação e o valor absoluto indica a intensidade dessa relação.

Para a interpretação do coeficiente de correlação de Pearson, Cohen, Manion e Morrison (2000) advogam que devemos recorrer a três aspetos: o valor numérico do coeficiente; a significância estatística da correlação e o valor do coeficiente de determinação r2xy, que é o quadrado do coeficiente de correlação de Pearson.

São consideradas fracas as relações próximas de zero, e fortes, as relações próximas de um, em valor absoluto, mas para interpretar os valores intermédios é necessário recorrer à significância estatística da correlação. A questão que se coloca é: “quão forte é que deve ser considerada uma correlação para podermos aceitá-la como válida, ou seja, como sendo estatisticamente significativa?” (Coutinho, 2011, p.152).

O nível de significância estatística depende da dimensão da amostra, que quanto maior for, menor é o valor numérico necessário do coeficiente para que a correlação seja significativa. Porém esta significância estatística é frequentemente traduzida por um valor numérico, sendo habitualmente considerado aceitável, em investigação em ciências sociais e humanas, níveis de significância inferiores a 0,05 (p<0,05). É, segundo Tuckman (2000, p.370), “um nível absolutamente arbitrário que muitos investigadores consideram como ponto de decisão para aceitar uma conclusão confiável, ou para rejeitá-la por ser altamente improvável que venha a ocorrer com esse nível de confiança.” Este nível de significância dos coeficientes de correlação é diretamente calculado pelo programa SPSS.

171

Quanto ao coeficiente de determinação (valor do coeficiente de correlação ao quadrado), este indica a proporção partilhada ou explicada da variância dos valores de uma variável pela variância dos valores da outra variável (Hill & Hill, 2012), ou seja, “indica-nos a proporção de variância comum às duas variáveis” (Coutinho, 2011, p.153).

Para facilitar a interpretação dos coeficientes de correlação obtidos, Borg (1963; citado por Coutinho, 2011) apresentou uma proposta que refere valores aproximados para avaliar a magnitude de coeficientes de correlação em amostras de 100 ou mais indivíduos (Quadro 6).

Valor absoluto do

coeficiente de correlação Interpretação

0,20 – 0,35 Relações muito débeis entre variáveis, mesmo que possam ser estatisticamente significativas

0,35 – 0,65

Neste nível, as correlações têm já significância estatística para o nível <0,1, contudo, usadas isoladamente, são de muito pouca utilidade para previsão individualizada.

0,65 – 0,85 A partir deste nível é possível fazer previsão para grupos, com alguma certeza.

> 0,85 Relações muito fortes entre variáveis.

Quadro 6 – Proposta de interpretação de coeficientes de correlação

De um modo geral, o grau de relação entre variáveis é considerado forte para coeficientes de correlação iguais ou superiores a 0,7.

Calculamos ainda coeficiente de contingência, para medir o grau de associação entre a variável nominal “Grupo disciplinar” e cada uma das variáveis intervalares, que, neste caso, foram tratadas como variáveis nominais, tal como sugere Moreira (2006), vendo cada resposta possível (de 1 a 5), em cada item, uma “etiqueta”, em vez de um valor numérico. Este procedimento é também referido por Martins (2011, p.19): “a partir de uma variável intervalar é sempre possível chegarmos a uma variável ordinal ou mesmo nominal, a partir da recodificação da variável original.” Enfatizamos que estas medidas são apenas descritivas, referindo-se, apenas aos dados observados.

Para ilustrar a relação entre duas variáveis, utilizamos ainda as tabelas de contingência que não são mais do que tabelas de frequência que permitem verificar se a distribuição de uma das variáveis está relacionada com a distribuição da outra (Coutinho, 2011).

172

Documentos relacionados