• Nenhum resultado encontrado

CAPÍTULO 3 METODOLOGIA DE PESQUISA ​

3.3 O SOFTWARE IRAMUTEQ

O ​software ​IraMuTeQ (Interface R para Análises de Textos Multidimensionais e Questionários) foi utilizado neste trabalho na versão 0.7 ​alpha ​2. Este ​software ​funciona nos sistemas operacionais Linux, Macintosh e Windows, sua distribuição é gratuita estando disponível para ​download​ na página do ​software. 58

O IraMuTeQ é baseado na linguagem R e na linguagem 59 ​python . Loubère, Ratinaud60 (2014, p. 3, tradução nossa) afirmam que o ​software ​“oferece um conjunto de tratamentos e ferramentas para ajudar na descrição e análise de ​corpus textuais e matrizes de tipos pessoas/personagens”, sendo possível ser utilizado como uma ferramenta auxiliar na análise

58 - O ​software ​está disponível para ​download ​no site <http://www.iramuteq.org/>. 59 - Para saber mais sobre a linguagem R, basta acessar <www.r-project.org>. 60 - Para saber mais sobre a linguagem python, basta acessar <www.python.org>.

82

de documentos de textos e quadros.

Dentre as diversas análises que o ​software ​faz, adotou-se a análise de Classificação Hierárquica Descendente (CHD). No entanto, para explicar melhor esta análise, é necessário formalizar alguns conceitos:

Corpus​: é o conjunto de todas as respostas organizadas de forma separada em um único documento;

❖ Texto: é considerado o texto de cada uma das respostas presentes no ​corpus, ​ou seja, o corpus ​é o conjunto dos textos;

❖ Segmento de texto (ST): são fragmentos dos textos recortados que geralmente tem em média três (3) linhas (CAMARGO e JUSTO, 2013);

❖ Ocorrências: é a quantidade de palavras do todo que o ​software ​considerou em uma análise;

❖ Número de formas: é o número de palavras sem repetição, considerando-se como o vocabulário da análise;

Hapax​: segundo Salviati (2017, p. 13), “[...] é uma palavra que aparece registrada somente uma vez em um dado idioma. No IraMuTeQ, esta expressão designa uma palavra que se utilizou ou registrou apenas uma vez em um ​corpus​”;

❖ Lematização: segundo Salviati (2017. p. 13), “[...] é o processo, efetivamente, de flexionar uma palavra para determinar o seu lema (as flexões chamam-se lexemas)”; ❖ Classes: considera-se como uma classe um grupo representativo da amostra que tem

respostas em comum, estas classes serão consideradas como “subcategorias”;

❖ Frequência: é a frequência que as palavras aparecem, considerando-se como uma taxa de corte, 15%;

❖ x²: (lê-se qui-quadrado) é o teste estatístico realizado pelo ​software ​IraMuTeQ que mostra o quanto as palavras estão relacionadas e imbricadas. Considera, como taxa de corte, valores menores que 3,84, pois este é um valor tabelado considerado como o valor crítico do x², ou seja, para valores maiores que 3,84 os resultados são significativos (CONTI, 2009, p. 2).

Relembrando que cento e setenta e um (171) professores foram os sujeitos integrantes da amostra. O quadro 4 mostra a distribuição destes, quanto a utilização ou não utilização da Gamificação no ensino de Matemática, bem como as técnicas de análise empregadas.

83

Quadro 4.​ Relação entre o quantitativo de professores que utilizou ou não a Gamificação e o método empregado na análise.

Fonte​: Elaborado pelo autor (2019)

Para as questões abertas do questionário, optou-se inicialmente pela análise de cada uma delas, de forma separada, criando subcategorias, pois, segundo Salviati (2017, p. 11), “caso as questões referiram-se a temas ou aspectos diferentes, é necessário realizar uma análise para cada questão, caso contrário, a análise resulta apenas na identificação dos diversos temas [...]”, o que possibilita resultados mais precisos.

Camargo e Justo (2013, p. 3) destacam que “o ​corpus adequado à análise do tipo Classificação Hierárquica Descendente – CHD, realizada pelo software IraMuTeQ precisa constituir-se num conjunto textual centrado em um tema”, o que justifica a utilização da análise de questão por questão com a análise da CHD. Segundo esta análise, Salviati (2017), declara:

[...] visa obter classes de segmentos de texto (ST) que, ao mesmo tempo, apresentam vocabulário semelhante entre si e vocabulário diferente das ST das outras classes. Esta análise é baseada na proximidade léxica e na ideia que palavras usadas em contexto similar estão associadas ao mesmo mundo léxico e são parte de mundos mentais específicos ou sistemas de representação. Nessa análise, os segmentos de texto são classificados de acordo com seu respectivo vocabulário e o conjunto de termos é particionado de acordo com a frequência das raízes das palavras. O sistema procura obter classes formadas por palavras que são significantemente associadas com aquela classe (SALVIATI, 2017, p. 47).

A análise da CHD origina classes que agrupam as palavras do ​corpus textual conforme os valores do teste qui-quadrado, e permite ao pesquisador construir as subcategorias (classes) para análise.

Para que seja possível a realização da análise da CHD, é necessário construir um corpus ​textual contendo as respostas dos sujeitos da pesquisa para as questões propostas.

84

Camargo e Justo (2013) destacam orientações para que seja elaborado este ​corpus,​que são as seguintes:

O​corpus ​pode ser construído no editor de texto ​LibreOffice (​ou no ​Word, em alguns 61 casos) utilizando a codificação Unicode UTF – 8. Nos dados coletados no questionário respondido pelos professores, observa-se que:

❖ Cada pergunta aberta gerou um conjunto de respostas, sendo esse conjunto o ​corpus do trabalho. No documento do ​LibreOffice ​cada uma dessas respostas fica em uma linha, sendo chamada de linha de comando, ou seja, é o comando que o ​software precisa ler para entender o que está naquela linha;

❖ Para a construção de uma linha de comando segue-se a ordem da figura 12:

Figura 12. ​Linha de comando para construção do ​corpus ​de trabalho.

Fonte: ​Elaborado pelo autor com base nos tutoriais do ​software IraMuTeQ de Camargo e Justos (2013)

❖ Após a elaboração de todas as linhas de comando e da organização de cada uma das respostas devidamente em seu lugar, é necessário fazer a correção ortográfica, sintática e revisar todas as questões verificando erros de digitação, além de complementação das frases para que se tenha sentido, e/ou, eliminação de frases sem sentido;

❖ Não se deve deixar parágrafos ou linhas avulsas. Também, o texto não deve conter nenhuma formatação (negrito, itálico, sublinhado, espaçamentos, parágrafos, etc.). Deve-se excluir as pontuações como aspas ("), cifrão ($), apóstrofo ('), porcentagem (%) hífen (-), e asterisco (*), exceto para as linhas de comando.

Finalizando a construção do ​corpus ​textual, ele pode ser inserido no ​software IraMuTeQ, gerando vários relatórios, dentre eles a CHD. Na próxima seção, apresenta-se as

85

técnicas de Análise de Conteúdo de Bardin (2016), bem como considerações de como elas foram utilizadas na análise dos dados desta dissertação.