O SOFTWARE IRAMUTEQ

CAPÍTULO 3 METODOLOGIA DE PESQUISA

3.3 O SOFTWARE IRAMUTEQ

O _software _{IraMuTeQ (Interface R para Análises de Textos Multidimensionais e} Questionários) foi utilizado neste trabalho na versão 0.7 _alpha _{2. Este software funciona nos} sistemas operacionais Linux, Macintosh e Windows, sua distribuição é gratuita estando disponível para _{download na página do software.}58

O IraMuTeQ é baseado na linguagem R e na linguagem 59 _{python . Loubère, Ratinaud}60 (2014, p. 3, tradução nossa) afirmam que o _software _{“oferece um conjunto de tratamentos e} ferramentas para ajudar na descrição e análise de _{corpus textuais e matrizes de tipos} pessoas/personagens”, sendo possível ser utilizado como uma ferramenta auxiliar na análise

58_{- O}_{software está disponível para download no site <http://www.iramuteq.org/>.} 59_{- Para saber mais sobre a linguagem R, basta acessar <www.r-project.org>.} 60_{- Para saber mais sobre a linguagem python, basta acessar <www.python.org>.}

de documentos de textos e quadros.

Dentre as diversas análises que o _software _{faz, adotou-se a análise de Classificação} Hierárquica Descendente (CHD). No entanto, para explicar melhor esta análise, é necessário formalizar alguns conceitos:

❖ Corpus_{: é o conjunto de todas as respostas organizadas de forma separada em um} único documento;

❖ Texto: é considerado o texto de cada uma das respostas presentes no _corpus, _{ou seja, o} corpus _{é o conjunto dos textos;}

❖ Segmento de texto (ST): são fragmentos dos textos recortados que geralmente tem em média três (3) linhas (CAMARGO e JUSTO, 2013);

❖ Ocorrências: é a quantidade de palavras do todo que o _software _{considerou em uma} análise;

❖ Número de formas: é o número de palavras sem repetição, considerando-se como o vocabulário da análise;

❖ Hapax_{: segundo Salviati (2017, p. 13), “[...] é uma palavra que aparece registrada} somente uma vez em um dado idioma. No IraMuTeQ, esta expressão designa uma palavra que se utilizou ou registrou apenas uma vez em um _corpus”;

❖ Lematização: segundo Salviati (2017. p. 13), “[...] é o processo, efetivamente, de flexionar uma palavra para determinar o seu lema (as flexões chamam-se lexemas)”; ❖ Classes: considera-se como uma classe um grupo representativo da amostra que tem

respostas em comum, estas classes serão consideradas como “subcategorias”;

❖ Frequência: é a frequência que as palavras aparecem, considerando-se como uma taxa de corte, 15%;

❖ x²: (lê-se qui-quadrado) é o teste estatístico realizado pelo _software _{IraMuTeQ que} mostra o quanto as palavras estão relacionadas e imbricadas. Considera, como taxa de corte, valores menores que 3,84, pois este é um valor tabelado considerado como o valor crítico do x², ou seja, para valores maiores que 3,84 os resultados são significativos (CONTI, 2009, p. 2).

Relembrando que cento e setenta e um (171) professores foram os sujeitos integrantes da amostra. O quadro 4 mostra a distribuição destes, quanto a utilização ou não utilização da Gamificação no ensino de Matemática, bem como as técnicas de análise empregadas.

Quadro 4._{Relação entre o quantitativo de professores que utilizou ou não a Gamificação e o} método empregado na análise.

Fonte_{: Elaborado pelo autor (2019)}

Para as questões abertas do questionário, optou-se inicialmente pela análise de cada uma delas, de forma separada, criando subcategorias, pois, segundo Salviati (2017, p. 11), “caso as questões referiram-se a temas ou aspectos diferentes, é necessário realizar uma análise para cada questão, caso contrário, a análise resulta apenas na identificação dos diversos temas [...]”, o que possibilita resultados mais precisos.

Camargo e Justo (2013, p. 3) destacam que “o _{corpus adequado à análise do tipo} Classificação Hierárquica Descendente – CHD, realizada pelo software IraMuTeQ precisa constituir-se num conjunto textual centrado em um tema”, o que justifica a utilização da análise de questão por questão com a análise da CHD. Segundo esta análise, Salviati (2017), declara:

[...] visa obter classes de segmentos de texto (ST) que, ao mesmo tempo, apresentam vocabulário semelhante entre si e vocabulário diferente das ST das outras classes. Esta análise é baseada na proximidade léxica e na ideia que palavras usadas em contexto similar estão associadas ao mesmo mundo léxico e são parte de mundos mentais específicos ou sistemas de representação. Nessa análise, os segmentos de texto são classificados de acordo com seu respectivo vocabulário e o conjunto de termos é particionado de acordo com a frequência das raízes das palavras. O sistema procura obter classes formadas por palavras que são significantemente associadas com aquela classe (SALVIATI, 2017, p. 47).

A análise da CHD origina classes que agrupam as palavras do _{corpus textual conforme} os valores do teste qui-quadrado, e permite ao pesquisador construir as subcategorias (classes) para análise.

Para que seja possível a realização da análise da CHD, é necessário construir um corpus _{textual contendo as respostas dos sujeitos da pesquisa para as questões propostas.}

Camargo e Justo (2013) destacam orientações para que seja elaborado este _corpus,_{que são as} seguintes:

O_corpus _{pode ser construído no editor de texto LibreOffice (ou no Word, em alguns} 61 casos) utilizando a codificação Unicode UTF – 8. Nos dados coletados no questionário respondido pelos professores, observa-se que:

❖ Cada pergunta aberta gerou um conjunto de respostas, sendo esse conjunto o _corpus do trabalho. No documento do _LibreOffice _{cada uma dessas respostas fica em uma} linha, sendo chamada de linha de comando, ou seja, é o comando que o _software precisa ler para entender o que está naquela linha;

❖ Para a construção de uma linha de comando segue-se a ordem da figura 12:

Figura 12. _{Linha de comando para construção do corpus de trabalho.}

Fonte: _{Elaborado pelo autor com base nos tutoriais do software}IraMuTeQ de Camargo e Justos (2013)

❖ Após a elaboração de todas as linhas de comando e da organização de cada uma das respostas devidamente em seu lugar, é necessário fazer a correção ortográfica, sintática e revisar todas as questões verificando erros de digitação, além de complementação das frases para que se tenha sentido, e/ou, eliminação de frases sem sentido;

❖ Não se deve deixar parágrafos ou linhas avulsas. Também, o texto não deve conter nenhuma formatação (negrito, itálico, sublinhado, espaçamentos, parágrafos, etc.). Deve-se excluir as pontuações como aspas ("), cifrão ($), apóstrofo ('), porcentagem (%) hífen (-), e asterisco (*), exceto para as linhas de comando.

Finalizando a construção do _corpus _{textual, ele pode ser inserido no software} IraMuTeQ, gerando vários relatórios, dentre eles a CHD. Na próxima seção, apresenta-se as

técnicas de Análise de Conteúdo de Bardin (2016), bem como considerações de como elas foram utilizadas na análise dos dados desta dissertação.

No documento A Gamificação como estratégia de ensino: a percepção de professores de matemática (páginas 83-87)

CAPÍTULO 3 METODOLOGIA DE PESQUISA ​

3.3 O SOFTWARE IRAMUTEQ

CAPÍTULO 3 METODOLOGIA DE PESQUISA