• Nenhum resultado encontrado

2 Caracterização do Problema e Trabalhos Correlatos

2.5 Trabalhos Correlatos em EDM

2.5.2 Trabalhos Direcionados a Identificar e Comparar o Desempenho dos

Em MINAEI-BIDGOLI e PUNCH (2003) utilizaram uma combinação de algoritmos classificadores com o objetivo de predizer as notas finais de uma disciplina do curso on-line LON-CAPA. O experimento utilizou os resultados de 12 exercícios de casa realizados por 261 estudantes inscritos na disciplina online de Física. Os autores demonstraram que a combinação de múltiplos classificadores obteve maior acurácia (86,8%) em comparação com as acurácias medidas individualmente, o experimento utilizou validação cruzada com 10 conjuntos (10-fold cross validation).

Os autores KOTSIANTIS et al. (2003) apresentaram um estudo comparativo entre seis algoritmos de aprendizado de máquina, objetivando encontrar o mais apropriado para predizer o abandono dos estudantes na disciplina “Introdução à Informática” de um curso na modalidade EAD na universidade Hellenic Open University, na Grécia. Neste trabalho, os autores analisaram 350 estudantes utilizando dados pessoais, participação nas atividades e notas nas avaliações. As seguintes técnicas de aprendizagem de máquina foram utilizadas: árvore de decisão, redes neurais artificiais, classificador Naive Bayes, aprendizagem baseados em instâncias, análise de regressão logística e Support Vector Machine (SVM). A conclusão do experimento mostrou que não havia diferença estatística entre os algoritmos estudados, mas o algoritmo classificador Naive Bayes foi ligeiramente melhor comparando com os demais.

University of Joensuu, Finlândia. Os autores analisaram dados de duas disciplinas ministradas no programa de Educação à Distância (EAD) do curso de Ciência da Computação. Os dados foram coletados durante dois anos letivos, sendo analisados 125 estudantes da disciplina de “Programação I” e 88 estudantes da disciplina de “Programação II”. A base de dados constituiu-se de atributos correspondentes a resultados de exercícios e notas finais. Foram comparados 5 classificadores: regressão linear, Support Vector Machine (SVM), Naive Bayes, redes bayesianas (Bayesian networks) e Bayesian multinets. O experimento utilizou validação cruzada de 10 conjuntos. Os autores concluíram que o classificador Naive Bayes foi melhor para prever potenciais estudantes desistentes nas disciplinas.

SUPERBY et al. (2006) analisaram o desempenho acadêmico dos estudantes das universidades belgas de língua francesa (Belgian French Speaking Universities). A pesquisa constituía em identificar no primeiro ano acadêmico estudantes em risco de falhar nos estudos ou abandonar, estabeleceram-se três níveis de risco: baixo, médio e alto. Foram coletados dados de 533 estudantes entre os anos 2003 a 2004. A análise para classificar os estudantes nos três grupos de risco foi feita utilizando os algoritmos: redes neurais (neural network), random forests e árvore de decisão (decision tree). O artigo utilizou questionários respondidos pelos estudantes das várias universidades envolvidas no estudo, os autores especularam que os resultados não foram satisfatórios porque a análise foi realizada com vários estudantes de diferentes universidades.

O trabalho de RUSLI et al. (2008) descreveu a utilização de três algoritmos preditivos para analisar o desempenho dos estudantes na Faculty of Information Technology and Quantitative Sciences na Universiti Teknologi MARA na Malásia. Os algoritmos utilizados foram: regressão logística, redes neurais artificiais e neuro-fuzzy. Os resultados mostraram que o sistema neuro-fuzzy foi que apresentou melhor resultado. O estudo foi feito com 393 estudantes e as variáveis utilizadas estão diretamente ligadas às formas de ingresso na universidade.

O artigo de GARCIA et al. (2009) descreve uma ferramenta de mineração de dados colaborativa baseada em regras de associação para auxiliar professores de cursos online a compartilhar e avaliar as informações descobertas. Os dados utilizados são logs de cursos online, os algoritmos de regras de associação são utilizados para descobrir relações entre os dados, os professores avaliam estas regras é utilizam um sistema de pontuação segundo a importância das mesmas. Mais detalhes sobre a ferramenta de mineração de dados KEEL (Knowledge Extraction based on Evaluationary Learning)

(ALCALÁ-FDEZ et al., 2009). A ferramenta proposta pelos autores é similar a ferramenta de mineração de dados Weka (HALL et al., 2009, BOUCKAERT et al., 2010).

Um trabalho mais abrangente foi realizado por DEKKER et al. (2009) no departamento de Engenharia Elétrica da Eindhoven University of Technology da Holanda. Os autores aplicaram técnicas de mineração de dados para identificar estudantes que abandonaram ou reprovaram no primeiro ano de graduação do curso de Engenharia Elétrica (DEKKER et al., 2009). Eles utilizaram dados pré-universitários dos estudantes com atributos informando: tipo de curso feito anteriormente, notas obtidas nas disciplinas Ciências, Matemática e outras. Os dados posteriores ao ingresso dos estudantes foram às notas obtidas em três exames parciais. Este trabalho foi feito com dados de 648 estudantes entre os anos de 2000 e 2009. Os autores testaram os algoritmos: árvore de decisão, classificadores bayesianos, regras de associação. Segundo os pesquisadores o classificador baseado em árvore de decisão obteve melhor resultado.

Em sua tese de doutorado HUANG (2011) utilizou um conjunto de modelos matemáticos (estáticos e mineração de dados) para predição do desempenho acadêmico dos estudantes na disciplina “Engineering Dynamics” na Utah State University, Estados Unidos. Nos quatro semestres de 2008 a 2011 foram coletados dados de 323 estudantes. As variáveis utilizadas foram às notas das disciplinas que são pré-requisitos a esta disciplina e as notas dos exames parciais da disciplina. Quatro técnicas de modelagem matemática foram utilizadas: regressão linear múltipla, rede neural, redes RBF e SVM. O autor mostrou que as quatro técnicas modelagem matemática apresentaram uma média de acurácia na predição superior a 80%. O autor relata que dados do conhecimento prévio dos estudantes influenciaram significativamente na acurácia do modelo de predição do desempenho acadêmico dos estudantes. O resultado obtido é uma predição da nota na disciplina. O autor utilizou os pacotes de software comerciais SPSS 18 e o MATLAB para executar os algoritmos dos modelos matemáticos investigados.

O trabalho de ZAFRA et al. (2011) propõe uma nova representação baseado em Multiple Instance Learning (MIL) para melhorar a eficiência em predizer o desempenho acadêmico de estudantes em Ambiente Virtual de Aprendizagem (AVA) em comparação com a utilização dos algoritmos clássicos. Os autores mostraram que para os dados de estudantes que utilizaram o sistema AVA da Cordoba University, Espanha, o sistema

MIL foi mais apropriado.

O trabalho desenvolvido por TONTINI et al. (2011) em uma IES da rede privada brasileira utilizou como base de dados às respostas de um questionário aplicado aos estudantes dos cursos de graduação. O questionário pedia uma avaliação da infraestrutura da instituição, qualidade do curso, expectativa profissional dos estudantes com relação à futura profissão e informações socioeconômicas. O autor considerou as respostas de 300 estudantes evadidos entre 2009/1 e 2009/2, e mais 300 estudantes escolhidos aleatoriamente que permaneceram matriculados na instituição. A análise das respostas para identificar estudantes em risco de evasão seguiu os procedimentos: método estatístico, análise de agrupamentos (clustering) e redes neurais artificiais RBF.

CHEEWAPRAKOBKIT (2013) investigou os fatores que afetam o desempenho acadêmico, ele analisou dados acadêmicos e pessoais dos estudantes de um programa internacional. O conjunto de dados analisados possui 1600 registros com 22 atributos entre os anos de 2001 a 2011 na universidade da Tailândia. Os autores utilizaram dois classificadores e utilizaram a validação cruzada com 10 conjuntos para conduzir o experimento. Os resultados experimentais mostraram que o classificador árvore de decisão obteve acurácia de 85% e o classificador redes neurais obteve acurácia de 84%.

2.5.3 Trabalhos Relacionados Utilizando Métodos Estatísticos e/ou