• Nenhum resultado encontrado

Como podemos ver, existem diversos trabalhos relacionados `a ´area, entretanto eles se diferenciam quanto ao tipo de dados que utilizam, tipo de ensino utilizado no estudo, as fontes de dados utilizadas e aos objetivos. Al ´em disto, mesmo trabalhos com foco muito pr ´oximo ainda apresentam resultados muito diferentes e podem ser ou n ˜ao de f ´acil generalizac¸ ˜ao.

A classificac¸ ˜ao inicial dos trabalhos se d ´a pelo seu objetivo, que geralmente varia entre predic¸ ˜ao de evas ˜ao e retenc¸ ˜ao e/ou predic¸ ˜ao de desempenho escolar. Os tra- balhos voltados para a predic¸ ˜ao da evas ˜ao buscam prever a situac¸ ˜ao final do aluno no curso, classificando estes como em risco ou normal. Enquanto que os trabalhos que buscam a predic¸ ˜ao do desempenho escolar, diferenciam-se quanto a classificac¸ ˜ao por disciplina como ROMERO et al. (2008) ou semestre CAMBRUZZI; RIGO; BARBOSA (2015).

No conceito de generalizac¸ ˜ao em minerac¸ ˜ao de dados exposto por BRAGA (2005), um modelo muito complexo e que leve em considerac¸ ˜ao muitos dados particulares pode se ajustar bem aos dados de treinamento e, no entanto, n ˜ao ter um bom desem- penho para outros dados. Ainda vale ressaltar que nem sempre os dados espec´ıficos utilizados para gerac¸ ˜ao dos modelos v ˜ao estar dispon´ıveis para os testes em outros locais.

Em relac¸ ˜ao aos dados utilizados podemos notar que entre as pesquisas analisadas pelo menos 5 utilizam dados demogr ´aficos em sua composic¸ ˜ao, enquanto 4 utilizam dados das interac¸ ˜oes dos alunos com ambientes virtuais e uma utiliza somente o desempenho escolar. Apenas uma pesquisa utiliza somente os dados de interac¸ ˜oes como base.

A utilizac¸ ˜ao de dados espec´ıficos pode acabar por dificultar o processo de generalizac¸ ˜ao, tendo em vista que vari ´aveis demogr ´aficas n ˜ao s ˜ao simples de serem repetidas em situac¸ ˜oes ou at ´e mesmo localidades diferentes. Como exemplo pode- mos citar testes que s ˜ao aplicados em um determinado local e podem ou n ˜ao ser aplicados em outros como o teste SAT (aplicado por algumas universidades dos Es- tados Unidos), ainda o grau de escolaridade pode ser diferente quando os cursos s ˜ao diferentes e vari ´aveis como sexo e idade podem ter impactos diferentes, dependendo do ambiente.

Nos trabalhos analisados geralmente os autores optam por seguir o fluxo dado na Figura 11 em suas pesquisas. Assim, esse ´e o fluxo seguido na metodologia desen- volvida nesse projeto.

Dados Demográficos Dados de Interações Dados Acadêmicos Dados Inicias em seu estado puro Etapa de Coleta e Pré-processamento Coleta Validação Classificação Coleta

FLUXO DOS DADOS E SEQUÊNCIA DO PROJETO

Experimentos Testes Geração dos Modelos Aplicação Discussão dos Resultados Publicação dos resultados Resultados Validação dos Resultados

Figura 11: Fluxo de dados e sequ ˆencia dos projetos

Podemos usar como exemplo o trabalho de LYKOURENTZOU et al. (2009) que apesar dos resultados expressivos apresentados, dificilmente poderia ser aplicado em outros locais fora da sua instituic¸ ˜ao, pois leva em conta dados muito espec´ıficos o que pode tornar mais dif´ıcil a generalizac¸ ˜ao dos modelos. Estes dados podem ser tanto os dados demogr ´aficos quanto at ´e mesmo dados espec´ıficos dos cursos como sua durac¸ ˜ao, onde nesta pesquisa citada o autor an ´alisa cursos com durac¸ ˜ao de apenas 8 aulas.

A pesquisa de JAYAPRAKASH et al. (2014) ´e outro exemplo que podemos analisar quanto a generalizac¸ ˜ao, pois mesmo outras universidades dos EUA teriam problemas para utilizar seus modelos devido a grande especificidade dos dados utilizados. Dados como os retirados do SAKAI ou quest ˜oes demogr ´aficas podem n ˜ao estar dispon´ıveis em outros locais, o que inviabiliza a utilizac¸ ˜ao dos modelos em outros ambientes.

Entretanto trabalhos como o de DETONI; ARAUJO; CECHINEL (2014) acredita-se que possam ser de f ´acil generalizac¸ ˜ao, pois trabalham somente com as interac¸ ˜oes geradas no ambiente virtual. Assim facilitando a generalizac¸ ˜ao de seus modelos e estes podendo ser aplicados em outras instituic¸ ˜oes que desejem utilizar a EDM como forma de aux´ılio na predic¸ ˜ao de desempenho de alunos.

Ainda temos um grande problema quanto `a ocultac¸ ˜ao de t ´ecnicas e resultados espec´ıficos, pois muitos autores como CAMBRUZZI; RIGO; BARBOSA (2015) n ˜ao demonstram algumas partes interessantes de suas pesquisas. Neste caso, por exem- plo, o autor n ˜ao revela especificamente os dados utilizados e sim somente de onde

estes dados s ˜ao retirados. Outro problema na mesma linha ´e a falta de resultados espec´ıficos, como em caso de evas ˜ao as taxas de verdadeiro positivo.

A etapa de pr ´e-processamento dos dados ´e de grande import ˆancia para o an- damento dos projetos e os diferentes autores acabam diferindo na t ´ecnica utilizada mesmo quando trabalham com tipo de dados iguais como contagem de interac¸ ˜oes. DETONI; ARAUJO; CECHINEL (2014) por exemplo, utiliza em sua pesquisa conta- gem de interac¸ ˜oes semanais separando as interac¸ ˜oes dos alunos, tutores e professo- res. Enquanto que LYKOURENTZOU et al. (2009) utiliza contagem de interac¸ ˜oes por aula do curso tendo em vista a breve durac¸ ˜ao dos cursos avaliados. JAYAPRAKASH et al. (2014) utiliza a totalizac¸ ˜ao das interac¸ ˜oes no decorrer do primeiro semestre do curso, totalizando-as no final sem distinc¸ ˜ao da sua data, mas levando em conta a data de entrega de trabalhos ou tarefas no ambiente virtual.

Nos resultados, as diversas pesquisas tendem a ter valores de acur ´acia bem dife- rentes. Na quest ˜ao da evas ˜ao, os valores variaram entre 62,50% e 94%. Enquanto que na predic¸ ˜ao do desempenho acad ˆemico os valores variaram entre 56% e 67,77%. Entretanto, estes valores podem trazer uma distorc¸ ˜ao nos fatos, pois nem sempre os autores divulgam os resultados mais importantes na predic¸ ˜ao, como a taxa de verda- deiros positivos.

Desta forma, fica aparente uma lacuna na ´area de predic¸ ˜ao de evas ˜ao, pois mesmo com diversos modelos estes costumam levar em conta dados muitos espec´ıficos e que nem sempre est ˜ao dispon´ıveis em diferentes contexto de educac¸ ˜ao a dist ˆancia. Neste sentido, este trabalho diferencia-se dos relacionados por apresentar uma proposta de metodologia para gerac¸ ˜ao de modelos de predic¸ ˜ao de alunos em risco de evas ˜ao, que utiliza a contagem de interac¸ ˜oes e suas variac¸ ˜oes o que pode permitir contemplar diferentes dom´ınios de aplicac¸ ˜ao.

Nesse cap´ıtulo ´e apresentado o contexto dos dados utilizados nos experimentos, a metodologia proposta e seu desenvolvimento, bem como os experimentos realiza- dos. No andamento da pesquisa foram alcanc¸ados resultados iniciais que auxiliaram a delinear a metodologia utilizada nesta dissertac¸ ˜ao, sendo estes publicados em con- fer ˆencias como, QUEIROGA; CECHINEL; ARA ´UJO (2015) e QUEIROGA et al. (2016).

Documentos relacionados