• Nenhum resultado encontrado

CAPÍTULO 4 MODELO CONCEITUAL PARA O DESENVOLVIMENTO DE

4.2 Descrição do Modelo Conceitual proposto

4.2.2 Coleta e Pré-Processamento de Dados

O SGA consiste na principal fonte de dados centralizados sobre as atividades e interações dos usuários, tais como acesso aos materiais de aprendizagem e testes realizados, além de dados estatísticos, como a quantidade de interações e o número de tentativas de respostas. Outras bases de dados, públicas e privadas, podem ser usadas para prover dados de acordo com o interesse de aplicações, por exemplo, silos tradicionais de dados disponíveis via arquiteturas orientadas a serviço – (Service Oriented Architecture - SOA). Além disso, o crescente uso de informações e tecnologias de comunicação em educação, móveis e ubíquas, amplia o conjunto de dados produzidos pelos usuários e suas aplicações, o que deixa trilhas de dados disponíveis que podem aumentar a qualidade e profundidade das análises (Siemens, 2013). Recursos tais como players multimídia, mensageiros instantâneos, jogos, páginas web, e-mails e programas de compartilhamento de arquivos são frequentemente usados durante a aprendizagem. Com isso, os dados podem estar em diferentes formatos, distribuídos ao longo do espaço, do tempo e da mídia. A dimensão Coleta e Pré-processamento de Dados, presente na Figura 4.1, ilustra o ambiente ciente de contexto no âmbito educacional, onde determinado contexto pode compreender informações sobre o mundo físico e informações sobre o mundo lógico.

4.2.2.1 Coleta dos Dados

A captura de contextos é passo essencial para apoiar usuários durante seus processos de ensino, aprendizagem e gestão. Tipicamente, ciência de contexto provê serviços a partir de sensores distribuídos em ambientes físicos inteligentes. Partindo desta abordagem, neste trabalho, a coleta de dados em ambientes de aprendizagem abertos envolve o uso de rede de sensores híbrida, composta por sensores físicos e sensores lógicos (ROSALES et al. 2010), e podem aumentar o volume de dados úteis, que refletem as atividades distribuídas do usuário, conduzindo a resultados mais sólidos de análise da aprendizagem

Os sensores físicos podem ser sensores de ambiente, ou sensores de dispositivo. Dados obtidos por sensores físicos podem ser muito úteis para análises educacionais. Por exemplo, se um determinado aluno não usa restaurantes

universitários, isso pode indicar que ele não é tão inserido no campus e, talvez, possa ser um candidato potencial para evadir da instituição.

Conforme apresentado no capítulo 2 desta tese, um sensor lógico é um componente de software (microagente), que pode capturar dados relevantes e específicos, tais como suas tarefas, progresso do trabalho, preferências, relacionamentos em redes sociais, horários de estudo, etc. Esta abstração utilizada para a coleta de dados a partir de ambientes digitais possibilita a cobertura de todos dados abundantemente espalhados nos ambientes com os quais o usuário interage.

A abordagem desenvolvida nesta tese para a coleta de contextos tem a capacidade de coletar dados distribuídos em ambientes de rápida mudança de informação e a partir de múltiplas e heterogêneas fontes a fim de criar um conjunto de dados educacionais útil.

A coleta de dados a partir do dispositivo do usuário deve ser transparente para ele e deve ser feita sem sua intervenção explícita e sem perturbar suas atividades de estudo. Além disso, a coleta de dados deve cobrir amplamente os comportamentos dos usuários a fim de produzir análises confiáveis e para servir, satisfatoriamente, aos diversos propósitos de aplicações de LA. Para isso, sensores lógicos devem rastrear pistas de dados e obter um conjunto significativo e de granularidade fina a partir do monitoramento das interações do usuário dentro e fora do browser, a partir de interações com aplicações e a partir do monitoramento de arquivos do sistema.

Com o potencial de coleta mencionado, onde a proliferação de dispositivos, móveis ou não, é crescente e a disponibilidade de sensores, lógicos ou físicos, é igualmente progressiva, é possível obter um conjunto extenso e profundo de dados sobre os usuários. Esses dados podem incluir: o local onde o aluno está, com quem ele está, qual dispositivo ele está usando, o que ele está fazendo (tomando sorvete, assistindo um filme no cinema, estudando em casa via SGA, acessando as redes sociais, ouvindo música, assistindo uma vídeoaula), quais os ruídos presentes no ambiente, entre outros. Contudo, monitorar e medir um conjunto imenso de dados que não sejam relevantes pode ser algo indesejável, principalmente pelo fato de produzir um conjunto massivo de dados que não serão utilizados e que poderão, inclusive, dificultar a geração de análises confiáveis. Desta forma, a identificação correta dos artefatos, incluindo as variáveis associadas a cada requisito e os

indicadores que serão utilizados para fazer as medições, é algo crucial para o bom funcionamento de uma ferramenta educacional analítica e deve ser cuidadosamente planejada durante o projeto e desenvolvimento de sistemas desta natureza.

4.2.2.2 Pré-processamento dos Dados

As fontes de dados indicadas no Modelo Conceitual proposto incluem: (i) o ambiente digital pessoal do usuário; (ii) o ambiente físico no qual ele se encontra e com o qual ele interage; (iii) os repositórios de dados. Considerando essa variedade de fontes e considerando, ainda, a diversidade de tecnologias utilizadas na coleta, problemas relacionados à qualidade do dado, abordados no capítulo 2 desta tese, podem estar presentes. Por exemplo, a aquisição de dados a partir de diferentes bases (institucionais, públicas ou privadas, e SGA) pode apresentar ambiguidade e conflito de dados, uma vez que os mesmos dados podem estar duplicados em diferentes fontes, por exemplo, informações pessoais do estudante. A coleta a partir do ambiente digital do usuário também pode apresentar problemas na qualidade do dado obtido. Por exemplo, a ausência do atributo ‘gênero’ pode dificultar a identificação do tipo de música que o estudante gosta de ouvir enquanto estuda matemática.

Desta forma, uma fase de pré-processamento dos dados deve ser prevista com a finalidade de transformar dado imperfeito em um formato adequado que possa ser utilizado como entrada para um método particular de análise. Várias técnicas, principalmente do campo de mineração de dados, podem ser utilizadas nesta fase e incluem: limpeza de dados, integração de dados, transformação de dados, redução de dados e fusão de dados (LIU, 2006; ROMERO e VENTURA, 2007 e HAN e KAMBER, 2011).

Dados coletados nesta segunda dimensão do Modelo Conceitual proposto podem ser utilizados para encontrar padrões significativos e para criar modelos descritivos, preditivos e prescritivos para apoiar a aprendizagem, o ensino e a gestão educacional. Alguns exemplos incluem a identificação de estudante academicamente em risco de fracasso; recomendações que auxiliem o estudante a melhorar seu aproveitamento acadêmico; personalização de ambientes de aprendizagem de acordo com o ritmo e estilo de aprendizagem do usuário; monitoramento contínuo da aprendizagem e do aproveitamento escolar para fins de intervenção e monitoramento da atuação de equipes de ensino e intervenções.

A Seção seguinte apresenta os tipos de análises previstas no Modelo proposto.