• Nenhum resultado encontrado

CAPÍTULO 5 FRAMEWORK PARA COLETA E ANÁLISES DE DADOS E

5.2 Visão Geral do Framework de Coleta e Análises de Dados

5.2.1 Arquitetura do Framework

5.2.1.3 Modelagem de Contextos e Análises

Neste trabalho, a fim de atender aos diferentes propósitos de aplicações (tais como recomendação, visualização e segurança de avaliações online) a modelagem de contextos e o raciocínio, a partir da aplicação de técnicas de análises sobre os contextos, são fases dissociadas do processo de coleta, o que possibilita a utilização de técnicas direcionadas ao foco da aplicação, facilidade de extensão e reuso.

A fim de reduzir a complexidade das aplicações analíticas cientes de contexto, melhorar a capacidade de evolução do sistema e possibilitar o reuso para aplicações de diferentes propósitos, a camada de modelos de contextos proposta no

framework usa duas abordagens para modelagem dos dados: um modelo gráfico

probabilístico (Rede Bayesiana) para análise dos dados, com a finalidade de encontrar relações entre variáveis de entrada e medir valores futuros - predição; e, um modelo semântico-conceitual, baseado em ontologias, para garantir descrição

semântica dos contextos com alta expressividade. Um conjunto de regras de decisão é utilizado para propósitos de facilitar e melhorar a visualização dos dados para compor os dois modelos de contexto a fim de alcançar um nível de análise prescritiva.

A abordagem adotada possibilita o compartilhamento de contextos, permitindo uma interpretação comum de informações de contextos em diferentes aplicações.

5.2.1.3.1 O Modelo Semântico-Conceitual - Ontologias

Modelos ontológicos especificam seus conceitos, relações e fatos de maneira uniforme (CHO e HONG, 2008), (HERVÀS, BRAVO, e FONTECHA, 2010) com apoio à interoperabilidade, descrição semântica e compartilhamento de contextos a partir de uma interpretação comum.

O modelo ontológico proposto neste trabalho tem a função principal de descrever a informação em um caminho semântico e também proporcionar suporte ao raciocínio lógico, provendo ainda características próprias da tecnologia, tais como expressividade, extensibilidade, facilidade de compartilhamento e reuso. Para isso, um serviço de inferência de informação contextual e interfaces de consultas às ontologias, ilustrados na Figura 5.3, são disponibilizados pelo framework.

Figura 5.3 – Representação da Modelagem de Contextos e Análise de Dados baseados em Ontologias. Fonte: elaborado pela autora.

As interfaces de consulta às ontologias utilizam a linguagem SPARQL de consulta para RDF (SEABORNE, 2006). O sistema de análise de dados provê um conjunto de inferências baseados em lógica de primeira ordem para a interpretação dos eventos e geração de informações. A Web Ontolgy Language (OWL) é utilizada para descrever os contextos a fim de facilitar o processo de inferência baseado em regras (ZHAO et al., 2008). Isso possibilita que sensores em diferentes plataformas tenham um vocabulário comum e um conjunto comum de conceitos quando interagindo entre si.

A base de conhecimento é composta por dados brutos, para acesso futuro quando requisitado por aplicações; o repositório Ontologias de Contexto, presente na Figura 5.3, consiste das ontologias desenvolvidas; e, um conjunto de regras, que podem ser aplicadas sobre os dados. O framework Jena17 foi utilizado para a

manipulação de ontologias e aplicação de inferência. Ontologias foram usadas para modelar as interações do estudante em aprendizagem online, conforme requisitos e indicadores previamente determinados. Foram desenvolvidas duas ontologias principais: uma ontologia de interações e comportamento do usuário no SGA; e, uma ontologia de interações e comportamento do usuário com outros recursos, ferramentas e aplicações. No primeiro caso, são mapeadas todas as ferramentas comuns à maioria dos SGA e suas relações, conforme estudo apresentado na Seção 4.2.2.1. Na segunda ontologia foram mapeados requisitos e indicadores previamente determinados relacionados às interações do usuário fora do SGA. A Figura 5.4 ilustra apenas parte da ontologia desenvolvida para modelagem dos contextos de interações dentro do SGA.

17

Figura 5.4 – Parte da Ontologia para Modelagem de Contextos em LA. (a) Representação gráfica da ontologia. (b) Classes. (c) Propriedades de objeto. (d) Propriedades de dados.

Fonte: elaborado pela autora.

Conforme apresentado no capítulo 3, ontologias consistem de um método de modelagem de contextos bastante adotado em LA, especialmente para fins de adaptação e personalização. Todavia, deve-se pesar a escolha entre alta a expressividade de modelos ontológicos e sua complexidade de gerenciamento, especialmente na representação de dados dinâmicos. De acordo com Bettini e

(a)

(d)

(b)

Brdiczka (2010), ontologias não são adequadas para processar informações em ambientes dinâmicos de constante mudança da informação de maneira escalável. Esse modelo foi disponibilizado no framework para uso de aplicações onde o tempo de raciocínio em ambientes de rápida mudança de informação não é algo crítico, tais como aplicações de monitoramento da aprendizagem online para fins de avaliação, onde a maioria dos dados utilizados como entrada para as análises são obtidos a partir de bases de dados de contextos (coletados por sensores e armazenados para acesso futuro).

A Seção seguinte apresenta o modelo de contexto baseado em Redes Bayesianas implementado e disponibilizado no framework.

5.2.1.3.2 O Modelo Gráfico Probabilístico – Redes Bayesianas

Redes Bayesianas (RB), desenvolvidas na década de 1980 por Judea Pearl (1988), são um modelo probabilístico inspirado pela causalidade (esquema causa- efeito) e provê um modelo gráfico no qual cada nó representa uma variável randômica em um domínio. Em nosso caso elas representam comportamentos dos estudantes, e cada arco representa um relacionamento de influência causal ou dependência entre essas variáveis. A Figura 5.5 ilustra a Rede Bayesiana que modela as relações entre as variáveis associadas com comportamentos dos usuários em fóruns de discussão. Essas variáveis foram identificadas no levantamento de requisitos, conforme apresentado na Seção 4.2.1.1 e no Quadro 4.1.

Atualmente, de acordo com Brusilovsky and Millán (2007), as RB são consideradas uma das melhores técnicas disponíveis e comumente usada como recurso poderoso para diagnósticos (inferências sobre as possíveis causas de um evento) e predição (estado/evolução futuro das variáveis dadas as evidências).

Cada nó da RB tem uma Tabela de Probabilidades Condicionais (TPC) que especifica a probabilidade de cada estado possível de um nó dada a combinação de estados de seus pais, conforme mostra a TPC do nó MsgRel ilustrado na Figura 5.5; ou então a distribuição da probabilidade a priori para nós sem pais (ou nós independentes), como a TPC do nó Access (Figura 5.5).

Figura 5.5 – Rede Bayesiana usada para modelar o comportamento do estudante em fórum de discussão. Fonte: elaborado pela autora.

Por ser complexa e extensa, a Figura 5.5 ilustra apenas parte do modelo desenvolvido, neste caso restrito às atividades de fóruns. Essa rede é usada para determinar o progresso acadêmico em fóruns de discussão e permite a modelagem de parâmetros qualitativos (estrutura da RB – nós e arcos) e informações quantitativas (parâmetros da RB – probabilidade a priori, condicionais ou distribuições). Este modelo inclui os aspectos relevantes do mundo real, tais como comportamentos observados e relações entre eles, e as probabilidades condicionais especificadas representam a força desses relacionamentos. Cada comportamento observado é classificado em uma das seguintes categorias: abaixo do esperado, dentro do esperado e acima do esperado; ou então como: apropriado e inapropriado. Os parâmetros de cada categoria podem ser definidos pelo professor durante o planejamento da disciplina. Ele pode fazer isso para cada comportamento observado. Entretanto, para reprimir a rejeição do sistema pelo excesso de configurações, essas configurações são opcionais e, caso elas não sejam feitas pelo professor, o sistema usa valores padrão pré-definidos. Por exemplo, o valor que determina o número de acessos esperado do estudante em uma atividade de fórum.

É possível fazer inferências a partir da RB para prever o progresso acadêmico de estudantes e prover recomendações em relação à sua participação em atividades, na disciplina e no curso. Para o exemplo do progresso acadêmico em fóruns de discussão, obtém-se valores do nó APrForum a partir dos valores dos nós

independentes. O progresso acadêmico do estudante em determinado fórum é dado pelo maior valor calculado de probabilidade – positivo ou negativo.

Para calcular a inferência probabilística é usado um conjunto de variáveis proposicionais V(V1, V2,..., Vn) e um subconjunto de variáveis E de V com valores definidos, usado como evidência, E = ɛ (positivo e negativo; ou como: abaixo do

esperado, dentro do esperado ou acima do esperado; ou como: apropriado e inapropriado). O cálculo da probabilidade condicional, baseado no teorema de Bayes, é dado por p(Vi = vi | E = ɛ), onde a variável Vi tem um valor vi dada a evidência.

Sendo assim, para determinar o progresso do estudante é preciso calcular a probabilidade p(APrForum = positive), ou seja, p(APrForum = positivo | AC, MA, RM,

MR, RE, RJ) e p(APrForum = negativo), ou seja, p(APrForum = negativo | AC, MA, RM, MR, RE, RJ). Assumindo que a probabilidade p(APrForum = positivo) é 94.99%, p(APrForum = negativo) é 5.01%, pode-se inferior que o estudante está tendo um

progresso positivo na atividade.

Para implementação do modelo probabilístico foi utilizada a engine de inferência Bayesiana implementada no pacote de API Weka para calcular o progresso acadêmico em cada atividade avaliativa, na unidade (ou tópico), em disciplinas e, então, o seu progresso global em um determinado curso.