• Nenhum resultado encontrado

2.4 Técnicas computacionais de apoio

2.4.2 Mineração de dados educacionais

2.4.2.2 Redes Bayesianas

As Redes Bayesianas (RB) são uma das estratégias mais usadas para representação do raciocínio probabilístico, para a representação de conhecimento e informações probabilísticas permeadas pela incerteza (FLORES e BARONE, 2003). Representada por uma rede semântica, com um grafo orientado acíclico (DAG), no qual os nós representam probabilidades associadas a variáveis do problema, estas podendo ser discretas ou contínuas.

Sob a ótica matemática, uma RB é uma representação da conjunção das probabilidades relacionadas a um determinado problema. A partir das fórmulas mostradas anteriormente e do desenho da rede, é possível calcular a probabilidade de um evento ou atributo a partir do conhecimento de probabilidades a priori e outras informações adicionais, como as probabilidades condicionais (LONGHI, 2011).

Computacionalmente pode ser considerada uma estrutura de dados que representa dependências entre variáveis, além de uma distribuição de probabilidades associadas a elas. O grafo possui diversos nós, que representam as variáveis do problema e armazenam informações sobre as probabilidades (LONGHI, 2011). As arestas que ligam os nós, representam uma precedência, ou influência causal entre os nodos (variáveis do problema). As precedências dos nodos pais em relação aos filhos determina uma distribuição de uma probabilidade (P), gerando uma quantificação da influência dos pais em cada um dos filhos (LONGHI, 2011). Quando um nodo não possui nenhuma aresta chegando nele é considerado condicionalmente independente, ou seja, não existem influências de outros atributos sobre ele.

Figura 9 – Exemplo de Rede Bayesiana para diagnóstico de hepatite

Fonte: Adaptado de Flores e Barone (2003)

A figura 9 mostra um exemplo de RB com três nodos (Febre, Icterícia e Hepatite). O nodo da hepatite é condicionalmente dependente de febre e icterícia, enquanto estas são

independentes. A tabela de probabilidades condicionais (TPC ou CPT) é um componente fundamental em uma RB, pois indica as probabilidades associadas a todas as combinações dos valores dos pais, com os valores possíveis para a variável filha.

No exemplo, as variáveis febre e icterícia estão associadas às tabelas de estados que indicam as probabilidades destas a priori, enquanto a variável hepatite está associada à uma tabela (CPT) que mostra a distribuição das probabilidades de acordo com os pais (febre e icterícia). É possível observar que a chance de uma pessoa ter hepatite nos casos em que ela tem febre (=Sim) e icterícia (=Sim) é de 95% e apenas 5% de não ter a doença. Já no caso de ter febre e não icterícia a chance cai para 20%. A rede contribui para a percepção de que o atributo icterícia é o que mais impacta na probabilidade de hepatite. (FLORES e BARONE, 2003).

Outro aspecto importante é a densidade da rede, que é determinada pelo número de nodos que pode influenciar cada nodo. O tamanho da tabela de probabilidades está relacionado ao número de valores dos atributos e o número de nós que impactam em um nó específico. No exemplo da figura 9, o cálculo seria 2*2*2=8, considerando que todos os atributos possuem 2

valores possíveis. A construção de redes mais complexas com um grande número de valores ou dependências pode dificultar o inviabilizar o aprendizado ou a especificação direta das probabilidades.

Redes bayesianas podem ser elaboradas de duas maneiras distintas. A primeira é a construção e a determinação das probabilidades, de acordo com o conhecimento de um especialista. Esta estratégia é denominada de modelo clássico que envolve um especialista humano. O processo de aquisição de conhecimento, é a etapa que consiste em obter do especialista o conhecimento necessário para representar os componentes qualitativo e quantitativo da rede. A obtenção das probabilidades permite expressar o componente quantitativo, enquanto a definição das relações entre as variáveis se constitui na representação qualitativa da rede (JÚNIOR, WILGES e NASSAR, 2014).

Em muitas situações este processo manual pode ser demorado, custoso e complexo. Podem existir dados incompletos ou desconhecidos, o que pode dificultar muito a construção da rede. Em outras situações o especialista acredita que exista uma alta ou baixa probabilidade associada à determinadas condições, mas não consegue quantificar as mesmas (JÚNIOR, WILGES e NASSAR, 2014). Os aspectos qualitativos, na maioria das situações são mais conhecidos ou facilmente expressados, pois a relação de influência entre determinados atributos é perceptível, embora seja difícil de quantificar.

Outro modelo para elaboração de uma RB é a aprendizagem usando um conjunto de dados sobre os quais são aplicados algoritmos de Machine Learning. No processo pode ocorrer tanto o aprendizado da estrutura da rede, quanto dos parâmetros ou probabilidades associadas às entradas. A aprendizagem da estrutura da rede identifica as dependências entre os atributos e a direção da causalidade Se a estrutura da rede for pré-definida, a principal atividade no treinamento é obter a tabela de probabilidades, usadas na classificação dos casos de entrada (Vier, Glutz e Jacques, 2015).

As etapas gerais para o desenvolvimento de uma RB são:

 Selecionar o conjunto de atributos ou variáveis que sejam suficientes para descrever o problema.

 Transformar cada variável em um nodo, adicionando este na rede.

 Definir os valores possíveis para cada nodo (variável)

 Determinar (ou aprender) as associações entre os nodos, os pais de cada atributo dependente.

 Determinar (ou aprender) as tabelas de probabilidades associadas a cada nodo dependente.

Figura 10 – Rede Bayesiana para prever desempenho de estudantes

Fonte: (JÚNIOR, WILGES e NASSAR, 2014)

Pesquisas relacionando Redes Bayesianas e o reconhecimento de emoções ou estados afetivos na área da educação podem ser encontrados, sendo um dos mais relevantes, o trabalho desenvolvido por Magali Longhi (LONGHI, 2011; LONGHI, BEHAR e BERCHT, 2010). Os principais objetivos foram a identificação dos estados de ânimo dos estudantes, dotando um AVEA de recursos para identificação dos mesmos. Fatores de comportamento e personalidade foram utilizados pela rede para mapear o estado afetivo exibido pelo estudante. A aplicação de

Redes Bayesianas no aprendizado de programação pode ser observada no trabalho desenvolvido por Vier, Glutz e Jaques (2015).

A figura 10 mostra uma rede que visa prever o desempenho de estudantes (JÚNIOR, WILGES e NASSAR, 2014). É possível visualizar uma variável que é a classe (desempenho) e os demais atributos, dependentes, que indicam nível, assunto e tipo de atividade. Segundo os autores, a representação permitiu identificar falhas na elaboração das questões e nas avaliações propostas.