Redes Bayesianas

(1)

REDES

B

A

YESIAN

AS

NELSON

NELSON CAMPACAMPAGNARO JRGNARO JR

JOINVILLE, ABRIL DE 2011

(2)

Sumário



 IntroduçãoIntrodução



 Redes Bayesianas- ConceitosRedes Bayesianas- Conceitos



 ProbabilidadeProbabilidade



 Estrutura de uma Estrutura de uma Rede BayRede Bayesianaesiana



 RepresenRepresentação tação do do ConhecimentoConhecimento



 Inferência usando Redes Inferência usando Redes BaBayesianasyesianas



 SemânticaSemântica



 AplicaçõesAplicações



 Construindo uma Rede BayConstruindo uma Rede Bayesianaesiana

  ConclusãoConclusão   ExercíciosExercícios   ReferênciasReferências

(3)

Sumário



 IntroduçãoIntrodução



 Redes Bayesianas- ConceitosRedes Bayesianas- Conceitos



 ProbabilidadeProbabilidade



 Estrutura de uma Estrutura de uma Rede BayRede Bayesianaesiana



 RepresenRepresentação tação do do ConhecimentoConhecimento



 Inferência usando Redes Inferência usando Redes BaBayesianasyesianas



 SemânticaSemântica



 AplicaçõesAplicações



 Construindo uma Rede BayConstruindo uma Rede Bayesianaesiana

  ConclusãoConclusão   ExercíciosExercícios   ReferênciasReferências

(4)

Introdução



 As Redes Bayesianas foram desenvolvidasAs Redes Bayesianas foram desenvolvidas

início dos anos 80 para facilitar a tarefa de início dos anos 80 para facilitar a tarefa de prediçã

predição o e e “abdução” em “abdução” em sistemas desistemas de Inteli

Inteligência gência ArtiArtificial ficial (AI) (AI) (Pearl, (Pearl, 2000). 2000). EmEm resumo,

resumo, Redes Redes BayBayesianaesianas (RB) s (RB) tambémtambém conhecidas como redes de opinião, redes conhecidas como redes de opinião, redes causais, gráficos de dependência

causais, gráficos de dependência

probabilística, são modelos gráficos para probabilística, são modelos gráficos para

raciocínio (conclusões) baseado na incerteza, raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis

onde os nós representam as variáveis (discreta o

(discreta ou contíu contínua), nua), e os e os arcosarcos

representam a conexão direta entre eles. representam a conexão direta entre eles.

(5)

Introdução

 Redes Bayesianas são modelos de

representação do conhecimento que

trabalham com o conhecimento incerto e incompleto através da Teoria da

Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.

 Ela vem se tornando a metodologia padrão

para a construção dos sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.

(6)

Redes Bayesianas

 São diagramas que organizam o

conhecimento numa dada área através de um mapeamento entre causas e efeitos.

 Os sistemas baseados em redes

Bayesianas são capazes de gerar

automaticamente predições ou decisões mesmo na situação de inexistência de

(7)

Redes Bayesianas

Existem duas abordagens principais que podem ser utilizadas dentro do contexto dos sistemas que agem racionalmente:

 Raciocínio Lógico

(8)

Raciocínio Lógico e Probabilístico

 Pondera sobre o conhecimento prévio a

respeito do problema e, sobre esta base de conhecimento retira suas conclusões.

 Redes bayesianas oferecem uma

abordagem para o raciocínio

probabilístico que engloba teoria de grafos, para o estabelecimento das

relações entre sentenças e ainda, teoria de probabilidades.

(9)

Probabilidade

 A probabilidade condicional trata da

probabilidade de ocorrer um evento A_,

tendo ocorrido um evento B_{, ambos do}

espaço amostral S_{, ou seja, ela é calculada}

sobre o evento B_{e não em função o}

espaço amostral S_.

 A probabilidade de ocorrência de um

evento A_{em relação a um evento}

ocorrido B_{é expressa como:}

(10)

Probabilidade

 Fornece um meio de descrever e manipular

conhecimento incerto ou incompleto.

 Associa às sentenças um grau de crença

numérico entre 0 e 1.

(11)

A regra de Bayes

 Thomas Bayes  Probabilidade

(12)

Grau da Probabilidade

Condicional: calculado de acordo com as evidências disponíveis. Dados dois eventos A e B, a probabilidade condicional de A

dado que ocorreu B é denotada por P(A/B) e definida por:

Ex: P(cárie|dor de dente) = 0.5

. 0 P(B) , P(B) B) P(A B) | P(A   

(13)

Grau de Probabilidade

Independência de Eventos: Dois eventos A e B são independentes se a informação da ocorrência (ou não) de B não altera a

probabilidade de ocorrência de A, isto é:

Ex: A= dor de ouvido , B= úlcera, ou seja úlcera não causa dor de ouvido.

P(A) B)

|

(14)

Tabela de Probabilidades

 O preenchimento das tabelas de

probabilidades condicionadas é muitas

vezes simples (desde que a relação entre os pais e o nó filho não seja arbitrária).

 Geralmente as relações entre nós pais e

nós filhos caem em categorias de

distribuições canónicas (que obedecem a um padrão), sendo necessário apenas

identificar qual o padrão e introduzir alguns parâmetros.

(15)

Tabela de Probabilidades

 Cada linha em uma Tabelas de

probabilidade condicional contém a

probabilidade condicional de cada valor de nó para um caso de condicionamento.

 um caso de condicionamento é apenas

uma combinação possível de valores para os nós superiores.

(16)

Tabela de Probabilidades

 Exemplo:

 Variáveis: Arrombamento, Terremoto,

(17)

Tabela de Probabilidades

 Roubos e terremotos afetam diretamente

a probabilidade do alarme tocar. Mas o fato de João e Maria telefonarem só

depende do alarme;

 Desse modo, a rede representa nossas

suposições de que eles não percebem

quaisquer roubos diretamente, não notam os terremotos e não verificam antes de

(18)

Estrutura de uma rede Bayesiana

 Cada variável aleatória (VA) é

representada por um nó da rede

 Cada nó (VA) recebe conexões dos nós

que têm influência direta (seus pais) sobre ele. (Tarefa fácil para o especialista)

 Cada nó possui uma tabela de

Probabilidades Condicionais que

quantifica a influência dos seus pais sobre ele. (Difícil para o especialista)

(19)

Estrutura de uma rede Bayesiana

 Conjunto de variáveis discretas U = {A1, A2,

..., An}.

 Conjunto de arestas direcionadas entre

variáveis.

 Não pode haver ciclos direcionados

 Cada variável tem um conjunto finito de

(20)

(21)

Representação do conhecimento

para raciocínio com incerteza

Representa 3 tipos de conhecimento

do domínio

:

• Relações de independência entre variáveis aleatórias

(graficamente);

• Probabilidades a priori de algumas variáveis; • Probabilidades condicionais entre variáveis

(22)

Representação do conhecimento

para raciocínio com incerteza

Permite calcular eficientemente:

 Probabilidades a posteriori de qualquer

variável aleatória (inferência), usando para isso uma definição recursiva do teorema de Bayes.

(23)

Representação do conhecimento

para raciocínio com incerteza

Conhecimento representado:

 Pode ser aprendido a partir de exemplos,

reutilizando parte dos mecanismos de raciocínio.

(24)

Raciocínio com Incerteza

 A chance do Flamengo ganhar o próximo

jogo é de 78%.

 A probabilidade de chover amanhã é de

90%.

 A grande maioria dos brasileiros gosta de

futebol.

 José acha que o cavalo Azulão vai ganhar

(25)

Inferência usando Redes Bayesianas

A distribuição conjunta pode ser usada para responder a qualquer pergunta sobre o

domínio. Tipos:

 Causal

 Diagnóstico  Intercausal

(26)

Semântica

Duas semânticas:

 Numérica (global)  Topológica (local)

(27)

Semântica Local

(28)

Aplicação

 Diagnóstico de doenças cardíacas: A

tecnologia de Redes Probabilísticas (Redes Bayesianas) é ideal para o

tratamento de incerteza, muito comum na área médica e, além disso, modela o

conhecimento do especialista do domínio de uma forma intuitiva.

(29)

Construindo uma Rede Bayesiana

 Escolher uma ordem para as variáveis

aleatórias X1,… Xn.,

 Para i = 1 à n, adicione Xi à rede, selecione

pais para X1, … ,Xi-1 tais que P (Xi | Pais(Xi)) = P (Xi | X1, ... Xi-1).

 A ordem correta em que os nós devem ser

adicionados consiste em adicionar primeiro as “causas de raiz”, depois as variáveis que elas influenciam e assim por diante, até

(30)

Construindo uma Rede Bayesiana

Exemplo de Aplicação

 O objetivo aqui, é extrair conhecimento

de forma automática a partir de uma base de dados hipotética contendo um número sequencial de candidatos e mais três

variáveis: Aprovado, Cursinho e IBL (Internet Banda Larga), contendo dois atributos possíveis cada (Sim e Não).

(31)

Construindo uma Rede Bayesiana

APROVADO IBL CURSINHO

Sim Sim Sim

Sim Não Sim

Sim Sim Não

Não Não Não

Sim Não Sim

Sim Sim Sim

Sim Não Sim

Não Não Não

Não Sim Não

Sim Sim Sim

Não Não Não

Sim Sim Não

Sim Não Sim

Sim Sim Sim

(32)

Construindo uma Rede Bayesiana

 Qual a probabilidade de um candidato

ser aprovado dado que possui internet de banda larga em casa?

 Qual a probabilidade de um candidato ser

(33)

Conclusão

 A maior vantagem do raciocínio

probabilístico em relação ao raciocínio lógico é permitir ao agente chegar a

decisões racionais mesmo quando não há informação suficiente para provar que

(34)

Exercícios

01)

Mobville, o roubo malabarista, frequentemente derruba as bolas que está equilibrando (ou carregando) quando a sua bateria está baixa. Em testes anteriores, foi determinado que a probabilidade com que ele derruba uma bola quando a bateria está baixa é de 0.9. Por outro lado, quando a bateria não está baixa, a probabilidade com que ele derruba uma bola é de somente 0.01. A bateria foi carregada há pouco tempo, e na nossa melhor adivinhacão, dado seus feitos com as bolas no ar, que a bateria esteja baixa é de 10 contra 1. Um roubo observador, com um sistema de visão não muito confiável, avisa que Mobville derrubou uma bola. A confiabilidade do observador é dado pelas seguintes probabilidades:

1.p(observador diz que Mobville derruba| Mobville derruba) = 0.9 2.p(observador diz que Mobville derruba| Mobvillen˜ao derruba) = 0.2

Desenhe uma rede de Bayes, e calcule a probabilidade de que a bateria esteja baixa dado o relatório do observador (derrubou uma bola).

(35)

Exercícios

02)

Um comitê de admissão para um programa de mestrado está tentando determinar a

probabilidade que um candidato admitido

seja realmente qualificado. As probabilidades relevantes são dadas pela rede de Bayes

(36)

(37)

Exercícios

 Determine p( A|D) (a probabilidade de uma

candidato qualificado (A), dado que este tenha sido aceito no programa de