REDES
REDES
B
B
A
A
YESIAN
YESIAN
AS
AS
NELSON
NELSON CAMPACAMPAGNARO JRGNARO JR
JOINVILLE, ABRIL DE 2011
Sumário
Sumário
IntroduçãoIntrodução
Redes Bayesianas- ConceitosRedes Bayesianas- Conceitos
ProbabilidadeProbabilidade
Estrutura de uma Estrutura de uma Rede BayRede Bayesianaesiana
RepresenRepresentação tação do do ConhecimentoConhecimento
Inferência usando Redes Inferência usando Redes BaBayesianasyesianas
SemânticaSemântica
AplicaçõesAplicações
Construindo uma Rede BayConstruindo uma Rede Bayesianaesiana
ConclusãoConclusão ExercíciosExercícios ReferênciasReferências
Sumário
Sumário
IntroduçãoIntrodução
Redes Bayesianas- ConceitosRedes Bayesianas- Conceitos
ProbabilidadeProbabilidade
Estrutura de uma Estrutura de uma Rede BayRede Bayesianaesiana
RepresenRepresentação tação do do ConhecimentoConhecimento
Inferência usando Redes Inferência usando Redes BaBayesianasyesianas
SemânticaSemântica
AplicaçõesAplicações
Construindo uma Rede BayConstruindo uma Rede Bayesianaesiana
ConclusãoConclusão ExercíciosExercícios ReferênciasReferências
Introdução
Introdução
As Redes Bayesianas foram desenvolvidasAs Redes Bayesianas foram desenvolvidas
início dos anos 80 para facilitar a tarefa de início dos anos 80 para facilitar a tarefa de prediçã
predição o e e “abdução” em “abdução” em sistemas desistemas de Inteli
Inteligência gência ArtiArtificial ficial (AI) (AI) (Pearl, (Pearl, 2000). 2000). EmEm resumo,
resumo, Redes Redes BayBayesianaesianas (RB) s (RB) tambémtambém conhecidas como redes de opinião, redes conhecidas como redes de opinião, redes causais, gráficos de dependência
causais, gráficos de dependência
probabilística, são modelos gráficos para probabilística, são modelos gráficos para
raciocínio (conclusões) baseado na incerteza, raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis
onde os nós representam as variáveis (discreta o
(discreta ou contíu contínua), nua), e os e os arcosarcos
representam a conexão direta entre eles. representam a conexão direta entre eles.
Introdução
Redes Bayesianas são modelos de
representação do conhecimento que
trabalham com o conhecimento incerto e incompleto através da Teoria da
Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.
Ela vem se tornando a metodologia padrão
para a construção dos sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.
Redes Bayesianas
São diagramas que organizam o
conhecimento numa dada área através de um mapeamento entre causas e efeitos.
Os sistemas baseados em redes
Bayesianas são capazes de gerar
automaticamente predições ou decisões mesmo na situação de inexistência de
Redes Bayesianas
Existem duas abordagens principais que podem ser utilizadas dentro do contexto dos sistemas que agem racionalmente:
Raciocínio Lógico
Raciocínio Lógico e Probabilístico
Pondera sobre o conhecimento prévio a
respeito do problema e, sobre esta base de conhecimento retira suas conclusões.
Redes bayesianas oferecem uma
abordagem para o raciocínio
probabilístico que engloba teoria de grafos, para o estabelecimento das
relações entre sentenças e ainda, teoria de probabilidades.
Probabilidade
A probabilidade condicional trata da
probabilidade de ocorrer um evento A,
tendo ocorrido um evento B, ambos do
espaço amostral S, ou seja, ela é calculada
sobre o evento B e não em função o
espaço amostral S.
A probabilidade de ocorrência de um
evento A em relação a um evento
ocorrido B é expressa como:
Probabilidade
Fornece um meio de descrever e manipular
conhecimento incerto ou incompleto.
Associa às sentenças um grau de crença
numérico entre 0 e 1.
A regra de Bayes
Thomas Bayes Probabilidade
Grau da Probabilidade
Condicional: calculado de acordo com as evidências disponíveis. Dados dois eventos A e B, a probabilidade condicional de A
dado que ocorreu B é denotada por P(A/B) e definida por:
Ex: P(cárie|dor de dente) = 0.5
. 0 P(B) , P(B) B) P(A B) | P(A
Grau de Probabilidade
Independência de Eventos: Dois eventos A e B são independentes se a informação da ocorrência (ou não) de B não altera a
probabilidade de ocorrência de A, isto é:
Ex: A= dor de ouvido , B= úlcera, ou seja úlcera não causa dor de ouvido.
P(A) B)
|
Tabela de Probabilidades
O preenchimento das tabelas de
probabilidades condicionadas é muitas
vezes simples (desde que a relação entre os pais e o nó filho não seja arbitrária).
Geralmente as relações entre nós pais e
nós filhos caem em categorias de
distribuições canónicas (que obedecem a um padrão), sendo necessário apenas
identificar qual o padrão e introduzir alguns parâmetros.
Tabela de Probabilidades
Cada linha em uma Tabelas de
probabilidade condicional contém a
probabilidade condicional de cada valor de nó para um caso de condicionamento.
um caso de condicionamento é apenas
uma combinação possível de valores para os nós superiores.
Tabela de Probabilidades
Exemplo:
Variáveis: Arrombamento, Terremoto,
Tabela de Probabilidades
Roubos e terremotos afetam diretamente
a probabilidade do alarme tocar. Mas o fato de João e Maria telefonarem só
depende do alarme;
Desse modo, a rede representa nossas
suposições de que eles não percebem
quaisquer roubos diretamente, não notam os terremotos e não verificam antes de
Estrutura de uma rede Bayesiana
Cada variável aleatória (VA) é
representada por um nó da rede
Cada nó (VA) recebe conexões dos nós
que têm influência direta (seus pais) sobre ele. (Tarefa fácil para o especialista)
Cada nó possui uma tabela de
Probabilidades Condicionais que
quantifica a influência dos seus pais sobre ele. (Difícil para o especialista)
Estrutura de uma rede Bayesiana
Conjunto de variáveis discretas U = {A1, A2,
..., An}.
Conjunto de arestas direcionadas entre
variáveis.
Não pode haver ciclos direcionados
Cada variável tem um conjunto finito de
Representação do conhecimento
para raciocínio com incerteza
Representa 3 tipos de conhecimento
do domínio
:
• Relações de independência entre variáveis aleatórias
(graficamente);
• Probabilidades a priori de algumas variáveis; • Probabilidades condicionais entre variáveis
Representação do conhecimento
para raciocínio com incerteza
Permite calcular eficientemente:
Probabilidades a posteriori de qualquer
variável aleatória (inferência), usando para isso uma definição recursiva do teorema de Bayes.
Representação do conhecimento
para raciocínio com incerteza
Conhecimento representado:
Pode ser aprendido a partir de exemplos,
reutilizando parte dos mecanismos de raciocínio.
Raciocínio com Incerteza
A chance do Flamengo ganhar o próximo
jogo é de 78%.
A probabilidade de chover amanhã é de
90%.
A grande maioria dos brasileiros gosta de
futebol.
José acha que o cavalo Azulão vai ganhar
Inferência usando Redes Bayesianas
A distribuição conjunta pode ser usada para responder a qualquer pergunta sobre o
domínio. Tipos:
Causal
Diagnóstico Intercausal
Semântica
Duas semânticas:
Numérica (global) Topológica (local)
Semântica Local
Aplicação
Diagnóstico de doenças cardíacas: A
tecnologia de Redes Probabilísticas (Redes Bayesianas) é ideal para o
tratamento de incerteza, muito comum na área médica e, além disso, modela o
conhecimento do especialista do domínio de uma forma intuitiva.
Construindo uma Rede Bayesiana
Escolher uma ordem para as variáveis
aleatórias X1,… Xn.,
Para i = 1 à n, adicione Xi à rede, selecione
pais para X1, … ,Xi-1 tais que P (Xi | Pais(Xi)) = P (Xi | X1, ... Xi-1).
A ordem correta em que os nós devem ser
adicionados consiste em adicionar primeiro as “causas de raiz”, depois as variáveis que elas influenciam e assim por diante, até
Construindo uma Rede Bayesiana
Exemplo de Aplicação
O objetivo aqui, é extrair conhecimento
de forma automática a partir de uma base de dados hipotética contendo um número sequencial de candidatos e mais três
variáveis: Aprovado, Cursinho e IBL (Internet Banda Larga), contendo dois atributos possíveis cada (Sim e Não).
Construindo uma Rede Bayesiana
APROVADO IBL CURSINHO
Sim Sim Sim
Sim Não Sim
Sim Sim Não
Não Não Não
Sim Não Sim
Sim Sim Sim
Sim Não Sim
Não Não Não
Não Sim Não
Sim Sim Sim
Não Não Não
Sim Sim Não
Sim Não Sim
Sim Sim Sim
Construindo uma Rede Bayesiana
Qual a probabilidade de um candidato
ser aprovado dado que possui internet de banda larga em casa?
Qual a probabilidade de um candidato ser
Conclusão
A maior vantagem do raciocínio
probabilístico em relação ao raciocínio lógico é permitir ao agente chegar a
decisões racionais mesmo quando não há informação suficiente para provar que
Exercícios
01)
Mobville, o roubo malabarista, frequentemente derruba as bolas que está equilibrando (ou carregando) quando a sua bateria está baixa. Em testes anteriores, foi determinado que a probabilidade com que ele derruba uma bola quando a bateria está baixa ´e de 0.9. Por outro lado, quando a bateria não está baixa, a probabilidade com que ele derruba uma bola é de somente 0.01. A bateria foi carregada há pouco tempo, e na nossa melhor adivinhacão, dado seus feitos com as bolas no ar, que a bateria esteja baixa ´e de 10 contra 1. Um roubo observador, com um sistema de visão não muito confiável, avisa que Mobville derrubou uma bola. A confiabilidade do observador ´e dado pelas seguintes probabilidades:
1.p(observador diz que Mobville derruba| Mobville derruba) = 0.9 2.p(observador diz que Mobville derruba| Mobvillen˜ao derruba) = 0.2
Desenhe uma rede de Bayes, e calcule a probabilidade de que a bateria esteja baixa dado o relatório do observador (derrubou uma bola).
Exercícios
02)
Um comitê de admissão para um programa de mestrado está tentando determinar a
probabilidade que um candidato admitido
seja realmente qualificado. As probabilidades relevantes são dadas pela rede de Bayes
Exercícios
Determine p( A|D) (a probabilidade de uma
candidato qualificado (A), dado que este tenha sido aceito no programa de