Incerteza. Disciplina: Inteligência Artificial Prof.: Cedric Luiz de Carvalho

(1)

Incerteza

Disciplina: Inteligência Artificial

Prof.: Cedric Luiz de Carvalho

(2)

Tópicos

 _Introdução

 _{Representação da incerteza}

 _{Probabilidade condicional e incondicional}  _{Inferência probabilística}

 _{Inferência Bayesiana}

 _{Regras de Bayes}

 _{Aplicação da Regra de Bayes}

(3)

Introdução

 _{Nos processos de inferência vistos:}

 _{um fato é verdadeiro}  _{um fato é falso}

 _{um fato é desconhecido}

 _{Pode-se haver casos onde: um fato é}

provavelmente verdadeiro

 _{mundo aleatório}

 distribuição das pessoas que ficarão doentes durante uma

epidemia de dengue

 _{mundo não aleatório, mas não temos acesso a todos}

os dados:

(4)

Irrigação

 _{Um agricultor ativa um sistema de irrigação apenas nas}

épocas mais secas (primavera e inverno). Em outras estações, deve existir chuva suficiente.

 _{Tanto a irrigação quanto a chuva podem deixar a}

varanda da casa do agricultor (próxima à área plantada) muito molhada.

 _{O chão da varanda, quando molhado, fica muito}

escorregadio.

 _Como:

 _{Representar de modo simples as relações de causalidade?}  _{Analisar os efeitos de cada variável sobre estas relações?}  _{Tomar decisões com base nestes efeitos?}

(5)

O Dilema do Prisioneiro

(1)

 _{Três prisioneiros (A, B e C) julgados por}

assassinato e em prisão preventiva. Amanhã será o julgamento, e apenas um será

condenado à prisão

 _{O guarda da prisão é amigo do juiz, e já sabe}

quem será condenado

 _{No meio da noite, o prisioneiro A chama o}

guarda e pede que este entregue uma carta a um prisioneiro que será libertado

(6)

O Dilema do Prisioneiro

(2)



_{Uma hora depois, A chama o guarda}

novamente e diz:

“Acho que você pode me dizer para quem

deu a carta. Isto não muda a minha

situação, já que eu já sei que um deles vai

ser libertado mesmo, independente do

meu julgamento.”



_{O guarda concorda e diz: “Dei a carta ao}

prisioneiro B.”

(7)

O Dilema do Prisioneiro

(3)



_{A não consegue mais dormir. Passa a noite}

pensando:

“Antes do guarda falar, as minhas chances

de ser condenado eram de 1 em 3. Agora

que ele falou algo que eu considerava

irrelevante (ou seja, o nome de alguém que

será libertado), as minhas chances de ser

condenado passaram para 1 em 2... Onde

foi que eu errei?”

(8)

O Dilema do Prisioneiro

(4) MORAL DA ESTÓRIA:

MODELAGEM DE PROBLEMAS ENVOLVENDO INCERTEZA DEVE SER FEITA COM MUITO

(9)

Incerteza

(1)



_{Agente lógico conhece todos fatos sobre o}

ambiente

_{definirá seus planos de ações} _{em muitos casos}

 não terá nenhuma ação

_{Exemplo: Plano A90}



_{A imperfeição da informação é geralmente}

conhecida na literatura de sistemas

(10)

Incerteza

(2)



_{Termo é muito restritivo}

 _{o que se convenciona chamar de tratamento de}

incerteza pode, na verdade, estar endereçando outras imperfeições da informação:

 imprecisão, conflito, ignorância parcial etc.



_{As informações podem variar de perfeitas a}

completamente imperfeitas

(11)

Representação de Incerteza

(1)



_{Informação perfeita: A aula começa às 8h}



_{Informação imprecisa: A aula começa entre}

8h e 9h



_{Informação incerta: Eu acho que a aula}

começa às 8h



_{Informação vaga: A aula começa lá pelas}

8h



Informação probabilista: É provável que a

(12)

Representação de Incerteza

(2)



Informação possibilista: É possível que a

aula comece às 8h



_{Informação inconsistente: Maria disse que}

a aula começa às 8h mas João disse que

ele começa às 10h



_{Informação incompleta: Eu não sei a que}

horas a aula começa, mas normalmente

na UFG as aulas começam às 8h



_{Ignorância Total: Eu não faço a menor}

(13)

Representação de Incerteza

(3)

O que fazer então?



_{Depende da importância relativa das}

várias metas e das probabilidades da sua

ocorrência

(14)

 _{Sistemas de diagnósticos}

 _{sempre trabalham com incerteza}

 _{conserto de carro, medicina, mercado, leis}

 _{Regra de diagnóstico}

∀ p sintoma (p, dor de garganta) ⇒ doença (p, gripe)

 _{A doença (causa do sintoma) pode ser outra.} ∀ p sintoma (p, dor de garganta) ⇒

doença (p, gripe) v doença(p, dengue) ...

(15)

 _{Regra causal}

∀ p doença (p, gripe) ⇒ sintoma (p,dor de garganta)

 _{Há circunstâncias em que a doença não provoca}

o sintoma.

 _{A conexão entre antecedente e conseqüente não}

é uma implicação lógica em nenhuma direção

(16)



_{Agentes em Lógica de Primeira Ordem}

enfrentam dificuldades em situações

onde:

_{o agente não tem acesso a todo o ambiente} _{o agente tem uma compreensão incompleta}

ou incorreta do ambiente

(17)



_{A lógica de primeira ordem falha no}

domínio de diagnóstico médico devido a:

_{“preguiça”:}

 _{existem causas ou conseqüências demais a}

considerar

_{ignorância teórica:}

 não existe uma teoria completa para o domínio

_{ignorância prática:}

 não podemos fazer todos os testes necessários

para o diagnóstico perfeito

(18)

 _{Na lógica de predicados é fácil representar:}

 _{todas as lojas estão fechadas aos domingos}  _{ninguém vive mais de 150 anos}

 _{carros de bombeiros são sempre vermelhos}

 _{Mas não fatos tão simples:}

 _{a maioria das lojas está fechada aos domingos}  _{quase ninguém vive mais de 100 anos}

 _{normalmente os carros de bombeiros são vermelhos}

(19)

 _{Nestes casos, o conhecimento do agente pode}

apenas prover um grau de crença nas sentenças relevantes

 _{O uso da teoria da probabilidade}

 _{grau de crença: 0 – 1}  _Exemplo:

P(gripe|dor de garganta) = 0.8

(20)

 _{Resume a nossa incerteza oriunda da falta de}

conhecimento preciso e completo sobre o problema

 _{Se acredita que o paciente tem 80% de chances}

de ter gripe se ele estiver com dor de garganta

 _{não é certeza absoluta}

 _{O grau de crença pode ser derivado:}

 _{dados estatísticos}  _{regras gerais}

 _{combinação de evidências}

(21)

 _{Probabilidade 0.8 não significa 80% de verdade}

 _{80% de crença do médico}

 _{Quando se fala de probabilidade neste contexto,}

não se faz referência a números, e sim, a um tipo de raciocínio

 _“_{A chance de que um paciente portador do sintoma}_S apresente no futuro próximo a doença D é p”

 _{A verdade desta afirmação não é o valor preciso de}_p_,

mas um valor de crença do médico dependendo das

evidências

do mundo

(22)



_{Dificuldades na implementação de sistemas}

usando grau de crença:

 _{como as probabilidades devem ser interpretadas}

 _{como elas podem ser combinadas umas com as outras}  _{como eventos separados (dependentes) podem ser}

tratados de modo que a mesma evidência não conte mais de uma vez

 _{quanto esforço deve ser gasto para difundir mudanças}

de probabilidade por todo os sistema

 A  B, crença P1  B  C, crença P2

 E se a confiança em A mudar, B e C também devem mudar

Conhecimento com Incerteza

(9)

(23)



Incerteza muda o caminho dos agentes para

tomar decisões

_{plano A90} _{plano A120}



_{Preferências entre diferentes possibilidades}



_{Teoria da decisão}

_{teoria da probabilidade + teoria da utilidade}

(24)



_{Linguagem para representar e raciocinar}

com conhecimento incerto:

_{a natureza das sentenças com o grau de crença} _{a dependência do grau de crença na experiência}

do agente



_{Extensão da lógica proposicional}

(25)

Proposições

(1)

 _{Grau de crença são aplicados as proposições}

 _{Variáveis randômicas}

 _{parte do mundo inicialmente desconhecidas}

 _{Domínio das variáveis randômicas:}

 _{booleana ou proposicional:}

 Febre  <true, false>

 _{discreta: <finito ou infinito>}

 Mês  <Janeiro, ..., Dezembro>

 _contínua:

 Temperatura  [0, 1]  Temperatura = 25,6

(26)

Eventos atômicos



_{Especificação completa do estado do}

mundo cujo agente está incerto

_{atribuição de valores para todas as variáveis}

do mundo



_{Exemplo: as variáveis do meu mundo}

_{gripe: verdadeiro ou falso}

_{dor de garganta: verdadeiro ou falso}

(27)

Grau de crença (probabilidade)



_{A dependência do grau de crença na}

experiência do agente é refletida:

_{probabilidade a priori (incondicional)} _{probabilidade condicional}

(28)

Probabilidade incondicional

(1)



_{A priori (incondicional)}

_{calculado antes do agente receber percepções}

(evidências)

 Exemplo

P(Gripe=true) ou P(gripe)

= 0.1



_{Grau de crença na ausência de qualquer}

(29)

Probabilidade incondicional

(2)

 _{A probabilidade de todos os valores possíveis de}

uma variável randômica

P(Tempo = sol) = 0.7 P(Tempo = chuva) = 0.2 P(Tempo = nublado) = 0.08 P(Tempo = neve) = 0.02 _Ou P(Tempo) = <0.7, 0.2, 0.08, 0.02>  _Chamada:

(30)

Probabilidade incondicional

(3)



_{A expressão:}

P(Tempo, Gripe)



Tabela de probabilidades 4 x 2 entradas



_Chamada:

_{Distribuição de Probabilidade}

Conjunta



_{Conjunto completo das variáveis Tempo,}

Dor de Garganta e Gripe:

Distribuição de Probabilidade Conjunta

Completa

(31)

Probabilidade condicional

(1)

_{Calculado de acordo com as evidências}

disponíveis

_{evidências: percepções que o agente recebeu até um}

dado momento

_Exemplo:

P(gripe | dor de garganta) = 0.8 P(gripe | ¬dor de garganta) = 0.2

 _{Se o paciente tem dor de garganta e nenhuma}

(32)



_{P(gripe | dor de garganta)= 0.8}

_{dado que dor de garganta é tudo que conheço,}

a chance de gripe (vista por mim) é de 80%



_Errado

_“_{se tenho dor de garganta então 80% de estar}

de gripe”



_{Se sabemos mais, isto é, a evidência da}

gripe é também observada, então:

P(gripe | dor de garganta, gripe) = 1

(33)



_OBS:

_{a nova evidência pode ser inútil}

P(gripe | dor de garganta, lua cheia)

= P(gripe | dor de garganta)

= 0.8

(34)

 _{Probabilidade incondicional}

 _{um caso especial da probabilidade condicional:} P(gripe | ) = P(gripe)

 _{Podem ser definidas em termos de probabilidades}

incondicionais

 _{Probabilidade condicional (a posteriori) de A dado que B}

ocorreu é definida por

P(A | B) = P(A ^B)

, quando P(B) > 0

P(B)

(35)



_{Pode também ser escrita (mais natural)}

P(A ^

B) = P(A |

Β

) P(B)

- Regra do produto

B forma um “contexto” para o evento A



_{Também pode ser escrita:}

P(A ^

B) = P(B |

Α

) P(A)

(36)

Axiomas da probabilidade

(1)



_{Semântica das declarações probabilísticas}

_{0 ≤ P(a) ≤ 1}

_{P(true) = 1 e P(false) = 0}

_{Probabilidade da disjunção}

(37)

Axiomas da probabilidade

(2)



_{Distribuição de Probabilidade Conjunta em}

qualquer conjunto de variáveis deve ser

1



_{Se for inconsistente um agente não pode}

(38)

Inferência probabilística

(1)

 _{Usando Distribuição de Probabilidade Conjunta}

Completa

 _{base de conhecimento}

 _{Um modelo probabilista de um domínio consiste}

de um conjunto de variáveis aleatórias que podem assumir valores particulares com certas

(39)

Inferência probabilística

(2)

0.576

0.144

0.064

0.016

¬gripe

0.008

0.072

0.012

0.108

gripe ¬febre febre ¬febre febre ¬dor de garganta dor de garganta

• Três variáveis booleanas:

• Tabela de 2 x 2 x 2

(40)

Inferência probabilística

(3)

 _{Os eventos atômicos são mutuamente exclusivos}

e coletivamente exaustivos (axiomas da probabilidade)

 _{Para o exemplo acima anterior}



_{a soma de todas as probabilidades = 1.0}

 _{Probabilidade incondicional}

P(gripe)

= 0.108 + 0.012 + 0.072 + 0.008

= 0.2

(41)

Inferência probabilística

(4)



_{Probabilidades incondicional:}

P(gripe ν dor de garganta)

= 0.108 + 0.012 + 0.072 + 0.008 +

0.016 + 0.06

(42)

Inferência probabilística

(5)

 _{Probabilidade de estar gripado dado uma dor}

de garganta:

P(gripe | dor de garganta)

= P(gripe ^ dor de garganta) P(dor de garganta)

= 0.108 + 0.012

0.108 + 0.012 + 0.016 + 0.064

(43)

Inferência probabilística

(6)

 _{Probabilidade de não se estar gripado dado}

uma dor de garganta:

P(¬gripe | dor de garganta) = P(¬gripe ^ dor de garganta) P(dor de garganta)

= 0.016 + 0.064

0.108 + 0.012 + 0.016 + 0.064

(44)

Inferência probabilística: problemas

 _{Problema real:}

 _{Enorme quantidade de variáveis randômicas}  _{Variáveis discretas, e também contínuas!}

 _{Para um domínio com n variáveis booleanas}  _O(2n) tamanho da tabela

 _O(2n₎ tempo de processamento da tabela  _{Milhares de variáveis randômicas}

 _{Tabela de distribuição de probabilidade conjunta é}

(45)

Independência

(1)

 _{Pela tabela anterior}

 _{adicionar uma quarta variável: Tempo}

 _{P(Dor de garganta, Febre, Gripe, Tempo)}  _{32 entradas}

 _{Qual a relação entre:}

P(dor de garganta, febre, gripe)

(46)

Independência

(2)

P(dor de garganta, febre, gripe, Tempo = sol)

= P(Tempo = sol | dor de garganta, febre, gripe) * P(dor de garganta, febre, gripe)

 _{Logo, se pode deduzir:}

P(Dor de garganta, Febre, Gripe, Tempo)

= P(Tempo) P(Dor de garganta, Febre, Gripe)

Regra do produto

= P(Tempo = sol | dor de garganta, febre, gripe)

(47)

Independência

(3)

 _{Tabela original de 32 entradas}

 _{Com a independência de proposições:}

 _{uma tabela de 8 entradas e outra de 4 entradas}

 _{Reduzem as informações necessárias para}

especificar a distribuição de probabilidade conjunta

 _{Difícil separar conjuntos de variáveis por}

(48)

Inferência Bayesiana

(1)



_{A teoria da probabilidade adota a frase}

epistêmica “...posto que C é conhecido”

como uma primitiva da linguagem.

Sintaticamente isto é denotado por:

P(A | C) = p

(49)

Inferência Bayesiana

(2)



Esta frase combina as noções de

conhecimento e crença pela atribuição à

A de um grau de crença p, dado o

conhecimento de C



C é chamado de “contexto da crença em

A”, e a notação P(A | C) é chamada

(50)

 _{O teorema de Bayes provê a base para o tratamento}

da imperfeição da informação

 _{ele computa a probabilidade de um dado evento, dado um}

conjunto de observações

 _{A regra de Bayes expressa as probabilidades}

incondicionais em termos das probabilidades condicionais (mais fáceis de obter/estimar)

 _{Permite obter probabilidades desconhecidas a partir de}

probabilidades conhecidas

(51)

Inferência Bayesiana

(4)

 _Seja:



_{P(Hi | E)}

 a probabilidade de que a hipótese Hi seja

verdadeira dada a evidência E.



_{P(E | Hi)}

 a probabilidade que a evidência E será

observada se a hipótese Hi for verdadeira.



_P(Hi)

 a probabilidade “a priori” que a hipótese Hi é

veradeira na ausência de qualquer evidência específica

(52)

Inferência Bayesiana

(5)



_{O teorema de Bayes é formulado como:}

**P(Y | X) = P(X | Y) * P(Y)**

P(X)



_{A probabilidade condicional, P(Y | X), dos}

eventos X e Y pode ser vista como uma

quantificação da relação de causa e efeito

entre X e Y:

(53)

Inferência Bayesiana

(6)

 _{Para o caso de termos mais de uma evidência:}

P(Y | X, e )

= P(X | Y, e) * P(Y, e) P(X | e)

(54)

Aplicação da Regra de Bayes:

Diagnóstico Médico

• Seja: M = doença meningite S = rigidez no pescoço • Um Doutor sabe: P(S | M) = 0.5 P(M) = 1/50000 P(S) = 1/20 P(M|S) = P(S|M)P(M) P(S) = 0,5*(1/50000) = 0,0002 1/20 A probabilidade de uma pessoa ter meningite dado que ela está com rigidez no pescoço é 0,02% ou ainda 1 em 5000.

(55)

Diagnóstico de roubo



_Temos:

P(alarme | roubo) = 0,95 P(alarme | ~roubo) = 0,01 P(roubo) = 0,0001 

_Então:

_{P(roubo | alarme) = 0,00941 = 0,9%}

 _{Este valor pode ser intuitivamente entendido}

quando verificamos que as chances de haver um roubo e o alarme tocar são muito pequenas em relação às chances de haver um alarme falso.

(56)

Probabilidade Condicional e Independência

(1)

 _{Informações probabilísticas são interessantes na}

seguinte forma

P(efeito | causa)

 _{Duas ou mais evidências (usando regra de Bayes)}

P(dor_no_braço ^ braço_inchado | braço_quebrado)

 _{É necessário conhecer as probabilidades}

condicionais das conjunções para cada valor de

braço_quebrado

_{duas variáveis:}₂2

(57)

Probabilidade Condicional e Independência

(2)



_{Pode-se tentar simplificar a expressão}

através de afirmações adicionais sobre o

domínio

_{a noção de independência}



_{dor_no_braço}

_e

_{braço_inchado}

_{não são}

independentes



_{Cada uma é causada diretamente pelo}

braço_quebrado

, mas nenhuma tem efeito

direto na outra

(58)

Probabilidade Condicional e Independência

(3)



_{Esta propriedade é escrita como}

P(dor_no_braço ^ braço_inchado|braço_quebrado) = P(dor_no_braço|braço_quebrado)

P( braço_inchad|braço_quebrado)



_{Esta expressão significa}

_{a independência condicional de}_{dor_no_braço}_e

(59)



_{Podemos processar cada pedaço}

separadamente



_{Independência condicional é crucial para o}

funcionamento eficaz de sistemas

probabilísticos

(60)

Probabilidade Condicional e Independência

(5)

 _{Seja X e Y independentes}

P(X | Y,Z) = P(X|Z)

 _{Isso quer dizer que se o objetivo é saber a}

probabilidade de X então tanto faz o valor de Y se você já sabe o valor de Z

 _{Exemplo: Trovão é condicionalmente}

independente de Chuva, dado Relâmpago:

P(Trovão | Chuva, Relâmpago) = P(Trovão | Relâmpago)

(61)



_{Uma outra equação que pode ser usada}

 _{P(Dor de garganta, Febre, Gripe)}

 _{=P(Dor de garganta, Febre | Gripe) P(Gripe)}

 _{=P(Dor de garganta | Gripe) P(Febre | Gripe) P(Gripe)}



_{Para todos os n sintomas que são}

condicionalmente independentes dado

gripe, o tamanho da representação é:

_{O(n), ao invés de O(2}n)

(62)

Diagnóstico de investimento

(1)  _{Supondo as evidências:}  _{e1 = solteiro}  _{e2 = salário_alto}  _{e3 = jovem}  _{Apoiam as hipóteses:}  _{h1 = investidor_de_alto_risco}  _{h2 = investidor_de_baixo_risco}

 _{Sendo mutualmente exclusivas e exaustivas:}

 _{P(h1 ^ h2) = 0}  _{P(h1) = 1 - P(h2)}

(63)

Diagnóstico de investimento

(2)

 _{Assumindo os conhecimentos do especialista,}

que estima as probabilidades posteriores:

 _{P(H=h1) = 0.3}

 _{P(E=e1|H=h1) = 0.6}  _{P(E=e2|H=h1) = 0.2}  _{P(E=e3|H=h1) = 0.5}

(64)

Diagnóstico de investimento

(2)

 _{Assumindo os conhecimentos do especialista,}

que estima as probabilidades posteriores:

_{P(H=h2) = 0.7}

_{P(E=e1|H=h2) = 0.3} _{P(E=e2|H=h2) = 0.8} _{P(E=e3|H=h2) = 0.2}

(65)

(66)

Regra de Bayes: Problemas

(1)

 _{Este tipo de método precisa trabalhar com um}

número MUITO grande de probabilidades ( P(Hi) e P(Ej/Hi) ) para cada evidência Ej e hipóteses Hi

 _{Dificuldade em se estimar estas probabilidades a}

(67)

Regra de Bayes: Problemas

(2)

 _{A regra de Bayes assume que os antecedentes Ei}

são independentes. Isto nem sempre é verdadeiro no caso das doenças, posto que alguns sintomas poderiam ser evidência de outros

 _{A base de conhecimento tem que ser completa}

 _{todas as evidências relevantes às hipóteses}

consideradas devem estar explícitas na base de conhecimento

(68)

Regra de Bayes: Problemas

(3)

 _{Se as probabilidades a priori e as probabilidades}

condicionais são baseadas em contagens de

freqüências e estatísticas, temos que assegurar que o número de amostras é representativo o suficiente para obter probabilidades precisas:

 _{algumas vezes as bases de dados não são corretas e}

precisas o suficiente para que sua soma seja igual a 1.0

 _Solução:

 _{Redes de Crenças:}

(69)

Referências

 _{Russel, S, & Norvig, P. (1995). Artificial}