• Nenhum resultado encontrado

Artificial Intelligence,

N/A
N/A
Protected

Academic year: 2022

Share "Artificial Intelligence,"

Copied!
31
0
0

Texto

(1)

✫ ✪ Cap. 15 Sistemas de Racioc´ınio Probabil´ıstico

• Como construir sistemas de racioc´ınio utilizando modelos de redes e que usem incerteza de acordo com a teoria das

probabilidades?

• Rede de Cren¸ ca ou rede bayesiana: grafo com as seguintes caracter´ısticas:

– N´os representam vari´ aveis aleat´orias.

– Arcos direcionados representam liga¸c˜ oes diretas entre vari´ aveis aleat´orias.

– Cada n´ o tem uma tabela de prob. cond.que quantifica o efeito dos pais deste deste n´ o.

– O grafo n˜ ao possui ciclos (DAG).

• relativamente f´acil para o expert definir as rela¸c˜ oes do que

definir as probs.

(2)

✫ ✪ Cap. 15 Sistemas de Racioc´ınio Probabil´ıstico

• Exemplo: alarme contra roubo.

• Alarme toca em duas situa¸c˜ oes: tentativa de roubo e terremoto.

• John e Mary s˜ao os vizinhos que avisam ao dono da casa se o alarme estiver tocando.

• John liga toda vez q o alarme toca e tb qdo o tel toca.

• Mary somente liga qdo o alarme toca, mas n˜ ao ouve algumas vezes.

• Dada a evidˆencia de quem ligou para o dono da casa, queremos

descobrir a probabilidade de ter havido roubo.

(3)

✫ ✪

Alarm

Earthquake

MaryCalls JohnCalls

Burglary

(4)

✫ ✪

• Rede somente representa liga¸c˜ oes diretas, causais.

• Nada ´e informado sobre Mary ouvir m´ usica alta ou de John confundir o tel com o alarme.

• Tabela de probabilidades condicionais:

Roubo Ter. P( Alarme | Roubo, T err )

T T 0.950 0.050

T F 0.950 0.050

F T 0.290 0.710

F F 0.001 0.999

(5)

✫ ✪

B

T T F F

E

T F T F

P(A)

.95 .29 .001 .001

P(B)

.002

P(E)

Alarm

Earthquake

MaryCalls JohnCalls

Burglary

A P(J)

T

F

.90 .05

A P(M)

T

F

.70

.01

.94

(6)

✫ ✪

• Duas formas de entender:

– representa¸c˜ ao da distribui¸c˜ ao de probabilidade conjunta.

Util para ´ construir redes.

– conjunto de senten¸cas condicionalmente independentes. ´ Util para projetar procedimentos de inferˆencia.

• Representando distribui¸c˜ ao de probabilidade conjunta:

– cada entrada na tabela pode ser calculada atrav´es da info na rede.

– uma entrada gen´erica representa a probabilidade de uma conjun¸c˜ ao de valores atribu´ıdos a cada vari´ avel:

P ( X

1

= x

1

∧ . . . ∧ X

n

= x

n

).

P ( x

1

, . . . , x

n

) = Q

n

i=1

P ( x

i

| P ais ( X

i

))

(7)

✫ ✪ Constru¸ c˜ ao de Redes de Cren¸ cas

• cada entrada na tabela ´e representada pelo produto dos elementos apropriados das tabelas de probabilidades condicionais (TPCs).

• TPCs fornecem uma representa¸c˜ ao decomposta da distribui¸c˜ ao conjunta.

• Exemplo:

P (J ∧ M ∧ A ∧ ¬B ∧ ¬E) = P (J | A)P (M | A)P (A |

¬B ∧ ¬E)P (¬B)P (¬E ) = 0.9 × 0.7 × 0.001 × 0.999 × 0.998 = 0.00062

• M´etodos melhores do que obter a tabela inteira de distribui¸c˜ ao

de probabilidade conjunta.

(8)

✫ ✪

• M´etodo para construir redes de cren¸cas:

– Rede ´e constru´ıda de forma que cada n´ o ´e condicionalmente independente dos seus predecessores, dada a probabilidade dos seus pais.

– equa¸c˜ ao P ( x

1

, . . . , x

n

) = Q

n

i=1

P ( x

i

| P ais ( x

i

)) usada para guiar o engenheiro de conhecimento a construir a topologia da rede.

– Para construir uma rede de forma que esta tenha a estrutura correta para o dom´ınio, escolhe-se n´ os pais

adequados para garantir que cada n´ o ´e condicionalmente

independente de seus antecessores.

(9)

✫ ✪ Constru¸ c˜ ao de Redes de Cren¸ cas

• Em geral:

P ( X

i

| X

i−1

, . . . , X

1

) = P ( X

i

| P ais ( X

i

)), desde que P ais ( X

i

) seja subconjunto ou igual a { x

i−1

, . . . , x

1

}

• Esta condi¸c˜ ao ´e alcan¸cada desde que se rotule os n´ os da rede em qq ordem q seja consistente com a ordem parcial impl´ıcita na estrutura do grafo.

• Ex: Mary telefona: n˜ ao ´e diretamente influenciado por

tentativa de assalto ou terremoto. ´ E influenciado pelo efeito de tentativa de assalto ou terremoto, ou seja, soar o alarme.

• o Fato de John telefonar tb n˜ ao tem influˆencia direta sobre o fato de Mary telefonar. Neste caso temos independˆencia

condicional:

P (M aryT el | J ohnT el, Alarme, T err, Assalto) = P (M aryT el |

Alarme)

(10)

✫ ✪ Constru¸ c˜ ao de Redes de Cren¸ cas

• Procedimento geral para constru¸c˜ ao de redes:

1. Escolha o conj de vari´ aveis X

i

relevantes que descrevam o dom´ınio.

2. Escolha ordem para as vari´ aveis.

3. Eqto h´ a vars:

a) Pegue uma var X

i

e adicione um n´ o na rede para X

i

. b) Construir P ais ( X

i

) com um conj m´ınimo de n´ os que j´a

estejam na rede, tal que a prop de indep cond seja satisfeita.

c) Defina a tabela de prob cond p/ X

i

.

(11)

✫ ✪ Constru¸ c˜ ao de Redes de Cren¸ cas

• Procedimento garante que a rede ´e ac´ıclica.

• Rede n˜ ao cont´em valores de probabilidades redundantes.

• Garante que axiomas da prob n˜ ao s˜ao violados.

(12)

✫ ✪

(13)

✫ ✪

(14)

✫ ✪

(15)

✫ ✪

(16)

✫ ✪

(17)

✫ ✪ Compacta¸ c˜ ao e Ordena¸ c˜ ao de N´ os

• Redes de cren¸cas + compactas do que distribui¸c˜ ao de prob conjunta.

• Sistemas localmente estruturados ou esparsos com info distribu´ıda pelos n´ os.

• Crescimento polinomial.

• Em redes de cren¸cas, podemos assumir que para a maioria dos dom´ınios, cada vari´ avel aleat´oria ´e diretamente influenciada por no max k outras vars (n´os pais).

• Qtde necess´aria de n´ umeros para a TPC de cada n´ o: 2

k

.

• Para a rede completa (n n´ os): n 2

k

.

(18)

✫ ✪ Compacta¸ c˜ ao e Ordena¸ c˜ ao de N´ os

• Ex concreto: rede com 20 n´ os e no max 5 pais p/ cada n´ o:

– redes de cren¸ca: 640 n´ umeros.

– tabela de distr de prob conj: ordem de 10

6

n´ umeros.

• N´ umero de links extra na rede = maior precis˜ao, mas pode n˜ ao se justificar devido ao aumento do tamanho das tabelas.

• Regra geral: adicionar ` a rede primeiro os n´ os causadores de

algum efeito e depois seus efeitos.

(19)

✫ ✪ Representa¸ c˜ ao de TPCs

• Problema: escolher as probs condicionais das TPCs.

• Rela¸c˜ ao entre pais e filhos pode se encaixar numa distribui¸c˜ ao canˆonica. Neste caso, probs podem ser especificadas atrav´es de nomes e talvez parms adicionais.

• Ex mais simples: n´ os determin´ısticos, probs s˜ao iguais as probs dos pais.

• N´os n˜ ao determin´ısticos: rela¸c˜ ao ruidosa OU.

• Representa¸c˜ ao das probs:

– Se todos os pais F, n´ o de sa´ıda F, com 100% de certeza.

– Se apenas 1 dos pais ´e V, n´ o de sa´ıda ´e F com prob = parˆametro ruidoso daquele n´ o pai que ´e V.

• Ex: P (F ebre | Resf ) = 0.4, P (F ebre | Gripe) = 0.8 e

P (F ebre | M al) = 0.9

(20)

✫ ✪ Resf Gripe Mal P(Febre) P(¬ Febre)

F F F 0.0 1.0

F F V 0.9 0.1

F V F 0.8 0.2

F V V 0.98 0.02 = 0.2 × 0.1

V F F 0.4 0.6

V F V 0.94 0.06 = 0.6 × 0.1

V V F 0.88 0.12 = 0.6 × 0.2

V V V 0.988 0.012 = 0.6 × 0.2 × 0.1

(21)

✫ ✪ Rela¸ c˜ oes de Independˆ encia Condicional

• Necessidade: saber se rela¸c˜ oes de independˆencia condicional mais gerais (n˜ao somente de pais p/ filhos) existem para poder obter mecanismos de inferˆencia capazes de responder consultas do tipo: “Existe algum conj de n´ os X independente de outro conj Y, dado conj de evidˆencias E?”

• M´etodo: direction-dependent separation ou d-separation (separa¸c˜ ao-d).

• separa¸c˜ ao-d: se todo ramo n˜ ao dirigido de um n´ o em X para um n´ o em Y ´ e d-separado por E, ent˜ ao X e Y s˜ ao

condicionalmente independentes, dado E.

• Um conj de n´ os E d-separa dois conj X e Y se todo ramo n˜ ao

dirigido de um n´ o em X para um n´ o em Y estiver bloqueado ,

dado E.

(22)

✫ ✪ Rela¸ c˜ oes de Independˆ encia Condicional

• Um ramo est´ a bloqueado, dado um conj de n´ os E, se houver um n´ o Z no caminho tal que uma das trˆes condi¸c˜ oes ´e satisfeita:

1. Z est´ a em E e Z tem um arco incidente e outro n˜ ao incidente.

2. Z est´ a em E e Z tem ambos os arcos n˜ ao incidentes.

3. Nem Z nem nenhum descendente de Z est˜ ao em E, e ambos

os arcos incidem em Z.

(23)

✫ ✪

X E Y

(1)

(2)

(3)

Z

Z

Z

(24)

✫ ✪ Inferˆ encia em Redes de Cren¸ cas

• Objetivo principal: computar distribui¸c˜ ao de probabilidade posterior para um conj de vari´ aveis de consulta, dados valores exatos para vari´ aveis de evidˆencia: P (Cons | Evidencia) .

• A princ´ıpio, qq n´ o pode servir como consulta ou evidˆencia.

• Duas fun¸c˜ oes: BELIEF NET TELL p/ incluir novas evidˆencias

na rede e BELIEF NET ASK p/ computar novas probs p/ as

vari´ aveis de consulta.

(25)

✫ ✪ Inferˆ encia em Redes de Cren¸ cas

• Diagn´ osticas : P (Assalto | J ohnT el) (efeitos p/ as causas).

• Causais: P (J ohnT el | Assalto) (causas p/ os efeitos).

• Inter-causais : P (Assalto | Alarme ∧ T err) .

• Mistas: combina¸c˜ ao de 1 ou mais dos casos acima.

• Redes de cren¸cas ainda podem ser usadas para:

– tomar decis˜ oes baseadas em probs na rede e em fun¸c˜ oes de utilidade do agente.

– decidir quais vari´ aveis de evidˆencia observar para obter info mais ´ util.

– fazer “an´alise de sensibilidade” para entender aspectos do modelo que tˆem > impacto nas probs das vars de consulta.

– Explicar os resultados da inferˆencia probabil´ıstica para o

usu´ ario.

(26)

✫ ✪ Inferˆ encia em Redes de Cren¸ cas

• Algoritmo BELIEF NET ASK an´ alogo ao backward-chain, faz inferˆencias a partir das vari´ aveis de consulta at´e encontrar

alguma evidˆencia.

• Algoritmo funciona somente para redes “singly connected”, onde h´ a no m´aximo um ramo n˜ ao dirigido entre quaisquer dois n´ os da rede: poli-´ arvores.

• Algoritmos para redes mais gerais usam algoritmos poli-´arvore

como sub-rotinas.

(27)

✫ ✪

E +

X

. . . . . .

E −

X

U1

X

Um

Yn Znj

Y1 Z1j

(28)

✫ ✪

• N´o X tem pais U e filhos Y.

• “singly connected” significa que todos os blocos s˜ao disjuntos e n˜ ao tˆem links.

• X ´e a vari´ avel de consulta.

• Objetivo: computar P ( X | E ).

• Conjunto de suporte causal : vari´ aveis de evidˆencia “acima”

de X que est˜ ao conectadas a X atrav´es dos pais.

• Conjunto de suporte evidencial : vari´ aveis de evidˆencia

“abaixo” de X que est˜ ao conectadas a X atrav´es dos filhos.

• E

Ui|X

: evidˆencias conectadas com todos os n´ os U

i

, exceto via o

ramo que passa por X.

(29)

✫ ✪ Inferˆ encia em Redes de Cren¸ cas

• Estrat´egia geral:

– Representar P( X | E ) em termos de contribui¸c˜ oes de E

X+

e E

X

.

– Computar a contribui¸c˜ ao de E

X+

atrav´es do seu efeito nos pais de X. Obs: computar os efeitos dos pais de X em X pode ser feito de forma recursiva.

– Computar a contribui¸c˜ ao de E

X

atrav´es do seu efeito nos pais de X. Obs: computar os efeitos dos pais de X em X pode ser feito de forma recursiva.

• M´etodo: aplicar Bayes, outros m´etodos padr˜ ao de prob,

simplifica¸c˜ oes (independˆencia condicional).

(30)

✫ ✪ Inferˆ encia em Redes de Cren¸ cas

P (X | E ) = P (X | E

X

, E

X+

) =

P(EX|X,E

+

X)P(X|EX+) P(EX|EX+)

• Como X d-separa E

X+

de E

X

na rede, podemos usar indep cond p/ simplificar primeiro termo do numerador. Tb podemos usar

1 P(E

X|E+

X)

como cte de normaliza¸c˜ ao:

P (X | E ) = α P (E

X

| X ) P (X | E

X+

)

P (X | E

X+

) = P

u

P (X | u , E

X+

)P ( u | E

X+

)

P (X | E

X+

) = P

u

P (X | u ) Q

i

P (u

i

| E

X+

)

P (X | E

X+

) = P

u

P (X | u ) Q

i

P (u

i

| E

Ui|X

)

(31)

✫ ✪ Abordagens para aprendizagem da estrutura das redes

• Restri¸c˜ oes (constraint-based): tenta encontrar a melhor rede que satisfaz as dependˆencias e independˆencias entre as vari´ aveis (atrav´es dos dados)

• Score: tenta encontrar a rede que tem melhor “score” (BIC, MDL, AIC etc)

• H´ıbrida: integra as abordagens constraint-based e score-based

Referências

Documentos relacionados

A utilização do insumo Bioestimulador deveria aumentar a disponibilidade e quantidade dos nutrientes no solo principalmente o P nos tratamentos sem fertilizante mineral através da

Segundo Ribeiro (2015), neste tipo de comutação, pacotes contendo dados são enviados individualmente através das ligações de dados partilhada entre os usuários da

unanimidade o Parecer n.º 38/CC/2012, do Conselheiro Relator Daniel Francisco Miranda, pela

Os ativos financeiros disponíveis para venda são ativos financeiros não derivados que: i) o Grupo tem intenção de manter por tempo indeterminado, ii) são designados como

Movimentos Políticos Pan-Europeus: os movimentos escolhem também os candidatos principais para mobilizar o eleitorado e organizam a estratégia de campanha em diferentes níveis:

Dentro do proposto pela atividade os principais custos serão apresentados a seguir, assim também como sua classificação em custos diretos ou indiretos, fixos ou

O governo federal até tem programas de incentivo à produção não convencional, como linha de crédito para produtores e uma lei para as prefeituras que

A meta prevista para este indicador era garantir a realização de exames complementares em dia a 100% de hipertensos e diabéticos do programa, por tanto não foi atingida,