Redes semi-qualitativas - Redes Credais e Qualitativas:

Prova O caráter NP-dif´ıcil é imediato, pois o problema BN-MPE já é NP-Completo e pode ser trivialmente transformado em CN-MPE (temos apenas que usar uma rede credal composta por conjuntos com uma única densidade de probabilidade). Pertinência é al-can¸cada pois, dada uma instancia¸cão x para as variáveis, o valor de P(x) é dado por Q

iP(xi|pa(x_i)). Isso vale pois cada conjunto credal K(xi|pa(x_i)) ´e localmente especifi-cado. 2

SQPN-M SQPN-m Resposta da inferência Sim Sim Influência amb´ıgüa Sim Não Influência positiva Não Sim Influência negativa Não Não Influência zero

Tabela 3: Resposta da inferˆencia em uma SQPN de acordo com os resultados dos proble-mas SQPN-M e SQPN-m.

variáveis altera a probabilidade de outras. SejaQ a variável de consulta eea observa¸cão (um evento observado); precisamos calcularP(q|e)−P(q). Quando max(P(q|e)−P(q))≤ 0, temos uma influência negativa da observa¸cão sobre Q, pois a observa¸cão de e fez diminuir o valor da probabilidade de q (a diferen¸ca P(q|e)−P(q) é sempre menor ou igual a zero). Se min(P(q|e)−P(q)) ≥ 0, então temos uma influência positiva, pois a observa¸cão fez aumentar a probabilidade de q. Se ambos max e min são zero, então não temos influência. Caso contrário temos uma influência amb´ıgüa da observa¸cão na variável de consulta.

Para calcular a inferência sobre a influência de observa¸cões em uma variável de consulta, utilizamos os problemas de decisão SQPN-M e SQPN-m.

Defini¸cão 3.40 SQPN-M é o problema de decidir se existem atribui¸cões de probabilidade para todas as configura¸cões dos nós e seus pais (ou seja, para todos os valores de proba-bilidade que já não estavam previamente fixados) que fa¸cam P(q|E)−P(q)>0, onde Q

é a variável de consulta e E é nossa observa¸cão na rede.

Defini¸cão 3.41 SQPN-m é o problema de decidir se existem atribui¸cões de probabilidade para todas as configura¸cões dos nós e seus pais (ou seja, para todos os valores de proba-bilidade que já não estavam previamente fixados) que fa¸cam P(q|E)−P(q)<0, onde Q

é a variável de consulta e E é nossa observa¸cão na rede.

Claramente precisamos (e é suficiente) resolver ambos os problemasSQPN-MeSQPN-mpara calcular a inferência tradicional em uma rede SQPN. A tabela 3 mostra essa rela¸cão.

Como SQPNs oferecem uma combina¸cão de QPNs e redes bayesianas, poder´ıamos esperar que a complexidade de tempo de inferências em SQPNs não seria maior que a complexi-dade de redes bayesianas. Esta se¸cão caracteriza um retrato diferente: SQPNs são mais dif´ıceis que QPNs e redes bayesianas.

X

X X

_n−1

X

S S S

S

₁ ₂ _n−1 _n

S

₀

Q

E

Figura 10: Rede utilizada no Teorema 3.42.

Teorema 3.42 PT-SQPN-M, BIW-SQPN-M, PT-SQPN-m e BIW-SQPN-ms˜ao NP-Completos.

Prova Primeiro note que estes problemas pertencem a NP, pois dadas as probabilidades para todas as configura¸cões de nós e seus pais, obtemos problemas em redes bayesianas tradicionais. Neste caso o cálculo de maxP(q|E)−P(q) (ou minP(q|E)−P(q)) pode ser feito em tempo polinomial (Corolário 3.3).

Para mostrar a dificuldade, vamos reduzir o problema MAX-3-SAT para uma consulta em PT-SQPN-M de forma an´aloga ao Teorema 3.21. Reproduzimos o problema por con-veniˆencia:

Dado um conjunto de variáveis booleanas{X₁, . . . , Xn}, uma fórmula 3CNF com cláusulas {C1, . . . , Cm} e um inteiro 0 ≤ k < m, o problema MAX-3-SAT é a questão de decidir se existe uma instancia¸cão para as variáveis que satisfaz mais que k cláusulas da fórmula.

Utilizamos uma rede com topologia apresentada na Figura 10. Ela tem apenas dois nós binários adicionais com rela¸cão àquela do Teorema 3.21: E, sem pais e com probabilidade uniforme e Qcom pais Sn, E e probabilidades condicionais definidas por:

P(q|S_n= 0, e) = 1 P(q|S_n= 0, e) = r P(q|S_n 6= 0, e) = 0 P(q|sn 6= 0, e) = r

(lembre que r= 1− ^β(m−k)_m+1 ). As demais variáveis qualitativas são X1, . . . , Xn. Note que neste caso elas funcionam exatamente igual às variáveis credais.

Agora uma inferência em SQPN sobre a influência de E = {E = e} sobre Q irá resolver MAX-3-SAT. Para resolver essa inferência, precisamos encontrar o sinal de minP(q|E)− P(q) e maxP(q|E) −P(q). Vamos focar inicialmente a aten¸cão para o

c´alculo de maxP(q|E)−P(q). Note que

P(q|E) = P(q|Sn= 0, e)P(Sn= 0) +X

c6=0

P(q|Sn=c, e)P(Sn=c) = P(Sn = 0) e

P(q) = P(q|Sn= 0, e)P(Sn= 0) +X

c6=0

P(q|Sn=c, e)P(Sn =c)

P(e) +

+ P(q|S_n = 0, e)P(Sn = 0) +X

c6=0

P(q|S_n =c, e)P(Sn =c)

! P(e)

= P(S_n= 0) +r

2 .

Dessa forma temos que

P(q|E)−P(q) = P(Sn = 0)−r

2 .

A consultaPT-SQPN-M decide se existe alguma instancia¸cão tal que esse valor é maior que zero. Isso acontece exatamente quando maxP(S_n = 0)> r, que é a consulta utilizada no Teorema 3.21. O restante da prova é idêntico àquele teorema. A prova para PT-SQPN-m

´e an´aloga. Alteramos ligeiramente as probabilidades condicionais em Q:

P(q|Sn= 0, e) = r P(q|S_n= 0, e) = 1 P(q|S_n 6= 0, e) = r P(q|sn 6= 0, e) = 0

e obtemos que P(q|E)−P(q) = ^r−P(S₂ⁿ⁼⁰⁾. Agora o argumento vale pois a consulta a PT-SQPN-m decide se esta equa¸cão pode resultar em valor negativo. Essa inferência é o mesmo que perguntar se maxP(Sn= 0) > r (e chegamos novamente na consulta usada no Teorema 3.21).

Finalmente, comoBIW-SQPN-MeBIW-SQPN-msão generaliza¸cões dos problemas anteriores, eles também são NP-dif´ıceis. 2

Corolário 3.43 Não existe esquema de aproxima¸cão polinomial (PTAS) para PT-SQPN-M, PT-SQPN-m, BIW-SQPN-M ou BIW-SQPN-m a menos que P=NP.

Prova Segue diretamente do fato queMAX-3-SAT n˜ao tem um PTAS a menos que P=NP.

Isso implica que estes problemas s˜ao MAXSNP-dif´ıceis. 2 Teorema 3.44 SQPN-M e SQPN-m s˜ao NP^PP-Completos.

W

₀

X

₁

X

₂

X

_k+1

X

W

E W

Q

Figura 11: Rede utilizada no Teorema 3.44.

Prova Primeiro note que tantoSQPN-M quantoSQPN-mpertencem a NP^PP, pois dadas as probabilidades para todas as configura¸cões de nós e seus pais, obtemos problemas em redes bayesianas tradicionais. Neste caso o cálculo de maxP(q|E)−P(q) (ou minP(q|E)−P(q)) pode ser feito pelo oráculo PP.

Para mostrar a dificuldade dos problemas, reduzimos o problema E-MAJSAT, que descre-vemos novamente por conveniˆencia:

Dada uma fórmula booleana φ sobre as variáveis X = {X₁, . . . , Xn}, e um inteiro 1 ≤ k ≤ n, existe uma instancia¸cão para as variáveis X1, . . . , Xk tal que a maioria das instancia¸cões de X satisfazem φ?

Seja X o conjunto das primeiras k variáveis e Y as demais, isto é, Xk+1, . . . , Xn. Cons-tru´ımos uma SQPN modelando a fórmulaφ. Esta rede tem um nó qualitativo para cada variável emX, sem pais. As variáveis de Ynão têm pais e possuem probabilidade a priori uniforme. Além disso, existe um nó Wi para cada operador booleano. Os pais de um operadorWi são seus operandos na fórmula e P(wi|pa(Wi)) descreve sua tabela verdade.

Seja W0 o único operador sem filhos na rede. Insira um nó extra a ele, chamado de Q, com W0 e um novo nó qualitativo E como seus pais (veja Figura 11). Fixamos

P(q|w₀, e) = 1 2 P(q|w₀, e) = 1 P(q|w0, e) = 1 2 P(q|w₀, e) = 0.

Agora uma inferência em SQPN sobre a influência de E ={E =e} sobre Q irá resolver E-MAJSAT. Para resolver essa inferência, precisamos encontrar o sinal de minP(q|E)−P(q) e maxP(q|E)−P(q). Vamos focar inicialmente a aten¸cão para o cálculo de minP(q|E)− P(q). Note que

P(q|E) = P(q|w₀, e)P(w0) +P(q|w₀, e)P(w0) = 1 2 e

P(q) = (P(q|w0, e)P(w0) +P(q|w0, e)P(w0))P(e) + + (P(q|w₀, e)P(w0) +P(q|w₀, e)P(w0))P(e)

= P(w0) (1−P(e)) + P(e) 2 .

AssimP(w0)> ¹₂ implica em minP(q|E)−P(q)<0 eP(w0)≤ ¹₂ implica em minP(q|E)−

P(q) = 0 (poisP(e) será fixado em 1 neste caso). Suponha que P(w0) indique o número de instancia¸cões de Y que satisfazem φ; então precisamos calcular apenas a resposta da consulta qualitativa: se minP(q|E)−P(q)<0, encontramos uma instancia¸cão de Xque satisfaz os requisitos do problemaE-MAJSAT, ou seja, onde a maioria das instancia¸cões de Y satisfazem φ. Caso contrário não existe tal instancia¸cão para as variáveis X. Ainda é necessário mostrar queP(w0) indica o número de instancia¸cões de Ysatisfazendoφ, dado a instancia¸cão deX (então a consulta min¹₂ −P(q) irá maximizar P(w0), encontrando a instancia¸cão deX desejada). Temos

P(w0) = X

X,Y

P(w0|X, Y)P(X)P(Y)

P(w0|xY) 1 2^n−k

= |sat|

|total cases|.

Note que o somatório sobreX apresentado desaparece, pois existe apenas um termo onde P(X) é igual a 1 (e P(X) = 0 nos outros casos). Chamamos aquela instancia¸cão não zerada de{X =x}. Além disso,P(w0|xY) é 1 quando (x, Y) satisfazφ, e 0 caso contrário.

Isso implica que maxP(w₀) calcula qual instancia¸cão de X tem a maior propor¸cão de instancia¸cões deY satisfazendo φ. Os mesmos argumentos valem para SQPN-M. 2

Utilizamos no Teorema 3.44 uma rede com rela¸cões qualitativas muito simples, e obtive-mos que os problemas são NP^PP-dif´ıceis; a inclusão de outras rela¸cões qualitativas, como influências e sinergias, sinais situacionais e rela¸cões não monotônicas apenas tornam o

pro-blema mais dif´ıcil, mas não o fazem sair de NP^PP, pois fixados os valores de probabilidade em todos os nós, continuamos obtendo uma inferência de atualiza¸cão de cren¸cas em uma rede bayesiana. Isso implica que inferências exatas em redes qualitativas especializadas (PARSONS; DOHNAL, 1993;RENOOIJ; GAAG, 2002) também são NP^PP-Completas.

4 Inferˆ encias usando

programa¸ c˜ ao multilinear

No documento Redes Credais e Qualitativas: (páginas 52-59)