Prova O car´ater NP-dif´ıcil ´e imediato, pois o problema BN-MPE j´a ´e NP-Completo e pode ser trivialmente transformado em CN-MPE (temos apenas que usar uma rede credal composta por conjuntos com uma ´unica densidade de probabilidade). Pertinˆencia ´e al-can¸cada pois, dada uma instancia¸c˜ao x para as vari´aveis, o valor de P(x) ´e dado por Q
iP(xi|pa(xi)). Isso vale pois cada conjunto credal K(xi|pa(xi)) ´e localmente especifi-cado. 2
SQPN-M SQPN-m Resposta da inferˆencia Sim Sim Influˆencia amb´ıg¨ua Sim N˜ao Influˆencia positiva N˜ao Sim Influˆencia negativa N˜ao N˜ao Influˆencia zero
Tabela 3: Resposta da inferˆencia em uma SQPN de acordo com os resultados dos proble-mas SQPN-M e SQPN-m.
vari´aveis altera a probabilidade de outras. SejaQ a vari´avel de consulta eea observa¸c˜ao (um evento observado); precisamos calcularP(q|e)−P(q). Quando max(P(q|e)−P(q))≤ 0, temos uma influˆencia negativa da observa¸c˜ao sobre Q, pois a observa¸c˜ao de e fez diminuir o valor da probabilidade de q (a diferen¸ca P(q|e)−P(q) ´e sempre menor ou igual a zero). Se min(P(q|e)−P(q)) ≥ 0, ent˜ao temos uma influˆencia positiva, pois a observa¸c˜ao fez aumentar a probabilidade de q. Se ambos max e min s˜ao zero, ent˜ao n˜ao temos influˆencia. Caso contr´ario temos uma influˆencia amb´ıg¨ua da observa¸c˜ao na vari´avel de consulta.
Para calcular a inferˆencia sobre a influˆencia de observa¸c˜oes em uma vari´avel de consulta, utilizamos os problemas de decis˜ao SQPN-M e SQPN-m.
Defini¸c˜ao 3.40 SQPN-M ´e o problema de decidir se existem atribui¸c˜oes de probabilidade para todas as configura¸c˜oes dos n´os e seus pais (ou seja, para todos os valores de proba-bilidade que j´a n˜ao estavam previamente fixados) que fa¸cam P(q|E)−P(q)>0, onde Q
´e a vari´avel de consulta e E ´e nossa observa¸c˜ao na rede.
Defini¸c˜ao 3.41 SQPN-m ´e o problema de decidir se existem atribui¸c˜oes de probabilidade para todas as configura¸c˜oes dos n´os e seus pais (ou seja, para todos os valores de proba-bilidade que j´a n˜ao estavam previamente fixados) que fa¸cam P(q|E)−P(q)<0, onde Q
´e a vari´avel de consulta e E ´e nossa observa¸c˜ao na rede.
Claramente precisamos (e ´e suficiente) resolver ambos os problemasSQPN-MeSQPN-mpara calcular a inferˆencia tradicional em uma rede SQPN. A tabela 3 mostra essa rela¸c˜ao.
Como SQPNs oferecem uma combina¸c˜ao de QPNs e redes bayesianas, poder´ıamos esperar que a complexidade de tempo de inferˆencias em SQPNs n˜ao seria maior que a complexi-dade de redes bayesianas. Esta se¸c˜ao caracteriza um retrato diferente: SQPNs s˜ao mais dif´ıceis que QPNs e redes bayesianas.
1
X
2X X
n−1X
nS S S
S
1 2 n−1 nS
0Q
E
Figura 10: Rede utilizada no Teorema 3.42.
Teorema 3.42 PT-SQPN-M, BIW-SQPN-M, PT-SQPN-m e BIW-SQPN-ms˜ao NP-Completos.
Prova Primeiro note que estes problemas pertencem a NP, pois dadas as probabilidades para todas as configura¸c˜oes de n´os e seus pais, obtemos problemas em redes bayesianas tradicionais. Neste caso o c´alculo de maxP(q|E)−P(q) (ou minP(q|E)−P(q)) pode ser feito em tempo polinomial (Corol´ario 3.3).
Para mostrar a dificuldade, vamos reduzir o problema MAX-3-SAT para uma consulta em PT-SQPN-M de forma an´aloga ao Teorema 3.21. Reproduzimos o problema por con-veniˆencia:
Dado um conjunto de vari´aveis booleanas{X1, . . . , Xn}, uma f´ormula 3CNF com cl´ausulas {C1, . . . , Cm} e um inteiro 0 ≤ k < m, o problema MAX-3-SAT ´e a quest˜ao de decidir se existe uma instancia¸c˜ao para as vari´aveis que satisfaz mais que k cl´ausulas da f´ormula.
Utilizamos uma rede com topologia apresentada na Figura 10. Ela tem apenas dois n´os bin´arios adicionais com rela¸c˜ao `aquela do Teorema 3.21: E, sem pais e com probabilidade uniforme e Qcom pais Sn, E e probabilidades condicionais definidas por:
P(q|Sn= 0, e) = 1 P(q|Sn= 0, e) = r P(q|Sn 6= 0, e) = 0 P(q|sn 6= 0, e) = r
(lembre que r= 1− β(m−k)m+1 ). As demais vari´aveis qualitativas s˜ao X1, . . . , Xn. Note que neste caso elas funcionam exatamente igual `as vari´aveis credais.
Agora uma inferˆencia em SQPN sobre a influˆencia de E = {E = e} sobre Q ir´a resolver MAX-3-SAT. Para resolver essa inferˆencia, precisamos encontrar o sinal de minP(q|E)− P(q) e maxP(q|E) −P(q). Vamos focar inicialmente a aten¸c˜ao para o
c´alculo de maxP(q|E)−P(q). Note que
P(q|E) = P(q|Sn= 0, e)P(Sn= 0) +X
c6=0
P(q|Sn=c, e)P(Sn=c) = P(Sn = 0) e
P(q) = P(q|Sn= 0, e)P(Sn= 0) +X
c6=0
P(q|Sn=c, e)P(Sn =c)
!
P(e) +
+ P(q|Sn = 0, e)P(Sn = 0) +X
c6=0
P(q|Sn =c, e)P(Sn =c)
! P(e)
= P(Sn= 0) +r
2 .
Dessa forma temos que
P(q|E)−P(q) = P(Sn = 0)−r
2 .
A consultaPT-SQPN-M decide se existe alguma instancia¸c˜ao tal que esse valor ´e maior que zero. Isso acontece exatamente quando maxP(Sn = 0)> r, que ´e a consulta utilizada no Teorema 3.21. O restante da prova ´e idˆentico `aquele teorema. A prova para PT-SQPN-m
´e an´aloga. Alteramos ligeiramente as probabilidades condicionais em Q:
P(q|Sn= 0, e) = r P(q|Sn= 0, e) = 1 P(q|Sn 6= 0, e) = r P(q|sn 6= 0, e) = 0
e obtemos que P(q|E)−P(q) = r−P(S2n=0). Agora o argumento vale pois a consulta a PT-SQPN-m decide se esta equa¸c˜ao pode resultar em valor negativo. Essa inferˆencia ´e o mesmo que perguntar se maxP(Sn= 0) > r (e chegamos novamente na consulta usada no Teorema 3.21).
Finalmente, comoBIW-SQPN-MeBIW-SQPN-ms˜ao generaliza¸c˜oes dos problemas anteriores, eles tamb´em s˜ao NP-dif´ıceis. 2
Corol´ario 3.43 N˜ao existe esquema de aproxima¸c˜ao polinomial (PTAS) para PT-SQPN-M, PT-SQPN-m, BIW-SQPN-M ou BIW-SQPN-m a menos que P=NP.
Prova Segue diretamente do fato queMAX-3-SAT n˜ao tem um PTAS a menos que P=NP.
Isso implica que estes problemas s˜ao MAXSNP-dif´ıceis. 2 Teorema 3.44 SQPN-M e SQPN-m s˜ao NPPP-Completos.
W
0X
1X
2X
kX
k+1X
nW
jE W
iQ
Figura 11: Rede utilizada no Teorema 3.44.
Prova Primeiro note que tantoSQPN-M quantoSQPN-mpertencem a NPPP, pois dadas as probabilidades para todas as configura¸c˜oes de n´os e seus pais, obtemos problemas em redes bayesianas tradicionais. Neste caso o c´alculo de maxP(q|E)−P(q) (ou minP(q|E)−P(q)) pode ser feito pelo or´aculo PP.
Para mostrar a dificuldade dos problemas, reduzimos o problema E-MAJSAT, que descre-vemos novamente por conveniˆencia:
Dada uma f´ormula booleana φ sobre as vari´aveis X = {X1, . . . , Xn}, e um inteiro 1 ≤ k ≤ n, existe uma instancia¸c˜ao para as vari´aveis X1, . . . , Xk tal que a maioria das instancia¸c˜oes de X satisfazem φ?
Seja X o conjunto das primeiras k vari´aveis e Y as demais, isto ´e, Xk+1, . . . , Xn. Cons-tru´ımos uma SQPN modelando a f´ormulaφ. Esta rede tem um n´o qualitativo para cada vari´avel emX, sem pais. As vari´aveis de Yn˜ao tˆem pais e possuem probabilidade a priori uniforme. Al´em disso, existe um n´o Wi para cada operador booleano. Os pais de um operadorWi s˜ao seus operandos na f´ormula e P(wi|pa(Wi)) descreve sua tabela verdade.
Seja W0 o ´unico operador sem filhos na rede. Insira um n´o extra a ele, chamado de Q, com W0 e um novo n´o qualitativo E como seus pais (veja Figura 11). Fixamos
P(q|w0, e) = 1 2 P(q|w0, e) = 1 P(q|w0, e) = 1 2 P(q|w0, e) = 0.
Agora uma inferˆencia em SQPN sobre a influˆencia de E ={E =e} sobre Q ir´a resolver E-MAJSAT. Para resolver essa inferˆencia, precisamos encontrar o sinal de minP(q|E)−P(q) e maxP(q|E)−P(q). Vamos focar inicialmente a aten¸c˜ao para o c´alculo de minP(q|E)− P(q). Note que
P(q|E) = P(q|w0, e)P(w0) +P(q|w0, e)P(w0) = 1 2 e
P(q) = (P(q|w0, e)P(w0) +P(q|w0, e)P(w0))P(e) + + (P(q|w0, e)P(w0) +P(q|w0, e)P(w0))P(e)
= P(w0) (1−P(e)) + P(e) 2 .
AssimP(w0)> 12 implica em minP(q|E)−P(q)<0 eP(w0)≤ 12 implica em minP(q|E)−
P(q) = 0 (poisP(e) ser´a fixado em 1 neste caso). Suponha que P(w0) indique o n´umero de instancia¸c˜oes de Y que satisfazem φ; ent˜ao precisamos calcular apenas a resposta da consulta qualitativa: se minP(q|E)−P(q)<0, encontramos uma instancia¸c˜ao de Xque satisfaz os requisitos do problemaE-MAJSAT, ou seja, onde a maioria das instancia¸c˜oes de Y satisfazem φ. Caso contr´ario n˜ao existe tal instancia¸c˜ao para as vari´aveis X. Ainda ´e necess´ario mostrar queP(w0) indica o n´umero de instancia¸c˜oes de Ysatisfazendoφ, dado a instancia¸c˜ao deX (ent˜ao a consulta min12 −P(q) ir´a maximizar P(w0), encontrando a instancia¸c˜ao deX desejada). Temos
P(w0) = X
X,Y
P(w0|X, Y)P(X)P(Y)
=X
Y
P(w0|xY) 1 2n−k
= |sat|
|total cases|.
Note que o somat´orio sobreX apresentado desaparece, pois existe apenas um termo onde P(X) ´e igual a 1 (e P(X) = 0 nos outros casos). Chamamos aquela instancia¸c˜ao n˜ao zerada de{X =x}. Al´em disso,P(w0|xY) ´e 1 quando (x, Y) satisfazφ, e 0 caso contr´ario.
Isso implica que maxP(w0) calcula qual instancia¸c˜ao de X tem a maior propor¸c˜ao de instancia¸c˜oes deY satisfazendo φ. Os mesmos argumentos valem para SQPN-M. 2
Utilizamos no Teorema 3.44 uma rede com rela¸c˜oes qualitativas muito simples, e obtive-mos que os problemas s˜ao NPPP-dif´ıceis; a inclus˜ao de outras rela¸c˜oes qualitativas, como influˆencias e sinergias, sinais situacionais e rela¸c˜oes n˜ao monotˆonicas apenas tornam o
pro-blema mais dif´ıcil, mas n˜ao o fazem sair de NPPP, pois fixados os valores de probabilidade em todos os n´os, continuamos obtendo uma inferˆencia de atualiza¸c˜ao de cren¸cas em uma rede bayesiana. Isso implica que inferˆencias exatas em redes qualitativas especializadas (PARSONS; DOHNAL, 1993;RENOOIJ; GAAG, 2002) tamb´em s˜ao NPPP-Completas.