• Nenhum resultado encontrado

Majorando a incerteza

No documento Lógica, probabilidade e consequência (páginas 51-58)

Com os Teoremas de Corre¸c˜ao (2.4.2) e Completude (2.4.3) demonstrados na se¸c˜ao anterior, pudemos argumentar que a semˆantica probabil´ıstica incorpora a l´ogica cl´assica nos casos em que h´a certeza absoluta sobre veracidade ou falsidade de senten¸cas. Mas, para tratar da propaga¸c˜ao de incerteza e propor uma solu¸c˜ao para dilemas como o Para- doxo da Loteria, a rela¸c˜ao de consequˆencia probabil´ıstica definida n˜ao ´e suficiente, pois ela n˜ao considera graus de certeza que n˜ao sejam 0 ou 1.

Na Se¸c˜ao 2.1, dissemos que para solucionar o Paradoxo da Loteria, vamos refutar o princ´ıpio de que um conjunto de senten¸cas aceitas racionalmente ´e dedutivamente fe- chado. Isto ´e consequˆencia do fato de entendermos senten¸cas aceitas racionalmente como senten¸cas com alto grau de certeza, alto valor de probabilidade. E, como veremos, cada inferˆencia l´ogica deve ser tratada individualmente para entendermos como o grau de in- certeza das premissas desta inferˆencia se propagam para sua conclus˜ao.

Vejamos um exemplo simples e imediato de propaga¸c˜ao de incerteza das premissas para a conclus˜ao. Para duas senten¸cas A e B e uma valora¸c˜ao probabil´ıstica P , a seguinte lei de probabilidades se aplica:

P (B) = P (A ∨ B) + P (A → B) − 1.

Podemos verificar facilmente esta lei observando as seguintes equa¸c˜oes, que s˜ao ba- seadas nas descri¸c˜oes de estado que formam as FNDs das senten¸cas em quest˜ao na lei acima:

• P (A ∨ B) = P (A ∧ ¬B) + P (A ∧ B) + P (¬A ∧ B); • P (A → B) = P (A ∧ B) + P (¬A ∧ B) + P (¬A ∧ ¬B); • 1 = P (A ∧ ¬B) + P (A ∧ B) + P (¬A ∧ B) + P (¬A ∧ ¬B).

Agora, vamos analisar a inferˆencia formalizada pela consequˆencia l´ogica cl´assica: A ∨ B, A → B ` B.

Tendo algum grau de incerteza sobre as premissas desta inferˆencia, representado pela associa¸c˜ao de probabilidades atrav´es da valora¸c˜ao P a cada uma delas, segue imediata- mente, pela lei de probabilidades apresentada acima, qual o exato grau de incerteza que devemos ter sobre a conclus˜ao da inferˆencia, representado pela probabilidade

P (A ∨ B) + P (A → B) − 1.

Nesta inferˆencia ´e poss´ıvel calcular exatamente como a incerteza sobre as premissas se propaga para a conclus˜ao. Por´em, isto nem sempre ´e poss´ıvel. Considere, por exemplo, a inferˆencia conhecida como silogismo disjuntivo, formalizada pela consequˆencia l´ogica cl´assica:

A ∨ B, ¬A ` B.

Poder´ıamos ter uma distribui¸c˜ao de probabilidade para o conjunto {A, B} como:

• P1(A ∧ B) = 0, 1;

• P1(¬A ∧ B) = 0, 6;

• P1(A ∧ ¬B) = 0, 2;

• P1(¬A ∧ ¬B) = 0, 1;

e outra distribui¸c˜ao de probabilidade para o mesmo conjunto como: • P2(A ∧ B) = 0;

• P2(¬A ∧ B) = 0, 6;

• P2(A ∧ ¬B) = 0, 3;

• P2(¬A ∧ ¬B) = 0, 1.

Ambas as distribui¸c˜oes, P1 e P2, induzem a valora¸c˜ao probabil´ıstica que tem como

casos:

• P (A ∨ B) = P (A ∧ B) + P (¬A ∧ B) + P (A ∧ ¬B) = 0, 9; • P (¬A) = P (¬A ∧ B) + P (¬A ∧ ¬B) = 0, 7.

Assim, se representamos o grau de incerteza que temos sobre as premissas da inferˆencia em quest˜ao por esta valora¸c˜ao probabil´ıstica P e queremos saber como estas incertezas se

propagam na inferˆencia, n˜ao poderemos encontrar um valor exato para a incerteza, pois a valora¸c˜ao probabil´ıstica P pode se comportar tanto como uma valora¸c˜ao induzida por P1 quanto uma valora¸c˜ao induzida por P2:

• P1(B) = P1(A ∧ B) + P1(¬A ∧ B) = 0, 7;

• P2(B) = P2(A ∧ B) + P2(¬A ∧ B) = 0, 6.

O nosso estudo sobre a propaga¸c˜ao da incerteza seguir´a, portanto, na tentativa de estimar qual a incerteza que podemos ter sobre a conclus˜ao de uma inferˆencia ao inv´es de calcul´a-la exatamente. At´e ent˜ao, estamos insistindo em falar de incerteza sobre senten¸cas, pois nos parece mais natural do que dizer que temos um grau de certeza sobre elas, apesar de ser isto que entendemos que as valora¸c˜oes probabil´ısticas representam. ´E claro que estes termos est˜ao intimamente ligados: se temos apenas um grau de certeza, que n˜ao absoluta, sobre uma senten¸ca, estamos, ent˜ao, incertos sobre ela. No entanto, a partir de agora tomaremos a incerteza como um conceito relevante e vamos defini-la a partir da no¸c˜ao de probabilidade. Concordando com Adams (Ada98), temos como consequˆencia que os pr´oximos resultados, relacionando inferˆencias l´ogicas com probabilidades, s˜ao mais facilmente enunciados em termos deste novo conceito.

As fun¸c˜oes de incerteza s˜ao outra maneira de perceber as valora¸c˜oes probabil´ısticas. Elas medem a probabilidade de uma senten¸ca ser falsa e s˜ao definidas assim: dada uma valora¸c˜ao probabil´ıstica P , a fun¸c˜ao de incerteza6 UP : L → R associada a ela ´e dada por

UP(ϕ) = 1 − P (ϕ), para ϕ ∈ L.

A seguir, temos alguns lemas que tratam das fun¸c˜oes de incerteza e, em seguida, um teorema, originalmente demonstrado por Suppes (Sup66), que d´a um grande passo em rela¸c˜ao ao entendimento da propaga¸c˜ao de incerteza em inferˆencias.

Lema 2.5.1. Sejam ϕ, ψ ∈ L tais que ` ϕ → ψ e P uma valora¸c˜ao probabil´ıstica. Ent˜ao, UP(ψ) ≤ UP(ϕ).

Demonstra¸c˜ao. Pelo Teorema 2.2.1, temos que P (ϕ) ≤ P (ψ). Aplicando a defini¸c˜ao da fun¸c˜ao de incerteza UP, segue o resultado.

Lema 2.5.2. Sejam ϕ1, . . . , ϕn ∈ L e P uma valora¸c˜ao probabil´ıstica. Ent˜ao,

UP(ϕ1∧ · · · ∧ ϕn) ≤ UP(ϕ1) + · · · + UP(ϕn). 6O nome U da fun¸c˜ao de incerteza ´e devido ao termo em inglˆes uncertainty.

Demonstra¸c˜ao. Primeiro vamos mostrar para n = 2. Pelo Teorema 2.2.1, temos que P (ϕ1) + P (ϕ2) = P (ϕ1 ∧ ϕ2) + P (ϕ1 ∨ ϕ2) e, pela defini¸c˜ao da fun¸c˜ao de incerteza UP,

segue que UP(ϕ1) + UP(ϕ2) = UP(ϕ1∧ ϕ2) + UP(ϕ1 ∨ ϕ2). Assim, como n˜ao ´e dif´ıcil ver

que UP(ϕ1∨ ϕ2) ≥ 0, segue o resultado. Com este caso e por indu¸c˜ao, segue o resultado

para n qualquer.

Teorema 2.5.1. Sejam ϕ1, . . . , ϕn, ψ ∈ L. Se ϕ1, . . . , ϕn` ψ, ent˜ao, para uma valora¸c˜ao

probabil´ıstica P ,

UP(ψ) ≤ UP(ϕ1) + · · · + UP(ϕn).

Demonstra¸c˜ao. Como ϕ1, . . . , ϕn` ψ, temos que ` ϕ1∧ · · · ∧ ϕn→ ψ e, pelo Lema 2.5.1,

segue que UP(ψ) ≤ UP(ϕ1∧ · · · ∧ ϕn). Assim, com o Lema 2.5.2, segue o resultado.

Podemos estabelecer sobre a propaga¸c˜ao de incerteza, segundo a semˆantica proba- bil´ıstica, que, em uma inferˆencia, a incerteza da conclus˜ao n˜ao excede a soma da incerteza das premissas. E, ent˜ao, em qualquer inferˆencia em que h´a qualquer grau de incerteza sobre as premissas, podemos majorar a incerteza que podemos ter na conclus˜ao. No exemplo do silogismo disjuntivo dado h´a pouco, temos que

UP(B) ≤ UP(A ∨ B) + U (¬A) = (1 − 0, 9) + (1 − 0, 7) = 0, 4.

Neste exemplo, observamos duas valora¸c˜oes probabil´ısticas que modelam nossa in- certeza sobre as premissas. As incertezas sobre a conclus˜ao em cada uma delas ´e dada por

• UP1(B) = 1 − 0, 7 = 0, 3;

• UP2(B) = 1 − 0, 6 = 0, 4.

As duas valora¸c˜oes, evidentemente, obedecem a majora¸c˜ao do Teorema 2.5.1.

Vejamos, finalmente, como o Teorema 2.5.1 pode explicar o Paradoxo da Loteria, em que t´ınhamos as senten¸cas A1, . . . , A1000 com probabilidades

P (An) =

999

1000 (n ∈ {1, . . . , 1000}).

Valores de probabilidades t˜ao altos que no racioc´ınio pr´atico faz estas senten¸cas serem aceitas racionalmente e, se tomadas por premissas em uma inferˆencia, como a que ´e formalizada pela consequˆencia l´ogica

em que a conclus˜ao sabemos ser falsa, chegamos a uma contradi¸c˜ao. Por outro lado, com a ajuda do Teorema 2.5.1, temos a estimativa

UP(A1 ∧ · · · ∧ A1000) ≤ 1000 X n=1 UP(An) = 1000 X n=1 1 1000 = 1. ´

E verdade que esta estimativa n˜ao lan¸ca nenhuma luz sobre o verdadeiro valor de UP(A1∧ · · · ∧ A1000), mas mostra que a semˆantica probabil´ıstica tamb´em n˜ao aponta no

sentido de validar uma conclus˜ao que ´e falsa. Desse modo, mostramos que ao aceitar senten¸cas com alto valor de probabilidade como aceitas racionalmente, n˜ao temos ne- cessariamente o fecho dedutivo de um conjunto de senten¸cas justificadas. Ao contr´ario, devemos proceder com a an´alise da propaga¸c˜ao de incerteza em inferˆencias que tomam estas senten¸cas por premissas.

Notamos ainda que, em uma inferˆencia, n˜ao ´e o pequeno grau de incerteza de cada premissa que nos garantir´a um pequeno grau de incerteza da conclus˜ao, mas sim o quanto de incerteza ´e acumulado pelo conjunto de todas as premissas.

Outra aplica¸c˜ao interessante do Teorema 2.5.1 ´e sobre a famosa inferˆencia Pseudo Sco- tus: A, ¬A ` B. ´E claro que, para qualquer valora¸c˜ao probabil´ıstica P , UP(A)+UP(¬A) =

1 e, logo, UP(B) ≤ 1. Em LPC esta inferˆencia geralmente gera desconforto por admitir

que qualquer coisa seja conclu´ıda das premissas, que n˜ao s˜ao necessariamente relacionadas `

a conclus˜ao. Podemos entender que na idealiza¸c˜ao de LPC, premissas contradit´orias n˜ao poderiam existir, mas note que na semˆantica probabil´ıstica a conclus˜ao que temos ´e que P (B) ∈ [0, 1], o que n˜ao diz nada sobre a probabilidade de B. Isto parece ser um resultado mais confort´avel, dado que n˜ao h´a nenhuma rela¸c˜ao das premissas com a conclus˜ao.

Vejamos, agora, uma rec´ıproca para o Teorema 2.5.1. Apesar de, no exemplo do silogismo disjuntivo, existir uma fun¸c˜ao de incerteza que atinge a majora¸c˜ao determinada pelo Teorema 2.5.1, a saber, UP2, este teorema n˜ao garante que a majora¸c˜ao determinada

´e o maior valor que uma fun¸c˜ao de incerteza pode atingir. E, em geral, n˜ao ´e o pior caso de fun¸c˜ao de incerteza que conseguimos com este teorema.

Por exemplo, na inferˆencia representada pela consequˆencia l´ogica A, B, C ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

podemos associar a seguinte valora¸c˜ao probabil´ıstica7, restrita `as premissas, com sua

respectiva fun¸c˜ao de incerteza:

7Temos que P se trata, de fato, de uma valora¸ao probabil´ıstica. Para isto, basta definir uma dis-

tribui¸c˜ao de probabilidade sobre as descri¸c˜oes de estado do conjunto {A, B, C} ou, ent˜ao, observar que qualquer associa¸c˜ao de probabilidades a um conjunto finito de senten¸cas atˆomicas induz uma valora¸c˜ao probabil´ıstica, como mostra o Teorema 3.4.2. Do mesmo modo justificamos a valora¸c˜ao probabil´ıstica introduzida para chegar ao Paradoxo da Loteria, an´aloga a esta.

• P (A) = 0, 9; • P (B) = 0, 9; • P (C) = 0, 9; • UP(A) = 0, 1; • UP(B) = 0, 1; • UP(C) = 0, 1.

Pelo Teorema 2.5.1, podemos majorar a incerteza da conclus˜ao por

UP((A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C)) ≤ UP(A) + UP(B) + UP(C) = 0, 3.

Por´em, pela consequˆencia l´ogica

A, B ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

podemos calcular uma outra majora¸c˜ao para a incerteza da conclus˜ao, que ´e a mesma da inferˆencia original que estamos analisando:

UP((A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C)) ≤ UP(A) + UP(B) = 0, 2.

Nos casos em que a majora¸c˜ao determinada pelo Teorema 2.5.1 ´e realmente o pior caso poss´ıvel que a fun¸c˜ao de incerteza pode atingir, como no exemplo do silogismo disjuntivo, as premissas desta inferˆencia gozam da propriedade de serem premissas essenciais8: em

uma consequˆencia l´ogica Γ ` ψ, em que Γ ´e um conjunto finito de senten¸cas de L, dizemos que uma premissa ϕ ∈ Γ ´e uma premissa essencial se Γ \ {ϕ} 0 ψ. O pr´oximo teorema, uma rec´ıproca parcial do Teorema 2.5.1, estabelece este resultado.

Teorema 2.5.2. Sejam as senten¸cas ϕ1, . . . , ϕn, ψ ∈ L e u1, . . . , un ≥ 0 n´umeros reais de

forma que u1+ · · · + un = 1. Ent˜ao, se ϕ1, . . . , ϕn ` ψ e as premissas desta consequˆencia

l´ogica s˜ao essenciais e logicamente compat´ıveis9, existe uma valora¸ao probabil´ıstica P tal

que UP(ϕi) = ui, para i = 1, . . . , n e

UP(ψ) = UP(ϕ1) + · · · + UP(ϕn).

Demonstra¸c˜ao. Vamos definir uma distribui¸c˜ao de probabilidade sobre o conjunto K das f´ormulas atˆomicas {A1, . . . , AJ} que aparecem nas senten¸cas ϕ1, . . . , ϕn, ψ e vamos consi-

derar as FNDs destas senten¸cas em fun¸c˜ao das descri¸c˜oes de estado do conjunto K. Seja vi uma valora¸c˜ao em que vi(ϕ1) = · · · = vi(ϕi−1) = vi(ϕi+1) = · · · = vi(ϕn) = 1

e vi(ϕi) = vi(ψ) = 0, para cada i = 1, . . . , n. Esta valora¸c˜ao existe pois cada ϕi ´e uma 8Um conjunto de premissas essenciais que derivam a senten¸ca ψ ´e conhecido, na literatura, por kernel

de ψ.

9Dizer que estas senten¸cas s˜ao logicamente compat´ıveis significa que n˜ao ´e o caso em que ` ¬(ϕ 1∧

premissa essencial na consequˆencia l´ogica que estamos considerando. Sejam, agora, as descri¸c˜oes de estado Ki de K que cont´em os literais Aj, se vi(Aj) = 1 e os literais ¬Aj,

se vi(Aj) = 0. Seja, tamb´em, v0 uma valora¸c˜ao em que v0(ϕ1) = · · · = v0(ϕn) = 1, que

existe pois as f´ormulas ϕ1, . . . , ϕns˜ao logicamente compat´ıveis e, a descri¸c˜ao de estado K0

aquela que cont´em os literais Aj quando v0(Aj) = 1 e os literais ¬Aj quando v0(Aj) = 0.

Definimos a distribui¸c˜ao de probabilidade P por: • P (K0) = 1 − (u1+ · · · + un);

• P (Ki) = ui (i = 1, . . . , n);

• P (K0) = 0, para todas as outras descri¸c˜oes de estado.

Note que, como vi(Ki) = 1 e vi(ϕi) = 0, Ki n˜ao aparece na FND de ϕi, para i =

1, . . . , n. Por outro lado, quando i 6= j, vi(ϕj) = vi(Ki) = 1 e, ent˜ao, Ki aparece na FND

de ϕj. Note, tamb´em, que v0(ϕi) = 1 e v0(K0) = 1, para i = 1, . . . , n e, ent˜ao, K0 aparece

na FND de ϕi, para i = 1, . . . , n. Portanto, para i = 1, . . . , n, temos que

P (ϕi) = [1 − (u1+ · · · + un)] + [u1+ · · · + ui−1+ ui+1+ · · · + un] = 1 − ui.

Agora, note que, como vi(Ki) = 1 e vi(ψ) = 0, Ki n˜ao aparece na FND de ψ, para

i = 1, . . . , n. Por outro lado, como ϕ1, . . . , ϕn ` ψ, temos que v0(ψ) = 1. Junto a isto,

como v0(K0) = 1, segue que K0 faz parte da FND de ψ. Portanto, temos que

P (ψ) = 1 − (u1+ · · · + un).

Finalmente, temos a fun¸c˜ao de incerteza UP em que

UP(ϕi) = 1 − (1 − ui) = ui (i = 1, . . . , n)

e, tamb´em,

UP(ψ) = 1 − [1 − (u1+ · · · + un)] = u1+ · · · + un = UP(ϕ1) + · · · + UP(ϕn).

O Teorema 2.5.2 ´e uma rec´ıproca parcial do Teorema 2.5.1 pois, apesar de garantir que a majora¸c˜ao ´e o pior caso poss´ıvel de incerteza da conclus˜ao em algumas inferˆencias, n˜ao garante para todas. De fato, na consequˆencia l´ogica

nenhuma das premissas - A, B ou C - ´e essencial e, como vimos, a aplica¸c˜ao do Teorema 2.5.1 n˜ao nos oferece o pior caso de incerteza.

Por´em, mesmo fazendo uso da consequˆencia

A, B ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

em que as premissas s˜ao essenciais, n˜ao obtemos o pior caso de incerteza pois, quando deixamos de considerar as trˆes premissas originais, perdemos informa¸c˜oes que poderiam diminuir mais ainda a majora¸c˜ao. No Cap´ıtulo 3 teremos condi¸c˜oes de calcular o pior caso poss´ıvel de incerteza para este exemplo.

No documento Lógica, probabilidade e consequência (páginas 51-58)