Majorando a incerteza - Lógica, probabilidade e consequência

Com os Teoremas de Corre¸cão (2.4.2) e Completude (2.4.3) demonstrados na se¸cão anterior, pudemos argumentar que a semântica probabil´ıstica incorpora a lógica clássica nos casos em que há certeza absoluta sobre veracidade ou falsidade de senten¸cas. Mas, para tratar da propaga¸cão de incerteza e propor uma solu¸cão para dilemas como o Para- doxo da Loteria, a rela¸cão de consequência probabil´ıstica definida não é suficiente, pois ela não considera graus de certeza que não sejam 0 ou 1.

Na Se¸cão 2.1, dissemos que para solucionar o Paradoxo da Loteria, vamos refutar o princ´ıpio de que um conjunto de senten¸cas aceitas racionalmente é dedutivamente fe- chado. Isto é consequência do fato de entendermos senten¸cas aceitas racionalmente como senten¸cas com alto grau de certeza, alto valor de probabilidade. E, como veremos, cada inferência lógica deve ser tratada individualmente para entendermos como o grau de incerteza das premissas desta inferência se propagam para sua conclusão.

Vejamos um exemplo simples e imediato de propaga¸cão de incerteza das premissas para a conclusão. Para duas senten¸cas A e B e uma valora¸cão probabil´ıstica P , a seguinte lei de probabilidades se aplica:

P (B) = P (A ∨ B) + P (A → B) − 1.

Podemos verificar facilmente esta lei observando as seguintes equa¸cões, que são ba- seadas nas descri¸cões de estado que formam as FNDs das senten¸cas em questão na lei acima:

• P (A ∨ B) = P (A ∧ ¬B) + P (A ∧ B) + P (¬A ∧ B); • P (A → B) = P (A ∧ B) + P (¬A ∧ B) + P (¬A ∧ ¬B); • 1 = P (A ∧ ¬B) + P (A ∧ B) + P (¬A ∧ B) + P (¬A ∧ ¬B).

Agora, vamos analisar a inferência formalizada pela consequência lógica clássica: A ∨ B, A → B ` B.

Tendo algum grau de incerteza sobre as premissas desta inferência, representado pela associa¸cão de probabilidades através da valora¸cão P a cada uma delas, segue imediata- mente, pela lei de probabilidades apresentada acima, qual o exato grau de incerteza que devemos ter sobre a conclusão da inferência, representado pela probabilidade

P (A ∨ B) + P (A → B) − 1.

Nesta inferência é poss´ıvel calcular exatamente como a incerteza sobre as premissas se propaga para a conclusão. Porém, isto nem sempre é poss´ıvel. Considere, por exemplo, a inferência conhecida como silogismo disjuntivo, formalizada pela consequência lógica clássica:

A ∨ B, ¬A ` B.

Poder´ıamos ter uma distribui¸c˜ao de probabilidade para o conjunto {A, B} como:

• P1(A ∧ B) = 0, 1;

• P1(¬A ∧ B) = 0, 6;

• P1(A ∧ ¬B) = 0, 2;

• P1(¬A ∧ ¬B) = 0, 1;

e outra distribui¸c˜ao de probabilidade para o mesmo conjunto como: • P2(A ∧ B) = 0;

• P2(¬A ∧ B) = 0, 6;

• P2(A ∧ ¬B) = 0, 3;

• P2(¬A ∧ ¬B) = 0, 1.

Ambas as distribui¸c˜oes, P1 e P2, induzem a valora¸c˜ao probabil´ıstica que tem como

casos:

• P (A ∨ B) = P (A ∧ B) + P (¬A ∧ B) + P (A ∧ ¬B) = 0, 9; • P (¬A) = P (¬A ∧ B) + P (¬A ∧ ¬B) = 0, 7.

Assim, se representamos o grau de incerteza que temos sobre as premissas da inferência em questão por esta valora¸cão probabil´ıstica P e queremos saber como estas incertezas se

propagam na inferência, não poderemos encontrar um valor exato para a incerteza, pois a valora¸cão probabil´ıstica P pode se comportar tanto como uma valora¸cão induzida por P1 quanto uma valora¸cão induzida por P2:

• P1(B) = P1(A ∧ B) + P1(¬A ∧ B) = 0, 7;

• P2(B) = P2(A ∧ B) + P2(¬A ∧ B) = 0, 6.

O nosso estudo sobre a propaga¸cão da incerteza seguirá, portanto, na tentativa de estimar qual a incerteza que podemos ter sobre a conclusão de uma inferência ao invés de calculá-la exatamente. Até então, estamos insistindo em falar de incerteza sobre senten¸cas, pois nos parece mais natural do que dizer que temos um grau de certeza sobre elas, apesar de ser isto que entendemos que as valora¸cões probabil´ısticas representam. É claro que estes termos estão intimamente ligados: se temos apenas um grau de certeza, que não absoluta, sobre uma senten¸ca, estamos, então, incertos sobre ela. No entanto, a partir de agora tomaremos a incerteza como um conceito relevante e vamos defini-la a partir da no¸cão de probabilidade. Concordando com Adams (Ada98), temos como consequência que os próximos resultados, relacionando inferências lógicas com probabilidades, são mais facilmente enunciados em termos deste novo conceito.

As fun¸cões de incerteza são outra maneira de perceber as valora¸cões probabil´ısticas. Elas medem a probabilidade de uma senten¸ca ser falsa e são definidas assim: dada uma valora¸cão probabil´ıstica P , a fun¸cão de incerteza6 UP : L → R associada a ela é dada por

UP(ϕ) = 1 − P (ϕ), para ϕ ∈ L.

A seguir, temos alguns lemas que tratam das fun¸cões de incerteza e, em seguida, um teorema, originalmente demonstrado por Suppes (Sup66), que dá um grande passo em rela¸cão ao entendimento da propaga¸cão de incerteza em inferências.

Lema 2.5.1. Sejam ϕ, ψ ∈ L tais que ` ϕ → ψ e P uma valora¸c˜ao probabil´ıstica. Ent˜ao, UP(ψ) ≤ UP(ϕ).

Demonstra¸cão. Pelo Teorema 2.2.1, temos que P (ϕ) ≤ P (ψ). Aplicando a defini¸cão da fun¸cão de incerteza UP, segue o resultado.

Lema 2.5.2. Sejam ϕ1, . . . , ϕn ∈ L e P uma valora¸c˜ao probabil´ıstica. Ent˜ao,

UP(ϕ1∧ · · · ∧ ϕn) ≤ UP(ϕ1) + · · · + UP(ϕn). 6_{O nome U da fun¸c˜}_{ao de incerteza ´}_{e devido ao termo em inglˆ}_{es uncertainty.}

Demonstra¸cão. Primeiro vamos mostrar para n = 2. Pelo Teorema 2.2.1, temos que P (ϕ1) + P (ϕ2) = P (ϕ1 ∧ ϕ2) + P (ϕ1 ∨ ϕ2) e, pela defini¸cão da fun¸cão de incerteza UP,

segue que UP(ϕ1) + UP(ϕ2) = UP(ϕ1∧ ϕ2) + UP(ϕ1 ∨ ϕ2). Assim, como n˜ao ´e dif´ıcil ver

que UP(ϕ1∨ ϕ2) ≥ 0, segue o resultado. Com este caso e por indu¸c˜ao, segue o resultado

para n qualquer.

Teorema 2.5.1. Sejam ϕ1, . . . , ϕn, ψ ∈ L. Se ϕ1, . . . , ϕn` ψ, ent˜ao, para uma valora¸c˜ao

probabil´ıstica P ,

UP(ψ) ≤ UP(ϕ1) + · · · + UP(ϕn).

Demonstra¸c˜ao. Como ϕ1, . . . , ϕn` ψ, temos que ` ϕ1∧ · · · ∧ ϕn→ ψ e, pelo Lema 2.5.1,

segue que UP(ψ) ≤ UP(ϕ1∧ · · · ∧ ϕn). Assim, com o Lema 2.5.2, segue o resultado.

Podemos estabelecer sobre a propaga¸cão de incerteza, segundo a semântica probabil´ıstica, que, em uma inferência, a incerteza da conclusão não excede a soma da incerteza das premissas. E, então, em qualquer inferência em que há qualquer grau de incerteza sobre as premissas, podemos majorar a incerteza que podemos ter na conclusão. No exemplo do silogismo disjuntivo dado há pouco, temos que

UP(B) ≤ UP(A ∨ B) + U (¬A) = (1 − 0, 9) + (1 − 0, 7) = 0, 4.

Neste exemplo, observamos duas valora¸cões probabil´ısticas que modelam nossa incerteza sobre as premissas. As incertezas sobre a conclusão em cada uma delas é dada por

• UP1(B) = 1 − 0, 7 = 0, 3;

• UP2(B) = 1 − 0, 6 = 0, 4.

As duas valora¸c˜oes, evidentemente, obedecem a majora¸c˜ao do Teorema 2.5.1.

Vejamos, finalmente, como o Teorema 2.5.1 pode explicar o Paradoxo da Loteria, em que t´ınhamos as senten¸cas A1, . . . , A1000 com probabilidades

P (An) =

999

1000 (n ∈ {1, . . . , 1000}).

Valores de probabilidades tão altos que no racioc´ınio prático faz estas senten¸cas serem aceitas racionalmente e, se tomadas por premissas em uma inferência, como a que é formalizada pela consequência lógica

em que a conclus˜ao sabemos ser falsa, chegamos a uma contradi¸c˜ao. Por outro lado, com a ajuda do Teorema 2.5.1, temos a estimativa

UP(A1 ∧ · · · ∧ A1000) ≤ 1000 X n=1 UP(An) = 1000 X n=1 1 1000 = 1. ´

E verdade que esta estimativa não lan¸ca nenhuma luz sobre o verdadeiro valor de UP(A1∧ · · · ∧ A1000), mas mostra que a semântica probabil´ıstica também não aponta no

sentido de validar uma conclusão que é falsa. Desse modo, mostramos que ao aceitar senten¸cas com alto valor de probabilidade como aceitas racionalmente, não temos necessariamente o fecho dedutivo de um conjunto de senten¸cas justificadas. Ao contrário, devemos proceder com a análise da propaga¸cão de incerteza em inferências que tomam estas senten¸cas por premissas.

Notamos ainda que, em uma inferência, não é o pequeno grau de incerteza de cada premissa que nos garantirá um pequeno grau de incerteza da conclusão, mas sim o quanto de incerteza é acumulado pelo conjunto de todas as premissas.

Outra aplica¸cão interessante do Teorema 2.5.1 é sobre a famosa inferência Pseudo Sco- tus: A, ¬A ` B. É claro que, para qualquer valora¸cão probabil´ıstica P , UP(A)+UP(¬A) =

1 e, logo, UP(B) ≤ 1. Em LPC esta inferˆencia geralmente gera desconforto por admitir

que qualquer coisa seja conclu´ıda das premissas, que n˜ao s˜ao necessariamente relacionadas `

a conclusão. Podemos entender que na idealiza¸cão de LPC, premissas contraditórias não poderiam existir, mas note que na semântica probabil´ıstica a conclusão que temos é que P (B) ∈ [0, 1], o que não diz nada sobre a probabilidade de B. Isto parece ser um resultado mais confortável, dado que não há nenhuma rela¸cão das premissas com a conclusão.

Vejamos, agora, uma rec´ıproca para o Teorema 2.5.1. Apesar de, no exemplo do silogismo disjuntivo, existir uma fun¸cão de incerteza que atinge a majora¸cão determinada pelo Teorema 2.5.1, a saber, UP2, este teorema não garante que a majora¸cão determinada

é o maior valor que uma fun¸cão de incerteza pode atingir. E, em geral, não é o pior caso de fun¸cão de incerteza que conseguimos com este teorema.

Por exemplo, na inferência representada pela consequência lógica A, B, C ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

podemos associar a seguinte valora¸c˜ao probabil´ıstica7_{, restrita `}_{as premissas, com sua}

respectiva fun¸c˜ao de incerteza:

7_{Temos que P se trata, de fato, de uma valora¸}_c˜_{ao probabil´ıstica. Para isto, basta definir uma dis-}

tribui¸cão de probabilidade sobre as descri¸cões de estado do conjunto {A, B, C} ou, então, observar que qualquer associa¸cão de probabilidades a um conjunto finito de senten¸cas atômicas induz uma valora¸cão probabil´ıstica, como mostra o Teorema 3.4.2. Do mesmo modo justificamos a valora¸cão probabil´ıstica introduzida para chegar ao Paradoxo da Loteria, análoga a esta.

• P (A) = 0, 9; • P (B) = 0, 9; • P (C) = 0, 9; • UP(A) = 0, 1; • UP(B) = 0, 1; • UP(C) = 0, 1.

Pelo Teorema 2.5.1, podemos majorar a incerteza da conclus˜ao por

UP((A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C)) ≤ UP(A) + UP(B) + UP(C) = 0, 3.

Porém, pela consequência lógica

A, B ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

podemos calcular uma outra majora¸cão para a incerteza da conclusão, que é a mesma da inferência original que estamos analisando:

UP((A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C)) ≤ UP(A) + UP(B) = 0, 2.

Nos casos em que a majora¸cão determinada pelo Teorema 2.5.1 é realmente o pior caso poss´ıvel que a fun¸cão de incerteza pode atingir, como no exemplo do silogismo disjuntivo, as premissas desta inferência gozam da propriedade de serem premissas essenciais8_{: em}

uma consequência lógica Γ ` ψ, em que Γ é um conjunto finito de senten¸cas de L, dizemos que uma premissa ϕ ∈ Γ ´_{e uma premissa essencial se Γ \ {ϕ} 0 ψ. O próximo teorema,} uma rec´ıproca parcial do Teorema 2.5.1, estabelece este resultado.

Teorema 2.5.2. Sejam as senten¸cas ϕ1, . . . , ϕn, ψ ∈ L e u1, . . . , un ≥ 0 n´umeros reais de

forma que u1+ · · · + un = 1. Ent˜ao, se ϕ1, . . . , ϕn ` ψ e as premissas desta consequˆencia

l´ogica s˜ao essenciais e logicamente compat´ıveis9_{, existe uma valora¸}_c˜_{ao probabil´ıstica P tal}

que UP(ϕi) = ui, para i = 1, . . . , n e

UP(ψ) = UP(ϕ1) + · · · + UP(ϕn).

Demonstra¸cão. Vamos definir uma distribui¸cão de probabilidade sobre o conjunto K das fórmulas atômicas {A1, . . . , AJ} que aparecem nas senten¸cas ϕ1, . . . , ϕn, ψ e vamos consi-

derar as FNDs destas senten¸cas em fun¸cão das descri¸cões de estado do conjunto K. Seja vi uma valora¸cão em que vi(ϕ1) = · · · = vi(ϕi−1) = vi(ϕi+1) = · · · = vi(ϕn) = 1

e vi(ϕi) = vi(ψ) = 0, para cada i = 1, . . . , n. Esta valora¸c˜ao existe pois cada ϕi ´e uma 8_{Um conjunto de premissas essenciais que derivam a senten¸}_{ca ψ ´}_{e conhecido, na literatura, por kernel}

de ψ.

9_{Dizer que estas senten¸}_{cas s˜}_{ao logicamente compat´ıveis significa que n˜}_{ao ´}_{e o caso em que ` ¬(ϕ} 1∧

premissa essencial na consequência lógica que estamos considerando. Sejam, agora, as descri¸cões de estado Ki de K que contém os literais Aj, se vi(Aj) = 1 e os literais ¬Aj,

se vi(Aj) = 0. Seja, tamb´em, v0 uma valora¸c˜ao em que v0(ϕ1) = · · · = v0(ϕn) = 1, que

existe pois as fórmulas ϕ1, . . . , ϕnsão logicamente compat´ıveis e, a descri¸cão de estado K0

aquela que cont´em os literais Aj quando v0(Aj) = 1 e os literais ¬Aj quando v0(Aj) = 0.

Definimos a distribui¸c˜ao de probabilidade P por: • P (K0) = 1 − (u1+ · · · + un);

• P (Ki) = ui (i = 1, . . . , n);

• P (K0_{) = 0, para todas as outras descri¸c˜}_{oes de estado.}

Note que, como vi(Ki) = 1 e vi(ϕi) = 0, Ki n˜ao aparece na FND de ϕi, para i =

1, . . . , n. Por outro lado, quando i 6= j, vi(ϕj) = vi(Ki) = 1 e, ent˜ao, Ki aparece na FND

de ϕj. Note, tamb´em, que v0(ϕi) = 1 e v0(K0) = 1, para i = 1, . . . , n e, ent˜ao, K0 aparece

na FND de ϕi, para i = 1, . . . , n. Portanto, para i = 1, . . . , n, temos que

P (ϕi) = [1 − (u1+ · · · + un)] + [u1+ · · · + ui−1+ ui+1+ · · · + un] = 1 − ui.

Agora, note que, como vi(Ki) = 1 e vi(ψ) = 0, Ki n˜ao aparece na FND de ψ, para

i = 1, . . . , n. Por outro lado, como ϕ1, . . . , ϕn ` ψ, temos que v0(ψ) = 1. Junto a isto,

como v0(K0) = 1, segue que K0 faz parte da FND de ψ. Portanto, temos que

P (ψ) = 1 − (u1+ · · · + un).

Finalmente, temos a fun¸c˜ao de incerteza UP em que

UP(ϕi) = 1 − (1 − ui) = ui (i = 1, . . . , n)

e, tamb´em,

UP(ψ) = 1 − [1 − (u1+ · · · + un)] = u1+ · · · + un = UP(ϕ1) + · · · + UP(ϕn).

O Teorema 2.5.2 é uma rec´ıproca parcial do Teorema 2.5.1 pois, apesar de garantir que a majora¸cão é o pior caso poss´ıvel de incerteza da conclusão em algumas inferências, não garante para todas. De fato, na consequência lógica

nenhuma das premissas - A, B ou C - é essencial e, como vimos, a aplica¸cão do Teorema 2.5.1 não nos oferece o pior caso de incerteza.

Por´em, mesmo fazendo uso da consequˆencia

A, B ` (A ∧ B) ∨ (A ∧ C) ∨ (B ∧ C),

em que as premissas são essenciais, não obtemos o pior caso de incerteza pois, quando deixamos de considerar as três premissas originais, perdemos informa¸cões que poderiam diminuir mais ainda a majora¸cão. No Cap´ıtulo 3 teremos condi¸cões de calcular o pior caso poss´ıvel de incerteza para este exemplo.

No documento Lógica, probabilidade e consequência (páginas 51-58)