• Nenhum resultado encontrado

Lógica, probabilidade e consequência

N/A
N/A
Protected

Academic year: 2021

Share "Lógica, probabilidade e consequência"

Copied!
109
0
0

Texto

(1)

Sandro M´

arcio da Silva Preto

ogica, Probabilidade e

Consequˆ

encia

Campinas 2015

(2)
(3)

Ficha catalográfica

Universidade Estadual de Campinas

Biblioteca do Instituto de Filosofia e Ciências Humanas Cecília Maria Jorge Nicolau - CRB 8/3387

Preto, Sandro Márcio da Silva,

P927L PreLógica, probabilidade e consequência / Sandro Márcio da Silva Preto. – Campinas, SP : [s.n.], 2015.

PreOrientador: Walter Alexandre Carnielli.

PreDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Filosofia e Ciências Humanas.

Pre1. Lógica. 2. Linguagens formais - Semântica. 3. Probabilidades. I. Carnielli, Walter Alexandre,1952-. II. Universidade Estadual de Campinas. Instituto de Filosofia e Ciências Humanas. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Logic, probability, and consequence Palavras-chave em inglês:

Logic

Formal languages - Semantics Probabilities

Área de concentração: Filosofia Titulação: Mestre em Filosofia Banca examinadora:

Marco Antonio Caron Ruffino Marcelo Finger

Juliana Bueno-Soler

Data de defesa: 25-09-2015

Programa de Pós-Graduação: Filosofia

(4)

A Comiss˜ao Julgadora dos trabalhos de Defesa de Disserta¸c˜ao de Mestrado, composta pe-los Professores Doutores a seguir descritos, em sess˜ao p´ublica realizada em 25 de setembro de 2015, considerou o candidato Sandro M´arcio da Silva Preto aprovado.

Prof. Dr. Marco Antonio Caron Ruffino Prof. Dr. Marcelo Finger

Profa. Dra. Juliana Bueno-Soler

A Ata de Defesa, assinada pelos membros da Comiss˜ao Examinadora, consta no processo de vida acadˆemica do aluno.

(5)
(6)

Antes de mais nada, agrade¸co aos meus pais Marcio e R´ubia. Esta disserta¸c˜ao ou qualquer outra conquista minha ´e tamb´em conquista deles, por todos os seus esfor¸cos e, muitas vezes, sacrif´ıcios. N˜ao h´a linguagem com poder de express˜ao capaz de capturar minha gratid˜ao e meus sentimentos por estes dois.

Agrade¸co tamb´em `a minha irm˜a N´ubia, sempre incentivadora e entusiasta de meus projetos, e ao pequeno Afonso, que acompanhou apenas alguns meses deste trabalho e agora ´e a quem o dedico.

Agrade¸co ao meu orientador Professor Walter que, sabiamente, me introduziu ao mundo das probabilidades e das apaixonantes quest˜oes filos´oficas. Tamb´em, a todos os professores, colegas e amigos do Centro de L´ogica, que fomentaram nos ´ultimos tempos meu amadurecimento intelectual e com quem compartilhei agrad´aveis momentos.

S˜ao tantos os amigos respons´aveis por minha forma¸c˜ao enquanto gente e, consequente-mente, enquanto acadˆemico que, com medo do imperdo´avel crime de omitir algum nome, omitirei todos. No entanto, citarei os saudosos contextos de nosso conv´ıvio. Assim, tˆem minha gratid˜ao os amigos da querida Guaran´esia “das manh˜as orvalhadas”, os amigos de camisa amarela da animada S˜ao Carlos, os s´abios amigos de rep´ublica da grandiosa Campinas, e, evidente, todos os amigos que fiz nas ´orbitas destes contextos.

Sou tamb´em grato aos que acompanham e ajudam a construir minhas mais recentes experiˆencias no Instituto Federal em Formiga: meus amigos e colegas de trabalho e, claro, `

(7)

Uma das maneiras conhecidas de representar a incerteza ´e atrav´es das probabilida-des. Para estudar o racioc´ınio sob incerteza deste ponto de vista, mostramos como ´e poss´ıvel associar valores de probabilidade a senten¸cas de uma linguagem formal defi-nindo semˆanticas probabil´ısticas com suporte na l´ogica cl´assica e em algumas l´ogicas n˜ao-cl´assicas. Definimos e analisamos rela¸c˜oes de consequˆencia probabil´ıstica baseadas na semˆantica probabil´ıstica. Para tal, estudamos tamb´em as valora¸c˜oes probabil´ısticas com aux´ılio de ferramentas matem´aticas como a ´algebra linear e a otimiza¸c˜ao linear. Al´em disto, apresentamos as principais interpreta¸c˜oes do conceito de probabilidade e introdu-zimos algumas outras formas de combinar l´ogica e probabilidades.

(8)

A well-known way to represent uncertainty is through probabilities. In order to study the concept of uncertainty reasoning from this point of view, we show how it is possible to associate probability values to sentences in a formal language by defining in detail the notion of probability semantics supported by classical logic and by some non-classical logics. We define and analyze the concept of probabilistic consequence relations based on probabilistic semantics. To this end, we also study probabilistic valuations assisted by mathematical tools such as linear algebra and linear optimization. In addition, we present some of the main concepts of probability interpretation and introduce some other ways to combine logic and probabilities.

(9)

Introdu¸c˜ao 11

1 Sobre Probabilidades e suas Interpreta¸c˜oes 13

1.1 O C´alculo de Probabilidades . . . 13

1.2 A Probabilidade Cl´assica . . . 18

1.3 A Probabilidade Frequentista . . . 20

1.4 A Probabilidade Subjetiva . . . 24

1.5 A Probabilidade L´ogica, a quest˜ao da indu¸c˜ao e as l´ogicas indutivas . . . . 27

1.6 A Probabilidade Propensista . . . 32

2 Semˆantica Probabil´ıstica e Propaga¸c˜ao de Incerteza 36 2.1 Racioc´ınio sob incerteza . . . 36

2.2 Axiomatizando a Teoria de Probabilidades . . . 38

2.3 Conjuntos versus senten¸cas . . . 42

2.4 Semˆantica probabil´ıstica . . . 44

2.5 Majorando a incerteza . . . 51

2.6 Consequˆencia probabil´ıstica de Adams . . . 58

3 Valora¸c˜oes Probabil´ısticas e Estimativas de Probabilidade 60 3.1 Pior caso e aceita¸c˜ao racional . . . 60

3.2 Algebra linear e valora¸c˜´ oes probabil´ısticas . . . 62

3.3 Majora¸c˜ao e minora¸c˜ao ´otimas . . . 65

3.4 O problema da Satisfatibilidade Probabil´ıstica . . . 67

3.5 Computa¸c˜ao de Mψ e mψ . . . 70

3.6 Consequˆencia probabil´ıstica de Hailperin . . . 75

4 Probabilidades em L´ogicas N˜ao-Cl´assicas 78 4.1 O prov´avel enquanto modalidade . . . 78

(10)

Considera¸c˜oes Finais 92

Bibliografia 95

A Formas Normais Disjuntivas 102

A.1 Defini¸c˜oes . . . 102 A.2 Resultados . . . 102

B Otimiza¸c˜ao Linear 106

B.1 Problemas de Otimiza¸c˜ao Linear . . . 106 B.2 Problema Dual . . . 107 B.3 Solu¸c˜oes . . . 108

(11)

Embora j´a em autores cl´assicos da l´ogica moderna, como A. De Morgan (DM47) e G. Boole (Boo54), a L´ogica e a Teoria de Probabilidades se mostrarem de m˜aos dadas, o termo l´ogica probabil´ıstica - definido ainda nesta introdu¸c˜ao - pode, como observou H´ajek (H´aj01), parecer um oximoro. De um lado, a l´ogica ´e a disciplina que trata do que ´e “imut´avel, necess´ario e certo” e, de outro, as probabilidades se referem “ao incerto, ao aleat´orio, ao inconstante”1. Ainda, no verbete Logic and Probability, da Stanford

Encyclo-pedia of Philosophy (DKS14), as diferen¸cas s˜ao ressaltadas mostrando que a l´ogica oferece uma perspectiva qualitativa da inferˆencia, dado que a validade de um argumento repousa em sua estrutura formal, e as probabilidades oferecem uma perspectiva quantitativa, pois medem a certeza numericamente.

No sistema da l´ogica proposicional cl´assica, tratado na maior parte deste texto, uma inferˆencia ´e chamada v´alida quando, por sua estrutura, se suas premissas forem verda-deiras, sua conclus˜ao necessariamente tamb´em ser´a. N˜ao faltam exemplos cl´assicos de inferˆencias v´alidas: modus ponens, silogismo disjuntivo, silogismo hipot´etico, etc. No en-tanto, em muitos casos ´e comum n˜ao se saber ao certo se senten¸cas s˜ao verdadeiras ou falsas, tornando ineficaz o conhecimento das inferˆencias v´alidas.

A proposta que estudamos, seguindo a linha de E. W. Adams (Ada98), ´e justamente medir o grau de certeza que temos sobre a veracidade destas senten¸cas atrav´es das pro-babilidades. Da´ı se deriva a no¸c˜ao de semˆantica probabil´ıstica, que oferece a possibilidade de associar probabilidades `as senten¸cas da linguagem proposicional. Neste trabalho abor-daremos, ainda que de forma elementar e tentativa, tanto a l´ogica cl´assica como algumas n˜ao-cl´assicas. A proposta inclui estudar como os graus de certeza, isto ´e, as probabilida-des, se comportam quando submetidos `a rela¸c˜ao de consequˆencia l´ogica (que modela as inferˆencias v´alidas) e que outros tipos de rela¸c˜oes de consequˆencias podem nascer desta combina¸c˜ao.

Ambas as disciplinas, a L´ogica e a Teoria de Probabilidades, s˜ao ferramentas adequa-das para descrever o racioc´ınio, apesar de n˜ao serem as ´unicas. Neste trabalho, vamos

1Tradu¸oes nossas de “immutable, necessary and certain” e “the uncertain, the random, the capricious”

em (H´aj01).

(12)

apresentar a semˆantica probabil´ıstica como uma ferramenta fruto da comunh˜ao entre l´ogica e probabilidades, com objetivo de obter uma forma de tratar o racioc´ınio quando h´a presen¸ca de incerteza. Entendemos, na maior parte desse texto, l´ogicas probabil´ısticas como os sistemas l´ogicos determinados por uma rela¸c˜ao de consequˆencia derivada desta semˆantica probabil´ıstica. As exce¸c˜oes s˜ao os sistemas em que s˜ao combinadas de modo alternativo l´ogicas n˜ao-cl´assicas e probabilidades.

No Cap´ıtulo 1 apresentamos brevemente a Teoria de Probabilidades atrav´es da sua teoria matem´atica de c´alculo. Al´em disso, mostramos que n˜ao existe um consenso sobre a natureza de probabilidade com uma breve exposi¸c˜ao das principais correntes que tratam este assunto.

No Cap´ıtulo 2, definimos a semˆantica probabil´ıstica, principal objeto de estudo desta disserta¸c˜ao, de forma a expressar a no¸c˜ao de incerteza sobre senten¸cas. Definimos, tamb´em, algumas rela¸c˜oes de consequˆencia probabil´ıstica, baseadas nas caracteriza¸c˜oes da inferˆencia que se obtˆem de acordo com os resultados que relacionam a semˆantica pro-posta nesta disserta¸c˜ao e a rela¸c˜ao de consequˆencia da l´ogica cl´assica.

Com vi´es mais t´ecnico-matem´atico, o Cap´ıtulo 3 aprofunda o estudo dos constituintes da semˆantica probabil´ıstica: as valora¸c˜oes probabil´ısticas. Este estudo pretende resolver quest˜oes como a determina¸c˜ao da estimativa ´otima da probabilidade de uma senten¸ca.

Finalizando o trabalho, o Cap´ıtulo 4 quebra a linha cl´assica que ´e adotada at´e ent˜ao e explora sistemas modais com um operador de probabilidades. Al´em disso, introduz um tema de desenvolvimento recente: semˆanticas probabil´ısticas para l´ogicas n˜ao-cl´assicas.

Ainda, no Apˆendice A, estudamos as Formas Normais Disjuntivas e, no Apˆendice B, introduzimos a Teoria de Otimiza¸c˜ao Linear, assuntos de papel importante para o entendimento das valora¸c˜oes probabil´ısticas, nos Cap´ıtulos 2 e 3.

As Considera¸c˜oes Finais retomam os cap´ıtulos anteriores, de forma a sumarizar os principais pontos desta disserta¸c˜ao, e apresenta alguns caminhos de pesquisa que podem motivar trabalhos mais espec´ıficos.

(13)

Sobre Probabilidades e suas

Interpreta¸

oes

Como, em nosso enfoque a Teoria de Probabilidades representa a incerteza das sen-ten¸cas, nada mais justo que discutir sua natureza. Come¸camos com a apresenta¸c˜ao do c´alculo de probabilidades, atrav´es da axiom´atica de Kolmogorov (Kol33) e, ent˜ao, levan-tamos algumas quest˜oes ligadas `a sua especificidade. Por este ser um assunto com v´arios pontos de vista dissonantes, apresentamos os principais deles.

O maior objetivo deste cap´ıtulo ´e introduzir algumas das interpreta¸c˜oes do conceito de probabilidades sem contudo nos aprofundar em nenhuma delas. A principal referˆencia em que nos baseamos ´e (Gil00). Outras referˆencias bastante recomendadas s˜ao (Eag10) e (Sky10).

Na Se¸c˜ao 1.5, ao falar da interpreta¸c˜ao l´ogica das probabilidades, discutimos tamb´em a quest˜ao da indu¸c˜ao e as l´ogicas indutivas.

1.1

O C´

alculo de Probabilidades

Uma correspondˆencia entre Fermat e Pascal, de 1654, ´e usualmente tomada por marco inicial do desenvolvimento da Teoria de Probabilidades. Os dois matem´aticos estudaram alguns problemas de apostas em jogos de azar, e esse tipo de problema permeou, por um bom tempo, o estudo desta teoria que teve in´ıcio na Fran¸ca do s´eculo XVII. Claro que um acontecimento cient´ıfico como o in´ıcio dos estudos de uma teoria dificilmente pode ser especificado no tempo e, de fato, Fermat e Pascal tiveram predecessores. Mas o trabalho deles inspirou outros matem´aticos e deu in´ıcio ao desenvolvimento sistem´atico da teoria. Apesar do estudo das probabilidades ter tido in´ıcio no s´eculo XVII, somente no s´eculo XX aparece, com A. N. Kolmogorov (Kol33), uma axiomatiza¸c˜ao sistem´atica. Esta axi-omatiza¸c˜ao ´e largamente aceita como a formula¸c˜ao correta do c´alculo de probabilidades, embora uma parcela de matem´aticos e fil´osofos discorde e proponha sistemas alternativos

(14)

de c´alculo, sobre o que discorreremos ainda nesta se¸c˜ao.

Kolmogorov axiomatiza a Teoria de Probabilidades por meio de uma fun¸c˜ao de proba-bilidade definida sobre uma ´algebra de conjuntos. Uma ´algebra F de subconjuntos sobre um conjunto Ω ´e uma classe n˜ao-vazia de subconjuntos de Ω fechada por complemen-tos em rela¸c˜ao a Ω e por uni˜oes finitas. Os elementos de F s˜ao chamados de eventos e podemos precisar a seguinte defini¸c˜ao:

Defini¸c˜ao 1.1.1. Sejam Ω um conjunto, F uma ´algebra de subconjuntos sobre Ω e os conjuntos A, B ∈ F . Uma fun¸c˜ao de probabilidades sobre F ´e uma fun¸c˜ao P : F → R que satisfaz os axiomas:

K1 P (A) ≥ 0; K2 P (Ω) = 1;

K3 Se A ∩ B = ∅, ent˜ao P (A ∪ B) = P (A) + P (B).

A partir destes axiomas pode-se calcular, por exemplo, que P (∅) = 0. De fato, como Ω ∩ ∅ = ∅ e Ω ∪ ∅ = Ω, o resultado segue imediatamente dos axiomas K2 e K3.

Como exemplo, podemos tomar o conjunto Ω = {1, 2, 3, 4, 5, 6}, de todas as possi-bilidades da face de um dado cair para cima em uma jogada e, como ´algebra, o con-junto de todos os subconcon-juntos de Ω. Para os valores das probabilidades, podemos ter P ({1}) = · · · = P ({6}) = 16. Caso em que tamb´em temos P ({1, 3, 5}) = 12 e P (Ω) = 1. Este exemplo ilustrativo independe de qualquer no¸c˜ao de probabilidade apesar de ser uma instˆancia da Probabilidade Cl´assica, estudada adiante.

A Defini¸c˜ao 1.1.1 ´e, na verdade, somente uma das duas vers˜oes que Kolmogorov prop˜oe, chamada por ele de Teoria Elementar de Probabilidades. A segunda vers˜ao que ele apre-senta toma por dom´ınio da fun¸c˜ao de probabilidade uma σ-´algebra: um conjunto que, al´em das propriedades de uma ´algebra, tamb´em ´e fechado por uni˜oes enumer´aveis. E, para axiomatizar a teoria, basta substituir o axioma K3, conhecido por axioma da aditi-vidade finita, pelo axioma da aditiaditi-vidade enumer´avel :

K3’ Se A1, A2, . . . ´e uma sequˆencia enumer´avel de conjuntos dois-a-dois disjuntos de Ω,

ent˜ao P [∞ n=1 An  = ∞ X n=1 P (An).

A aceita¸c˜ao da aditividade enumer´avel ´e objeto de bastante discuss˜ao entre os especia-listas. O pr´oprio Kolmogorov entende que os espa¸cos infinitos s˜ao apenas uma idealiza¸c˜ao

(15)

dos processos aleat´orios reais mas, mesmo assim, se limita a estudar os modelos que satisfazem a aditividade enumer´avel1.

Since the new axiom is essential for infinite fields of probability only, it is almost impossible to elucidate its empirical meaning [...] Infinite fields of pro-bability occur only as idealized models of real random processes. We limit ourselves, arbitrarily, to only those models which satisfy Axiom VI. This limi-tation has been found expedient in researches of the most diverse sort. (Kol56, tradu¸c˜ao para o inglˆes de (Kol33))

Por outro lado, De Finetti, um dos principais te´oricos das probabilidades subjetivas, nega a aditividade enumer´avel e somente trabalha com a aditividade finita (Se¸c˜ao 1.4). Chamamos a axiom´atica que considera somente a aditividade finita de caso finito da teoria de Kolmogorov, e a axiom´atica com a aditividade enumer´avel de caso infinito.

Outro importante conceito levado em conta por Kolmogorov ´e o de probabilidade con-dicional, definido para eventos A, B ∈ Ω, desde que P (B) 6= 0, pelo quociente

P (A|B) = P (A ∩ B) P (B) .

Para Kolmogorov, este quociente define uma nova fun¸c˜ao com dois argumentos, que, por um abuso de nota¸c˜ao, leva o mesmo nome da fun¸c˜ao de probabilidades `a qual ela ´e associada. H´a, no entanto, uma discuss˜ao se este quociente ´e realmente uma defini¸c˜ao ou deveria ser entendido a partir de um axioma que governa um novo operador bin´ario, dado que o conceito pr´e-te´orico de probabilidade condicional pode n˜ao se alinhar perfeitamente com a “defini¸c˜ao”. A. H´ajek discute esta quest˜ao em (H´aj03). De qualquer forma, por motivos t´ecnicos, n˜ao ´e incomum tomarmos nos sistemas formais o quociente como uma defini¸c˜ao e desenvolvermos a teoria matem´atica, tamb´em, a partir dele.

A probabilidade condicional tem o objetivo de modelar o c´alculo da probabilidade de um evento A quando assumimos que um evento B ocorre. Lemos a nota¸c˜ao P (A|B) como: probabilidade de A, dado B. A probabilidade de, ao jogar um dado, cair para cima a face com o n´umero 3, dado que assumimos que a face que caiu ´e de um n´umero ´ımpar, ´e a probabilidade condicional dada por P ({3}|{1, 3, 5}) = 13, de acordo com o exemplo que demos acima nesta se¸c˜ao.

Apesar de algumas exce¸c˜oes, como os eventos Ω e ∅, a fun¸c˜ao de probabilidade n˜ao determina valores para os eventos em geral, assim como a l´ogica n˜ao determina, em geral,

1No trabalho original, Kolmogorov coloca o que chama de axioma da continuidade ao inv´es do

(16)

valores de verdade para as senten¸cas. Tais valores devem ser buscados fora da teoria matem´atica. A quest˜ao que se coloca ´e a de entender o que s˜ao as probabilidades. E a´ı, al´em do aspecto matem´atico, formalizado pela teoria de Kolmogorov, as probabilidades tˆem tamb´em um aspecto filos´ofico. Este ´ultimo, diferente do primeiro, n˜ao ´e unanimidade e h´a divergˆencias gritantes entre os fil´osofos sobre a natureza das probabilidades.

Devido `a grande aceita¸c˜ao da axiomatiza¸c˜ao de Kolmogorov e ao fato deste sistema ser desenvolvido em est´agio cada vez mais avan¸cado, W. Salmon (Sal66) defende a im-portˆancia de verificar se cada interpreta¸c˜ao do conceito de probabilidade, entendendo ao seu modo a sua natureza, est´a em consonˆancia com a axiomatiza¸c˜ao de Kolmogorov. Ao crit´erio que dita que, para se aceitar uma interpreta¸c˜ao do conceito de probabilidade, esta interpreta¸c˜ao deve satisfazer a teoria de Kolmogorov, chama-se crit´erio de admissibilidade. No entanto, h´a cr´ıticas quanto `a ado¸c˜ao deste crit´erio. Humphreys nota problemas para algumas interpreta¸c˜oes em se impor a admissibilidade.

It is time, I believe, to give up the criterion of admissibility. We have seen that it places an unreasonable demand upon one plausible construal of propensities. Add to this the facts that limiting relative frequencies violate the axiom of countable additivity [2] and that their probability spaces are not sigma-fields

unless further constraints are added; that rational degrees of belief, according to some accounts, are not and cannot sensibly be required to be countably additive; and that there is serious doubt as to whether the traditional theory of probability is the correct account for use in quantum theory. Then the project of constraining semantics by syntax begins to look quite implausible in this area. (Hum85)

Segundo Lyon (Lyo14), a conclus˜ao de Humphreys ´e que o sistema axiom´atico da Teoria de Probabilidades adotado deve ser sens´ıvel `a interpreta¸c˜ao de probabilidade adotada, e n˜ao o contr´ario. K. R. Popper, proponente da interpreta¸c˜ao propensista (Se¸c˜ao 1.6), sistematiza diversos c´alculos de probabilidade al´em de determinar uma nova interpreta¸c˜ao. H´a ainda outras propostas de axiomatiza¸c˜ao da Teoria de Probabilidades, como a de R´enyi, em (R´en55). R´enyi prop˜oe uma axiom´atica em que o conceito fundamental ´e o de probabilidade condicional. Seu espa¸co de probabilidade condicional ´e uma generaliza¸c˜ao da estrutura de Kolmogorov, que pode ser restaurada como caso particular da estrutura de R´enyi.

Outra disputa sobre probabilidades, segundo observa¸c˜ao de J. Bueno-Soler e W. Car-nielli (BSC15), aparece na existˆencia de duas tradi¸c˜oes que diferem sobre qual entidade

(17)

s˜ao associados valores de probabilidades. De um lado, em 1933, Kolmogorov introduziu as probabilidades definidas sobre conjuntos ou eventos, uma abordagem ligada `a Teoria da Medida, um ramo da matem´atica em que as fun¸c˜oes de probabilidade s˜ao casos parti-culares de medidas sobre conjuntos3. Por´em, de outro lado, uma abordagem mais antiga

´e a associa¸c˜ao de probabilidades sobre senten¸cas de uma linguagem, como usada por G. W. Leibniz (1646-1716), defensor do uso de probabilidades em um novo tipo de l´ogica, em (Lei77), A. De Morgan (1806-1871) em (DM47) e G. Boole (1815-1864) em (Boo54), dentre outros.

J. Bueno-Soler e W. Carnielli ainda notam que as probabilidades sobre conjuntos, hoje em dia, s˜ao majoritariamente usadas por matem´aticos, estat´ısticos e engenheiros e as probabilidades sobre senten¸cas s˜ao preferidas por fil´osofos e l´ogicos. Veremos nas interpreta¸c˜oes apresentadas neste cap´ıtulo exemplos de ambas as tradi¸c˜oes e, na Se¸c˜ao 2.3, mostraremos uma maneira de relacion´a-las.

Nas pr´oximas se¸c˜oes veremos algumas das mais importantes interpreta¸c˜oes, veremos como elas interpretam os conceitos de evento e probabilidade e discutiremos a quest˜ao da satisfatibilidade, por cada uma delas, da teoria de Kolmogorov. Estas interpreta¸c˜oes n˜ao excluem necessariamente umas `as outras. Para alguns fil´osofos, elas podem coexistir e, dependendo do contexto, diferentes interpreta¸c˜oes podem se encaixar como sendo a correta. J´a outros n˜ao tˆem este entendimento pluralista e defendem que somente uma delas ´e a teoria correta, como De Finetti.

As interpreta¸c˜oes do conceito de probabilidade s˜ao geralmente classificadas em dois grandes grupos: o grupo das interpreta¸c˜oes objetivas e o grupo das interpreta¸c˜oes sub-jetivas. As interpreta¸c˜oes objetivas entendem que probabilidades s˜ao propriedades dos fenˆomenos da natureza e independem do conhecimento e de outras no¸c˜oes epistˆemicas como cren¸ca, de modo que podem ser realmente medidas objetivamente. J´a as teorias subjetivas veem probabilidades como entidades relacionadas ao conhecimento do homem e, portanto, podem variar de acordo com o agente.

Veremos nas pr´oximas se¸c˜oes exemplos de cada um destes grupos. Mas esta clas-sifica¸c˜ao tamb´em n˜ao ´e unˆanime. Pode-se colocar dentre os grupos um outro que visa classificar teorias que entendem as probabilidades como medidas das evidˆencias objeti-vas. Nesta outra classifica¸c˜ao, entraria, por exemplo, a interpreta¸c˜ao cl´assica, abordada a seguir.

3Boas referˆencias sobre Teoria da Medida s˜ao (RF10) e (Fol99). Na segunda, encontra-se o

(18)

1.2

A Probabilidade Cl´

assica

A interpreta¸c˜ao cl´assica do conceito de probabilidade foi advogada, dentre outros, por P. S. Laplace e foi fortemente influenciada pelo Iluminismo europeu. Num per´ıodo em que o Determinismo Universal, sobre o qual decorremos brevemente abaixo, era amplamente aceito, a interpreta¸c˜ao da no¸c˜ao de probabilidade aparece como a medida da ignorˆancia do ser humano.

A tese do Determinismo Universal ´e uma consequˆencia do sucesso da mecˆanica new-toniana, que tornou capaz de descrever e prever o movimento dos corpos macrosc´opicos com a utiliza¸c˜ao de equa¸c˜oes matem´aticas, e Determinismo Universal ´e a cren¸ca na extra-pola¸c˜ao desta capacidade para outros fenˆomenos. O pr´oprio Laplace deu uma das mais famosas descri¸c˜oes desta tese iluminista em seu Essai philosophique sur les probabilit´es:

We ought then to regard the present state of the universe as the effect of its anterior state and as the cause of the one which is to follow. Given for one instant an intelligence which could comprehend all the forces by which nature is animated and the respective situation of the beings who compose it - an intelligence sufficiently vast to submit these data to analysis - it would embrace in the same formula the movements of the greatest bodies of the universe and those of the lightest atom; for it, nothing would be uncertain and the future, as the past would be present to its eyes.

(Lap51, tradu¸c˜ao para o inglˆes de (Lap40))

A inteligˆencia vasta `a qual Laplace se refere ficou conhecida como o Demˆonio de La-place. Hoje em dia, com as descobertas de que as leis da mecˆanica quˆantica diferem das leis da mecˆanica Newtoniana e com o uso essencial das probabilidades nesta ciˆencia4,

v´arias cr´ıticas s˜ao feitas ao Determinismo Universal e s˜ao levantadas teses de que o uni-verso ´e indetermin´ıstico por natureza. Por´em, para Laplace, o universo era determin´ıstico e a probabilidade ´e um meio de medir a nossa ignorˆancia sobre o acontecimento de um evento que poderia ser determinado se tiv´essemos o conhecimento, as informa¸c˜oes e a capacidade de an´alise de seu demˆonio.

Deste modo, sem nenhuma evidˆencia que favore¸ca uma possibilidade em particular ou com evidˆencias que favore¸cam de maneira igual todas elas, a probabilidade de um evento ´e definida como a fra¸c˜ao em que o numerador ´e o n´umero de possibilidades que verificam este evento e o denominador ´e o n´umero total de casos poss´ıveis. Vemos que na

4K. R. Popper, em (Pop57), al´em de desenvolver sua interpreta¸ao propensista de probabilidade,

(19)

formula¸c˜ao cl´assica o c´alculo das probabilidades somente pode ser aplicado quando temos casos igualmente poss´ıveis. Assim, ao jogar um dado sobre o qual n˜ao temos nenhuma informa¸c˜ao adicional, n˜ao temos nenhum motivo para crer que uma face cair´a para cima em detrimento das outras e, ent˜ao, a probabilidade de cair uma face ´ımpar ´e de 36 = 12, pois h´a 3 casos em que a face do dado ´e ´ımpar e 6 possibilidades no total. Nas palavras de Laplace:

The theory of chance consists in reducing all the events of the same kind to a certain number of cases equally possible, that is to say, to such as we may be equally undecided about in regard to their existence, and in determining the number of cases favorable to the event whose probability is sought. The ratio of this number to that of all the cases possible is the measure of this probability, which is thus simply a fraction whose numerator is the number of favourable cases and whose denominator is the number of all the cases possible. (Lap51)

´

E imediato que esta formula¸c˜ao verifica os axiomas de Kolmogorov para o caso finito. Em nota¸c˜ao moderna, chamando o conjunto das possibilidades de Ω e identificando um evento com um subconjunto A ⊂ Ω, temos que a probabilidade do evento A ´e dada por:

P (A) = |A| |Ω|, em que |A| denota a cardinalidade do conjunto A.

Ainda, ao considerarmos outro evento B ⊂ Ω, se B 6= ∅, ent˜ao P (B) 6= 0 e podemos definir a probabilidade condicional por

P (A|B) = |A ∩ B| |B| . ´

E imediato tamb´em que esta defini¸c˜ao satisfaz o axioma da probabilidade condicional. A concep¸c˜ao cl´assica foi aceita por muito tempo. Em 1912, Markov publicou impor-tantes resultados, sobre as chamadas cadeias de Markov, em um texto que adotava a defini¸c˜ao cl´assica como fundamento de seus c´alculos. J´a sobre as cr´ıticas que surgiram a esta concep¸c˜ao, podemos destacar o fato dela n˜ao tratar da jogada de um dado viciado, por exemplo. Von Mises questiona:

But how are we to deal with the problem of a biased die by means of a theory which knows only probability based on a number of equally likely results? (VM57)

(20)

Laplace, por´em, se refere `a quest˜ao de uma moeda viciada em favor de uma das faces sem que saibamos qual delas. Por conta deste desconhecimento, a probabilidade cl´assica de cair cada uma das faces para cima em uma jogada ´e determinada.

But if there exist in the coin an inequality which causes one of the faces to appear rather than the other without knowing which side is favored by this inequality, the probability of throwing heads at the first throw will always be 12; because of our ignorance of which face is favored by the inequality the probability of the simple event is increased if this inequality is favorable to it, just so much as it is diminished if the inequality is contrary to it. (Lap51)

Percebemos claramente aqui que a interpreta¸c˜ao cl´assica n˜ao ´e do tipo objetiva, pois a probabilidade n˜ao ´e uma propriedade que se relaciona com os objetos (moedas, dados, etc), mas com a ignorˆancia do ser humano em rela¸c˜ao aos resultados poss´ıveis em um expe-rimento. Tamb´em pareceria estranho entendˆe-la como um tipo de probabilidade subjetiva, pois apesar de qualificar o conhecimento do ser humano, sua determina¸c˜ao n˜ao depende de um agente em particular, como na interpreta¸c˜ao subjetiva (que veremos ainda neste cap´ıtulo). Gillies (Gil00) contorna este inconveniente classificando as interpreta¸c˜oes das probabilidades em epistˆemicas, classe `a qual pertence a interpreta¸c˜ao cl´assica, e objetivas. Laplace chega, em algum momento, a tratar do exemplo de uma moeda viciada, para a qual a probabilidade de sair cara numa jogada ´e de 1+α2 e de sair coroa ´e de 1−α2 . Isto parece ir no caminho de indicar a existˆencia de uma probabilidade objetiva e desconhecida. Para Gillies (Gil00), isto ´e uma inconsistˆencia no trabalho de Laplace, em que seu c´alculo de probabilidades n˜ao representa seu posicionamento filos´ofico, evidenciando sua falta de compromisso com probabilidades objetivas.

1.3

A Probabilidade Frequentista

A ideia frequentista de probabilidade tem car´ater fortemente empirista e apareceu na metade do s´eculo XIX, na escola de Cambridge, com R. L. Ellis (Ell44) e J. Venn (Ven66). Mas, somente ficou famosa no s´eculo XX com as formula¸c˜oes mais sofisticadas de Reinchenbach (Rei49) e R. Von Mises (VM19; VM57; VM64), sendo esta ´ultima a que introduziremos nos pr´oximos par´agrafos.

O car´ater empirista das interpreta¸c˜oes frequentistas das probabilidades reside no enten-dimento da teoria como uma ciˆencia matem´atica an´aloga `a mecˆanica e `a geometria. Se por um lado, para a mecˆanica temos uma teoria que modela matematicamente os fenˆomenos observ´aveis do movimento e para a geometria, uma teoria que modela o espa¸co f´ısico,

(21)

por outro, para as probabilidades, Von Mises entende que estas tratam de outro tipo de fenˆomenos que podemos observar na natureza, a saber, os experimentos aleat´orios5. Deste modo, probabilidades s˜ao caracter´ısticas dos fenˆomenos que se repetem, independentes do observador destes fenˆomenos, dando assim a esta interpreta¸c˜ao o status de objetiva.

[...] just as the subject matter of geometry is the study of space phenomena, so probability theory deals with mass phenomena and repetitive events. (VM57, pref´acio da terceira edi¸c˜ao alem˜a)

Desta forma, n˜ao s˜ao associadas probabilidades a um determinado experimento, mas a um conjunto de experimentos de mesmo tipo. Para cumprir seu programa, Von Mi-ses chama de coletivo esta sequˆencia de experimentos uniformes, e prop˜oe observar um atributo, isto ´e, uma caracter´ıstica que pode variar, de cada um destes experimentos. Um exemplo de coletivo ´e o lan¸camento subsequente de uma moeda e o atributo a ser observado ´e o lado que cai para cima em cada lan¸camento (cara ou cora).

O conjunto dos atributos poss´ıveis foi chamado por ele de espa¸co de atributos e, na terminologia atual, ´e largamente conhecido por espa¸co amostral. Denotando os atributos cara por K e coroa por C, temos o espa¸co de atributos Ω = {K, C}. Para refinar nossos termos, admitiremos qualquer subconjunto de Ω como atributo e chamaremos, por exemplo, K e C de atributos elementares. No exemplo de um espa¸co de atributos Ω = {1, 2, 3, 4, 5, 6} das faces de um dado, podemos ter o atributo ´ımpar {1, 3, 5}.

Von Mises diferencia os conceitos de coletivo emp´ırico, que realmente existe e pode ser observado no mundo real, como o ato de jogar dez vezes uma moeda em sequˆencia em determinado tempo e lugar, e o conceito idealizado de coletivo matem´atico, uma sequˆencia infinita de experimentos. Esta sequˆencia hipot´etica de experimentos do coletivo matem´atico ´e, na verdade, um artif´ıcio t´ecnico que idealiza os fenˆomenos observados nas frequˆencias relativas.

Vejamos, ent˜ao, o que ´e uma frequˆencia relativa. Se, ao atributo A, relacionamos um coletivo emp´ırico C = {ω1, . . . , ωN} e denotamos por mn(A) a quantidade de vezes que

o atributo A foi verificado nos n primeiros experimentos de C, definimos a frequˆencia relativa de A por

f rnC(A) = mn(A) n .

5Preferimos traduzir o termo repetitive events por experimentos aleat´orios primeiro, pois j´a estamos

usando o termo evento para nomear possibilidades para as quais associamos valores de probabilidade em

um experimento e, segundo, pois nos parece ser este o termo empregado em portuguˆes

(22)

A partir da´ı, a lei testada empiricamente que leva ao conceito de coletivo matem´atico ´e o fato de que, quanto mais se aumenta a quantidade de elementos de um coletivo emp´ırico, mais a frequˆencia relativa do atributo em quest˜ao se aproxima de uma constante. Keynes (Key21) sugere dar a esta lei o nome de Lei da Estabilidade das Frequˆencias Estat´ısticas6.

E, assim, baseando-se nesta lei e munido da ideia de um coletivo matem´atico (infinito) C = {ω1, ω2, . . .}, Von Mises define a probabilidade do atributo A como

P (A) = lim n→∞f r C n(A) = limn→∞ m(A) n .

It is essential for the theory of probability that experience has shown that in the game of dice, as in all the other mass phenomena which we have mentioned, the relative frequencies of certain attributes become more and more stable as the number of observations is increased. (VM57)

Deste modo, com a defini¸c˜ao de probabilidade baseada em uma idealiza¸c˜ao, na pr´atica, uma probabilidade s´o pode ser aproximada atrav´es de um coletivo emp´ırico. Ent˜ao, para o desenvolvimento formal de sua teoria, Von Mises desenvolve uma axiomatiza¸c˜ao. Assim, para ele, as leis das probabilidades tamb´em s˜ao idealiza¸c˜oes das observa¸c˜oes emp´ıricas, como o conceito de coletivo matem´atico. Segue um dos axiomas da teoria frequentista em quest˜ao.

Axioma 1 (da Convergˆencia). Seja A um atributo arbitr´ario de um coletivo (matem´atico) C. Ent˜ao, existe o limite

lim

n→∞f r C n(A).

Von Mises ainda percebe a necessidade de outra lei natural que deve ser levada em conta em sua Teoria de Probabilidades: a aleatoriedade. O avan¸co que ele oferece `as ideias frequentistas ´e a observa¸c˜ao do fato de os coletivos n˜ao terem uma ordem. Por exemplo, em jogadas subsequentes de uma moeda, n˜ao termos a capacidade de prever qual ser´a o resultado dos lan¸camentos. A ideia intuitiva proposta por Von Mises consiste em relacionar a aleatoriedade com a falha dos sistemas de apostas, que consistem em receitas para apostar, como a seguinte: depois de trˆes caras em um lan¸camento de moeda, aposte que o pr´oximo ser´a coroa. Qualquer sistema deste tipo foi fadado ao fracasso.

The authors of such systems have all, sooner or later, had the sad experience of finding out that no system is able to improve their chances of winning in the long run, i.e., to affect the relative frequencies with which different colours

(23)

or numbers appear in a sequence selected from the total sequence of the game. (VM57)

A formaliza¸c˜ao axiom´atica da lei da aleatoriedade sobre coletivos foi proposta satisfa-toriamente por Church (Chu40), como uma aplica¸c˜ao da teoria das fun¸c˜oes recursivas7, teoria esta que ele mesmo ajudou a desenvolver.

Axioma 2 (da Aleatoriedade). Seja A um atributo arbitr´ario de um coletivo (matem´atico) C = {ω1, ω2, . . .}, para o qual

lim

n→∞f r C

n(A) = p.

Ent˜ao, para qualquer subsequˆencia C0 = {ωn1, ωn2, . . .} de C especificada por uma fun¸c˜ao recursiva, levando em conta as frequˆencias relativas calculadas nesta nova sequˆencia, te-mos

lim

j→∞f r C0

nj(A) = p.

Para finalizar a explana¸c˜ao da teoria de Von Mises, vejamos como definir probabi-lidades condicionais nela. A probabilidade condicional P (A|B) de um atributo A de um experimento, assumindo que o atributo B se verifica ´e definida naturalmente a par-tir da intui¸c˜ao que temos de probabilidade condicional. Seja C = {ω1, ω2, . . .} o

cole-tivo para o qual verificamos os atributos A e B. Selecionamos de C uma subsequˆencia CB = {ωn1, ωn2, . . .} somente dos experimentos em que se verifica o atributo B e, ent˜ao, levando em conta as frequˆencias relativas calculadas nesta nova sequˆencia, se P (B) 6= 0, podemos definir

P (A|B) = lim

j→∞f r CB

nj (A).

Para que esta defini¸c˜ao seja coerente ´e necess´ario garantir que CB seja um coletivo, ou

seja, que obede¸ca aos axiomas da convergˆencia e da aleatoriedade. Uma demonstra¸c˜ao deste fato est´a em (Gil00, 111).

A teoria de Von Mises tamb´em satisfaz os axiomas de Kolmogorov para o caso finito. Para o caso infinito, Von Mises prop˜oe mais tarde (VM64) adicionar um novo axioma aos dois j´a existentes. Isto resolve a quest˜ao de colocar sua teoria no patamar da axi-omatiza¸c˜ao amplamente aceita, por´em, para Gillies (Gil00, 110), esta estrat´egia mina a filosofia de formalizar a Teoria de Probabilidades idealizando as leis naturais verificadas empiricamente. Al´em disso, a defini¸c˜ao de probabilidade condicional apresentada satisfaz o axioma da probabilidade condicional (Gil00, 111).

Uma das cr´ıticas `a teoria de Von Mises j´a aparece na idealiza¸c˜ao do coletivo ma-tem´atico. At´e que ponto ´e leg´ıtima a representa¸c˜ao de coletivos emp´ıricos atrav´es de

(24)

coletivos matem´aticos? Von Mises responde a estas cr´ıticas com o argumento de que sua idealiza¸c˜ao ´e an´aloga `as idealiza¸c˜oes sobre o infinito feitas na mecˆanica e na geometria.

Attempts have been made to construct geometries in which no ‘infinitely nar-row’ lines exist but only those of definite width. The results were meagre because this method of treatment is much more difficult than the usual one. Moreover, a strip of definite width is only another abstraction no better than a straight line [...] (VM57)

Outra quest˜ao ´e o problema do caso ´unico: em muitas situa¸c˜oes importantes, para as quais gostar´ıamos de definir uma probabilidade, n˜ao ´e poss´ıvel definir nem um coletivo emp´ırico. Para Von Mises, sua teoria simplesmente n˜ao se aplica a estes casos.

Our probability theory has nothing to do with questions such as: “Is there a probability of Germany being at some time in the future involved in a war with Liberia?” (VM57)

Para Von Mises, a Teoria de Probabilidades se aplica somente aos experimentos que podem ser repetidos v´arias vezes, como fica expresso na m´axima: “Primeiro o coletivo, depois a probabilidade”8.

1.4

A Probabilidade Subjetiva

O conceito de probabilidade subjetiva nasce da identifica¸c˜ao de probabilidades com graus de cren¸ca. Nesta interpreta¸c˜ao, as probabilidades n˜ao s˜ao propriedades dos poss´ıveis eventos, mas uma grada¸c˜ao da cren¸ca que um agente (indiv´ıduo) tem na ocorrˆencia de um evento. ´E aceito tamb´em que diferentes pessoas, com a mesma capacidade de racioc´ınio e as mesmas evidˆencias, tenham um grau diferente de cren¸ca sobre a ocorrˆencia de um mesmo evento. Por isto, esta identifica¸c˜ao torna as probabilidades subjetivas.

Dentre as formula¸c˜oes com este vi´es, se destacam as de F. Ramsey (Ram31) e de De Finetti (DF30a; DF30b; DF30c; DF89; DF93), que foram propostas independentemente e, apesar de alguns pontos de discordˆancia, s˜ao muito pr´oximas.

O primeiro problema que surge na abordagem subjetiva ´e o de entender o que ´e e medir o grau de cren¸ca de um agente. Para Ramsey o grau de cren¸ca ´e um fenˆomeno psicol´ogico que poderia at´e ser medido com um aparelho:

[...] it is, I suppose, conceivable that degrees of belief could be measured by a psychogalvanometer or some such instrument [...] (Ram31)

(25)

Por´em, na falta de tal tecnologia, a proposta dos te´oricos em quest˜ao foi medir o grau de cren¸ca de um agente levando-o a fazer uma aposta. Deste modo, um oponente9 que fosse medir tal grandeza sobre um evento E deveria seguir o seguinte procedimento: convencer o agente a participar de uma aposta na qual ele deve escolher um n´umero q ∈ [0, 1], chamado de quociente de aposta, e, ent˜ao, tal oponente revela uma recompensa R ∈ R (note que este valor pode ser negativo). O valor que o agente paga para apostar ´e de qR e, se o evento E verificar ser o caso, o agente recebe R. ´E assumido tamb´em que o oponente proponha um valor |R| que seja pequeno em rela¸c˜ao `as posses do agente.

´

E importante que o agente n˜ao saiba de antem˜ao se R ´e positivo ou negativo para que o quociente de aposta escolhido reflita realmente o grau de cren¸ca que ele tem no evento E. Se ele soubesse que R > 0, seria vantajoso escolher um valor pequeno para q e vice versa. Por outro lado, sem esta informa¸c˜ao, n˜ao existe uma boa estrat´egia al´em de seguir o instinto. Nesta aposta, o papel do agente ´e mais evitar uma grande perda que vislumbrar um grande ganho.

Vejamos, na tabela a seguir, alguns exemplos de valores para q e R na aposta de um evento E, juntamente com o valor ganho pelo agente nos casos em que E for verdadeiro (coluna E) e em que E for falso (coluna ¬E). O ganho, no caso de acontecer o evento E, ´e dado por R − qR e, no caso de se verificar o evento ¬E, por −qR.

q R qR E ¬E 0 100 0 100 0 0 −100 0 −100 0 0, 2 100 20 80 −20 0, 2 −100 −20 −80 20 0, 5 100 50 50 −50 0, 5 −100 −50 −50 50 0, 8 100 80 20 −80 0, 8 −100 −80 −20 80 1 100 100 0 −100 1 −100 −100 0 100

Seguimos neste texto a abordagem dos primeiros trabalhos de De Finetti, em que as apostas s˜ao monet´arias. Ramsey segue por outro caminho, criando uma teoria da utilidade. O pr´oprio De Finetti acaba abandonando em seus ´ultimos trabalhos as apostas monet´arias, mas sua primeira abordagem continua sendo muito aceita na literatura.

E, ent˜ao, o quociente de aposta de um agente para um evento E ´e justamente a probabilidade P (E) deste evento, relembrando que as probabilidades, aqui, podem variar

9Em (Gil00), Gillies fala de um psic´ologo ao inv´es de um oponente, seguindo a linha de que o grau de

cren¸ca ´e um fenˆomeno psicol´ogico que, para Ramsey poderia ser medido. Preferimos o termo oponente,

(26)

de agente para agente e, at´e mesmo para um mesmo agente, pode variar com o tempo. Uma obje¸c˜ao que pode ser feita contra esta maneira de mensurar os graus de cren¸ca ´e que o quociente medido atrav´es de apostas ´e, no m´aximo, uma estimativa aproximada e n˜ao um valor num´erico exato. Para De Finetti, esta aproxima¸c˜ao n˜ao ´e um problema e at´e tem a virtude de facilitar os c´alculos, desde que n˜ao esque¸camos que ´e uma idealiza¸c˜ao da medida e a teoria matem´atica trabalhar´a na pr´atica, assim, com aproxima¸c˜oes.

[...] if you want to apply mathematics, you must act as though the measured magnitudes have precise values. This fiction is very fruitful, as everybody knows; the fact that it is only a fiction does not diminish its value as long as we bear in mind that the precision of the result will be what it will be. [...] To go, with the valid help of mathematics, from approximate premises to approximate conclusions, I must go by way of an exact algorithm, even though I consider it an artifice. (DF89)

Para definir probabilidades condicionais na interpreta¸c˜ao subjetiva usamos o conceito de quociente de apostas condicional : para um evento E, dado um evento F , ´e o quociente de aposta que o agente daria para o evento E, sendo que a aposta seria cancelada se o evento F n˜ao se verificasse. Se F n˜ao se verifica, o valor pago pelo agente e a recompensa paga pelo oponente s˜ao devolvidos. Este quociente ´e a probabilidade condicional P (E|F ). Resolvido o problema de medir a probabilidade subjetiva como um grau de cren¸ca, surge outra quest˜ao de grande importˆancia: n˜ao ´e imediato que as probabilidades de um agente satisfazem os axiomas de Kolmogorov. Na verdade, nem ´e de se esperar que um agente tenha quocientes de aposta t˜ao precisos que satisfa¸cam a teoria matem´atica. E da´ı chegamos ao surpreendente Teorema do Aposta holandesa.

Para tal, vamos introduzir a ideia de coerˆencia: quando um agente aposta em uma s´erie de eventos E1, E2, . . . , En, seus quocientes de aposta s˜ao ditos coerentes se, e somente

se, n˜ao existem respectivas recompensas R1, R2, . . . , Rn tais que o oponente sempre ganha

a aposta. Se existem tais recompensas, ´e dito que o oponente tem um Aposta holandesa10 contra o agente. ´E razo´avel esperar que nenhum agente deixe de ser coerente em suas apostas. Agora, podemos enunciar o resultado prometido.

Teorema 1.4.1 (Aposta holandesa). Um conjunto de quocientes de aposta ´e coerente se, e somente se, eles satisfazem os axiomas de Kolmogorov para o caso finito.

(27)

Este resultado11, demonstrado em (Gil00, 60), deixa patente a validade da

inter-preta¸c˜ao subjetiva da teoria matem´atica das probabilidades. No entanto, algumas ob-serva¸c˜oes devem ser feitas. A primeira ´e que De Finetti n˜ao usa exatamente a axiom´atica de Kolmogorov, mas, sim, uma vers˜ao dela que utiliza a defini¸c˜ao de fun¸c˜ao de probabi-lidade sobre a linguagem proposicional cl´assica ao inv´es de uma ´algebra. Introduziremos esta outra vers˜ao da axiomatiza¸c˜ao na Se¸c˜ao 2.2.

A outra observa¸c˜ao ´e o fato de a interpreta¸c˜ao subjetiva n˜ao satisfazer o caso infinito da teoria de Kolmogorov. Por´em, diferente de Von Mises, De Finetti n˜ao vˆe isto como um problema e nem tenta contorn´a-lo. Para ele, o caso infinito ´e s´o uma quest˜ao de conveniˆencia matem´atica, mas que n˜ao se justifica em seu conceito de probabilidade.

Its success owes much to the mathematical convenience of making the calculus of probability merely a translation of modern measure theory. [...] No-one has given a real justification of countable additivity (other than just taking it as a ‘natural extension’ of finite additivity). (DF74)

Para finalizar, vejamos, na tabela abaixo, um exemplo de conjunto n˜ao-coerente de quocientes de aposta.

Eventos q R qR R − qR

A ∧ ¬B ∧ ¬C 0, 5 10 5 5 ¬A ∧ B ∧ ¬C 0, 3 10 3 7 ¬A ∧ ¬B ∧ C 0, 3 10 3 7

Deve-se notar que somente uma das senten¸cas que representam eventos acima pode ser verdadeira e, ent˜ao, o valor m´aximo que o agente pode ganhar neste conjunto de quocientes ´e 7. Por outro lado, com as recompensas dadas, todo o conjunto de quocientes tem o pre¸co de 11. Neste caso, o oponente tem um Aposta holandesa contra o agente e ganha as apostas em qualquer situa¸c˜ao. Como declara o Teorema do Aposta holandesa, este conjunto de quocientes n˜ao respeita os axiomas de Kolmogorov, como pode ser verificado a partir das observa¸c˜oes sobre descri¸c˜oes de estado que veremos na Se¸c˜ao 2.4.

1.5

A Probabilidade L´

ogica, a quest˜

ao da indu¸

ao e

as l´

ogicas indutivas

Nesta se¸c˜ao, trataremos de uma interpreta¸c˜ao um pouco diferente, para a qual a probabilidade condicional tem um papel de maior destaque do que a probabilidade de um

11Um dos sentidos da implica¸c˜ao do Teorema do Aposta holandesa, o que diz que se os axiomas de

Kolmogorov s˜ao respeitados, o conjunto de quocientes de aposta ´e coerente (n˜ao h´a Aposta holandesa),

foi demonstrado por De Finetti em (DF74). O outro sentido da implica¸c˜ao, mais sutil, foi provado por

(28)

´

unico evento, diferente das interpreta¸c˜oes que vimos at´e agora.

A interpreta¸c˜ao l´ogica12, assim como a interpreta¸c˜ao cl´assica, relaciona probabilidade com o leque de possibilidades do que se analisa. Mas, diferente dela, n˜ao assume ausˆencia nem simetria de evidˆencias, admitindo que as possibilidades possam ter pesos diferentes. Desse modo, a probabilidade de uma hip´otese H ´e medida levando-se em conta a evidˆencia E que se tem, fazendo uso da ideia de probabilidade condicional.

Uma probabilidade ser´a entendida como o grau de confirma¸c˜ao que uma evidˆencia E d´a a uma hip´otese H. Esta interpreta¸c˜ao culminar´a em uma generaliza¸c˜ao do con-ceito de implica¸c˜ao l´ogica e determinar´a uma estrutura para o racioc´ınio indutivo. No momento, vamos nos ater `a exposi¸c˜ao da interpreta¸c˜ao l´ogica e mais tarde voltaremos a estas quest˜oes.

Frisamos que nesta se¸c˜ao apresentamos a concep¸c˜ao contemporˆanea da probabilidade l´ogica, mas as liga¸c˜oes entre l´ogica e probabilidades j´a aparece em outros autores, como Leibniz e Boole, conforme comentado na Se¸c˜ao 1.1.

A interpreta¸c˜ao l´ogica de probabilidade no sentido contemporˆaneo come¸cou a ser de-senvolvida nas primeiras d´ecadas do s´eculo XX, principalmente em Cambridge, por Key-nes (Key21) e Jeffreys (Jef39). Na d´ecada de 1950, Carnap tomou partido desta linha e ofereceu uma formula¸c˜ao sistem´atica (Car50) para a teoria. Nossa referˆencia para a formula¸c˜ao de Carnap, estudada a seguir, ´e (H´aj12).

Carnap, assim como De Finetti, define suas probabilidades sobre uma linguagem for-mal. Por´em, n˜ao sobre a linguagem proposicional, mas sobre uma linguagem de primeira ordem13 com uma quantidade finita de s´ımbolos de predicados mon´adicos e uma

quanti-dade enumer´avel de constantes individuais.

Nesta linguagem, de acordo com seu poder de express˜ao, podemos descrever comple-tamente uma constante por uma conjun¸c˜ao de todos os s´ımbolos de predicado, cada um destes podendo estar negado ou n˜ao, aplicados sobre esta constante. E, ent˜ao, chamamos de descri¸c˜ao de estado uma conjun¸c˜ao de f´ormulas deste tipo, que descreve completamente cada uma delas, para todas as constantes da linguagem.

Utilizemos, como exemplo, a linguagem com um ´unico s´ımbolo de predicado mon´adico F e com as constantes a, b e c. Nesta linguagem, cada constante ´e descrita completamente por f´ormulas do tipo F a, ¬F a, ¬F b, F c, etc. E as descri¸c˜oes de estado que levam em considera¸c˜ao todas as constantes s˜ao:

12As express˜oes interpreta¸ao l´ogica e probabilidade l´ogica, no t´ıtulo da se¸ao, s˜ao tradu¸oes nossas de

logical interpretation e logical probability, que aparecem em (H´aj12).

(29)

1. F a ∧ F b ∧ F c; 2. ¬F a ∧ F b ∧ F c; 3. ¬F a ∧ ¬F b ∧ F c; 4. ¬F a ∧ ¬F b ∧ ¬F c; 5. F a ∧ ¬F b ∧ ¬F c; 6. F a ∧ F b ∧ ¬F c; 7. F a ∧ ¬F b ∧ F c; 8. ¬F a ∧ F b ∧ ¬F c.

Carnap, ent˜ao, associa probabilidades a cada uma destas descri¸c˜oes de estado atrav´es de uma fun¸c˜ao m, que ele chama de medida de probabilidade. A medida de probabilidade pode ser estendida para qualquer f´ormula da linguagem que seja composta pelas f´ormulas atˆomicas que constituem as descri¸c˜oes de estado sobre `as quais a medida foi definida. Abusando da nota¸c˜ao, tamb´em chamaremos a extens˜ao de m.

O conceito de medida de probabilidade ´e an´alogo14ao de distribui¸ao de probabilidade

que introduziremos no Cap´ıtulo 2, em que tratamos da quest˜ao da extens˜ao para as outras f´ormulas. ´E importante observar que, tanto a medida m, quanto sua extens˜ao, satisfazem a vers˜ao para linguagem formal dos axiomas de Kolmogorov para o caso finito. Portanto, com o mapeamento que veremos na Se¸c˜ao 2.3, a interpreta¸c˜ao l´ogica oferece uma interpreta¸c˜ao de uma instˆancia da teoria de Kolmogorov.

Agora, Carnap pode definir a fun¸c˜ao de confirma¸c˜ao de uma hip´otese H dada uma evidˆencia E, que denotaremos por c(H, E) utilizando a vers˜ao para linguagem formal da defini¸c˜ao de probabilidade condicional:

c(H, E) = m(H ∧ E) m(E) .

Chegamos a um ponto crucial da teoria de Carnap. Apesar de existirem v´arias poss´ıveis medidas m, ele advoga em favor de uma espec´ıfica, denotada por m∗. Vere-mos como defini-la e, depois, por que ela ´e escolhida por Carnap.

Primeiro, vamos chamar de descri¸c˜ao de estrutura os conjuntos maximais de descri¸c˜oes de estado de nossa linguagem nos quais cada descri¸c˜ao de estado pode ser obtida de uma outra deste conjunto por uma permuta¸c˜ao das constantes. Utilizando a numera¸c˜ao do exemplo que estamos seguindo para nos referir `as descri¸c˜oes de estado, temos as descri¸c˜oes de estrutura:

• {1} - tudo satisfaz F ;

14As medidas de probabilidade s˜ao definidas sobre uma linguagem de primeira ordem enquanto as

distribui¸c˜oes s˜ao definidas sobre a linguagem proposicional. Para fazer a analogia, basta entender cada

f´ormula atˆomica fechada de primeira ordem (e.g., F a) como uma f´ormula atˆomica proposicional (e.g.,

A), de modo que para f´ormulas atˆomicas de primeira ordem diferentes devem ser associadas f´ormulas

atˆomicas proposicionais diferentes. Assim, podemos, por exemplo, associar a F a, F b e F c as f´ormulas A,

(30)

• {2, 6, 7} - um ¬F e dois F ; • {3, 5, 8} - dois ¬F e um F ; • {4} - tudo satisfaz ¬F .

E, ent˜ao, a medida m∗ ´e definida do seguinte modo: seja p o valor de 1 dividido pela quantidade de descri¸c˜oes de estrutura (no nosso exemplo, p = 14). Assim, a medida m∗ de uma descri¸c˜ao de estado ´e o valor de p dividido pela quantidade de elementos da descri¸c˜ao de estrutura `a qual esta descri¸c˜ao de estado pertence. Dessa forma, no exemplo:

• m∗(1) = m(4) = p 1 = 1 4; • m∗(2) = m(3) = m(5) = m(6) = m(7) = m(8) = p 3 = 1 12.

Note que a medida m∗favorece as descri¸c˜oes de estado mais homogˆeneas. Por exemplo, a descri¸c˜ao de estado F a∧F b∧F c, em que todas as constantes satisfazem a propriedade F , tem uma medida maior do que as descri¸c˜oes de estado menos homogˆeneas (em que algumas constantes possuem a propriedade e outras n˜ao). O mesmo ocorre com ¬F a ∧ ¬F b ∧ ¬F c. Antes de analisar os motivos que levaram Carnap a eleger a medida m∗, vamos observar que nesta interpreta¸c˜ao l´ogica, a probabilidade da hip´otese H ´e unicamente determinada pela evidˆencia E por qualquer agente racional, o que exclui esta teoria da classifica¸c˜ao subjetiva. Al´em disso, a probabilidade aqui n˜ao ´e medida atrav´es de experiˆencias e, portanto, n˜ao ´e uma caracter´ıstica dos fenˆomenos, n˜ao ´e objetiva. Da mesma forma que a probabilidade cl´assica, a probabilidade l´ogica ´e uma medida de incerteza baseada em evidˆencias.

Vejamos, ent˜ao, o que faz de m∗ uma medida especial. Ela ´e uma medida que faz com que a fun¸c˜ao de confirma¸c˜ao c∗ que ela induz leve em considera¸c˜ao o aprendizado com a experiˆencia. No nosso exemplo, temos que a probabilidade15a priori de F a ´e m(F a) = 1

2.

Agora, se soubermos que F b ´e o caso, intuitivamente, temos uma evidˆencia que corrobora com a hip´otese F a e o grau de confirma¸c˜ao ´e, de fato, maior: c∗(F a, F b) = 23. Al´em disso, se soubermos que F c tamb´em ´e o caso, temos ainda que c∗(F a, F b ∧ F c) = 34.

Uma cr´ıtica que se faz `a abordagem de Carnap ´e que m∗ n˜ao ´e a ´unica medida que faz com que o grau de confirma¸c˜ao aprenda com a experiˆencia, mas v´arias outras medidas levam a fun¸c˜oes de confirma¸c˜ao com esta caracter´ıstica. No entanto, m∗ parece ser a mais simples e natural. Esta caracter´ıstica de m∗´e justamente o que leva a interpreta¸c˜ao l´ogica a generalizar o conceito de implica¸c˜ao l´ogica e a tratar a indu¸c˜ao.

15Como j´a dissemos, no Cap´ıtulo 2 abordamos a quest˜ao da extens˜ao da medida de probabilidade e,

(31)

A indu¸c˜ao ´e um modo de inferˆencia largamente usado no dia-a-dia e nas ciˆencias. Um t´ıpico exemplo de indu¸c˜ao ´e o racioc´ınio que toma como premissas: “O primeiro cisne que vi ´e branco”, “O segundo cisne que vi ´e branco”, . . . , “O mil´esimo cisne que vi ´e branco” e, disso, infere: “Todos os cisnes s˜ao brancos”. Esta inferˆencia, apesar de parecer razo´avel, n˜ao ´e v´alida na l´ogica cl´assica e a quest˜ao que aparece ´e a de justificar este tipo de racioc´ınio.

Para D. Hume (1711-1776), o conhecido fil´osofo c´etico escocˆes, este racioc´ınio ´e in-justific´avel e n˜ao passa de uma ilus˜ao irracional (Hum88). N. C. A. da Costa coloca o problema.

O problema central de indu¸c˜ao, dentro de nossa posi¸c˜ao, consiste em se en-contrar alguma forma de justifica¸c˜ao de todos os tipos de indu¸c˜ao correta, porquanto todos eles se utilizam ou podem ser utilizados em ciˆencia. (dC93b) V´arias foram as tentativas de justificar a indu¸c˜ao e N. C. A. da Costa, ap´os sentenciar que, at´e aquele momento, “Todas as tentativas de solu¸c˜ao do problema de se justificar a inferˆencia indutiva falharam” (dC93b), prop˜oe algumas justificativas (dC93b) que admite, tamb´em, serem limitadas.

No entanto, o simples abandono do racioc´ınio indutivo ´e um tanto problem´atico devido a sua utilidade. Neste caso, h´a a necessidade da investiga¸c˜ao da estrutura da indu¸c˜ao sendo este o objetivo das l´ogicas indutivas, sistemas que fazem uso das probabilidades.

Como a l´ogica dedutiva n˜ao precisa legitimar a dedu¸c˜ao para ent˜ao estud´a-la, o mesmo ocorrer´a com a l´ogica indutiva e a opera¸c˜ao de indu¸c˜ao. (dC93b)

N˜ao ´e nosso objetivo aqui aprofundar sobre a quest˜ao da indu¸c˜ao, mas observar que a interpreta¸c˜ao de Carnap das probabilidades tinha o objetivo de demarcar crit´erios para este tipo de inferˆencia, como fica claro com o fato da fun¸c˜ao de confirma¸c˜ao c∗ aprender com a experiˆencia. E assim, o conceito de implica¸c˜ao l´ogica ´e generalizado ao entendermos que c∗(H, E) determina um grau de implica¸c˜ao da evidˆencia E para a hip´otese H.

O pr´oprio N. C. A. da Costa esbo¸ca um sistema de l´ogica indutiva baseado no que ele chama de teoria pragm´atica da probabilidade, que seria uma interpreta¸c˜ao das proba-bilidades combinando aspectos das interpreta¸c˜oes subjetivas e das interpreta¸c˜oes l´ogicas. Em suas palavras, “[a probabilidade pragm´atica] expressa nosso grau de confian¸ca na con-veniˆencia e oportunidade de se admitir uma proposi¸c˜ao como hip´otese, com a finalidade de ser testada e criticada” (dC93b).

Para finalizar, lembramos que o principal objeto de estudo deste trabalho ´e uma semˆantica probabil´ıstica, que levar´a `as defini¸c˜oes de algumas rela¸c˜oes de consequˆencia

(32)

na linguagem proposicional e, por assim dizer, de algumas l´ogicas probabil´ısticas. Reco-nhecemos que podem haver rela¸c˜oes entre os sistemas que estudamos e os sistemas de l´ogica indutiva. Por´em, nossa preocupa¸c˜ao n˜ao ´e a argumenta¸c˜ao indutiva, ao contr´ario, entendemos que o tipo de inferˆencia que tratamos est´a intimamente ligado com a in-ferˆencia dedutiva. Mais especificamente, com a quest˜ao de tratar a dedu¸c˜ao em cen´arios em que prevalece a incerteza das informa¸c˜oes (premissas), como tentamos explicitar a partir do pr´oximo cap´ıtulo.

1.6

A Probabilidade Propensista

Nesta ´ultima se¸c˜ao, voltamos a expor uma interpreta¸c˜ao objetiva da Teoria de Proba-bilidades. A interpreta¸c˜ao propensista surge com o fil´osofo da ciˆencia K. R. Popper com objetivo de tratar o problema do caso ´unico enfrentado pelas interpreta¸c˜oes objetivas, como comentado na Se¸c˜ao 1.3.

A primeira interpreta¸c˜ao defendida por Popper, em (Pop35), foi uma vers˜ao fre-quentista abandonada posteriormente em favor de sua interpreta¸c˜ao propensista. Mas j´a nesta primeira empreitada, Popper deixa expl´ıcita sua preocupa¸c˜ao em propor uma interpreta¸c˜ao objetiva que trate de casos ´unicos, diferente da interpreta¸c˜ao de Von Mises, por necessidade da f´ısica moderna.

Ideas involving the theory of probability play a decisive part in modern physics. Yet we still lack a satisfactory, consistent definition of probability; or, what amounts to much the same, we still lack a satisfactory axiomatic system for the calculus of probability.

(Pop59a, tradu¸c˜ao para o inglˆes de (Pop35))

My hope is that these investigations will help to relieve the present unsatis-factory situation in which physicists make much use of probabilities without being able to say, consistently, what they mean by ‘probability’. (Pop59a)

H´a uma classe extensa e difusa de propostas propensistas de interpreta¸c˜oes, por´em vamos nos ater `a proposta de Popper, que tamb´em sofreu mudan¸cas de acordo com o amadurecimento de suas ideias. Popper introduz a interpreta¸c˜ao propensista em (Pop57) e a desenvolve em escritos sequentes (Pop59b; Pop83; Pop90).

Para resolver a quest˜ao da probabilidade objetiva do caso ´unico, Popper faz uma “pequena” mudan¸ca, podendo at´e ser entendida como uma restri¸c˜ao, no papel que o conceito de coletivo de Von Mises desempenha na defini¸c˜ao das probabilidades. Mas

(33)

antes de introduzir a ideia de propens˜ao, vejamos um exemplo de coletivo em que a teoria de Von Mises descarta a probabilidade do caso ´unico. Imagine um coletivo formado por homens brasileiros. A probabilidade do atributo “morrer antes dos 41 anos” pode ser aproximada pela frequˆencia relativa deste atributo em rela¸c˜ao ao coletivo estabelecido. Por´em, a probabilidade de um certo homem em particular nesta sequˆencia viver mais de 41 anos n˜ao pode ser calculada.

We can say nothing about the probability of death of an individual, even if we know his condition of life and health in detail. The phrase ‘probability of death’, when it refers to a single person has no meaning at all for us. This is one of the most important consequences of our definition of probability. (VM57)

Popper chega a sugerir que esta probabilidade ´e a pr´opria frequˆencia relativa do atri-buto no coletivo, mas ele mesmo, mais tarde, contra-argumenta esta tese (Pop57; Pop59b). Estas investiga¸c˜oes levam Popper a associar valores de probabilidades partindo, ao inv´es de coletivos, de condi¸c˜oes geradoras de experimentos repetidos.

All this means that the frequency theorist is forced to introduce a modifi-cation of his theory - apparently a very slight one. He will now say that an admissible sequence of events (a reference sequence, a ‘collective’) must always be a sequence of repeated experiments. Or more generally, he will say that admissible sequences must be either virtual or actual sequences which are characterized by a set of generating conditions - by a set of conditions whose repeated realisation produces the elements of the sequences. (Pop59b)

E, ent˜ao, em sua primeira formula¸c˜ao da interpreta¸c˜ao propensista, Popper asserta que as condi¸c˜oes geradoras s˜ao dotadas de uma tendˆencia, uma disposi¸c˜ao, uma propens˜ao a gerar sequˆencias cujas frequˆencias relativas s˜ao probabilidades se o experimento for repetido segundo estas condi¸c˜oes.

[...] we have to visualise the conditions as endowed with a tendency or dis-position, or propensity, to produce sequences whose frequencies are equal to the probabilities; which is precisely what the propensity interpretation asserts. (Pop59b)

Com a vis˜ao de Popper n˜ao ´e mais necess´ario, para falar de probabilidades objeti-vamente, que um experimento seja repetido v´arias vezes. Mas ´e poss´ıvel, por exemplo,

(34)

postular probabilidades sobre condi¸c˜oes geradoras que sejam realizadas, de fato, uma ´

unica vez.

O chamado problema da classe de referˆencia, abordado por A. J. Ayer em (Aye63), afeta esta interpreta¸c˜ao. Ao estabelecer probabilidades a partir de condi¸c˜oes geradoras, n˜ao relacionamos valores de probabilidade a um evento em si, mas `as condi¸c˜oes geradoras de um experimento das quais o experimento ´e somente uma instˆancia.

Desta forma, ao tentar estabelecer a probabilidade de um homem particular morrer antes de completar 41 anos, temos o problema de definir as condi¸c˜oes geradoras que definem este homem particular como: “ser homem”, ou “ser homem brasileiro” ou, mais particularmente, “ser homem brasileiro que fuma dois ma¸cos de cigarro diariamente”.

Conforme Popper desenvolve sua interpreta¸c˜ao propensista, ele muda o significado de propens˜ao como a propriedade de condi¸c˜oes geradoras a gerar frequˆencias relativas para a propriedade de uma situa¸c˜ao f´ısica em um determinado momento.

[...] propensities in physics are properties of the whole physical situation and sometimes of the particular way in which a situation changes. (Pop90)

D. W. Miller, que tamb´em desenvolve este posicionamento tardio de Popper (Mil94; Mil96), coloca sobre a transi¸c˜ao:

In the propensity interpretation, the probability of an outcome is not a mea-sure of any frequency, but (as will be explained) a meamea-sure of the inclination of the current state of affairs to realize that outcome. (Mil94)

Como Gillies critica (Gil00, 127), nesta nova vers˜ao propensista n˜ao ´e poss´ıvel testar uma associa¸c˜ao de propens˜ao a um evento devido o car´ater ´unico e n˜ao repet´ıvel de um estado f´ısico, diferente da primeira vers˜ao em que a propens˜ao ´e relacionada `as frequˆencias relativas. Por´em, o pr´oprio Miller admite esta limita¸c˜ao.

The propensity interpretation of probability is inescapably metaphysical, not only because many propensities are postulated that are not open to empirical evaluation [...] (Mil96)

Diferente da maioria dos te´oricos vistos neste cap´ıtulo, Popper n˜ao se preocupa em que sua interpreta¸c˜ao valide o sistema de Kolmogorov. Pelo, contr´ario, Popper axioma-tizou v´arios c´alculos de probabilidade em seu trabalho. Miller destaca em (Mil) algumas axiom´aticas alternativas `a de Kolmogorov para a Teoria de Probabilidades como outras

(35)

das contribui¸c˜oes de Popper no estudo das probabilidades. Alguns destes sistemas jun-tamente com outros propostos por Popper e Miller em conjunto, est˜ao sumarizados em (Mil04).

´

E interessante notar, baseado nos sistemas propostos por Popper, sua preferˆencia em tomar como termo primitivo probabilidades condicionais ao inv´es de probabilidades absolutas. Tamb´em ´e interessante Popper entender que um sistema axiom´atico deve ser satisfeito por todas as interpreta¸c˜oes propostas. Por isto, em (Pop59b), ele defende que em um desenvolvimento formal, n˜ao se deve assumir nada sobre a natureza dos objetos aos quais s˜ao associados valores de probabilidades. Neste contexto, Popper critica o c´alculo de Kolmogorov por assumir que estes objetos sejam conjuntos.

Finalizamos nossa breve introdu¸c˜ao `a Teoria de Probabilidades e `as suas principais interpreta¸c˜oes. No pr´oximo cap´ıtulo, seguimos introduzindo a semˆantica probabil´ıstica e j´a come¸camos a investigar rela¸c˜oes de consequˆencia, tanto cl´assicas como probabil´ısticas, a partir desta semˆantica.

(36)

Semˆ

antica Probabil´ıstica e

Propaga¸

ao de Incerteza

Neste cap´ıtulo, vamos aprofundar a discuss˜ao a respeito do racioc´ınio sob incerteza. Partindo da l´ogica proposicional cl´assica, da linguagem proposicional e da semˆantica bi-valorada, definimos uma semˆantica probabil´ıstica e estudamos como as incertezas sobre senten¸cas, representadas pelas probabilidades associadas a elas, se propagam das pre-missas para a conclus˜ao em uma inferˆencia. Para isto, vamos introduzir a Teoria de Probabilidades partindo da linguagem proposicional.

2.1

Racioc´ınio sob incerteza

O Sistema de L´ogica Proposicional Cl´assica (LPC) ´e uma poderosa ferramenta de inferˆencia que tem a pretens˜ao de descrever, segundo alguns, ou normatizar, segundo outros, o racioc´ınio comum. Seu estudo pode ser motivado por diversas aplica¸c˜oes que chegam at´e aos campos mais pr´aticos, como, por exemplo, o estudo de circuitos el´etricos. Por´em, h´a uma caracter´ıstica de LPC (e da l´ogica cl´assica como um todo) que pode nos motivar a analisar sua linguagem de um ponto de vista probabil´ıstico: a idealiza¸c˜ao da certeza absoluta sobre o valor de verdade das senten¸cas.

O c´etico D. Hume chega ao ponto de n˜ao aceitar a possibilidade de certeza racional sobre quest˜oes que ainda se apresentam no futuro (Hum88). Por´em, assumindo uma postura n˜ao c´etica quanto ao futuro, podemos aceitar algum grau de certeza sobre tais fatos. Como, por exemplo, quando, com base nas experiˆencias de vida, olhamos de manh˜a para o c´eu nublado e nos atentamos para uma sens´ıvel queda de temperatura e, por isso, conclu´ımos que existe uma grande chance de chover durante o dia. Mesmo que n˜ao tenhamos certeza absoluta sobre este fato, este alto grau de certeza pode fazer a diferen¸ca entre levarmos ou n˜ao um guarda-chuvas ao sairmos de casa pela manh˜a. E, mesmo que n˜ao chova, muitos v˜ao concordar que esta decis˜ao foi acertada. Afinal de contas, um

(37)

homem prevenido vale por dois!

E j´a que parece que a an´alise das senten¸cas no dia-a-dia ´e feita atribuindo-lhes graus de certeza, nos atentamos ao fato de que estas inferˆencias n˜ao tˆem incidˆencia sobre senten¸cas com valor de verdade bem determinado, mas sobre senten¸cas que possuem certo grau de certeza. Assim, parece natural que concordemos que a seguinte inferˆencia ´e bastante vi´avel e ´util, mesmo sem termos certeza sobre a verdade das premissas:

• Premissa 1. Se houver, pela manh˜a, presen¸ca de grandes nuvens tipo cumulus, chover´a durante o dia;

• Premissa 2. H´a presen¸ca de grandes nuvens tipo cumulus esta manh˜a; • Conclus˜ao. Chover´a durante o dia.

Por´em, apesar de natural e usual, ao abrirmos m˜ao da idealiza¸c˜ao da l´ogica cl´assica para podermos descrever os fenˆomenos do racioc´ınio do dia-a-dia, abrimos caminho para que poss´ıveis problemas apare¸cam, como podemos notar no Paradoxo da Loteria (Kyb61). Imagine uma loteria justa com mil bilhetes numerados - 1, 2, 3, . . . , 1000 - em que um destes bilhetes ser´a sorteado. As chances de uma proposi¸c˜ao do tipo “O bilhete de n´umero 484 n˜ao ser´a sorteado” ser verdadeira ´e de 999 : 1 (ou 1000999). Com chances t˜ao grandes ´e natural tomarmos esta senten¸ca por premissa em alguma inferˆencia. E ent˜ao, podemos tomar por premissa qualquer senten¸ca do tipo:

An: “O bilhete de n´umero n n˜ao ser´a sorteado.” n = 1, 2, 3, . . . , 1000)

Podemos, portanto, tomar todas estas mil senten¸cas (A1, . . . , A1000) como premissas e

inferirmos, por LPC, a senten¸ca

A1∧ · · · ∧ A1000,

que juntamente com o fato de que um dos bilhetes ser´a sorteado, gera uma contradi¸c˜ao. Este paradoxo ´e creditado a assumirmos trˆes princ´ıpios do racioc´ınio (Kva98):

• Existe um limiar da certeza a partir do qual ´e racional aceitar uma senten¸ca como justificada;

• Um conjunto de senten¸cas aceitas como justificadas ´e dedutivamente fechado. Ou seja, este conjunto cont´em todas as dedu¸c˜oes feitas a partir de senten¸cas dele; • N˜ao ´e poss´ıvel, para o mesmo indiv´ıduo ao mesmo tempo, aceitar como justificadas

Referências

Documentos relacionados

consequência lógica das quatro premissas Sócrates é um homem, Todos os homens são mortais, Nenhum mortal vive para sempre, Todos os que. virão a morrer às vezes preocupam-se

[17] se concetre mais na determina¸c˜ ao autom´ atica de semelhan¸cas semˆ anticas entre palavras, ele utilizam uma rede semˆ antica extra´ıda a partir do vocabul´ ario fechado

Logo, o problema de se saber todos os valores verdades de uma f´ ormula na l´ ogica cl´ assica proposicional, para todas as atribui¸c˜ oes v a seus s´ımbolos proposicionais, ´

Desse modo, atribuindo valores de verdade as variáveis proposicionais podemos obter o valor de verdade duma fórmula.. Podemos utilizar tabelas de verdade para olhar como podem

• Na aula de hoje: terceira ´ area da semˆ antica: objetivo de desenvolver t´ ecnicas para expressar a semˆ antica de linguagens utilizadas para programa¸c˜ ao

O benefício terá natureza indenizatória mesmo se concedido em numerário, cartão benefício ou similar, não terá natureza salarial, não integrará a remuneração, e não

Este ano, esperamos mais saúde para todos, mais trabalho e por consequência, mais dinheiro no bolso de cada um de nossos associados.. Que possamos continuar superando

Uma das principais diferenças entre o sistema convencional de cultivo e os sistemas conservacionaistas, como o cultivo mínimo e o plantio direto, é a ocorrência de maior