A teoria de Savage - Tomando decisões reais

3. Tomando decisões reais

3.1 A teoria de Savage

A teoria da decisão de Leonard Savage, como apresentada em seu (1954) The Foundations of Statistics, é sem dúvida a mais conhecida teoria normativa de escolha sob incerteza; em particular dentro da economia e das ciências da decisão.

No livro, Savage apresenta um conjunto de axiomas que restringem as preferências sobre um conjunto de opções, garantindo a existência de um par de funções de probabilidade e utilidade em relação ao qual as preferências podem ser representadas como maximização da utilidade esperada. Quase três décadas antes da publicação do livro, Frank P. Ramsey (1926) havia proposto que um conjunto diferente de axiomas poderia gerar mais ou menos o mesmo resultado. No entanto, a teoria de Savage tem sido muito mais influente que a de Ramsey, talvez porque Ramsey não deu uma prova completa de seu resultado, nem forneceu muitos detalhes de como esta seria (BRADLEY, 2004). O resultado de Savage não será descrito aqui em todos os seus detalhes. Entretanto, os ingredientes e a estrutura de seu teorema serão expostos destacando seus pontos fortes e fracos.

As opções ou prospectos na teoria de Savage são semelhantes às loterias, exceto que os possíveis resultados não vêm com chances objetivas, mas dependem de se um determinado estado de coisas do mundo é real. De fato, os elementos primitivos na teoria de Savage são resultados¹⁰ e estados (do mundo). Os primeiros são os bons ou maus estados de coisas que, em última análise, afetam e importam para um agente, enquanto os segundos são as características do mundo sobre as quais o agente não tem controle e que são o locus de sua incerteza sobre o mundo.

Conjuntos de estados são chamados de eventos. Esta distinção entre resultados e estados serve para separar claramente desejo e crença: os primeiros são, de acordo com a teoria de Savage, o alvo do desejo, enquanto os segundos são o alvo da crença.

As opções semelhantes a loterias sobre as quais o agente tem preferências são um rico conjunto de atos que efetivamente equivalem a todas as possíveis atribuições de resultados aos estados do mundo. Ou seja, os “atos” são funções do espaço de estados para o espaço de resultados, e a ordenação de preferências do agente é considerada como definida sobre todas essas possíveis funções. Alguns desses “atos” parecerão bastante sensatos: considere o ato que atribui ao evento

11 Este problema de atos sem sentido é considerado por alguns o principal problema com o resultado de Savage (vide JOYCE, 1999, p. 108). Levantamos essa questão novamente abaixo quando discutimos os pontos fracos da teoria de Savage.

"chove" o resultado "passeio molhado e miserável" e atribui ao evento "não chove"

o resultado "passeio muito confortável". Este é aparentemente o ato de dar um passeio sem o guardachuva. Outros atos de Savage não parecerão tão sensatos, como o ato constante que atribui ao evento "chove" e "não chove" o mesmo resultado

"passeio molhado e miserável" (note que os atos constantes proporcionam uma forma de incluir resultados seguros dentro da ordenação de preferência). O problema com este ato (e muitos outros) é que ele não corresponde a nada que um agente poderia, sequer em princípio, optar por fazer ou executar¹¹.

A distinção de Savage entre ato/estado(evento)/resultado pode ser naturalmente representada em forma de tabela, com linhas servindo como atos que produzem um determinado resultado para cada coluna de estado/evento. A Tabela 2 mostra os dois atos mencionados acima, mais um terceiro com que o tomador de decisão pode se importar: os atos i) "passear sem guardachuva", ii) "passear com guardachuva", e iii) o bizarro “ato constante”. É claro que o conjunto de atos necessários para o teorema de Savage envolve ainda mais atos que respondem por todas as combinações possíveis de estados e resultados.

Tabela 2. Tabela de decisão ao estilo de Savage

Antes de discutir os axiomas de Savage, falemos do resultado a que eles dão origem. A seguinte notação será utilizada: f, g, etc, são vários atos, ou seja, funções do conjunto S de estados do mundo no conjunto O de resultados, sendo o conjunto destas funções F. f(s_i) denota o resultado de f quando o estado s_i∈S é verdadeiro. A utilidade esperada de f, de acordo com a teoria de Savage, designada por U(f), é dada pela

12 Para simplificar, assumiremos que o conjunto O é finito, mas Savage provou um resultado semelhante para um conjunto O infinito.

Equação de Savage U(f) = ∑_iu(f(s_i)) ⋅ P(s_i)

Savage demonstrou que o resultado pode ser enunciado da seguinte forma¹²: Teorema 3 (Savage).

Seja ⪯ uma relação de preferência fraca em F. Se

⪯ satisfizer os axiomas de Savage, então o seguinte se aplica:

● A confiança do agente na atualidade dos estados em S pode ser representada por uma função de probabilidade única (e finitamente aditiva) P;

● a “força” de seus desejos pelos resultados em O pode ser representada por uma função de utilidade, que é única até a transformação linear positiva;

● e o par (P, u) dá lugar à função de utilidade esperada, U, que representa as suas preferências pelas alternativas em F ou seja, para qualquer f, g ∈ F:

f ⪯ g ⇔ U(f) ≤ U(g)

O resultado acima pode parecer notável; em particular, o fato de que as preferências de uma pessoa podem determinar uma função de probabilidade única que representa suas crenças. Em um olhar mais atento, entretanto, é evidente que algumas de nossas crenças podem ser determinadas pelo exame de nossas preferências.

Suponha que lhe seja oferecida uma escolha entre duas loterias, uma que resulte em você ganhar um belo prêmio se uma moeda der cara, mas sem receber nada se a moeda der coroa, e outra que resulte em você ganhar o mesmo prêmio se a moeda der coroa, mas não receber nada se a moeda der cara. Então, assumindo que a desejabilidade do prêmio (e, de modo similar, a de não haver prêmio) é independente de como a moeda cai, sua preferência entre as duas loterias deve ser inteiramente determinada por suas crenças comparativas para as duas maneiras como a moeda pode cair. Por exemplo, se você prefere estritamente a primeira loteria à segunda, isso sugere que você considera cara mais provável do que coroa.

A observação acima sugere que se podem medir as crenças comparativas de um agente, e talvez mais, a partir de suas preferências. Savage foi um passo além disso e definiu crenças comparativas em termos de preferências. Para afirmar a definição de Savage, seja .≾. uma relação de crença comparativa fraca, definida sobre o conjunto S de estados do mundo. (.≺. e .∼. são definidos em termos de .≾.

da forma usual).

Definição 1 (Crença Comparativa).

Suponha que E e F sejam dois eventos (ou seja, subconjuntos de S). Suponha que X e Y sejam dois resultados, e f e g dois atos, com as seguintes propriedades:

● f(s_i)=X para todo si∈E, mas f(s_i)=Y para todo s_i∉E,

● g(s_i)=X para todo si∈F, mas g(s_i)=Y para todo s_i∉F,

● Y⪯X.

Logo, E .≾. F ⇔ f ⪯ g.

A definição 1 é baseada na simples observação de que geralmente se prefere associar um bom resultado a um evento mais provável do que a um menos provável.

Mas a ideia de que isso define crenças comparativas pode parecer questionável.

Poderíamos, por exemplo, imaginar pessoas que são instrumentalmente irracionais e, como resultado, deixam de preferir g a f, mesmo quando todas as condições acima se mantêm e elas acham F mais provável do que E. Além disso, esta definição levanta a questão de como definir as crenças comparativas daqueles que são indiferentes entre todos os resultados (ERIKSSON; HÁJEK, 2007). Talvez não existam tais pessoas (e o axioma de Savage P5 de fato deixa claro que seu resultado não se refere a tais pessoas).

No entanto, parece que uma definição de crenças comparativas não deve impedir que tais pessoas, se existirem, tenham crenças comparativas. Savage sugere que esta definição de crenças comparativas é plausível à luz do seu axioma P4, que será enunciado a seguir. Em qualquer caso, ocorre que, quando as preferências de uma pessoa satisfazem os axiomas de Savage, podemos ler a partir de suas preferências uma relação de crença comparativa que pode ser representada por uma função de probabilidade (única).

Sem mais delongas, vamos enunciar, a seguir, os axiomas de Savage. Estes são entendidos como restrições à relação de preferência de um agente sobre um conjunto de atos, tal como descrito acima. O primeiro dos axiomas de Savage é o axioma básico de ordenação.

P1. (Ordenação)

A relação ⪯ é completa e transitiva.

O próximo axioma lembra o axioma de Independência de vNM. Dizemos que a alternativa f “concorda com” g se, para qualquer estado no evento E, f e g produzem o mesmo resultado.

P2. Princípio da Coisa Segura (sure thing principle) Se f, g, e f′, g′ são tais que:

● f concorda com g e f′ concorda com g′ no evento ¬E,

● f concorda com f′ e g concorda com g′ no evento E,

● e f ⪯ g, então f′ ⪯ g′.

A ideia por trás do Princípio da Coisa Segura (PCS) é essencialmente a mesma que está por trás da Independência: como devemos ser capazes de avaliar cada resultado independentemente de outros resultados possíveis, podemos seguramente ignorar estados do mundo onde dois atos que estamos comparando produzem o mesmo resultado. Colocar o princípio em forma de tabela pode tornar isso mais aparente. A configuração envolve quatro atos com a seguinte forma:

A intuição por trás do PCS é que se g é fracamente preferível a f, então isso deve ser porque a consequência Y é considerada pelo menos tão desejável quanto X; o que pelo mesmo raciocínio implica que g′ é fracamente preferido a f′.

Savage também exige que a conveniência de um resultado seja independente do estado em que ele ocorre. Para formalizar esta exigência, Savage introduz a noção de evento nulo, definido da seguinte forma:

Definição 2 (Evento nulo)

O evento E é nulo para qualquer alternativa f, g ∈ F, f∼g dado que E.

A intuição é que eventos nulos são aqueles eventos que um agente tem certeza de que não ocorrerão. Se, e somente se, um agente tiver a certeza de que E não ocorrerá, então ele é indiferente quanto ao resultado, no caso de E, dos atos diante dele. O seguinte axioma estipula então que saber qual é o estado real não afeta a ordenação de preferência sobre resultados:

P3. (Neutralidade de estados)

Se f(s_i) = X e g(s_i) = Y sempre que s_i ∈ E e E não é nulo, então f ⪯ g dado que E apenas no caso de X ⪯ Y.

O próximo axioma é realmente o que torna possível determinar uma relação de crença comparativa a partir das preferências de um agente. Acima, foi sugerido que ao pedir para você apostar um prêmio sobre se uma moeda dá cara ou coroa, podese determinar qual desses eventos – seja cara, seja coroa – você acha mais provável. Mas essa sugestão só é plausível se o tamanho do prêmio não afetar o seu julgamento sobre a probabilidade relativa desses dois eventos. Essa suposição é capturada pelos próximos axiomas. Uma vez que o axioma é bastante complicado, ele será declarado em forma de tabela:

P4. Considere os seguintes atos:

Agora suponha que:

X ′ ⪯ X, Y ′ ⪯ Y, f ′ ⪯ f Logo:

g′ ⪯ g.

Menos formalmente (e enunciado em termos de preferência estrita): se você prefere apostar o prêmio X em f em vez de f′, você deve considerar E mais provável que F. Portanto, você deve preferir apostar o prêmio Y em g em vez de g′

uma vez que o prêmio em si não afeta a probabilidade dos eventos.

O próximo axioma não é indiscutivelmente um requisito de racionalidade, mas um dos "axiomas estruturais" de Savage (vide SUPPES. 2002). Um agente precisa ter alguma variação na preferência para que seja possível ler suas crenças comparativas a partir de suas preferências; e, mais geralmente, para que seja possível representála como maximizando a utilidade esperada. Para isso, o próximo axioma requer simplesmente que haja algumas alternativas entre as quais o agente não fique indiferente:

P5.

Há algum f, g ∈ F, tal que f ≺ g.

Quando estes cinco axiomas são satisfeitos, as preferências do agente dão origem a uma relação de crença comparativa, .≾., que tem a propriedade de ser uma relação de probabilidade qualitativa que é necessária para se poder representar .≾. por uma função de probabilidade. Em outras palavras, .≾. satisfaz as seguintes três condições, para quaisquer eventos E, F e G:

1. .≾. é transitiva e completa,

2. se E∩G = ∅ = F∩G, então E . ≾ . F ⇔ E ∪ G .

≾ . F ∪ G, 3. ∅.≾.E, ∅.≺.S

Ser uma relação de probabilidade qualitativa não é, entretanto, suficiente para garantir a possibilidade de representação probabilística (dados os outros

13 Quando o conjunto de resultados é infinito, o agente precisa satisfazer um axioma adicional. Mas, para simplificar, assumiremos resultados finitos.

axiomas de Savage). Para garantir esta possibilidade, Savage adicionou o seguinte axioma estrutural:

P6. (Nãoatomicidade)

Suponha f ≺ g. Então, para qualquer X ∈ O, há uma partição finita {E₁,E₂,…E_m} de S tal que:

● f′(s_i) = X para qualquer s_i∈ E_j, mas f′(s_i) = f(s_i) para qualquer s_j ∉ E_i,

● g′(s_i)=X para qualquer s_i∈ E_j, mas g′(s_i) = g(s_i) para qualquer s_j∉ E_j,

● f′≺ g e f ≺ g′.

Assim como o axioma da continuidade de vNM, a nãoatomicidade implica que não importa quão ruim seja um resultado X, se g já é preferível a f, então se adicionarmos X como um dos resultados possíveis de f – construindo assim uma nova alternativa f′ – g ainda será preferível à alternativa modificada, desde que a probabilidade de X seja suficientemente pequena. De fato, a nãoatomicidade implica que S contém eventos de probabilidade arbitrariamente pequena. Não é muito difícil imaginar como isso poderia ser satisfeito. Por exemplo, qualquer evento F pode ser particionado em dois subeventos equiprováveis, de acordo com o resultado de um lance de cara ou coroa. Cada subevento pode ser dividido de maneira semelhante, de acordo com o resultado do segundo sorteio da mesma moeda, e assim por diante, ad infinitum.

Savage mostrou que sempre que estes seis axiomas são satisfeitos, a relação de crença comparativa pode ser representada por uma função de probabilidade única. Tendo feito isso, ele poderia contar com o teorema da representação vNM para mostrar que um agente que satisfaz todos os seis axiomas¹³ pode ser representado como maximizando a utilidade esperada relativamente a uma função de probabilidade única que representa plausivelmente as crenças dos agentes sobre os estados de coisas e uma função de utilidade cardinal que representa plausivelmente os desejos do agente para os resultados (lembrese da afirmação

14 omo alguns apontaram (por exemplo, ZYNDA, 2000), a função de probabilidade derivada sobre estados de coisas e a função de utilidade sobre resultados não precisam representar as crenças e desejos reais do agente. Talvez o agente tenha preferências sobre atos que satisfaçam os axiomas de Savage, que são bastante desconectados de suas crenças e desejos reais. Além disso, o teorema de Savage não exclui que um agente com preferências que satisfazem seus axiomas possa ser representado usando uma forma funcional alternativa que melhor corresponda à sua psicologia de tomada de decisão. Essas são leituras alternativas do teorema. No entanto, a inferência para a melhor explicação parece apontar em favor de considerar a representação de utilidade esperada como descobrindo crenças e desejos determinantes das preferências do agente.

do teorema de Savage acima)¹⁴. A prova do próprio Savage é bastante complicada, mas Kreps (1988) fornece uma ilustração útil dela.

Não há dúvida de que o teorema da representação da utilidade esperada, de Savage, é muito poderoso. Há, no entanto, duas perguntas importantes a serem feitas sobre se Savage atinge seus objetivos: 1) Savage caracteriza as preferências racionais, pelo menos no sentido genérico? E (2) o teorema de Savage nos diz como tomar decisões racionais no mundo real? A teoria de Savage tem problemas para atender a essas duas demandas consideradas em conjunto. Podese arguir que a fraqueza central da teoria é que suas várias restrições e suposições puxam em diferentes direções quando se trata de construir modelos de decisão realistas e, além disso, pelo menos uma restrição (notadamente, o Princípio da Coisa Segura) só é plausível sob premissas de modelagem de decisão que supostamente são o resultado, e não o input, da teoria.

Um requisito bem reconhecido de modelagem de decisão para a teoria de Savage é que os resultados sejam tão específicos quanto possível em todos os aspectos importantes para sua avaliação. Se não fosse assim, o axioma da Neutralidade de Estado, por exemplo, seria uma restrição de racionalidade muito implausível. Suponha que estejamos, por exemplo, nos perguntando se vamos comprar chocolate quente ou limonada para o fim de semana, e suponha que o quão bom achamos cada opção depende de como estará o clima. Então precisamos descrever os resultados de forma que eles incluam o estado meteorológico. Pois se não o fizermos, a desejabilidade dos resultados dependerá de qual estado efetivamente ocorre. Como a limonada é, suponhamos, melhor nos dias quentes do que nos frios, um resultado como “Eu bebo limonada neste fim de semana” seria

15 No entanto, um resultado semelhante ao de Savage pode ser obtido sem a Suposição de Campo Retangular, em particular adicionando alguma estrutura extra ao conjunto de prospectos. (vide BRADLEY, 2007).

mais ou menos desejável dependendo de sua ocorrência em um dia quente ou frio.

Isto seria contrário ao axioma da Neutralidade de Estado. Portanto, os resultados apropriados neste caso são da forma “Eu bebo limonada neste fim de semana com tempo quente”. É claro que este resultado deve ser dividido em resultados ainda mais finos, se ainda houver outras características que afetem a escolha em questão, como compartilhar a bebida com um amigo que ama limonada versus compartilhar a bebida com um amigo que ama chocolate quente, e assim por diante.

O fato de que os resultados no caso acima devem ser suficientemente específicos para conter o estado da meteorologia pode parecer bastante inócuo.

Entretanto, esta exigência exacerba o problema acima mencionado que muitas das opções/ações que Savage requer para seu teorema de representação são absurdas, na medida em que o conteúdo semântico dos pares estado/resposta é contraditório.

Lembrese que o domínio da ordenação de preferências na teoria de Savage equivale a toda função desde o conjunto de estados até o conjunto de resultados (o que Broome (1991a) chama de Assunção de Campo Retangular). Então, se “eu bebo limonada neste fim de semana em clima quente” é um dos resultados com os quais estamos trabalhando, e dividimos o conjunto de estados de acordo com o tempo, então deve haver, por exemplo, um ato que tenha esse resultado num estado em que faz frio! Quanto mais detalhados os resultados (como requerido para a plausibilidade da Neutralidade do Estado), menos plausível é a Assunção de Campo Retangular. Esta é uma tensão interna no quadro de Savage. Na verdade, é difícil ver como ou por que um agente racional pode/deve formar preferências sobre atos sem sentido (contudo, veja Dreier 1996 para um argumento de que esta não é uma questão tão importante). Sem esse pressuposto, porém, o ordenamento de preferências do agente não será suficientemente rico para as restrições de racionalidade de Savage produzirem o resultado da representação da UE¹⁵.

O axioma na teoria de Savage que tem recebido mais atenção é o Princípio da Coisa Segura. Não é difícil ver que este princípio entra em conflito com as preferências de Allais pela mesma razão por que estas preferências entram em conflito com a Independência (lembrese da seção 2.3). O desafio de Allais será discutido novamente mais tarde. Por enquanto, nossa preocupação é antes o

Princípio da Coisa Segura em relação à lógica interna da teoria de Savage. Para começar, o Princípio da Coisa Segura, assim como a Neutralidade do Estado, exacerba as preocupações com a Assunção de Campo Retangular. Isto porque o Princípio da Coisa Segura só é plausível se os resultados forem suficientemente específicos para responder por qualquer tipo de dependência entre os resultados em diferentes estados do mundo. Por exemplo, se o fato de se poder ter escolhido uma alternativa sem risco – e assim garantir um resultado aceitável – faz uma diferença para a conveniência de não receber nada depois de ter assumido um risco (como no problema de Allais), então isso tem que ser contabilizado na descrição dos resultados. Mas, novamente, se levarmos em conta tais dependências na descrição dos resultados, encontramos o problema de que haverá atos na ordenação de preferência que não fazem sentido (vide BROOME, 1991a, cap. 5).

Há um outro problema interno com a teoria de Savage associada ao Princípio da Coisa Segura: o princípio só é razoável quando o modelo de decisão é construído de tal forma que haja independência probabilística entre os atos que um agente está considerando e os estados do mundo que determinam os resultados desses atos. Lembramos que o princípio diz que se tivermos quatro opções com a seguinte forma:

Neste caso, se g é fracamente preferível a f, g′ deve ser fracamente preferível a f′. Suponha, entretanto, que exista uma dependência probabilística entre os estados do mundo e as alternativas que estamos considerando, e que nós achamos que Z é melhor que ambos X e Y, e, também, achamos W melhor que ambos X e Y. Além disso, suponha que g faz ¬E mais provável do que f o faz, e f′

faz ¬E mais provável do que g’ o faz. Então, parece perfeitamente razoável preferir g a f, mas f′ a g′.

Por que a exigência de independência probabilística é problemática? Para começar, em muitas circunstâncias de decisão do mundo real, é difícil enquadrar o modelo de decisão de tal forma que os estados sejam intuitivamente probabilisticamente

independentes dos atos. Por exemplo, suponha que uma pessoa gosta de fumar e está tentando decidir se quer parar ou não. Quanto tempo ela viverá está entre as contingências que afetam a desejabilidade de fumar. Seria natural dividir o conjunto de estados de acordo com o tempo de vida da pessoa. Mas então é óbvio que as opções que ela está considerando poderiam, e sem dúvida deveriam, afetar a probabilidade de ela encontrar cada estado do mundo, pois é bem reconhecido que a expectativa de vida é reduzida pelo cigarro. Savage, portanto, exigiria uma representação alternativa do problema de decisão – os estados não se referem diretamente à expectativa de vida, mas sim à propensão fisiológica do agente para reagir de uma certa forma ao fumo.

Talvez haja sempre uma maneira de se chegar a modelos de decisão tais que os atos sejam intuitiva e probabilisticamente independentes dos estados. Mas aí reside o problema mais sério. Lembremos que Savage estava tentando formular uma maneira de determinar as crenças de um agente racional a partir de suas preferências sobre os atos, de tal modo que as crenças possam ser representadas por uma função de probabilidade. Se estamos interessados em decisões do mundo real, então os atos em questão devem ser opções reconhecíveis para o agente (o que já vimos ser questionável). Além disso, agora vemos que uma das restrições de racionalidade de Savage sobre preferências – o Princípio da Coisa Segura – só é plausível se os atos modelados forem probabilisticamente independentes dos estados. Em outras palavras, essa independência deve ser embutida no modelo de decisão se for para facilitar medidas apropriadas de crença e desejo. Mas isto é para assumir que já temos informações importantes sobre as crenças do agente cujas atitudes estamos tentando representar; isto é, que estadopartições ela considera probabilisticamente independentes de seus atos.

Os problemas acima sugerem que existe a necessidade de uma teoria alternativa de escolha sob incerteza. A teoria de Richard Jeffrey, que será discutida a seguir, evita todos os problemas que têm sido discutidos até agora. Mas, como veremos, a teoria de Jeffrey tem problemas bem conhecidos, embora não sejam problemas intransponíveis.

No documento Filosofia da Economia (páginas 135-146)