• Nenhum resultado encontrado

O teorema de Kuhn-Zermelo

Teorema 5.1 (Kuhn-Zermelo) Todo jogo seq¨uencial de in- forma¸c˜ao perfeita possui pelo menos um equil´ıbrio de Nash em estrat´egias puras.

Id´eia da prova. A demonstra¸c˜ao ´e feita por indu¸c˜ao. Se o jogo possui apenas um ´unico n´o de decis˜ao, ent˜ao o teorema ´e verdadeiro: o jo- gador que age neste n´o escolhe uma a¸c˜ao que maximiza o seu payoff. Os outros jogadores, se existirem, tem espa¸cos de estrat´egias vazios. Suponha ent˜ao que todo jogo com menos do que m > 1 n´os de de- cis˜ao possua pelo menos um equil´ıbrio de Nash. Escolhendo um n´o de decis˜ao β que sucede imediatamente a raiz α da ´arvore do jogo, cria- remos dois jogos. O primeiro ´e o subjogo Gβ que come¸ca em β. Pela

hip´otese de indu¸c˜ao, Gβpossui pelo menos um equil´ıbrio de Nash s∗β.

O segundo jogo, G−β, ´e constru´ıdo da seguinte maneira: removemos

de G o subjogo Gβ e n´o β, que antes era de decis˜ao, criamos uma

folha cujos payoffs s˜ao dados pelos payoffs associados ao equil´ıbrio s∗ β

de Gβ. Novamente, pela hip´otese de indu¸c˜ao, G−β possui pelo me-

nos um equil´ıbrio de Nash s∗

−β. Se a a¸c˜ao em s∗−β n˜ao usa o ramo a

que liga α a β em G−β, ent˜ao s∗−β ´e um equil´ıbrio de Nash do jogo

original G. Por outro lado, se s∗

−β usa o ramo a, ent˜ao (a, s∗β) ´e um

5.5

Exerc´ıcios

[01] (Jogo da centop´eia) Use indu¸c˜ao retroativa para obter um equil´ıbrio de Nash do jogo seq¨uencial da figura abaixo. O equil´ıbrio ´e Pareto eficiente?

1 2 1 2

(4, 1) (2, 8) (16, 4) (8, 32)

(64, 16) Continuar Continuar Continuar Continuar

Parar Parar Parar Parar

. Este jogo foi desenvolvido pelo economista Robert W. Rosenthal, mas o seu nome ´e devido a Kenneth Binmore.

[02] (Jogo da confianc¸a) Use indu¸c˜ao retroativa para obter um equil´ıbrio de Nash do jogo seq¨uencial da figura abaixo. O equi- l´ıbrio ´e Pareto eficiente?

1 2 (0, 0) ( 1, 1) ({1, 2) confiar não confiar trair honrar .

Exemplos

6.1

O jogo Le Her simplificado

Nesta se¸c˜ao estudaremos a vers˜ao simplificada do jogo Le Her, como apresentada por Benjamim e Goldman em [05]. Dois jogadores empregam um pacote de 13 cartas do mesmo naipe (A, 2, . . . , 10, Q, J e K). Ap´os um sistema de distribui¸c˜ao e troca de cartas que descreveremos a seguir, o vencedor ´e aquele com a maior carta (A < 2 <· · · < 10 < Q < J < K).

Inicialmente, o jogador 1 embaralha as 13 cartas e distribui uma carta X para si, uma carta Y para o jogador 2 e deixa o restante das cartas em um monte Z, sem que nenhum dos dois jogadores veja as cartas. Feito isto, cada jogador vˆe sua carta, mas n˜ao as outras. O jogador 1 deve ent˜ao decidir se mant´em a sua carta ou a troca com o jogador 2 (que n˜ao pode se negar a fazer a troca). No primeiro caso, ´e a vez do jogador 2 decidir se ele mant´em a sua carta (a ´unica que ele conhece at´e o momento) ou se ele faz a troca com a primeira carta do monte Z. Depois que o jogador 2 faz a sua escolha, os jogadores mostram as suas cartas e vence aquele com a maior carta. No segundo caso, os dois jogadores conhecem os valores das duas cartas X e Y e o jogador 2 n˜ao tem escolha alguma: se, depois da troca, a sua carta for menor do que a carta do jogador 1, ent˜ao ele deve obrigatoriamente troc´a-la com a carta do monte Z na esperan¸ca de obter uma carta maior para vencer o jogo, caso

contr´ario, ele mant´em a sua carta e vence o jogo. O leitor interessado pode se familiarizar com as regras do jogo atuando como o jogador 2 no applet Java dispon´ıvel no endere¸co:

http://www.professores.uff.br/hjbortol/arquivo/2007.1/ applets/leher1 br.html.

Quais s˜ao as estrat´egias puras do jogador 1? Cada estrat´egia pura corresponde a uma escolha de um subconjunto formado pelas cartas que ele ir´a manter na primeira etapa do jogo. Por exemplo, a escolha do subconjunto {5, 7, 9} corresponde `a estrat´egia pura do jogador 1 em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Desta maneira, existem tantas estrat´egias puras quantos subconjuntos do conjunto

D ={A, 2, 3, 4, 5, 6, 7, 8, 9, 10, Q, J, K},

isto ´e, existem um total de 213= 8192 estrat´egias puras para o joga-

dor 1. O mesmo vale para o jogador 2: ele tem 213 estrat´egias puras

distintos de D, cada um especificando quais cartas o jogador 2 ir´a manter. ´E importante observar mais uma vez que o jogador 2 s´o faz uma escolha (a de manter a sua carta Y ou troc´a-la com uma carta do monte Z) quando o jogador 1 decide por manter a sua carta X. Se o jogador 1 resolve trocar de cartas, a a¸c˜ao do jogador 2 est´a com- pletamente determinada pelos valores das cartas X e Y (supondo, naturalmente, que o jogador 2 seja racional).

A matriz de payoffs do jogo tem, portanto, dimens˜ao 213× 213.

Este tamanho pode ser reduzido consideravelmente observando que estrat´egias puras “com saltos” s˜ao dominadas por aquelas “sem sal- tos”. Por exemplo, a estrat´egia pura

{5, 7, 9}

(manter apenas as cartas 5, 7 e 9) ´e dominada pela estrat´egia pura {5, 6, 7, 8, 9, 10, Q, J, K}

(manter apenas as cartas maiores do que ou iguais a 5). Assim, ao inv´es de considerar todos os 213 subconjuntos de D, podemos nos

restringir aos 13 subconjuntos da forma {C ∈ D | C ≥ C}, onde 

C∈ D. No que se segue, usaremos o seguinte abuso de nota¸c˜ao A ={A, 2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},

2 ={2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},

3 ={3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, . . . para representar estas estrat´egias puras dominantes de cada jogador.

O ganho do jogador 1 ´e sua probabilidade de vit´oria que, eviden- temente, depende das estrat´egias puras (dominantes) escolhidas pelos dois jogadores. Atrav´es de c´alculos com probabilidades condicionais (como em [05]) ou atrav´es de uma enumera¸c˜ao direta (veja o ap- plet Java dispon´ıvel no endere¸co http://www.professores.uff.br/ hjbortol/arquivo/2007.1/applets/leher2 br.html), obtemos a matriz de payoffs apresentada na tabela 6.1, onde as probabilida- des foram calculadas com 3 casas decimais corretas. Como o jogo ´e de soma zero (isto ´e, um jogador vence se, e somente se, o outro perde), a matriz de payoffs do jogador 2 ´e a matriz de payofffs do jogador 1 multiplicada por−1.

. 6 .1 : O J O G O L E H E R S IM P L IF IC A D O 123 jogador 2 A 2 3 4 5 6 7 8 9 10 Q J K jogad or 1 A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462 2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500 3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533 4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559 5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578 6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590 7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593 8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588 9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573 10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549 Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514 J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468 K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410

124 [C A P . 6 : E X E M P jogador 2 A 2 3 4 5 6 7 8 9 10 Q J K jogad or 1 7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593 8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588 9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573

Tabela 6.2: Matriz de payoffs do jogador 1 para o jogo Le Her ap´os mais uma elimina¸c˜ao de estrat´egias estritamente dominadas.

Vamos usar dominˆancia para simplificar ainda mais a matriz do jogo. Observe que as estrat´egias 7 e 9 do jogador 1 dominam, respec- tivamente, as estrat´egias de A a 6 e de 10 a K (isto ´e, o jogador 1 deve sempre trocar cartas ≤ 6 e deve sempre manter cartas ≥ 10). Eliminando-se ent˜ao as linhas estritamente dominadas, obtemos a matriz da tabela 6.2. Para esta matriz reduzida, as estrat´egias 9 e 10 do jogador 2 dominam, respectivamente, as estrat´egias de A a 8 e de Q a K (isto ´e, o jogador 2 deve sempre trocar cartas≤ 8 e deve sempre manter as cartas Q, J e K. Eliminando-se ent˜ao as colunas estritamente dominadas, obtemos a matriz da tabela 6.3.

jogador 2 9 10 jogad or 1 7 0.538 0.543 8 0.547 0.548 9 0.549 0.545

Tabela 6.3: Matriz de payoffs do jogador 1 para o jogo Le Her ap´os mais uma elimina¸c˜ao de estrat´egias estritamente domi- nadas.

Finalmente, vemos que para esta matriz reduzida, a estrat´egia 8 do jogador 1 domina estritamente a estrat´egia 7. Eliminando-a, obtemos a matriz 2× 2 da tabela 6.4. jogador 2 9 10 jogad or 1 8 0.547 0.548 9 0.549 0.545

Tabela 6.4: Matriz de payoffs do jogador 1 para o jogo Le Her ap´os mais uma elimina¸c˜ao de estrat´egias estritamente domi- nadas.

Usando-se programa¸c˜ao linear ou fun¸c˜oes de melhor resposta, po- demos calcular facilmente o equil´ıbrio de Nash em estrat´egias mistas

deste jogo 2× 2:

(p1, p2) = (4/5, 1/5) para o jogador 1

e

(q1, q2) = (3/5, 2/5) para o jogador 2.

Os payoffs m´edios s˜ao, respectivamente, 0.5474 e 0.4526. Vemos, portanto, que o jogador 1 leva vantagem nesta vers˜ao simplificada do Le Her supondo, ´e claro, que ele aja racionalmente seguindo o equil´ıbrio de Nash.

Observac¸˜oes.

1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar de cartas com o jogador 1 se sua carta for K (a de maior valor). No caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2 vence. Mesmo na vers˜ao original, a probabilidade m´edia de ganho do jogador 1 ´e maior do que a do jogador 2 no equil´ıbrio de Nash. Os detalhes podem ser encontrados nas referˆencias [25] e [37]. 2. O jogo Le Her foi investigado por Pierre R´emond de Montmort

(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Wal- degrave (1684–1741) que forneceu uma solu¸c˜ao para o jogo usando o conceito de equil´ıbrio em estrat´egias mistas. As referˆencias [90] e [37] apresentam em detalhes a hist´oria deste jogo, incluindo a troca de correspondˆencia entre Montmort, Bernoulli e Waldegrave e os erros cometidos na solu¸c˜ao apresentada por Bernoulli. 3. Benjamim e Goldman mostram em [05] que, para a vers˜ao sim-

plificada do Le Her, a redu¸c˜ao da matriz de payoffs para uma matriz 2× 2 ocorre para qualquer baralho com um n´umero N ≥ 3 de cartas de um mesmo naipe.

Documentos relacionados