• Nenhum resultado encontrado

Teoria dos jogos: conceitos básicos

N/A
N/A
Protected

Academic year: 2017

Share "Teoria dos jogos: conceitos básicos"

Copied!
77
0
0

Texto

(1)

TEORIA n'!s JOGü3 CONCEITOS BÂ~ICOS

Mario Henrique Simonsen I

(2)

-CONCEITOS BÁSICOS

1.1) Objetivo da Teoria dos Jogos

Como tomar decisões cujos resultados dependem de açoes de terceiros é o que se procura analisar na teoria dos jogos. Trata-se de um programa extremamente ambicioso, que levado às úl-timas conseqüências ensinaria qualquer indivíduo a transformar-se em campeao mundial de xadrez, a nivelar-se aos melhores

profis-A

sionais do poquer ou qualquer outro jogo de cartas, a solucionar qualquer problema econômico, a jamais perder qualquer eleição e a perpetuar-se como o maior general de todos os tempos. Com efeito, não só o xadrez e o pôquer, mas também a tomada de decisões eco-nômicas, as campanhas pOlíticas e a guerra sao jogos, no sentido C2 que o resultado colhido por cada um nao depende apenas C~ SEüS ~~OP~, mas também das decisões de terceiros.

Não surpreende que, diante de um programa tão am0icio-so, a teoria dos jogos seja um ramo altamente incompleto da mate-mática aplicada. O ponto de partida foi um livro excepcionalmente

(3)

.2.

Primeiro, a maioria dos jogos realmente interessantes

depa'ra-se com problemas ainda nao solucionados de computação,

em-bora muitas vezes se possa dizer algo sobre o seu resultado com

base em teoremas de existência. Como veremos no Capítulo 2, o

Teorema de Zermello assegura que o jogo de xadrez e , estritamente

determinado, no sentido de que urna e só uma das três seguintes

proposições é verdadeira: a) existe uma estratégia de ganho para

o jogador das peças brancas, qualquer que seja a estratégia das

pretas; b) existe uma estratégia que dá ganho às pretas qualquer

que seja a estratégia das brancas; c) qualquer que seja a

estra-tégia das brancas existe pelo menos uma outra que assegura as ,

pretas o empate, e vice-versa.

o

problema é que, até agora,

ne-nhum computador conseguiu dissecar todas as estratégias POSS1-,

veis numa partida de xadrez. É isso que torna o xadrez tão

exci-tante quanto infantil o jogo da velha, ainda que ambos ,sejam

ab-solutamente equivalentes do ponto de vista do teorema de Zermello.

Segundo, e aí reside o ponto mais sutil da teoria dos

j~gos, o conceito de racionalidade nem sempre e , isento dI"

::.tlllbi-qüidades. De um lado porque em mui tos casos surgem coY,fli tos

en-tre a noção de racionalidade individual e a de racionalic.:.'Ide

co-letiva. O exemplo clássico nesse sentido é o dilema dos

prisio-neiros, descrito mais adiante. De outro lado porque uma coisa e ,

agir racionalmente diante de adversários ou colegas igualmente

racionais, outra agir racionalmente quando se põe em dúvida a

ra-cionalidade dos demais parceiros. Como veremos mais adiante,

es-se problema pode abalar es-seriamente a aplicabilidade prática do

principal conceito da teoria dos jogos não cooperativos, o de

(4)

I

I

Terceiro, muitos jogos admitem diferentes equilíbrios, com resultados diferentes para os vários participantes. É de se reconhecer que, nesses casos, o atual conhecimento sobre a teoria deixa um campo de indeterminaç~o sobre o que seja decis~o racio-nal em problemas de interdependência estratégica.

(5)

.4.

1.2) Conceitos Básicos

Genericamente um jogo é um conjunto de regras que esta-belecem: i) o número de participantes; ii) as informações for-necidas a cada participante; iii) as decisões permitidas a cada participante; iv) os resultados (pay-offs) auferidos por cada um dos participantes. Estes últimos podem depender exclusiva-mente das decisõ8s tornadas pelos participantes (corno no jogo de xadrez) ou também de fatores aleatórios (como no bridge ou no pô-quer). O segundo caso reduz-se ao primeiro trazendo para o jogo umparticipante adicional, a "natureza", mas com uma ressalva im-portante: a natureza tem caprichos próprios, nem estando interes-sada em ganhar nem em perder.

As regras dividem os jogos em dois tipos fundamentais, os cooperativos e os nao cooperativos. No primeiro caso permitem--se coalizões entre os participantes sob a forma de contratos ir-revogáveis e irretratáveis. Esses contratos podem ser de dois

ti-!"';.5 distintos, os que admitem pagamentos laterais entre os

;·:.rti-cipantes, (

.

-e os qu-e prolb-em tals pagam-entos. No caso d~d jogos nao cooperativos, é proibida qualquer comunicação entre os

0iferen-tes jogadores, eliminando-se a possibilidade de contratos, amea-ças explícitas ou coalizões. Em qualquer dos casos, uma estraté-gia é um conjunto de decisões acessível a cada jogador.

Nos jogos nao cooperativos há urna categoria especial, e que será analisada em pormenores no Capítulo 2, os jogos de

,

(6)

oposto ao do outro. Também não geram a dúvida atroz que cerca a teoria dos jogos não cooperativos: "o que acontecerá se meu par-ceiro não se comportar racionalmente", pois o parceiro e , adver-sário, e por isso mesmo quanto mais errar melhor.

A teoria presume que o jogo seja jogado uma unlca vez. ,

.

Isso nao exclui a possibilidade de que um mesmo jogo seja re-petido um número finito ou infinito de vezes, mas obriga a uma reflexão muito importante: um superjogo, isto e, , um mesmo jogo repetido n vezes, não é a mesma coisa do que n repetições inde-pendentes do mesmo jogo. A diferença não é relevante no caso dos jogos cooperativos, mas é fundamental no caso dos jogos nao coo-perativos de soma variável, onde surge a possibilidade de cada participante sinalizar aos demais o seu desejo de cooperar, des-de que os des-demais façam o mesmo. Embora as regras do jogo lmpeçam qualquer comunicação entre os participantes, a sinalização

é

pos-sível na medida em que um jogador escolha estratégias que mos-trem a sua disposição para cooperar enquanto os demais fizerem o mesmo, e 8~ retaliar em caso contrário. Em jogos infinitamente

repet~~~~. ~ssa pnsFiLilid~~p ~p cooperação por vias indiretas se demonstra por um fd:,.CSO teorema de Aumann. Essa

é

uma forte razão

(7)

.6.

1.3) Jogos na Forma Extensiva

Trataremos os jogos como uma sequencia de lances, cada um decidido por um único participante. Isso permite descrever to-das as evoluções possíveis do jogo por meio de uma árvore de de-cisões, em que cada lance representa a transição de um vértice para outro ao longo da árvore. O jogo diz-se finito ou infinito conforme o número de vértices seja finito ou infinito. O fato de, em alguns jogos, os participantes deverem fazer lances simultâ-neos concilia-se com essa descrição por um artifício simples: bas-ta transformar os lances anteriores em sequenciais, mas admitir que cada participante desconheça os lances anteriores da sequen-cia.

Isso significa que a árvore de decisões decreve todas as possíveis evoluções do jogo, mas não fornece a desc~ição com-pleta do jogo. Para completá-la é preciso especificar o que cada participante conhece no momento de tomar suas decisões. Nesse sentido, os jogos podem classificar-se em vários tipos, de acordo com três critérios:

i) quanto ao conhecimento das regras do jOq0' os jo~~s

dizem-se de informação completa quando cada participante conhece: a) o número de participantes do jogo; b) as decisões que qualquer deles pode tomar; c) os pay-offs de todos os participantes. Se algum desses elementos for desconhecido por algum participante, o

jogo diz-se de informação incompleta;

ii) quanto

à

memória: os jogos dizem-se de memória per-feita quando cada participante se lembra, a cada momento, de to-dos os lances que efetuou desde o início do jogo; de memória lm-perfeita, em caso contrário;

(8)

efe-tuar seus lances, conhece em que vértice da árvore se encontra o jogo (a exemplo do xadrez); de informação imperfeita em caso con-trário (a exemplo do pôquer).

Vejamos alguns exemplos:

A) NIM 2x2:

Estado Inicial: duas pilhas, cada urna com dois livros. Número de Jogadores: 2.

Seqüência de Chamada: o jogador A é o primeiro a jogar, seguido por B, e assim alternadamente.

Ações Permitidas: cada jogador deve retirar quantos livros quiser ou puder, desde que pelo menos um, e desde que mexa de cada vez na mesma pilha. Se as duas pilhas contiverem o mesmo número de livros, só é permitido mexer na pilha esquerda.

Fim do Jogo: quando o último livro for retirado.

Pay-offs: quem retirar o último livro paga um centavo ao outro.

Trata-se de um jogo de perfeita informação completa (presumivelmente também de perf€::: ' ... a memória), 8 que se descreve

pela seguinte árvore (onde as l~~Ld~ em C~~_ v~rticc .iüdicam o

jogador a efetuar o próximo lance, se for o ~2S0, e onde os ver-, tices com um retângulo em volta indicam as situações de fim de

jogo e o respectivo vencedor:

A (1,0)

(9)

o 8 o

É imediato que o segundo jogador pode vencer facilmente pela seguinte regra: se, no lance inicial, A mandar o jogo para o vértice BI' B responde mandando o jogo para A

30 E se, no lance i-nicial, A mandar o jogo para B

2, B responde mandando o jogo para

B) Mini-porrinha

Estado Inicial: dois jogadores, A e B, com as maos vazias.

Primeiro Lance: A coloca na mao direita um palito de fósforo ou dois, sem que B saiba de sua escolha.

Segundo Lance: B coloca na mão direita um ou dois palitos de fós-foro, sem que A saiba da escolha.

Terceiro Lance: A escolhe um número inteiro que pode ser 2,3 ou 4. Quarto Lance: B escolhe um inteiro de 2 a 4 diferente do escolhido por A. Fim do Jogo: ambos abrem as respectivas mãos direitas e totalizam

,

o numero de palitos.

Pay-offs: o jogador que acertar o total (pelo terceiro ou pelo quarto l~nce, recebe um d61ar do outro). Se ninguém acertar, h? ..::mpate.

A árvore de Jogo apresenta-se a seguir, dentro das se-guintes convençoes gráficas:

a) os vértices nos quatro primeiros nlvelS ,

.

indicam a

,

.

quem cabe o proxlmo lance;

b) os vértices I a 24 indicam as possíveis configura-çoes finais do jogo;

(10)

d) abaixo dos vértices 1 a 24 indica-se o vencedor do jogo (A, B ou empate

=

E).

5 6

~

B B B

4~

1~

21\3

19 20 21 22 23 24

A A B E B E B E A A E B B E A A E B E B E B A A

h diferença funda~ental entre a mini-porrinha e o Nim 2x2

8

que agora os iúqadores, ao efetuarem seus lances, não sabem em que ~~rtice J~ ~rvore se encontram, o que caracteriza um jogo de informação imperfeita. Ao efetuar o segundo lance, B nao sabe se está em Bl ou em B

2. Ao efetuar o terceiro, A sabe se está na sub-árvore que começa em BI ou na que começa em B

(11)

,

.10.

o

dilema dos prisioneiros: Dois marginais, suspeitos de um crime, são apanhados pela polícia e interrogados em celas separadas. Cada um deles é abordado por um juiz, cujas ameaças e promessas estão acima de qualquer suspeita, e que lhes diz: "con-fesse o crime, colaborando com a justiça, em seu próprio interes-se. Se ambos, você e seu parceiro, confessarem, cada qual pegará seis anos de xadrez. Se um confessar e o outro nao, o primeiro só pegará dois anos de cadeia, o outro dez cnos, corno punlçao pela

.

-mentira. É possível que nenhum de vocês confesse e, nesse caso, a

,

pena sera de apenas quatro anos para cada um. Mas pense, pois seu interesse é confessar".

A árvore do jogo é descrita abaixo, C indicando a con-fissão, N a negação. Os números debaixo dos vértices terminais indicam os pay-offs dos dois tratantes, o sinal menos lembrando que quanto mais anos de cadeia, pior.

A

N

4

(-6;-6) (-2;-10) (-10;-2) (-4;-4)

o

jogo pressupoe que o segundo prisioneiro, ao tornar sua decisão de confessar ou não, nao saiba se se encontra no vér-tice Bl ou B

2 da árvore de decisões. No jogo em questão, isso nao chega a ser muito relevante, p01S cada jogador dispõe de urna es-tratégia dominante, isto é, que assegura maior pay-off qualquer que seja a decisão do parceiro, pois a pena individual

confessando o crime do que negando. Com efeito, cada prisioneiro

,

(12)

pensará com seus botões: se meu colega confessar, pegarei 6 anos de cadeia se também confessar, 10 anos se negar minha culpa. Se ele não confessar, pegarei só 2 anos confessando contra 4 se ne-gar o crime. Logo, em qualquer hipótese, o melhor para mim é con-fessar. O raciocínio vale quer o prisioneiro já conheça a deci-sao do parceiro ou nao. Trata-se de um exemplo clássico de con-flito entre racionalidade individual e coletiva. Se fosse permi-tido um pacto irrevogável e irretratável entre os dois parceiros do crime, o melhor para ambos seria não confessar e pegar apenas quatro anos de xadrez. O interrogatório em celas separadas impede esse pacto, e a racionalidade individual condena ambos a seis a-nos de cadeia.

Os três jogos apresentados tipificam a variedade de problemas que a teoria dos jogos pretende abordar. O Nim2x2 é um jogo de duas pessoas-soma zero com perfeita informação. Trata-se de um jogo infantil, no sentido de que a estratégia de ganho pode ser descoberta sem maiores dores de cabeça, mas exceto quanto a este l~J ~lmo aspecto (8s.:iencial, do ponto de vista prático), o jo-go e 00 mesmu ~:ei'~ro que o xadrez. A mini-porrinha também e , um

(13)

. . . . - - -

-.12.

At~ agora s~ exemplificamos jogos finitos.

também os infinitos e a sua descrição extensiva requer urna

mais abrangente do que sejam: a) urna árvore topológica; conjunto de informações; c) urna estrat~gia. Antes de essas definições, vale no entanto explorar a trajetória

definição

b) um

(14)

1.4} Jogos matriciais e bi-matriciais

Cuidemos agora de um tipo particular de jogo de duas pessoas, A e B: no primeiro lance, A escolhe um número inteiro de I a m; no segundo, B escolhe um número inteiro de I a n, sem estar informado da escolha de A. Indicando por i o inteiro escolhido por A e por j o escolhido por B, o primeiro jogador recebe a .. ,

1J

o segundo b ... Um tal jogo apelida-se bi-matricial, no sentido de

1J

que ele se descreve por um par de matrizes de pay-offs, onde as linhas representam as possíveis estratégias de A, as colunas as possíveis estratégias de B:

Estratégia de B Estratégia de A

BI B2

· ...

B n

AI (all;bll ) (aI2;bI2)

·

...

(alnibln) A

2 (a21;b21) (a22;a22)

· ...

(a2nib2n )

. . .

.

. . .

.

.

. . . .

.

.

.

. .

.

.

.

...

~

. . .

A (a

ml i bm1.\ (a m2'

'--

';n', )

·

...

(a ·b )

m mn' mn

-- - - ---_.

No caso dos jogos de duas pessoas soma zero, b .. = -a .. ,

1J 1J

tornando dispensável a explicitação da matriz dos pay-offs de B. Nesse caso, para a descrição do jogo, basta apresentar a matriz dos pay-offs do primeiro jogador. Esses são os apelidados "jogos matriciais".

(15)

.14.

mais geral que será dpmonstrado ainda neste capítulo. Para tanto basta entender claramente o que seja estratégia num jogo sob a forma extensiva.

A idéia de estratégia é a de um plano de jogo. Em suma, trata-se de urna sequencia completa de lances, até o fim do jogo, cada um deles representando urna função do conjunto de informações disponíveis e com valores permitidos pelas regras do jogo. Trate-mos de apresentar na forma bi-matricial os jogos apresentados sob a forma extensiva na secção anterior.

o

caso do dilema dos prisioneiros é imediato, pois as estratégias possíveis para cada jogador se resumem a confessar

(c) ou negar (N):

Estratégia de B Estratégia de A

C N

C (-E;-6) (-2;-10)

N (-10;-2) (-4;-4)

- ~

A descrição acima supoe que o jogo se rc~lize com info~

maçao imperfeita, isto é, que A e B tenham que fazer suas esco-lhas ignorando a do parceiro. Se A fosse o primeiro a decidir e B

(16)

d) confessar se A tiver negado, negar se A tiver confessado.

Vejamos agora o caso do Nim. No primeiro lance, A pode mandar o jogo para BI ou para B

2. Na primeira hipótese, o curso do jogo independe de qualquer outra decisão de A. Na segunda, A só tem mais de uma opção se o jogador B, no seu primeiro lance, tiver mandado o jogo para A4. Nesse caso, A tanto pode mandar o jogo para B4 quanto para B5. Em suma, A só dispõe de três estra-tégias, isto é, possíveis planos de jogo:

AI mandar o jogo para BI no primeiro lance;

AlI mandar o jogo para B2 no primeiro lance; posteriormente, se B mandar o jogo para A4' mandar o jogo para B4;

A

III: mandar o jogo para B2 no primeiro lance; posteriormente, se B tiver mandado o jogo para A4' mandar o jogo para BS.

,

.

Vejamos agora os posslvels planos para B. Se, inicial-mente, A tiver mandado o jogo para BI' B pOderá mandar o jogo pa-ra A2 ou A~. Se A tiver mancado o jogo para B2' B poderá respon-der m~~dando o jogo ~dra A4' AS ou A6. Em qualquer das hipóteses, a post0:-ior e\ic] "'·'.2n do jogo independe de qualquer decisão de B. Isto posto, há seis e a~~Das seis estratégias para B:

B

I BI-A2 ou B2-A4 B

II· : BI-A2 ou B2-AS B

III: BI-A2 ou B2-A6 B

IV BI-A3 ou B2-A4 BV BI-A3 ou B2-AS B

(17)

.16.

A primeira estratégia indicando "se r; jogo estiver em

B1 , mandá-lo para A2 , se estiver em B2 mandá-lo para A4"' e assim

por diante.

A representação matricial do jogo (com os pay-offs de A) é a que se segue:

BI B

II BIII BIV BV BVI

AI 1 1 1 -1 -1 -1

AlI -1 1 -1 -1 1 -1

A

III 1 1 -1 1 1 -1

A representação matricial confirma o que já se viu an-teriormente: B ganha o jogo escolhendo a estratégia B

VI'

Cuidemos agora da mini-porrinha. A tem que tomar duas

~2cisões independentes: quantos palitos de fósforo

.. U\..lV e que número (2,3 ou 4) estimar para o total de p~:' ~ '::::::.

Is-to posIs-to, há seis estratégias possíveis para A:

Estratégia Palitos na mao Total anunciado

AI 1 2

A

2 1 3

A3 1 4

A4 2 2

AS 2 3

(18)

Obviamente as estratégias A3 e A4 sa0 absolutamente es-túpidas, pois se A tem um só palito na mão o total nao pode ser quatro, e se A tem dois palitos o total não pode ser dois. Acon-tece que até agora nao estamos interessados em examinar se os jogadores sao ou não inteligentes, mas apenas o que lhes é permi-tido fazer.

Vejamos agora as estratégias de B. Elas se compoem de dois passos também independentes. O primeiro consiste em escolher quantos palitos esconder na mao. O segundo é um plano de respos-ta ao torespos-tal estimado por A, isto é, uma função f(x), definida e com valores no conjunto (2;3;4), tal que f(x)

F

x. Há oito

fun-,

.

çoes posslvels dessa natureza. Corno B pode ter escondido um ou dois palitos de fósforo, segue-se que há dezesseis possíveis planos de jogo P?ra B:

Estratégia Palitos na mao f(2);f(3);f(4)

BI I (3 2 2)

B

2 1 (3 2 3)

B3 I (~ 4 2)

B4 I (3 4 ~ ;

BS 1 (4 2 2)

B6 1 (4 2 3)

B7 I (4 4 2)

Ba 1 (4 4 3)

Bg 2 ( 3 2 2)

BIO 2 (3 2 3)

BII 2 (3 4 2)

B

l2 2 (3 4 3)

(19)

.18.

Estratégia Palitos na mao f(2)if(3)if(4)

B

14 2 (4 2 3)

BIS 2 (4 4 2)

B16 2 (4 4 3)

A matriz representativa da mini-porrinha (com os pay--offs de A) é, pois,a seguinte:

B

1 B2 B3 B4 BS B6 B7 BS B9 B10 Bn B12 B13 B14 BIS B

16

AI 1 1 1 1 1 1 1 1 -1 -1 -1 -1 O O O O

A

2 -1 -1 O O -1 -1 O O 1 1 1 1 1 1 1 1

A3 -1 O -1 O -1 O -1 O O -1 O -1 O -1 O -1

A4 -1 -1 -1 -1 O O O O O O O O -1 -1 -1 -1

AS 1 1 1 1 1 1 1 1 O O -1 -1 O O -1 -1

(20)

l.S} Dominância, max~zn, equilíbrio de Nash

Analisemos agora os critérios de tomada racional de de-cisões em jogos não cooperativos. A teoria gravita em torno de três conceitos centrais, dominância, maxmin e equilíbrio de Nash. Embora a discussão da presente secção se limite a jogos bi-matri-ciais, a maioria dos resultados se estende naturalmente a casos mais gerais.

Diz-se que uma estratégia S .. do jogador j domina a sua

1J

estratégia Skj quando, qualquer que seja a combinação de estra-tégias dos demais jogadores, S .. lhe proporciona ganhos maiores

1J

ou iguais do que Skj' sendo estritamente maiores pelo menos para alguma combinação de estratégias dos demais participantes do jo-go. Especificamente, no caso de jogos bi-matriciais:

i) a estratégia A. do primeiro jogador domina a sua

es-1

tratégia Ak quando a

ij ~ akj para j = 1,2, ... ,n, valendo a de-sigualdade estrita para algum índice j;

ii) a estratégia B d0 segundo jogado~ domina a sua

es-r

tratégia B quando b. ~ b. V""l:ra 1 0- 1.:.> . . . . , m, valendo a

de-s 1r 1S

sigualdade estrita para algum índice i.

A título de exemplo, no Nim 2x2 a estratégia AIII do primeiro jogador domina a sua estratégia AlI. A estratégia BV1 do segundo jogador domina qualquer outra de suas estratégias. No di-lema dos prisioneiros, a estratégia "confessar" domina a estraté-gia "negar" para ambos os participantes.

(21)

indi-~---~

-FUNDAÇÃO GETÚLIO VARG~

Riblioteca Mário Henrique Simoht~ri

víduo num jogo nao cooperativo é algo muito simples quando ele dispõe de urna estratégia dominante, isto é, de urna estratégia que domine todas as demais, tal corno B

VI para o segundo jogador' no Nim 2x2 e "confessar" no dilema dos prisioneiros. O indivíduo, no caso, nao precisa preocupar-se em saber se os demais jogadores são ou não racionais, pois isso não altera a sua escolha, que de-ve recair sobre a estratégia dominante.

Infelizmente, na maioria dos jogos interessantes nao existem estratégias dominantes para os jogadores. Isso nos leva a dois outros conceitos bem mais controversos de comportamento racional.

O primeiro é o de "maxmin". O "maxmin", para cada jo-gador, é o ganho mínimo que ele pode assegurar para si, indepen-dentemente das estratégias dos demais jogadores, escolhendo pru-dentemente a sua estratégia. Em jogos bi-matriciais, o maximin de A e B são expressos por:

V

A = mêlÀ min a.

i j 1j

• T

=

max m1n b .

\In

1j

~

j 1

Urna estratégia que assegure ao jogador um ganho m1n1-,.

.

mo igual ao seu maxmin é dita urna estratégia de maxmin. A

títu-lo de exemptítu-lo, no jogo bi-matricial abaixo:

(22)

Escolhendo a estratégia AI' o primeiro jogador, depen-dendo da opção do segundo, tanto pode ganhar 10 quanto -10; esco-lhendo AlI' pode ganhar 9 ou 8. Isto posto, AlI é a estratégia do maxmin para o primeiro jogador, garantindo-lhe um ganho pelo me-nos igual a 8. Do mesmo modo, B

II é a estratégia de maxmin para o segundo jogador.

A idéia de maxmin é a de açao tão prudente quanto pos-sível, típica do jogador que teme enfrentar um bando de loucos. Quando existe uma estratégia dominante, o jogo do maxmin é obvia-mente racional, por força do seguinte:

Teorema 1.1:

Demonstração:

Uma estratégia dominante e , uma estratégia de maxmin.

Suponhamos que, num jogo bi-matricial, o jogador A disponha de uma estratégia dominante Ak. Então,por definição:

Logo:

min j a igualdade

V A =

~ a ..

1J para

a

kj ~ min

j

valendo para mln a

kj = j

1

=

1,2, . . . ,n.

a (i=l, 2, ... ,n) - I

i=k. Segue-se que: max min a kj ·

i j

(23)

.22.

uma estratégia de maxmin, é supor que os jogadores Vlvam na re-tranca do pessimismo. Em casos simples, como o da mini-porrinha, essa retranca a nada leva, no sentido de que qualquer estratégia possível é uma estratégia de maxmin, quer para A que para B. Ou seja, ela pode condenar quem queira viver defensivamente ao pior dos mundos.

Isso nos leva a um terceiro conceito fundamental da teoria dos jogos não cooperativos, o de equilíbrio de Nash. Tra-ta-se de uma combinação de estratégias, uma para cada participan-te, tal que nenhum jogador possa aumentar seu ganho mudando unilateral mente de estratégia. Em jogos bi-matriciais, trata-se de um par

(Ak,Br) de estratégias, uma para cada jogador, tal que:

( i= 1, 2, ... , m) (j=1,2, ... ,n)

A idéia é uma extensão de uma construção econômica cláâ sica e qu~ será descri ta m?.:Ls adiante, a de equilíbrio de Cournot para S 01igop6lio, a~cesentada em 1838. Um equilíbrio de Nash

corresp8nde

à

~a~~~~alidade dos participantes de um jogo não coo-perativo num sentido ba~tante restrito: a de uma combinação de estratégias que, se for orquestrada, não decepciona os partici-pantes, no sentido de que nenhum se arrepende da estratégia que adotou.

(24)

que jogadores racionais acertam na mosca um equilíbrio de Nash.

Num primeiro caso particular a resposta é simples, quan do cada jogador dispõe de uma estratégia dominante, como no dile-ma dos prisioneiros. Isso resulta do seguinte:

Teorema 1.2: Uma combinação de estratégias dominantes

num jogo bi-matricial é um equilíbrio de Nash.

Demonstração: Por hipótese, a

kr ~ air, para i=1,2, ... ,m e b

kr ~ bkj para j=1,2, ... ,n.

Num outro caso também é fácil associar racionalidade a equilíbrio de Nash: aquele em que uma combinação de estratégias de maxmin fornece um equilíbrio de Nash. Basta, aí, supor que ca-da jogador seja prudente. Isso é o que ocorre em jogos de duas pessoas-soma zero com um equilíbrio de Nash,conforme demonstra o:

Teorema 1.3:

Demonstração:

Seja [ao o] a matriz mxn de ganhos do jogador A num

1J

jogo de duas ppssoas-soma zero. Admitamos que o par d0 estratégias (AkiBr) seja um equilíbrio de

~a~n. Então, indicando por v

A e vB o maxmin de ca-da um ~~S jogadores:

=

-v B

Por hipótese a

kr ~ air (i=l, ... ,m) e (j=l, ... ,n).

o

que implica: max

i

ao 1 r

,

Como o jogo e de soma zero, b o o=-a o o,

1J 1J

(i=l, ... ,m) i (j=l, ... ,n)

(25)

·24.

Em suma, se o par de estratégias (Ak;~r) for um equili brio de Nash, o elemento a

kr da matriz de ganhos do jogador de A

ser~ um ponto de sela, isto é, um elemento mínimo na linha k e

m~ximo na coluna r. Daí se segue imediatamente que:

A título de exemplo, tomemos o jogo de duas pessoas--soma zero onde a matriz de ganhos do jogador A é:

B

I BII BIII BIV BV BIV

AI 3 O -2 1 -3 -4

AlI 3 2 O 1 1 1

AIII 8 -7 -1 O 9 -8

Basta que o jogador A seja prudente ou admita que B se-ja ~'rudente para que escolha a estratégia AlI' Pelo mesmo é:.

'9"1,-mento, o jogador B escolher~ B

III. Isto posto, chega-s2 ~mediata­ mente ao equilíbrio de Nash (AII;BIII)'

Fora casos particulares como os acima apresentados, a associação entre comportamento racional em jogos não cooperativos e equilíbrio de Nash é problem~tica. Com efeito, para cada joga-dor, escolher uma estratégia que leva a um tal equilíbrio so , e ,

(26)

decisão do parceiro.

Como primeiro exemplo sobre a fragilidade da associação entre comportamento racional e equilíbrio de Nash, tomemos o jogo

. . . (+)

bl.-matrl.cl.al:

(20;20) (-20;20)

(18;18) (16;16)

o

único equilíbrio de Nash é a combinação de estratégia (Al;B

l ). Como Bl é a estratégia dominante para o segundo jogador, A não hesitará em escolher AI se confiar cegamente na racionalid~

de do parceiro. Sucede que, no caso,se B escolher B

2 ao invés de Bl' nada terá a perder se A escolher AI' e pouco perderá se A es-colher A

2. Já para o jogador A, escolher AI será um desastre se

r:

0ptar por B

2. Não é de surpreender, nessas condições, ar:. .... A, que

+~m que tomar sua decisão sem conhecer a de R, opte pr I~

~~traté-gia de maxmin A 2.

o

exemplo acima mostra o principal problema na associa-çao entre comportamento racional e equilíbrio de Nash. Para al-guns participantes do jogo, pode ser extremamente imprudente es-colher estratégias conducentes a um tal equilíbrio sem a garantia de que todos os demais jogadores façam o mesmo, o dilema do joga-dor A no exemplo acima. A explicação convencional usada para

as-(+) Para identificar um equilíbrio de Nash num jogo bi-matricial, há uma re-gri Rrática muito simples: basta descobrir uma casa onde o ganho de A

(27)

.26.

sociar racionalidade pm jogos nao cooperativos a equilíbrio de Nash consiste em engajar cada jogador num exercício mental. Cada um veste não só a própria pele, mas também a dos parceiros, so , parando a indagação sobre "eu penso que você pensa que eu penso que você pensa" quando se chegar a urna combinação de estratégias na qual ninguém possa lucrar mudando unilateralmente a sua decisão". Infelizmente essa explicação nada explica, pois ela equivale a postular que comportamento racional é acertar um equilíbrio àe

Nash na mosca. De resto, o exercício mental só faz sentido se se admitir (o que é uma hipótese gratuita num jogo de informação im-perfeita) que os demais parceiros se envolvam num exercício seme-lhante.

,

Quanto maior o numero de participantes de um jogo nao cooperativo sem estratégias dominantes ou onde o equilíbrio de Nash não corresponde a uma combinação de estratégias de maxmin, mais temerário se torna escolher uma estratégia conducénte a um tal equilíbrio sem a garantia de que os demais decidam da mesma forma. Um exercício interessante jogo da metêoc da média. N pessoas são convocadas a e2~rp.ver num ped?;o np. naneI um nume-, ro real no intervalo fechado

[O;l].

por x. o numero , e~

1

colhido pelo iésimo participante (que deve escoll1er xi desconhe-cendo a opção dos demais), computa-se a metade s da média:

s :; _1_

2N

N

E

i:;l o ganho de cada jogador sendo:

S.

1

i) 100 dólares, se xi :; s, isto é, se sua escolha ti-ver coincidido da metade da média;

ii) O, se x. > s, isto é, se sua escolha tiver

ultrapas-1

(28)

iii) -100 dólares (perda) se lha ficar abaixo da metade da m~dia.

X.

1 < s, icto ~ se sua

esco-É fácil verificar que o único equilíbrio de Nash se al-cança quando todos os jogadores escrevem zero no seu papelucho individual. Se todos agirem dessa forma, cada qual ganhará 100 dólares. Sucede que basta que um jogador escreva um número acima de zero para que quem tiver escolhido zero fique abaixo da

m~-dia e com isso perca 100 dólares, ao inv~s de ganhar a mesma quantia. Isso ~ o suficiente para que agentes racionais, mas com um mínimo de prudência, prefiram errar por excesso do que por falta, já que o excesso nada lhes custa. É muito fácil testar es-se jogo numa sala de aula com alunos pós-graduados de matemática, engenharia ou economia. E, desde que se impeça qualquer comunica-ção entre os participantes, como se supoe na teoria dos jogos nao cooperativos, ~ muito improvável que se chegue imediatamente ao equilíbrio de Nash.

Um terceiro exemplo em que a associação entre rac;ona-lidade e equilíbrio de Nash ~ mais do que problemática, e forne-cido pelo jogo bi-matricial:

(-20;-20) (15;-15) (-15;15) (10;10)

(29)

trans-.28.

cende a idéia de equilíbrio de Nash. Com efeito, se o primeiro jogador tentar forçar o que lhe é o melhor equilíbrio de Nash, jogando Ar' e o segundo agir da mesma forma jogando Br' o resul-tado será o pior dos mundos para ambos, com ganhos negativos

(-20;-20). O bom senso sugere que a melhor combinação para ambos é (Arr;B

rr). Trata-se de uma combinação de estratégias de maxmin, mas não de um equilíbrio de Nash.

A discussão precedente sublinha um ponto essencial: salvo em casos especiais, o que seja comportamento racional num jogo não cooperativo é um conceito ambíguo. A matemática, que não tolera ambigüidades, explora amplamente as propriedades da-quilo que se pode definir com precisão, um equilíbrio de Nash. Resta apenas lembrar que o conceito de equilíbrio de Nash é o de sabedoria a posteriori: uma combinação de estratégias que, termi-nado o jogo, não deixa ninguém arrependido. Trata-se, ~e certo modo, de uma associação espúria entre Aristóteles e Darwin, e que qualifica como racional quem sobreviveu à seleção natural. E que

d8j~a sem resposta o que realmente constitui a indagação rel~~an­

(30)

1.6} Jogos repetidos

Cuidemos agora dos superjogos, isto é, dos jogos repe-tidos. Na presente secção analisaremos especificamente o seguin-te super jogo: "um mesmo jogo bi-matricial é repetido p vezes; ao final de cada etapa, cada participante torna conhecimento da es-tratégia escolhida pelo outro. O ganho final de cada jogador e a ,

média aritmética dos ganhos contabilizados em etapa".

A diferença entre o superjogo e p repetições indepen-dentes do mesmo jogo está no conceito de estratégia, pelo menos quando se supoe memória perfeita. De fato, há agora dois concei-tos a distinguir, o de estratégia no superjogo e o de escolha em cada jogada. Estratégia, no superjogo, é um plano de açao para cada jogada, função da história até então conhecida do jogo.

Para esclarecer a questão, consideremos o jogo bi-matri cial em que cada jogador dispõe de duas estratégias:

Consideremos o super jogo correspondente a dois lances sucessivos desse jogo bi-matricial. No primeiro lance, é óbvio que cada participante dispõe apenas de duas opções possíveis, ou A

(31)

.30.

mas de dois para oito, o leque de estratégias de cada participante do superjogo. De fato, os possíveis planos de A para o superjogo sao agora:

Estratégia de A lQ lance 2 Q lance, se no lQ B tiver escolhido

Bl B2

AI AI AI AI

AlI AI AI A2

A

lII AI A2 AI

A

IV AI A2 A2

~

A

2 AI Ar

~I

A

2 Ar A2

~lI

A

2 A2 AI

~lll

A2 A2 A2

Da mesma maneira, os possíveis planos de jogo para B sao:

r

Estratégia de B

I

BI

BIl

BIll

Brv

BV

BVI

BVII

BVllI

(32)

Assim por exemplo, a combinação de e~tratégias (AIII,B V) implica as realizações (A

l ,B2) no primeiro lance, (A2,Bl ) no se-gundo. A combinação (AVI,BVII) leva às realizações (A

2,B2) e (A2 ,B l ), e assim sucessivamente. Com um pouco de paciência, é fá-cil verificar que os ganhos no superjogo em questão são dados por:

B

I BII BIII BIV BV BVI BVII BVIII

AI a a e e e e b b

AlI a a e e h h 1- i

A

III f f g g e e b b

A

IV f f g g h h i i

AV f h f h g i g

1-~I

f h f h j d j d

~II

c j c j g i g

1-A

VIII c j c j j d j d

onS0:

a

=

(all;b ll ) b

=

(a

12;b12) c

=

(a

2l;b2l) d

=

(a

22;b22) e

=

(O,5(a

ll+a12); O,5(bll+b12» f

=

(O,5(a

ll+a21); O,5(bll+b2l» g = (O,5(a

ll+a22); O,5(b2l+b22»

h

=

(O,5(a

12+a21); O,5(b12+b2l» i = (O,5(a

12+a22); O,5(b12+b22» j = (O,5(a

(33)

.32.

Até que ponto é vantajoso para cada jogador condicio-nar cada lance

à

história conhecida do superjogo é questão a dis-cutir. Em alguns casos a resposta é positiva, noutros negativa. De qualquer forma, a especificação das estratégias no superjogo cobre os dois tipos de comportamento. Assim, no exemplo apresen-tado,as estratégias AI' AIV' AV e AVIII do primeiro jogador (as-sim corno as correspondentes do segundo) estabelecem um comporta-mento determinístico, no sentido de que as decisões do primeiro

jogador independem do que o parceiro resolver no primeiro lance.

as estratégias AlI' AIII , AVI e AVII tornam o segundo lance do primeiro jogador dependente do primeiro lance do segundo.

Suponhamos que a combinação de estratégias (A , B )

r s

seja o único equilíbrio de Nash de um jogo bi-matricial. Tornemos o super jogo correspondente a p lances consecutivos do jogo bi-ma-tricial, cada participante (cuja memória se supõe perfeita) sendo informado ao cabo de cada lance da escolha do outro. É claro que, nesse caso, a combinação de estratégias (AR,B

S) onde AR e BS sig-,

n ~[icam escolher incondicionalmente A e B em todos os 12:"~ds e

r s

~',.,., ~~'.lilíbr io de Nash do super jogo. Resta indagar se 1""" <=>y; stem

outros equilíbrios de Nash no super jogo em questão. Para t~~to,tº

memos o jogo bi-matricial:

(20;20) (18;18)

(-20;20) (16;16)

o

único equilíbrio de Nash é (Al;B

(34)

I

\

bi-matricial, os ganhos finais de cada participante sendo a me-, dia aritm~tica dos ganhos contabilizados em cada lance. O

super-jogo descreve-se, na forma estrat~gica, por:

Ar I (20; 20) 1I (20; 20) I (O; 20)

AlI [(20;20) 11(20;20) 1 (0;20)

(0;20) (0;20) (0;20) (-20;20) (-20;20)

(0;20) (-1;19) (-1;19) (-2;18) (-2;18)

Arrr (19;19) (19;19) (18;18) (18;18) (0;20) (0;20) (-20;20) (-20;20)

Arv (19;19) (19;19) (18;18) (18;18) (-1;19) (-1;19) (-2;18) (-2;18)

Av (19;19) (-1;19) 1(19;19)J (-1;19) (18;18) (-2;18) (18;18) (-2;18)

Avr (19;19) (-1;19) 1(19;19)1 (-1;19) (17;17) (16;16) (17;17) (16;16)

Avr (18;18) (17;17) (18;18) (17;17) 1(18;18)1 (-2;18) 1(18;18)1 (-2;18)

Avrrr (18;18) (17;17) (18;18) (17;17) (17;17) (16;16) (17;17) (16;16)

Para identificar os equilíbrios de Nash nessa bi-;,':..triz

8

x

8 basta aplicar o crit~rio pr~tico j~ enunciado e~ -~.~ de

rodap~; uma casa ~ equilíbrio de Nash se e somente se nem A ~udeL

!c61horar na coluna nem B puder melhorar na linha correspondente. Encontram-se assim os oitos equilíbrios de Nash envolvidos

retângulos:

Equilíbrio Realizações em cada lance

(Al;Bl ) (Al;B l )

(Al;Bl ) (Al;B l ) (Al;B l )

(35)

.34.

Equilíbrio Realizações em cada lance

I!! 2!!

(Arr;B rr ) (Al;B

l ) (Al;Bl )

(Av;Brrr) (A

2;Bl ) (AI;BI )

(Avr;Brrr) (A2;Bl ) (AI;B I )

(Avrr;B v ) (A

2;B2) (AI;Bl )

(Avrr;Bvrr) (A2;B2) (Al;B

I )

Todos esses equilíbrios retratam s~bedoria a posteriori, no sentido de que, dada a estratégia do parceiro, ninguém se ar-repende do que fez. O exercício serve para mostrar corno a repeti-ção de um jogo pode ampliar o número de equilíbrios de Nash.

Resta examinar corno cada um desses equilíbrios adere , a noçao comum de racionalidade a priori. Para tanto, lembremos as características do jogo bi-matricial (2x2) que deu origem ao su-perjogo; i) B dispõe de urna e~tratégia dominante BI' mas pouco tem a pc,-::er se escolher :8

2; ii) (AI;BI ) é o único equilíbrio de

Nash, jogar AI e o parceiro jogar

B

2; iii) jogando A2, c primeiro jogador deixa de ganhar se B optar pela sua estratégia dominante B

I; mas defende-se com um sa-tisfatório maxmin caso B escolha B2.

Isto posto, examinemos as estratégias de A e de B en-volvidas nos oito equilíbrios de Nash no superjogo:

(36)

ii) Arr: o primeiro jogador começa com AI' na suposição de que o segundo opte pela estratégia dominante BI. Caso verifi-que verifi-que B agiu dessa forma, repete AI no segundo lance. Caso ob-serve que, no primeiro lance, B escolheu B

2, passa no segundo

,

a estratégia de maxmin A

2. Trata-se de uma estratégia sensata; iii) AV: o primeiro jogador prudentemente toma a estraté-gia de maxmin no primeiro lance, esperando com isso convencer o adversário a escolher a estratégia dominante no segundo lance; isso posto, joga AI no segundo lance. Trata-se de uma sinalização algo arriscada, mas psicologicamente justifi6ável;

iv) Avr: no primeiro lance, o primeiro jogador caminha prudentemente com a estratégia de maxmin A2. No segundo passa pa-ra AloU repete A

2 conforme o outro jogador tenha escolhido BI ou B

2 no primeiro lance;

v) Br: trata-se do modelo de comportamento racional pa-ra o segundo jogador, qual seja, optar pela sua estpa-ratégia domi-nante;

vi) B

1r: e~0r~a nao se trate da estratégia dominante, B pouco ~em a P0L~L- se adotá-la, ao invés de Br. A intenção é pu-nir o jogador A, caso 2~Le comece o primeiro lance com a estraté-gia de maxmin: para tanto, B joga BI no primeiro lance e, no se-gundo, joga BI ou B

2 conforme A tenha escolhido no primeiro lance AloU A

2. Trata-se de uma estratégia psicologicamente

compreensí-vel, ainda que fora do melhor padrão de comportamento racional; vii) B

(37)

.36.

viii) BV: trata-se de um comportamento 0~tranho do segundo jogador, que opta no primeiro lance pela estratégia dominada B

2; ix) Bvrr: o segundo jogador se comporta de forma dupla-mente estranha, optando pela estratégia dominada no primeiro lan-ce, e reagindo à escolha de A no primeiro lance com o sistema de prêmios e punições às avessas da estratégia Brrr.

Em SUffiu, dos oito equilíbrios de Nash, apenas as

com-binações (Arr;Br ) e (Arr;B

rr) envolvem comportamentos plausíveis de ambos os jogadores. Nos outros seis, pelo menos um dos parti-cipantes se comporta de modo estranho. Já a combinação bem mais atrativa ao senso comum (Avr;B

r ) em que A é cauteloso e em que B escolhe sempre a sua estratégia dominante não é um equilíbrio de Nash.

Vejamos um outro exemplo, o do superjogo em dois lances do jogo bi-matricial:

(-20;-20) (16;-16)

(-16;16) (10;10)

(38)

Br

Bn

Brn

Brv

BV

Bvr

Bvn

~vrn

AI (-20j-20) (-20j-20) (-2j-18) (-2j-18) (-2j-18) ·(-2 j -18) 106j-16) 1 106j-16)

I

AlI (-20:-20) (-20j-20) (-2j-18) (-2j-18) 1 (Oj O) 1 (OjO) (13j-3) (13j-3) AIII (-18j-2) (-18j-2) (-5j-5) (-5j-5) (-2j-18) (-2j-18) 06j-16) 06j-16) A

IV (-18j-2) (-18j-2) (-5j-5) (-5j-5) I(OjO) 1 (OjO) (13j-3) 03j-3) AV (-18j-2) I( Oj O) 1 (-18j-2) I(Oj O) 1 (-5j-5) (13j-3) (OjO) (13j-3) AVI (-18j-2) (OjO) (~18j-2) (OjO) (-3j 13) .<10j10) (-3j13) 00jl0) AVII

I

(-16j 16) 1 (-3j 13) (-16j16) (-3j 13) (-5j-5) (13j-3) (-5j-5) (13j-3) AVIII

I

(-16j16) 1 (-3j13) (-16j16) (-3j13) (-3j 13) (lOj 10) (-3j13) 00j10)

Os oito equilíbrios de Nash do superjogo realizam, nos dois lances, os dois equilíbrios de Nash do jogo bi-matricial

(2x2), (A

I ;B2) ou (A2;Bl ) ou sucessiva ou alternadamente. O que parece o compromisso sensato, a combinação de estrat~gids (A

2;B2) não ~ um equilíbrio de Nash do s .... J~erjogo.

Vale explorar algumas I,Toprieú~C~~ do super jogo corres-pondente a duas jogadas sucessivas do mesmo jogo bi-matricial m x n. No primeiro lance, o primeiro jogador escolhe a estrat~gia

r, o segundo a estrat~gia s; no segundo, o primeiro escolhe a

es-trat~gia f(s), o segundo a estratégia g(r). Isto posto, uma

es-trat~gia de A no superjogo ~ o par de números inteiros (rif(s». Uma estrat~gia de B, o par (s,g(r». No caso, g(r) ~ uma função definida no conjunto dos inteiros I a m e com valores no conjunto dos inteiros· I a n; f(s) com domínio nos inteiros de I a n e com

(39)

.38.

Suponhamos que o par de estrat~gias (r;f(s» (s;g(r) ) seja um equilíbrio de Nash do superjogo. Isso implica que, para qualquer inteiro i de I a m, para qualquer inteiro j de I a n, e para quaisquer funções de reação fi (s) e gl (r):

a

rs a. 1S + a fl (s)g(i) (1) ( 2)

Particularizemos essas desigualdades tomando i=r e j=s. Como as funções de reação podem ser escolhidas de modo a se ter fi (s) igual a qualquer inteiro de I a m e gl (r) igual a qualquer inteiro de I a n, segue-se, tomando i=r e j=s, que:

(p= I, . . . , m)

(q= I, . . . , n)

Isso significa que o equilíbrio de Nash do super jogo realiza, n0 lance final, um 2quilíbrio de Nash do jogo bi-matri-cial c .... :iginal, como ~_usinuam os dois exemplos acima discutidos.

J~ para o p~jmeiro lance, nao se pode assegurar que a realização do equilíbrio de Nash no superjogo também seja um e-quilíbrio de Nash do jogo bi-matricial. A razão, analiticamente explicada pelas desigualdades (1) e (2), é que, ao alterar a es-colha no primeiro lance, cada jogador pode levar o parceiro a al-terar a escolha do segundo lance.

Não obstante,

é

possível obter uma desigualdade muito importante quanto aos ganhos no primeiro lance. Designemos por:

WA af(s)g(r)

(40)

Corno foi visto, esses sao os ganhos correspondentes a um equilíbrio de Nash do jogo bi-matricial simples. Observemos a-gora que, qualquer que seja a função de reação g(i) do segundo

,

jogador a primeira jogada do primeiro, A pode escolher fI (s) de modo a pelo menos lhe assegurar o seu maxm1n v

A. Do mesmo modo, B pode escolher gl(r) de modo a garantir seu maxmin v

B. Isto pos-to, as desigualdades (1) e (2) levam a:

a + w

A ~ a. + vA

rs 1S (i=l, ... ,m)

(j=l, ... ,n)

Num caso particular, essas desigualdades levam a uma conclusão extremamente importante, aquele em que todo equilíbrio de Nash também é um equilíbrio de maxmin, no sentido de que WA=vA e wB=vB. Nesse caso, pode-se assegurar que um equilíbrio de Nash do superjogo realiza, desde o primeiro lance, um equilíbrio de Nash do jogo matricial.

É fácil estp~0e~ a demonstração acima em duas direções: do mesmo jogo de 2 para p, sendo pu!;; inteiro p2sitivo. (Basta, para tanto, quebrar o super-jogo em dois lances de um ~rimeiro jogo bi-matricial correspon-dente ao primeiro lance, e um segundo corresponcorrespon-dente aos p-l úl-timos lances, e então raciocinar por indução finita); ii) esten-dendo de 2 para N o número de jogadores. Conclui-se que, se qual-quer equilíbrio de Nash é também um equilíbrio de maxmin, então o superjogo, em matéria de equilíbrios de Nash, é equivalente, em matéria de realizações, a p repetições independentes do mesmo

jo-.

,

(41)

, , - - - -- -

-.40.

o

equilíbrio de Nash de um jogo bi-matricial é um equi-líbrio de maxmin em dois casos particulares: i) nos jogos em que cada jogador dispõe de urna estratégia dominante; ii) nos jogos de duas pessoas-sorna zero com ponto de sela. Isso leva à conclu-sao de que, nesses casos, a repetição é incapaz de trazer novida-des em matéria de equilíbrios de Nash.

No caso dos jogos de duas pessoas-sorna zero com ponto de sela, a conclusão nada tem de surpreendente. Afinal, se, em ca-da lance, A pode garantir um ganho mínimo v

A e B um ganho mínimo vB' sendo vA+vB=O, não há por que imaginar que a repetição do jogo possa trazer qualquer novidade, quer o jogo seja repetido um nu-, mero finito ou infinito de vezes. De fato, o único sentido da re-petição é dar consistência prática ao conceito de estratégias mistas em jogos matriciais sem ponto de sela, assunto de que tra-taremos na próxima secção.

Já no caso do dilema dos prisioneiros, em que a estra-tégia dominante é confessar, e conclusão é decepcionante. Com e-feito, ~~ria de se p~ep~mir que a repetição levasse à cooperaçao.

(42)

(-20;-20) (16;-16) (-16;16) (10;10)

A combinação prudente e cooperativa (A

2;B2) nao fornece um equilíbrio de Nash se o jogo só for repetido um número finito de vezes. A estratégia de disparo, no caso, seria A jogar A

2 en-quanto B jogasse B2 e vice-versa, cada qual tratando de punir o outro que tomasse a iniciativa de querer lucrar

à

custa do prejui zo do outro.

Esse impasse leva ao estudo dos jogos nao cooperativos repetidos por um número infinito de vezes. Aí sim, as estratégias de disparo se transformam em equilíbrios de Nash. No dilema dos prisioneiros, cada um nega até que o outro confesse, e daí por diante confessa. A combinação dessas estratégias no jl':Jo infini-tamente repetido é um equilíbric ~e Nash, par~ o.~uJio dos matemá-ticos. E, cuja realização prát<"':d

é

a r"!..~. ~:cnciCt Ud racionalida-de coletiva sobre a individual já q~e ninguém c~nfessa em qual-quer lance do jogo. Na mesma linha, no jogo bi-matricial com e-quilíbrios de Nash conflitantes anteriormente apresentado, a com-binação de estratégias em que A escolhe A

2 enquanto B escolher B

2 passando para AI quando B tiver escolhido Bl e vice-versa, um equilíbrio de Nash do super jogo infinitamente repetido.

, e

Na realidade, a teoria dos jogos infinitamente repeti-dos é bem mais consentânea com o comportamento do mundo real do

, ,

(43)

jo-.42.

(44)

1.7) Estratégias mist3s

A análise precedente omitiu uma indagação essencial, a existência de equilíbrios de Nash em jogos bi-matriciais. Infe-lizmente tal existência não pode ser assegurada, pelo menos na medida em que o jogo é descrito como "A escolhe uma linha e B u-ma coluna do par de u-matrizes." A título de exemplo, tomemos o jo-go bi-matricial:

(10;6) (9;4)

(4;8) (10;3)

Em qualquer das quatro casas do par de matrizes, ou A pode melhorar mudando de coluna ou B pode aumentar seu ganho mu-dando de linha. Isso significa que nenhuma das quatro combinações possíveis de estratégias puras ~ um equilíbri0 de Nash.

Na mesma linha, tomem02 o jogo d~ ~~ns pessoas-soma ze-ro, onde os ganhos do primeiro jogador são dados por:

1

-1

-1

1

(45)

1

-.44.

isto

é,

um elemento que seja ao mesmo tempo mínimo de linha e ma-, ximo de coluna. O que seja comportamento racional, no caso, e uma , questão insolúvel, no sentido de que A pensará com seus botões:

IIse eu escolher AI o melhor para meu adversário será escolherB 2; mas se ele optar por B

2, melhor para mim será escolher A2; nesse caso, a melhor escolha de meu adversário será Bl , e aí o melhor para mim é voltar para AllI. B enfrenta o mesmo dilema.

Para contornar o problema, von Neumann inventou o con-ceito de estratégia mista, como tal entendida uma distribuição de probabilidades no conjunto das estratégias puras. Para

ilus-trar a questão, comecemos com os jogos bi-matriciais 2 x 2, do tipo:

'

-Se A escolhe AI com probabilidade l-x e A

2 com probabi-lidade x (O ~ x ~ 1) e se B escolhe Bl com probabilidade l-y e B

2 com probabilidade y (O ~ y ~ 1), tem-se um cujas possíveis realizações sao:

(Al;Bl ) com probabilidade (l-x)(l-y) (A

l ;B2) com probabilidade (l-x)y (A

2;Bl ) com probabilidade x(l-y) (A

2;B2) com probabilidade xy

(46)

Isto posto, os ganhos esperados de A e B sao:

w(A) = (l-x)(l-y)a

ll + (l-x)y a12 + x(l-y) a21 + xy a22 w(B) = (l-x)(l-y)b

ll + (l-x)y b12 + x(l-y) b21 + xy b22

Um equilíbrio de Nash é agora uma combinação de estra-tégias mistas, uma para cada jogador, tal que nem A possa aumen-tar seu ganho espêrado modificando unilateralmente x, nem B possa aumentar seu ganho esperado modificando unilateralmente y. No ca-so de jogos bi-matriciais com apenas duas estratégias puras para cada jogador é fácil calcular o equilíbrio de Nash com estraté-gias mistas.

Com efeito, tomemos as derivadas parciais:

FA(y)

=

dw(A)

=

(1-y)(a21-all) + y(a22-a12) . dX

FB(X) dw(B) (l-x) (b

12-bll) + x(b22-b21)

=

=

dy

Num equilíbrio de Nash deve-se ter simultane~illente:

? O; se x

=

O

=

O; se O < x < 1 O; se x = 1

~

~ O; se y = O

= O; se O < Y < 1

<:

O; se y = 1

(47)

.46.

a) pelo menos um jogador dispõe de urna estratégia domi-nante: nesse caso, há um equilíbrio de Nash com estratégias pu-ras (que são casos particulares de estratégias mistas), construí-do da seguinte forma: i) o jogaconstruí-dor que dispõe de estratégia construí- domi-nante escolhe essa estratégia; ii) presumida essa escolha, o ou-tro jogador toma a estratégia que lhe dê o maior ganho possí-vel;

b) nenhum jogador dispõe de uma estratégia dominante: nesse caso, (a21-all)(a22-a12) < O e (b12-bll)(b22-b21) < O. Sg

gue-se que FA(O)FA(l) < O e FB(O)FB(l) < O. Como as funções FA(y) e FB(X) são lineares, e portanto contínuas, existem x€(O;l) e i€(O;l) tais que FA(y)

=

FB(x) =

o.

Os valores de x e y sao ex-pressos, no caso por:

x

=

y

=

Assim, por exemplo, no jogo bi-matricial já apres:,:õ·::é'd·:):

(10;6) (4;8)

(9;4) (10;3)

obtém-se x = 2/3, y = 1/7. No equilíbrio de Nash com

gias mistas,o primeiro jogador escolhe lotericamente as estraté-gias AloU A

2 com probabilidades (1/3; 2/3), o segundo mistura B e B com probabilidades (6/7; 1/7). Nesse equilíbrio, os

ga-. 1 2

(48)

64

w(A} = ;

7

w(B}

=

14

3

Qual o significado prático do conceito de estratégia mista, eis uma questão que dá panos para mangas. À primeira vista, parece uma temeridade o jogador A misturar as estratégias para obter um ganho esperado de 64/7, mas com o risco de ganhar apenas 4 (se se realizar a combinação de estratégias (A

l ;B2}), ao

.

,

lnves de se ater

à

estratégia do maxmin,que lhe assegura um ganho pelo menos igual a 9

=

63/7. Há duas escapatórias, cada qual com os seus problemas.

A primeira, na linha de von Neumann e Morgenstern, con-siste em admitir que os ganhos de cada jogador sejam medidos em termos de utilidades e não em termos de pagamentos efetivos. As utilidades transformam os pagamentos por meio de funções. que hie-rarquizam as preferências de cada indivíduo diante de problemasde escolha envolvendo risco, conforme se verá no Capítulo IV. Dentro da t80ria, o objetivo de cada participante do jogo é o de maxirni· zar a utilidade esperada, dadas as escolhas estratégic?~ dos de-mais participantes. Isso dá pleno suporte

à

idéia de ~qtratés:~

mista. Surgem, no entanto, dois outros problemas. Primeiro, salvo para os indivíduos indiferentes ao risco, a utilidade da média nao é a média das utilidades. Isso torna bem mais complexa a teo-ria dos jogos repetidos. Além do mais, em jogos nao repetidos, torna-se essencial lembrar que jogos de duas pessoas - soma zero não necessariamente são jogos de soma de utilidade zero. (Esse é um ponto, aliás, muito importante, e que explica por que os po-bres não costumam jogar pôquer com os milionários).

(49)

.48.

mistas encontre abrigo na lei dos grandes números.

o

problema e , que,· como se viu na secção anterior, um mesmo jogo repetido n ve-zes não necessariamente equivale a n repetições independentes do mesmo jogo. De qualquer forma, a idéia pode ser defendida pois, como já se viu, a repetição de um equilíbrio de Nash no jogo for-nece um equilíbrio de Nash no superjogo.

Em qualquer hipótese, o conceito de estratégia mista fornece uma pista para o que seja comportamento racional em jogos onde não existem sequer equilíbrios de Nash com estratégias pu-ras, como no caso da mini-porrinha.

Voltando ao caso dos jogos bi-matriciais com apenas duas estratégias para cada participante, vale sublinhar um ponto fundamental: é possível que existam, ao mesmo tempo, equilíbrios de Nash com estratégias puras e equilíbrios de Nash com estraté-gias mistas. A título de exemplo, voltemos ao jogo bi-matricial:

(-20;-20) (15;-15)

(-15;15) (10;10)

Há dois equilíbrios de Nash com estratégias puras (A

(50)

o

conceito de estrat~gia mista se e3~ende naturalmente para os jogos bi-matriciais com m estrat~gias puras para o pri-meiro jogador e n para o segundo. Para tanto definamos o simplexo

k-l k

fundamental S do R como sendo o conjunto dos vetores do Rk com coordenadas nao negativas e de soma igual a 1:

k-l

I

S

=

{(Pl"" ,Pk) Pl ~ Oi •• • Pk ~ Oi Pl+'" .+Pk

=

I}

Uma estrat~gia mista para o primeiro jogador e um vetor ,

E: m-l estrat~gia mista segundo jogador

p S , uma para o um vetor

E: n-l Indicando p' a matriz lxm transposta da matriz

q S • por

co-luna p, os ganhos esperados de cada jogador, combinando as

estra-t~gias puras de acordo com os vetores de probabilidade p e q, se-rão dados por:

m w(A) = L

i=l m w(B) = L

i=l n L j=l n L j=l

a .. p.q.

1.J 1. J

b .. p.q.

1.J 1. 1.

=

=

p'Aq

p'Bq

Isto posto, um equilíbrio de Nash define-se

,_._--

UlT''''

combinação de estrat~gias (poiqo)' uma para cada jogador, --:"ll q,-le nénhum deles possa aumentar seu ganho mudando unilateralmente de

e&trat~gia, isto ~, tal que:

p' Aq ~ P Aq

o o o para

p' Bq ~ p' Bq

o o o para

todo

todo

m-l

p E: S

n-l

q E: S

Note-se que um equilíbrio de Nash com estrat~gias

pu-ras ~ tamb~m um equilíbrio de Nash no campo das estrat~gias

(51)

no campo restrito das estratégias puras:

a

rs ~ a. 1S

~ b .

rJ

(i=l, . . . . ,m)

(j=l, . . . . ,n)

.50.

m .ésima

Indicando por ei o vetor do R cuja 1 coordenada é

igual a 1 e as demais iguais a zero, e por f. o vetor do Rn

J cuja

.ésima d ' .

J coor enada e 19ual a 1 e as demais iguais a zero, as

desi-gualdades acima equivalem a:

e' Af ~ e! Af

r s 1 s e " B f ~ e' B f .

r s r J

(i=l, . . . . ,m)

(j=l, . . . . ,n)

Daí se segue que se p = (Pl' . . . . 'Pm) ,

e um vetor do

m-l

S , isto é, um vetor com coordenadas não negativas e soma 1:

p.e'AF ~ p.e!Af

1 r s 1 1 S (i=l, . • . . . ,m)

e por~anto, somando para i de 1 a m:

a = e'Af ~ p'Af

rs r s s

Do mesmo modo se conclui que:

= e'Bf > e'Bq

r s r para qualquer q E Sn-l.

Do ponto de vista analítica, a mágica do conceito de e~

tratégia mista é que ele transforma o conjunto de estratégias de

cada jogador num subconjunto convexo e compacto do Rk (o inteiro

k podendo variar de um jogador para outro). Com isso, consegue-se

provar a existência de pelo menos um equilíbrio de Nash não

(52)

pessoas. Cuidaremos do assunto no Capítulo 3. A demonstração e

(53)

.52.

1.8) O Oligopólio de Cournot

Corno se disse anteriormente, a idéia de equilíbrio de Nash num jogo não cooperativo é urna extensão do modelo de oligo-pólio desenvolvido por Cournot em seu "Recherches sur les princi-pes Mathématiques de la Théorie des Richesses" publicado em 1838. Vale apresentar esse modelo.

Cournot admite um mercado onde n empresas concorram pa-ra a produção de um produto homogêneo, onde a curva de demanda inversa é p = f (Q), sendo Q o total das quantidades vendidas pe-las n empresas por unidade de tempo. Designando por qi a quantidª

,

.

d e a pro UZl a pe a d 'd 1 1 .eSlma empresa por unl a e 'd d de tempo, por

C.(q.) o custo de produção dessa quantidade e supondo que as quaQ

1 1

tidades vendidas sejam iguais às produzidas, o lucro da 1 .ésima e~

presa será dado por:

L. (q.) = pq. - C. (q.) = q.f(ql+q2+ . . . +q ) - C. (q.)

1 1 1 1 1 1 n 1 1

A hipótese de Cournot é que cada empresa escolha 0_ de modo a maximizar o seu lucro tornando corno dadas as G'-.ctntidades produzidas pelas concorrentes. Isso equivale a tratar o 0]igopó-:Iio corno um jogo não cooperativo em que o campo de estratégias de cada participante é o conjunto dos reais não negativos. Um equi-líbrio de Cournot é assim um equiequi-líbrio de Nash.

Na discussão que se segue suporemos que L.(q.) seja con

1 1

tínua em todas as suas variáveis, côncava em ql' e que L.(q.)

ten-1 1

do a menos infinito quando qi tende para o infinito (esta última hipótese pode ser substituída pela de que cada empresa possua um limite máximo de produção q., o que restringe o campo de

estraté-1

gias de cada participante ao intervalo fechado

o

~ q. ~

q.).

Referências

Documentos relacionados

As palavras que se destacam são: gesto, linguagem, signos, encenação e teatralidade lidas pela Teoria dos Sistemas Dinâmicos e pe la Semiótica Cognitiva, a fim de investigar

A exemplo dos demais meios de comunicação, nessa mesma década, no ano de 1986, o gibi da Margarida foi lançado no Brasil com histórias produzidas por quadrinhistas brasileiros

O estudo da lógica da trisseção do cubo e o exercício de implementação desta lógica por meio de técnicas de desenho paramétrico resultaram na estruturação de um

Segundo Boziki; Silva; Printes (2011), a utilização de agrotóxicos, além de causar impactos ao meio ambiente, vem acometendo a saúde humana através da

Bens em exposição no local do leilão.... Bens em exposição no local

Após o sucesso nos Jogos Olímpicos do Rio de Janeiro, a Confederação Brasileira de Cano- agem tem mais um motivo para celebrar: a en- tidade renovou o contrato de patrocínio com a

Ser˜ ao reconstitu´ıdas etapas das aplica¸ c˜ oes da cicloide nos casos do pˆ endulo de Huygens, em que ela se comporta como is´ ocrona (mesmo tempo) e do problema da braquist´

O circuito deve ser montado conforme mostra o esquema de montagem apresentado na Figura 36. Neste os dois sensores de temperatura devem ser ligados em paralelo. Figura 36