• Nenhum resultado encontrado

Uma Introdução à Teoria Econômica dos Jogos

N/A
N/A
Protected

Academic year: 2019

Share "Uma Introdução à Teoria Econômica dos Jogos"

Copied!
191
0
0

Texto

(1)
(2)
(3)

Publicações Matemáticas

Uma Introdução

à Teoria Econômica dos Jogos

Humberto Bortolossi

UFF

Gilmar Garbugio

UESB

Brígida Sartini

UFRRJ

impa

26

o

(4)

Direitos reservados, 2007 pela Associação Instituto Nacional de Matemática Pura e Aplicada - IMPA Estrada Dona Castorina, 110

22460-320 Rio de Janeiro, RJ Impresso no Brasil / Printed in Brazil Capa: Noni Geiger / Sérgio R. Vaz

26o Colóquio Brasileiro de Matemática

• Aspectos Ergódicos da Teoria dos Números - Alexander Arbieto, Carlos Matheus e Carlos Gustavo Moreira

• Componentes Irredutíveis dos Espaços de Folheações - Alcides Lins Neto

• Elliptic Regularity and Free Boundary Problems: an Introduction - Eduardo V. Teixeira

• Hiperbolicidade, Estabilidade e Caos em Dimensão Um - Flavio Abdenur e Luiz Felipe Nobili França

• Introduction to Generalized Complex Geometry - Gil R. Cavalcanti

• Introduction to Tropical Geometry - Grigory Mikhalkin

• Introdução aos Algoritmos Randomizados - Celina de Figueiredo, Guilherme da Fonseca, Manoel Lemos e Vinicius de Sá

• Mathematical Aspects of Quantum Field Theory - Edson de Faria and Welington de Melo

• Métodos Estatísticos Não-Paramétricos e suas Aplicações - Aluisio Pinheiro e Hildete P. Pinheiro

• Moduli Spaces of Curves - Enrico Arbarello

• Noções de Informação Quântica - Marcelo O. Terra Cunha

• Three Dimensional Flows - Vítor Araújo e Maria José Pacifico

• Tópicos de Corpos Finitos com Aplicações em Criptografia e Teoria de Códigos - Ariane Masuda e Daniel Panario

• Tópicos Introdutórios à Análise Complexa Aplicada - André Nachbin e Ailín Ruiz de Zárate

• Uma Introdução à Mecânica Celeste - Sérgio B. Volchan

Uma Introdução à Teoria Econômica dos Jogos - Humberto Bortolossi, Gilmar Garbugio e Brígida Sartini

• Uma Introdução aos Sistemas Dinâmicos via Frações Contínuas - Lorenzo J. Díaz e Danielle de Rezende Jorge

ISBN: 978-85-244-0265-4 Distribuição: IMPA

(5)

H. J. B.

`

A minha m˜ae Rita e aos meus irm˜aos Humberto e Reginaldo.

B. A. S.

(6)
(7)

Sum´

ario

Pref´acio 3

1 Alguns marcos hist´oricos 5 2 Jogos na forma estrat´egica 10

2.1 O que ´e um jogo? . . . 10

2.2 Solu¸c˜oes de um jogo em estrat´egias puras . . . 13

2.2.1 Dominˆancia em estrat´egias puras . . . 14

2.2.2 Equil´ıbrio de Nash em estrat´egias puras . . . . 20

2.2.3 Rela¸c˜oes entre dominˆancia e equil´ıbrio de Nash 24 2.3 Estrat´egias mistas . . . 27

2.4 Solu¸c˜oes de um jogo em estrat´egias mistas . . . 31

2.4.1 Dominˆancia em estrat´egias mistas . . . 32

2.4.2 Equil´ıbrio de Nash em estrat´egias mistas . . . . 35

2.4.3 Rela¸c˜oes entre dominˆancia e equil´ıbrio de Nash 45 2.4.4 Como interpretar estrat´egias mistas? . . . 45

2.5 Jogos infinitos . . . 48

2.6 Exerc´ıcios . . . 50

3 O teorema de equil´ıbrio de Nash 60 3.1 Usando o teorema de Brouwer . . . 60

3.2 Usando o teorema de Kakutani . . . 65

3.3 Algumas propriedades dos equil´ıbrios de Nash . . . 69

3.4 Exerc´ıcios . . . 70

(8)

4 Calculando equil´ıbrios de Nash 71

4.1 Equil´ıbrio de Nash via um problema de otimiza¸c˜ao . . 71

4.2 Equil´ıbrio de Nash via equa¸c˜oes polinomiais . . . 74

4.3 Jogos de soma zero . . . 82

4.3.1 Jogos de soma constante com dois jogadores . . 82

4.3.2 Equil´ıbrio de Nash em estrat´egias puras . . . . 86

4.3.3 Equil´ıbrio de Nash em estrat´egias mistas . . . . 91

4.3.4 O teorema minimax de von Neumann . . . 93

4.4 Equil´ıbrio de Nash via um problema de complementa-ridade . . . 101

4.4.1 Jogos bimatriciais . . . 101

4.4.2 O algoritmo de Lemke-Howson . . . 104

4.5 Gambit . . . 104

4.6 Exerc´ıcios . . . 106

5 Jogos na forma extensa 108 5.1 Defini¸c˜ao . . . 108

5.2 Equil´ıbrio de Nash . . . 110

5.3 Indu¸c˜ao retroativa e equil´ıbrio perfeito em subjogos . . 114

5.4 O teorema de Kuhn-Zermelo . . . 118

5.5 Exerc´ıcios . . . 119

6 Exemplos 120 6.1 O jogo Le Her simplificado . . . 120

6.2 O modelo de duop´olio de Cournot . . . 126

6.3 O modelo de duop´olio de Bertrand . . . 129

6.4 O modelo de duop´olio de Stackelberg . . . 131

6.5 A trag´edia dos comuns . . . 133

A Convexidade 137 B Programa¸c˜ao Linear 145 C Respostas dos exerc´ıcios 155 Bibliografia 173

(9)

Pref´

acio

Ateoria dos jogos´e uma teoria matem´atica criada para se modelar

fenˆomenos que podem ser observados quando dois ou mais “agentes de

decis˜ao” interagem entre si. Ela fornece a linguagem para a descri¸c˜ao de processos de decis˜ao conscientes e objetivos envolvendo mais de um indiv´ıduo.

Suas aplica¸c˜oes incluem elei¸c˜oes, leil˜oes, balan¸co de poder, evolu-¸c˜ao gen´etica, etc. Ela tamb´em ´e uma teoria matem´atica pura, que pode e tem sido estudada como tal, sem a necessidade de relacion´a-la

com problemas comportamentais ou jogosper se.

Algumas pessoas acreditam que ateoria dos jogos formar´a, algum

dia, o alicerce de um conhecimento t´ecnico estrito de como decis˜oes s˜ao feitas e de como a economia funciona. A teoria ainda n˜ao atingiu este patamar e, hoje, ´e mais estudada em seus aspectos matem´aticos puros e, em aplica¸c˜oes, ela ´e usada como uma ferramenta ou alegoria que auxiliam no entendimento de sistemas mais complicados.

Neste texto trataremos da teoria matem´atica dos jogos n˜

ao-coope-rativos est´aticos de informa¸c˜ao completa e dos jogos dinˆamicos de

informa¸c˜ao perfeita.

A Teoria Econˆomica dos Jogos n˜ao deve ser confundida com a

Teoria Combinat´oria dos Jogos, iniciada por Sprague e Grundy na d´ecada de 30. Enquanto que a primeira tem motiva¸c˜oes predomi-nante econˆomicas e procura estabelecer m´etodos para se maximizar

o ganho (payoff), a segunda se concentra nos aspectos combinat´orios

de jogos de mesa (por exemplo, a estrat´egia do jogo de nim) e n˜ao

permite “elementos imprevis´ıveis” como o lan¸camento de um dado ou o embaralhamento de cartas.

Acreditamos que o assunto seja estimulante para o estudante de matem´atica: ele ter´a a oportunidade de ver como conceitos de an´alise,

(10)

topologia, otimiza¸c˜ao e probabilidade se integram em uma teoria apli-cada.

Agradecimentos

Gostar´ıamos de agradecer a Hilmar Ilton Santana Ferreira, Polya-ne Alves Santos e Larissa Santana Barreto, que participaram ativa-mente dos semin´arios sobre teoria dos jogos realizados no per´ıodo

2003-2004, momento no qual uma vers˜ao preliminar deste texto foi

escrita. Tamb´em gostar´ıamos de agradecer a Rita de C´assia Silva Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que leram o texto e fizeram v´arias sugest˜oes. Finalmente, gostar´ıamos de

agradecer a Se¸c˜ao de Referˆencia (SRE) da Divis˜ao de Bibliotecas e

Documenta¸c˜ao da PUC-Rio pela agilidade e eficiˆencia na aquisi¸c˜ao de alguns artigos dif´ıceis de se encontrar.

Humberto Jos´e Bortolossi Br´ıgida Alexandre Sartini

Gilmar Garbugio

(11)

Alguns marcos

hist´

oricos

Neste cap´ıtulo apresentaremos alguns marcos hist´oricos da teoria dos jogos relacionados principalmente com os t´opicos que iremos ex-plorar no texto. Para uma cronologia mais completa, recomendamos as referˆencias [46, 50, 65, 86, 95, 96].

O conceito de solu¸c˜ao de um jogo por estrat´egia mista1surgiu pela

primeira vez no estudo do jogoLe Her, realizado por James

Walde-grave e descrito por ele em uma carta a Pierre R´emond de Montmort, em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar

uma estrat´egia que maximizasse a probabilidade de vit´oria do

joga-dor, independentemente da escolha de estrat´egia de seu oponente. Este jogo foi discutido por Montmort e por Nicholas Bernoulli em 1713 e os resultados foram publicados nesse ano por Montmort, que incluiu a solu¸c˜ao de Waldegrave em um apˆendice.

Em 1838, Augustin Cournot publicou sua obra Recherches sur

les Principes Mathematiques de la Theorie des Richesses, na qual analisou um caso especial de duop´olio. As empresas decidiam as quantidades a produzir e Cournot definiu o conceito de equil´ıbrio de

1Uma estrat´egia pura ´e uma das escolhas que o jogador pode fazer. Uma

estrat´egia mista ´e uma distribui¸c˜ao de probabilidades sobre o conjunto de es-trat´egias puras. Defini¸c˜oes formais ser˜ao apresentadas no pr´oximo cap´ıtulo.

(12)

Figura 1.1: Antoine Augustin Cournot (1801–1877).

mercado como sendo a situa¸c˜ao em que ambas as empresas reagem

de forma ´otima `a decis˜ao da empresa concorrente. Este conceito

de solu¸c˜ao ´e uma vers˜ao do equil´ıbrio de Nash aplicado ao caso do duop´olio.

No in´ıcio do s´eculo XX, apareceram v´arios artigos sobreteoria dos jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo

de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die

Theorie des Schachspiels, afirmando que, em cada etapa do jogo, pelo menos um dos jogadores possui uma estrat´egia que o levar´a a vit´oria

ou ao empate. Contudo, Zermelo n˜ao demonstrou o teorema em seu

artigo. A primeira demonstra¸c˜ao foi dada por Laszlo Kalmar.

Apa-rentemente, foi Zermelo quem primeiro destacou o uso da semˆantica

de otimalidade em teoria dos jogos: “Whether one could calculate

with mathematical objectivity, or even give a participant some idea of, the value of a possible position in the game, as well as of the best move in this position: information without which the player would have to eliminate both subjective and psychological guesses and the opinions of ‘the perfect player’, etc.?” ([95]).

No per´ıodo de 1921 a 1927, ´Emile Borel publicou uma s´erie de

notas sobre jogos sim´etricos de soma zero com dois jogadores com

um n´umero finito n de estrat´egias puras para cada jogador. Borel

foi o primeiro a tentar formular matematicamente este jogo. Ele in-troduziu o conceito de “m´etodo de jogada” (o que hoje corresponde `a estrat´egia pura) e procurou por uma solu¸c˜ao em estrat´egias mis-tas (o que hoje ´e conhecido como solu¸c˜ao minimax). Em 1921, ele

(13)

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).

para n= 5 ([08]). Borel acreditava que o resultado de existˆencia

n˜ao seria v´alido para um n qualquer, mas como n˜ao encontrou um

contra-exemplo, deixou o problema em aberto.

Figura 1.3: F´elix Edouard Justin ´Emile Borel (1871-1956).

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando

topologia e c´alculo funcional ([50]), John von Neumann demonstrou a existˆencia de solu¸c˜ao em estrat´egias mistas de um jogo finito de soma zero com dois jogadores e um n´umero arbitr´ario de estrat´egias pura. Este artigo tamb´em introduziu a forma extensa de um jogo.

At´e a d´ecada de 40, os artigos publicados sobreteoria dos jogos

n˜ao tinham despertado muito o interesse dos cientistas sociais e de

outras ´areas que pesquisavam sobre conflitos de interesses. Talvez

isto se deva ao fato de que os artigos eram escritos por matem´aticos e publicados em revistas matem´aticas. Este panorama foi alterado

(14)

Behavior, escrito por John von Neumann e pelo economista Oskar

Morgenstern, um marco na teoria dos jogos.

Oskar Morgenstern John von Neumann

(1902-1977) (1903-1957)

Figura 1.4: Oskar Morgenstern e John von Neumann.

(15)

pesquisa-dores de diversas ´areas. Na reedi¸c˜ao de 1947, tomada como padr˜ao, os autores estabeleceram os axiomas da teoria da utilidade. O livro foi republicado em 1953 e sua mais recente edi¸c˜ao ´e de 1980.

Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua

tese de doutorado em 1949, sob o t´ıtuloNon-Cooperative Games. Ele

definiu o conceito deponto de equil´ıbrio, atualmente conhecido como

equil´ıbrio de Nash de um jogo e provou sua existˆencia para jogos n˜ao-cooperativos. Os resultados mais importantes de sua tese est˜ao no

artigoEquilibrium Points in N-Person Games de 1950 ([66]) e, mais

detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).

Ainda em 1950, Nash escreveu sobre o problema da barganha em

The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos

coo-perativos em Two Person Cooperative Games ([70]). Nestes, Nash

definiu o conceito de solu¸c˜ao da barganha de Nash em um jogo coo-perativo com dois jogadores, estabeleceu um sistema de axiomas que esta solu¸c˜ao deveria satisfazer e provou a existˆencia e unicidade desta solu¸c˜ao.

Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam o Prˆemio Nobel de Economia em reconhecimento ao trabalho pioneiro sobre an´alise de equil´ıbrio na teoria de jogos n˜ao-cooperativos.

(a) (b) (c)

(16)

Jogos na forma

estrat´

egica

2.1

O que ´

e um jogo?

A teoria dos jogos pode ser definida como a teoria dos modelos matem´aticos que estuda a escolha de decis˜oes ´otimas sob condi¸c˜oes

de conflito. O elemento b´asico em um jogo ´e o conjunto dejogadores

que dele participam. Cada jogador tem um conjunto deestrat´egias.

Quando cada jogador escolhe sua estrat´egia, temos ent˜ao uma

si-tua¸c˜ao ou perfil no espa¸co de todas as situa¸c˜oes (perfis) poss´ıveis. Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no

jogo. Em termos matem´aticos, cada jogador tem uma fun¸c˜ao

uti-lidade que atribui um n´umero real (o ganho ou payoff do jogador) a cada situa¸c˜ao do jogo. Mais especificamente, um jogo tem os se-guintes elementos b´asicos: existe um conjunto finito de jogadores, representado por

G={g1, g2, . . . , gn},

e cada jogadorgi∈Gpossui um conjunto finito

Si={si1, si2, . . . , simi}

(17)

de op¸c˜oes, denominadas estrat´egias puras do jogador gi (mi 2). Um vetor

s= (s1j1, s2j2, . . . , snjn),

onde siji ´e uma estrat´egia pura para o jogador gi ∈ G, ´e

denomi-nado umperfil de estrat´egias puras. O conjunto de todos os perfis de estrat´egias puras formam, portanto, o produto cartesiano

S=

n

i=1

Si=S1×S2× · · · ×Sn,

denominado espa¸co de estrat´egias puras do jogo. Para cada

joga-dorgiG, existe umafun¸c˜ao utilidade

ui: S → R s ui(s)

que associa o ganho (payoff) ui(s) do jogador gi a cada perfil de

estrat´egias puras s S. Esta fun¸c˜ao utilidade ´e uma forma de re-presentar a preferˆencia do jogadorgicom rela¸c˜ao aos v´arios perfis de estrat´egias do jogo ([13]).

Jogos descritos nesta forma s˜ao denominadosjogos estrat´egicos ou

jogos na forma normal. Neles, cada jogador deve fazer a sua escolha

de estrat´egiasem o conhecimento das escolhas dos demais jogadores.

Admite-se, contudo, que cada jogador conhece toda a estrutura do jogo. Por este motivo, jogos deste tipo tamb´em s˜ao denominados

jogos n˜ao-cooperativos de informa¸c˜ao completa.

Assume-se tamb´em que os jogadores sejamracionais, isto ´e, eles

sempre escolher˜ao a¸c˜oes que maximizem a sua fun¸c˜ao utilidade. Al´em

de ser racional, cada jogador (1) sabe que seus advers´arios tamb´em

s˜ao racionais, (2) sabe que eles sabem que o jogador sabe que eles s˜ao racionais,ad infinitum.

Exemplo 2.1 (O dilema do prisioneiro)Possivelmente o exem-plo mais conhecido na teoria dos jogos ´e odilema do prisioneiro. Ele

foi formulado por Albert W. Tucker em 1950, em um semin´ario para

psic´ologos na Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos.

(18)

poderem se comunicar entre si, o delegado de plant˜ao faz a seguinte proposta: cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜ao submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜ao ambos ter˜ao pena de 5 anos. Mas se um confessar e o outro negar, ent˜ao o que confessou ser´a libertado e o outro ser´a condenado a 10 anos de pris˜ao. Neste contexto, temos

G={Al,Bob},

SAl ={confessar,negar}, SBob={confessar,negar}, S=SAl×SBob=

{(confessar,confessar),(confessar,negar),

(negar,confessar),(negar,negar)}.

As duas fun¸c˜oes utilidade

uAl:S R e uBob:SR s˜ao dadas por

uAl(confessar,confessar) =5, uAl(confessar,negar) = 0, uAl(negar,confessar) =10, uAl(negar,negar) =1,

(que representam os ganhos de Al) e

uBob(confessar,confessar) =5, uBob(confessar,negar) =10, uBob(negar,confessar) = 0, uBob(negar,negar) =−1

(que representam os ganhos de Bob). ´E uma pr´atica representar os

payoffs dos jogadores atrav´es de uma matriz, denominadamatriz de payoffs.

Bob

confessar negar

Al

confessar (5,5) (0,10)

negar (−10,0) (−1,−1)

Nesta matriz, os n´umeros de cada c´elula representam,

respectiva-mente, os payoffs de Al e Bob para as escolhas de Al e Bob

(19)

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher desejam sair para passear. O homem prefere assistir a um jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem

juntos para o futebol, ent˜ao o homem tem satisfa¸c˜ao maior do que a

mulher. Por outro lado, se eles forem juntos ao cinema, ent˜ao a

mu-lher tem satisfa¸c˜ao maior do que o homem. Finalmente, se eles sa´ırem sozinhos, ent˜ao ambos ficam igualmente insatisfeitos. Esta situa¸c˜ao tamb´em pode ser modelada como um jogo estrat´egico. Temos:

G={homem,mulher},

Shomem={futebol,cinema}, Smulher={futebol,cinema}, S=Shomem×Smulher=

{(futebol,futebol),(futebol,cinema),

(cinema,futebol),(cinema,cinema)}.

As duas fun¸c˜oes utilidade uhomem: S R e umulher: S R s˜ao

descritas pela seguinte matriz depayoffs:

Mulher

futebol cinema

Ho

m

em futebol (10,5) (0,0)

cinema (0,0) (5,10)

.

2.2

Solu¸

oes de um jogo em estrat´

egias

puras

Uma solu¸c˜ao de um jogo ´e uma prescri¸c˜ao ou previs˜ao sobre o re-sultado do jogo. Existem v´arios conceitos diferentes de solu¸c˜ao. Nesta

se¸c˜ao, investigaremos os dois conceitos mais comuns: dominˆancia e

equil´ıbrio de Nash.

(20)

se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se

analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira:

“Duas coisas podem acontecer: Bob pode confessar ou Bob pode negar. Se Bob confessar, ent˜ao ´e melhor para

mim confessar tamb´em. Se Bob n˜ao confessar, ent˜ao eu

fico livre se eu confessar. Em qualquer um dos casos, ´e

melhor para mim confessar. Ent˜ao, eu confessarei.”

Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ınio e concluir que Bob tamb´em ir´a confessar. Assim, ambos confessar˜ao e ficar˜ao presos por 5 anos.

Em termos da teoria dos jogos, dizemos que (1) os dois

joga-dores possuem uma estrat´egia dominante, isto ´e, todas menos uma

estrat´egia ´eestritamente dominada, (2) que o jogo ´e resol´uvel por do-minˆancia estrita iteradae (3) que o jogo termina em uma solu¸c˜ao que ´e umequil´ıbrio de estrat´egia dominante, conceitos que definiremos a seguir.

2.2.1

Dominˆ

ancia em estrat´

egias puras

Freq¨uentemente, iremos discutir perfis de estrat´egia na qual ape-nas a estrat´egia de um ´unico jogadorgiGir´a variar, enquanto que as estrat´egias de seus oponentes permanecer˜ao fixas. Denote por

s−i= (s1j1, . . . , s(i−1)ji−1, s(i+1)ji+1, . . . , snjn)∈

S−i=S1× · · · ×Si−1×Si+1× · · · ×Sn

uma escolha de estrat´egia para todos os jogadores, menos o jogadorgi. Desta maneira, um perfil de estrat´egias pode ser convenientemente denotado por

s= (siji,s−i) = (s1j1, . . . , s(i−1)ji−1, siji, s(i+1)ji+1, . . . , snjn).

(21)

Defini¸c˜ao 2.1 (Estrat´egia Pura Estritamente Domi-nada) Dizemos que uma estrat´egia pura sik Si do joga-dorgiG´eestritamente dominadapela estrat´egiasik′ ∈Sise,

independentemente das escolhas dos demais jogadores, o joga-dorgi ganhar mais escolhendosik′ do quesik, isto ´e, se

ui(sik′,si)> ui(sik,si),

para todos−i∈S−i.

Defini¸c˜ao 2.2 (em estrat´egias puras)

(a) (Dominˆancia Estrita Iterada)Dominˆancia estrita ite-rada´e o processo no qual, seq¨uencialmente, se eliminam as estrat´egias que s˜ao estritamente dominadas.

(b) (Equil´ıbrio de Estrat´egia Estritamente

Dominan-te)Quando o processo de dominˆancia estrita iterada reduz

o jogo para um ´unico perfil de estrat´egias purass∗, dizemos ques∗´e umequil´ıbrio de estrat´egia estritamente dominante.

Exemplo 2.3 Considere o jogo determinado pela matriz depayoffs

abaixo.

g2

s21 s22 s23 s24

g1

s11 (5,2) (2,6) (1,4) (0,4)

s12 (0,0) (3,2) (2,1) (1,1)

s13 (7,0) (2,2) (1,1) (5,1)

(22)

Neste jogo, para o jogadorg2, a estrat´egias21 ´e estritamente

domi-nada pela estrat´egias24 e, assim, a primeira coluna da matriz pode

ser eliminada.

g2

s22 s23 s24

g1

s11 (2,6) (1,4) (0,4)

s12 (3,2) (2,1) (1,1)

s13 (2,2) (1,1) (5,1)

s14 (1,3) (0,2) (4,8)

Agora, nesta matriz reduzida, para o jogador g1, as estrat´egias s11

es14 s˜ao estritamente dominadas pelas estrat´egiass12 es13, respec-tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Al´em disso, a estrat´egias23do jogadorg2´e estritamente dominada pela

es-trat´egias22. Assim, a coluna 2 tamb´em pode ser eliminada. Obtemos

ent˜ao uma matriz reduzida 2×2.

g2

s22 s24

g1 s12 (3,2) (1,1)

s13 (2,2) (5,1)

Finalmente, a estrat´egia s24 do jogadorg2 ´e estritamente dominada

pela estrat´egias22 e, na matriz 2×1 resultante, a estrat´egias13 do jogadorg1´e estritamente dominada pela estrat´egias12. Vemos ent˜ao que (s12, s22) ´e o equil´ıbrio de estrat´egias estritamente dominantes do jogo: o jogadorg1escolhe a estrat´egias12(ganhando 3) e o jogadorg2

escolhe a estrat´egias22(ganhando 2).

(23)

mais simples, no sentido de que o conjunto de estrat´egias puras de um jogador (aquele que tem uma estrat´egia estritamente domi-nada) ´e substitu´ıdo por um subconjunto com menos elementos (ob-tido removense justamente as estrat´egias que s˜ao estritamente do-minadas). No exemplo acima, os conjuntos de estrat´egias puras ini-ciais dos dois jogadores s˜ao dados, respectivamente, por

S1={s11, s12, s13, s14} e S2={s21, s22, s23, s24}.

Como a estrat´egia puras21 ´e estritamente dominada pors24, o

con-juntoS2´e substitu´ıdo por{s22, s23, s24}=S2−{s21}. O conjuntoS1

permanece o mesmo. Sendo assim, podemos substituir o jogo original por um mais simples, onde os conjuntos de estrat´egias puras dos dois jogadores s˜ao dados por

S1(1)={s11, s12, s13, s14} e S (1)

2 ={s22, s23, s24}.

As fun¸c˜oes utilidade do novo jogo s˜ao as restri¸c˜oes das fun¸c˜oes utili-dade do jogo original aos novos conjuntos de estrat´egias puras:

u1|S1(1) e u2|S(1)2 .

Para o novo jogo, vemos que as estrat´egiass11es14s˜ao estritamente

dominadas pelas estrat´egiass12 es13, respectivamente. Logo,

pode-mos simplificar o jogo mais uma vez, considerando os conjuntos de estrat´egias puras

S1(2)={s12, s13} e S (2)

2 ={s22, s23, s24}.

Seguindo com as outras elimina¸c˜oes, terminamos com um jogo muito simples, onde cada conjunto de estrat´egias puras ´e unit´ario:

S1(5)={s12} e S2(5)={s22}.

Este processo de elimina¸c˜ao gerou, portanto, uma cadeia de espa¸cos de estrat´egias puras:

S=S1×S2S(1)=S1(1)×S2(1)S(2) =S1(2)×S2(2)· · ·

(24)

Neste exemplo, a t´ecnica de dominˆancia estrita iterada forneceu um ´

unico perfil de estrat´egias como solu¸c˜ao do jogo, no caso, o perfil

(s12, s22)S1(5)×S (5) 2 .

Contudo, pode acontecer da t´ecnica fornecer v´arios perfis ou, at´e

mesmo, fornecer todo o espa¸co de estrat´egias, como ´e o caso da

bata-lha dos sexos, onde n˜ao existem estrat´egias estritamente dominadas.

Um outro conceito importante ´e o de estrat´egia pura fracamente dominada.

Defini¸c˜ao 2.3 (Estrat´egia Pura Fracamente Domi-nada) Dizemos que uma estrat´egia pura sik Si do joga-dor gi G ´e fracamente dominada pela estrat´egia sik′ ∈ Si

se

ui(sik′,si)≥ui(sik,si),

para todos−i∈S−ie, pelo menos para algum s•−i∈S−i, ui(sik′,s•i)> ui(sik,s•i).

Em outras palavras, sik Si ´e fracamente dominada por

sik′ ∈Si se, independentemente das escolhas dos demais

joga-dores, o jogadorgi nada perde se trocar a estrat´egia sik Si

pela estrat´egiasik′ ∈ Si e, pelo menos para uma escolha dos

demais jogadores, esta troca d´a ao jogadorgi um ganho maior.

Defini¸c˜ao 2.4

(a) (Dominˆancia Fraca Iterada)Dominˆancia fraca iterada

´e o processo no qual, seq¨uencialmente, se eliminam as es-trat´egias que s˜ao fracamente dominadas.

(b) (Equil´ıbrio de Estrat´egia Fracamente Dominante)

(25)

Exemplo 2.4 Considere o jogo cuja matriz depayoffs´e dada por:

g2

s21 s22

g1 s11 (1,1) (1,0)

s12 (1,0) (0,1) .

A estrat´egia s12 do jogador g1 ´e fracamente dominada pela

estra-t´egias11. Eliminando-a, obtemos a matriz reduzida:

g2

s21 s22

g1 s11 (1,1) (1,0) .

Vemos agora que a estrat´egia s22 do jogador 2 ´e estritamente

do-minada pela estrat´egias21. Sendo assim, (s11, s21) ´e o equil´ıbrio de estrat´egias fracamente dominadas do jogo.

Uma pergunta natural ´e se o processo de elimina¸c˜ao das estrat´egias

dominadas depende ou n˜ao da ordem em que s˜ao realizadas. Para

o caso de estrat´egias estritamente dominadas, pode-se mostrar que

esta ordem ´e irrelevante, isto ´e, independentemente da ordem em que as estrat´egias (estritamente dominadas) s˜ao eliminadas, obt´em-se sempre a mesma matriz reduzida no final do processo. Por outro lado,

o processo de elimina¸c˜ao das estrat´egiasfracamente dominadas pode

conduzir a resultados diferentes, dependendo da ordem de elimina¸c˜ao. Considere, por exemplo, o jogo (conforme [32]):

g2

s21 s22 s23

g1 s11 (0,2) (0,0) (1,0)

(26)

Eliminando-se, em seq¨uˆencia, as estrat´egias s23 (que ´e estritamente

dominada por s21), s11 (que ´e fracamente dominada por s12) e s22

(que ´e estritamente dominada por s21), obtemos (s12, s21) como

res-posta. Agora, eliminando-se, em seq¨uˆencia, as estrat´egias s22 (que

´e estritamente dominada pors21), s12 (que ´e fracamente dominada

pors11) es23(que ´e estritamente dominada pors21), obtemos outra

resposta: (s11, s21). Para detalhes sobre este assunto, recomendamos

as referˆencias [01, 15, 26, 32, 47, 55].

Com rela¸c˜ao `a complexidade computacional, os resultados mos-tram que os problemas relacionados com estrat´egias estritamente do-minadas tendem a ser mais f´aceis (no sentido que eles podem ser

resolvidos em tempo polinomial), enquanto que quest˜oes envolvendo

estrat´egias fracamente dominadas s˜ao mais dif´ıceis (no sentido que eles s˜ao NP-completos). Por exemplo, saber se uma dada submatriz

de uma matriz de payoffs pode ser obtida atrav´es do processo de

elimina¸c˜ao de estrat´egias dominadas ´e um problema polinomial para o caso de estrat´egias estritamente dominadas e ´e um problema NP-Completo para o caso de estrat´egias fracamente dominadas. Detalhes sobre o assunto podem ser encontrados nas referˆencias [18, 33].

2.2.2

Equil´ıbrio de Nash em estrat´

egias puras

Uma solu¸c˜ao estrat´egicaou equil´ıbrio de Nashde um jogo ´e um

perfil de estrat´egias onde cada jogador n˜ao tem incentivo de mudar

sua estrat´egia se os demais jogadores n˜ao o fizerem.

Defini¸c˜ao 2.5 (Equil´ıbrio de Nash)Dizemos que um perfil de estrat´egias

s∗= (s∗

1, . . . , s∗(i−1), s∗i, s∗(i+1), . . . , s∗n)∈S

´e umequil´ıbrio de Nashse

ui(s∗

i,s∗−i)≥ui(siji,s ∗ −i)

(27)

Exemplo 2.5

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrat´egias (confessar, confessar) ´e um equil´ıbrio de Nash. De fato:

uAl(confessar,confessar) =5>10 =uAl(negar,confessar) e

uBob(confessar,confessar) =5>10 =uBob(confessar,negar).

Estas desigualdades mostram que, para o perfil de estrat´egias

(confessar, confessar), um prisioneiro n˜ao se sente motivado a

mudar a sua estrat´egia se o outro n˜ao o fizer (ele n˜ao vai ficar menos tempo na cadeia fazendo isto).

J´a o perfil (negar, confessar) n˜ao ´e um equil´ıbrio de Nash do jogo pois, neste caso, dado que Bob decide confessar, Al fica menos tempo na cadeia se mudar a sua estrat´egia de negar para confessar. Em outras palavras, para o perfil (negar, confessar), Al se sente motivado a mudar a sua estrat´egia se Bob n˜ao o fizer. Os perfis (confessar, negar) e (negar, negar) tamb´em n˜ao s˜ao equil´ıbrios de Nash. Em (confessar, negar), Bob se sente moti-vado a mudar a sua estrat´egia se Al n˜ao o fizer e, em (negar, negar), cada um dos prisioneiros se sente motivado a mudar a sua estrat´egia se o outro n˜ao o fizer. Desta maneira, vemos que o ´unico equil´ıbrio de Nash do jogo ´e (confessar, confessar).

(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estrat´egia (fu-tebol, futebol) e (cinema, cinema) s˜ao os ´unicos equil´ıbrios de Nash do jogo.

(c) No Exemplo 2.3, o ´unico equil´ıbrio de Nash do jogo ´e o perfil de estrat´egias (s12, s22).

Existem, contudo, jogos que n˜ao possuem equil´ıbrios de Nash em

estrat´egias puras. Este ´e o caso, por exemplo, do jogo de comparar

(28)

Exemplo 2.6 (Comparar moedas)Nesse jogo, dois jogadores exi-bem, ao mesmo tempo, a moeda que cada um esconde em sua m˜ao. Se ambas as moedas apresentam cara ou coroa, o segundo jogador

d´a sua moeda para o primeiro. Se uma das moedas apresenta cara,

enquanto a outra apresenta coroa, ´e a vez do primeiro jogador dar sua moeda para o segundo. Esse jogo se encontra representado por

sua matriz depayoffs dada abaixo.

g2

s21 s22

g1 s11 (+1,−1) (−1,+1) s12 (−1,+1) (+1,−1)

Observe que o perfil de estrat´egias (s11, s21) n˜ao ´e um equil´ıbrio de

Nash em estrat´egias puras, pois se o jogador g1 mantiver a sua

es-trat´egia s11, o jogador g2 ter´a um ganho maior se mudar sua

es-trat´egia des21 paras22, isto ´e, ele se sente motivado a mudar a sua

estrat´egia se o jogador g1 n˜ao mudar a sua escolha. O mesmo

com-portamento ocorre para o perfil de estrat´egias (s12, s22). J´a, para os perfis (s11, s22) e (s12, s21), ´e o jogador g1 que se sente motivado a

mudar de estrat´egia para ganhar mais, se o jogadorg2mantiver a sua

estrat´egia. Isto mostra que o jogo de comparar moedas n˜ao possui equil´ıbrios de Nash em estrat´egias puras.

Existe uma maneira conveniente de se caracterizar equil´ıbrios de

Nash atrav´es das fun¸c˜oes de melhor resposta. De maneira informal,

a melhor resposta de um jogador para uma determinada escolha de estrat´egias dos demais jogadores ´e o conjunto de estrat´egias do jo-gador que maximizam o seu ganho quando os demais jojo-gadores n˜ao mudam as suas escolhas. Mais precisamente, temos a seguinte

Defini¸c˜ao 2.6 (Func¸˜oes de melhor resposta)A fun¸c˜ao de melhor resposta do jogadorgi´e a aplica¸c˜ao

(29)

definida por

MRi(s−i) = argmaxsi∈Siui(si,s−i)

= {s∗

i ∈Si | ∀si∈Si, ui(s∗i,s−i)≥ui(si,s−i)},

coms−i∈S−i(aqui 2Sirepresenta o conjunto das partes deSi).

A fun¸c˜ao de melhor resposta do jogo ´e a aplica¸c˜ao

MR :S 2S

definida por

MR(s) = (MR1(s−1),MR2(s−2), . . . ,MRn(s−n)),

com s S. Observa¸c˜ao: alguns autores usam as nota¸c˜oes

MRi:S−i⇒Si e MRi:S−i →→Si para representar a fun¸c˜ao

de melhor resposta MRi: S−i→2Si.

Exemplo 2.7

(a) No dilema do prisioneiro (Exemplo 2.1), temos

MRAl : SBob →→ SAl

confessar → {confessar}

negar → {confessar}

MRBob: SAl →→ SBob

confessar → {confessar}

negar → {confessar}.

(b) Na batalha dos sexos (Exemplo 2.2), temos

MRHomem: SMulher →→ SHomem

futebol → {futebol}

cinema → {cinema}

MRMulher: SHomem →→ SMulher

futebol → {futebol}

(30)

(c) No Exemplo 2.3, temos

MR1(s21) ={s14}, MR1(s22) ={s12},

MR1(s23) ={s12}, MR1(s24) ={s13},

MR2(s11) ={s22}, MR2(s12) ={s22},

MR2(s13) ={s22}, MR2(s14) ={s24}.

(d) No jogo de comparar moedas (Exemplo 2.6), temos

MR1(s21) ={s11}, MR1(s22) ={s12},

MR2(s11) ={s22}, MR2(s12) ={s21}.

A pr´oxima proposi¸c˜ao ´e uma conseq¨uˆencia direta das defini¸c˜oes de equil´ıbrio de Nash e fun¸c˜oes de melhor resposta.

Proposi¸c˜ao 2.1 s∗ = (s

1, . . . , s∗i, . . . , s∗n)∈S ´e um equil´ıbrio

de Nash em estrat´egias puras se, e somente se,s∗

i ∈MRi(s∗−i)

para todoi= 1, . . . , n.

Observac¸˜ao. Como vimos, nem sempre um jogo possui um equi-l´ıbrio de Nash em estrat´egias puras. Contudo, ´e poss´ıvel garantir esta existˆencia para certos tipos de jogos com estruturas especiais. O leitor interessado pode consultar os jogos descritos nos artigos [28, 61, 80, 94]. Para resultados quantitativos, veja [60].

2.2.3

Rela¸

oes entre dominˆ

ancia e equil´ıbrio de

Nash

Proposi¸c˜ao 2.2 O processo de dominˆancia estrita iterada n˜ao pode eliminar um equil´ıbrio de Nash ao simplificar um jogo.

(31)

com menos elementos, obtido removendo-se as estrat´egias do jogador que s˜ao estritamente dominadas. Cada elimina¸c˜ao gera um espa¸co de estrat´egias puras com menos elementos o que, sucessivamente, sim-plifica o jogo original:

S=S1× · · · ×Sn S(1)=S1(1)× · · · ×Sn(1)

· · ·S(k)=S(k)1 × · · · ×Sn(k).

Com esta nota¸c˜ao, o enunciado da proposi¸c˜ao pode ser colocado as-sim: ses∗S ´e um equil´ıbrio de Nash, ent˜aos∗S(k).

A demonstra¸c˜ao ser´a feita por contradi¸c˜ao: suponha, por absurdo, que exista s∗= (s

1, . . . , s∗n)∈S tal ques∗ ´e um equil´ıbrio de Nash,

mas s∗ S(k). Isto significa que existe i tal que s

i ∈ S (l) i mas s∗

i ∈S (l+1)

i para algum l= 0, . . . , k−1 (se l= 0, defina S (0) i =Si).

Sem perda de generalidade, vamos supor que esta propriedade ocorre pelaprimeira vez para o ´ındicei, isto ´e,s∗

i ´e a primeira estrat´egia do

perfil de estrat´egias

s∗= (s∗

1, . . . , s∗(i−1), s∗i, s∗(i+1), . . . , s∗n)

que ´e eliminada por uma estrat´egia estritamente dominante. Sendo assim, existes•

i ∈S (l)

i tal que

ui(s∗i,s−i)< ui(s•i,s−i)

para todos−i∈S−(l)i. Comos∗i ´e a primeira estrat´egia a ser eliminada,

isto significa ques∗i S(l)i e, portanto,

ui(s∗

i,s∗−i)< ui(s•i,s∗−i).

Mas isto ´e um absurdo pois, por hip´otese, s∗ = (s

i,s∗−i) ´e um

equil´ıbrio de Nash.

Proposi¸c˜ao 2.3 Se o processo de dominˆancia estrita iterada deixa apenas um ´unico perfil de estrat´egias purass∗, ent˜ao s∗

(32)

Demonstra¸c˜ao:Suponha que o processo de dominˆancia estrita iterada gere uma cadeia de espa¸cos de estrat´egias puras

S=S1× · · · ×SnS(1) =S1(1)× · · · ×Sn(1)

· · ·S(k)=S1(k)× · · · ×Sn(k),

onde o ´ultimo conjunto da cadeia ´e unit´ario:

S(k)=S1(k)× · · · ×S(k)n ={s∗}={(s∗

1, . . . , s∗i, . . . , s∗n)}.

Note que, em particular, s∗

1 ∈ S

(l)

1 , s∗2 ∈ S (l)

2 , . . . , s∗n ∈ S (l)

n , para

todo l = 0, . . . , k. Vamos mostrar que, nesta situa¸c˜ao,s∗ ´e o ´unico

equil´ıbrio de Nash do jogo. De fato, basta mostrar que s∗ ´e um

equil´ıbrio de Nash, pois a unicidade ´e uma conseq¨uˆencia direta da

Proposi¸c˜ao 2.2. Suponha ent˜ao, por absurdo, que s∗ ao seja um

equil´ıbrio de Nash. Neste caso, devem existir ´ındice i e estrat´egia

puras[1]

i ∈Si, coms

[1]

i =s∗i, tais que ui(s∗

i,s∗−i)< ui(s

[1]

i ,s∗−i).

Dado que (s[1]

i ,s∗−i)∈S(k)e dado ques∗ι ∈S (l)

ι para todoι= 1, . . . n

e para todo l= 0, . . . , k, segue-se que a estrat´egias[1]

i ´e estritamente

dominada por alguma outra estrat´egias[2]

i ∈Si. Segue-se ent˜ao que,

em particular, ui(s[1]

i ,s∗−i)< ui(s

[2]

i ,s∗−i) e, portanto,

ui(s∗

i,s∗−i)< ui(s

[1]

i ,s∗−i)< ui(s

[2]

i ,s∗−i).

Note que, por causa destas desigualdades, segue-se que s[2]

i =s

[1]

i e s[2]

i =s∗i. Como (s

[2]

i ,s∗−i) tamb´em n˜ao pertence aS(k), segue-se que a

estrat´egias[2]

i ´e estritamente dominada por uma outra estrat´egias

[3]

i ∈ Si. Sendo assim,ui(s[2]

i ,s∗−i)< ui(s

[3]

i ,s∗−i) e, portanto,

ui(s∗i,s∗−i)< ui(s

[1]

i ,s

−i)< ui(s

[2]

i ,s

−i)< ui(s

[3]

i ,s

∗ −i).

Como antes, destas desigualdades, segue-se ques[3]

i =s

[2]

i ,s

[3]

i =s

[1]

i e s[3]

i =s∗i. Prosseguindo desta maneira, construir´ıamos uma seq¨uˆencia

infinita (s[1]

i , s

[2]

i , s

[3]

i , . . . , s

[r]

i , . . .) de estrat´egias purasdistintas do

jo-gadorgi satisfazendo as desigualdades

ui(s∗i,s∗−i)< ui(s

[1]

i ,s∗−i)<· · ·< ui(s

[r]

(33)

Mas isto ´e um absurdo, poisSi ´e um conjunto finito.

A rec´ıproca da Proposi¸c˜ao 2.3 ´e falsa, isto ´e, mesmo que o jogo tenha um ´unico equil´ıbrio de Nash, ele n˜ao ´e necessariamente obtido a

partir do processo de dominˆancia estrita iterada. O jogo cuja matriz

depayoffs´e

g2

s21 s22 s23

g1

s11 (−1,+1) (+1,−1) (−1,+1)

s12 (+1,1) (1,+1) (+1,1)

s13 (−1,+1) (+1,−1) (+5,+5)

fornece um contra-exemplo: s∗ = (s13, s23) ´e o ´unico equil´ıbrio de

Nash do jogo, mas n˜ao existem estrat´egias estritamente dominadas.

A Proposi¸c˜ao 2.2 ´e se trocarmos dominˆancia estrita por

domi-nˆancia fraca, isto ´e, o processo de dominˆancia fraca iterada pode

eliminar um equil´ıbrio de Nash (veja o exerc´ıcio [10] na p´agina 58

para um contra-exemplo). Se o processo de dominˆancia fraca iterada

reduz o jogo para apenas um ´unico perfil de estrat´egias (como na

Proposi¸c˜ao 2.3), ent˜ao este perfil ´e obrigatoriamente um equil´ıbrio de Nash, contudo, ele n˜ao ´e necessariamente o ´unico equil´ıbrio de Nash do jogo.

2.3

Estrat´

egias mistas

Como vimos no jogo de comparar moedas do Exemplo 2.6, existem jogos que n˜ao possuem equil´ıbrios de Nash em estrat´egias puras. Uma alternativa para estes casos ´e a de considerar o jogo do ponto de vista probabil´ıstico, isto ´e, ao inv´es de escolher um perfil de estrat´egias puras, o jogador deve escolher umadistribui¸c˜ao de probabilidadesobre suas estrat´egias puras.

(34)

isto ´e,pi ´e um elemento do conjunto

∆mi=

(x1, . . . , xmi)∈R

mi |x10, . . . , xm

i ≥0 e

mi

k=1 xk= 1

.

Assim, se pi= (pi1, pi2, . . . , pimi), ent˜ao

pi10, pi20, . . . , pimi 0 e

mi

k=1

pik= 1.

Note que cada ∆mi ´e um conjunto compacto e convexo. Nas

Figuras 2.1 e 2.2 temos os desenhos de ∆2e ∆3, respectivamente. Os

pontos extremos (v´ertices) de ∆mi, isto ´e, os pontos da forma

e1= (1,0, . . . ,0,0), e2= (0,1, . . . ,0,0), . . . , emi = (0,0, . . . ,0,1)

d˜ao, respectivamente, probabilidade 1 `as estrat´egias puras si1, si2, . . . , simi. Desta maneira, podemos considerar a distribui¸c˜ao de

pro-babilidade ek como a estrat´egia mista que representa a estrat´egia

purasik do jogadorgi.

O espa¸co de todos os perfis de estrat´egia mista ´e o produto car-tesiano

∆ = ∆m1×∆m2× · · · ×∆mn,

denominadoespa¸co de estrat´egias mistas. Como o produto cartesiano

de conjuntos compactos e convexos ´e compacto e convexo, vemos que ∆ ´e compacto e convexo.

Um vetor p∈ ∆ ´e denominado um perfil de estrat´egias mistas.

Como no caso de estrat´egias puras, usaremos a nota¸c˜ao p−i para

representar as estrat´egias mistas de todos os jogadores, excluindo-se

a do jogadorgi. Desta maneira, escreveremos

(pi,p−i)

para representarp= (p1, . . . ,pi, . . . ,pn). Como a estrat´egia purasik

pode ser identificada com a distribui¸c˜ao de probabilidades que d´a

peso 1 asik e peso 0 `as demais estrat´egias do jogadorgi, usaremos

(35)

1 0

1

x1 x2

Figura 2.1: ∆2=(x1, x2)∈R2 |x1≥0, x2≥0 ex1+x2= 1.

0

1

1 1

x1

x2 x3

Figura 2.2: ∆3=

(x1, x2, x3)R3

| x10,x20,x30 ex1+

(36)

como uma nota¸c˜ao alternativa para o perfil de estrat´egias mistas (ek,p−i). Do mesmo modo, usaremos

(pi,si)

para indicar o perfil de estrat´egias mistas onde o jogadorgi escolhe

a distribui¸c˜ao de probabilidades pi e os demais jogadores escolhem

distribui¸c˜oes que d˜ao peso 1 `as estrat´egias puras ems−i.

Cada perfil de estrat´egias mistasp= (p1, . . . ,pn)∆ determina umpayoffesperado (utilidade esperada), uma m´edia dospayoffs pon-derada pelas distribui¸c˜oes de probabilidadesp1, . . . ,pn. Mais preci-samente, se

p = (p1,p2, . . . ,pn) = (p11, p12, . . . , p1m1

p1

;p21, p22, . . . , p2m2

p2

;. . .;pn1, pn2, . . . , pnmn

pn

),

ent˜ao

ui(p) =

m1

j1=1

m2

j2=1

· · ·

mn

jn=1

p1j1·p2j2· · ·pnjn·ui(s1j1, s2j2, . . . , snjn).

(2.1)

Cuidado com o abuso de nota¸c˜ao: estamos usandouipara representar

a fun¸c˜ao utilidade tanto em estrat´egias puras quanto em estrat´egias mistas.

Como exemplo, considere o jogo de comparar moedas na p´

agi-na 22. Se g1 escolhe a distribui¸c˜ao de probabilidadep1= (1/4,3/4) e g2 escolhe a distribui¸c˜ao de probabilidade p2 = (1/3,2/3), ent˜ao os payoffs esperados associados ao perfil de estrat´egias mistas p = (p1,p2) = (1/4,3/4; 1/3,2/3) s˜ao dados por

u1(p) =

2

j1=1

2

j2=1

p1j1·p2j2·u1(s1j1, s2j2)

= p11·p21·u1(s11, s21) +p11·p22·u1(s11, s22) +

p12·p21·u1(s12, s21) +p12·p22·u1(s12, s22)

= 1

4 · 1

3·(+1) + 1 4·

2

3 ·(−1) + 3 4 ·

1

3 ·(−1) + 3 4 ·

2 3·(+1)

= +1

(37)

e, analogamente,

u2(p) =

2

j1=1

2

j2=1

p1j1·p2j2·u2(s1j1, s2j2)

= p11·p21·u2(s11, s21) +p11·p22·u2(s11, s22) +

p12·p21·u2(s12, s21) +p12·p22·u2(s12, s22)

= 1

4 · 1

3 ·(−1) + 1 4·

2

3·(+1) + 3 4 ·

1

3 ·(+1) + 3 4 ·

2 3 ·(−1) = −16.

Observac¸˜ao. Sep∗= (p

i,p∗−i)∈∆, ent˜ao a fun¸c˜aox→ui(x,p∗−i)

preserva combina¸c˜oes convexas. Mais precisamente, se x1, . . . ,xr ∈

∆mi eλ1, . . . , λrs˜ao escalares n˜ao-negativos com

r

k=1λk = 1, ent˜ao

ui

r

k=1

λk·xk,p∗−i

=

r

k=1

λk·ui(xk,p∗−i). (2.2)

Em particular, se

p∗i = (p∗

i1, . . . , p∗imi) = mi

k=1 p∗

ik·ek, (2.3)

comek o k-´esimo vetor da base canˆonica deRmi, ent˜ao

ui(p∗) =ui(p

i,p∗−i) =ui

mi

k=1 p∗

ik·ek,p∗−i

= mi k=1 p∗

ik·ui(ek,p∗−i).

(2.4)

2.4

Solu¸

oes de um jogo em estrat´

egias

mistas

(38)

2.4.1

Dominˆ

ancia em estrat´

egias mistas

Defini¸c˜ao 2.7 (Estrat´egia Mista Estritamente Domi-nada) Dizemos que uma estrat´egia mista pi ∆mi do

joga-dorgi ∈G´e estritamente dominada pela estrat´egia p′i ∆mi

se,independentemente das escolhas de distribui¸c˜oes de

proba-bilidade dos demais jogadores, o jogador gi ganha mais

esco-lhendop′

ido quepi, isto ´e, se

ui(p′i,pi)> ui(pi,pi),

para todopi∆−i= ∆m1×· · ·×∆mi−1×∆mi+1×· · ·×∆mn.

Como ospayoffs ui(p′i,pi) eui(pi,pi) s˜ao, respectivamente, combina¸c˜oes convexas dos payoffs ui(p′i,s−i) e ui(pi,s−i),

segue-se que a condi¸c˜ao acima ´e equivalente a

ui(p′i,s−i)> ui(pi,s−i),

para todos perfis de estrat´egias purass−i∈S−i.

Exemplo 2.8 ([30], p´agina 21) Considere o jogo com a seguinte

matriz depayoffs:

g2

s21 s22

g1

s11 (5,3) (0,0)

s12 (0,0) (5,3)

s13 (2,1) (2,1) .

(39)

dominada pela estrat´egia mistap′1= (1/2,1/2,0)∆3, pois

u1(p′1,p2) =u1

1 2,

1

2,0;p21, p22

= 5

2 ·p21+ 5 2 ·p22=

5 2

>

u1(p1,p2) =u1

0,0,1;p21, p22

= 2 ·p21+ 2·p22= 2

para todo p2 = (p21, p22) ∆2. Como p1 = (0,0,1) representa

a estrat´egia pura s13 do jogador g1, este exemplo tamb´em mostra

que uma estrat´egia pura pode n˜ao ser dominada por nenhuma outra

estrat´egia puras mas, ainda sim, ser dominada por uma estrat´egia mista.

Exemplo 2.9 ([31], p´agina 7) Uma estrat´egia mista que atribui probabilidade positiva para uma estrat´egia pura estritamente domi-nada tamb´em ´e estritamente domidomi-nada (Exerc´ıcio [13]). Contudo, uma estrat´egia mista pode ser estritamente dominada mesmo que ela atribua probabilidades positivas apenas para as estrat´egias puras que

n˜ao s˜ao nem mesmo fracamente dominadas. Considere, por exemplo,

o jogo com a seguinte matriz de payoffs:

g2

s21 s22

g1

s11 (5,3) (2,0)

s12 (2,0) (5,3)

s13 (4,1) (4,1) .

As estrat´egias puras s11 e s12 n˜ao s˜ao fracamente dominadas, mas

a estrat´egia mista p1 = (1/2,1/2,0) ´e estritamente dominada pela estrat´egia mistap′

(40)

pois

u1(p′1,p2) =u1

0,0,1;p21, p22

= 4 ·p21+ 4·p22= 4

>

u1(p1,p2) =u1

1 2,

1

2,0;p21, p22

= 7

2 ·p21+ 7 2 ·p22=

7 2

para todo p2= (p21, p22)∈∆2.

A defini¸c˜ao de dominˆancia estrita iterada para estrat´egias mistas que daremos aqui segue a linha proposta pelas referˆencias [26, 31, 74]. Abordagens alternativas podem ser encontradas em [01, 15].

Defini¸c˜ao 2.8 (Dominˆancia Estrita Iterada em Estra-t´egias Mistas)Sejam Si(0)=Si e ∆

(0)

mi = ∆mi. Defina,

recur-sivamente,

Si(n)={sSi(n−1)| ∄pi∆(nmi−1)tal que

∀s−i∈S (n−1)

−i , ui(pi, s−i)> ui(s, s−i)}

e

∆(n)mi ={pi= (pi1, . . . , pimi)∈∆mi |

∀k= 1, . . . , mi, pik >0 somente sesik Si(n)}.

A interse¸c˜ao

Si∞=

n=0 S(n)i

(41)

∆∞

mi={pi∈∆mi |∄p ′

i ∈∆mi

tal que s−i∈S−(∞i), ui(p′i, s−i)> ui(pi, si)}

´e o conjunto de todas as estrat´egias mistas do jogador gi que

sobreviveram a t´ecnica dedominˆancia estrita iterada.

Note queS(n)

i ´e o conjunto de estrat´egias puras emS

(n−1)

i que n˜ao s˜ao

estritamente dominadas pelas estrat´egias mistas em ∆(n−1)

mi e que ∆

(n)

mi

´e o conjunto de estrat´egias mistas que d´a probabilidades positivas apenas para as estrat´egias puras emS(n)

i .

Defini¸c˜ao 2.9 (Equil´ıbrio de Estrat´egia Estritamente Dominante)Se, no processo de dominˆancia estrita iterada, o

conjuntoS∞=S

1 × · · · ×S∞n ´e unit´ario, isto ´e, se S∞=

{s∗},

ent˜ao dizemos ques∗´e umequil´ıbrio de estrat´egia estritamente dominante.

Como no caso de estrat´egias puras, ´e poss´ıvel mostrar que os

con-juntos S∞=S

1 × · · · ×Sn∞ e ∆∞= ∆∞m1× · · · ×∆

mn n˜ao

depen-dem da ordepen-dem em que as estrat´egias estritamente dominadas s˜ao removidas. N˜ao apresentaremos a demonstra¸c˜ao deste fato aqui. O leitor interessado poder´a encontr´a-la (bem como as defini¸c˜oes e

resultados sobre estrat´egias mistas fracamente dominadas) nas

re-ferˆencias [01, 15, 26, 55].

2.4.2

Equil´ıbrio de Nash em estrat´

egias mistas

(42)

p∗= (p

1,p∗2, . . . ,p∗n)∈∆ = ∆m1×∆m2× · · · ×∆mn

´e umequil´ıbrio de Nashse

ui(p∗i,p∗−i)≥ui(p,p∗−i)

para todo p ∆mi, isto ´e, nenhum jogador sente motiva¸c˜ao

de trocar a sua estrat´egia mista se os demais jogadores n˜ao o fizerem.

Exemplo 2.10

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrat´egias mistas

p∗= (p

1,p∗2) = (1,0; 1,0)

´e um equil´ıbrio de Nash, pois

u1(p1,p∗2) =u1(p11, p12; 1,0) = 5·p1110

−5 =u1(1,0; 1,0) =u1(p∗1,p∗2) para todop1= (p11, p12)∆2 e

u2(p∗1,p2) =u2(1,0;p21, p22) = 5·p21−10≤

−5 =u2(1,0; 1,0) =u2(p∗1,p∗2)

para todo p2 = (p21, p22) ∆2. Observe que este equil´ıbrio

corresponde ao equil´ıbrio em estrat´egias puras

s∗= (confessar, confessar).

Mostraremos mais adiante que este ´e o´unicoequil´ıbrio de Nash em estrat´egias mistas do jogo.

(b) Na batalha dos sexos (Exemplo 2.2), os equil´ıbrios de Nash em estrat´egias mistas s˜ao

(43)

Os dois primeiros perfis de estrat´egias mistas correspondem `as estrat´egias puras (futebol, futebol) e (cinema, cinema),

respec-tivamente. Mostraremos mais adiante que estes s˜ao os ´unicos

equil´ıbrios de Nash em estrat´egias mistas do jogo.

(c) No Exemplo 2.3, o ´unico equil´ıbrio de Nash em estrat´egia mista

´e o ponto

(0,1,0,0; 0,1,0,0)

que corresponde ao equil´ıbrio de Nash (s12, s22) em estrat´egias puras.

(d) No jogo de comparar moedas do Exemplo 2.6, o ´unico equil´ıbrio

de Nash em estrat´egias mistas ´e o ponto

(1/2,1/2; 1/2,1/2).

Como no caso de estrat´egias puras, podemos caracterizar equil´ı-brios de Nash em estrat´egias mistas atrav´es das fun¸c˜oes de melhor resposta. Considere um jogo com espa¸co de estrat´egias mistas ∆ = ∆m1× · · ·×∆mi× · · ·×∆mn. No que se segue, usaremos as seguintes

nota¸c˜oes:

∆(Si) = ∆mi e ∆(S−i) = ∆m1× · · · ×∆mi−1×∆mi+1× · · ·∆mn.

Defini¸c˜ao 2.11 (Func¸˜oes de melhor resposta em estra-t´egias mistas)A fun¸c˜ao de melhor resposta do jogadorgi´e a aplica¸c˜ao

MRi: ∆(S−i)→2∆(Si)

definida por MRi(p−i) = argmaxpi∈∆(Si)ui(pi,p−i), isto ´e,

MRi(p−i)

=

{p∗i ∆(Si)| ∀pi∆(Si), ui(p∗i,p−i)≥ui(pi,p−i)},

comp−i ∈ ∆(S−i). A fun¸c˜ao de melhor resposta do jogo ´e a

aplica¸c˜ao

(44)

definida por

MR(p) = (MR1(p−1),MR2(p−2), . . . ,MRn(p−n)),

comp∈∆.

Note que, como ∆(Si) ´e um conjunto compacto n˜ao-vazio e a

fun¸c˜aopiui(pi,p−i) ´e cont´ınua, podemos usar o teorema de

Wei-erstrass para garantir que MRi(p−i) = argmaxpi∈∆(Si)ui(pi,p−i) ´e

um conjunto n˜ao-vazio para todopi∆(S−i).

A pr´oxima proposi¸c˜ao ´e uma conseq¨uˆencia direta das defini¸c˜oes de equil´ıbrio de Nash e fun¸c˜oes de melhor resposta em estrat´egias mistas.

Proposi¸c˜ao 2.4 p∗= (p

1, . . . ,p∗i, . . . ,p∗n)∈∆ ´e um equil´ıbrio

de Nash em estrat´egias mistas se, e somente se,p∗

i ∈MRi(p∗−i)

para todoi= 1, . . . , n, isto ´e,p∗MR(p).

Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2), a mulher escolha a estrat´egia mistap2= (1/2,1/2). Qual ´e a melhor resposta do homem a esta estrat´egia da mulher? Para responder a esta pergunta, observe inicialmente que

uHomem(p1,p2) = uHomem(p11, p12;p21, p22)

= p11·p21·uHomem(futebol,futebol) +

p11·p22·uHomem(futebol,cinema) +

p12·p21·uHomem(cinema,futebol) +

p12·p22·uHomem(cinema,cinema) = 10·p11·p21+ 5·p12·p22

e, portanto, uHomem(p11, p12; 1/2,1/2) = 5·p11+ (5/2)·p12. Desta maneira,

(45)

Segue-se que a melhor resposta do homem `a estrat´egia mista p2 = (1/2,1/2) da mulher ´e obtida resolvendo-se o seguinte problema de otimiza¸c˜ao:

maximizar 5·p11+ (5/2)·p12

sujeito a p11+p12= 1,

p110,

p120,

cuja solu¸c˜ao ´e (p∗

11, p∗12) = (1,0). Sendo assim, MRHomem(1/2,1/2) =

{(1,0)}.

No caso de jogos com apenas dois jogadores, cada um com apenas duas estrat´egias puras, ´e poss´ıvel escrever as estrat´egias mistas de uma maneira mais simplificada:

∆2={(p,1−p)∈R2 |0≤p≤1},

isto ´e, cada elemento de ∆2pode ser identificado com um n´umero real

no intervalo [0,1]. Com isto, as fun¸c˜oes de melhor resposta podem

ser reescritas de forma a depender de apenas de um n´umero real. Por

exemplo, se o homem escolhe uma estrat´egia mista (p,1−p)∈∆2,

qual ´e a melhor resposta da mulher a esta estrat´egia do homem? Escrevendo as estrat´egias mistas da mulher na forma (q,1q)∆2,

vemos que

uMulher(p,1p;q,1q) = 15pq+ 1010q10p

= 5 (3p2)q+ 10 (1p).

Sendo assim,

MRMulher(p) = argmax(q,1−q)∈∆2(5 (3p−2)q+ 10 (1−p))

= argmaxq∈[0,1](5 (3p−2)q+ 10 (1−p)),

onde, por simplicidade, estamos escrevendo MRMulher(p) no lugar

de MRMulher(p,1−p). Assim, dada a escolha dep∈[0,1] do homem,

(46)

escolherq= 0. Sep= 2/3, ent˜ao 3p2 = 0 e, portanto, a utilidade

uMulher = 10 (1p) da mulher n˜ao depender´a deq. Neste caso, a mulher poder´a escolher qualquer valor deqem [0,1]. Sep(2/3,1], ent˜ao 3p2>0 e, para maximizar a sua utilidade, a mulher dever´a

escolherq= 1. Mostramos ent˜ao que

MRMulher(p) =

⎧ ⎨ ⎩

{0}, sep∈[0,2/3),

[0,1], sep= 2/3,

{1}, sep∈(2/3,1].

Esta fun¸c˜ao de melhor resposta pode ser representada graficamente, como mostra a Figura 2.3.

1 p(Homem) 0

1 q

2/3

(Cinema) (Cinema)

(Futebol) (Mulher)

(Futebol)

Figura 2.3: Representa¸c˜ao gr´afica da fun¸c˜ao de melhor resposta da mulher no jogo da batalha dos sexos.

Do mesmo modo, se a mulher escolhe uma estrat´egia mista (q,1q) ∆2, ent˜ao

uHomem(p,1p;q,1q) = 15pq+ 55q5p

= 5 (3q1)p+ 5 (1q),

de modo que

MRHomem(q) = argmax(p,1−p)∈∆2(5 (3q−1)p+ 5 (1−q))

(47)

Assim, dada a escolha de q [0,1] da mulher, o homem quer

en-contrar os valores de p[0,1] que maximizam o valor de sua

utili-dadeuHomem= 5 (3q1)p+ 5 (1q). Seq [0,1/3), ent˜ao 3q

1 < 0 e, para maximizar a sua utilidade, o homem dever´a

esco-lher p = 0. Se q = 1/3, ent˜ao 3q1 = 0 e, portanto, a utilidade

uHomem = 5 (1−q) do homem n˜ao depender´a de p. Neste caso, o homem poder´a escolher qualquer valor depem [0,1]. Seq∈(1/3,1], ent˜ao 3q−1>0 e, para maximizar a sua utilidade, o homem dever´a

escolherp= 1. Mostramos ent˜ao que

MRHomem(q) =

⎧ ⎨ ⎩

{0}, seq[0,1/3),

[0,1], seq= 1/3,

{1}, seq(1/3,1].

Esta fun¸c˜ao de melhor resposta pode ser representada graficamente, como mostra a Figura 2.4.

1 q (Mulher) 0

1 p

1/3

(Cinema) (Cinema)

(Futebol) (Homem)

(Futebol)

Figura 2.4: Representa¸c˜ao gr´afica da fun¸c˜ao de melhor resposta do homem no jogo da batalha dos sexos.

Agora, pela Proposi¸c˜ao 2.4, segue-se que um perfil de estrat´egias mistas (p∗,1p;q,1q) ´e um equil´ıbrio de Nash se, e somente se,

q∗MR

Mulher(p∗) e p∗ ∈MRHomem(q∗). Desta maneira, os valores

de p∗ e qque geram equil´ıbrios de Nash correspondem aos pontos

(48)

resposta da mulher e do homem, quando representadas em um mesmo sistema de eixos, como ilustra a Figura 2.5.

1 p(Homem) 0

1 q

2/3 1/3

(Cinema) (Cinema)

(Futebol) (Mulher)

(Futebol)

Figura 2.5: Calculando os equil´ıbrios de Nash usando as representa-¸c˜oes gr´aficas das duas fun¸c˜oes de melhor resposta.

Vemos, portanto, que a batalha dos sexos possui apenas 3 equil´ıbrios de Nash em estrat´egias mistas:

(0,1; 0,1), (2/3,1/3; 1/3,2/3) e (1,0; 1,0),

que correspondem, respectivamente, aos trˆes ´unicos pontos de

inter-se¸c˜ao (p∗, q) = (0,0), (p, q) = (2/3,1/3) e (p, q) = (1,1) das

duas representa¸c˜oes gr´aficas.

Exemplo 2.12 ([31], p´agina 17) (O jogo da inspec¸˜ao) O che-fe de uma empresa de computa¸c˜ao desconfia que seu operador de computadores est´a usando o tempo de servi¸co para “bater papo”

na internet. Se o operador trabalha corretamente, ele gasta g em

esfor¸co e produz um lucro bruto de v unidades para a empresa. O

chefe, por sua vez, pode fiscalizar ou n˜ao o trabalho do operador.

Fiscalizar custahunidades para a empresa. Se o operador for pego

“batendo papo” na internet, ele perde o seu sal´ario de w unidades

(49)

que g > h > 0 e que w > g. Os dois jogadores escolhem suas estrat´egias simultaneamente (em particular, ao decidir se vai fiscalizar ou n˜ao, o chefe n˜ao sabe se o empregado decidiu trabalhar ou decidiu “bater papo” na internet). Neste contexto, o jogo da inspe¸c˜ao tem a

matriz de payoffsindicada abaixo.

empregado

n˜ao trabalhar trabalhar

ch

ef

e fiscalizar (h,0) (vwh, wg)

n˜ao fiscalizar (−w, w) (v−w, w−g)

Observe que este jogo n˜ao possui equil´ıbrio de Nash em estrat´egias puras e, como ele deve se repetir em cada dia ´util de trabalho, n˜ao ´e

sensato escolhersemprea mesma estrat´egia pura para todos os dias.

A solu¸c˜ao, neste caso, ´e escolher entre as estrat´egias puras a cada dia seguindo uma distribui¸c˜ao de probabilidades, isto ´e, atrav´es de es-trat´egias mistas. Como as fun¸c˜oes de melhor resposta do empregado e do chefe s˜ao dadas, respectivamente, por

MREmpregado(p) = argmaxq∈[0,1]((−wp+g)q+w−g)

= ⎧ ⎨ ⎩

{1}, sep[0, g/w),

[0,1], sep=g/w,

{0}, sep(g/w,1],

MRChefe (q) = argmaxp∈[0,1]((+wq−h)p+v(1−q)−w)

= ⎧ ⎨ ⎩

{0}, seq∈[0, h/w),

[0,1], seq=h/w,

{1}, seq∈(h/w,1],

segue-se que o (´unico) equil´ıbrio de Nash em estrat´egias mistas ´e

obtido tomando-se p∗ = g/w eq=h/w. Se, por exemplo, v = 5,

w= 4,g= 3 eh= 2, ent˜ao

(p∗,1

−p∗;q,1

−q∗) = (3/4,1/4; 1/2,1/2).

Isto significa que o chefe deve escolher sua estrat´egia de acordo com

um gerador de n´umeros aleat´orios com distribui¸c˜ao de

(50)

com um gerador de n´umeros aleat´orios com distribui¸c˜ao de probabili-dade (1/2,1/2). Isto pode ser feito, por exemplo, com as duas “rodas da fortuna” da Figura 2.6.

Fiscalizar

Não fiscalizar

Trabalhar

Não trabalhar

chefe empregado

Figura 2.6: Distribui¸c˜oes de probabilidade que constituem um equil´ı-brio de Nash para o jogo do Exemplo 2.12.

A partir deste resultado, podemos calcular o valor ´otimo de contrato

do empregado, isto ´e, o valor de w que maximiza opayoff esperado

do chefe:

uChefe(w) = (+wq∗−h)p∗+v(1−q∗)−w) =v

1−wh

−w.

Se, por exemplo, √vh > g, ent˜ao este valor ´otimo ´e dado por w∗ =

vh(note queu′

Chefe(w∗) = 0 eu′′Chefe(w)≤0 paraw >0).

Jogos deste tipo tˆem sido usados para se estudar temas como controle de armas ([03, 10, 83]), preven¸c˜ao de crimes ([04]) e incentivos no trabalho ([53]).

(51)

que garante a existˆencia de equil´ıbrios em estrat´egias mistas para jogos finitos.

2.4.3

Rela¸

oes entre dominˆ

ancia e equil´ıbrio de

Nash

As Proposi¸c˜oes 2.2 e 2.3 para estrat´egias puras continuam v´alidas para estrat´egias mistas: (1) o processo de dominˆancia estrita ite-rada em estrat´egias mistas n˜ao pode eliminar um equil´ıbrio de Nash e (2) se o processo de dominˆancia estrita iterada em estrat´egias mistas deixa apenas um ´unico perfil de estrat´egias, ent˜ao este perfil ´e um

equil´ıbrio de Nash do jogo. N˜ao apresentaremos as demonstra¸c˜oes

destes resultados aqui. O leitor interessado poder´a encontr´a-las nas referˆencias [15, 26].

2.4.4

Como interpretar estrat´

egias mistas?

Existe muita controv´ersia sobre as interpreta¸c˜oes e usos de es-trat´egias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann, por exemplo, em [02], afirma que

“Mixed strategy equilibria have always been intuitively problematic because they are not ‘strict’: a player will not lose if he abandons the randomization and uses instead any arbitrary one of the pure strategy components of the randomization.”

(veja as Equa¸c˜oes 4.1 na p´agina 81) e, segundo Rardner e

Roshen-tal ([76]),

“One of the reasons why game-theoretic ideas have not found more widespread application is that randomization, which plays a major role in game theory, seems to have limited appeal in many practical situations.”

Ainda, segundo Rubinstein ([81]),

(52)

the game, goes against our intuition. We are reluctant to believe that our decisions are made at random. We prefer to be able to point to a reason for each action we take. Outside of Las Vegas we do not spin roulettes.”

De fato, testes experimentais recentes mostraram que jogadores n˜ao seguem a estrat´egia mista prevista pela teoria, mesmo quando o jogo possui um ´unico equil´ıbrio de Nash em estrat´egias mistas ([57]).

Existem tamb´em certas an´alises feitas com estrat´egias mistas que

produzem resultados n˜ao-intuitivos. Considere, por exemplo, a

se-guinte situa¸c˜ao. Um contribuinteCdeve decidir se vai ou n˜ao sonegar imposto, sabendo que existe um fiscalF que pode ou n˜ao fiscaliz´a-lo.

Na matriz de payoffs abaixo, vamos assumir que valem as seguintes

desigualdades

(1) c21> c11: o contribuinteC prefere n˜ao sonegar se souber que o fiscalF ir´a fiscalizar,

(2) c12> c22: o contribuinteC prefere sonegar se souber que o fis-calF n˜ao ir´a fiscalizar,

(3) f11> f12: o fiscalF prefere fiscalizar se souber que o contribuin-teC ir´a sonegar e

(4) f22> f21: o fiscalF prefere n˜ao fiscalizar se souber que o contri-buinteC n˜ao ir´a sonegar.

Vocˆe pode pensar que oscij s˜ao n´umeros negativos que representam

o quanto ser´a debitado deCpelo pagamento de imposto e que osfij

s˜ao n´umeros positivos que representam bˆonus salariais de F.

F

fiscalizar n˜ao fiscalizar

C

sonegar (c11, f11) (c12, f12)

n˜ao sonegar (c21, f21) (c22, f22)

.

Usando a t´ecnica descrita no Exemplo 2.11, vemos que o ´unico

equi-l´ıbrio de Nash do jogo ´e dado por (p∗

C,1−p∗C;p∗F,1−p∗F), onde

(p∗C, p∗F) =

f22−f21 f22f21f12+f11,

c22−c12 c22c12c21+c11

Imagem

Figura 1.5: Ganhadores do prˆemio Nobel de Economia em 1994:
Figura 2.3: Representa¸c˜ao gr´ afica da fun¸c˜ao de melhor resposta da mulher no jogo da batalha dos sexos.
Figura 2.4: Representa¸c˜ao gr´ afica da fun¸c˜ao de melhor resposta do homem no jogo da batalha dos sexos.
Figura 2.5: Calculando os equil´ıbrios de Nash usando as representa-
+7

Referências

Documentos relacionados

Sendo assim, o presente estudo visa quantificar a atividade das proteases alcalinas totais do trato digestório do neon gobi Elacatinus figaro em diferentes idades e dietas que compõem

O trabalho de migrantes de Fagundes- PB nas usinas Maravilha e Santa Tereza, em Pernambuco aborda as mudanças estruturais do Sistema Capitalista, que atingem a questão do mercado

Se no cadastro da administradora, foi selecionado na aba Configurações Comissões, para que as comissões fossem geradas no momento da venda do contrato, já é

A decrease in the size of the cation alkyl side-chain slightly increases the catalytic activity of the ionic liquid, improving methanol conversion and DMC selectivity.. The

O órgão consultivo e deliberativo do SISNAMA (esfera federal) ou os conselhos estaduais de meio ambiente deverão descrever quais empreendimentos estão incluídos

Otto: Este filósofo e teólogo toma como base para sua definição de religião a experiência religiosa e introduz na discussão um conceito que muito vai influenciar a compreensão

MENOR AJUSTE DE ZERO MOLA DO RANGE AJUSTE DE SPAN BRUTO AJUSTE DE CRUZAMENTO FEIXE DE RELÉ RELÉ B RELÉ A PRESSÃO DE ALIMENTAÇÃO PRESSÃO DO BICO SINAL DE ENTRADA SINAL DE SAÍDA

essa lesão afeta glândulas salivares menores, o local de acometimento mais freqüente é a região de palato duro, seguida do lábio superior, língua, assoalho de boca e