Publicações Matemáticas
Uma Introdução
à Teoria Econômica dos Jogos
Humberto Bortolossi
UFF
Gilmar Garbugio
UESB
Brígida Sartini
UFRRJ
impa
26
oDireitos reservados, 2007 pela Associação Instituto Nacional de Matemática Pura e Aplicada - IMPA Estrada Dona Castorina, 110
22460-320 Rio de Janeiro, RJ Impresso no Brasil / Printed in Brazil Capa: Noni Geiger / Sérgio R. Vaz
26o Colóquio Brasileiro de Matemática
• Aspectos Ergódicos da Teoria dos Números - Alexander Arbieto, Carlos Matheus e Carlos Gustavo Moreira
• Componentes Irredutíveis dos Espaços de Folheações - Alcides Lins Neto
• Elliptic Regularity and Free Boundary Problems: an Introduction - Eduardo V. Teixeira
• Hiperbolicidade, Estabilidade e Caos em Dimensão Um - Flavio Abdenur e Luiz Felipe Nobili França
• Introduction to Generalized Complex Geometry - Gil R. Cavalcanti
• Introduction to Tropical Geometry - Grigory Mikhalkin
• Introdução aos Algoritmos Randomizados - Celina de Figueiredo, Guilherme da Fonseca, Manoel Lemos e Vinicius de Sá
• Mathematical Aspects of Quantum Field Theory - Edson de Faria and Welington de Melo
• Métodos Estatísticos Não-Paramétricos e suas Aplicações - Aluisio Pinheiro e Hildete P. Pinheiro
• Moduli Spaces of Curves - Enrico Arbarello
• Noções de Informação Quântica - Marcelo O. Terra Cunha
• Three Dimensional Flows - Vítor Araújo e Maria José Pacifico
• Tópicos de Corpos Finitos com Aplicações em Criptografia e Teoria de Códigos - Ariane Masuda e Daniel Panario
• Tópicos Introdutórios à Análise Complexa Aplicada - André Nachbin e Ailín Ruiz de Zárate
• Uma Introdução à Mecânica Celeste - Sérgio B. Volchan
• Uma Introdução à Teoria Econômica dos Jogos - Humberto Bortolossi, Gilmar Garbugio e Brígida Sartini
• Uma Introdução aos Sistemas Dinâmicos via Frações Contínuas - Lorenzo J. Díaz e Danielle de Rezende Jorge
ISBN: 978-85-244-0265-4 Distribuição: IMPA
H. J. B.
`
A minha m˜ae Rita e aos meus irm˜aos Humberto e Reginaldo.
B. A. S.
Sum´
ario
Pref´acio 3
1 Alguns marcos hist´oricos 5 2 Jogos na forma estrat´egica 10
2.1 O que ´e um jogo? . . . 10
2.2 Solu¸c˜oes de um jogo em estrat´egias puras . . . 13
2.2.1 Dominˆancia em estrat´egias puras . . . 14
2.2.2 Equil´ıbrio de Nash em estrat´egias puras . . . . 20
2.2.3 Rela¸c˜oes entre dominˆancia e equil´ıbrio de Nash 24 2.3 Estrat´egias mistas . . . 27
2.4 Solu¸c˜oes de um jogo em estrat´egias mistas . . . 31
2.4.1 Dominˆancia em estrat´egias mistas . . . 32
2.4.2 Equil´ıbrio de Nash em estrat´egias mistas . . . . 35
2.4.3 Rela¸c˜oes entre dominˆancia e equil´ıbrio de Nash 45 2.4.4 Como interpretar estrat´egias mistas? . . . 45
2.5 Jogos infinitos . . . 48
2.6 Exerc´ıcios . . . 50
3 O teorema de equil´ıbrio de Nash 60 3.1 Usando o teorema de Brouwer . . . 60
3.2 Usando o teorema de Kakutani . . . 65
3.3 Algumas propriedades dos equil´ıbrios de Nash . . . 69
3.4 Exerc´ıcios . . . 70
4 Calculando equil´ıbrios de Nash 71
4.1 Equil´ıbrio de Nash via um problema de otimiza¸c˜ao . . 71
4.2 Equil´ıbrio de Nash via equa¸c˜oes polinomiais . . . 74
4.3 Jogos de soma zero . . . 82
4.3.1 Jogos de soma constante com dois jogadores . . 82
4.3.2 Equil´ıbrio de Nash em estrat´egias puras . . . . 86
4.3.3 Equil´ıbrio de Nash em estrat´egias mistas . . . . 91
4.3.4 O teorema minimax de von Neumann . . . 93
4.4 Equil´ıbrio de Nash via um problema de complementa-ridade . . . 101
4.4.1 Jogos bimatriciais . . . 101
4.4.2 O algoritmo de Lemke-Howson . . . 104
4.5 Gambit . . . 104
4.6 Exerc´ıcios . . . 106
5 Jogos na forma extensa 108 5.1 Defini¸c˜ao . . . 108
5.2 Equil´ıbrio de Nash . . . 110
5.3 Indu¸c˜ao retroativa e equil´ıbrio perfeito em subjogos . . 114
5.4 O teorema de Kuhn-Zermelo . . . 118
5.5 Exerc´ıcios . . . 119
6 Exemplos 120 6.1 O jogo Le Her simplificado . . . 120
6.2 O modelo de duop´olio de Cournot . . . 126
6.3 O modelo de duop´olio de Bertrand . . . 129
6.4 O modelo de duop´olio de Stackelberg . . . 131
6.5 A trag´edia dos comuns . . . 133
A Convexidade 137 B Programa¸c˜ao Linear 145 C Respostas dos exerc´ıcios 155 Bibliografia 173
Pref´
acio
Ateoria dos jogos´e uma teoria matem´atica criada para se modelar
fenˆomenos que podem ser observados quando dois ou mais “agentes de
decis˜ao” interagem entre si. Ela fornece a linguagem para a descri¸c˜ao de processos de decis˜ao conscientes e objetivos envolvendo mais de um indiv´ıduo.
Suas aplica¸c˜oes incluem elei¸c˜oes, leil˜oes, balan¸co de poder, evolu-¸c˜ao gen´etica, etc. Ela tamb´em ´e uma teoria matem´atica pura, que pode e tem sido estudada como tal, sem a necessidade de relacion´a-la
com problemas comportamentais ou jogosper se.
Algumas pessoas acreditam que ateoria dos jogos formar´a, algum
dia, o alicerce de um conhecimento t´ecnico estrito de como decis˜oes s˜ao feitas e de como a economia funciona. A teoria ainda n˜ao atingiu este patamar e, hoje, ´e mais estudada em seus aspectos matem´aticos puros e, em aplica¸c˜oes, ela ´e usada como uma ferramenta ou alegoria que auxiliam no entendimento de sistemas mais complicados.
Neste texto trataremos da teoria matem´atica dos jogos n˜
ao-coope-rativos est´aticos de informa¸c˜ao completa e dos jogos dinˆamicos de
informa¸c˜ao perfeita.
A Teoria Econˆomica dos Jogos n˜ao deve ser confundida com a
Teoria Combinat´oria dos Jogos, iniciada por Sprague e Grundy na d´ecada de 30. Enquanto que a primeira tem motiva¸c˜oes predomi-nante econˆomicas e procura estabelecer m´etodos para se maximizar
o ganho (payoff), a segunda se concentra nos aspectos combinat´orios
de jogos de mesa (por exemplo, a estrat´egia do jogo de nim) e n˜ao
permite “elementos imprevis´ıveis” como o lan¸camento de um dado ou o embaralhamento de cartas.
Acreditamos que o assunto seja estimulante para o estudante de matem´atica: ele ter´a a oportunidade de ver como conceitos de an´alise,
topologia, otimiza¸c˜ao e probabilidade se integram em uma teoria apli-cada.
Agradecimentos
Gostar´ıamos de agradecer a Hilmar Ilton Santana Ferreira, Polya-ne Alves Santos e Larissa Santana Barreto, que participaram ativa-mente dos semin´arios sobre teoria dos jogos realizados no per´ıodo
2003-2004, momento no qual uma vers˜ao preliminar deste texto foi
escrita. Tamb´em gostar´ıamos de agradecer a Rita de C´assia Silva Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que leram o texto e fizeram v´arias sugest˜oes. Finalmente, gostar´ıamos de
agradecer a Se¸c˜ao de Referˆencia (SRE) da Divis˜ao de Bibliotecas e
Documenta¸c˜ao da PUC-Rio pela agilidade e eficiˆencia na aquisi¸c˜ao de alguns artigos dif´ıceis de se encontrar.
Humberto Jos´e Bortolossi Br´ıgida Alexandre Sartini
Gilmar Garbugio
Alguns marcos
hist´
oricos
Neste cap´ıtulo apresentaremos alguns marcos hist´oricos da teoria dos jogos relacionados principalmente com os t´opicos que iremos ex-plorar no texto. Para uma cronologia mais completa, recomendamos as referˆencias [46, 50, 65, 86, 95, 96].
O conceito de solu¸c˜ao de um jogo por estrat´egia mista1surgiu pela
primeira vez no estudo do jogoLe Her, realizado por James
Walde-grave e descrito por ele em uma carta a Pierre R´emond de Montmort, em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar
uma estrat´egia que maximizasse a probabilidade de vit´oria do
joga-dor, independentemente da escolha de estrat´egia de seu oponente. Este jogo foi discutido por Montmort e por Nicholas Bernoulli em 1713 e os resultados foram publicados nesse ano por Montmort, que incluiu a solu¸c˜ao de Waldegrave em um apˆendice.
Em 1838, Augustin Cournot publicou sua obra Recherches sur
les Principes Mathematiques de la Theorie des Richesses, na qual analisou um caso especial de duop´olio. As empresas decidiam as quantidades a produzir e Cournot definiu o conceito de equil´ıbrio de
1Uma estrat´egia pura ´e uma das escolhas que o jogador pode fazer. Uma
estrat´egia mista ´e uma distribui¸c˜ao de probabilidades sobre o conjunto de es-trat´egias puras. Defini¸c˜oes formais ser˜ao apresentadas no pr´oximo cap´ıtulo.
Figura 1.1: Antoine Augustin Cournot (1801–1877).
mercado como sendo a situa¸c˜ao em que ambas as empresas reagem
de forma ´otima `a decis˜ao da empresa concorrente. Este conceito
de solu¸c˜ao ´e uma vers˜ao do equil´ıbrio de Nash aplicado ao caso do duop´olio.
No in´ıcio do s´eculo XX, apareceram v´arios artigos sobreteoria dos jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo
de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die
Theorie des Schachspiels, afirmando que, em cada etapa do jogo, pelo menos um dos jogadores possui uma estrat´egia que o levar´a a vit´oria
ou ao empate. Contudo, Zermelo n˜ao demonstrou o teorema em seu
artigo. A primeira demonstra¸c˜ao foi dada por Laszlo Kalmar.
Apa-rentemente, foi Zermelo quem primeiro destacou o uso da semˆantica
de otimalidade em teoria dos jogos: “Whether one could calculate
with mathematical objectivity, or even give a participant some idea of, the value of a possible position in the game, as well as of the best move in this position: information without which the player would have to eliminate both subjective and psychological guesses and the opinions of ‘the perfect player’, etc.?” ([95]).
No per´ıodo de 1921 a 1927, ´Emile Borel publicou uma s´erie de
notas sobre jogos sim´etricos de soma zero com dois jogadores com
um n´umero finito n de estrat´egias puras para cada jogador. Borel
foi o primeiro a tentar formular matematicamente este jogo. Ele in-troduziu o conceito de “m´etodo de jogada” (o que hoje corresponde `a estrat´egia pura) e procurou por uma solu¸c˜ao em estrat´egias mis-tas (o que hoje ´e conhecido como solu¸c˜ao minimax). Em 1921, ele
Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953).
para n= 5 ([08]). Borel acreditava que o resultado de existˆencia
n˜ao seria v´alido para um n qualquer, mas como n˜ao encontrou um
contra-exemplo, deixou o problema em aberto.
Figura 1.3: F´elix Edouard Justin ´Emile Borel (1871-1956).
No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando
topologia e c´alculo funcional ([50]), John von Neumann demonstrou a existˆencia de solu¸c˜ao em estrat´egias mistas de um jogo finito de soma zero com dois jogadores e um n´umero arbitr´ario de estrat´egias pura. Este artigo tamb´em introduziu a forma extensa de um jogo.
At´e a d´ecada de 40, os artigos publicados sobreteoria dos jogos
n˜ao tinham despertado muito o interesse dos cientistas sociais e de
outras ´areas que pesquisavam sobre conflitos de interesses. Talvez
isto se deva ao fato de que os artigos eram escritos por matem´aticos e publicados em revistas matem´aticas. Este panorama foi alterado
Behavior, escrito por John von Neumann e pelo economista Oskar
Morgenstern, um marco na teoria dos jogos.
Oskar Morgenstern John von Neumann
(1902-1977) (1903-1957)
Figura 1.4: Oskar Morgenstern e John von Neumann.
pesquisa-dores de diversas ´areas. Na reedi¸c˜ao de 1947, tomada como padr˜ao, os autores estabeleceram os axiomas da teoria da utilidade. O livro foi republicado em 1953 e sua mais recente edi¸c˜ao ´e de 1980.
Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua
tese de doutorado em 1949, sob o t´ıtuloNon-Cooperative Games. Ele
definiu o conceito deponto de equil´ıbrio, atualmente conhecido como
equil´ıbrio de Nash de um jogo e provou sua existˆencia para jogos n˜ao-cooperativos. Os resultados mais importantes de sua tese est˜ao no
artigoEquilibrium Points in N-Person Games de 1950 ([66]) e, mais
detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).
Ainda em 1950, Nash escreveu sobre o problema da barganha em
The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos
coo-perativos em Two Person Cooperative Games ([70]). Nestes, Nash
definiu o conceito de solu¸c˜ao da barganha de Nash em um jogo coo-perativo com dois jogadores, estabeleceu um sistema de axiomas que esta solu¸c˜ao deveria satisfazer e provou a existˆencia e unicidade desta solu¸c˜ao.
Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam o Prˆemio Nobel de Economia em reconhecimento ao trabalho pioneiro sobre an´alise de equil´ıbrio na teoria de jogos n˜ao-cooperativos.
(a) (b) (c)
Jogos na forma
estrat´
egica
2.1
O que ´
e um jogo?
A teoria dos jogos pode ser definida como a teoria dos modelos matem´aticos que estuda a escolha de decis˜oes ´otimas sob condi¸c˜oes
de conflito. O elemento b´asico em um jogo ´e o conjunto dejogadores
que dele participam. Cada jogador tem um conjunto deestrat´egias.
Quando cada jogador escolhe sua estrat´egia, temos ent˜ao uma
si-tua¸c˜ao ou perfil no espa¸co de todas as situa¸c˜oes (perfis) poss´ıveis. Cada jogador tem interesse ou preferˆencias para cada situa¸c˜ao no
jogo. Em termos matem´aticos, cada jogador tem uma fun¸c˜ao
uti-lidade que atribui um n´umero real (o ganho ou payoff do jogador) a cada situa¸c˜ao do jogo. Mais especificamente, um jogo tem os se-guintes elementos b´asicos: existe um conjunto finito de jogadores, representado por
G={g1, g2, . . . , gn},
e cada jogadorgi∈Gpossui um conjunto finito
Si={si1, si2, . . . , simi}
de op¸c˜oes, denominadas estrat´egias puras do jogador gi (mi ≥ 2). Um vetor
s= (s1j1, s2j2, . . . , snjn),
onde siji ´e uma estrat´egia pura para o jogador gi ∈ G, ´e
denomi-nado umperfil de estrat´egias puras. O conjunto de todos os perfis de estrat´egias puras formam, portanto, o produto cartesiano
S=
n
i=1
Si=S1×S2× · · · ×Sn,
denominado espa¸co de estrat´egias puras do jogo. Para cada
joga-dorgi∈G, existe umafun¸c˜ao utilidade
ui: S → R s → ui(s)
que associa o ganho (payoff) ui(s) do jogador gi a cada perfil de
estrat´egias puras s ∈ S. Esta fun¸c˜ao utilidade ´e uma forma de re-presentar a preferˆencia do jogadorgicom rela¸c˜ao aos v´arios perfis de estrat´egias do jogo ([13]).
Jogos descritos nesta forma s˜ao denominadosjogos estrat´egicos ou
jogos na forma normal. Neles, cada jogador deve fazer a sua escolha
de estrat´egiasem o conhecimento das escolhas dos demais jogadores.
Admite-se, contudo, que cada jogador conhece toda a estrutura do jogo. Por este motivo, jogos deste tipo tamb´em s˜ao denominados
jogos n˜ao-cooperativos de informa¸c˜ao completa.
Assume-se tamb´em que os jogadores sejamracionais, isto ´e, eles
sempre escolher˜ao a¸c˜oes que maximizem a sua fun¸c˜ao utilidade. Al´em
de ser racional, cada jogador (1) sabe que seus advers´arios tamb´em
s˜ao racionais, (2) sabe que eles sabem que o jogador sabe que eles s˜ao racionais,ad infinitum.
Exemplo 2.1 (O dilema do prisioneiro)Possivelmente o exem-plo mais conhecido na teoria dos jogos ´e odilema do prisioneiro. Ele
foi formulado por Albert W. Tucker em 1950, em um semin´ario para
psic´ologos na Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos.
poderem se comunicar entre si, o delegado de plant˜ao faz a seguinte proposta: cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜ao submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜ao ambos ter˜ao pena de 5 anos. Mas se um confessar e o outro negar, ent˜ao o que confessou ser´a libertado e o outro ser´a condenado a 10 anos de pris˜ao. Neste contexto, temos
G={Al,Bob},
SAl ={confessar,negar}, SBob={confessar,negar}, S=SAl×SBob=
{(confessar,confessar),(confessar,negar),
(negar,confessar),(negar,negar)}.
As duas fun¸c˜oes utilidade
uAl:S →R e uBob:S→R s˜ao dadas por
uAl(confessar,confessar) =−5, uAl(confessar,negar) = 0, uAl(negar,confessar) =−10, uAl(negar,negar) =−1,
(que representam os ganhos de Al) e
uBob(confessar,confessar) =−5, uBob(confessar,negar) =−10, uBob(negar,confessar) = 0, uBob(negar,negar) =−1
(que representam os ganhos de Bob). ´E uma pr´atica representar os
payoffs dos jogadores atrav´es de uma matriz, denominadamatriz de payoffs.
Bob
confessar negar
Al
confessar (−5,−5) (0,−10)
negar (−10,0) (−1,−1)
Nesta matriz, os n´umeros de cada c´elula representam,
respectiva-mente, os payoffs de Al e Bob para as escolhas de Al e Bob
Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher desejam sair para passear. O homem prefere assistir a um jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem
juntos para o futebol, ent˜ao o homem tem satisfa¸c˜ao maior do que a
mulher. Por outro lado, se eles forem juntos ao cinema, ent˜ao a
mu-lher tem satisfa¸c˜ao maior do que o homem. Finalmente, se eles sa´ırem sozinhos, ent˜ao ambos ficam igualmente insatisfeitos. Esta situa¸c˜ao tamb´em pode ser modelada como um jogo estrat´egico. Temos:
G={homem,mulher},
Shomem={futebol,cinema}, Smulher={futebol,cinema}, S=Shomem×Smulher=
{(futebol,futebol),(futebol,cinema),
(cinema,futebol),(cinema,cinema)}.
As duas fun¸c˜oes utilidade uhomem: S → R e umulher: S → R s˜ao
descritas pela seguinte matriz depayoffs:
Mulher
futebol cinema
Ho
m
em futebol (10,5) (0,0)
cinema (0,0) (5,10)
.
2.2
Solu¸
c˜
oes de um jogo em estrat´
egias
puras
Uma solu¸c˜ao de um jogo ´e uma prescri¸c˜ao ou previs˜ao sobre o re-sultado do jogo. Existem v´arios conceitos diferentes de solu¸c˜ao. Nesta
se¸c˜ao, investigaremos os dois conceitos mais comuns: dominˆancia e
equil´ıbrio de Nash.
se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se
analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira:
“Duas coisas podem acontecer: Bob pode confessar ou Bob pode negar. Se Bob confessar, ent˜ao ´e melhor para
mim confessar tamb´em. Se Bob n˜ao confessar, ent˜ao eu
fico livre se eu confessar. Em qualquer um dos casos, ´e
melhor para mim confessar. Ent˜ao, eu confessarei.”
Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ınio e concluir que Bob tamb´em ir´a confessar. Assim, ambos confessar˜ao e ficar˜ao presos por 5 anos.
Em termos da teoria dos jogos, dizemos que (1) os dois
joga-dores possuem uma estrat´egia dominante, isto ´e, todas menos uma
estrat´egia ´eestritamente dominada, (2) que o jogo ´e resol´uvel por do-minˆancia estrita iteradae (3) que o jogo termina em uma solu¸c˜ao que ´e umequil´ıbrio de estrat´egia dominante, conceitos que definiremos a seguir.
2.2.1
Dominˆ
ancia em estrat´
egias puras
Freq¨uentemente, iremos discutir perfis de estrat´egia na qual ape-nas a estrat´egia de um ´unico jogadorgi∈Gir´a variar, enquanto que as estrat´egias de seus oponentes permanecer˜ao fixas. Denote por
s−i= (s1j1, . . . , s(i−1)ji−1, s(i+1)ji+1, . . . , snjn)∈
S−i=S1× · · · ×Si−1×Si+1× · · · ×Sn
uma escolha de estrat´egia para todos os jogadores, menos o jogadorgi. Desta maneira, um perfil de estrat´egias pode ser convenientemente denotado por
s= (siji,s−i) = (s1j1, . . . , s(i−1)ji−1, siji, s(i+1)ji+1, . . . , snjn).
Defini¸c˜ao 2.1 (Estrat´egia Pura Estritamente Domi-nada) Dizemos que uma estrat´egia pura sik ∈ Si do joga-dorgi∈G´eestritamente dominadapela estrat´egiasik′ ∈Sise,
independentemente das escolhas dos demais jogadores, o joga-dorgi ganhar mais escolhendosik′ do quesik, isto ´e, se
ui(sik′,s−i)> ui(sik,s−i),
para todos−i∈S−i.
Defini¸c˜ao 2.2 (em estrat´egias puras)
(a) (Dominˆancia Estrita Iterada)Dominˆancia estrita ite-rada´e o processo no qual, seq¨uencialmente, se eliminam as estrat´egias que s˜ao estritamente dominadas.
(b) (Equil´ıbrio de Estrat´egia Estritamente
Dominan-te)Quando o processo de dominˆancia estrita iterada reduz
o jogo para um ´unico perfil de estrat´egias purass∗, dizemos ques∗´e umequil´ıbrio de estrat´egia estritamente dominante.
Exemplo 2.3 Considere o jogo determinado pela matriz depayoffs
abaixo.
g2
s21 s22 s23 s24
g1
s11 (5,2) (2,6) (1,4) (0,4)
s12 (0,0) (3,2) (2,1) (1,1)
s13 (7,0) (2,2) (1,1) (5,1)
Neste jogo, para o jogadorg2, a estrat´egias21 ´e estritamente
domi-nada pela estrat´egias24 e, assim, a primeira coluna da matriz pode
ser eliminada.
g2
s22 s23 s24
g1
s11 (2,6) (1,4) (0,4)
s12 (3,2) (2,1) (1,1)
s13 (2,2) (1,1) (5,1)
s14 (1,3) (0,2) (4,8)
Agora, nesta matriz reduzida, para o jogador g1, as estrat´egias s11
es14 s˜ao estritamente dominadas pelas estrat´egiass12 es13, respec-tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Al´em disso, a estrat´egias23do jogadorg2´e estritamente dominada pela
es-trat´egias22. Assim, a coluna 2 tamb´em pode ser eliminada. Obtemos
ent˜ao uma matriz reduzida 2×2.
g2
s22 s24
g1 s12 (3,2) (1,1)
s13 (2,2) (5,1)
Finalmente, a estrat´egia s24 do jogadorg2 ´e estritamente dominada
pela estrat´egias22 e, na matriz 2×1 resultante, a estrat´egias13 do jogadorg1´e estritamente dominada pela estrat´egias12. Vemos ent˜ao que (s12, s22) ´e o equil´ıbrio de estrat´egias estritamente dominantes do jogo: o jogadorg1escolhe a estrat´egias12(ganhando 3) e o jogadorg2
escolhe a estrat´egias22(ganhando 2).
mais simples, no sentido de que o conjunto de estrat´egias puras de um jogador (aquele que tem uma estrat´egia estritamente domi-nada) ´e substitu´ıdo por um subconjunto com menos elementos (ob-tido removense justamente as estrat´egias que s˜ao estritamente do-minadas). No exemplo acima, os conjuntos de estrat´egias puras ini-ciais dos dois jogadores s˜ao dados, respectivamente, por
S1={s11, s12, s13, s14} e S2={s21, s22, s23, s24}.
Como a estrat´egia puras21 ´e estritamente dominada pors24, o
con-juntoS2´e substitu´ıdo por{s22, s23, s24}=S2−{s21}. O conjuntoS1
permanece o mesmo. Sendo assim, podemos substituir o jogo original por um mais simples, onde os conjuntos de estrat´egias puras dos dois jogadores s˜ao dados por
S1(1)={s11, s12, s13, s14} e S (1)
2 ={s22, s23, s24}.
As fun¸c˜oes utilidade do novo jogo s˜ao as restri¸c˜oes das fun¸c˜oes utili-dade do jogo original aos novos conjuntos de estrat´egias puras:
u1|S1(1) e u2|S(1)2 .
Para o novo jogo, vemos que as estrat´egiass11es14s˜ao estritamente
dominadas pelas estrat´egiass12 es13, respectivamente. Logo,
pode-mos simplificar o jogo mais uma vez, considerando os conjuntos de estrat´egias puras
S1(2)={s12, s13} e S (2)
2 ={s22, s23, s24}.
Seguindo com as outras elimina¸c˜oes, terminamos com um jogo muito simples, onde cada conjunto de estrat´egias puras ´e unit´ario:
S1(5)={s12} e S2(5)={s22}.
Este processo de elimina¸c˜ao gerou, portanto, uma cadeia de espa¸cos de estrat´egias puras:
S=S1×S2S(1)=S1(1)×S2(1)S(2) =S1(2)×S2(2)· · ·
Neste exemplo, a t´ecnica de dominˆancia estrita iterada forneceu um ´
unico perfil de estrat´egias como solu¸c˜ao do jogo, no caso, o perfil
(s12, s22)∈S1(5)×S (5) 2 .
Contudo, pode acontecer da t´ecnica fornecer v´arios perfis ou, at´e
mesmo, fornecer todo o espa¸co de estrat´egias, como ´e o caso da
bata-lha dos sexos, onde n˜ao existem estrat´egias estritamente dominadas.
Um outro conceito importante ´e o de estrat´egia pura fracamente dominada.
Defini¸c˜ao 2.3 (Estrat´egia Pura Fracamente Domi-nada) Dizemos que uma estrat´egia pura sik ∈ Si do joga-dor gi ∈ G ´e fracamente dominada pela estrat´egia sik′ ∈ Si
se
ui(sik′,s−i)≥ui(sik,s−i),
para todos−i∈S−ie, pelo menos para algum s•−i∈S−i, ui(sik′,s•−i)> ui(sik,s•−i).
Em outras palavras, sik ∈ Si ´e fracamente dominada por
sik′ ∈Si se, independentemente das escolhas dos demais
joga-dores, o jogadorgi nada perde se trocar a estrat´egia sik ∈ Si
pela estrat´egiasik′ ∈ Si e, pelo menos para uma escolha dos
demais jogadores, esta troca d´a ao jogadorgi um ganho maior.
Defini¸c˜ao 2.4
(a) (Dominˆancia Fraca Iterada)Dominˆancia fraca iterada
´e o processo no qual, seq¨uencialmente, se eliminam as es-trat´egias que s˜ao fracamente dominadas.
(b) (Equil´ıbrio de Estrat´egia Fracamente Dominante)
Exemplo 2.4 Considere o jogo cuja matriz depayoffs´e dada por:
g2
s21 s22
g1 s11 (1,1) (1,0)
s12 (1,0) (0,1) .
A estrat´egia s12 do jogador g1 ´e fracamente dominada pela
estra-t´egias11. Eliminando-a, obtemos a matriz reduzida:
g2
s21 s22
g1 s11 (1,1) (1,0) .
Vemos agora que a estrat´egia s22 do jogador 2 ´e estritamente
do-minada pela estrat´egias21. Sendo assim, (s11, s21) ´e o equil´ıbrio de estrat´egias fracamente dominadas do jogo.
Uma pergunta natural ´e se o processo de elimina¸c˜ao das estrat´egias
dominadas depende ou n˜ao da ordem em que s˜ao realizadas. Para
o caso de estrat´egias estritamente dominadas, pode-se mostrar que
esta ordem ´e irrelevante, isto ´e, independentemente da ordem em que as estrat´egias (estritamente dominadas) s˜ao eliminadas, obt´em-se sempre a mesma matriz reduzida no final do processo. Por outro lado,
o processo de elimina¸c˜ao das estrat´egiasfracamente dominadas pode
conduzir a resultados diferentes, dependendo da ordem de elimina¸c˜ao. Considere, por exemplo, o jogo (conforme [32]):
g2
s21 s22 s23
g1 s11 (0,2) (0,0) (1,0)
Eliminando-se, em seq¨uˆencia, as estrat´egias s23 (que ´e estritamente
dominada por s21), s11 (que ´e fracamente dominada por s12) e s22
(que ´e estritamente dominada por s21), obtemos (s12, s21) como
res-posta. Agora, eliminando-se, em seq¨uˆencia, as estrat´egias s22 (que
´e estritamente dominada pors21), s12 (que ´e fracamente dominada
pors11) es23(que ´e estritamente dominada pors21), obtemos outra
resposta: (s11, s21). Para detalhes sobre este assunto, recomendamos
as referˆencias [01, 15, 26, 32, 47, 55].
Com rela¸c˜ao `a complexidade computacional, os resultados mos-tram que os problemas relacionados com estrat´egias estritamente do-minadas tendem a ser mais f´aceis (no sentido que eles podem ser
resolvidos em tempo polinomial), enquanto que quest˜oes envolvendo
estrat´egias fracamente dominadas s˜ao mais dif´ıceis (no sentido que eles s˜ao NP-completos). Por exemplo, saber se uma dada submatriz
de uma matriz de payoffs pode ser obtida atrav´es do processo de
elimina¸c˜ao de estrat´egias dominadas ´e um problema polinomial para o caso de estrat´egias estritamente dominadas e ´e um problema NP-Completo para o caso de estrat´egias fracamente dominadas. Detalhes sobre o assunto podem ser encontrados nas referˆencias [18, 33].
2.2.2
Equil´ıbrio de Nash em estrat´
egias puras
Uma solu¸c˜ao estrat´egicaou equil´ıbrio de Nashde um jogo ´e um
perfil de estrat´egias onde cada jogador n˜ao tem incentivo de mudar
sua estrat´egia se os demais jogadores n˜ao o fizerem.
Defini¸c˜ao 2.5 (Equil´ıbrio de Nash)Dizemos que um perfil de estrat´egias
s∗= (s∗
1, . . . , s∗(i−1), s∗i, s∗(i+1), . . . , s∗n)∈S
´e umequil´ıbrio de Nashse
ui(s∗
i,s∗−i)≥ui(siji,s ∗ −i)
Exemplo 2.5
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrat´egias (confessar, confessar) ´e um equil´ıbrio de Nash. De fato:
uAl(confessar,confessar) =−5>−10 =uAl(negar,confessar) e
uBob(confessar,confessar) =−5>−10 =uBob(confessar,negar).
Estas desigualdades mostram que, para o perfil de estrat´egias
(confessar, confessar), um prisioneiro n˜ao se sente motivado a
mudar a sua estrat´egia se o outro n˜ao o fizer (ele n˜ao vai ficar menos tempo na cadeia fazendo isto).
J´a o perfil (negar, confessar) n˜ao ´e um equil´ıbrio de Nash do jogo pois, neste caso, dado que Bob decide confessar, Al fica menos tempo na cadeia se mudar a sua estrat´egia de negar para confessar. Em outras palavras, para o perfil (negar, confessar), Al se sente motivado a mudar a sua estrat´egia se Bob n˜ao o fizer. Os perfis (confessar, negar) e (negar, negar) tamb´em n˜ao s˜ao equil´ıbrios de Nash. Em (confessar, negar), Bob se sente moti-vado a mudar a sua estrat´egia se Al n˜ao o fizer e, em (negar, negar), cada um dos prisioneiros se sente motivado a mudar a sua estrat´egia se o outro n˜ao o fizer. Desta maneira, vemos que o ´unico equil´ıbrio de Nash do jogo ´e (confessar, confessar).
(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estrat´egia (fu-tebol, futebol) e (cinema, cinema) s˜ao os ´unicos equil´ıbrios de Nash do jogo.
(c) No Exemplo 2.3, o ´unico equil´ıbrio de Nash do jogo ´e o perfil de estrat´egias (s12, s22).
Existem, contudo, jogos que n˜ao possuem equil´ıbrios de Nash em
estrat´egias puras. Este ´e o caso, por exemplo, do jogo de comparar
Exemplo 2.6 (Comparar moedas)Nesse jogo, dois jogadores exi-bem, ao mesmo tempo, a moeda que cada um esconde em sua m˜ao. Se ambas as moedas apresentam cara ou coroa, o segundo jogador
d´a sua moeda para o primeiro. Se uma das moedas apresenta cara,
enquanto a outra apresenta coroa, ´e a vez do primeiro jogador dar sua moeda para o segundo. Esse jogo se encontra representado por
sua matriz depayoffs dada abaixo.
g2
s21 s22
g1 s11 (+1,−1) (−1,+1) s12 (−1,+1) (+1,−1)
Observe que o perfil de estrat´egias (s11, s21) n˜ao ´e um equil´ıbrio de
Nash em estrat´egias puras, pois se o jogador g1 mantiver a sua
es-trat´egia s11, o jogador g2 ter´a um ganho maior se mudar sua
es-trat´egia des21 paras22, isto ´e, ele se sente motivado a mudar a sua
estrat´egia se o jogador g1 n˜ao mudar a sua escolha. O mesmo
com-portamento ocorre para o perfil de estrat´egias (s12, s22). J´a, para os perfis (s11, s22) e (s12, s21), ´e o jogador g1 que se sente motivado a
mudar de estrat´egia para ganhar mais, se o jogadorg2mantiver a sua
estrat´egia. Isto mostra que o jogo de comparar moedas n˜ao possui equil´ıbrios de Nash em estrat´egias puras.
Existe uma maneira conveniente de se caracterizar equil´ıbrios de
Nash atrav´es das fun¸c˜oes de melhor resposta. De maneira informal,
a melhor resposta de um jogador para uma determinada escolha de estrat´egias dos demais jogadores ´e o conjunto de estrat´egias do jo-gador que maximizam o seu ganho quando os demais jojo-gadores n˜ao mudam as suas escolhas. Mais precisamente, temos a seguinte
Defini¸c˜ao 2.6 (Func¸˜oes de melhor resposta)A fun¸c˜ao de melhor resposta do jogadorgi´e a aplica¸c˜ao
definida por
MRi(s−i) = argmaxsi∈Siui(si,s−i)
= {s∗
i ∈Si | ∀si∈Si, ui(s∗i,s−i)≥ui(si,s−i)},
coms−i∈S−i(aqui 2Sirepresenta o conjunto das partes deSi).
A fun¸c˜ao de melhor resposta do jogo ´e a aplica¸c˜ao
MR :S →2S
definida por
MR(s) = (MR1(s−1),MR2(s−2), . . . ,MRn(s−n)),
com s ∈ S. Observa¸c˜ao: alguns autores usam as nota¸c˜oes
MRi:S−i⇒Si e MRi:S−i →→Si para representar a fun¸c˜ao
de melhor resposta MRi: S−i→2Si.
Exemplo 2.7
(a) No dilema do prisioneiro (Exemplo 2.1), temos
MRAl : SBob →→ SAl
confessar → {confessar}
negar → {confessar}
MRBob: SAl →→ SBob
confessar → {confessar}
negar → {confessar}.
(b) Na batalha dos sexos (Exemplo 2.2), temos
MRHomem: SMulher →→ SHomem
futebol → {futebol}
cinema → {cinema}
MRMulher: SHomem →→ SMulher
futebol → {futebol}
(c) No Exemplo 2.3, temos
MR1(s21) ={s14}, MR1(s22) ={s12},
MR1(s23) ={s12}, MR1(s24) ={s13},
MR2(s11) ={s22}, MR2(s12) ={s22},
MR2(s13) ={s22}, MR2(s14) ={s24}.
(d) No jogo de comparar moedas (Exemplo 2.6), temos
MR1(s21) ={s11}, MR1(s22) ={s12},
MR2(s11) ={s22}, MR2(s12) ={s21}.
A pr´oxima proposi¸c˜ao ´e uma conseq¨uˆencia direta das defini¸c˜oes de equil´ıbrio de Nash e fun¸c˜oes de melhor resposta.
Proposi¸c˜ao 2.1 s∗ = (s∗
1, . . . , s∗i, . . . , s∗n)∈S ´e um equil´ıbrio
de Nash em estrat´egias puras se, e somente se,s∗
i ∈MRi(s∗−i)
para todoi= 1, . . . , n.
Observac¸˜ao. Como vimos, nem sempre um jogo possui um equi-l´ıbrio de Nash em estrat´egias puras. Contudo, ´e poss´ıvel garantir esta existˆencia para certos tipos de jogos com estruturas especiais. O leitor interessado pode consultar os jogos descritos nos artigos [28, 61, 80, 94]. Para resultados quantitativos, veja [60].
2.2.3
Rela¸
c˜
oes entre dominˆ
ancia e equil´ıbrio de
Nash
Proposi¸c˜ao 2.2 O processo de dominˆancia estrita iterada n˜ao pode eliminar um equil´ıbrio de Nash ao simplificar um jogo.
com menos elementos, obtido removendo-se as estrat´egias do jogador que s˜ao estritamente dominadas. Cada elimina¸c˜ao gera um espa¸co de estrat´egias puras com menos elementos o que, sucessivamente, sim-plifica o jogo original:
S=S1× · · · ×Sn S(1)=S1(1)× · · · ×Sn(1)
· · ·S(k)=S(k)1 × · · · ×Sn(k).
Com esta nota¸c˜ao, o enunciado da proposi¸c˜ao pode ser colocado as-sim: ses∗∈S ´e um equil´ıbrio de Nash, ent˜aos∗∈S(k).
A demonstra¸c˜ao ser´a feita por contradi¸c˜ao: suponha, por absurdo, que exista s∗= (s∗
1, . . . , s∗n)∈S tal ques∗ ´e um equil´ıbrio de Nash,
mas s∗ ∈ S(k). Isto significa que existe i tal que s∗
i ∈ S (l) i mas s∗
i ∈S (l+1)
i para algum l= 0, . . . , k−1 (se l= 0, defina S (0) i =Si).
Sem perda de generalidade, vamos supor que esta propriedade ocorre pelaprimeira vez para o ´ındicei, isto ´e,s∗
i ´e a primeira estrat´egia do
perfil de estrat´egias
s∗= (s∗
1, . . . , s∗(i−1), s∗i, s∗(i+1), . . . , s∗n)
que ´e eliminada por uma estrat´egia estritamente dominante. Sendo assim, existes•
i ∈S (l)
i tal que
ui(s∗i,s−i)< ui(s•i,s−i)
para todos−i∈S−(l)i. Comos∗i ´e a primeira estrat´egia a ser eliminada,
isto significa ques∗−i ∈S−(l)i e, portanto,
ui(s∗
i,s∗−i)< ui(s•i,s∗−i).
Mas isto ´e um absurdo pois, por hip´otese, s∗ = (s∗
i,s∗−i) ´e um
equil´ıbrio de Nash.
Proposi¸c˜ao 2.3 Se o processo de dominˆancia estrita iterada deixa apenas um ´unico perfil de estrat´egias purass∗, ent˜ao s∗
Demonstra¸c˜ao:Suponha que o processo de dominˆancia estrita iterada gere uma cadeia de espa¸cos de estrat´egias puras
S=S1× · · · ×SnS(1) =S1(1)× · · · ×Sn(1)
· · ·S(k)=S1(k)× · · · ×Sn(k),
onde o ´ultimo conjunto da cadeia ´e unit´ario:
S(k)=S1(k)× · · · ×S(k)n ={s∗}={(s∗
1, . . . , s∗i, . . . , s∗n)}.
Note que, em particular, s∗
1 ∈ S
(l)
1 , s∗2 ∈ S (l)
2 , . . . , s∗n ∈ S (l)
n , para
todo l = 0, . . . , k. Vamos mostrar que, nesta situa¸c˜ao,s∗ ´e o ´unico
equil´ıbrio de Nash do jogo. De fato, basta mostrar que s∗ ´e um
equil´ıbrio de Nash, pois a unicidade ´e uma conseq¨uˆencia direta da
Proposi¸c˜ao 2.2. Suponha ent˜ao, por absurdo, que s∗ n˜ao seja um
equil´ıbrio de Nash. Neste caso, devem existir ´ındice i e estrat´egia
puras[1]
i ∈Si, coms
[1]
i =s∗i, tais que ui(s∗
i,s∗−i)< ui(s
[1]
i ,s∗−i).
Dado que (s[1]
i ,s∗−i)∈S(k)e dado ques∗ι ∈S (l)
ι para todoι= 1, . . . n
e para todo l= 0, . . . , k, segue-se que a estrat´egias[1]
i ´e estritamente
dominada por alguma outra estrat´egias[2]
i ∈Si. Segue-se ent˜ao que,
em particular, ui(s[1]
i ,s∗−i)< ui(s
[2]
i ,s∗−i) e, portanto,
ui(s∗
i,s∗−i)< ui(s
[1]
i ,s∗−i)< ui(s
[2]
i ,s∗−i).
Note que, por causa destas desigualdades, segue-se que s[2]
i =s
[1]
i e s[2]
i =s∗i. Como (s
[2]
i ,s∗−i) tamb´em n˜ao pertence aS(k), segue-se que a
estrat´egias[2]
i ´e estritamente dominada por uma outra estrat´egias
[3]
i ∈ Si. Sendo assim,ui(s[2]
i ,s∗−i)< ui(s
[3]
i ,s∗−i) e, portanto,
ui(s∗i,s∗−i)< ui(s
[1]
i ,s
∗
−i)< ui(s
[2]
i ,s
∗
−i)< ui(s
[3]
i ,s
∗ −i).
Como antes, destas desigualdades, segue-se ques[3]
i =s
[2]
i ,s
[3]
i =s
[1]
i e s[3]
i =s∗i. Prosseguindo desta maneira, construir´ıamos uma seq¨uˆencia
infinita (s[1]
i , s
[2]
i , s
[3]
i , . . . , s
[r]
i , . . .) de estrat´egias purasdistintas do
jo-gadorgi satisfazendo as desigualdades
ui(s∗i,s∗−i)< ui(s
[1]
i ,s∗−i)<· · ·< ui(s
[r]
Mas isto ´e um absurdo, poisSi ´e um conjunto finito.
A rec´ıproca da Proposi¸c˜ao 2.3 ´e falsa, isto ´e, mesmo que o jogo tenha um ´unico equil´ıbrio de Nash, ele n˜ao ´e necessariamente obtido a
partir do processo de dominˆancia estrita iterada. O jogo cuja matriz
depayoffs´e
g2
s21 s22 s23
g1
s11 (−1,+1) (+1,−1) (−1,+1)
s12 (+1,−1) (−1,+1) (+1,−1)
s13 (−1,+1) (+1,−1) (+5,+5)
fornece um contra-exemplo: s∗ = (s13, s23) ´e o ´unico equil´ıbrio de
Nash do jogo, mas n˜ao existem estrat´egias estritamente dominadas.
A Proposi¸c˜ao 2.2 ´e se trocarmos dominˆancia estrita por
domi-nˆancia fraca, isto ´e, o processo de dominˆancia fraca iterada pode
eliminar um equil´ıbrio de Nash (veja o exerc´ıcio [10] na p´agina 58
para um contra-exemplo). Se o processo de dominˆancia fraca iterada
reduz o jogo para apenas um ´unico perfil de estrat´egias (como na
Proposi¸c˜ao 2.3), ent˜ao este perfil ´e obrigatoriamente um equil´ıbrio de Nash, contudo, ele n˜ao ´e necessariamente o ´unico equil´ıbrio de Nash do jogo.
2.3
Estrat´
egias mistas
Como vimos no jogo de comparar moedas do Exemplo 2.6, existem jogos que n˜ao possuem equil´ıbrios de Nash em estrat´egias puras. Uma alternativa para estes casos ´e a de considerar o jogo do ponto de vista probabil´ıstico, isto ´e, ao inv´es de escolher um perfil de estrat´egias puras, o jogador deve escolher umadistribui¸c˜ao de probabilidadesobre suas estrat´egias puras.
isto ´e,pi ´e um elemento do conjunto
∆mi=
(x1, . . . , xmi)∈R
mi |x1≥0, . . . , xm
i ≥0 e
mi
k=1 xk= 1
.
Assim, se pi= (pi1, pi2, . . . , pimi), ent˜ao
pi1≥0, pi2≥0, . . . , pimi ≥0 e
mi
k=1
pik= 1.
Note que cada ∆mi ´e um conjunto compacto e convexo. Nas
Figuras 2.1 e 2.2 temos os desenhos de ∆2e ∆3, respectivamente. Os
pontos extremos (v´ertices) de ∆mi, isto ´e, os pontos da forma
e1= (1,0, . . . ,0,0), e2= (0,1, . . . ,0,0), . . . , emi = (0,0, . . . ,0,1)
d˜ao, respectivamente, probabilidade 1 `as estrat´egias puras si1, si2, . . . , simi. Desta maneira, podemos considerar a distribui¸c˜ao de
pro-babilidade ek como a estrat´egia mista que representa a estrat´egia
purasik do jogadorgi.
O espa¸co de todos os perfis de estrat´egia mista ´e o produto car-tesiano
∆ = ∆m1×∆m2× · · · ×∆mn,
denominadoespa¸co de estrat´egias mistas. Como o produto cartesiano
de conjuntos compactos e convexos ´e compacto e convexo, vemos que ∆ ´e compacto e convexo.
Um vetor p∈ ∆ ´e denominado um perfil de estrat´egias mistas.
Como no caso de estrat´egias puras, usaremos a nota¸c˜ao p−i para
representar as estrat´egias mistas de todos os jogadores, excluindo-se
a do jogadorgi. Desta maneira, escreveremos
(pi,p−i)
para representarp= (p1, . . . ,pi, . . . ,pn). Como a estrat´egia purasik
pode ser identificada com a distribui¸c˜ao de probabilidades que d´a
peso 1 asik e peso 0 `as demais estrat´egias do jogadorgi, usaremos
1 0
1
x1 x2
Figura 2.1: ∆2=(x1, x2)∈R2 |x1≥0, x2≥0 ex1+x2= 1.
0
1
1 1
x1
x2 x3
Figura 2.2: ∆3=
(x1, x2, x3)∈R3
| x1≥0,x2≥0,x3≥0 ex1+
como uma nota¸c˜ao alternativa para o perfil de estrat´egias mistas (ek,p−i). Do mesmo modo, usaremos
(pi,s−i)
para indicar o perfil de estrat´egias mistas onde o jogadorgi escolhe
a distribui¸c˜ao de probabilidades pi e os demais jogadores escolhem
distribui¸c˜oes que d˜ao peso 1 `as estrat´egias puras ems−i.
Cada perfil de estrat´egias mistasp= (p1, . . . ,pn)∈∆ determina umpayoffesperado (utilidade esperada), uma m´edia dospayoffs pon-derada pelas distribui¸c˜oes de probabilidadesp1, . . . ,pn. Mais preci-samente, se
p = (p1,p2, . . . ,pn) = (p11, p12, . . . , p1m1
p1
;p21, p22, . . . , p2m2
p2
;. . .;pn1, pn2, . . . , pnmn
pn
),
ent˜ao
ui(p) =
m1
j1=1
m2
j2=1
· · ·
mn
jn=1
p1j1·p2j2· · ·pnjn·ui(s1j1, s2j2, . . . , snjn).
(2.1)
Cuidado com o abuso de nota¸c˜ao: estamos usandouipara representar
a fun¸c˜ao utilidade tanto em estrat´egias puras quanto em estrat´egias mistas.
Como exemplo, considere o jogo de comparar moedas na p´
agi-na 22. Se g1 escolhe a distribui¸c˜ao de probabilidadep1= (1/4,3/4) e g2 escolhe a distribui¸c˜ao de probabilidade p2 = (1/3,2/3), ent˜ao os payoffs esperados associados ao perfil de estrat´egias mistas p = (p1,p2) = (1/4,3/4; 1/3,2/3) s˜ao dados por
u1(p) =
2
j1=1
2
j2=1
p1j1·p2j2·u1(s1j1, s2j2)
= p11·p21·u1(s11, s21) +p11·p22·u1(s11, s22) +
p12·p21·u1(s12, s21) +p12·p22·u1(s12, s22)
= 1
4 · 1
3·(+1) + 1 4·
2
3 ·(−1) + 3 4 ·
1
3 ·(−1) + 3 4 ·
2 3·(+1)
= +1
e, analogamente,
u2(p) =
2
j1=1
2
j2=1
p1j1·p2j2·u2(s1j1, s2j2)
= p11·p21·u2(s11, s21) +p11·p22·u2(s11, s22) +
p12·p21·u2(s12, s21) +p12·p22·u2(s12, s22)
= 1
4 · 1
3 ·(−1) + 1 4·
2
3·(+1) + 3 4 ·
1
3 ·(+1) + 3 4 ·
2 3 ·(−1) = −16.
Observac¸˜ao. Sep∗= (p∗
i,p∗−i)∈∆, ent˜ao a fun¸c˜aox→ui(x,p∗−i)
preserva combina¸c˜oes convexas. Mais precisamente, se x1, . . . ,xr ∈
∆mi eλ1, . . . , λrs˜ao escalares n˜ao-negativos com
r
k=1λk = 1, ent˜ao
ui
r
k=1
λk·xk,p∗−i
=
r
k=1
λk·ui(xk,p∗−i). (2.2)
Em particular, se
p∗i = (p∗
i1, . . . , p∗imi) = mi
k=1 p∗
ik·ek, (2.3)
comek o k-´esimo vetor da base canˆonica deRmi, ent˜ao
ui(p∗) =ui(p∗
i,p∗−i) =ui
mi
k=1 p∗
ik·ek,p∗−i
= mi k=1 p∗
ik·ui(ek,p∗−i).
(2.4)
2.4
Solu¸
c˜
oes de um jogo em estrat´
egias
mistas
2.4.1
Dominˆ
ancia em estrat´
egias mistas
Defini¸c˜ao 2.7 (Estrat´egia Mista Estritamente Domi-nada) Dizemos que uma estrat´egia mista pi ∈ ∆mi do
joga-dorgi ∈G´e estritamente dominada pela estrat´egia p′i ∈∆mi
se,independentemente das escolhas de distribui¸c˜oes de
proba-bilidade dos demais jogadores, o jogador gi ganha mais
esco-lhendop′
ido quepi, isto ´e, se
ui(p′i,p−i)> ui(pi,p−i),
para todop−i∈∆−i= ∆m1×· · ·×∆mi−1×∆mi+1×· · ·×∆mn.
Como ospayoffs ui(p′i,p−i) eui(pi,p−i) s˜ao, respectivamente, combina¸c˜oes convexas dos payoffs ui(p′i,s−i) e ui(pi,s−i),
segue-se que a condi¸c˜ao acima ´e equivalente a
ui(p′i,s−i)> ui(pi,s−i),
para todos perfis de estrat´egias purass−i∈S−i.
Exemplo 2.8 ([30], p´agina 21) Considere o jogo com a seguinte
matriz depayoffs:
g2
s21 s22
g1
s11 (5,3) (0,0)
s12 (0,0) (5,3)
s13 (2,1) (2,1) .
dominada pela estrat´egia mistap′1= (1/2,1/2,0)∈∆3, pois
u1(p′1,p2) =u1
1 2,
1
2,0;p21, p22
= 5
2 ·p21+ 5 2 ·p22=
5 2
>
u1(p1,p2) =u1
0,0,1;p21, p22
= 2 ·p21+ 2·p22= 2
para todo p2 = (p21, p22) ∈ ∆2. Como p1 = (0,0,1) representa
a estrat´egia pura s13 do jogador g1, este exemplo tamb´em mostra
que uma estrat´egia pura pode n˜ao ser dominada por nenhuma outra
estrat´egia puras mas, ainda sim, ser dominada por uma estrat´egia mista.
Exemplo 2.9 ([31], p´agina 7) Uma estrat´egia mista que atribui probabilidade positiva para uma estrat´egia pura estritamente domi-nada tamb´em ´e estritamente domidomi-nada (Exerc´ıcio [13]). Contudo, uma estrat´egia mista pode ser estritamente dominada mesmo que ela atribua probabilidades positivas apenas para as estrat´egias puras que
n˜ao s˜ao nem mesmo fracamente dominadas. Considere, por exemplo,
o jogo com a seguinte matriz de payoffs:
g2
s21 s22
g1
s11 (5,3) (2,0)
s12 (2,0) (5,3)
s13 (4,1) (4,1) .
As estrat´egias puras s11 e s12 n˜ao s˜ao fracamente dominadas, mas
a estrat´egia mista p1 = (1/2,1/2,0) ´e estritamente dominada pela estrat´egia mistap′
pois
u1(p′1,p2) =u1
0,0,1;p21, p22
= 4 ·p21+ 4·p22= 4
>
u1(p1,p2) =u1
1 2,
1
2,0;p21, p22
= 7
2 ·p21+ 7 2 ·p22=
7 2
para todo p2= (p21, p22)∈∆2.
A defini¸c˜ao de dominˆancia estrita iterada para estrat´egias mistas que daremos aqui segue a linha proposta pelas referˆencias [26, 31, 74]. Abordagens alternativas podem ser encontradas em [01, 15].
Defini¸c˜ao 2.8 (Dominˆancia Estrita Iterada em Estra-t´egias Mistas)Sejam Si(0)=Si e ∆
(0)
mi = ∆mi. Defina,
recur-sivamente,
Si(n)={s∈Si(n−1)| ∄pi∈∆(nmi−1)tal que
∀s−i∈S (n−1)
−i , ui(pi, s−i)> ui(s, s−i)}
e
∆(n)mi ={pi= (pi1, . . . , pimi)∈∆mi |
∀k= 1, . . . , mi, pik >0 somente sesik ∈Si(n)}.
A interse¸c˜ao
Si∞=
∞
n=0 S(n)i
∆∞
mi={pi∈∆mi |∄p ′
i ∈∆mi
tal que ∀s−i∈S−(∞i), ui(p′i, s−i)> ui(pi, si)}
´e o conjunto de todas as estrat´egias mistas do jogador gi que
sobreviveram a t´ecnica dedominˆancia estrita iterada.
Note queS(n)
i ´e o conjunto de estrat´egias puras emS
(n−1)
i que n˜ao s˜ao
estritamente dominadas pelas estrat´egias mistas em ∆(n−1)
mi e que ∆
(n)
mi
´e o conjunto de estrat´egias mistas que d´a probabilidades positivas apenas para as estrat´egias puras emS(n)
i .
Defini¸c˜ao 2.9 (Equil´ıbrio de Estrat´egia Estritamente Dominante)Se, no processo de dominˆancia estrita iterada, o
conjuntoS∞=S∞
1 × · · · ×S∞n ´e unit´ario, isto ´e, se S∞=
{s∗},
ent˜ao dizemos ques∗´e umequil´ıbrio de estrat´egia estritamente dominante.
Como no caso de estrat´egias puras, ´e poss´ıvel mostrar que os
con-juntos S∞=S∞
1 × · · · ×Sn∞ e ∆∞= ∆∞m1× · · · ×∆
∞
mn n˜ao
depen-dem da ordepen-dem em que as estrat´egias estritamente dominadas s˜ao removidas. N˜ao apresentaremos a demonstra¸c˜ao deste fato aqui. O leitor interessado poder´a encontr´a-la (bem como as defini¸c˜oes e
resultados sobre estrat´egias mistas fracamente dominadas) nas
re-ferˆencias [01, 15, 26, 55].
2.4.2
Equil´ıbrio de Nash em estrat´
egias mistas
p∗= (p∗
1,p∗2, . . . ,p∗n)∈∆ = ∆m1×∆m2× · · · ×∆mn
´e umequil´ıbrio de Nashse
ui(p∗i,p∗−i)≥ui(p,p∗−i)
para todo p ∈ ∆mi, isto ´e, nenhum jogador sente motiva¸c˜ao
de trocar a sua estrat´egia mista se os demais jogadores n˜ao o fizerem.
Exemplo 2.10
(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estrat´egias mistas
p∗= (p∗
1,p∗2) = (1,0; 1,0)
´e um equil´ıbrio de Nash, pois
u1(p1,p∗2) =u1(p11, p12; 1,0) = 5·p11−10≤
−5 =u1(1,0; 1,0) =u1(p∗1,p∗2) para todop1= (p11, p12)∈∆2 e
u2(p∗1,p2) =u2(1,0;p21, p22) = 5·p21−10≤
−5 =u2(1,0; 1,0) =u2(p∗1,p∗2)
para todo p2 = (p21, p22) ∈ ∆2. Observe que este equil´ıbrio
corresponde ao equil´ıbrio em estrat´egias puras
s∗= (confessar, confessar).
Mostraremos mais adiante que este ´e o´unicoequil´ıbrio de Nash em estrat´egias mistas do jogo.
(b) Na batalha dos sexos (Exemplo 2.2), os equil´ıbrios de Nash em estrat´egias mistas s˜ao
Os dois primeiros perfis de estrat´egias mistas correspondem `as estrat´egias puras (futebol, futebol) e (cinema, cinema),
respec-tivamente. Mostraremos mais adiante que estes s˜ao os ´unicos
equil´ıbrios de Nash em estrat´egias mistas do jogo.
(c) No Exemplo 2.3, o ´unico equil´ıbrio de Nash em estrat´egia mista
´e o ponto
(0,1,0,0; 0,1,0,0)
que corresponde ao equil´ıbrio de Nash (s12, s22) em estrat´egias puras.
(d) No jogo de comparar moedas do Exemplo 2.6, o ´unico equil´ıbrio
de Nash em estrat´egias mistas ´e o ponto
(1/2,1/2; 1/2,1/2).
Como no caso de estrat´egias puras, podemos caracterizar equil´ı-brios de Nash em estrat´egias mistas atrav´es das fun¸c˜oes de melhor resposta. Considere um jogo com espa¸co de estrat´egias mistas ∆ = ∆m1× · · ·×∆mi× · · ·×∆mn. No que se segue, usaremos as seguintes
nota¸c˜oes:
∆(Si) = ∆mi e ∆(S−i) = ∆m1× · · · ×∆mi−1×∆mi+1× · · ·∆mn.
Defini¸c˜ao 2.11 (Func¸˜oes de melhor resposta em estra-t´egias mistas)A fun¸c˜ao de melhor resposta do jogadorgi´e a aplica¸c˜ao
MRi: ∆(S−i)→2∆(Si)
definida por MRi(p−i) = argmaxpi∈∆(Si)ui(pi,p−i), isto ´e,
MRi(p−i)
=
{p∗i ∈∆(Si)| ∀pi∈∆(Si), ui(p∗i,p−i)≥ui(pi,p−i)},
comp−i ∈ ∆(S−i). A fun¸c˜ao de melhor resposta do jogo ´e a
aplica¸c˜ao
definida por
MR(p) = (MR1(p−1),MR2(p−2), . . . ,MRn(p−n)),
comp∈∆.
Note que, como ∆(Si) ´e um conjunto compacto n˜ao-vazio e a
fun¸c˜aopi→ui(pi,p−i) ´e cont´ınua, podemos usar o teorema de
Wei-erstrass para garantir que MRi(p−i) = argmaxpi∈∆(Si)ui(pi,p−i) ´e
um conjunto n˜ao-vazio para todop−i∈∆(S−i).
A pr´oxima proposi¸c˜ao ´e uma conseq¨uˆencia direta das defini¸c˜oes de equil´ıbrio de Nash e fun¸c˜oes de melhor resposta em estrat´egias mistas.
Proposi¸c˜ao 2.4 p∗= (p∗
1, . . . ,p∗i, . . . ,p∗n)∈∆ ´e um equil´ıbrio
de Nash em estrat´egias mistas se, e somente se,p∗
i ∈MRi(p∗−i)
para todoi= 1, . . . , n, isto ´e,p∗∈MR(p∗).
Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2), a mulher escolha a estrat´egia mistap2= (1/2,1/2). Qual ´e a melhor resposta do homem a esta estrat´egia da mulher? Para responder a esta pergunta, observe inicialmente que
uHomem(p1,p2) = uHomem(p11, p12;p21, p22)
= p11·p21·uHomem(futebol,futebol) +
p11·p22·uHomem(futebol,cinema) +
p12·p21·uHomem(cinema,futebol) +
p12·p22·uHomem(cinema,cinema) = 10·p11·p21+ 5·p12·p22
e, portanto, uHomem(p11, p12; 1/2,1/2) = 5·p11+ (5/2)·p12. Desta maneira,
Segue-se que a melhor resposta do homem `a estrat´egia mista p2 = (1/2,1/2) da mulher ´e obtida resolvendo-se o seguinte problema de otimiza¸c˜ao:
maximizar 5·p11+ (5/2)·p12
sujeito a p11+p12= 1,
p11≥0,
p12≥0,
cuja solu¸c˜ao ´e (p∗
11, p∗12) = (1,0). Sendo assim, MRHomem(1/2,1/2) =
{(1,0)}.
No caso de jogos com apenas dois jogadores, cada um com apenas duas estrat´egias puras, ´e poss´ıvel escrever as estrat´egias mistas de uma maneira mais simplificada:
∆2={(p,1−p)∈R2 |0≤p≤1},
isto ´e, cada elemento de ∆2pode ser identificado com um n´umero real
no intervalo [0,1]. Com isto, as fun¸c˜oes de melhor resposta podem
ser reescritas de forma a depender de apenas de um n´umero real. Por
exemplo, se o homem escolhe uma estrat´egia mista (p,1−p)∈∆2,
qual ´e a melhor resposta da mulher a esta estrat´egia do homem? Escrevendo as estrat´egias mistas da mulher na forma (q,1−q)∈∆2,
vemos que
uMulher(p,1−p;q,1−q) = 15pq+ 10−10q−10p
= 5 (3p−2)q+ 10 (1−p).
Sendo assim,
MRMulher(p) = argmax(q,1−q)∈∆2(5 (3p−2)q+ 10 (1−p))
= argmaxq∈[0,1](5 (3p−2)q+ 10 (1−p)),
onde, por simplicidade, estamos escrevendo MRMulher(p) no lugar
de MRMulher(p,1−p). Assim, dada a escolha dep∈[0,1] do homem,
escolherq= 0. Sep= 2/3, ent˜ao 3p−2 = 0 e, portanto, a utilidade
uMulher = 10 (1−p) da mulher n˜ao depender´a deq. Neste caso, a mulher poder´a escolher qualquer valor deqem [0,1]. Sep∈(2/3,1], ent˜ao 3p−2>0 e, para maximizar a sua utilidade, a mulher dever´a
escolherq= 1. Mostramos ent˜ao que
MRMulher(p) =
⎧ ⎨ ⎩
{0}, sep∈[0,2/3),
[0,1], sep= 2/3,
{1}, sep∈(2/3,1].
Esta fun¸c˜ao de melhor resposta pode ser representada graficamente, como mostra a Figura 2.3.
1 p(Homem) 0
1 q
2/3
(Cinema) (Cinema)
(Futebol) (Mulher)
(Futebol)
Figura 2.3: Representa¸c˜ao gr´afica da fun¸c˜ao de melhor resposta da mulher no jogo da batalha dos sexos.
Do mesmo modo, se a mulher escolhe uma estrat´egia mista (q,1−q)∈ ∆2, ent˜ao
uHomem(p,1−p;q,1−q) = 15pq+ 5−5q−5p
= 5 (3q−1)p+ 5 (1−q),
de modo que
MRHomem(q) = argmax(p,1−p)∈∆2(5 (3q−1)p+ 5 (1−q))
Assim, dada a escolha de q ∈ [0,1] da mulher, o homem quer
en-contrar os valores de p∈[0,1] que maximizam o valor de sua
utili-dadeuHomem= 5 (3q−1)p+ 5 (1−q). Seq ∈[0,1/3), ent˜ao 3q−
1 < 0 e, para maximizar a sua utilidade, o homem dever´a
esco-lher p = 0. Se q = 1/3, ent˜ao 3q−1 = 0 e, portanto, a utilidade
uHomem = 5 (1−q) do homem n˜ao depender´a de p. Neste caso, o homem poder´a escolher qualquer valor depem [0,1]. Seq∈(1/3,1], ent˜ao 3q−1>0 e, para maximizar a sua utilidade, o homem dever´a
escolherp= 1. Mostramos ent˜ao que
MRHomem(q) =
⎧ ⎨ ⎩
{0}, seq∈[0,1/3),
[0,1], seq= 1/3,
{1}, seq∈(1/3,1].
Esta fun¸c˜ao de melhor resposta pode ser representada graficamente, como mostra a Figura 2.4.
1 q (Mulher) 0
1 p
1/3
(Cinema) (Cinema)
(Futebol) (Homem)
(Futebol)
Figura 2.4: Representa¸c˜ao gr´afica da fun¸c˜ao de melhor resposta do homem no jogo da batalha dos sexos.
Agora, pela Proposi¸c˜ao 2.4, segue-se que um perfil de estrat´egias mistas (p∗,1−p∗;q∗,1−q∗) ´e um equil´ıbrio de Nash se, e somente se,
q∗∈MR
Mulher(p∗) e p∗ ∈MRHomem(q∗). Desta maneira, os valores
de p∗ e q∗ que geram equil´ıbrios de Nash correspondem aos pontos
resposta da mulher e do homem, quando representadas em um mesmo sistema de eixos, como ilustra a Figura 2.5.
1 p(Homem) 0
1 q
2/3 1/3
(Cinema) (Cinema)
(Futebol) (Mulher)
(Futebol)
Figura 2.5: Calculando os equil´ıbrios de Nash usando as representa-¸c˜oes gr´aficas das duas fun¸c˜oes de melhor resposta.
Vemos, portanto, que a batalha dos sexos possui apenas 3 equil´ıbrios de Nash em estrat´egias mistas:
(0,1; 0,1), (2/3,1/3; 1/3,2/3) e (1,0; 1,0),
que correspondem, respectivamente, aos trˆes ´unicos pontos de
inter-se¸c˜ao (p∗, q∗) = (0,0), (p∗, q∗) = (2/3,1/3) e (p∗, q∗) = (1,1) das
duas representa¸c˜oes gr´aficas.
Exemplo 2.12 ([31], p´agina 17) (O jogo da inspec¸˜ao) O che-fe de uma empresa de computa¸c˜ao desconfia que seu operador de computadores est´a usando o tempo de servi¸co para “bater papo”
na internet. Se o operador trabalha corretamente, ele gasta g em
esfor¸co e produz um lucro bruto de v unidades para a empresa. O
chefe, por sua vez, pode fiscalizar ou n˜ao o trabalho do operador.
Fiscalizar custahunidades para a empresa. Se o operador for pego
“batendo papo” na internet, ele perde o seu sal´ario de w unidades
que g > h > 0 e que w > g. Os dois jogadores escolhem suas estrat´egias simultaneamente (em particular, ao decidir se vai fiscalizar ou n˜ao, o chefe n˜ao sabe se o empregado decidiu trabalhar ou decidiu “bater papo” na internet). Neste contexto, o jogo da inspe¸c˜ao tem a
matriz de payoffsindicada abaixo.
empregado
n˜ao trabalhar trabalhar
ch
ef
e fiscalizar (−h,0) (v−w−h, w−g)
n˜ao fiscalizar (−w, w) (v−w, w−g)
Observe que este jogo n˜ao possui equil´ıbrio de Nash em estrat´egias puras e, como ele deve se repetir em cada dia ´util de trabalho, n˜ao ´e
sensato escolhersemprea mesma estrat´egia pura para todos os dias.
A solu¸c˜ao, neste caso, ´e escolher entre as estrat´egias puras a cada dia seguindo uma distribui¸c˜ao de probabilidades, isto ´e, atrav´es de es-trat´egias mistas. Como as fun¸c˜oes de melhor resposta do empregado e do chefe s˜ao dadas, respectivamente, por
MREmpregado(p) = argmaxq∈[0,1]((−wp+g)q+w−g)
= ⎧ ⎨ ⎩
{1}, sep∈[0, g/w),
[0,1], sep=g/w,
{0}, sep∈(g/w,1],
MRChefe (q) = argmaxp∈[0,1]((+wq−h)p+v(1−q)−w)
= ⎧ ⎨ ⎩
{0}, seq∈[0, h/w),
[0,1], seq=h/w,
{1}, seq∈(h/w,1],
segue-se que o (´unico) equil´ıbrio de Nash em estrat´egias mistas ´e
obtido tomando-se p∗ = g/w eq∗ =h/w. Se, por exemplo, v = 5,
w= 4,g= 3 eh= 2, ent˜ao
(p∗,1
−p∗;q∗,1
−q∗) = (3/4,1/4; 1/2,1/2).
Isto significa que o chefe deve escolher sua estrat´egia de acordo com
um gerador de n´umeros aleat´orios com distribui¸c˜ao de
com um gerador de n´umeros aleat´orios com distribui¸c˜ao de probabili-dade (1/2,1/2). Isto pode ser feito, por exemplo, com as duas “rodas da fortuna” da Figura 2.6.
Fiscalizar
Não fiscalizar
Trabalhar
Não trabalhar
chefe empregado
Figura 2.6: Distribui¸c˜oes de probabilidade que constituem um equil´ı-brio de Nash para o jogo do Exemplo 2.12.
A partir deste resultado, podemos calcular o valor ´otimo de contrato
do empregado, isto ´e, o valor de w que maximiza opayoff esperado
do chefe:
uChefe(w) = (+wq∗−h)p∗+v(1−q∗)−w) =v
1−wh
−w.
Se, por exemplo, √vh > g, ent˜ao este valor ´otimo ´e dado por w∗ =
√
vh(note queu′
Chefe(w∗) = 0 eu′′Chefe(w)≤0 paraw >0).
Jogos deste tipo tˆem sido usados para se estudar temas como controle de armas ([03, 10, 83]), preven¸c˜ao de crimes ([04]) e incentivos no trabalho ([53]).
que garante a existˆencia de equil´ıbrios em estrat´egias mistas para jogos finitos.
2.4.3
Rela¸
c˜
oes entre dominˆ
ancia e equil´ıbrio de
Nash
As Proposi¸c˜oes 2.2 e 2.3 para estrat´egias puras continuam v´alidas para estrat´egias mistas: (1) o processo de dominˆancia estrita ite-rada em estrat´egias mistas n˜ao pode eliminar um equil´ıbrio de Nash e (2) se o processo de dominˆancia estrita iterada em estrat´egias mistas deixa apenas um ´unico perfil de estrat´egias, ent˜ao este perfil ´e um
equil´ıbrio de Nash do jogo. N˜ao apresentaremos as demonstra¸c˜oes
destes resultados aqui. O leitor interessado poder´a encontr´a-las nas referˆencias [15, 26].
2.4.4
Como interpretar estrat´
egias mistas?
Existe muita controv´ersia sobre as interpreta¸c˜oes e usos de es-trat´egias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann, por exemplo, em [02], afirma que
“Mixed strategy equilibria have always been intuitively problematic because they are not ‘strict’: a player will not lose if he abandons the randomization and uses instead any arbitrary one of the pure strategy components of the randomization.”
(veja as Equa¸c˜oes 4.1 na p´agina 81) e, segundo Rardner e
Roshen-tal ([76]),
“One of the reasons why game-theoretic ideas have not found more widespread application is that randomization, which plays a major role in game theory, seems to have limited appeal in many practical situations.”
Ainda, segundo Rubinstein ([81]),
the game, goes against our intuition. We are reluctant to believe that our decisions are made at random. We prefer to be able to point to a reason for each action we take. Outside of Las Vegas we do not spin roulettes.”
De fato, testes experimentais recentes mostraram que jogadores n˜ao seguem a estrat´egia mista prevista pela teoria, mesmo quando o jogo possui um ´unico equil´ıbrio de Nash em estrat´egias mistas ([57]).
Existem tamb´em certas an´alises feitas com estrat´egias mistas que
produzem resultados n˜ao-intuitivos. Considere, por exemplo, a
se-guinte situa¸c˜ao. Um contribuinteCdeve decidir se vai ou n˜ao sonegar imposto, sabendo que existe um fiscalF que pode ou n˜ao fiscaliz´a-lo.
Na matriz de payoffs abaixo, vamos assumir que valem as seguintes
desigualdades
(1) c21> c11: o contribuinteC prefere n˜ao sonegar se souber que o fiscalF ir´a fiscalizar,
(2) c12> c22: o contribuinteC prefere sonegar se souber que o fis-calF n˜ao ir´a fiscalizar,
(3) f11> f12: o fiscalF prefere fiscalizar se souber que o contribuin-teC ir´a sonegar e
(4) f22> f21: o fiscalF prefere n˜ao fiscalizar se souber que o contri-buinteC n˜ao ir´a sonegar.
Vocˆe pode pensar que oscij s˜ao n´umeros negativos que representam
o quanto ser´a debitado deCpelo pagamento de imposto e que osfij
s˜ao n´umeros positivos que representam bˆonus salariais de F.
F
fiscalizar n˜ao fiscalizar
C
sonegar (c11, f11) (c12, f12)
n˜ao sonegar (c21, f21) (c22, f22)
.
Usando a t´ecnica descrita no Exemplo 2.11, vemos que o ´unico
equi-l´ıbrio de Nash do jogo ´e dado por (p∗
C,1−p∗C;p∗F,1−p∗F), onde
(p∗C, p∗F) =
f22−f21 f22−f21−f12+f11,
c22−c12 c22−c12−c21+c11