Uma Introdução a Teoria dos Jogos

(1)

Brígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi Polyane Alves Santos e Larissa Santana Barreto

II Bienal da SBM

Universidade Federal da Bahia

25 a 29 de outubro de 2004

(2)

1 Descri¸c˜ao informal da teoria dos jogos 1

1.1 Introdu¸c˜ao . . . 1

1.2 Hist´oria . . . 2

1.3 O que ´e um jogo? . . . 4

1.4 Solu¸c˜oes de um jogo . . . 8

1.5 Estrat´egias mistas . . . 12

1.6 Solu¸c˜oes em estrat´egias mistas . . . 15

1.7 Existˆencia de solu¸c˜oes . . . 23

2 O teorema minimax de von Neumann 24 2.1 Jogos de soma constante com dois jogadores . . . 24

2.2 Equil´ıbrio de Nash em estrat´egias puras . . . 26

2.3 Equil´ıbrio de Nash em estrat´egias mistas . . . 29

2.4 O teorema minimax de von Neumann . . . 31

3 O teorema de equil´ıbrio de Nash 38 4 A forma extensa de um jogo 49 4.1 Representa¸c˜ao de um jogo via alfabetos e ´arvores . . . 49

4.2 Convers˜ao entre as formas normal e extensa . . . 58

Bibliograﬁa 61

(3)

Descri¸ c˜ ao informal da teoria dos jogos

1.1 Introdu¸ c˜ ao

A teoria dos jogos é uma teoria matemática criada para se modelar fenômenos que podem ser observados quando dois ou mais “agentes de de- cisão” interagem entre si. Ela fornece a linguagem para a descri¸cão de proces- sos de decisão conscientes e objetivos envolvendo mais do que um indiv´ıduo.

A teoria dos jogos é usada para se estudar assuntos tais como elei¸cões, leilões, balan¸ca de poder, evolu¸cão genética, etc. Ela é também uma teoria matemática pura, que pode e tem sido estudada como tal, sem a necessidade de relacioná-la com problemas comportamentais ou jogos per se.

Algumas pessoas acreditam que a teoria dos jogos formará em algum dia o alicerce de um conhecimento técnico estrito de como decisões são feitas e de como a economia funciona. O desenvolvimento da teoria ainda não atingiu este patamar e, hoje, a teoria dos jogos é mais estudada em seus aspectos matemáticos puros e, em aplica¸cões, ela é usada como uma ferramenta ou alegoria que auxiliam no entendimento de sistemas mais complicados.

Neste texto trataremos da Teoria Econômica dos Jogos, que n˜ao deve ser confundida com a Teoria Combinatória dos Jogos [4, 11, 5, 2, 6, 7], iniciada por Sprague [20] e Grundy na década de 30. Enquanto que a primeira tem motiva¸cões predominante econômicas e procura estabelecer métodos para se maximizar o ganho (payoff), a segunda se concentra nos aspectos com- binatórios de jogos de mesa (por exemplo, ser o jogador a fazer o último

(4)

movimento em um jogo de nim [1]) e n˜ao permite “elementos imprevis´ıveis”

como o lan¸camento de um dado ou o baralhamento de cartas.

1.2 Hist´ oria

Registros antigos sobre teoria dos jogos remontam ao século XVIII. Em correspondência dirigida a Nicolas Bernoulli, James Waldegrave analisa um jogo de cartas chamado “le Her” e fornece uma solu¸cão que é um equil´ıbrio de estratégia mista (conceito que nos familiarizaremos posteriormente). Con- tudo, Waldegrave não estendeu sua abordagem para uma teoria geral. No in´ıcio do século XIX, temos o famoso trabalho de Augustin Cournot sobre duopólio [3]. Em 1913, Ernst Zermelo publicou o primeiro teorema ma- temático da teoria dos jogos [21], o teorema afirma que o jogo de xadrez é estritamente determinado, isto ´e, em cada estágio do jogo pelo menos um dos jogadores tem uma estratégia em mão que lhe dará a vitória ou conduzirá o jogo ao empate. Outro grande matemático que se interessou em jogos foi Emile Borel, que reinventou as solu¸cões minimax e publicou quatro artigos sobre jogos estratégicos. Ele achava que a guerra e a economia podiam ser estudadas de uma maneira semelhante.

Figura 1.1: Ernst Zermelo.

Em seu in´ıcio, a teoria dos jogos chamou pouca aten¸cão. O grande ma- temático John von Neumann mudou esta situa¸cão. Em 1928, ele demonstrou que todo jogo finito de soma zero com duas pessoas possui uma solu¸cão em

(5)

estratégias mistas [18]. A demonstra¸cão original usava topologia e análise

Figura 1.2: John von Neumann.

funcional e era muito complicada de se acompanhar. Em 1937, ele forneceu uma nova demonstra¸c˜ao baseada no teorema do ponto ﬁxo de Brouwer.

John von Neumann, que trabalhava em muitas áreas da ciência, mostrou interesse em economia e, junto com o economista Oscar Morgenstern, publicou o clássico “The Theory of Games and Economic Behaviour” [19] em 1944 e, com isto, a teoria dos jogos invadiu a economia e a matemática aplicada.

Figura 1.3: Oscar Morgenstern.

Em 1950, o matemático John Forbes Nash Júnior publicou quatro artigos importantes para a teoria dos jogos não-cooperativos e para a teoria de barganha. Em “Equilibrium Points inn-Person Games” [14] e “Non-cooperative

(6)

Games” [16], Nash provou a existˆencia de um equil´ıbrio de estratégias mistas para jogos não-cooperativos, denominado equil´ıbrio de Nash, e sugeriu uma abordagem de estudo de jogos cooperativos a partir de sua redu¸cão para a forma não-cooperativa. Nos artigos “The Bargaining Problem” [15] e “Two- Person Cooperative Games” [17], ele criou a teoria de barganha e provou a existência de solu¸cão para o problema da barganha de Nash.

Figura 1.4: John Forbes Nash.

Em 1994, John Forbes Nash Jr. (Universidade de Princeton), John Har- sanyi Universidade de Berkeley, California) e Reinhard Selten (Universidade de Bonn, Alemanha) receberam o prˆemio Nobel por suas contribui¸c˜oes para a Teoria dos Jogos.

1.3 O que ´ e um jogo?

A teoria dos jogos pode ser definida como a teoria dos modelos ma- temáticos que estuda a escolha de decisões ótimas sob condi¸cões de conflito.

O elemento básico em um jogo é o conjunto de jogadores que dele partici- pam. Cada jogador tem um conjunto de estratégias. Quando cada jogador escolhe sua estratégia, temos então uma situa¸cãoouperfil no espa¸co de todas as situa¸cões (perfis) poss´ıveis. Cada jogador tem interesse ou preferências para cada situa¸cão no jogo. Em termos matemáticos, cada jogador tem uma

(7)

Figura 1.5: John Harsanyi.

Figura 1.6: Reinhart Selten.

(8)

fun¸cão utilidade que atribui um número real (o ganho ou payoff do jogador) a cada situa¸cão do jogo.

Mais especificamente, um jogo tem os seguintes elementos básicos: existe um conjunto finito de jogadores, representado por G = {g1, g2, . . . , g_n}. Cada jogador g_i ∈ G possui um conjunto finito S_i = {s_i₁, s_i₂, . . . , s_im_i} de op¸cões, denominadas estratégias puras do jogador g_i (m_i ≥ 2). Um vetor s = (s_1j₁, s_2j₂, . . . , s_nj_n), onde s_ij_i é uma estratégia pura para o jogador g_i ∈ G, ´e denominado um perfil de estratégia pura. O conjunto de todos os perfis de estratégia pura formam, portanto, o produto cartesiano

S = n

i=1

S_i = S1 ×S2 × · · · ×S_n,

denominado espa¸co de estrat´egia pura do jogo. Para jogador g_i ∈ G, existe uma fun¸c˜ao utilidade

u_i: S → R s → u_i(s)

que associa o ganho (payoff) u_i(s) do jogador g_i a cada perfil de estratégia pura s ∈ S.

Exemplo 1.1 (O dilema do prisioneiro) Possivelmente o exemplo mais conhecido na teoria dos jogos é odilema do prisioneiro. Ele foi formulado por Albert W. Tucker em 1950, em um seminário para psicólogos na Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos.

A situa¸cão é a seguinte: dois ladrões, Al e Bob, são capturados e acusados de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si, o delegado de plantão faz seguinte proposta: cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos serão submetidos a uma pena de 1 ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas se um confessar e o outro negar, então o que confessou será libertado e o outro será condenado a 10 anos de prisão. Neste contexto, temos

G= {^Al,Bob}, S_Al = {^confessar,negar}, S_Bob = {^confessar,negar}, S = {(confessar,confessar),(confessar,negar),(negar,confessar),(negar,negar)}. As duas fun¸c˜oes utilidade

(9)

u_Al: S → R e u_Bob: S →R s˜ao dadas por

u_Al(confessar,confessar) = −5, u_Al(confessar,negar) = 0, u_Al(negar,confessar) = −10, u_Al(negar,negar) = −1, (que representam os ganhos (payoﬀs) de Al) e

u_Bob(confessar,confessar) = −5, u_Bob(confessar,negar) = −10, u_Bob(negar,confessar) = 0, u_Bob(negar,negar) = −1

(que representam os ganhos (payoffs) de Bob). É uma prática se representar os payoffs dos jogadores através de uma matriz, denominada matriz de payoffs.

Bob

confessar negar

Al confessar (−5,−5) (0,−10) negar (−10,0) (−1,−1)

Nesta matriz, os números de cada célula representam, respectivamente, os payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a célula.

Exemplo 1.2 (A batalha dos sexos) Um homem e a sua mulher de- sejam sair para passear. O homem prefere assistir a um jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para o futebol, então o homem tem satisfa¸cão maior do que a mulher. Por outro lado, se eles forem juntos ao cinema, então a mulher tem satisfa¸cão maior do que o homem. Finalmente, se eles sa´ırem sozinhos, então ambos ficam igualmente insatisfeitos. Esta situa¸cão também pode ser modelada como um jogo estratégico. Temos:

G = {^homem,mulher}, S_homem = {^futebol,cinema}, S_mulher = {^futebol,cinema}, S = {(^futebol,^futebol),(^futebol,^cinema),(^cinema,^futebol),(^cinema,^cinema)}. As duas fun¸cões utilidade u_homem: S → R e u_mulher: S → R são descritas pela seguinte matriz de payoffs:

(10)

Mulher

futebol cinema

Homem futebol (10,5) (0,0)

cinema (0,0) (5,10)

1.4 Solu¸ c˜ oes de um jogo

Uma solu¸cão de um jogo é uma prescri¸cão ou previsão sobre o resultado do jogo. Existem vários conceitos diferentes de solu¸cão. Nesta se¸cão, inves- tigaremos os dois conceitos mais comuns: dominância e equil´ıbrio de Nash.

Considere o dilema do prisioneiro. Como encontrar uma solu¸cão para o dilema de Bob e Al, isto é, que estratégias são plaus´ıveis se os dois prisioneiros querem minimizar¹ o tempo de cadeia? Se analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira:

“Duas coisas podem acontecer: Bob pode confessar ou Bob pode ne- gar. Se Bob confessar, então é melhor para mim confessar também.

Se Bob não confessar, então eu fico livre se eu confessar. Em qualquer um dos casos, é melhor para mim confessar. Então, eu confessarei.”

Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ınio e concluir que Bob também irá confessar. Assim, ambos confessarão e ficarão presos por 5 anos.

Em termos da teoria dos jogos, dizemos que os dois jogadores possuem umaestratégia dominante, isto é, todas menos uma estratégia é estritamente dominada, que o jogo ´e resolúvel por dominância estrita iterada e que o jogo termina em uma solu¸cão que é um equil´ıbrio de estratégia dominante, conceitos que definiremos a seguir.

1No exemplo 1.1, ospayoffsforam definidos como números≤0. Desta maneira, minimizar o tempo de cadeia é equivalente a maximizar opayoff.

(11)

Dominˆancia

Freqüentemente, iremos discutir perfis de estratégia na qual apenas a estratégia de um único jogador g_i ∈ G irá variar, enquanto que as estratégias de seus oponentes permanecerão fixas. Denote por

s−i = (s₁_j₁, . . . , s_(i−1)j_i−1, s_(i+1)j_i+1, . . . , s_nj_n) ∈

S_−i = S₁ × · · · ×S_i−1 ×S_i+1 × · · · ×S_n uma escolha de estratégia para todos os jogadores, menos o jogador g_i. Desta maneira, um perfil de estratégia pode ser convenientemente denotado por

s = (s_ij_i,s−i) = (s₁_j₁, . . . , s_(i−1)j_i−1, s_ij_i, s_(i+1)j_i+1, . . . , s_nj_n).

Defini¸cão 1.1 (Estratégia Pura Estritamente Dominada) Uma estratégia pura s_ik ∈ S_i do jogador g_i ∈ G é estritamente do- minada pela estratégia s_ik ∈ S_i se

u_i(s_ik,s−i) > u_i(s_ik,s−i),

para todos−i ∈ S_−i. A estratégia s_ik ∈ S_i é fracamente dominadapela estratégia s_ik ∈ S_i se u_i(s_ik,s−i) ≥ u_i(s_ik,s−i), para todo s−i ∈ S_−i. Dominância estrita iterada nada mais é do um processo onde se eliminam as estratégias que são estritamente dominadas.

Exemplo 1.3 Considere o jogo determinado pela matriz de payoﬀs abaixo.

g₂

s₂₁ s₂₂ s₂₃ s₂₄

g1

s₁₁ (5,2) (2,6) (1,4) (0,4) s₁₂ (0,0) (3,2) (2,1) (1,1) s₁₃ (7,0) (2,2) (1,1) (5,1) s₁₄ (9,5) (1,3) (0,2) (4,8)

(12)

Neste jogo, para o jogador g₂, a estratégia s₂₁ é estritamente dominada pela estratégia s₂₄, assim, a primeira coluna da matriz pode ser eliminada.

g₂

s₂₂ s₂₃ s₂₄

g1

s₁₁ (2,6) (1,4) (0,4) s₁₂ (3,2) (2,1) (1,1) s₁₃ (2,2) (1,1) (5,1) s₁₄ (1,3) (0,2) (4,8)

Agora, nesta matriz reduzida, para o jogador g₁, as estratégias s₁₁ e s₁₄ são estritamente dominadas pelas estratégias s₁₂ e s₁₃, respectivamente. Por- tanto, as linhas 1 e 4 podem ser eliminadas. Além disso, a estratégia s₂₃ do jogador g₂ é estritamente dominada pelas estratégia s₂₂. Assim, a coluna 2 também pode ser eliminada. Obtemos então uma matriz reduzida 2×2.

g₂ s₂₂ s₂₄ g₁ s₁₂ (3,2) (1,1)

s₁₃ (2,2) (5,1)

Finalmente, a estratégia s₂₄ do jogador g₂ é estritamente dominada pela estratégia s₂₂ e, na matriz 2× 1 resultante, a estratégia s₁₃ do jogador g₁

é estritamente dominada pela estratégia s₁₂. Vemos então que o resultado do jogo é (3,2), isto é, o jogador g₁ escolhe a estratégia s₁₂ e o jogador g₂ escolhe a estratégia s₂₂.

No exemplo acima, a t´ecnica de dominˆancia estrita iterada forneceu um

´

unico perfil de estratégia como solu¸cão do jogo, no caso, o perfil (s12, s22).

(13)

Contudo, pode acontecer da técnica fornecer vários perfis ou, até mesmo, fornecer todo o espa¸co de estratégia, como é o caso da batalha dos sexos, onde não existem estratégias estritamente dominadas.

Solu¸c˜ao estrat´egica ou equil´ıbrio de Nash

Uma solu¸cão estratégica ou equil´ıbrio de Nash de um jogo é um ponto onde cada jogador não tem incentivo de mudar sua estratégia se os demais jogadores não o fizerem.

Defini¸cão 1.2 (Equil´ıbrio de Nash) Dizemos que um perfil de es- tratégia

s^∗ = (s^∗₁, . . . , s^∗_(i−1), s^∗_i, s^∗_(i+1), . . . , s^∗_n) ∈ S

´e um equil´ıbrio de Nash se

u_i(s^∗_i,s^∗_−i) ≥ u_i(s_ij_i,s^∗_−i)

para todo i = 1, . . . , n e para todo j_i = 1, . . . , m_i, com m_i ≥ 2.

Exemplo 1.4

(a) No dilema do prisioneiro (exemplo 1.1), o perfil de estratégia (confessar, confessar) é um equil´ıbrio de Nash. De fato: se um prisioneiro confessar e o outro não, aquele que não confessou fica preso na cadeia 10 anos, ao invés de 5 anos, se tivesse confessado. Além desse perfil, não existem outros equil´ıbrios de Nash.

(b) Na batalha dos sexos (exemplo 1.2), os perfis de estratégia (futebol, futebol) e (cinema, cinema) são os únicos equil´ıbrios de Nash do jogo.

(c) No exemplo 1.3, o único equil´ıbrio de Nash do jogo é o perfil de es- tratégia (s₁₂, s₂₂).

(d) Existem jogos que n˜ao possuem equil´ıbrios de Nash em estrat´egias puras.

Este é o caso do jogo de combinar moedas (matching pennies). Nesse jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o primeiro. Se uma das moedas

(14)

apresenta cara, enquanto a outra apresenta coroa, ´e a vez do primeiro jogador dar sua moeda pra o segundo. Esse jogo se encontra representado por sua matriz de payoﬀs dada abaixo.

g2

s₂₁ s₂₂

g₁ s₁₁ (+1,−1) (−1,+1) s12 (−1,+1) (+1,−1)

1.5 Estrat´ egias mistas

Como vimos no jogo de combinar de moedas do exemplo 1.4 (d) acima, existem jogos que n˜ao possuem equil´ıbrios de Nash em estrat´egias puras.

Uma alternativa para estes casos é a de considerar o jogo do ponto de vista probabil´ıstico, isto é, ao invés de escolher um perfil de estratégia pura, o jogador deve escolher umadistribui¸cão de probabilidadesobre suas estratégias puras.

Uma estratégia mista p_i para o jogador g_i ∈ G é uma distribui¸cão de probabilidades sobre o conjunto S_i de estratégias puras do jogador, isto é, p_i é um elemento do conjunto

∆_m_i =

(x₁, . . . , x_m_i) ∈ R^mⁱ | x₁ ≥ 0, . . . , x_m_i ≥0 e

m_i

k=1

x_k = 1

.

Assim, se p_i = (p_i1, p_i2, . . . , p_im_i), ent˜ao

p_i1 ≥ 0, p_i2 ≥0, . . . , p_i_mi ≥ 0 e

mi

k=1

p_ik = 1.

Note que cada ∆_m_i é um conjunto compacto e convexo. Nas figuras 1.7 e 1.8 temos os desenhos de ∆2 e ∆3, respectivamente. Os pontos extremos (vértices) de ∆_m_i, isto é, os pontos da forma

e1 = (1,0, . . . ,0,0), e2 = (0,1, . . . ,0,0), . . . , emi = (0,0, . . . ,0,1)

(15)

dão, respectivamente, probabilidade 1 às estratégias puras s_i1, s_i2, . . . , s_im_i. Desta maneira, podemos considerar a distribui¸cão de probabilidade ek como a estratégia mista que representa a estratégia pura s_ik do jogador g_i.

1 0

1

x₁ x2

Figura 1.7: ∆₂ ={(x₁, x₂)∈R² | x₁ ≥0, x₂ ≥0 e x₁+x₂ = 1}.

O espa¸co de todos os perfis de estratégia mista é o produto cartesiano

∆ = ∆_m₁ ×∆_m₂ × · · · ×∆_m_n,

denominado espa¸co de estratégia mista. Um vetor p ∈ ∆ é denominado um perfil de estratégia mista. Como no caso de estrat´egias puras, usaremos a nota¸cão p_−i para representar as estratégias de todos os jogadores, com exce¸cão do jogador g_i.

Como o produto cartesiano de conjuntos compactos e convexos ´e compacto e convexo, vemos que ∆ ´e compacto e convexo.

Cada perfil de estratégia mista p = (p1, . . . ,p_n) ∈ ∆ determina umpayoff esperado, uma média dos payoffs ponderada pelas distribui¸cões de probabilidades p1, . . . , p_n. Mais precisamente, se

p = (p1,p2, . . . ,p_n)

= (p₁₁, p₁₂, . . . , p_1m₁

p₁

;p₂₁, p₂₂, . . . , p_2m₂

p₂

;. . .;p_n1, p_n2, . . . , p_nm_n

p_n

), ent˜ao

(16)

0 1

1 1

x₁

x₂ x3

Figura 1.8: ∆₃ ={(x₁, x₂, x₃)∈R³ | x₁ ≥0, x₂ ≥0, x₃ ≥0 e x₁+x₂+x₃ = 1}.

u_i(p) =

m₁

j1=1 m₂

j2=1

· · ·

m_n

jn=1

n k=1

p_kj_ku_i(s_1j₁, s_2j₂, . . . , s_nj_n)

.

Assim, no item (d) do exemplo 1.4, se g₁ escolhe a distribui¸cão de probabilidade p1 = (1/4,3/4) e g₂ escolhe a distribui¸cão de probabilidade p2 = (1/3,2/3), então os payoffsesperados associados ao perfil de estratégia mista p = (p1,p2) = (1/4,3/4; 1/3,2/3) são dados por

u₁(p) = 2 j₁=1

2 j₂=1

2 k=1

p_kj_ku₁(s_1j₁, s_2j₂)

= p₁₁

p₂₁u₁(s₁₁, s₂₁) +p₂₂u₁(s₁₁, s₂₂)

+ p₁₂

p₂₁u₁(s₁₂, s₂₁) +p₂₂u₁(s₁₂, s₂₂)

= 1 4

1

3(+1) + 2 3(−1)

+ 3

4 1

3(−1) + 2 3(+1)

= +1 6

(17)

e, analogamente, u₂(p) =

2 j₁=1

2 j₂=1

2 k=1

p_kj_ku₂(s_1j₁, s_2j₂)

= p₁₁

p₂₁u₂(s₁₁, s₂₁) +p₂₂u₂(s₁₁, s₂₂)

+

= p12

p21u2(s12, s21) +p22u2(s12, s22)

= 1 4

1

3(−1) + 2 3(+1)

+ 3

4 1

3(+1) + 2 3(−1)

= −1 6.

1.6 Solu¸ c˜ oes em estrat´ egias mistas

Todos os critérios básicos para solu¸cões de jogos em estratégias puras podem ser estendidos para estratégias mistas.

Dominˆancia estrita iterada

Defini¸cão 1.3 (Dominância estrita iterada) Sejam S_i⁽⁰⁾ = S_i e

∆⁽⁰⁾_m_i = ∆_m_i. Deﬁna, recursivamente, S_i⁽ⁿ⁾ = {s ∈ S_i⁽ⁿ⁻¹⁾ | p∈ ∆⁽ⁿ⁻¹⁾_m_i tal que

∀s_−i ∈ S₋₁⁽ⁿ⁻¹⁾, u_i(p, s_−i) > u_i(s, s_−i)} e

∆⁽_mⁿ_i⁾ = {p= (p₁, . . . , p_m_i) ∈ ∆_m_i |

∀k = 1, . . . , m_i, p_k > 0 somente se s_ik ∈ S_i⁽ⁿ⁾}, onde, por abuso de nota¸cão, u_i(p, s_−i) representa o payoff esperado quando o jogador g_i escolhe a estratégia mista p e os demais jogadores escolhem as estratégias mistas correspondentes as estratégias puras dadas por s_−i. A interse¸cão

(18)

S_i^∞ = ∞ n=0

S_i⁽ⁿ⁾

´e o conjunto de estrat´egias puras e

∆^∞_m_i = {p ∈ ∆_m_i |

p ∈ ∆_m_i tal que ∀s_−i ∈ S_−i⁽^∞⁾, u_i(p, s_−i) > u_i(p, s_i)}

é o conjunto de todas as estratégias mistas do jogador g_i que sobrevi- veram a técnica de dominância estrita iterada.

Equil´ıbrio de Nash

Defini¸cão 1.4 (Equil´ıbrio de Nash) Dizemos que um perfil de es- tratégia mista

p^∗ = (p^∗1,p^∗2, . . . ,p^∗_n) ∈ ∆ = ∆_m₁ ×∆_m₂ × · · · ×∆_m_n

´e um equil´ıbrio de Nash se

u_i(p^∗_i,p^∗_−i) ≥ u_i(p,p^∗_−i)

para todo p ∈ ∆_m_i, isto é, nenhum jogador sente motiva¸cão de trocar sua estratégia mista se os demais jogadores não o fizerem.

Exemplo 1.5

(a) No dilema do prisioneiro (exemplo 1.1), o perﬁl de estrat´egia mista p^∗ = (p^∗1,p^∗2) = (1,0; 1,0)

´e um equil´ıbrio de Nash, pois

u₁(p,p^∗2) =u₁(p,1−p; 1,0) = 5p−10 ≤ −5 = u₁(1,0; 1,0) = u₁(p^∗1,p^∗2) para todo p = (p,1−p) ∈ ∆₂ e

u2(p^∗₁,q) =u2(1,0;q,1−q) = 5q −10 ≤ −5 = u2(1,0; 1,0) = u2(p^∗₁,p^∗₂)

(19)

para todoq = (q,1−q) ∈ ∆₂. Observe que este equil´ıbrio corresponde ao equil´ıbrio em estratégias purass^∗ = (confessar, confessar). Mostraremos mais adiante que este é o único equil´ıbrio de Nash em estratégias mistas do jogo.

(b) Na batalha dos sexos (exemplo 1.2), os equil´ıbrios de Nash em estrat´egias mistas s˜ao

(1,0; 1,0) e (0,1; 0,1),

correspondentes aos equil´ıbrios de Nash em estrat´egias puras (futebol, futebol) e (cinema, cinema), respectivamente, ´e o ponto

(2/3,1/3; 1/3,2/3).

Mostraremos mais adiante que estes são os únicos equil´ıbrios de Nash em estratégias mistas do jogo.

(c) No exemplo 1.3, o único equil´ıbrio de Nash em estratégia mista é o ponto (0,1,0,0; 0,1,0,0)

que corresponde ao equil´ıbrio de Nash (s₁₂, s₂₂) em estrat´egias puras.

(d) No jogo de combinar de moedas do exemplo 1.4 (d), o único equil´ıbrio de Nash em estratégias mistas é o ponto

(1/2,1/2; 1/2,1/2).

Exemplo 1.6 O chefe de uma empresa de computa¸cão desconfia que seu operador de computadores está usando o tempo de servi¸co para “bater papo”

na internet. Se o operador trabalha corretamente, ele gasta g em esfor¸co e produz um lucro bruto de v unidades. O chefe, por sua vez, pode ﬁscalizar ou n˜ao o trabalho do operador. Fiscalizar custa h unidades para a empresa.

Se o operador for pego “batendo papo” na internet, ele perde o seu salário de w unidades. Para limitar o número de casos a considerar, vamos assumir que v > w > g > h > 0. Os dois jogadores escolhem suas estratégias simultaneamente.

(20)

empregado

n˜ao trabalhar trabalhar chefe ﬁscalizar (−h,0) (v −w −h, w−g)

n˜ao ﬁscalizar (−w, w) (v −w, w −g)

Observe que este jogo não possui equil´ıbrio de Nash em estratégias puras e, como ele deve se repetir em cada dia útil de trabalho, não é sensato escolher sempre a mesma estratégia pura para todos os dias. A solu¸cão, neste caso, é escolher entre as estratégias puras a cada dia seguindo uma distribui¸cão de probabilidades. De fato, se v = 5, w = 4, g = 3 e h = 2, então o ponto

(3/4,1/4; 1/2,1/2)

é um equil´ıbrio de Nash em estratégias mistas. Isto significa que o chefe deve escolher sua estratégia de acordo com um gerador de números aleatórios com distribui¸cão de probabilidade (3/4,1/4) e o operador deve escolher sua estratégia de acordo com um gerador de números aleatórios com distribui¸cão de probabilidade (1/2,1/2). Isto pode ser feito, por exemplo, com as duas

“rodas da fortuna” da ﬁgura 1.9.

Fiscalizar

Não fiscalizar

Trabalhar

Não trabalhar

chefe empregado

Figura 1.9: Distribui¸c˜oes de probabilidade que constituem um equil´ıbrio de Nash para o jogo do exemplo 1.6.

Exemplo 1.7 (A tragédia dos comuns) Considere uma vila, onde cada um dos n fazendeiros tem a op¸cão de manter ou não sua ovelha no pasto. A

(21)

utilidade do leite e da l˜a de uma ovelha pastando ´e igual a 1, por outro lado, esta ovelha no pasto contribui com um dano ambiental (compartilhado por todos os fazendeiros) de 5 unidades.

Cada fazendeiro tem duas estratégias: manter ou não manter sua ovelha no pasto. Defina

x_i =

1, se o i-´esimo fazendeiro mantém sua ovelha no pasto, 0, se o i-´esimo fazendeiro não mantém sua ovelha no pasto.

Em termos destas variáveis, é fácil de ver que a utilidade u_i do i-´esimo fazendeiro é dada por

u_i(x₁, . . . , x_n) =x_i −5· (x₁ +· · ·+x_n)

n .

Se n > 5, manter todas as ovelhas no pasto, isto é, tomar x₁ = · · · = x_n = 1, é o único equil´ıbrio de Nash do jogo. De fato: se todas as ovelhas estão no pasto e um fazendeiro resolve tirar sua ovelha, ele deixa de ganhar 1 (proveniente da utilidade da lã e do leite) e deixa de perder 5/n < 1 (proveniente do dano ambiental), isto é, ele acaba ganhando menos do que se tivesse mantido sua ovelha no pasto. Assim, todos terminarão mantendo sua ovelha e a utilidade final de cada fazendeiro será igual −4, com preju´ızo ambiental máximo. A figura 1.10 lista todos os perfis de estratégia pura, com as respectivas utilidades, para o caso n = 6.

Para amenizar esta situa¸cão, a teoria dos jogos sugere a cobran¸ca de um imposto por danos ambientais. Se o i-´esimo fazendeiro deve pagar um imposto de t unidades por manter sua ovelha no pasto, então sua utilidade final será dada por

u_i(x₁, . . . , x_n) = x_i−tx_i −5· (x₁ +· · ·+x_n)

n .

Se t = 5, então x₁ = . . . = x_n = 0 é o único equil´ıbrio de Nash, isto é, todos os fazendeiros vão preferir retirar suas ovelhas do pasto (figura 1.11).

O caso n = 6 et = 1/6 é interessante: todos os 64 perfis de estratégia são equil´ıbrios de Nash (figura 1.12).

(22)

perﬁl u1 u2 u3 u4 u5 u6

(0,0,0,0,0,0) 0 0 0 0 0 0

(0,0,0,0,0,1) −5/6 −5/6 −5/6 −5/6 −5/6 1/6 (0,0,0,0,1,0) −5/6 −5/6 −5/6 −5/6 1/6 −5/6 (0,0,0,0,1,1) −5/3 −5/3 −5/3 −5/3 −2/3 −2/3 (0,0,0,1,0,0) −5/6 −5/6 −5/6 1/6 −5/6 −5/6 (0,0,0,1,0,1) −5/3 −5/3 −5/3 −2/3 −5/3 −2/3 (0,0,0,1,1,0) −5/3 −5/3 −5/3 −2/3 −2/3 −5/3 (0,0,0,1,1,1) −5/2 −5/2 −5/2 −3/2 −3/2 −3/2 (0,0,1,0,0,0) −5/6 −5/6 1/6 −5/6 −5/6 −5/6 (0,0,1,0,0,1) −5/3 −5/3 −2/3 −5/3 −5/3 −2/3 (0,0,1,0,1,0) −5/3 −5/3 −2/3 −5/3 −2/3 −5/3 (0,0,1,0,1,1) −5/2 −5/2 −3/2 −5/2 −3/2 −3/2 (0,0,1,1,0,0) −5/3 −5/3 −2/3 −2/3 −5/3 −5/3 (0,0,1,1,0,1) −5/2 −5/2 −3/2 −3/2 −5/2 −3/2 (0,0,1,1,1,0) −5/2 −5/2 −3/2 −3/2 −3/2 −5/2 (0,0,1,1,1,1) −10/3 −10/3 −7/3 −7/3 −7/3 −7/3 (0,1,0,0,0,0) −5/6 1/6 −5/6 −5/6 −5/6 −5/6 (0,1,0,0,0,1) −5/3 −2/3 −5/3 −5/3 −5/3 −2/3 (0,1,0,0,1,0) −5/3 −2/3 −5/3 −5/3 −2/3 −5/3 (0,1,0,0,1,1) −5/2 −3/2 −5/2 −5/2 −3/2 −3/2 (0,1,0,1,0,0) −5/3 −2/3 −5/3 −2/3 −5/3 −5/3 (0,1,0,1,0,1) −5/2 −3/2 −5/2 −3/2 −5/2 −3/2 (0,1,0,1,1,0) −5/2 −3/2 −5/2 −3/2 −3/2 −5/2 (0,1,0,1,1,1) −10/3 −7/3 −10/3 −7/3 −7/3 −7/3 (0,1,1,0,0,0) −5/3 −2/3 −2/3 −5/3 −5/3 −5/3 (0,1,1,0,0,1) −5/2 −3/2 −3/2 −5/2 −5/2 −3/2 (0,1,1,0,1,0) −5/2 −3/2 −3/2 −5/2 −3/2 −5/2 (0,1,1,0,1,1) −10/3 −7/3 −7/3 −10/3 −7/3 −7/3 (0,1,1,1,0,0) −5/2 −3/2 −3/2 −3/2 −5/2 −5/2 (0,1,1,1,0,1) −10/3 −7/3 −7/3 −7/3 −10/3 −7/3 (0,1,1,1,1,0) −10/3 −7/3 −7/3 −7/3 −7/3 −10/3 (0,1,1,1,1,1) −25/6 −19/6 −19/6 −19/6 −19/6 −19/6 (1,0,0,0,0,0) 1/6 −5/6 −5/6 −5/6 −5/6 −5/6 (1,0,0,0,0,1) −2/3 −5/3 −5/3 −5/3 −5/3 −2/3 (1,0,0,0,1,0) −2/3 −5/3 −5/3 −5/3 −2/3 −5/3 (1,0,0,0,1,1) −3/2 −5/2 −5/2 −5/2 −3/2 −3/2 (1,0,0,1,0,0) −2/3 −5/3 −5/3 −2/3 −5/3 −5/3 (1,0,0,1,0,1) −3/2 −5/2 −5/2 −3/2 −5/2 −3/2 (1,0,0,1,1,0) −3/2 −5/2 −5/2 −3/2 −3/2 −5/2 (1,0,0,1,1,1) −7/3 −10/3 −10/3 −7/3 −7/3 −7/3 (1,0,1,0,0,0) −2/3 −5/3 −2/3 −5/3 −5/3 −5/3 (1,0,1,0,0,1) −3/2 −5/2 −3/2 −5/2 −5/2 −3/2 (1,0,1,0,1,0) −3/2 −5/2 −3/2 −5/2 −3/2 −5/2 (1,0,1,0,1,1) −7/3 −10/3 −7/3 −10/3 −7/3 −7/3 (1,0,1,1,0,0) −3/2 −5/2 −3/2 −3/2 −5/2 −5/2 (1,0,1,1,0,1) −7/3 −10/3 −7/3 −7/3 −10/3 −7/3 (1,0,1,1,1,0) −7/3 −10/3 −7/3 −7/3 −7/3 −10/3 (1,0,1,1,1,1) −19/6 −25/6 −19/6 −19/6 −19/6 −19/6 (1,1,0,0,0,0) −2/3 −2/3 −5/3 −5/3 −5/3 −5/3 (1,1,0,0,0,1) −3/2 −3/2 −5/2 −5/2 −5/2 −3/2 (1,1,0,0,1,0) −3/2 −3/2 −5/2 −5/2 −3/2 −5/2 (1,1,0,0,1,1) −7/3 −7/3 −10/3 −10/3 −7/3 −7/3 (1,1,0,1,0,0) −3/2 −3/2 −5/2 −3/2 −5/2 −5/2 (1,1,0,1,0,1) −7/3 −7/3 −10/3 −7/3 −10/3 −7/3 (1,1,0,1,1,0) −7/3 −7/3 −10/3 −7/3 −7/3 −10/3 (1,1,0,1,1,1) −19/6 −19/6 −25/6 −19/6 −19/6 −19/6 (1,1,1,0,0,0) −3/2 −3/2 −3/2 −5/2 −5/2 −5/2 (1,1,1,0,0,1) −7/3 −7/3 −7/3 −10/3 −10/3 −7/3 (1,1,1,0,1,0) −7/3 −7/3 −7/3 −10/3 −7/3 −10/3 (1,1,1,0,1,1) −19/6 −19/6 −19/6 −25/6 −19/6 −19/6 (1,1,1,1,0,0) −7/3 −7/3 −7/3 −7/3 −10/3 −10/3 (1,1,1,1,0,1) −19/6 −19/6 −19/6 −19/6 −25/6 −19/6 (1,1,1,1,1,0) −19/6 −19/6 −19/6 −19/6 −19/6 −25/6

(1,1,1,1,1,1) −4 −4 −4 −4 −4 −4

Figura 1.10: A trag´edia dos comuns com n= 6 e imposto t= 0.