• Nenhum resultado encontrado

Micro2Pos NA1 JGLR JogosI

N/A
N/A
Protected

Academic year: 2021

Share "Micro2Pos NA1 JGLR JogosI"

Copied!
17
0
0

Texto

(1)

Microeconomia 2 – P´

os-Gradua¸c˜

ao – 2/2019

Notas de Aula 1 – Teoria dos Jogos (Parte l)

Prof. Jos´

e Guilherme de Lara Resende

Departamento de Economia, Universidade de Bras´ılia

1

Introdu¸

ao

1.1

Interdependˆ

encia Estrat´

egica

A teoria dos jogos permite modelar comportamentos estrat´egicos de agentes econˆomicos (jo-gadores) que se envolvem em uma determinada situa¸c˜ao (jogo). ´E o instrumento adequado quando existe interdependˆencia estrat´egica entre os agentes do modelo analisado.

No modelo de consumo usual, o consumidor decide entre poss´ıveis cestas de bens, dados os pre¸cos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produ¸c˜ao e dados os pre¸cos dos insumos e dos bens que vende. No modelo de equil´ıbrio geral competitivo, tanto os consumidores quanto as firmas s˜ao tomadores de pre¸cos: tomam os pre¸cos como dados e n˜ao h´a interdependˆencia estrat´egica entre suas decis˜oes. Por´em, existem situa¸c˜oes onde o resultado das a¸c˜oes de um agente dependem tamb´em das a¸c˜oes de outro ou outros agentes. Nesses casos, assumimos que o payoff (utilidade) do agente depende n˜ao s´o da sua a¸c˜ao, mas tamb´em da a¸c˜ao de outros agentes. Modelos de oligop´olio s˜ao um exemplo, em que o lucro de determinada firma depende do comportamento de suas rivais. Em um jogo, cada jogador deve levar em conta a estrat´egia dos outros jogadores antes de escolher o melhor para si. Isso gera uma circularidade, caracter´ıstica fundamental da teoria dos jogos.

O objetivo da teoria dos jogos ´e determinar o resultado de um jogo. Cada m´etodo de an´alise d´a origem a um conceito de solu¸c˜ao particular, chamado equil´ıbrio.

A maioria dos conceitos tem sua origem no conceito de equil´ıbrio de Nash e s˜ao, usualmente, equil´ıbrios de Nash que satisfazem certas propriedades. Por isso, s˜ao chamados refinamen-tos. Cada refinamento tenta solucionar alguma deficiˆencia do conceito de equil´ıbrio de Nash particular a alguma situa¸c˜ao ou modelo.

1.2

No¸

oes Preliminares

Defini¸c˜ao (informal): Jogo. Um jogo refere-se a qualquer situa¸c˜ao envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependˆencia estrat´egica.

Para descrevermos um jogo ´e necess´ario conhecermos trˆes objetos: • Os jogadores,

• A regra do jogo,

(2)

S˜ao feitas duas hip´oteses b´asicas sobre os jogadores (Myerson, 1997):

1. Os jogadores s˜ao racionais. As a¸c˜oes de um jogador s˜ao consistentes com o objetivo desejado: maximizar o seu payoff ou a sua utilidade.

2. Os jogadores s˜ao inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e conseguem fazer as mesmas inferˆencias que realizamos sobre a situa¸c˜ao em que se encontram.

A segunda hip´otese n˜ao ´e t˜ao in´ocua quanto parece. Na teoria de equil´ıbrio geral os in-div´ıduos s˜ao racionais, mas n˜ao ´e necess´ario que sejam inteligentes no sentido acima: os agentes econˆomicos n˜ao precisam conhecer toda a estrutura de teoria de equil´ıbrio geral ao tomarem suas decis˜oes.

As duas formas mais usuais de representarmos um jogo s˜ao:

FORMA NORMAL: Representa¸c˜ao em forma matricial, tamb´em conhecida como forma estrat´egica. Adequada para situa¸c˜oes onde os jogadores se “movem” (decidem suas a¸c˜oes) simultaneamente. Mais usada em modelos est´aticos.

FORMA EXTENSIVA: Representa¸c˜ao em forma de ´arvore. Adequada para situa¸c˜oes onde exista uma ordem cronol´ogica dos eventos do jogo. Mais usada em modelos dinˆamicos.

Existe uma correspondˆencia entre essas duas formas, que veremos mais a frente.

Vamos estudar jogos n˜ao-cooperativos: analisamos cada agente separadamente e n˜ao como um grupo. Essa defini¸c˜ao n˜ao implica que um jogador n˜ao possa cooperar com o outro; ela ´e apenas de cunho metodol´ogico, onde cada agente ´e visto como uma entidade separada, autˆonoma, e n˜ao h´a grupos de agentes (coaliz˜oes) se comportando como um ´unico agente.

1.3

Conhecimento Comum

Uma hip´otese crucial em teoria dos jogos ´e a de conhecimento comum (“common knowledge”). Essa hip´otese assume que a racionalidade dos jogadores e a estrutura do jogo ´e de conhecimento comum para todo jogador.

Se considerarmos dois jogadores, um determinado fato ´e de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, com o mesmo racioc´ınio valendo para o jogador 2.

Essa hip´otese ´e fundamental para a validade de certos procedimentos, tais como os procedi-mentos de elimina¸c˜ao de estrat´egias dominadas. Mais ainda, ela ´e fundamental para o conceito de equil´ıbrio de Nash (existem artigos que relaxam a hip´otese de conhecimento comum, sob certas condi¸c˜oes).

Myerson (1997) argumenta que a hip´otese de jogadores inteligentes implica supor que a estru-tura do jogo ´e de conhecimento comum desses jogadores.

A formaliza¸c˜ao matem´atica dessa hip´otese ´e complicada. Aqui, vamos apenas assumir a sua validade. As formaliza¸c˜oes mais conhecidas s˜ao feitas por Aumann (1976) e Aumann and Brandenburger (1995).

(3)

A quest˜ao de que se a hip´otese de conhecimento comum pode ser relaxada para a obten¸c˜ao de um equil´ıbrio de Nash ´e de dif´ıcil trato. Aumann and Brandenburger (1995) mostraram que a hip´otese de conhecimento comum da racionalidade pode ser substitu´ıda por outras condi¸c˜oes. Polak (1999) aprofunda a an´alise de Aumann and Brandenburger (1995). Essa discuss˜ao ´e com-plicada e foge do escopo do curso. Vamos apenas ver um exemplo para entender a importˆancia dessa hip´otese.

Myerson (1997) cita uma f´abula que ilustra bem as implica¸c˜oes da hip´otese. Em uma vila, existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os homens da vila, exceto ao seu marido. Essas tradi¸c˜oes s˜ao de conhecimento comum de todos os habitantes da vila.

Suponha que todas as esposas foram infi´eis. Logo, cada homem sabia da infidelidade de todas as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum homem se lamentava. Numa certa noite, um visitante revelou a todos que uma esposa havia sido infiel. Qual foi o resultado dessa revela¸c˜ao?

O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de n´umero 100, todos se lamentaram. Tente entender porque a hip´otese de conhecimento comum leva a esse resultado. Para isso, ´e necess´ario compreender o que a informa¸c˜ao do visitante adicionou ao conhecimento dos homens da vila.

O racioc´ınio fica mais f´acil de compreender se considerarmos primeiro o caso em que apenas uma esposa traiu o marido. A informa¸c˜ao nova que o visitante revelou foi informar a todos da vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, n˜ao tinha conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciˆencia de que a sua esposa ´e que fora infiel e se lamentaria na primeira noite depois da revela¸c˜ao do visitante, j´a que os costumes da vila s˜ao de conhecimento comum de todos os seus habitantes. Caso houvesse duas esposas infi´eis, ent˜ao 98 homens da vila saberiam que havia duas esposas infi´eis e 2 homens teriam conhecimento de apenas um caso de infidelidade, j´a que n˜ao saberiam que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ningu´em se lamen-taria o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda noite, ap´os observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que tˆem conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam conta de que foram tra´ıdos e se lamentariam. O racioc´ınio estende-se de modo an´alogo para o caso de 100 esposas infi´eis: no cent´esimo dia, todos os maridos se dariam conta de que foram tra´ıdos e se lamentariam.

(4)

2

Jogos na Forma Estrat´

egica

2.1

Defini¸

oes e Exemplos de Jogos

Defini¸c˜ao 7.1: Jogo na Forma Estrat´egica (ou Forma Normal). Um jogo na forma estrat´egica ´e uma cole¸c˜ao G = (Si, ui)Ii=1, onde I ´e o n´umero de jogadores, Si ´e o conjunto de

estrat´egias dispon´ıveis ao jogador i, para todo i ∈ I, e ui :

QI

j=1Sj → R ´e a fun¸c˜ao de payoff

(a utilidade) do jogador i, que depende das estrat´egias de todos os jogadores. Dizemos que um jogo na forma normal ´e finito se o n´umero I de jogadores ´e finito e se o conjunto das estrat´egias Si ´e finito para todo jogador i, i = 1, . . . , I.

Na forma normal n˜ao nos preocupamos com cada a¸c˜ao do jogador, mas apenas com cada estrat´egia do jogador, o conjunto de todas as a¸c˜oes que podem ser tomadas no decorrer de uma partida do jogo, incluindo a¸c˜oes para qualquer situa¸c˜ao de jogo. Como veremos `a frente, em certos casos, a estrat´egia do jogador pode condensar uma quantidade enorme de informa¸c˜ao, descrevendo um n´umero muito grande de a¸c˜oes a serem tomadas ao longo do jogo.

Observe que a interdependˆencia estrat´egica entre os agentes do modelo analisado aparece ex-plicitamente na hip´otese de que o payoff de cada jogador depende das estrat´egias de todos os outros jogadores: ui : S1 × · · · × Si × · · · × SI → R, ou seja, ui depende n˜ao apenas da

estrat´egia si ∈ Si escolhida por i, mas tamb´em das estrat´egias de todos os outros jogadores,

ui(s1, . . . , si, . . . , sI).

2.2

Exemplos

Exemplo 1: “Matching Pennies” ou “Batedor vs Rebatedor”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.

1↓ / 2 → Cara Coroa Cara −1, 1 1, −1 Coroa 1, −1 −1, 1

Nota¸c˜ao: Vamos usar a seguinte conven¸c˜ao para todos os jogos representados na forma ma-tricial: o primeiro elemento em cada c´elula da matriz ´e o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da c´elula ´e o payoff do jogador 2 (“jogador-coluna”).

No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevis´ıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleat´orio ou de modo que o seu rival n˜ao saiba exatamente o que ele escolher´a. Para esse jogo, temos que:

Jogadores: I = {1, 2};

Estrat´egias: S1 = S2 = {Cara, Coroa};

Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1;

u1(Cara,Cara) = u1(Coroa,Coroa) = −1;

(5)

Observe que esse ´e um jogo de soma zero: o ganho de um jogador ´e igual `a perda do outro jogador. Esse tipo de jogo foi extensivamente estudado por von Neumann and Morgenstern (2007), no livro “Theory of Games and Economic Behavior ”, publicado originalmente em 1947 e um dos marcos da teoria dos jogos.

Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e La´elio foram presos e est˜ao sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles rece-ber˜ao uma pena de 3 anos na cadeia. Se ambos n˜ao confessarem o crime, a pena ser´a de apenas dois anos, por falta de evidˆencia. Por´em, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na pris˜ao para quem confessar e, para quem n˜ao confessar, de cinco anos na pris˜ao, por n˜ao ter colaborado com a justi¸ca. A matriz abaixo descreve este jogo.

L.A.↓ / La´elio → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2

Exemplo 3: Problema de Coordena¸c˜ao. Suponha que duas pessoas est˜ao viajando sepa-radamente para o Rio de Janeiro e combinaram de se encontrar para almo¸car no dia seguinte. Por´em esqueceram de marcar o restaurante e n˜ao est˜ao conseguindo se comunicar. Eles costu-mam almo¸car sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almo¸co no restaurante da barra ´e mais agrad´avel do que o almo¸co no restaurante do centro. Por´em, eles se desencontrarem ´e a pior situa¸c˜ao poss´ıvel. A matriz abaixo descreve este jogo.

1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1

Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo `a tarde. Concordaram com duas op¸c˜oes: ir ao jogo do Corintians (F) ou fazer compras (C). Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir `as compras. A matriz abaixo descreve este jogo.

Nelson↓ / Renata → F C

F 2, 1 0, 0

C 0, 0 1, 2

A batalha dos sexos modela tamb´em um problema de coordena¸c˜ao, mas que envolve uma disputa de poder. Veremos mais `a frente que esse jogo tem dois equil´ıbrios (em estrat´egias puras), em que ambos os jogadores devem coordenar suas estrat´egias para alcan¸car um dos equil´ıbrios. Por´em, o equil´ıbrio que o jogador 1, Nelson, prefere, (F, F ), ´e diferente do equil´ıbrio que o jogador 2, Renata, prefere, (C, C), (e ambos preferem estar em uma situa¸c˜ao de equil´ıbrio do que estar em uma situa¸c˜ao de desequil´ıbrio, (F, C) ou (C, F )). Neste caso, podemos ter uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equil´ıbrio preferido.

(6)

2.3

Dominˆ

ancia Estrita

Considere um jogo com I jogadores. Vamos representar em negrito um conjunto de estrat´egias de todos os jogadores: s = (s1, . . . , sI). Vamos usar a nota¸c˜ao s−i = (s1, . . . , si−1, si+1, . . . , sI)

para representar um conjunto de estrat´egias de todos os jogadores, exceto o jogador i.

Defini¸c˜ao 7.2: Estrat´egia Estritamente Dominante. A estrat´egia ˆsi ∈ Si ´e estritamente

dominante para o jogador i no jogo G se para toda estrat´egia si ∈ Si, si 6= ˆsi, do jogador i

valer que:

ui(ˆsi, s−i) > ui(si, s−i), para todo s−i ∈ S−i,

onde S−i= S1× · · · × Si−1× Si+1× · · · × SI.

Logo, uma estrat´egia si ´e estritamente dominante para o jogador i se ela for a ´unica estrat´egia

que maximiza o payoff desse jogador, quaisquer que sejam as estrat´egias escolhidas pelos outros jogadores. Claramente, se o jogador i possuir uma estrat´egia estritamente dominante, ent˜ao ela constitui a escolha ´obvia para i jogar.

Para o jogo do dilema dos prisioneiros, Confessar ´e uma estrat´egia estritamente dominante para os dois prisioneiros. Ela ´e a melhor estrat´egia para cada prisioneiro, independentemente do que o outro prisioneiro escolha. Nesse caso, podemos dizer que (C, C) ´e um equil´ıbrio em estrat´egias estritamamente dominantes.

Observe que o equil´ıbrio (C, C) ´e Pareto dominado pelo conjunto de estrat´egias (N C, N C). Temos, ent˜ao, um caso onde o comportamento individual maximizador dos agentes envolvidos resulta em um equil´ıbrio Pareto ineficiente. Logo, na presen¸ca de interdependˆencia estrat´egica, a intera¸c˜ao de jogadores cujo objetivo ´e maximizar o seu pr´oprio bem-estar pode levar a si-tua¸c˜oes ineficientes.

Estrat´egias estritamente dominantes n˜ao s˜ao comuns. Existem v´arias situa¸c˜oes, como o pro-blema de coordena¸c˜ao acima (Exemplo 3), onde ´e f´acil verificar que n˜ao existem estrat´egias dominantes para nenhum dos jogadores.

Apesar de estrat´egias estritamente dominantes serem raras, podemos usar um conceito similar, chamado estrat´egia estritamente dominada, para eliminarmos estrat´egias que nunca devem ser escolhidas pelo jogador.

Defini¸c˜ao 7.3: Estrat´egia Estritamente Dominada. A estrat´egia ¯si ´e estritamente

domi-nada para o jogador i no jogo G se existir uma outra estrat´egia ˆsi ∈ Si, ˆsi 6= ¯si, desse jogador

tal que:

ui(ˆsi, s−i) > ui(¯si, s−i), para todo s−i ∈ S−i

Neste caso, dizemos que a estrat´egia ˆsi domina estritamente a estrat´egia ¯si.

Portanto, uma estrat´egia estritamente dominante ´e uma estrat´egia que domina estritamente todas as outras estrat´egias do jogador. Podemos dizer tamb´em que todas as outras estrat´egias desse jogador s˜ao estritamente dominadas pela sua estrat´egia estritamente dominante.

Exemplo 5: Estrat´egia Estritamente Dominada. Considere o seguinte jogo:

1↓ / 2 → E D

C (7, 4) (5, 3) M (8, 5) (2, 4) B (5, 3) (3, 4)

(7)

Para o jogador 1, a estrat´egia B ´e estritamente dominada pela estrat´egia C. Essa ´e a ´unica estrat´egia estritamente dominada no jogo acima. Se eliminarmos essa estrat´egia do jogo, usando o argumento de que o jogador 1 nunca a escolher´a, j´a que C traz um payoff sempre maior, qualquer que seja a jogada de 2, obtemos um novo jogo, dado por:

1↓ / 2 → E D

C (7, 4) (5, 3) M (8, 5) (2, 4)

Para esse novo “jogo reduzido”, a estrat´egia E domina estritamente D, para o jogador 2. Eliminando essa estrat´egia, obtemos um novo jogo, dado por:

1↓ / 2 → E C (7, 4) M (8, 5)

Finalmente, para esse novo “jogo reduzido”, a estrat´egia M domina estritamente C, para o jogador 1. Logo, ancontramos (M, E) (isto ´e, o jogador 1 escolhe M , o jogador 2 escolhe E) como solu¸c˜ao do jogo usando esse procedimento de elimina¸c˜ao de estrat´egias estritamente dominadas (PEEED).

A ideia do procedimento ´e, portanto, simples. Ele usa implicitamente a hip´otese de conhe-cimento comum da racionalidade e da estrutura do jogo para todos os jogadores. A sua formaliza¸c˜ao pode ser feita do seguinte modo:

Procedimento de Elimina¸c˜ao de Estrat´egias Estritamente Dominadas (PEEED): Considere o jogo G = (Si, ui)Ii=1. Seja Si0 = Si, para cada jogador i. Para n ≥ 1, seja Sin o

conjunto das estrat´egias do jogador i resultante da n-´esima etapa de elimina¸c˜ao, ou seja, si ∈ Sin

se si ∈ Sin−1 n˜ao ´e estritamente dominada em S n−1

i no jogo dado por G

n−1= (Sn−1

i , ui)Ii=1.

Defini¸c˜ao 7.4: Estrat´egia Iterativamente Estritamente N˜ao-Dominada. A estrat´egia si do jogador i ´e iterativamente estritamente n˜ao dominada em S (ou sobrevive ao PEEED)

se si ∈ Sin, para todo n ≥ 1.

O problema com o PEEED ´e que ele nem sempre leva a alguma solu¸c˜ao. Por exemplo, na batalha dos sexos, n˜ao existe nenhuma estrat´egia estritamente dominada, portanto n˜ao conse-guimos eliminar nenhuma estrat´egia do jogo e fazer qualquer predi¸c˜ao mais acurada sobre qual deve ser o seu resultado (ou, pelo menos, o que n˜ao pode ser resultado).

2.4

Dominˆ

ancia Fraca

Podemos enfraquecer as defini¸c˜oes de dominˆancia estrita, relaxando a exigˆencia de que o payoff seja sempre estritamente maior nas defini¸c˜oes acima.

Defini¸c˜ao: Estrat´egia Fracamente Dominante. A estrat´egia ˆsi ∈ Si ´e fracamente

domi-nante para o jogador i no jogo G se para toda estrat´egia si ∈ Si, si 6= ˆsi, valer que:

ui(ˆsi, s−i) ≥ ui(si, s−i), para todo s−i ∈ S−i,

com desigualdade estrita para pelo menos um s−i.

Evidentemente, toda estrat´egia fortemente dominante ´e fracamente dominante, mas a volta n˜ao vale (ver Exemplo 6 abaixo).

(8)

Exemplo 6. Considere o seguinte jogo:

1↓ / 2 → E D

C (1, 1) (0, 0) B (0, 0) (0, 0)

A estrat´egia C ´e fracamente dominante para o jogador 1 e a estrat´egia E ´e fracamente do-minante para o jogador 2. Desse modo, (C, E) ´e um equil´ıbrio em estrat´egias fracamente dominantes. Observe que nenhuma dessas duas estrat´egias ´e estritamente dominante.

Defini¸c˜ao 7.5: Estrat´egia Fracamente Dominada. A estrat´egia ¯si´e fracamente dominada

para o jogador i no jogo G se existir uma outra estrat´egia ˆsi ∈ Si do jogador i tal que:

ui(ˆsi, s−i) ≥ ui(¯si, s−i), para todo s−i ∈ S−i,

com desigualdade estrita para pelo menos um s−i. Dizemos que ˆsi domina fracamente ¯si.

Exemplo 7. Considere o seguinte jogo:

1↓ / 2 → E D

C (9, 6) (7, 6) M (9, 1) (3, 2) B (5, 4) (7, 3)

O jogador 1 possui duas estrat´egias fracamente dominadas: M ´e fracamente dominada por C e B ´e fracamente dominada por C (ou seja, C ´e fracamente dominante para o jogador 1). O jogador 2 n˜ao possui nenhuma estrat´egia dominada, seja no sentido estrito seja no sentido fraco. Vamos primeiro definir formalmente o processo de elimina¸c˜ao de estrat´egias fracamente dominadas (PEEFD):

Procedimento de Elimina¸c˜ao de Estrat´egias Fracamente Dominadas (PEEFD): Con-sidere o jogo G = (Si, ui)Ii=1. Seja Wi0 = Si, para cada jogador i. Para n ≥ 1, seja Win o

conjunto das estrat´egias do jogador i resultante da n-´esima etapa de elimina¸c˜ao de estrat´egias fracamente dominadas, ou seja, si ∈ Win se si ∈ Win−1 n˜ao ´e fracamente dominada em W

n−1 i

no jogo dado por Gn−1= (Wn−1

i , ui)Ii=1.

Defini¸c˜ao 7.6: Estrat´egia Iterativamente Fracamente N˜ao-Dominada. A estrat´egia si do jogador i ´e iterativamente fracamente n˜ao-dominada em S (ou sobrevive ao PEEFD ) se

si ∈ Win, para todo n ≥ 1.

Vamos aplicar o PEEFD ao jogo acima, procedendo de trˆes modos distintos:

1. Se eliminarmos primeiro M para o jogador 1, a estrat´egia D do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar B no jogo resultante, obtendo (C, E) (payoff (9,6)) como solu¸c˜ao.

2. Se eliminarmos primeiro B para o jogador 1, a estrat´egia E do jogador 2 se torna fra-camente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante, obtendo (C, D) (payoff (7,6)) como solu¸c˜ao.

3. Se eliminarmos simultaneamente M e B, ent˜ao obtemos o subjogo com 1 escolhendo C e 2 sendo indiferente entre E e D, e nenhuma dessas duas estrat´egias podem ser eliminadas para o jogador 2, usando o PEEFD.

O exemplo acima mostra que a ordem de elimina¸c˜ao das estrat´egias fracamente dominadas pode afetar a solu¸c˜ao obtida. Esta ´e uma caracter´ıstica ruim deste procedimento, pois a solu¸c˜ao obtida pode mudar conforme a ordem de elimina¸c˜ao das estrat´egias. Este problema n˜ao ocorre quando eliminamos estrat´egias estritamente dominadas.

(9)

2.5

Estrat´

egias Racionaliz´

aveis

O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo. Por´em, esses procedimentos n˜ao esgotam toda a for¸ca dessa hipot´ese: ela permite obter o conceito de estrat´egia racionaliz´avel (Bernheim, 1984; Pearce, 1984), mais restritivo do que o conceito de estrat´egias que sobrevivem ao PEEED.

Defini¸c˜ao: Melhor Resposta. Considere o jogo G = (Si, ui)Ii=1. A estrat´egia ˆsi ´e a melhor

resposta do jogador i `a estrat´egia s−i dos seus rivais se:

ui(ˆsi, s−i) ≥ ui(si, s−i), para todo si ∈ Si.

Portanto, a estrat´egia ˆsi ´e a melhor resposta do jogador i para a estrat´egia s−i se ela for uma

escolha ´otima de i quando ele acredita que seus rivais escolher˜ao as estrat´egias descritas no vetor s−i. Um jogador n˜ao deve escolher uma estrat´egia que nunca ´e uma melhor resposta,

pois n˜ao h´a conjectura poss´ıvel sobre o comportamento dos seus rivais que o jogador i possa fazer que justifique a escolha de uma estrat´egia que nunca ´e melhor resposta. Observe que estrat´egias estritamente dominadas nunca s˜ao a melhor resposta.

Podemos montar um procedimento de elimina¸c˜ao de estrat´egias que nunca s˜ao melhor res-posta, de modo similar ao PEEED. Mais uma vez, estamos supondo a validade da hip´otese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.

Defini¸c˜ao: Estrat´egias Racionaliz´aveis. As estrat´egias em Si do jogador i que sobrevivem

ao procedimento de elimina¸c˜ao de estrat´egias que nunca s˜ao a melhor resposta s˜ao chamadas racionaliz´aveis.

Uma estrat´egia racionaliz´avel pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estrat´egia com uma conjectura razo´avel sobre o comportamento dos outros jogadores (nenhum rival escolher´a uma estrat´egia n˜ao racionaliz´avel).

Proposi¸c˜ao. As seguintes afirma¸c˜oes s˜ao verdadeiras:

• A ordem de remo¸c˜ao das estrat´egias que nunca s˜ao a melhor resposta n˜ao altera o resul-tado obtido.

• Cada jogador tem pelo menos uma estrat´egia racionaliz´avel, podendo ter mais de uma. • O conjunto de estrat´egias racionaliz´aveis est´a contido no conjunto de estrat´egias que

sobrevivem ao PEEED.

• Para jogos com dois jogadores, o conjunto de estrat´egias racionaliz´aveis ´e igual ao con-junto de estrat´egias que sobrevivem ao PEEED.

Por´em, o conceito de estrat´egia racionaliz´avel tamb´em nem sempre fornece uma solu¸c˜ao. Por exemplo, para a batalha dos sexos, todas as estrat´egias s˜ao racionaliz´aveis, logo o conceito n˜ao diz nada sobre o que devemos esperar como resultado desta intera¸c˜ao estrat´egica.

Queremos tornar as predi¸c˜oes sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equil´ıbrio de Nash (EN), que, satisfeitas certas condi¸c˜oes, sempre aponta pelo menos uma solu¸c˜ao para o jogo. Esse ´e o mais importante conceito em teoria dos jogos.

(10)

3

Equil´ıbrio de Nash

3.1

Equil´ıbrio de Nash em Estrat´

egias Puras

O m´aximo que podemos obter usando a hip´otese de conhecimento comum ´e o conceito de estrat´egias racionaliz´aveis. Por´em esse conceito nem sempre traz predi¸c˜oes sobre o resultado de um jogo. Por exemplo, para a Batalha dos Sexos, todas as estrat´egias de todos os jogadores s˜ao racionaliz´aveis. Logo, esse conceito n˜ao traz nenhuma informa¸c˜ao a respeito da resolu¸c˜ao que devemos esperar para esse jogo. Queremos tornar as predi¸c˜oes sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando apenas estrat´egias racionaliz´aveis. Para obtermos qualquer outro conceito mais forte, temos que adicionar alguma hip´otese nova, al´em da de conhecimento comum.

Defini¸c˜ao 7.7: Equil´ıbrio de Nash em Estrat´egias Puras (Nash, 1951). Um conjunto de estrat´egias ˆs = (ˆs1, ˆs2, . . . , ˆsI) ´e um equil´ıbrio de Nash (EN) (em estrat´egias puras) para o

jogo G = (Si, ui)Ii=1 se, para todo jogador i, i = 1, 2, . . . , I, valer que:

ui(ˆsi, ˆs−i) ≥ ui(si, ˆs−i) , ∀ si ∈ Si.

Primeiro note que um equil´ıbrio de Nash ˆs determina uma estrat´egia para cada jogador. Em um equil´ıbrio de Nash (EN), a estrat´egia de cada jogador ´e a melhor resposta para as estrat´egias que s˜ao de fato escolhidas pelos outros jogadores. Portanto, um EN requer que cada jogador esteja certo sobre sua conjectura a respeito das estrat´egias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas.

Proposi¸c˜ao 1: Todas as estrat´egias que fazem parte de um equil´ıbrio de Nash s˜ao racio-naliz´aveis. Mais ainda, todo equil´ıbrio formado por estrat´egias estritamente ou fracamente dominantes, ou obtido pela elimina¸c˜ao de estrat´egias estritamente ou fracamente dominadas, ´

e um equil´ıbrio de Nash.

O conceito de EN traz uma predi¸c˜ao mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No problema de coordena¸c˜ao abaixo, todas as estrat´egias s˜ao racionaliz´aveis, mas apenas (s1 = L, s2 = U ) e (s1 = D, s2 = R) s˜ao EN em estrat´egias puras.

1↓ / 2 → L R U 3, 3 0, 0 D 0, 0 1, 1

O jogo “Cara ou Coroa”, representado na matriz abaixo, n˜ao possui EN em estrat´egias puras. Logo, de modo geral, n˜ao podemos garantir a existˆencia de EN em estrat´egias puras.

1↓ / 2 → Cara Coroa Cara −1, 1 1, −1 Coroa 1, −1 −1, 1

Intuitivamente, qualquer solu¸c˜ao desse jogo envolve ambos os jogadores escolhendo suas es-trat´egias de modo imprevis´ıvel. Para formalizar essa ideia, vamos introduzir o conceito de estrat´egias mistas.

(11)

3.2

Equil´ıbrio de Nash em Estrat´

egias Mistas

Defini¸c˜ao 7.8: Estrat´egias Mistas. Seja Si o conjunto de estrat´egias puras do jogador i.

Uma estrat´egia mista do jogador i ´e uma distribui¸c˜ao de probabilidade sobre Si, ou seja, uma

fun¸c˜ao mi : Si → [0, 1], que associa uma probabilidade a cada estrat´egia pura do jogador i.

Logo, para um jogo finito, temos que:

mi(si) ≥ 0 , ∀ si e

X

si∈Si

mi(si) = 1 .

O simplex de Si, representado por Mi = ∆(Si) = mi : Si → [0, 1] |Psi∈Simi(si) = 1 , ´e o

conjunto das estrat´egias mistas do jogador i. Esse conjunto tamb´em inclui as estrat´egias puras do jogador (chamadas estrat´egias mistas degeneradas).

Se os jogadores randomizam suas estrat´egias, ent˜ao o resultado do jogo deixar´a de ser de-termin´ıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada: seja m = (m1, . . . , mI) uma cole¸c˜ao de estrat´egias mistas para todos os jogadores. A utilidade

esperada do jogador i para a cole¸c˜ao de estrat´egias mistas m ´e: ui(m) =

X

s∈S

[m1(s1)m2(s2) . . . mI(sI)] ui(s1, . . . , si, . . . , sI)

Observa¸c˜ao: estamos assumindo que as randomiza¸c˜oes de cada jogador s˜ao independentes. A no¸c˜ao de equil´ıbrio correlacionado (Aumann, 1974) trata do caso onde essas randomiza¸c˜oes n˜ao s˜ao independentes. Essa dependˆencia pode ser interpretada, por exemplo, como sinais p´ublicos que fazem com que as estrat´egias tenham um grau de correla¸c˜ao.

Podemos estender imediatamente os conceitos de: estrat´egias dominantes, estrat´egias domi-nadas, procedimentos de elimina¸c˜ao e estrat´egias racionaliz´aveis, ao permitir que os jogadores possam escolher estrat´egias mistas, e n˜ao apenas estrat´egias puras. A Defini¸c˜ao 7.9 faz esta extens˜ao para o conceito de equil´ıbrio de Nash.

Defini¸c˜ao 7.9: Equil´ıbrio de Nash em Estrat´egias Mistas. O conjunto de estrat´egias mistas ˆm = ( ˆm1, . . . , ˆmI) ´e um equil´ıbrio de Nash para o jogo G = (Si, ui)Ii=1 se, para cada

jogador i = 1, 2, . . . , I, valer que:

ui( ˆmi, ˆm−i) ≥ ui(mi, ˆm−i) , ∀ mi ∈ Mi.

A defini¸c˜ao acima permite que os jogadores randomizem entre as estrat´egias puras. Observe que no equil´ıbrio, cada jogador conhece o modo em que os outros jogadores est˜ao randomizando (as estrat´egias mistas escolhidas por seus rivais). Al´em disso, como estrat´egias puras s˜ao estrat´egias mistas, a Defini¸c˜ao 7.9 estende a Defini¸c˜ao 7.7.

Observe que, para cada conjunto de estrat´egias dos jogadores candidato a equil´ıbrio, devemos verificar se para cada jogador, a sua estrat´egia ´e de fato a melhor resposta para as estrat´egias dos outros jogadores que fazem parte do conjunto de estrat´egias candidato a equil´ıbrio. Con-siderando estrat´egias mistas, existe um n´umero infinito de estrat´egias, o que torna este proce-dimento invi´avel. Como fazemos ent˜ao para encontrar os equil´ıbrios de Nash em estrat´egias mistas de um jogo? O Teorema 7.1 abaixo fornece um algoritmo para isso. Antes vamos definir o conceito de suporte de uma estrat´egia mista.

(12)

Defini¸c˜ao (Suporte). O suporte da estrat´egia mista mi ∈ Mi, denotado por supp(mi), ´e o

conjunto de estrat´egias puras de i que s˜ao jogadas com probabilidade positiva por mi. Logo

supp(mi) ⊂ Si e:

supp(mi) = {si ∈ Si | mi(si) > 0} .

Podemos definir o suporte do conjunto de estrat´egias mistas m = (m1, m2, . . . , mI) como:

supp(m) = I Y i=1 supp(mi) = I Y i=1 {si ∈ Si | mi(si) > 0}

Teorema 7.1: Equivalˆencia de Defini¸c˜oes. As seguintes afirmativas s˜ao equivalentes: 1. ˆm = ( ˆm1, . . . , ˆmI) ∈ M ´e um equil´ıbrio de Nash (segundo a Defini¸c˜ao 7.9);

2. Para todo jogador i, ui( ˆm) = ui(si, ˆm−i), para todo si ∈ supp( ˆmi); e ui( ˆm) ≥ ui(si, ˆm−i),

para todo si ∈ supp( ˆ/ mi);

3. Para todo jogador i, ui( ˆm) ≥ ui(si, ˆm−i), para todo si ∈ Si.

O Teorema 7.1 diz que em um EN em estrat´egias mistas, duas estrat´egias puras de um joga-dor que podem ser escolhidas (que est˜ao no suporte da estrat´egia mista considerada, ou seja, que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que ser´a igual ao payoff obtido no equil´ıbrio.

Esse resultado ´e consequˆencia de utilizarmos a utilidade esperada, linear nas probabilidades, para calcularmos o payoff de um conjunto de estrat´egias mistas. Caso existissem duas es-trat´egias puras que o jogador escolhesse com probabilidade positiva e tal que uma delas gerasse um payoff maior do que o da outra, dadas as estrat´egias de equil´ıbrio dos outros jogadores, o jogador n˜ao deveria atribuir probabilidade positiva `a estrat´egia que lhe d´a o payoff mais baixo, pois isso reduziria o seu payoff de equil´ıbrio.

Ou seja, dadas as estrat´egias escolhidas em equil´ıbrio pelos outros jogadores, esse jogador ´

e indiferente entre qualquer estrat´egia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estrat´egias puras lhe d˜ao um payoff igual ou maior do que qualquer outra estrat´egia que ele n˜ao escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador ´e ( ˆm1, . . . , ˆmI) ser um equil´ıbrio.

Existe uma outra forma de interpretar a randomiza¸c˜ao de estrat´egias, para o caso de dois jogadores, que pode ser mais adequada para certas situa¸c˜oes. Nessa interpreta¸c˜ao, a estrat´egia mista de um determinado jogador ´e a distribui¸c˜ao de probabilidade que o outro jogador atribui para as escolhas de seus rivais. Por exemplo, no jogo “Cara ou Coroa”, a estrat´egia mista do jogador 1 pode ser interpretada tanto como o modo que o jogador 1 randomiza entre cara e coroa ou como o modo que o jogador 2 imagina que o jogador 1 estar´a randomizando entre as suas estrat´egias.

Vamos agora usar o Teorema 7.1 para calcular o EN para o jogo “Cara ou Coroa”. Suponha que o jogador 1 decida proceder do seguinte modo: com probabilidade α ele escolhe Ca e com probabilidade 1 − α ele escolhe Co. Similarmente, o jogador 2 decide proceder do seguinte modo: com probabilidade β ele escolhe Ca e com probabilidade 1 − β ele escolhe Co. Vamos representar na matriz abaixo essa situa¸c˜ao.

1↓ / 2 → Cara (β) Coroa (1 − β) Cara (α) −1, 1 1, −1 Coroa (1 − α) 1, −1 −1, 1

(13)

Pelo Teorema 7.1, essas randomiza¸c˜oes constituem um EN se:

u1(m1, m2) = u1(Ca, m2) = u1(Co, m2) e u2(m1, m2) = u2(m1, Ca) = u2(m1, Co) ,

onde m1 e m2 representam as estrat´egias mistas dos jogadores 1 e 2, respectivamente. Portanto:

u1(Ca, m2) = u1(Co, m2) ⇒ −1 × β + 1 × (1 − β) = 1 × β + −1 × (1 − β) ⇒ β = 0,5

u2(m1, Ca) = u2(m1, Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5

Logo, m1 = (1/2Ca;1/2Co) e m2 = (1/2Ca;1/2Co) constituem um EN em estrat´egias mistas

(mais ainda, este ´e o ´unico EN deste jogo). Observe que:

u1(Ca, m2) = u1(Co, m2) = u1(m1, m2) = 0

u2(m1, Ca) = u2(m1, Co) = u2(m1, m2) = 0,

como esperado pelo Teorema 7.1.

Para jogos maiores, com mais jogadores e/ou mais estrat´egias, o seguinte algoritmo descreve como devemos proceder para determinar todos os EN de um jogo na forma normal.

Algoritmo para Encontrar EN em Estrat´egias Mistas. Fixe ˆS = ˆS1 × · · · × ˆSI ⊂ S =

S1× · · · × SI, com ˆSi 6= ∅ para todo i. Se existir algum equil´ıbrio de Nash m com suporte em

ˆ

S, ent˜ao existem n´umeros Ui, para todo jogador i, tais que:

(i) P s−i∈S−i Q j6=i mj(sj) !

ui(ˆsi, s−i) = Ui, para todo jogador i, para todo ˆsi ∈ ˆSi;

(ii) ui(si, m−i) ≤ Ui, para todo jogador i, para todo si ∈ ˆ/Si;

(iii) mi(ˆsi) > 0, para todo ˆsi ∈ ˆSi, P ˆ si∈ ˆSi

mi(ˆsi) = 1, e mi(si) = 0, para todo si ∈ ˆ/ Si.

Repita o procedimento para todas as combina¸c˜oes poss´ıveis ˆS.

A ideia do algoritmo ´e fixar um conjunto de estrat´egias puras dos jogadores para o qual se verifica a existˆencia de algum equil´ıbrio em estrat´egias mistas. Usando o Teorema 7.1, vemos que o algoritmo acima garante que:

(i) A utilidade de um jogador i qualquer, ao jogar uma estrat´egia pura que faz parte da randomiza¸c˜ao (jogada com probabilidade positiva) deve ser sempre igual, quando os seus rivais est˜ao jogando as estrat´egias de equil´ıbrio;

(ii) Nenhuma estrat´egia (para qualquer jogador) que n˜ao ´e usada na randomiza¸c˜ao d´a uma utilidade maior do que a de equil´ıbrio;

(iii) As probabilidades de randomiza¸c˜ao s˜ao de fato probabilidades.

Vamos encontrar todos os equil´ıbrios do jogo abaixo para aplicarmos o algoritmo acima. Exemplo 8. Considere o seguinte jogo com dois jogadores. O jogador 1 possui duas estrat´egias puras, U e D. O jogador 2 possui trˆes estrat´egias puras, L, M e R:

1↓ / 2 → L M R

U 1, 1 0, 0 5, 5 D 0, 0 2, 2 0, 0

(14)

Esse jogo possui dois EN em estrat´egias puras, (U, R) e (D, M ). Vamos procurar todos os EN poss´ıveis em estrat´egias mistas. Temos que considerar quatro casos:

1. O jogador 2 randomiza entre L, M e R com probabilidades β, γ e 1 − β − γ, o jogador 1 randomiza entre U e D com probabilidades α e 1 − α. Nesse caso, devemos ter que:

(i) u1(U, m2) = u1(D, m2) e (ii) u2(m1, L) = u2(m1, M ) = u2(m1, R).

Ou seja,

(i) 1 × β + 5 × (1 − β − γ) = 2 × γ (ii) 1 × α = 2 × (1 − α) = 5 × α

No item (ii), n˜ao existe solu¸c˜ao para α que satisfa¸ca as igualdades desse item. Portanto, n˜ao existe EN com a randomiza¸c˜ao sugerida acima.

2. O jogador 2 randomiza entre L e M com probabilidades β e 1 − β, o jogador 1 randomiza entre U e D com probabilidades α e 1 − α. Nesse caso, devemos ter que:

(i) u1(U, m2) = u1(D, m2) e (ii) u2(m1, L) = u2(m1, M ).

Ou seja,

(i) 1 × β = 2 × (1 − β) ⇒ β = 2/3 (ii) 1 × α = 2 × (1 − α) ⇒ α = 2/3

Ent˜ao (m1; m2) = (2/3U,1/3D;2/3L,1/3M ) ´e um candidato a EN. Por´em, s2 = R ´e tal que

u2(m1, R) = 10/3 > u2(m1, m2) = 2/3, portanto a randomiza¸c˜ao acima n˜ao ´e um EN.

3. O jogador 2 randomiza entre L e R com probabilidades β e 1 − β, o jogador 1 randomiza entre U e D com probabilidades α e 1 − α. Nesse caso, devemos ter que:

(i) u1(U, m2) = u1(D, m2) e (ii) u2(m1, L) = u2(m1, R).

Ou seja,

(i) 1 × β + 5 × (1 − β) = 0 ⇒ β = 1,25 (ii) 1 × α = 5 × α ⇒ α = 0

O item (iii) do algoritmo n˜ao ´e satisfeito (o valor de β encontrado n˜ao caracteriza uma probabilidade). Portanto, n˜ao existe EN com a randomiza¸c˜ao sugerida nesse caso. 4. O jogador 2 randomiza entre M e R com probabilidades β e 1 − β, o jogador 1 randomiza

entre U e D com probabilidades α e 1 − α. Nesse caso, devemos ter que: (i) u1(U, m2) = u1(D, m2) e (ii) u2(m1, M ) = u2(m1, R).

Ou seja,

(i) 5 × (1 − β) = 2 × β ⇒ β = 5/7 (ii) 2 × (1 − α) = 5 × α ⇒ α = 2/7

Ent˜ao (m1; m2) = (2/7U,5/7D;5/7M,2/7R) ´e um candidato a EN. Como s2 = L ´e tal que

u2(m1, L) = 5/7 < u2(m1, m2) = 10/7, a randomiza¸c˜ao acima ´e de fato um EN.

O jogo acima possui ao todo trˆes EN, dois em estrat´egias puras e um em estrat´egias mistas n˜ao-degeneradas. Claramente, esse algoritmo ´e impratic´avel de ser calculado “no bra¸co” para jogos com muitas estrat´egias. Por´em, ele pode ser implementado computacionalmente nesses casos.

(15)

3.3

Teorema de Nash

Teorema 7.2: Existˆencia de Equil´ıbrio de Nash. Todo jogo finito na forma estrat´egica possui (pelo menos) um equil´ıbrio de Nash em estrat´egias mistas.

O seguinte resultado mais geral ´e v´alido:

Teorema de Existˆencia de Equil´ıbrio de Nash (TEEN). Considere o jogo G = (Mi, ui)Ii=1,

onde:

1. Mi ⊂ Rn ´e n˜ao-vazio, compacto e convexo para todo i; e

2. ui : M → R ´e cont´ınua em M e quase-cˆoncava em Mi.

Ent˜ao sempre existe (pelo menos) um equil´ıbrio de Nash para esse jogo.

Corol´ario (Teorema 7.2). Todo jogo finito na forma estrat´egica possui pelo menos um equil´ıbrio de Nash em estrat´egias mistas.

Para confirmar a validade do corol´ario, basta notar que o simplex de um conjunto finito n˜ ao-vazio ´e compacto e convexo. Logo, o Teorema 7.2 pode ser visto como um corol´ario de Teorema TEEN.

Para se provar o Teorema TEEN, vamos definir a correspondˆencia bi : M−i → Mi de melhor

resposta para o jogador i:

bi(m−i) = { ˆmi ∈ Mi | ui( ˆmi, m−i) ≥ ui(mi, m−i), ∀mi ∈ Mi}.

A defini¸c˜ao acima diz que bi(m−i) seleciona, dada a escolha m−i de todos os outros jogadores

que n˜ao i, a melhor resposta do jogador i `a escolha m−i. Observe primeiro que bi´e de fato uma

correspondˆencia e n˜ao uma fun¸c˜ao, pois para uma determinada escolha m−i dos seus rivais, o

jogador i pode ter mais de uma estrat´egia que ´e a melhor resposta a m−i.

Podemos provar que a correspondˆencia de melhor resposta de cada jogador satisfaz: (i) bi(m−i) ´e n˜ao vazia para todo m−i ∈ M−i;

(ii) bi(m−i) ´e de valores convexos e de valores compactos para todo m−i ∈ M−i;

(iii) bi : M−i → Mi ´e hemi-cont´ınua superior (hcs).

A propriedade de continuidade superior garante, junto com a propriedade de hemi-continuidade inferior, uma regularidade para correspondˆencias an´aloga `a propriedade de conti-nuidade para fun¸c˜oes. Se bi satisfaz as propriedades acima, podemos definir a correspondˆencia

b = (b1, . . . , bI) como a correspondˆencia de melhor resposta de todos os jogadores e ent˜ao

aplicar o Teorema do Ponto Fixo de Kakutani, enunciado abaixo.

Teorema do Ponto Fixo de Kakutani. Suponha que M ⊂ Rn ´e um conjunto n˜ao-vazio,

compacto e convexo. Seja b : M → M uma correspondˆencia hemi-cont´ınua superior com valores convexos. Ent˜ao b tem ponto fixo (isto ´e, existe mP F ∈ M tal que mP F ∈ b(mP F)).

Observe que se existe um ponto fixo para b, isto ´e, um conjunto de estrat´egias m∗ = (m∗1, . . . , m∗I) tal que (m∗1, . . . , m∗I) ∈ (b1(m∗−1), . . . , bI(m∗−I)), ent˜ao vale que m∗i ∈ bi(m∗−i) para todo jogador

i, o que significa que m∗i ´e a melhor resposta do jogador i `a escolha m∗−i de seus rivais, ou seja, m∗ = (m∗1, . . . , m∗I) ´e um equil´ıbrio de Nash.

(16)

4

Alguns Resultados

Vimos acima exemplos de equil´ıbrios com estrat´egias puramente mistas. O exemplo abaixo mostra que pode existir um EN onde apenas um dos jogadores de fato randomize. Para que isso ocorra, ´e necess´ario que os payoffs obtidos com as estrat´egias puras que fazem parte da randomiza¸c˜ao desse jogador sejam todos iguais, j´a que o outro jogador n˜ao randomiza e escolhe uma estrat´egia pura. Al´em disso, cada estrat´egia pura do jogador que de fato ´e randomizada forma um EN em estrat´egias puras junto com a estrat´egia pura escolhida pelo outro jogador. O exemplo a seguir ilustra esse ponto.

Exemplo 9: Considere o seguinte jogo com dois jogadores: 1↓ / 2 → L R

U 1, 1 0, 0 D 1, 0 0, 0

Esse jogo possui trˆes EN em estrat´egias puras, (U, L), (D, L) e (D, R). N˜ao existe equil´ıbrio em estrat´egias estritamente mistas para os dois jogadores. Por´em, (αU, (1 − α)D; L) ´e um EN para todo α ∈ [0, 1], em que o jogador 1 randomiza entre as estrat´egias U e D, escolhendo qualquer probabilidade. Isso ocorre porque como U e D provˆeem o mesmo payoff para o jogador 1 quando 2 escolhe L, ent˜ao qualquer randomiza¸c˜ao entre essas duas estrat´egias ser´a parte de um EN junto com a estrat´egia L de 2.

Um caso mais extremo e sem interesse seria o de um jogo em que os payoffs de cada jogador s˜ao todos iguais. Nessa situa¸c˜ao, “tudo” ser´a EN, j´a que qualquer escolha de cada jogador gerar´a sempre o mesmo payoff. Evidentemente, isso n˜ao configuraria um jogo no sentido informal do termo. A matriz abaixo ilustra esse caso.

1↓ / 2 → L R U 1, 2 1, 2 D 1, 2 1, 2

Proposi¸c˜ao. Os seguintes resultados s˜ao v´alidos:

1. Se existir equil´ıbrio em estrat´egias estritamente dominantes, ele ser´a ´unico e ser´a o ´unico EN do jogo. O mesmo vale para equil´ıbrios obtidos com o PEEED: se existir, ser´a ´unico e o ´unico EN do jogo.

2. Se existir equil´ıbrio em estrat´egias fracamente dominantes, ent˜ao ele ser´a um EN. Neste caso, pode ocorrer que exista outro EN, formado por estrat´egias fracamente dominadas. O exemplo abaixo mostra esse caso.

3. Vimos em um exemplo acima que o PEEFD pode levar a diferentes resultados, depen-dendo da ordem de elimina¸c˜ao das estrat´egias. Mesmo assim, qualquer equil´ıbrio obtido com o PEEFD ser´a um EN.

Exemplo 10: Considere o seguinte jogo com dois jogadores: 1↓ / 2 → L R

U 1, 1 0, 0 D 0, 0 0, 0

(17)

Esse jogo possui dois EN, dados por (U, L) e (D, R). N˜ao existe equil´ıbrio em estrat´egias estritamente mistas. O EN (U, L) ´e tamb´em equil´ıbrio em estrat´egias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (L, D) ´e um equil´ıbrio formado por estrat´egias fracamente dominadas e, portanto, n˜ao pode ser encontrado usando o PEEFD.

O Exemplo 10 mostra que pode existir um equil´ıbrio formado por estrat´egias fracamente do-minadas. Um equil´ıbrio desse tipo ´e algo estranho, pois envolve cada jogador escolher uma estrat´egia para a qual existe outra op¸c˜ao que dar´a sempre um payoff maior ou igual, inde-pendentemente do que os outros jogadores fa¸cam. Ent˜ao ´e dif´ıcil justificar que um equil´ıbrio em estrat´egias fracamente dominadas seja o resultado da intera¸c˜ao estrat´egica dos jogadores. Existe um conceito de refinamento do EN para jogos na forma normal, chamado refinamento da m˜ao-trˆemula (Selten, 1975; Myerson, 1978) que exclui a possibilidade desse tipo de equil´ıbrio ocorrer, no sentido de que o EN formado por estrat´egias fracamente dominadas n˜ao satisfaz o refinamento da m˜ao-trˆemula (pode se dizer tamb´em que esse EN n˜ao ´e perfeito da m˜ ao-trˆemula).

Refinamentos do conceito de EN s˜ao direcionados para eliminar EN que por algum motivo n˜ao s˜ao considerados razo´aveis. Nesse caso, existir´a algum ou alguns EN que satisfazem o refinamento e algum ou alguns que n˜ao o satisfazem.

O refinamento da m˜ao-trˆemula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estrat´egia a ser jogada. O EN ent˜ao ser´a chamado perfeito da m˜ao-trˆemula caso satisfa¸ca a condi¸c˜ao imposta pelo refinamento. No exemplo acima, apenas o EN (U, L) ´e perfeito da m˜ao-trˆemula. O EN (D, R) n˜ao ´e perfeito da m˜ao-trˆemula. Mas-Colell et al. apresentam a formaliza¸c˜ao desse conceito, elaborado por Selten (1975) e Myerson (1978).

Referˆ

encias

Aumann, R. J. (1974). Subjectivity and correlation in randomized strategies. Journal of Mathematical Economics, 1 , 67-96.

Aumann, R. J. (1976). Agreeing to disagree. The Annals of Statistics, 4:6 , 1236-1239.

Aumann, R. J., & Brandenburger, A. (1995). Epistemic conditions for nash equilibrium. Econometrica, 63:5 , 1161-1180.

Bernheim, B. D. (1984). Rationalizable strategic behavior. Econometrica, 52 , 1007-1028. Myerson, R. B. (1997). Game theory: Analysis of conflict. Harvard University Press. Nash, J. F. (1951). Non-cooperative games. Annals of Mathematics, 54:2 , 289-295.

Pearce, D. G. (1984). Rationalizable strategic behavior and the problem of perfection. Econo-metrica, 52 , 1029-1050.

Polak, B. (1999). Epistemic conditions for nash equilibrium, and common knowledge of rationality. Econometrica, 67:3 , 673-676.

von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior (1944: 1st ed.). Princeton University Press.

Referências

Documentos relacionados

3.2 Prática e Percepções dos professores Com relação às dificuldades com a modalidade EaD no formato que é oferecido pela Unijuí, o professor “B” afirma que, por ter

Consideradas estratégicas para os Jogos Olímpicos, as estações Ricardo de Albuquerque, Magalhães Bastos, Vila Militar, Olímpica de Engenho de Dentro, Deodoro e São

O órgão consultivo e deliberativo do SISNAMA (esfera federal) ou os conselhos estaduais de meio ambiente deverão descrever quais empreendimentos estão incluídos

Os resultados das análises de regressão hierárquica demonstram que a duração do desemprego atua como moderador na relação entre o significado do trabalho e o

A decrease in the size of the cation alkyl side-chain slightly increases the catalytic activity of the ionic liquid, improving methanol conversion and DMC selectivity.. The

2.7 - Não ter sido demitido por justa causa do serviço público, atestado por declaração assinada pelo candidato; 2.8 - Não estar aposentado em decorrência de cargo, função

MENOR AJUSTE DE ZERO MOLA DO RANGE AJUSTE DE SPAN BRUTO AJUSTE DE CRUZAMENTO FEIXE DE RELÉ RELÉ B RELÉ A PRESSÃO DE ALIMENTAÇÃO PRESSÃO DO BICO SINAL DE ENTRADA SINAL DE SAÍDA

Após o sucesso nos Jogos Olímpicos do Rio de Janeiro, a Confederação Brasileira de Cano- agem tem mais um motivo para celebrar: a en- tidade renovou o contrato de patrocínio com a