• Nenhum resultado encontrado

Microeconomia2Grad NA5 TJ

N/A
N/A
Protected

Academic year: 2021

Share "Microeconomia2Grad NA5 TJ"

Copied!
29
0
0

Texto

(1)

MICROECONOMIA 2 – GRADUAC

¸ ˜

AO

Departamento de Economia, Universidade de Bras´ılia

Notas de Aula 5 – Teoria dos Jogos

Prof. Jos´

e Guilherme de Lara Resende

1

Introdu¸

ao

1.1

Interdependˆ

encia Estrat´

egica

A teoria dos jogos permite modelar comportamentos estrat´egicos dos agentes econˆomicos. ´E o instrumento adequado quando existe interdependˆencia estrat´egica entre os agentes do modelo analisado.

No modelo de consumo usual, o consumidor decide entre poss´ıveis cestas de bens, dados os pre¸cos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produ¸c˜ao e dados os pre¸cos dos insumos e dos bens que vende. No modelo de equil´ıbrio geral competitivo, tanto os consumidores quanto as firmas tomam os pre¸cos como dados e n˜ao h´a intera¸c˜ao estrat´egica entre os agentes econˆomicos.

Por´em, existem situa¸c˜oes onde os resultados das a¸c˜oes de um agente dependem diretamente do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente depende n˜ao s´o da sua a¸c˜ao, mas da a¸c˜ao de outros agentes. Modelos de oligop´olio s˜ao um exemplo, em que o lucro de determinada firma depende do que suas rivais fazem.

Um jogo ent˜ao caracteriza qualquer situa¸c˜ao desse tipo, em que cada participante deve levar em conta a estrat´egia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo da teoria dos jogos ´e determinar o resultado de um jogo. Cada m´etodo de an´alise resulta em um conceito de solu¸c˜ao particular, chamado equil´ıbrio.

A maioria dos conceitos tem sua origem no conceito de equil´ıbrio de Nash e s˜ao, usualmente, equil´ıbrios de Nash que satisfazem certas propriedades. Por isso, s˜ao chamados refinamentos. Cada refinamento tenta solucionar alguma deficiˆencia do conceito de equil´ıbrio de Nash particular a alguma situa¸c˜ao ou modelo.

1.2

No¸

oes Preliminares

Defini¸c˜ao (informal): Jogo. Um jogo refere-se a qualquer situa¸c˜ao envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependˆencia estrat´egica.

Vamos estudar jogos n˜ao-cooperativos: analisamos cada agente separadamente e n˜ao como um grupo. Essa defini¸c˜ao n˜ao implica que um jogador n˜ao possa cooperar com o outro, ela ´e apenas de cunho metodol´ogico, onde cada agente ´e visto como uma entidade separada, autˆonoma, e n˜ao h´a grupos de agentes se comportando como um ´unico agente.

(2)

Para descrevermos um jogo ´e necess´ario conhecermos trˆes objetos: • Os jogadores,

• A regra do jogo,

• O resultado do jogo (payoff dos jogadores).

S˜ao feitas duas hip´oteses b´asicas sobre os jogadores:

1. Os jogadores s˜ao racionais. As a¸c˜oes de um jogador s˜ao consistentes com o objetivo desejado: maximizar o seu payoff.

2. Os jogadores s˜ao inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-seguem fazer as mesmas inferˆencias que realizamos sobre a situa¸c˜ao em que se encontram. A segunda hip´otese n˜ao ´e t˜ao in´ocua quanto parece. Na teoria de equil´ıbrio geral os indiv´ıduos s˜ao racionais, mas n˜ao ´e necess´ario que sejam inteligentes no sentido acima: os agentes econˆomicos n˜ao precisam conhecer toda a estrutura de teoria de equil´ıbrio geral ao tomarem suas decis˜oes.

As duas formas mais comuns de se representar um jogo s˜ao:

• Forma Estrat´egica: Representa¸c˜ao em forma matricial. Esta forma ´e adequada para situa¸c˜oes onde os jogadores se “movem” (decidem suas a¸c˜oes) simultaneamente (modelo est´atico). Tamb´em conhecida como forma normal.

• Forma Extensiva: Representa¸c˜ao em forma de ´arvore. Esta forma ´e adequada para situa¸c˜oes onde exista uma ordem cronol´ogica dos eventos do jogo (modelo dinˆamico). Tamb´em conhecida como forma sequencial.

Existe uma correspondˆencia entre essas duas formas, que veremos mais a frente. Vimos que o princ´ıpio b´asico de eficiˆencia usado em economia ´e o crit´erio de Pareto. Dizemos que o resultado A do jogo ´e Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar melhor em B do que em A.

Defini¸c˜ao: Um resultado de um jogo ´e Pareto ´otimo (ou eficiente de Pareto) se n˜ao ´e Pareto-dominado por nenhum outro resultado poss´ıvel para o jogo.

1.3

Conhecimento Comum

Uma hip´otese usada em teoria dos jogos ´e a de conhecimento comum (“common knowledge”), que assume que a racionalidade dos jogadores e a estrutura do jogo s˜ao de conhecimento comum de todo jogador.

Se considerarmos dois jogadores, um determinado fato ´e de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo racioc´ınio valendo para o jogador 2.

(3)

Essa hip´otese ´e fundamental para a validade de certos procedimentos, tais como os procedi-mentos de elimina¸c˜ao de estrat´egias dominadas. Mais ainda, ela ´e importante para o conceito de equil´ıbrio de Nash (existem artigos que relaxam a hip´otese de conhecimento comum, sob certas condi¸c˜oes).

Myerson argumenta que a hip´otese de jogadores inteligentes implica supor que a estrutura do jogo ´e de conhecimento comum desses jogadores. A formaliza¸c˜ao matem´atica dessa hip´otese ´e complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para entender a importˆancia dessa hip´otese.

Myerson cita uma f´abula que ilustra bem as implica¸c˜oes da hip´otese. Em uma vila, existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os homens da vila, exceto ao seu marido. Essas tradi¸c˜oes s˜ao de conhecimento comum de todos os habitantes da vila.

Suponha que todas as esposas foram infi´eis. Logo, cada homem sabia da infidelidade de todas as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa havia sido infiel. Qual foi o resultado dessa revela¸c˜ao?

O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de n´umero 100, todos se lamentaram. Tente entender porque a hip´otese de conhecimento comum leva a esse resultado. Para isso, ´e necess´ario compreender o que a informa¸c˜ao do visitante adicionou ao conhecimento dos homens da vila.

O racioc´ınio fica mais f´acil de compreender se considerarmos primeiro o caso em que apenas uma esposa traiu o marido. A informa¸c˜ao nova que o visitante revelou foi informar a todos da vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, n˜ao tinha conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciˆencia de que a sua esposa ´e que fora infiel e se lamentaria na primeira noite depois da revela¸c˜ao do visitante, j´a que os costumes da vila s˜ao de conhecimento comum de todos os seus habitantes.

Caso houvesse duas esposas infi´eis, ent˜ao 98 homens da vila saberiam que havia duas esposas infi´eis e 2 homens teriam conhecimento de apenas um caso de infidelidade, j´a que n˜ao saberiam que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ningu´em se lamentaria o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda noite, ap´os observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que tˆem conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam conta de que foram tra´ıdos e se lamentariam. O racioc´ınio estende-se de modo an´alogo para o caso de 100 esposas infi´eis: no cent´esimo dia, todos os maridos se dariam conta de que foram tra´ıdos e se lamentariam.

(4)

2

Jogos na Forma Estrat´

egica

2.1

Defini¸

oes e Exemplos de Jogos

Defini¸c˜ao: Jogo na Forma Estrat´egica (ou Forma Normal). Um jogo na forma estrat´egica ´e uma cole¸c˜ao G = (Si, ui)Ii=1, onde I ´e o n´umero de jogadores, Si ´e o conjunto de estrat´egias

dispon´ıveis ao jogador i, para todo i ∈ I, e ui :

QI

k=1Sk → R ´e a fun¸c˜ao de payoff (a utilidade)

do jogador i, que depende das estrat´egias de todos os jogadores. Dizemos que um jogo na forma normal ´e finito se o conjunto das estrat´egias Si ´e finito para todo i, i = 1, . . . , I.

Observe que a interdependˆencia estrat´egica entre os agentes aparece explicitamente na hip´otese de que o payoff de cada jogador ´e descrita pela fun¸c˜ao ui : S1× · · · × Si× · · · × SI → R, ou seja,

ui depende n˜ao apenas da estrat´egia si escolhida por i, mas tamb´em das estrat´egias de todos os

outros jogadores, s1, . . . , si−1, si+1, . . . , sI.

Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.

1↓ / 2 → Cara Coroa Cara −1, 1 1, −1 Coroa 1, −1 −1, 1

Nota¸c˜ao: Vamos usar a seguinte conven¸c˜ao, corriqueira e adotada em diversos livros, para todos os jogos representados na forma matricial: o primeiro elemento em cada c´elula da matriz ´e o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da c´elula ´e o payoff do jogador 2 (“jogador-coluna”).

Para o jogo do Exemplo 1, temos que: Jogadores: I = {1, 2};

Estrat´egias: S1 = S2 = {Cara, Coroa};

Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1;

u1(Cara,Cara) = u1(Coroa,Coroa) = −1;

u2(s1, s2) = −u1(s1, s2), ∀(s1, s2) ∈ S1 × S2.

No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevis´ıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleat´orio ou de modo que o seu rival n˜ao saiba exatamente qual o lado da moeda ser´a escolhido.

Observe que esse ´e um jogo de soma zero: o ganho de um jogador ´e igual `a perda do outro jogador. Para jogos de soma zero com dois jogadores, os conceitos de solu¸c˜ao usados podem envolver os jogadores randomizarem suas estrat´egias. Esse tipo de jogo foi extensivamente estudado por von Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e um marco da teoria dos jogos.

(5)

Um tipo de jogo mais geral do que os de soma zero s˜ao os jogos de soma fixa (dos payoffs), tamb´em chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, ent˜ao o jogo ´e de soma zero. Logo, jogos de soma zero s˜ao um tipo de jogos de soma fixa.

Em um jogo de soma fixa, um jogador s´o aumenta o seu payoff se o payoff do outro jogador se reduzir pelo valor desse aumento. Ent˜ao qualquer resultado deste jogo ´e Pareto eficiente, pois aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse tipo de jogo ´e adequado para modelar situa¸c˜oes em que se tem um “vencedor” e um “perdedor”. Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador ganhar, ele obt´em o payoff +1, enquanto o perdedor obt´em o payoff −1. Se o jogo empatar, cada jogador obt´em payoff 0. Evidentemente, muitos dos jogos analisados em economia n˜ao s˜ao de soma fixa (ou seja, podemos dizer que s˜ao de soma vari´avel ), como ´e o caso dos Exemplos 2 e 3 a seguir. Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e est˜ao sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receber˜ao uma pena de 3 anos na cadeia. Se ambos n˜ao confessarem o crime, a pena ser´a de apenas dois anos, por falta de evidˆencia. Por´em, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na pris˜ao para quem confessar e, para quem n˜ao confessar, de cinco anos na pris˜ao, por n˜ao ter colaborado com a justi¸ca. A matriz abaixo descreve este jogo.

L.A.↓ / Laelio → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2

Exemplo 3: Problema de Coordena¸c˜ao. Suponha que duas pessoas est˜ao viajando separada-mente para o Rio de Janeiro e combinaram de se encontrar para almo¸car no dia seguinte. Por´em esqueceram de marcar o restaurante e n˜ao est˜ao conseguindo se comunicar. Eles costumam almo¸car sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almo¸co no restaurante da barra ´e mais agrad´avel do que o almo¸co no restaurante do centro. Por´em, eles se desencontrarem ´e a pior situa¸c˜ao poss´ıvel. A matriz abaixo descreve este jogo.

1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1

Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo `a tarde. Concordaram com duas op¸c˜oes: ir a um jogo de futebol ou fazer compras. Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir `as compras. A matriz abaixo descreve este jogo.

Nelson↓ / Renata → Futebol Compras

(6)

Os Exemplos 3 e 4 modelam problemas de coordena¸c˜ao: os dois jogadores devem escolher suas estrat´egias de modo que fa¸cam o mesmo programa. Veremos mais `a frente que cada um desses dois jogos possui dois equil´ıbrios de Nash em estrat´egias puras, em que ambos os jogadores devem coordenar suas estrat´egias para alcan¸car um desses equil´ıbrios. Al´em disso, o Exemplo 4 envolve uma disputa de poder, em que o equil´ıbrio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem juntos ao futebol), ´e diferente do equil´ıbrio que a jogadora 2, Renata, prefere, (C, C) (os dois irem juntos `as compras). Ambos os jogadores preferem estar em uma situa¸c˜ao de equil´ıbrio do que estar em uma situa¸c˜ao de desequil´ıbrio, (F, C) ou (C, F ), ou seja, em que um escolhe um programa diferente do escolhido pelo outro. Temos ent˜ao uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equil´ıbrio preferido.

2.2

Conceitos de Dominˆ

ancia e Estrat´

egias Racionaliz´

aveis

Nas defini¸c˜oes a seguir vamos denotar por si uma estrat´egia qualquer de um jogador i arbitr´ario

e por Si o conjunto de todas as estrat´egias dispon´ıveis para o jogador i. Al´em disso, s−i denota

um grupo de estrat´egias para os outros jogadores que n˜ao o jogador i (ou seja, s−i especifica uma

estrat´egia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estrat´egias

dispon´ıveis para os outros jogadores que n˜ao o jogador i.

Defini¸c˜ao: Estrat´egia Estritamente Dominante. A estrat´egia ˆsi ´e estritamente (ou

forte-mente) dominante para o jogador i em um dado jogo se para toda estrat´egia si 6= ˆsi, si ∈ Si,

vale:

ui(ˆsi, s−i) > ui(si, s−i), para todo s−i ∈ S−i.

Logo, uma estrat´egia ˆsi ´e estritamente dominante para o jogador i se ela for a ´unica estrat´egia

que maximiza o payoff desse jogador, quaisquer que sejam as estrat´egias escolhidas pelos outros jogadores.

Para o jogo dilema dos prisioneiros, ´e f´acil verificar que Confessar ´e uma estrat´egia estritamente dominante para os dois prisioneiros. Ela ´e a estrat´egia que gera o maior payoff para cada prisioneiro, qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) ´e um equil´ıbrio em estrat´egias estritamamente dominantes.

Observe que o equil´ıbrio (C, C) ´e Pareto dominado pelo conjunto de estrat´egias (N C, N C), ou seja, cada jogador obt´em um payoff maior em (N C, N C) do que em (C, C). Temos, ent˜ao, um caso onde o comportamento individual maximizador dos agentes envolvidos resulta em um equil´ıbrio Pareto ineficiente. Logo, na presen¸ca de interdependˆencia estrat´egica, a intera¸c˜ao de jogadores cujo objetivo ´e maximizar o seu pr´oprio bem-estar pode levar a situa¸c˜oes Pareto-ineficientes.

Estrat´egias estritamente dominantes n˜ao s˜ao comuns. ´E comum situa¸c˜oes onde n˜ao existem estrat´egias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.

Exemplo 5: Observe que o jogo a seguir n˜ao possui nenhuma estrat´egia estritamente dominante:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5

(7)

Apesar de estrat´egias estritamente dominantes serem raras, podemos usar um conceito similar, de estrat´egia estritamente dominada, para eliminarmos estrat´egias que nunca devem ser escolhidas por qualquer jogador.

Defini¸c˜ao: Estrat´egia Estritamente Dominada. Uma estrat´egia ¯si ´e estritamente (ou

forte-mente) dominada para o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:

ui(ˆsi, s−i) > u1(¯si, s−i), para todo s−i ∈ S−i.

Dizemos que ˆsi domina estritamente ¯si.

Observe que uma estrat´egia estritamente dominante domina estritamente todas as outras es-trat´egias do jogador. Logo, todas as outras estrat´egias s˜ao estritamente dominadas pela estrat´egia estritamente dominante.

Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5

Para o jogador 1, a estrat´egia D ´e estritamente dominada pela estrat´egia U . Essa ´e a ´unica estrat´egia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin-armos essa estrat´egia do jogo, usando o argumento de que o jogador 1 nunca a escolher´a, j´a que U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos ent˜ao o seguinte jogo reduzido:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1

Para esse jogo reduzido, a estrat´egia M domina estritamente R, para o jogador 2. Eliminando a estrat´egia R, obtemos:

1↓ / 2 → L M

U 5, 2 4, 3 C 1, 4 3, 2

J´a para este novo jogo reduzido, a estrat´egia U domina estritamente C, para o jogador 1. Eliminando C, obtemos:

1↓ / 2 → L M

(8)

Finalmente, a estrat´egia L ´e estritamente dominada por M , para o jogador 2, neste ´ultimo subjogo. Por meio desse “procedimento de elimina¸c˜ao de estrat´egias estritamente dominadas (PEEED)”, obtivemos (U, M ) (isto ´e, o jogador 1 escolhe U , o jogador 2 escolhe M ) como solu¸c˜ao do jogo. Dizemos que (U, M ) ´e um equil´ıbrio obtido pela elimina¸c˜ao de estrat´egias estritamente dominadas (e que U e M s˜ao estrat´egias que sobrevivem ao PEEED).

A ideia do procedimento ´e, portanto, simples. Ele usa implicitamente a hip´otese de conhecimento comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos a solu¸c˜ao (U, M ), supomos implicitamente que o jogador 2 sabe que o jogador 1 ´e racional e nunca jogar´a a estrat´egia D. Como o jogador 1 sabe que o jogador 2 ´e racional e tamb´em que 2 sabe que ele ´e racional e nunca jogar´a D, ent˜ao o jogador 1 infere que 2 nunca jogar´a R. A continua¸c˜ao desse racioc´ınio permite concluir que (U, M ) ´e a solu¸c˜ao do jogo.

O problema com o PEEED ´e que ele tamb´em nem sempre leva a alguma solu¸c˜ao. No Exemplo 5 abaixo, n˜ao existe nenhuma estrat´egia estritamente dominada e, portanto, n˜ao conseguimos eliminar nenhuma estrat´egia do jogo usando o PEEED. Logo, n˜ao conseguimos fazer qualquer predi¸c˜ao mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou, pelo menos, o que n˜ao pode ser resultado).

Exemplo 6: Considere o jogo:

1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0

Para esse jogo, n˜ao existem nem estrat´egias estritamente dominantes nem estrat´egias estrita-mente dominadas.

Podemos enfraquecer as defini¸c˜oes de dominˆancia estrita, relaxando a exigˆencia de que o payoff seja sempre estritamente maior nas defini¸c˜oes acima, de modo a obter o seguinte conceito.

Defini¸c˜ao: Estrat´egia Fracamente Dominante. Uma estrat´egia ˆsi ∈ Si ´e fracamente

domi-nante para o jogador i se para toda estrat´egia si 6= ˆsi, si ∈ Si, valer que:

ui(ˆsi, s−i) ≥ ui(si, s−i), para todo si ∈ Si,

com desigualdade estrita para pelo menos um s−i.

Evidentemente, toda estrat´egia estritamente dominante ´e fracamente dominante, mas a volta n˜ao vale: no Exemplo 6 acima, as estrat´egias U de 1 e L de 2 s˜ao fracamente dominantes, mas n˜ao estritamente dominantes, j´a que para o jogador 1, quando 2 escolhe L, escolher U d´a payoff estritamente maior do que escolher D. Por´em se 2 escolhe R, ent˜ao o payoff para 1 ao escolher U ´e igual (e n˜ao maior) ao payoff que ele obt´em se escolher D. Note que racioc´ınio similar vale para o jogador 2, com rela¸c˜ao a sua estrat´egia L. Dizemos que (U, L) ´e um equil´ıbrio formado por estrat´egias fracamente dominantes.

Problema similar ao que ocorre com a no¸c˜ao de estrat´egias estritamente dominantes ocorre com o conceito de estrat´egias fracamente dominantes: pode ser que n˜ao exista solu¸c˜ao para o jogo em estrat´egias fracamente dominantes, como o Exemplo 6 ilustra.

(9)

Exemplo 7: Considere o seguinte jogo: E D C (2, 1) (3, 0) M (4, 0) (2, 1) B (4, 4) (3, 4) ´

E f´acil observar que n˜ao existe estrat´egia fracamente dominante para ambos os jogadores (apenas B ´e fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar o jogo acima, um relaxamento da no¸c˜ao de estrat´egia estritamente dominada.

Defini¸c˜ao: Estrat´egia Fracamente Dominada. Uma estrat´egia ¯si´e fracamente dominada para

o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:

ui(ˆsi, s−i) ≥ ui(¯si, s−i), para todo s−i ∈ S−i,

com desigualdade estrita para pelo menos um s−i. Dizemos ent˜ao que ˆsi domina fracamente ¯si.

Vamos aplicar um procedimento de elimina¸c˜ao de estrat´egias fracamente dominadas (PEEFD) ao jogo do exemplo 7 acima. Podemos fazˆe-lo de trˆes modos distintos:

1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D d˜ao o mesmo payoff para o jogador 2 e n˜ao podemos eliminar nenhuma dessas estrat´egias. Sobram ent˜ao (B, E) e (B, D) como poss´ıveis resultados do jogo.

2. Se eliminarmos primeiro C para o jogador 1, a estrat´egia E do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante, obtendo (B, D) (payoff (3,4)) como solu¸c˜ao.

3. Se eliminarmos primeiro M para o jogador 1, a estrat´egia D do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante, obtendo (B, E) (payoff (4,4)) como solu¸c˜ao.

Portanto, a ordem de elimina¸c˜ao das estrat´egias fracamente dominadas pode afetar a solu¸c˜ao obtida. Esta ´e uma caracter´ıstica ruim deste procedimento, pois a solu¸c˜ao do jogo pode mudar conforme a ordem de elimina¸c˜ao das estrat´egias. Este problema n˜ao ocorre quando eliminamos estrat´egias estritamente dominadas.

O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-gadores e da estrutura do jogo. Por´em, esses procedimentos n˜ao esgotam toda a for¸ca dessa hip´otese. Usando a hip´otese de conhecimento comum, podemos eliminar outras estrat´egias al´em das dominadas.

Defini¸c˜ao: Melhor Resposta. A estrat´egia ˆsi ´e a melhor resposta do jogador i `a estrat´egia ˆs−i

dos outros jogadores se:

(10)

Portanto, a estrat´egia ˆsi ´e a melhor resposta do jogador i para a estrat´egia ˆs−i dos outros

jo-gadores se ela for a ou uma das escolhas ´otimas de i quando ele acreditar que os outros jogadores ir˜ao selecionar a estrat´egia ˆs−i. Um jogador n˜ao deve escolher uma estrat´egia que nunca ´e uma

melhor resposta, pois neste caso n˜ao existe justificativa para o uso dessa estrat´egia. Observe que estrat´egias estritamente dominadas nunca s˜ao a melhor resposta. Podemos montar um procedi-mento de elimina¸c˜ao de estrat´egias que nunca s˜ao a melhor resposta, de modo similar ao PEEED. Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hip´otese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.

Defini¸c˜ao: Estrat´egias Racionaliz´aveis. As estrat´egias em Si do jogador i que sobrevivem

ao procedimento de elimina¸c˜ao de estrat´egias que nunca s˜ao a melhor resposta s˜ao chamadas racionaliz´aveis.

Uma estrat´egia racionaliz´avel pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estrat´egia com uma conjectura razo´avel sobre o comportamento dos outros jogadores (nenhum rival escolher´a uma estrat´egia n˜ao racionaliz´avel).

´

E poss´ıvel mostrar que as seguintes afirma¸c˜oes s˜ao verdadeiras:

• A ordem de remo¸c˜ao das estrat´egias que nunca s˜ao a melhor resposta n˜ao altera o resultado obtido;

• Cada jogador tem pelo menos uma estrat´egia racionaliz´avel, podendo ter mais de uma; • O conjunto de estrat´egias racionaliz´aveis est´a contido no conjunto de estrat´egias que

sobre-vivem ao PEEED;

• Para jogos com dois jogadores, o conjunto de estrat´egias racionaliz´aveis ´e igual ao conjunto de estrat´egias que sobrevivem ao PEEED.

Por´em, o conceito de estrat´egia racionaliz´avel nem sempre fornece uma solu¸c˜ao. Para o Exemplo 3, a batalha dos sexos, todas as estrat´egias s˜ao racionaliz´aveis e, portanto, o conceito n˜ao informa nada sobre o que esperar como solu¸c˜ao deste jogo. Queremos tornar as predi¸c˜oes sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equil´ıbrio de Nash (EN), que, satisfeitas certas condi¸c˜oes, sempre aponta pelo menos uma solu¸c˜ao para qualquer jogo na forma estrat´egica. Esse ´e o mais importante conceito em teoria dos jogos.

(11)

2.3

Equil´ıbrio de Nash

O m´aximo que podemos desenvolver usando apenas a hip´otese de conhecimento comum ´e o conceito de estrat´egias racionaliz´aveis, visto acima. Para obtermos qualquer outro conceito mais robusto, temos que adicionar alguma hip´otese nova.

Defini¸c˜ao: Equil´ıbrio de Nash em Estrat´egias Puras. Um conjunto de estrat´egias s∗ = (s∗1, . . . , s∗I) ´e um equil´ıbrio de Nash (EN) (em estrat´egias puras) para um determinado jogo se para todo jogador i, i = 1, . . . , I, valer que:

ui(s∗i, s ∗

−i) ≥ ui(si, s∗−i), para todo si ∈ Si.

Dizemos que um EN ´e estrito se as desigualdades acima forem estritas. Logo, em um EN estrito, n˜ao existe, para nenhum dos jogadores, nenhuma outra estrat´egia diferente da de equil´ıbrio que resulte em um payoff igual ao de equil´ıbrio, dado que os outros jogadores est˜ao selecionando as suas estrat´egias de equil´ıbrio.

Em um equil´ıbrio de Nash, a estrat´egia de cada jogador ´e a melhor resposta para as estrat´egias que s˜ao de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam corretos sobre suas conjecturas a respeito das estrat´egias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas.

O conceito de EN traz uma predi¸c˜ao mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estrat´egias s˜ao racionaliz´aveis, mas apenas (F, F ) e (C, C) s˜ao EN em estrat´egias puras. Vamos mostrar que (F, F ) ´e um EN estrito. Se 1 escolher F , ent˜ao 2 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F ´e a melhor resposta de 2 para a escolha de F feita por 1. De modo similar, se 2 escolher F , ent˜ao 1 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F ´e a melhor resposta de 1 para a escolha de F feita por 2. Isso mostra que (F, F ) ´e um EN estrito.

Usando um argumento similar, n˜ao ´e dif´ıcil observar que o jogo “Cara ou Coroa”, discutido no Exemplo 1 acima, n˜ao possui EN em estrat´egias puras. De modo geral, n˜ao podemos garantir a existˆencia de EN em estrat´egias puras. Intuitivamente, qualquer solu¸c˜ao do jogo “Cara ou Coroa” envolve ambos os jogadores escolhendo suas estrat´egias de modo imprevis´ıvel. Para formalizar essa possibilidade de randomiza¸c˜ao, vamos introduzir o conceito de estrat´egias mistas.

Defini¸c˜ao: Estrat´egias Mistas. Seja Si o conjunto de estrat´egias puras do jogador i. Uma

estrat´egia mista do jogador i ´e uma distribui¸c˜ao de probabilidade sobre Si, ou seja, uma fun¸c˜ao

σi : Si → [0, 1], que atribui uma probabilidade a cada estrat´egia pura do jogador i. Logo, temos

que:

0 ≤ σi(si) ≤ 1 , ∀si e

X

si∈Si

σi(si) = 1 .

O simplex de Si, representado por ∆Si, ´e o conjunto das estrat´egias mistas do jogador i. Este

conjunto inclui tamb´em as estrat´egias puras do jogador (estrat´egias mistas degeneradas), j´a que se σ(¯si) = 1 para alguma estrat´egia ¯si, ent˜ao isso significa que ¯si ´e escolhida com probabilidade 1.

(12)

Se os jogadores randomizarem suas estrat´egias, ent˜ao o resultado do jogo deixar´a de ser de-termin´ıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja σ = (σ1, σ2) uma cole¸c˜ao de estrat´egias mistas para os jogadores 1 e 2. A utilidade esperada

do jogador 1 (similar para 2) para o conjunto de estrat´egias mistas σ ´e calculada como: u1(σ1, σ2) =

X

s1∈S1,s2∈S2

[σ1(s1) × σ2(s2)] × u1(s1, s2)

Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estrat´egias mistas σ1 = (1/4◦Ca, 3/4◦

Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do

jogador 1 quando ele escolhe a estrat´egia σ1 e o jogador 2 escolhe a estrat´egia σ2 ´e:

u1(σ1, σ2) =

X

s1∈S1,s2∈S2

σ1(s1) × σ2(s2) × u1(s1, s2)

= σ1(Ca) × σ2(Ca) × u1(Ca, Ca) + σ1(Ca) × σ2(Co) × u1(Ca, Co)+

+ σ1(Co) × σ2(Ca) × u1(Co, Ca) + σ1(Co) × σ2(Co) × u1(Co, Co)

= 1 4× 2 3 × (−1) + 1 4 × 1 3× (+1) + 3 4× 2 3 × (+1) + 3 4 × 1 3 × (−1) = 1 6

Podemos estender imediatamente os conceitos de estrat´egias dominantes e dominadas, proced-imentos de elimina¸c˜ao e estrat´egias racionaliz´aveis, ao permitir que os jogadores possam escolher estrat´egias mistas, al´em de estrat´egias puras.

Defini¸c˜ao: Equil´ıbrio de Nash. Um conjunto de estrat´egias σ∗ = (σ∗1, . . . , σ∗I) ´e um equil´ıbrio de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que:

ui(σ∗i, σ ∗

−i) ≥ u1(σi, σ∗−i), para todo σi ∈ ∆Si.

A defini¸c˜ao acima de EN permite que os jogadores randomizem entre as estrat´egias puras. Logo, eles podem n˜ao somente escolher uma estrat´egia pura, mas tamb´em escolher uma estrat´egia que envolva v´arias estrat´egias puras, cada uma escolhida com determinada probabilidade. Observe que, em equil´ıbrio, a hip´otese de expectativas mutualmente corretas implica que cada jogador conhece o modo em que os outros jogadores est˜ao randomizando (as estrat´egias mistas escolhidas por seus rivais).

Pela defini¸c˜ao de EN com estrat´egias mistas, para cada conjunto de estrat´egias dos jogadores candidato a equil´ıbrio, devemos verificar se para cada jogador, a sua estrat´egia ´e de fato a melhor resposta para as estrat´egias dos outros jogadores que fazem parte do conjunto de estrat´egias can-didatas a equil´ıbrio. Considerando que existem infinitas estrat´egias mistas, este procedimento de cerifica¸c˜ao para determinar EN ´e invi´avel. Como fazemos ent˜ao para encontrar todos os equil´ıbrios de Nash? O teorema abaixo fornece uma resposta.

Teorema: Equivalˆencia de Defini¸c˜oes. As seguintes afirmativas s˜ao equivalentes: 1. (σ∗1, σ2∗) ∈ ∆(S1) × ∆(S2) ´e um equil´ıbrio de Nash;

2. Para todo jogador i, ui(σ∗1, σ2∗) = ui(si, σ∗−i), para todo si jogado com probabilidade positiva;

e ui(σ1∗, σ ∗

(13)

O teorema fornece um algoritmo para encontrar equil´ıbrios de Nash em estrat´egias mistas. Ele diz que em um EN em estrat´egias mistas, duas estrat´egias puras de um jogador que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que ser´a igual ao payoff obtido no equil´ıbrio. Esse resultado ´e consequˆencia de utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estrat´egias mistas. Caso existissem duas estrat´egias puras que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff maior do que o da outra, o jogador n˜ao deveria atribuir probabilidade positiva `a estrat´egia que lhe d´a o payoff mais baixo, pois isso reduziria o seu payoff de equil´ıbrio.

Ou seja, dadas as estrat´egias escolhidas em equil´ıbrio pelos outros jogadores, esse jogador ´e indiferente entre qualquer estrat´egia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estrat´egias puras lhe d˜ao um payoff igual ou maior do que qualquer outra estrat´egia que ele n˜ao escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador ´e fazer (σ1∗, σ∗2) um equil´ıbrio.

Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem-plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz abaixo essa situa¸c˜ao.

1↓ / 2 → Cara (β) Coroa (1 − β) Cara (α) −1, 1 1, −1 Coroa (1 − α) 1, −1 −1, 1

Pelo teorema acima, essas randomiza¸c˜oes s˜ao um EN se, e somente se: u1(Ca, σ2) = u1(Co, σ2) e u2(σ1, Ca) = u2(σ1, Co),

onde σ1 e σ2 representam as estrat´egias mistas dos jogadores 1 e 2, respectivamente. Portanto:

u1(Ca, σ2) = u1(Co, σ2) ⇒ −1 × β + 1 × (1 − β) = 1 × β − 1 × (1 − β) ⇒ β = 0,5

u2(σ1, Ca) = u2(σ1, Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5

Logo, σ1 = (1/2◦ Ca;1/2◦ Co) e σ2 = (1/2◦ Ca;1/2◦ Co) ´e um EN em estrat´egias mistas. Observe

que:

u1(Ca, σ2) = u1(Co, σ2) = u1(σ1, σ2) = 0

u2(σ1, Ca) = u2(σ1, Co) = u2(σ1, σ2) = 0 ,

(14)

2.4

Teorema de Existˆ

encia e Outros Resultados

Teorema de Existˆencia de Equil´ıbrio de Nash. Todo jogo finito na forma normal possui pelo menos um equil´ıbrio de Nash, assumindo que os jogadores possam usar estrat´egias mistas.

O Teorema de Existˆencia garante que para todo jogo na forma estrat´egica finito existir´a pelo menos um equil´ıbrio de Nash (EN). Logo o conceito de EN n˜ao ´e problem´atico no sentido que para qualquer jogo finito podemos garantir que existir´a uma solu¸c˜ao para ele, se usarmos o conceito de EN como solu¸c˜ao para o problema de interdenpedˆencia estrat´egica modelado no jogo.

A rela¸c˜ao entre equil´ıbrio de Nash e os conceitos de equil´ıbrio com estrat´egias dominantes ´e descrita pelos seguintes resultados:

1. Se existir equil´ıbrio em estrat´egias estritamente dominantes, ele ser´a ´unico e ser´a o ´unico EN do jogo. O mesmo vale para equil´ıbrios obtidos com o PEEED: se existir, ser´a ´unico e o ´unico EN do jogo.

2. Se existir equil´ıbrio em estrat´egias fracamente dominantes, ent˜ao ele ser´a um EN. Neste caso, pode ocorrer que exista outro EN, formado por estrat´egias fracamente dominadas. O Exemplo 6 acima ilustra esse caso, em que (D, R) ´e um EN formado por estrat´egias fracamente dominadas.

3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da ordem de elimina¸c˜ao adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele ser´a um EN.

Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6: 1↓ / 2 → L R

U 1, 1 0, 0 D 0, 0 0, 0

Esse jogo possui dois EN, dados por (U, L) e (D, R). N˜ao existe equil´ıbrio em estrat´egias estritamente mistas. O EN (U, L) ´e tamb´em equil´ıbrio em estrat´egias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (D, R) ´e um equil´ıbrio formado por estrat´egias fracamente dominadas e portanto n˜ao pode ser encontrado usando o PEEFD.

O Exemplo 6 acima mostra que podem existir equil´ıbrios de Nash formados por estrat´egias fracamente dominadas. O resultado de um jogo ser desse tipo ´e algo estranho, pois envolve cada jogador escolher uma estrat´egia para a qual existe outra op¸c˜ao que dar´a sempre um payoff maior ou igual, independentemente do que os outros jogadores fa¸cam. Existe um refinamento do EN para jogos na forma normal, chamado refinamento da m˜ao-trˆemula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equil´ıbrio ocorrer. O refinamento da m˜ao-trˆemula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estrat´egia a ser jogada. O EN ent˜ao ser´a chamado perfeito da m˜ao-trˆemula caso satisfa¸ca a condi¸c˜ao imposta pelo refinamento. No exemplo acima, apenas o EN (U, L) ´e perfeito da m˜ao-trˆemula.

Refinamentos do conceito de EN s˜ao direcionados para eliminar EN que por algum motivo n˜ao s˜ao considerados razo´aveis. Nesse caso, existir´a algum ou alguns EN que satisfazem o refinamento e algum ou alguns que n˜ao o satisfazem.

(15)

3

Jogos na Forma Extensiva

3.1

Introdu¸

ao

Sabemos que para descrevermos um jogo s˜ao necess´arios trˆes objetos: 1) os jogadores; 2) a regra do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva ´e a representa¸c˜ao mais adequada para situa¸c˜oes dinˆamicas.

Defini¸c˜ao Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma extensiva (ou forma sequencial ) em forma de ´arvore, onde em cada conjunto de informa¸c˜ao um jogador escolhe uma a¸c˜ao que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes propriedades:

• Se inicia em um ´unico n´o de decis˜ao, chamado n´o inicial. Logo, todo n´o do jogo que n˜ao ´e o n´o inicial ´e um sucessor deste n´o, no sentido que podemos descrever qualquer n´o a partir do n´o inicial mais uma s´erie de a¸c˜oes tomadas (a hist´oria ocorrida do jogo at´e aquele n´o); • Todo n´o do jogo, com exce¸c˜ao do n´o inicial (que n˜ao possui nenhum predecessor), tem um

´

unico n´o predecessor imediato;

• Nos n´os finais do jogo, nenhum jogador faz qualquer escolha (nenhuma a¸c˜ao pode ser tomada) e nestes n´os s˜ao especificados os payoffs do jogo para a forma de como o jogo foi jogado, descrita pela hist´oria do jogo narrada pelo n´o final considerado.

Defini¸c˜ao: Jogo de Informa¸c˜ao Perfeita. Um jogo ´e chamado de informa¸c˜ao perfeita se cada jogador observa perfeitamente todas as a¸c˜oes escolhidas por todos os jogadores que se moveram antes dele.

Em um jogo de informa¸c˜ao perfeita, cada n´o de decis˜ao constitui um conjunto de informa¸c˜ao por si s´o, j´a que todos os jogadores observam todas as decis˜oes tomadas anteriormente a qualquer momento que for jogar. Se um jogo n˜ao for de informa¸c˜ao perfeita, ent˜ao existe pelo menos um ponto do jogo em que algum jogador n˜ao sabe o que foi escolhido no momento anterior. Neste caso, unimos os n´os que fazem parte de um mesmo conjunto de informa¸c˜ao por um retˆangulo pontilhado, como ilustra o jogo `a direita na figura abaixo, indicando que existe (pelo menos) um conjunto de informa¸c˜ao que cont´em mais de um n´o de decis˜ao de um jogador, o que significa que este jogador n˜ao sabe exatamente em que n´o est´a do conjunto de informa¸c˜ao (ou seja, ele n˜ao observa a tomada de decis˜ao feita no n´o predessor imediato).

Jogo de Informa¸c˜ao Perfeita

t 1 E @ @ @ @ @ @ D t 2 2       r A A A A A A l  1   0        l A A A A AA r t  0   3  t t t t

Jogo de Informa¸c˜ao Imperfeita

t 1 E @ @ @ @ @@ D t 2       r A A A A A A l  1   0        l A A A A A A r t  0   3  t t t t

(16)

No jogo `a esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada n´o de decis˜ao de 2 forma um conjunto de informa¸c˜ao por si s´o. J´a no jogo `a direita da figura acima, o jogador 2 n˜ao observa se 1 escolhe E ou D, ou seja, os dois n´os de decis˜ao de 2 formam um ´unico conjunto de informa¸c˜ao.

Evidentemente, os n´os de decis˜ao que pertencem a um mesmo conjunto de informa¸c˜ao devem ser todos referentes ao mesmo jogador. Al´em disso, as a¸c˜oes que o jogador pode tomar em n´os de decis˜ao que est˜ao no mesmo conjunto de informa¸c˜ao devem ser iguais. Caso isso n˜ao ocorresse e existissem dois n´os de decis˜ao no mesmo conjunto de informa¸c˜ao, com a¸c˜oes n˜ao exatamente iguais, ent˜ao o jogador seria capaz de inferir em que n´o est´a, ao realizar que as a¸c˜oes dispon´ıveis naquele n´o s˜ao diferentes das a¸c˜oes do outro n´o. Portanto, n´os de decis˜ao que pertencem a um mesmo conjunto de informa¸c˜ao pertencem ao mesmo jogador e possuem exatamente as mesmas a¸c˜oes dispon´ıveis. Defini¸c˜ao: Jogo de Mem´oria Perfeita. Um jogo ´e de mem´oria perfeita quando nenhum jogador esquece o que j´a sabia (inclusive a¸c˜oes que j´a foram tomadas durante o desenrolar do jogo).

A ´arvore de jogo ilustrada na figura abaixo n˜ao apresenta mem´oria perfeita. Neste exemplo, o jogador 1, na terceira rodada, ap´os a sua escolha na primeira rodada e ap´os a escolha do jogador 2 na segunda rodada, n˜ao se lembra de sua pr´opria escolha feita na primeira rodada.

t 1             E H H H H H H H H H H H j D t 2 a @ @ @ @ @ @ R b t       a A A A A A A U b t 1       A A A A A A U l r l r l r l r t @ @ @ @ @ @ R t       A A A A A A U t       A A A A A A U

Finalmente, existe uma outra defini¸c˜ao, jogo de informa¸c˜ao completa, que se refere a jogos em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que n˜ao observem alguma tomada de decis˜ao (ou seja, um jogo de informa¸c˜ao completa pode ser de informa¸c˜ao imperfeita). J´a em um jogo de informa¸c˜ao incompleta, os jogadores podem n˜ao conhecer alguma informa¸c˜ao relevante sobre o tipo dos seus rivais, tais como as preferˆencias, as estrat´egias ou os payoffs dos outros jogadores. Um exemplo cl´assico de jogos de informa¸c˜ao incompleta refere-se a leil˜oes. Em um leil˜ao, cada participante n˜ao sabe qual ´e a valora¸c˜ao exata que os outros participantes atribuem ao objeto leiloado.

(17)

3.2

Rela¸

ao entre Forma Extensiva e Forma Normal

Um jogo representado na forma normal pode ser representado na forma extensiva sem am-biguidades? O contr´ario tamb´em ´e v´alido? Da forma extensiva para a forma normal sim, mas o contr´ario n˜ao ´e v´alido. A mesma forma normal pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representa¸c˜ao na forma normal, que se resume a representa¸c˜ao de um jogo do tipo “Cara ou Coroa” discutido no Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha ´e do jogador 1 e na segunda linha, do jogador 2.

Jogador 1 escolhe primeiro

t 1 Ca @ @ @ @ @ @ Co t 2       Co A A A A A A Ca  −1 1   1 −1        Ca A A A A AA Co t  1 −1   −1 1  t t t t

Jogador 2 escolhe primeiro

t 2 Ca @ @ @ @ @@ Co t 1       Co A A A A A A Ca  −1 1   1 −1        Ca A A A A A A Co t  1 −1   −1 1  t t t t

A forma normal ´e uma estrutura mais simples do que a forma extensiva. Ela envolve menos objetos matem´aticos do que a forma extensiva, porque a estrat´egia do jogador pode condensar uma quantidade enorme de informa¸c˜ao sobre a tomada de decis˜ao do jogador. Logo, encontrar a representa¸c˜ao na forma normal do jogo analisado pode tornar mais f´acil a determina¸c˜ao dos EN de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estrat´egia para um jogo na forma extensiva.

A defini¸c˜ao de estrat´egia para jogos simultˆaneos ´e simples e direta. No caso de jogos sequenciais, a defini¸c˜ao de estrat´egia ´e mais elaborada, j´a que nesses jogos, um determinado jogador pode ter v´arios momentos de escolha de a¸c˜oes ao longo do jogo. Por exemplo, em xadrez, as jogadas dos dois jogadores se alternam ao longo da partida.

Uma estrat´egia de um jogador para jogos sequenciais ´e uma regra que determina a escolha de a¸c˜ao em todos os conjuntos de informa¸c˜ao desse jogador no jogo. Logo, uma estrat´egia para o jogador i ´e um plano contingente completo: uma regra de decis˜ao que especifica como o jogador i jogar´a em toda e qualquer circunstˆancia do jogo em que ele possa vir a jogar. Isso significa que uma estrat´egia define a¸c˜oes para todos os conjuntos de informa¸c˜ao do jogo, mesmo que esses conjuntos de informa¸c˜ao n˜ao sejam alcan¸cados durante o jogo.

(18)

Exemplo 8. Suponha o seguinte jogo sequencial: t 1 E @ @ @ @ @ @ D t 2 2       r A A A A A A l  6 4   10 10        f A A A A A A g t  0 0   14 8 

Como o jogador 1 s´o possui um conjunto de informa¸c˜ao, dado pelo n´o de decis˜ao inicial, onde as a¸c˜oes dispon´ıveis s˜ao E e D, ent˜ao 1 possui apenas duas estrat´egias: E e D. J´a o jogador 2 possui dois conjuntos de informa¸c˜ao distintos: 1) o n´o de decis˜ao alcan¸cado quando 1 escolhe E, que vamos denotar por x1, e onde 2 pode escolher as a¸c˜oes l ou r; e 2) o n´o de decis˜ao alcan¸cado quando

1 escolhe D, que vamos denotar por x2, e onde 2 pode escolher as a¸c˜oes f ou g. Portanto, uma

estrat´egia para o jogador 2 pode ser descrita como (l em x1, g em x2), ou de modo mais simples,

(l, g). Essa estrat´egia significa que o jogador 2 escolhe l em x1 e g em x2. Fica claro ent˜ao que

uma estrat´egia define a¸c˜oes em todos os pontos do jogo. Isto pode parecer desnecess´ario `a primeira vista, mas para computarmos os EN, ´e importante que a estrat´egia seja completa nesse sentido.

Portanto, o conjunto das estrat´egias do jogador 2 ´e formado por (l, f ), (l, g), (r, f ), (r, g). Logo, o jogador 2 possui 22 = 4 estrat´egias (2 ´e o n´umero de a¸c˜oes em cada conjunto de informa¸c˜ao, e 2 tamb´em ´e o n´umero de conjuntos de informa¸c˜ao do jogador 2).

Para determinarmos todos os equil´ıbrios de Nash em estrat´egias puras de um jogo na forma sequencial, o ideal ´e encontramos a representa¸c˜ao do jogo na forma normal. O primeiro passo para isso ´e encontrar as estrat´egias de cada jogador.

No Exemplo 8 acima, vimos que o jogador 2 possui 4 estrat´egias e o jogador 1 possui 2 es-trat´egias. Obtemos ent˜ao a seguinte matriz de dimens˜ao 2 por 4 para a representa¸c˜ao desse jogo na forma normal:

1↓ / 2 → (l, f ) (l, g) (r, f ) (r, g) E 6, 4 6, 4 10, 10 10, 10 D 0, 0 14, 8 0, 0 14, 8

Preenchemos os payoffs na matriz usando a representa¸c˜ao em forma de ´arvore do jogo. Por exemplo, se 2 escolheu E e 2 escolheu (l, f ), ent˜ao o payoff resultante ser´a (6, 4). J´a se 1 escolher D e 2 escolher (l, f ), ent˜ao percebemos que a a¸c˜ao importante definida na estrat´egia de 2 quando 1 escolhe D ´e a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0).

Uma vez obtida a representa¸c˜ao na forma normal do jogo, ´e f´acil obter os EN em estrat´egias puras do jogo, que s˜ao trˆes: (E; (r, f )), (D, (l, g)) e (D, (r, g)).

(19)

Veremos agora que alguns tipos de jogos possuem uma dinˆamica de a¸c˜oes escolhidas em tempos diferentes de tal modo que represent´a-los na forma normal e da´ı encontrarmos os EN pode n˜ao ser adequado, no sentido de que alguns destes EN n˜ao constituem solu¸c˜ao razo´avel para a intera¸c˜ao estrat´egica modelada. Mais especificamente, quando derivamos a forma normal associada a um jogo sequencial e encontrarmos os EN do jogo, alguns destes equil´ıbrios podem n˜ao ser cr´ıveis, ou seja, baseados em amea¸cas de um dos jogadores que n˜ao ser´a cumprida caso tivesse que de fato ser levada a cabo. O exemplo a seguir ilustra esse problema.

Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo-nopolista mant´em o mercado amea¸cando firmas entrantes de uma guerra de pre¸cos. Desse modo, o monop´olio mant´em seu lucro. Por´em, se alguma firma de fato entrar neste mercado, a melhor estrat´egia para o monopolista ´e formar um cartel e dividir o lucro de monop´olio, j´a que a guerra de pre¸cos traria preju´ızos n˜ao somente para a firma entrante, mas tamb´em para o incumbente. Essa situa¸c˜ao estrat´egica ´e representada pelo seguinte jogo na forma extensiva.

t Entrante N˜ao Entra @ @ @ @ @ @ R Entra  0 20  tMonopolista  −5 −5   10 10  Briga @ @ @ @ @ @ R Acomoda

A representa¸c˜ao na forma normal do jogo sequencial acima ´e:

Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar

N˜ao entra 0,20 0,20

Entra -5,-5 10,10

Existem dois EN em estrat´egias puras para o jogo:

1. firma entrante (E) Entra; monopolista (M ) Acomoda, se E entrar, e 2. firma entrante N˜ao entra; monopolista Briga se E entrar.

O segundo EN ´e baseado em uma amea¸ca vazia, n˜ao-cr´ıvel : M faz uma amea¸ca, que se for levada a s´erio, n˜ao precisar´a ser cumprida, pois nesse caso E ter´a escolhido n˜ao entrar. Por´em, se E decidir entrar no mercado, o melhor para M ser´a se acomodar. O refinamento de perfei¸c˜ao em subjogos, que veremos a seguir, tenta eliminar EN baseados em amea¸cas n˜ao cr´ıveis, por n˜ao serem uma solu¸c˜ao razo´avel para a intera¸c˜ao estrat´egica modelada.

(20)

3.3

Equil´ıbrio de Nash Perfeito em Subjogos (ENPS)

Jogos de Informa¸c˜ao Perfeita

Vamos analisar jogos de informa¸c˜ao perfeita primeiro. O objetivo ´e desenvolver um conceito de equil´ıbrio que elimine equil´ıbrios baseados em estrat´egias n˜ao-cr´ıveis, como no Exemplo 8 acima, onde o ideal seria obter (Entra, Ac se E entrou) como ´unica solu¸c˜ao da intera¸c˜ao estrat´egica descrita. Portanto, queremos refinar o conceito de EN de modo que as solu¸c˜oes do jogo ainda sejam EN, mas eliminando os EN baseados em estrat´egias que envolvam amea¸cas n˜ao-cr´ıveis. O Princ´ıpio da Racionalidade Sequencial (PRS), que exige que a estrat´egia de um jogador qualquer deve especificar a¸c˜oes que s˜ao ´otimas em cada ponto do jogo, ´e fundamental para obtermos esse refinamento.

Esse princ´ıpio ´e implementado em um jogo de informa¸c˜ao perfeita pelo seguinte Algoritmo de Indu¸c˜ao Reversa (“backward induction algorithm”):

1. Comece pelos n´os de decis˜ao finais da ´arvore (“n´os pen´ultimos” – n´os cujos sucessores s˜ao todos n´os terminais);

2. Determine a escolha ´otima dos jogadores que jogam nesses n´os (problema de maximiza¸c˜ao individual, sem intera¸c˜ao estrat´egica);

3. Redesenhe a ´arvore, substituindo os n´os de decis˜ao final por um n´o terminal, com payoff definido pela escolha ´otima no passo 2);

4. Repita passos 1), 2) e 3) para esse jogo reduzido, at´e chegar ao n´o inicial do jogo.

A solu¸c˜ao de indu¸c˜ao reversa para jogos com informa¸c˜ao perfeita se resume a que todos os jogadores fa¸cam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na pr´atica, o jogo ´e resolvido do fim para o come¸co. O conjunto de estrat´egias puras s = (s1, s2, . . . , sI) ´e um

conjunto de estrat´egias de indu¸c˜ao reversa para um jogo na forma extensiva se tiver sido obtido de acordo com o algoritmo de indu¸c˜ao reversa. ´E poss´ıvel mostrar que todo conjunto de estrat´egias de indu¸c˜ao reversa ´e um EN do jogo.

Resultado: Existˆencia de Equil´ıbrio. Todo jogo na forma extensiva finito de informa¸c˜ao perfeita tem um EN em estrat´egias puras, que pode ser encontrado usando indu¸c˜ao reversa. Se os payoffs de cada jogador forem diferentes nos n´os terminais, para todos os jogadores, ent˜ao existir´a um ´unico EN que pode ser encontrado usando indu¸c˜ao reversa.

Corol´ario. Todo jogo finito de informa¸c˜ao perfeita tem (pelo menos) um EN em estrat´egias puras. Exemplo 8: Monopolista e Firma Entrante (continua¸c˜ao). No jogo Monopolista/Entrante, existem dois EN em estrat´egias puras, mas apenas um EN obtido usando o algoritmo de indu¸c˜ao reversa. O algoritmo elimina exatamente o EN baseado na amea¸ca n˜ao-cr´ıvel do monopolista abrir uma guerra de pre¸cos caso o entrante decida entrar. Esta amea¸ca n˜ao ´e cr´ıvel pois uma vez que a firma entrante entrar no mercado, se o monopolista fizer uma guerra de pre¸cos, ele pr´oprio se prejudicar´a sem obter nenhum ganho.

Logo, todo conjunto de estrat´egias obtido usando o algoritmo de indu¸c˜ao reversa acima ´e um EN do jogo. Mas nem todo EN do jogo pode ser obtido por indu¸c˜ao reversa. Os EN que podem ser obtidos utilizando o algoritmo s˜ao chamados EN perfeitos em subjogos (ENPS), ou EN que satisfazem o crit´erio de perfei¸c˜ao em subjogos.

(21)

Jogos de Informa¸c˜ao Imperfeita

O algoritmo de indu¸c˜ao reversa acima s´o se aplica para jogos de informa¸c˜ao perfeita. Por´em a ideia de racionalidade sequencial pode ser usada tamb´em para jogos de informa¸c˜ao incompleta, por meio de um algoritmo similar de indu¸c˜ao reversa.

A ideia central ´e definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser visto como um jogo por si s´o. A propriedade de racionalidade sequencial exige que um EN seja EN para cada subjogo do jogo original.

Defini¸c˜ao: Subjogo. Um subjogo de um jogo Γ na forma extensiva ´e um subconjunto do jogo tal que:

(i) Se inicia em um conjunto de informa¸c˜ao que cont´em apenas um ´unico n´o de decis˜ao, e cont´em todos os n´os sucessores desse n´o inicial;

(ii) Se o n´o de decis˜ao y pertence ao subjogo, ent˜ao todo n´o z que pertence ao conjunto de informa¸c˜ao de y tamb´em pertence ao subjogo.

Todo jogo possui pelo menos um ´unico subjogo, que seria o pr´oprio jogo. Este ´e o caso do exemplo abaixo. Um subjogo estrito de um jogo ´e um subjogo que est´a contido de modo estrito no jogo, ou seja, ´e diferente (“menor”) que o jogo inteiro.

u 1 E @ @ @ @ @ @ D u 2       r A A A A A A l  1 3   0 0        l A A A A A A r u  0 0   3 1  u u u u

Defini¸c˜ao: ENPS em Estrat´egias Puras. O conjunto de estrat´egias s = (s1, s2, . . . , sI) do jogo

Γ ´e um equil´ıbrio de Nash perfeito em subjogos (ENPS) se s = (s1, s2, . . . , sI) induz um equil´ıbrio

de Nash em todo subjogo de Γ.

ENPS ´e um refinamento de EN: todo ENPS ´e um EN, j´a que o pr´oprio jogo ´e um subjogo seu. O contr´ario n˜ao ´e v´alido: existem EN que n˜ao s˜ao perfeitos em subjogos.

Teorema. Para todo jogo na forma extensiva finito de informa¸c˜ao perfeita, o conjunto de es-trat´egias de indu¸c˜ao reversa ´e igual ao conjunto de ENPS em estrat´egias puras.

Logo, em jogos de informa¸c˜ao perfeita, o conjunto de ENPS coincide com o conjunto de EN obtido usando o algoritmo de indu¸c˜ao reversa visto acima. Por´em, considerando jogos de informa¸c˜ao imperfeita, nem todo jogo possui um ENPS em estrat´egias puras. O teorema a seguir garante a

(22)

Teorema: Existˆencia de ENPS (Selten). Todo jogo na forma extensiva finito com mem´oria perfeita possui um ENPS.

A hip´otese de mem´oria perfeita ´e necess´aria. Existem exemplos de jogos de mem´oria imperfeita que n˜ao possuem ENPS.

O seguinte algoritmo geral de indu¸c˜ao reversa para jogos na forma extensiva, sejam de in-forma¸c˜ao completa ou n˜ao, ´e v´alido para encontrar os ENPS:

1. Comece pelo t´ermino da ´arvore, determine os EN para todos os subjogos finais (subjogos que n˜ao possuem nenhum subjogo estrito);

2. Substitua cada subjogo pelo payoff de um de seus EN;

3. Repita os passos 1) e 2) para o jogo reduzido, continue at´e n˜ao restar nenhum subjogo; 4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um

EN).

Para jogos de informa¸c˜ao perfeita, esse algoritmo ´e igual ao algoritmo anterior.

3.4

Jogos Repetidos

Em um jogo do tipo dilema dos prisioneiros, seria poss´ıvel obter coopera¸c˜ao se repet´ıssemos o jogo diversas vezes? Com a repeti¸c˜ao, o n´umero de estrat´egias de cada jogador aumenta. Nesse caso, ´e poss´ıvel criar estrat´egias em que um jogador puna o seu rival caso ele n˜ao coopere.

Vamos ent˜ao analisar novamente o Dilema dos Prisioneiros (Exemplo 2): 1↓ / 2 → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2

Suponha que o jogador 1 adote a seguinte estrat´egia: na primeira intera¸c˜ao ele joga N C (co-operar). Nos per´ıodos seguintes, se o outro jogador escolheu N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contr´ario, o jogador 1 escolhe C (n˜ao cooperar) at´e o jogo terminar. Essa estrat´egia pode levar a algum tipo de coopera¸c˜ao? Mais especificamente, existe algum equil´ıbrio tal que os jogadores venham a adotar estrat´egias cooperativas? Para jogos do tipo dilema dos prisioneiros repetidos finitas vezes, a resposta ´e negativa. Para jogos repetidos indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva .

A no¸c˜ao de ENPS tem como consequˆencia que se o dilema dos prisioneiros for repetido um n´umero fixo (finito) de vezes, o ´unico equil´ıbrio de Nash perfeito em subjogos ser´a formado pelo EN do jogo em cada per´ıodo sendo jogado. Logo, n˜ao ´e poss´ıvel obter o resultado eficiente com a repeti¸c˜ao finita do jogo. Isso implica que qualquer dependˆencia hist´orica nas estrat´egias atuais ´e eliminada. Ou seja, tudo o que ocorreu antes ´e irrelevante para decidir o que fazer hoje. Para jogos que satisfa¸cam as condi¸c˜oes da proposi¸c˜ao, um ENPS n˜ao depende da hist´oria ocorrida no jogo em nenhum momento.

(23)

Por exemplo, uma consequˆencia desse fato ´e que se o dilema dos prisioneiros for jogado repeti-damente, por um per´ıodo determinado, continua sempre tendo a mesma solu¸c˜ao n˜ao cooperativa entre os jogadores, para cada rodada do jogo. Esse resultado segue da hip´otese de racionalidade sequencial. Por indu¸c˜ao reversa, na ´ultima rodada, ´e melhor n˜ao cooperar. Resolvendo de traz para diante, obtemos n˜ao-coopera¸c˜ao para todas as rodadas do jogo.

Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de t´ermino conhecida pelos jogadores. Resolvendo o jogo por indu¸c˜ao reversa, cada jogador percebe que o seu rival ir´a descumprir o acordo de coopera¸c˜ao na ´ultima vez que interagirem. Eles se adiantam a isso e n˜ao cooperam na ´ultima rodada. Sabendo disso, os jogadores tamb´em n˜ao ir˜ao cooperar na pen´ultima rodada do jogo. Usando esse argumento, obtemos que os jogadores n˜ao cooperam em nenhuma rodada do jogo. Esse argumento, consequˆencia da defini¸c˜ao de ENPS, leva a resultados considerados pouco razo´aveis, como mostra o Exemplo 9 abaixo, em que o ´unico ENPS consiste nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).

Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo.

s I C P  1 1  s II C P  0 3  I C P s  2 2  s II C P  1 4  . . . ...sII C s P  97 100   99 99  s s I C P II C P  98 101  (100 100)

Para o jogo da centopeia, o ´unico ENPS consiste em todo jogador escolher P em todo momento do jogo. Portanto, o payoff de equil´ıbrio ´e 1 para cada jogador, e nenhuma coopera¸c˜ao ´e obtida.

Por´em, se o dilema dos prisioneiros for repetido infinitamente (ou se n˜ao tiver uma data fixa para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equil´ıbrio, dependendo do quanto os jogadores descontem o futuro.

As estrat´egias que levam a esse tipo de equil´ıbrio s˜ao chamadas estrat´egias gatilho (trigger ou Nash-reversion strategies). Um exemplo ´e a estrat´egia “olho-por-olho” (tit-for-tat), onde a estrat´egia de hoje do jogador ´e igual `a estrat´egia usada pelo seu advers´ario ontem.

Considere a seguinte estrat´egia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na primeira intera¸c˜ao ele joga N C (cooperar). Nos per´ıodos seguintes, se o outro jogador escolher N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contr´ario, o jogador i escolhe C (n˜ao cooperar) para sempre (note que a estrat´egia ´e extremamente punitiva: um desvio do rival e nunca mais a coopera¸c˜ao pode ser refeita). Suponha que a taxa de desconto intertemporal ´e 0 < δ < 1. Temos que o jogador 2 cooperar´a se:

∞ X t=0 −2δt≥ −1 + ∞ X t=1 −3δt ⇒ −2 1 − δ ≥ −1 + −3δ 1 − δ Logo, se: δ ≥ 1 2 = 50% ,

(24)

Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do equil´ıbrio cooperativo e seguindo o equil´ıbrio cooperativo, podem existir equil´ıbrios em que os jogadores adotem estrat´egias que envolvem coopera¸c˜ao. Esse resultado ´e conhecido como “Folk Theorem”.

Como a taxa de desconto intertemporal δ ´e determinada pela taxa de juros r do seguinte modo: δ = 1

1 + r,

ent˜ao uma vez determinada a taxa de desconto intertemporal, podemos tamb´em encontrar a taxa de juros associada. Para o exemplo acima, temos que r ≥ 1.

Leitura Sugerida

• Varian, cap´ıtulos 28 (A Teoria dos Jogos) e 29 (Aplica¸c˜oes da Teoria dos Jogos). • Nicholson e Snyder, cap´ıtulo 8 (Strategy and Game Theory).

(25)

Exerc´ıcios

1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula:

a) As estrat´egias estritamente dominantes e as estrat´egias estritamente dominadas, quando existirem.

b) As estrat´egias fracamente dominantes e as estrat´egias fracamente dominadas, quando existirem.

c) As estrat´egias que nunca s˜ao melhor resposta e as estrat´egias racionaliz´aveis.

d) Considere todo par de estrat´egias para cada um desses jogos e verifique quais s˜ao equil´ıbrios de Nash e quais n˜ao s˜ao, justificando pelo alguns desses pares para fim de aprendizagem (se vocˆe ainda estiver com dificuldades, continue escrevendo a justifica-tiva, at´e entender bem a l´ogica de se determinar um equil´ıbrio de Nash em estrat´egias puras).

e) Determine os equil´ıbrios de Nash que possuem de fato uma randomiza¸c˜ao ocorrendo para os exemplos 3 (problema de coordena¸c˜ao) e 4 (batalha dos sexos).

f) Procure determinar se existe algum EN com randomiza¸c˜ao para o jogo dilema dos pri-sioneiros. Quais s˜ao os valores para as probabilidades encontradas? O que isso significa? 2. Argumente, de maneira clara e concisa, porque a ordem de elimina¸c˜ao das estrat´egias n˜ao

afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.

3. Vimos a defini¸c˜ao de dominˆancia para estrat´egias puras. Estrat´egias mistas podem tamb´em dominar estrat´egias puras ou mesmo outras estrat´egias mistas. Considere o seguinte jogo e responda os itens a seguir.

1/2 L M R

U 3,0 0,-3 0,-4 D 2,4 4,5 -1,8

a) Mostre que as estrat´egias puras L e R n˜ao dominam estritamente a estrat´egia pura M . b) Mostre que M ´e estritamente dominada pela estrat´egia mista em que 2 escolhe L e R

com probabilidades iguais.

4. Calcule os EN dos seguintes jogos e verifique se existe alguma rela¸c˜ao desses equil´ıbrios com equil´ıbrios obtidos por meio de algum argumento de dominˆancia:

a) 1/2 L R U 1,1 0,0 D 0,0 0,0 b) 1/2 L R U 1,1 0,1

(26)

c)

1/2 L l m M

U 1,1 1,2 0,0 0,0

C 1,1 1,1 10,10 -10,-10 D 1,1 -10,-10 10,-10 1,-10

5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto seria uma oferta aceit´avel. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja, R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo ´e igual ou maior do que o que Rafael acha aceit´avel, ent˜ao eles dividem o dinheiro seguindo a oferta de Paulo. Caso contr´ario, o dinheiro ´e jogado fora. A utilidade de cada jogador ´e dada pelo tanto de dinheiro que ele recebe.

a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial). b) Quais s˜ao o(s) equil´ıbrio(s) de Nash em estrat´egias puras desse jogo?

6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.

D C

D (R$1, R$1) (R$3, R$0) C (R$0, R$3) (R$2, R$2)

a) Suponha que cada jogador deseja apenas obter o m´aximo de dinheiro poss´ıvel. Quais s˜ao os EN desse jogo?

Suponha agora que os dois jogadores s˜ao altru´ıstas, ou seja, cada um deles se importa com o bem-estar do rival. Em particular, se mi(s1, s2) ´e o payoff que o jogador i ganha e mj(s1, s2)

´e o payoff do jogador j, quando a estrat´egia jogada ´e (s1, s2), ent˜ao a utilidade do jogador i

´e dada por ui(s1, s2) = mi(s1, s2) + αmj(s1, s2), onde α ≥ 0.

b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo do tipo dilema dos prisioneiros?

c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores de α para os quais o jogo n˜ao ´e mais um dilema dos prisioneiros, encontre os EN. d) Existe algum valor de α para o qual qualquer combina¸c˜ao de estrat´egias puras ser´a um

equil´ıbrio?

7. Considere o jogo denotado por G(n, k) de adivinhar a m´edia (“guessing the average”, Osborne e Rubinstein), onde k ´e a quantidade de participantes que simultanemente escolhe um n´umero inteiro entre 1 e n (inclusive 1 e n). Um prˆemio de R$60 ´e dividido igualmente entre os jogadores que escolheram o n´umero mais perto da metade da m´edia de todas as escolhas (ou seja, se a metade da m´edia foi 3, e os n´umero mais pr´oximos foram 2 e 4, os participantes que escolheram esses valores dividem o prˆemio. J´a se a metade da m´edia foi 3,3, todos os participantes que escolheram 3 levam o prˆemio)

a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.

b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 ´e um EN. c) Argumente que em qualquer EN o prˆemio ´e dividido por todos os participantes. d) Argumente que o conjunto de estrat´egias descrito no item b) ´e o ´unico EN.

(27)

8. O ex´ercito de Pat´opolis deve decidir se ataca ou n˜ao o ex´ercito de Gans´opolis, que est´a ocupando uma ilha que pertencia `a Pat´opolis, situada entre as duas cidades. No caso de um ataque, o ex´ercito de Gans´opolis pode lutar ou recuar de volta `a sua cidade, por meio de uma ponte que liga a ilha `a cidade. Cada cidade prefere ocupar a ilha a n˜ao ocup´a-la, e uma guerra ´e o pior resultado poss´ıvel para ambas as cidades. Modele essa situa¸c˜ao como um jogo na forma extensiva e mostre que o ex´ercito de Gans´opolis pode melhorar seu payoff se queimar a ponte que liga a ilha `a sua cidade, eliminando a op¸c˜ao de recuar. Explique esse resultado em termos intuitivos e relacione com o que foi visto em aula.

9. Considere o seguinte jogo na forma extensiva:

t 1 E  2 2  M @ @ @ @ @ @ D t 2       r A A A A A A l  3 1   1 0        l A A A A A A r t  0 0   0 1  t t t t

a) Escreva o conjunto de estrat´egias desse jogo e encontre a forma estrat´egica associada. b) Encontre os EN em estrat´egias puras.

c) Encontre os ENPS em estrat´egias puras.

10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parˆenteses ´e do jogador 1 e o payoff na parte inferior ´e do jogador 2. Reponda aos itens abaixo.

 2 0  v 1 E @ @ @ @ @ @ @@R S -D v 2 r @ @ @ @ @ @ R l ? m  1 3   1 2   4 0  l @ @ @ @ @ @ R r ? m v  4 0   0 2   3 3 

a) Descreva os conjuntos de estrat´egias dos dois jogadores. b) Qual a representa¸c˜ao desse jogo na forma normal?

c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?

(28)

11. (P2-1/19) Considere o seguinte jogo na forma extensiva: r I ? L           M H H H H H H H HHj R  0 2  r II r II a @ @ @ @ @ @ R b  1 1   −1 −1   −2 4  c @ @ @ @ @ @ R d r r I r P @ @ @ @ @ @ R Q  −1 3   −1 5 

As a¸c˜oes do jogador I est˜ao representadas por letras mai´usculas e as a¸c˜oes do jogador II por letras min´usculas. O payoff na parte superior em parˆenteses ´e do jogador I e o payoff na parte inferior ´e do jogador II.

a) Qual o n´umero de estrat´egias puras do jogador 1? E do jogador 2? b) Qual a representa¸c˜ao desse jogo na forma normal?

c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?

d) Quais s˜ao os equil´ıbrios de Nash (EN) em estrat´egias puras desse jogo? e) Quais s˜ao os EN perfeito em subjogos (em estrat´egias puras)?

12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de cima do vetor de payoffs ´e o da firma entrante e o payoff na parte de baixo desse vetor ´e o da firma monopolista. s Entrante ˜ nE @ @ @ @ R E 0 60 sMonopolista ˜ nL @ @ @ @ R L s Entrante     GE A A A A U PE 8 30 15 15     PE A A A A U GE s −3 0 −12 −6

a) Determine os conjuntos de todas as estrat´egias para os dois jogadores. b) Encontre os EN em estrat´egias puras do jogo.

c) Encontre os ENPS do jogo.

d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo-nopolista escolheu ˜nL ou L. Descreva todas as estrat´egias que a firma Entrante possui agora.

(29)

13. (P4-1/19) Considere o seguinte jogo na forma extensiva: v Jog. 1 A @ @ @ @ @ @ @@ B v Jog. 2 Jog. 2         D A A A A A A AA F  2 0          D A A A A A A AA F  0 1  v Jog. 1 v      A A A A A L  3 10  R  0 1  v      A A A A A L  3 0  R  1 1 

onde o payoff na parte superior em parˆenteses ´e do jogador 1 e o payoff na parte inferior em parˆenteses ´e do jogador 2.

a) Descreva as estrat´egias dos jogadores.

b) Derive a forma normal do jogo e encontre todos os equil´ıbrios de Nash (EN) do jogo em estrat´egias puras.

c) Encontre todos os equil´ıbrios de Nash perfeitos em subjogos (ENPS) em estrat´egias puras.

Referências

Documentos relacionados

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais

Na avaliação de comprimento da parte aérea e número de entrenós, não houve diferenças significativas para o fator ambiente de incubação e para a interação entre genótipos

Azt is fi gyelembe kell azonban venni, hogy a mozgáskoordináció zavarai és a látásromlás miatt a rajzok patológiásabbnak tűnhetnek, mint amit a vizsgált személy

a) O desempenho dos discentes que usam os instrumentos de apoio ao ensino e aprendizagem de algoritmos e programação de computadores selecionados superará o

Associação de Pais e Amigos dos Excepcionais.. A relativa “exclusividade” destas duas associações no acesso ao programa é alvo de muita controvérsia, dentro e fora do

A efetivação da inscrição do candidato implica o conhecimento das presentes disposições e a tácita aceitação das condições deste processo seletivo,

Neste sentido, esse estudo mostra que as famílias das camadas mé- dias cariocas são ao mesmo tempo “relacionais” e “individualistas”, pois na mesma medida em que as trocas

Assim, além de suas cinco dimensões não poderem ser mensuradas simultaneamente, já que fazem mais ou menos sentido dependendo do momento da mensuração, seu nível de