MICROECONOMIA 2 – GRADUAC
¸ ˜
AO
Departamento de Economia, Universidade de Bras´ılia
Notas de Aula 5 – Teoria dos Jogos
Prof. Jos´
e Guilherme de Lara Resende
1
Introdu¸
c˜
ao
1.1
Interdependˆ
encia Estrat´
egica
A teoria dos jogos permite modelar comportamentos estrat´egicos dos agentes econˆomicos. ´E o instrumento adequado quando existe interdependˆencia estrat´egica entre os agentes do modelo analisado.
No modelo de consumo usual, o consumidor decide entre poss´ıveis cestas de bens, dados os pre¸cos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produ¸c˜ao e dados os pre¸cos dos insumos e dos bens que vende. No modelo de equil´ıbrio geral competitivo, tanto os consumidores quanto as firmas tomam os pre¸cos como dados e n˜ao h´a intera¸c˜ao estrat´egica entre os agentes econˆomicos.
Por´em, existem situa¸c˜oes onde os resultados das a¸c˜oes de um agente dependem diretamente do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente depende n˜ao s´o da sua a¸c˜ao, mas da a¸c˜ao de outros agentes. Modelos de oligop´olio s˜ao um exemplo, em que o lucro de determinada firma depende do que suas rivais fazem.
Um jogo ent˜ao caracteriza qualquer situa¸c˜ao desse tipo, em que cada participante deve levar em conta a estrat´egia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo da teoria dos jogos ´e determinar o resultado de um jogo. Cada m´etodo de an´alise resulta em um conceito de solu¸c˜ao particular, chamado equil´ıbrio.
A maioria dos conceitos tem sua origem no conceito de equil´ıbrio de Nash e s˜ao, usualmente, equil´ıbrios de Nash que satisfazem certas propriedades. Por isso, s˜ao chamados refinamentos. Cada refinamento tenta solucionar alguma deficiˆencia do conceito de equil´ıbrio de Nash particular a alguma situa¸c˜ao ou modelo.
1.2
No¸
c˜
oes Preliminares
Defini¸c˜ao (informal): Jogo. Um jogo refere-se a qualquer situa¸c˜ao envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependˆencia estrat´egica.
Vamos estudar jogos n˜ao-cooperativos: analisamos cada agente separadamente e n˜ao como um grupo. Essa defini¸c˜ao n˜ao implica que um jogador n˜ao possa cooperar com o outro, ela ´e apenas de cunho metodol´ogico, onde cada agente ´e visto como uma entidade separada, autˆonoma, e n˜ao h´a grupos de agentes se comportando como um ´unico agente.
Para descrevermos um jogo ´e necess´ario conhecermos trˆes objetos: • Os jogadores,
• A regra do jogo,
• O resultado do jogo (payoff dos jogadores).
S˜ao feitas duas hip´oteses b´asicas sobre os jogadores:
1. Os jogadores s˜ao racionais. As a¸c˜oes de um jogador s˜ao consistentes com o objetivo desejado: maximizar o seu payoff.
2. Os jogadores s˜ao inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-seguem fazer as mesmas inferˆencias que realizamos sobre a situa¸c˜ao em que se encontram. A segunda hip´otese n˜ao ´e t˜ao in´ocua quanto parece. Na teoria de equil´ıbrio geral os indiv´ıduos s˜ao racionais, mas n˜ao ´e necess´ario que sejam inteligentes no sentido acima: os agentes econˆomicos n˜ao precisam conhecer toda a estrutura de teoria de equil´ıbrio geral ao tomarem suas decis˜oes.
As duas formas mais comuns de se representar um jogo s˜ao:
• Forma Estrat´egica: Representa¸c˜ao em forma matricial. Esta forma ´e adequada para situa¸c˜oes onde os jogadores se “movem” (decidem suas a¸c˜oes) simultaneamente (modelo est´atico). Tamb´em conhecida como forma normal.
• Forma Extensiva: Representa¸c˜ao em forma de ´arvore. Esta forma ´e adequada para situa¸c˜oes onde exista uma ordem cronol´ogica dos eventos do jogo (modelo dinˆamico). Tamb´em conhecida como forma sequencial.
Existe uma correspondˆencia entre essas duas formas, que veremos mais a frente. Vimos que o princ´ıpio b´asico de eficiˆencia usado em economia ´e o crit´erio de Pareto. Dizemos que o resultado A do jogo ´e Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar melhor em B do que em A.
Defini¸c˜ao: Um resultado de um jogo ´e Pareto ´otimo (ou eficiente de Pareto) se n˜ao ´e Pareto-dominado por nenhum outro resultado poss´ıvel para o jogo.
1.3
Conhecimento Comum
Uma hip´otese usada em teoria dos jogos ´e a de conhecimento comum (“common knowledge”), que assume que a racionalidade dos jogadores e a estrutura do jogo s˜ao de conhecimento comum de todo jogador.
Se considerarmos dois jogadores, um determinado fato ´e de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo racioc´ınio valendo para o jogador 2.
Essa hip´otese ´e fundamental para a validade de certos procedimentos, tais como os procedi-mentos de elimina¸c˜ao de estrat´egias dominadas. Mais ainda, ela ´e importante para o conceito de equil´ıbrio de Nash (existem artigos que relaxam a hip´otese de conhecimento comum, sob certas condi¸c˜oes).
Myerson argumenta que a hip´otese de jogadores inteligentes implica supor que a estrutura do jogo ´e de conhecimento comum desses jogadores. A formaliza¸c˜ao matem´atica dessa hip´otese ´e complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para entender a importˆancia dessa hip´otese.
Myerson cita uma f´abula que ilustra bem as implica¸c˜oes da hip´otese. Em uma vila, existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os homens da vila, exceto ao seu marido. Essas tradi¸c˜oes s˜ao de conhecimento comum de todos os habitantes da vila.
Suponha que todas as esposas foram infi´eis. Logo, cada homem sabia da infidelidade de todas as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa havia sido infiel. Qual foi o resultado dessa revela¸c˜ao?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de n´umero 100, todos se lamentaram. Tente entender porque a hip´otese de conhecimento comum leva a esse resultado. Para isso, ´e necess´ario compreender o que a informa¸c˜ao do visitante adicionou ao conhecimento dos homens da vila.
O racioc´ınio fica mais f´acil de compreender se considerarmos primeiro o caso em que apenas uma esposa traiu o marido. A informa¸c˜ao nova que o visitante revelou foi informar a todos da vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, n˜ao tinha conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciˆencia de que a sua esposa ´e que fora infiel e se lamentaria na primeira noite depois da revela¸c˜ao do visitante, j´a que os costumes da vila s˜ao de conhecimento comum de todos os seus habitantes.
Caso houvesse duas esposas infi´eis, ent˜ao 98 homens da vila saberiam que havia duas esposas infi´eis e 2 homens teriam conhecimento de apenas um caso de infidelidade, j´a que n˜ao saberiam que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ningu´em se lamentaria o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda noite, ap´os observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que tˆem conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam conta de que foram tra´ıdos e se lamentariam. O racioc´ınio estende-se de modo an´alogo para o caso de 100 esposas infi´eis: no cent´esimo dia, todos os maridos se dariam conta de que foram tra´ıdos e se lamentariam.
2
Jogos na Forma Estrat´
egica
2.1
Defini¸
c˜
oes e Exemplos de Jogos
Defini¸c˜ao: Jogo na Forma Estrat´egica (ou Forma Normal). Um jogo na forma estrat´egica ´e uma cole¸c˜ao G = (Si, ui)Ii=1, onde I ´e o n´umero de jogadores, Si ´e o conjunto de estrat´egias
dispon´ıveis ao jogador i, para todo i ∈ I, e ui :
QI
k=1Sk → R ´e a fun¸c˜ao de payoff (a utilidade)
do jogador i, que depende das estrat´egias de todos os jogadores. Dizemos que um jogo na forma normal ´e finito se o conjunto das estrat´egias Si ´e finito para todo i, i = 1, . . . , I.
Observe que a interdependˆencia estrat´egica entre os agentes aparece explicitamente na hip´otese de que o payoff de cada jogador ´e descrita pela fun¸c˜ao ui : S1× · · · × Si× · · · × SI → R, ou seja,
ui depende n˜ao apenas da estrat´egia si escolhida por i, mas tamb´em das estrat´egias de todos os
outros jogadores, s1, . . . , si−1, si+1, . . . , sI.
Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.
1↓ / 2 → Cara Coroa Cara −1, 1 1, −1 Coroa 1, −1 −1, 1
Nota¸c˜ao: Vamos usar a seguinte conven¸c˜ao, corriqueira e adotada em diversos livros, para todos os jogos representados na forma matricial: o primeiro elemento em cada c´elula da matriz ´e o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da c´elula ´e o payoff do jogador 2 (“jogador-coluna”).
Para o jogo do Exemplo 1, temos que: Jogadores: I = {1, 2};
Estrat´egias: S1 = S2 = {Cara, Coroa};
Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1;
u1(Cara,Cara) = u1(Coroa,Coroa) = −1;
u2(s1, s2) = −u1(s1, s2), ∀(s1, s2) ∈ S1 × S2.
No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevis´ıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleat´orio ou de modo que o seu rival n˜ao saiba exatamente qual o lado da moeda ser´a escolhido.
Observe que esse ´e um jogo de soma zero: o ganho de um jogador ´e igual `a perda do outro jogador. Para jogos de soma zero com dois jogadores, os conceitos de solu¸c˜ao usados podem envolver os jogadores randomizarem suas estrat´egias. Esse tipo de jogo foi extensivamente estudado por von Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e um marco da teoria dos jogos.
Um tipo de jogo mais geral do que os de soma zero s˜ao os jogos de soma fixa (dos payoffs), tamb´em chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, ent˜ao o jogo ´e de soma zero. Logo, jogos de soma zero s˜ao um tipo de jogos de soma fixa.
Em um jogo de soma fixa, um jogador s´o aumenta o seu payoff se o payoff do outro jogador se reduzir pelo valor desse aumento. Ent˜ao qualquer resultado deste jogo ´e Pareto eficiente, pois aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse tipo de jogo ´e adequado para modelar situa¸c˜oes em que se tem um “vencedor” e um “perdedor”. Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador ganhar, ele obt´em o payoff +1, enquanto o perdedor obt´em o payoff −1. Se o jogo empatar, cada jogador obt´em payoff 0. Evidentemente, muitos dos jogos analisados em economia n˜ao s˜ao de soma fixa (ou seja, podemos dizer que s˜ao de soma vari´avel ), como ´e o caso dos Exemplos 2 e 3 a seguir. Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e est˜ao sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receber˜ao uma pena de 3 anos na cadeia. Se ambos n˜ao confessarem o crime, a pena ser´a de apenas dois anos, por falta de evidˆencia. Por´em, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na pris˜ao para quem confessar e, para quem n˜ao confessar, de cinco anos na pris˜ao, por n˜ao ter colaborado com a justi¸ca. A matriz abaixo descreve este jogo.
L.A.↓ / Laelio → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2
Exemplo 3: Problema de Coordena¸c˜ao. Suponha que duas pessoas est˜ao viajando separada-mente para o Rio de Janeiro e combinaram de se encontrar para almo¸car no dia seguinte. Por´em esqueceram de marcar o restaurante e n˜ao est˜ao conseguindo se comunicar. Eles costumam almo¸car sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almo¸co no restaurante da barra ´e mais agrad´avel do que o almo¸co no restaurante do centro. Por´em, eles se desencontrarem ´e a pior situa¸c˜ao poss´ıvel. A matriz abaixo descreve este jogo.
1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1
Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo `a tarde. Concordaram com duas op¸c˜oes: ir a um jogo de futebol ou fazer compras. Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir `as compras. A matriz abaixo descreve este jogo.
Nelson↓ / Renata → Futebol Compras
Os Exemplos 3 e 4 modelam problemas de coordena¸c˜ao: os dois jogadores devem escolher suas estrat´egias de modo que fa¸cam o mesmo programa. Veremos mais `a frente que cada um desses dois jogos possui dois equil´ıbrios de Nash em estrat´egias puras, em que ambos os jogadores devem coordenar suas estrat´egias para alcan¸car um desses equil´ıbrios. Al´em disso, o Exemplo 4 envolve uma disputa de poder, em que o equil´ıbrio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem juntos ao futebol), ´e diferente do equil´ıbrio que a jogadora 2, Renata, prefere, (C, C) (os dois irem juntos `as compras). Ambos os jogadores preferem estar em uma situa¸c˜ao de equil´ıbrio do que estar em uma situa¸c˜ao de desequil´ıbrio, (F, C) ou (C, F ), ou seja, em que um escolhe um programa diferente do escolhido pelo outro. Temos ent˜ao uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equil´ıbrio preferido.
2.2
Conceitos de Dominˆ
ancia e Estrat´
egias Racionaliz´
aveis
Nas defini¸c˜oes a seguir vamos denotar por si uma estrat´egia qualquer de um jogador i arbitr´ario
e por Si o conjunto de todas as estrat´egias dispon´ıveis para o jogador i. Al´em disso, s−i denota
um grupo de estrat´egias para os outros jogadores que n˜ao o jogador i (ou seja, s−i especifica uma
estrat´egia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estrat´egias
dispon´ıveis para os outros jogadores que n˜ao o jogador i.
Defini¸c˜ao: Estrat´egia Estritamente Dominante. A estrat´egia ˆsi ´e estritamente (ou
forte-mente) dominante para o jogador i em um dado jogo se para toda estrat´egia si 6= ˆsi, si ∈ Si,
vale:
ui(ˆsi, s−i) > ui(si, s−i), para todo s−i ∈ S−i.
Logo, uma estrat´egia ˆsi ´e estritamente dominante para o jogador i se ela for a ´unica estrat´egia
que maximiza o payoff desse jogador, quaisquer que sejam as estrat´egias escolhidas pelos outros jogadores.
Para o jogo dilema dos prisioneiros, ´e f´acil verificar que Confessar ´e uma estrat´egia estritamente dominante para os dois prisioneiros. Ela ´e a estrat´egia que gera o maior payoff para cada prisioneiro, qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) ´e um equil´ıbrio em estrat´egias estritamamente dominantes.
Observe que o equil´ıbrio (C, C) ´e Pareto dominado pelo conjunto de estrat´egias (N C, N C), ou seja, cada jogador obt´em um payoff maior em (N C, N C) do que em (C, C). Temos, ent˜ao, um caso onde o comportamento individual maximizador dos agentes envolvidos resulta em um equil´ıbrio Pareto ineficiente. Logo, na presen¸ca de interdependˆencia estrat´egica, a intera¸c˜ao de jogadores cujo objetivo ´e maximizar o seu pr´oprio bem-estar pode levar a situa¸c˜oes Pareto-ineficientes.
Estrat´egias estritamente dominantes n˜ao s˜ao comuns. ´E comum situa¸c˜oes onde n˜ao existem estrat´egias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.
Exemplo 5: Observe que o jogo a seguir n˜ao possui nenhuma estrat´egia estritamente dominante:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5
Apesar de estrat´egias estritamente dominantes serem raras, podemos usar um conceito similar, de estrat´egia estritamente dominada, para eliminarmos estrat´egias que nunca devem ser escolhidas por qualquer jogador.
Defini¸c˜ao: Estrat´egia Estritamente Dominada. Uma estrat´egia ¯si ´e estritamente (ou
forte-mente) dominada para o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:
ui(ˆsi, s−i) > u1(¯si, s−i), para todo s−i ∈ S−i.
Dizemos que ˆsi domina estritamente ¯si.
Observe que uma estrat´egia estritamente dominante domina estritamente todas as outras es-trat´egias do jogador. Logo, todas as outras estrat´egias s˜ao estritamente dominadas pela estrat´egia estritamente dominante.
Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5
Para o jogador 1, a estrat´egia D ´e estritamente dominada pela estrat´egia U . Essa ´e a ´unica estrat´egia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin-armos essa estrat´egia do jogo, usando o argumento de que o jogador 1 nunca a escolher´a, j´a que U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos ent˜ao o seguinte jogo reduzido:
1↓ / 2 → L M R
U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1
Para esse jogo reduzido, a estrat´egia M domina estritamente R, para o jogador 2. Eliminando a estrat´egia R, obtemos:
1↓ / 2 → L M
U 5, 2 4, 3 C 1, 4 3, 2
J´a para este novo jogo reduzido, a estrat´egia U domina estritamente C, para o jogador 1. Eliminando C, obtemos:
1↓ / 2 → L M
Finalmente, a estrat´egia L ´e estritamente dominada por M , para o jogador 2, neste ´ultimo subjogo. Por meio desse “procedimento de elimina¸c˜ao de estrat´egias estritamente dominadas (PEEED)”, obtivemos (U, M ) (isto ´e, o jogador 1 escolhe U , o jogador 2 escolhe M ) como solu¸c˜ao do jogo. Dizemos que (U, M ) ´e um equil´ıbrio obtido pela elimina¸c˜ao de estrat´egias estritamente dominadas (e que U e M s˜ao estrat´egias que sobrevivem ao PEEED).
A ideia do procedimento ´e, portanto, simples. Ele usa implicitamente a hip´otese de conhecimento comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos a solu¸c˜ao (U, M ), supomos implicitamente que o jogador 2 sabe que o jogador 1 ´e racional e nunca jogar´a a estrat´egia D. Como o jogador 1 sabe que o jogador 2 ´e racional e tamb´em que 2 sabe que ele ´e racional e nunca jogar´a D, ent˜ao o jogador 1 infere que 2 nunca jogar´a R. A continua¸c˜ao desse racioc´ınio permite concluir que (U, M ) ´e a solu¸c˜ao do jogo.
O problema com o PEEED ´e que ele tamb´em nem sempre leva a alguma solu¸c˜ao. No Exemplo 5 abaixo, n˜ao existe nenhuma estrat´egia estritamente dominada e, portanto, n˜ao conseguimos eliminar nenhuma estrat´egia do jogo usando o PEEED. Logo, n˜ao conseguimos fazer qualquer predi¸c˜ao mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou, pelo menos, o que n˜ao pode ser resultado).
Exemplo 6: Considere o jogo:
1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0
Para esse jogo, n˜ao existem nem estrat´egias estritamente dominantes nem estrat´egias estrita-mente dominadas.
Podemos enfraquecer as defini¸c˜oes de dominˆancia estrita, relaxando a exigˆencia de que o payoff seja sempre estritamente maior nas defini¸c˜oes acima, de modo a obter o seguinte conceito.
Defini¸c˜ao: Estrat´egia Fracamente Dominante. Uma estrat´egia ˆsi ∈ Si ´e fracamente
domi-nante para o jogador i se para toda estrat´egia si 6= ˆsi, si ∈ Si, valer que:
ui(ˆsi, s−i) ≥ ui(si, s−i), para todo si ∈ Si,
com desigualdade estrita para pelo menos um s−i.
Evidentemente, toda estrat´egia estritamente dominante ´e fracamente dominante, mas a volta n˜ao vale: no Exemplo 6 acima, as estrat´egias U de 1 e L de 2 s˜ao fracamente dominantes, mas n˜ao estritamente dominantes, j´a que para o jogador 1, quando 2 escolhe L, escolher U d´a payoff estritamente maior do que escolher D. Por´em se 2 escolhe R, ent˜ao o payoff para 1 ao escolher U ´e igual (e n˜ao maior) ao payoff que ele obt´em se escolher D. Note que racioc´ınio similar vale para o jogador 2, com rela¸c˜ao a sua estrat´egia L. Dizemos que (U, L) ´e um equil´ıbrio formado por estrat´egias fracamente dominantes.
Problema similar ao que ocorre com a no¸c˜ao de estrat´egias estritamente dominantes ocorre com o conceito de estrat´egias fracamente dominantes: pode ser que n˜ao exista solu¸c˜ao para o jogo em estrat´egias fracamente dominantes, como o Exemplo 6 ilustra.
Exemplo 7: Considere o seguinte jogo: E D C (2, 1) (3, 0) M (4, 0) (2, 1) B (4, 4) (3, 4) ´
E f´acil observar que n˜ao existe estrat´egia fracamente dominante para ambos os jogadores (apenas B ´e fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar o jogo acima, um relaxamento da no¸c˜ao de estrat´egia estritamente dominada.
Defini¸c˜ao: Estrat´egia Fracamente Dominada. Uma estrat´egia ¯si´e fracamente dominada para
o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:
ui(ˆsi, s−i) ≥ ui(¯si, s−i), para todo s−i ∈ S−i,
com desigualdade estrita para pelo menos um s−i. Dizemos ent˜ao que ˆsi domina fracamente ¯si.
Vamos aplicar um procedimento de elimina¸c˜ao de estrat´egias fracamente dominadas (PEEFD) ao jogo do exemplo 7 acima. Podemos fazˆe-lo de trˆes modos distintos:
1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D d˜ao o mesmo payoff para o jogador 2 e n˜ao podemos eliminar nenhuma dessas estrat´egias. Sobram ent˜ao (B, E) e (B, D) como poss´ıveis resultados do jogo.
2. Se eliminarmos primeiro C para o jogador 1, a estrat´egia E do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante, obtendo (B, D) (payoff (3,4)) como solu¸c˜ao.
3. Se eliminarmos primeiro M para o jogador 1, a estrat´egia D do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante, obtendo (B, E) (payoff (4,4)) como solu¸c˜ao.
Portanto, a ordem de elimina¸c˜ao das estrat´egias fracamente dominadas pode afetar a solu¸c˜ao obtida. Esta ´e uma caracter´ıstica ruim deste procedimento, pois a solu¸c˜ao do jogo pode mudar conforme a ordem de elimina¸c˜ao das estrat´egias. Este problema n˜ao ocorre quando eliminamos estrat´egias estritamente dominadas.
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-gadores e da estrutura do jogo. Por´em, esses procedimentos n˜ao esgotam toda a for¸ca dessa hip´otese. Usando a hip´otese de conhecimento comum, podemos eliminar outras estrat´egias al´em das dominadas.
Defini¸c˜ao: Melhor Resposta. A estrat´egia ˆsi ´e a melhor resposta do jogador i `a estrat´egia ˆs−i
dos outros jogadores se:
Portanto, a estrat´egia ˆsi ´e a melhor resposta do jogador i para a estrat´egia ˆs−i dos outros
jo-gadores se ela for a ou uma das escolhas ´otimas de i quando ele acreditar que os outros jogadores ir˜ao selecionar a estrat´egia ˆs−i. Um jogador n˜ao deve escolher uma estrat´egia que nunca ´e uma
melhor resposta, pois neste caso n˜ao existe justificativa para o uso dessa estrat´egia. Observe que estrat´egias estritamente dominadas nunca s˜ao a melhor resposta. Podemos montar um procedi-mento de elimina¸c˜ao de estrat´egias que nunca s˜ao a melhor resposta, de modo similar ao PEEED. Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hip´otese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.
Defini¸c˜ao: Estrat´egias Racionaliz´aveis. As estrat´egias em Si do jogador i que sobrevivem
ao procedimento de elimina¸c˜ao de estrat´egias que nunca s˜ao a melhor resposta s˜ao chamadas racionaliz´aveis.
Uma estrat´egia racionaliz´avel pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estrat´egia com uma conjectura razo´avel sobre o comportamento dos outros jogadores (nenhum rival escolher´a uma estrat´egia n˜ao racionaliz´avel).
´
E poss´ıvel mostrar que as seguintes afirma¸c˜oes s˜ao verdadeiras:
• A ordem de remo¸c˜ao das estrat´egias que nunca s˜ao a melhor resposta n˜ao altera o resultado obtido;
• Cada jogador tem pelo menos uma estrat´egia racionaliz´avel, podendo ter mais de uma; • O conjunto de estrat´egias racionaliz´aveis est´a contido no conjunto de estrat´egias que
sobre-vivem ao PEEED;
• Para jogos com dois jogadores, o conjunto de estrat´egias racionaliz´aveis ´e igual ao conjunto de estrat´egias que sobrevivem ao PEEED.
Por´em, o conceito de estrat´egia racionaliz´avel nem sempre fornece uma solu¸c˜ao. Para o Exemplo 3, a batalha dos sexos, todas as estrat´egias s˜ao racionaliz´aveis e, portanto, o conceito n˜ao informa nada sobre o que esperar como solu¸c˜ao deste jogo. Queremos tornar as predi¸c˜oes sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equil´ıbrio de Nash (EN), que, satisfeitas certas condi¸c˜oes, sempre aponta pelo menos uma solu¸c˜ao para qualquer jogo na forma estrat´egica. Esse ´e o mais importante conceito em teoria dos jogos.
2.3
Equil´ıbrio de Nash
O m´aximo que podemos desenvolver usando apenas a hip´otese de conhecimento comum ´e o conceito de estrat´egias racionaliz´aveis, visto acima. Para obtermos qualquer outro conceito mais robusto, temos que adicionar alguma hip´otese nova.
Defini¸c˜ao: Equil´ıbrio de Nash em Estrat´egias Puras. Um conjunto de estrat´egias s∗ = (s∗1, . . . , s∗I) ´e um equil´ıbrio de Nash (EN) (em estrat´egias puras) para um determinado jogo se para todo jogador i, i = 1, . . . , I, valer que:
ui(s∗i, s ∗
−i) ≥ ui(si, s∗−i), para todo si ∈ Si.
Dizemos que um EN ´e estrito se as desigualdades acima forem estritas. Logo, em um EN estrito, n˜ao existe, para nenhum dos jogadores, nenhuma outra estrat´egia diferente da de equil´ıbrio que resulte em um payoff igual ao de equil´ıbrio, dado que os outros jogadores est˜ao selecionando as suas estrat´egias de equil´ıbrio.
Em um equil´ıbrio de Nash, a estrat´egia de cada jogador ´e a melhor resposta para as estrat´egias que s˜ao de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam corretos sobre suas conjecturas a respeito das estrat´egias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas.
O conceito de EN traz uma predi¸c˜ao mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estrat´egias s˜ao racionaliz´aveis, mas apenas (F, F ) e (C, C) s˜ao EN em estrat´egias puras. Vamos mostrar que (F, F ) ´e um EN estrito. Se 1 escolher F , ent˜ao 2 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F ´e a melhor resposta de 2 para a escolha de F feita por 1. De modo similar, se 2 escolher F , ent˜ao 1 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F ´e a melhor resposta de 1 para a escolha de F feita por 2. Isso mostra que (F, F ) ´e um EN estrito.
Usando um argumento similar, n˜ao ´e dif´ıcil observar que o jogo “Cara ou Coroa”, discutido no Exemplo 1 acima, n˜ao possui EN em estrat´egias puras. De modo geral, n˜ao podemos garantir a existˆencia de EN em estrat´egias puras. Intuitivamente, qualquer solu¸c˜ao do jogo “Cara ou Coroa” envolve ambos os jogadores escolhendo suas estrat´egias de modo imprevis´ıvel. Para formalizar essa possibilidade de randomiza¸c˜ao, vamos introduzir o conceito de estrat´egias mistas.
Defini¸c˜ao: Estrat´egias Mistas. Seja Si o conjunto de estrat´egias puras do jogador i. Uma
estrat´egia mista do jogador i ´e uma distribui¸c˜ao de probabilidade sobre Si, ou seja, uma fun¸c˜ao
σi : Si → [0, 1], que atribui uma probabilidade a cada estrat´egia pura do jogador i. Logo, temos
que:
0 ≤ σi(si) ≤ 1 , ∀si e
X
si∈Si
σi(si) = 1 .
O simplex de Si, representado por ∆Si, ´e o conjunto das estrat´egias mistas do jogador i. Este
conjunto inclui tamb´em as estrat´egias puras do jogador (estrat´egias mistas degeneradas), j´a que se σ(¯si) = 1 para alguma estrat´egia ¯si, ent˜ao isso significa que ¯si ´e escolhida com probabilidade 1.
Se os jogadores randomizarem suas estrat´egias, ent˜ao o resultado do jogo deixar´a de ser de-termin´ıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja σ = (σ1, σ2) uma cole¸c˜ao de estrat´egias mistas para os jogadores 1 e 2. A utilidade esperada
do jogador 1 (similar para 2) para o conjunto de estrat´egias mistas σ ´e calculada como: u1(σ1, σ2) =
X
s1∈S1,s2∈S2
[σ1(s1) × σ2(s2)] × u1(s1, s2)
Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estrat´egias mistas σ1 = (1/4◦Ca, 3/4◦
Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do
jogador 1 quando ele escolhe a estrat´egia σ1 e o jogador 2 escolhe a estrat´egia σ2 ´e:
u1(σ1, σ2) =
X
s1∈S1,s2∈S2
σ1(s1) × σ2(s2) × u1(s1, s2)
= σ1(Ca) × σ2(Ca) × u1(Ca, Ca) + σ1(Ca) × σ2(Co) × u1(Ca, Co)+
+ σ1(Co) × σ2(Ca) × u1(Co, Ca) + σ1(Co) × σ2(Co) × u1(Co, Co)
= 1 4× 2 3 × (−1) + 1 4 × 1 3× (+1) + 3 4× 2 3 × (+1) + 3 4 × 1 3 × (−1) = 1 6
Podemos estender imediatamente os conceitos de estrat´egias dominantes e dominadas, proced-imentos de elimina¸c˜ao e estrat´egias racionaliz´aveis, ao permitir que os jogadores possam escolher estrat´egias mistas, al´em de estrat´egias puras.
Defini¸c˜ao: Equil´ıbrio de Nash. Um conjunto de estrat´egias σ∗ = (σ∗1, . . . , σ∗I) ´e um equil´ıbrio de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que:
ui(σ∗i, σ ∗
−i) ≥ u1(σi, σ∗−i), para todo σi ∈ ∆Si.
A defini¸c˜ao acima de EN permite que os jogadores randomizem entre as estrat´egias puras. Logo, eles podem n˜ao somente escolher uma estrat´egia pura, mas tamb´em escolher uma estrat´egia que envolva v´arias estrat´egias puras, cada uma escolhida com determinada probabilidade. Observe que, em equil´ıbrio, a hip´otese de expectativas mutualmente corretas implica que cada jogador conhece o modo em que os outros jogadores est˜ao randomizando (as estrat´egias mistas escolhidas por seus rivais).
Pela defini¸c˜ao de EN com estrat´egias mistas, para cada conjunto de estrat´egias dos jogadores candidato a equil´ıbrio, devemos verificar se para cada jogador, a sua estrat´egia ´e de fato a melhor resposta para as estrat´egias dos outros jogadores que fazem parte do conjunto de estrat´egias can-didatas a equil´ıbrio. Considerando que existem infinitas estrat´egias mistas, este procedimento de cerifica¸c˜ao para determinar EN ´e invi´avel. Como fazemos ent˜ao para encontrar todos os equil´ıbrios de Nash? O teorema abaixo fornece uma resposta.
Teorema: Equivalˆencia de Defini¸c˜oes. As seguintes afirmativas s˜ao equivalentes: 1. (σ∗1, σ2∗) ∈ ∆(S1) × ∆(S2) ´e um equil´ıbrio de Nash;
2. Para todo jogador i, ui(σ∗1, σ2∗) = ui(si, σ∗−i), para todo si jogado com probabilidade positiva;
e ui(σ1∗, σ ∗
O teorema fornece um algoritmo para encontrar equil´ıbrios de Nash em estrat´egias mistas. Ele diz que em um EN em estrat´egias mistas, duas estrat´egias puras de um jogador que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que ser´a igual ao payoff obtido no equil´ıbrio. Esse resultado ´e consequˆencia de utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estrat´egias mistas. Caso existissem duas estrat´egias puras que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff maior do que o da outra, o jogador n˜ao deveria atribuir probabilidade positiva `a estrat´egia que lhe d´a o payoff mais baixo, pois isso reduziria o seu payoff de equil´ıbrio.
Ou seja, dadas as estrat´egias escolhidas em equil´ıbrio pelos outros jogadores, esse jogador ´e indiferente entre qualquer estrat´egia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estrat´egias puras lhe d˜ao um payoff igual ou maior do que qualquer outra estrat´egia que ele n˜ao escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador ´e fazer (σ1∗, σ∗2) um equil´ıbrio.
Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem-plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz abaixo essa situa¸c˜ao.
1↓ / 2 → Cara (β) Coroa (1 − β) Cara (α) −1, 1 1, −1 Coroa (1 − α) 1, −1 −1, 1
Pelo teorema acima, essas randomiza¸c˜oes s˜ao um EN se, e somente se: u1(Ca, σ2) = u1(Co, σ2) e u2(σ1, Ca) = u2(σ1, Co),
onde σ1 e σ2 representam as estrat´egias mistas dos jogadores 1 e 2, respectivamente. Portanto:
u1(Ca, σ2) = u1(Co, σ2) ⇒ −1 × β + 1 × (1 − β) = 1 × β − 1 × (1 − β) ⇒ β = 0,5
u2(σ1, Ca) = u2(σ1, Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5
Logo, σ1 = (1/2◦ Ca;1/2◦ Co) e σ2 = (1/2◦ Ca;1/2◦ Co) ´e um EN em estrat´egias mistas. Observe
que:
u1(Ca, σ2) = u1(Co, σ2) = u1(σ1, σ2) = 0
u2(σ1, Ca) = u2(σ1, Co) = u2(σ1, σ2) = 0 ,
2.4
Teorema de Existˆ
encia e Outros Resultados
Teorema de Existˆencia de Equil´ıbrio de Nash. Todo jogo finito na forma normal possui pelo menos um equil´ıbrio de Nash, assumindo que os jogadores possam usar estrat´egias mistas.
O Teorema de Existˆencia garante que para todo jogo na forma estrat´egica finito existir´a pelo menos um equil´ıbrio de Nash (EN). Logo o conceito de EN n˜ao ´e problem´atico no sentido que para qualquer jogo finito podemos garantir que existir´a uma solu¸c˜ao para ele, se usarmos o conceito de EN como solu¸c˜ao para o problema de interdenpedˆencia estrat´egica modelado no jogo.
A rela¸c˜ao entre equil´ıbrio de Nash e os conceitos de equil´ıbrio com estrat´egias dominantes ´e descrita pelos seguintes resultados:
1. Se existir equil´ıbrio em estrat´egias estritamente dominantes, ele ser´a ´unico e ser´a o ´unico EN do jogo. O mesmo vale para equil´ıbrios obtidos com o PEEED: se existir, ser´a ´unico e o ´unico EN do jogo.
2. Se existir equil´ıbrio em estrat´egias fracamente dominantes, ent˜ao ele ser´a um EN. Neste caso, pode ocorrer que exista outro EN, formado por estrat´egias fracamente dominadas. O Exemplo 6 acima ilustra esse caso, em que (D, R) ´e um EN formado por estrat´egias fracamente dominadas.
3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da ordem de elimina¸c˜ao adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele ser´a um EN.
Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6: 1↓ / 2 → L R
U 1, 1 0, 0 D 0, 0 0, 0
Esse jogo possui dois EN, dados por (U, L) e (D, R). N˜ao existe equil´ıbrio em estrat´egias estritamente mistas. O EN (U, L) ´e tamb´em equil´ıbrio em estrat´egias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (D, R) ´e um equil´ıbrio formado por estrat´egias fracamente dominadas e portanto n˜ao pode ser encontrado usando o PEEFD.
O Exemplo 6 acima mostra que podem existir equil´ıbrios de Nash formados por estrat´egias fracamente dominadas. O resultado de um jogo ser desse tipo ´e algo estranho, pois envolve cada jogador escolher uma estrat´egia para a qual existe outra op¸c˜ao que dar´a sempre um payoff maior ou igual, independentemente do que os outros jogadores fa¸cam. Existe um refinamento do EN para jogos na forma normal, chamado refinamento da m˜ao-trˆemula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equil´ıbrio ocorrer. O refinamento da m˜ao-trˆemula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estrat´egia a ser jogada. O EN ent˜ao ser´a chamado perfeito da m˜ao-trˆemula caso satisfa¸ca a condi¸c˜ao imposta pelo refinamento. No exemplo acima, apenas o EN (U, L) ´e perfeito da m˜ao-trˆemula.
Refinamentos do conceito de EN s˜ao direcionados para eliminar EN que por algum motivo n˜ao s˜ao considerados razo´aveis. Nesse caso, existir´a algum ou alguns EN que satisfazem o refinamento e algum ou alguns que n˜ao o satisfazem.
3
Jogos na Forma Extensiva
3.1
Introdu¸
c˜
ao
Sabemos que para descrevermos um jogo s˜ao necess´arios trˆes objetos: 1) os jogadores; 2) a regra do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva ´e a representa¸c˜ao mais adequada para situa¸c˜oes dinˆamicas.
Defini¸c˜ao Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma extensiva (ou forma sequencial ) em forma de ´arvore, onde em cada conjunto de informa¸c˜ao um jogador escolhe uma a¸c˜ao que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes propriedades:
• Se inicia em um ´unico n´o de decis˜ao, chamado n´o inicial. Logo, todo n´o do jogo que n˜ao ´e o n´o inicial ´e um sucessor deste n´o, no sentido que podemos descrever qualquer n´o a partir do n´o inicial mais uma s´erie de a¸c˜oes tomadas (a hist´oria ocorrida do jogo at´e aquele n´o); • Todo n´o do jogo, com exce¸c˜ao do n´o inicial (que n˜ao possui nenhum predecessor), tem um
´
unico n´o predecessor imediato;
• Nos n´os finais do jogo, nenhum jogador faz qualquer escolha (nenhuma a¸c˜ao pode ser tomada) e nestes n´os s˜ao especificados os payoffs do jogo para a forma de como o jogo foi jogado, descrita pela hist´oria do jogo narrada pelo n´o final considerado.
Defini¸c˜ao: Jogo de Informa¸c˜ao Perfeita. Um jogo ´e chamado de informa¸c˜ao perfeita se cada jogador observa perfeitamente todas as a¸c˜oes escolhidas por todos os jogadores que se moveram antes dele.
Em um jogo de informa¸c˜ao perfeita, cada n´o de decis˜ao constitui um conjunto de informa¸c˜ao por si s´o, j´a que todos os jogadores observam todas as decis˜oes tomadas anteriormente a qualquer momento que for jogar. Se um jogo n˜ao for de informa¸c˜ao perfeita, ent˜ao existe pelo menos um ponto do jogo em que algum jogador n˜ao sabe o que foi escolhido no momento anterior. Neste caso, unimos os n´os que fazem parte de um mesmo conjunto de informa¸c˜ao por um retˆangulo pontilhado, como ilustra o jogo `a direita na figura abaixo, indicando que existe (pelo menos) um conjunto de informa¸c˜ao que cont´em mais de um n´o de decis˜ao de um jogador, o que significa que este jogador n˜ao sabe exatamente em que n´o est´a do conjunto de informa¸c˜ao (ou seja, ele n˜ao observa a tomada de decis˜ao feita no n´o predessor imediato).
Jogo de Informa¸c˜ao Perfeita
t 1 E @ @ @ @ @ @ D t 2 2 r A A A A A A l 1 0 l A A A A AA r t 0 3 t t t t
Jogo de Informa¸c˜ao Imperfeita
t 1 E @ @ @ @ @@ D t 2 r A A A A A A l 1 0 l A A A A A A r t 0 3 t t t t
No jogo `a esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada n´o de decis˜ao de 2 forma um conjunto de informa¸c˜ao por si s´o. J´a no jogo `a direita da figura acima, o jogador 2 n˜ao observa se 1 escolhe E ou D, ou seja, os dois n´os de decis˜ao de 2 formam um ´unico conjunto de informa¸c˜ao.
Evidentemente, os n´os de decis˜ao que pertencem a um mesmo conjunto de informa¸c˜ao devem ser todos referentes ao mesmo jogador. Al´em disso, as a¸c˜oes que o jogador pode tomar em n´os de decis˜ao que est˜ao no mesmo conjunto de informa¸c˜ao devem ser iguais. Caso isso n˜ao ocorresse e existissem dois n´os de decis˜ao no mesmo conjunto de informa¸c˜ao, com a¸c˜oes n˜ao exatamente iguais, ent˜ao o jogador seria capaz de inferir em que n´o est´a, ao realizar que as a¸c˜oes dispon´ıveis naquele n´o s˜ao diferentes das a¸c˜oes do outro n´o. Portanto, n´os de decis˜ao que pertencem a um mesmo conjunto de informa¸c˜ao pertencem ao mesmo jogador e possuem exatamente as mesmas a¸c˜oes dispon´ıveis. Defini¸c˜ao: Jogo de Mem´oria Perfeita. Um jogo ´e de mem´oria perfeita quando nenhum jogador esquece o que j´a sabia (inclusive a¸c˜oes que j´a foram tomadas durante o desenrolar do jogo).
A ´arvore de jogo ilustrada na figura abaixo n˜ao apresenta mem´oria perfeita. Neste exemplo, o jogador 1, na terceira rodada, ap´os a sua escolha na primeira rodada e ap´os a escolha do jogador 2 na segunda rodada, n˜ao se lembra de sua pr´opria escolha feita na primeira rodada.
t 1 E H H H H H H H H H H H j D t 2 a @ @ @ @ @ @ R b t a A A A A A A U b t 1 A A A A A A U l r l r l r l r t @ @ @ @ @ @ R t A A A A A A U t A A A A A A U
Finalmente, existe uma outra defini¸c˜ao, jogo de informa¸c˜ao completa, que se refere a jogos em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que n˜ao observem alguma tomada de decis˜ao (ou seja, um jogo de informa¸c˜ao completa pode ser de informa¸c˜ao imperfeita). J´a em um jogo de informa¸c˜ao incompleta, os jogadores podem n˜ao conhecer alguma informa¸c˜ao relevante sobre o tipo dos seus rivais, tais como as preferˆencias, as estrat´egias ou os payoffs dos outros jogadores. Um exemplo cl´assico de jogos de informa¸c˜ao incompleta refere-se a leil˜oes. Em um leil˜ao, cada participante n˜ao sabe qual ´e a valora¸c˜ao exata que os outros participantes atribuem ao objeto leiloado.
3.2
Rela¸
c˜
ao entre Forma Extensiva e Forma Normal
Um jogo representado na forma normal pode ser representado na forma extensiva sem am-biguidades? O contr´ario tamb´em ´e v´alido? Da forma extensiva para a forma normal sim, mas o contr´ario n˜ao ´e v´alido. A mesma forma normal pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representa¸c˜ao na forma normal, que se resume a representa¸c˜ao de um jogo do tipo “Cara ou Coroa” discutido no Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha ´e do jogador 1 e na segunda linha, do jogador 2.
Jogador 1 escolhe primeiro
t 1 Ca @ @ @ @ @ @ Co t 2 Co A A A A A A Ca −1 1 1 −1 Ca A A A A AA Co t 1 −1 −1 1 t t t t
Jogador 2 escolhe primeiro
t 2 Ca @ @ @ @ @@ Co t 1 Co A A A A A A Ca −1 1 1 −1 Ca A A A A A A Co t 1 −1 −1 1 t t t t
A forma normal ´e uma estrutura mais simples do que a forma extensiva. Ela envolve menos objetos matem´aticos do que a forma extensiva, porque a estrat´egia do jogador pode condensar uma quantidade enorme de informa¸c˜ao sobre a tomada de decis˜ao do jogador. Logo, encontrar a representa¸c˜ao na forma normal do jogo analisado pode tornar mais f´acil a determina¸c˜ao dos EN de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estrat´egia para um jogo na forma extensiva.
A defini¸c˜ao de estrat´egia para jogos simultˆaneos ´e simples e direta. No caso de jogos sequenciais, a defini¸c˜ao de estrat´egia ´e mais elaborada, j´a que nesses jogos, um determinado jogador pode ter v´arios momentos de escolha de a¸c˜oes ao longo do jogo. Por exemplo, em xadrez, as jogadas dos dois jogadores se alternam ao longo da partida.
Uma estrat´egia de um jogador para jogos sequenciais ´e uma regra que determina a escolha de a¸c˜ao em todos os conjuntos de informa¸c˜ao desse jogador no jogo. Logo, uma estrat´egia para o jogador i ´e um plano contingente completo: uma regra de decis˜ao que especifica como o jogador i jogar´a em toda e qualquer circunstˆancia do jogo em que ele possa vir a jogar. Isso significa que uma estrat´egia define a¸c˜oes para todos os conjuntos de informa¸c˜ao do jogo, mesmo que esses conjuntos de informa¸c˜ao n˜ao sejam alcan¸cados durante o jogo.
Exemplo 8. Suponha o seguinte jogo sequencial: t 1 E @ @ @ @ @ @ D t 2 2 r A A A A A A l 6 4 10 10 f A A A A A A g t 0 0 14 8
Como o jogador 1 s´o possui um conjunto de informa¸c˜ao, dado pelo n´o de decis˜ao inicial, onde as a¸c˜oes dispon´ıveis s˜ao E e D, ent˜ao 1 possui apenas duas estrat´egias: E e D. J´a o jogador 2 possui dois conjuntos de informa¸c˜ao distintos: 1) o n´o de decis˜ao alcan¸cado quando 1 escolhe E, que vamos denotar por x1, e onde 2 pode escolher as a¸c˜oes l ou r; e 2) o n´o de decis˜ao alcan¸cado quando
1 escolhe D, que vamos denotar por x2, e onde 2 pode escolher as a¸c˜oes f ou g. Portanto, uma
estrat´egia para o jogador 2 pode ser descrita como (l em x1, g em x2), ou de modo mais simples,
(l, g). Essa estrat´egia significa que o jogador 2 escolhe l em x1 e g em x2. Fica claro ent˜ao que
uma estrat´egia define a¸c˜oes em todos os pontos do jogo. Isto pode parecer desnecess´ario `a primeira vista, mas para computarmos os EN, ´e importante que a estrat´egia seja completa nesse sentido.
Portanto, o conjunto das estrat´egias do jogador 2 ´e formado por (l, f ), (l, g), (r, f ), (r, g). Logo, o jogador 2 possui 22 = 4 estrat´egias (2 ´e o n´umero de a¸c˜oes em cada conjunto de informa¸c˜ao, e 2 tamb´em ´e o n´umero de conjuntos de informa¸c˜ao do jogador 2).
Para determinarmos todos os equil´ıbrios de Nash em estrat´egias puras de um jogo na forma sequencial, o ideal ´e encontramos a representa¸c˜ao do jogo na forma normal. O primeiro passo para isso ´e encontrar as estrat´egias de cada jogador.
No Exemplo 8 acima, vimos que o jogador 2 possui 4 estrat´egias e o jogador 1 possui 2 es-trat´egias. Obtemos ent˜ao a seguinte matriz de dimens˜ao 2 por 4 para a representa¸c˜ao desse jogo na forma normal:
1↓ / 2 → (l, f ) (l, g) (r, f ) (r, g) E 6, 4 6, 4 10, 10 10, 10 D 0, 0 14, 8 0, 0 14, 8
Preenchemos os payoffs na matriz usando a representa¸c˜ao em forma de ´arvore do jogo. Por exemplo, se 2 escolheu E e 2 escolheu (l, f ), ent˜ao o payoff resultante ser´a (6, 4). J´a se 1 escolher D e 2 escolher (l, f ), ent˜ao percebemos que a a¸c˜ao importante definida na estrat´egia de 2 quando 1 escolhe D ´e a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0).
Uma vez obtida a representa¸c˜ao na forma normal do jogo, ´e f´acil obter os EN em estrat´egias puras do jogo, que s˜ao trˆes: (E; (r, f )), (D, (l, g)) e (D, (r, g)).
Veremos agora que alguns tipos de jogos possuem uma dinˆamica de a¸c˜oes escolhidas em tempos diferentes de tal modo que represent´a-los na forma normal e da´ı encontrarmos os EN pode n˜ao ser adequado, no sentido de que alguns destes EN n˜ao constituem solu¸c˜ao razo´avel para a intera¸c˜ao estrat´egica modelada. Mais especificamente, quando derivamos a forma normal associada a um jogo sequencial e encontrarmos os EN do jogo, alguns destes equil´ıbrios podem n˜ao ser cr´ıveis, ou seja, baseados em amea¸cas de um dos jogadores que n˜ao ser´a cumprida caso tivesse que de fato ser levada a cabo. O exemplo a seguir ilustra esse problema.
Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo-nopolista mant´em o mercado amea¸cando firmas entrantes de uma guerra de pre¸cos. Desse modo, o monop´olio mant´em seu lucro. Por´em, se alguma firma de fato entrar neste mercado, a melhor estrat´egia para o monopolista ´e formar um cartel e dividir o lucro de monop´olio, j´a que a guerra de pre¸cos traria preju´ızos n˜ao somente para a firma entrante, mas tamb´em para o incumbente. Essa situa¸c˜ao estrat´egica ´e representada pelo seguinte jogo na forma extensiva.
t Entrante N˜ao Entra @ @ @ @ @ @ R Entra 0 20 tMonopolista −5 −5 10 10 Briga @ @ @ @ @ @ R Acomoda
A representa¸c˜ao na forma normal do jogo sequencial acima ´e:
Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar
N˜ao entra 0,20 0,20
Entra -5,-5 10,10
Existem dois EN em estrat´egias puras para o jogo:
1. firma entrante (E) Entra; monopolista (M ) Acomoda, se E entrar, e 2. firma entrante N˜ao entra; monopolista Briga se E entrar.
O segundo EN ´e baseado em uma amea¸ca vazia, n˜ao-cr´ıvel : M faz uma amea¸ca, que se for levada a s´erio, n˜ao precisar´a ser cumprida, pois nesse caso E ter´a escolhido n˜ao entrar. Por´em, se E decidir entrar no mercado, o melhor para M ser´a se acomodar. O refinamento de perfei¸c˜ao em subjogos, que veremos a seguir, tenta eliminar EN baseados em amea¸cas n˜ao cr´ıveis, por n˜ao serem uma solu¸c˜ao razo´avel para a intera¸c˜ao estrat´egica modelada.
3.3
Equil´ıbrio de Nash Perfeito em Subjogos (ENPS)
Jogos de Informa¸c˜ao Perfeita
Vamos analisar jogos de informa¸c˜ao perfeita primeiro. O objetivo ´e desenvolver um conceito de equil´ıbrio que elimine equil´ıbrios baseados em estrat´egias n˜ao-cr´ıveis, como no Exemplo 8 acima, onde o ideal seria obter (Entra, Ac se E entrou) como ´unica solu¸c˜ao da intera¸c˜ao estrat´egica descrita. Portanto, queremos refinar o conceito de EN de modo que as solu¸c˜oes do jogo ainda sejam EN, mas eliminando os EN baseados em estrat´egias que envolvam amea¸cas n˜ao-cr´ıveis. O Princ´ıpio da Racionalidade Sequencial (PRS), que exige que a estrat´egia de um jogador qualquer deve especificar a¸c˜oes que s˜ao ´otimas em cada ponto do jogo, ´e fundamental para obtermos esse refinamento.
Esse princ´ıpio ´e implementado em um jogo de informa¸c˜ao perfeita pelo seguinte Algoritmo de Indu¸c˜ao Reversa (“backward induction algorithm”):
1. Comece pelos n´os de decis˜ao finais da ´arvore (“n´os pen´ultimos” – n´os cujos sucessores s˜ao todos n´os terminais);
2. Determine a escolha ´otima dos jogadores que jogam nesses n´os (problema de maximiza¸c˜ao individual, sem intera¸c˜ao estrat´egica);
3. Redesenhe a ´arvore, substituindo os n´os de decis˜ao final por um n´o terminal, com payoff definido pela escolha ´otima no passo 2);
4. Repita passos 1), 2) e 3) para esse jogo reduzido, at´e chegar ao n´o inicial do jogo.
A solu¸c˜ao de indu¸c˜ao reversa para jogos com informa¸c˜ao perfeita se resume a que todos os jogadores fa¸cam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na pr´atica, o jogo ´e resolvido do fim para o come¸co. O conjunto de estrat´egias puras s = (s1, s2, . . . , sI) ´e um
conjunto de estrat´egias de indu¸c˜ao reversa para um jogo na forma extensiva se tiver sido obtido de acordo com o algoritmo de indu¸c˜ao reversa. ´E poss´ıvel mostrar que todo conjunto de estrat´egias de indu¸c˜ao reversa ´e um EN do jogo.
Resultado: Existˆencia de Equil´ıbrio. Todo jogo na forma extensiva finito de informa¸c˜ao perfeita tem um EN em estrat´egias puras, que pode ser encontrado usando indu¸c˜ao reversa. Se os payoffs de cada jogador forem diferentes nos n´os terminais, para todos os jogadores, ent˜ao existir´a um ´unico EN que pode ser encontrado usando indu¸c˜ao reversa.
Corol´ario. Todo jogo finito de informa¸c˜ao perfeita tem (pelo menos) um EN em estrat´egias puras. Exemplo 8: Monopolista e Firma Entrante (continua¸c˜ao). No jogo Monopolista/Entrante, existem dois EN em estrat´egias puras, mas apenas um EN obtido usando o algoritmo de indu¸c˜ao reversa. O algoritmo elimina exatamente o EN baseado na amea¸ca n˜ao-cr´ıvel do monopolista abrir uma guerra de pre¸cos caso o entrante decida entrar. Esta amea¸ca n˜ao ´e cr´ıvel pois uma vez que a firma entrante entrar no mercado, se o monopolista fizer uma guerra de pre¸cos, ele pr´oprio se prejudicar´a sem obter nenhum ganho.
Logo, todo conjunto de estrat´egias obtido usando o algoritmo de indu¸c˜ao reversa acima ´e um EN do jogo. Mas nem todo EN do jogo pode ser obtido por indu¸c˜ao reversa. Os EN que podem ser obtidos utilizando o algoritmo s˜ao chamados EN perfeitos em subjogos (ENPS), ou EN que satisfazem o crit´erio de perfei¸c˜ao em subjogos.
Jogos de Informa¸c˜ao Imperfeita
O algoritmo de indu¸c˜ao reversa acima s´o se aplica para jogos de informa¸c˜ao perfeita. Por´em a ideia de racionalidade sequencial pode ser usada tamb´em para jogos de informa¸c˜ao incompleta, por meio de um algoritmo similar de indu¸c˜ao reversa.
A ideia central ´e definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser visto como um jogo por si s´o. A propriedade de racionalidade sequencial exige que um EN seja EN para cada subjogo do jogo original.
Defini¸c˜ao: Subjogo. Um subjogo de um jogo Γ na forma extensiva ´e um subconjunto do jogo tal que:
(i) Se inicia em um conjunto de informa¸c˜ao que cont´em apenas um ´unico n´o de decis˜ao, e cont´em todos os n´os sucessores desse n´o inicial;
(ii) Se o n´o de decis˜ao y pertence ao subjogo, ent˜ao todo n´o z que pertence ao conjunto de informa¸c˜ao de y tamb´em pertence ao subjogo.
Todo jogo possui pelo menos um ´unico subjogo, que seria o pr´oprio jogo. Este ´e o caso do exemplo abaixo. Um subjogo estrito de um jogo ´e um subjogo que est´a contido de modo estrito no jogo, ou seja, ´e diferente (“menor”) que o jogo inteiro.
u 1 E @ @ @ @ @ @ D u 2 r A A A A A A l 1 3 0 0 l A A A A A A r u 0 0 3 1 u u u u
Defini¸c˜ao: ENPS em Estrat´egias Puras. O conjunto de estrat´egias s = (s1, s2, . . . , sI) do jogo
Γ ´e um equil´ıbrio de Nash perfeito em subjogos (ENPS) se s = (s1, s2, . . . , sI) induz um equil´ıbrio
de Nash em todo subjogo de Γ.
ENPS ´e um refinamento de EN: todo ENPS ´e um EN, j´a que o pr´oprio jogo ´e um subjogo seu. O contr´ario n˜ao ´e v´alido: existem EN que n˜ao s˜ao perfeitos em subjogos.
Teorema. Para todo jogo na forma extensiva finito de informa¸c˜ao perfeita, o conjunto de es-trat´egias de indu¸c˜ao reversa ´e igual ao conjunto de ENPS em estrat´egias puras.
Logo, em jogos de informa¸c˜ao perfeita, o conjunto de ENPS coincide com o conjunto de EN obtido usando o algoritmo de indu¸c˜ao reversa visto acima. Por´em, considerando jogos de informa¸c˜ao imperfeita, nem todo jogo possui um ENPS em estrat´egias puras. O teorema a seguir garante a
Teorema: Existˆencia de ENPS (Selten). Todo jogo na forma extensiva finito com mem´oria perfeita possui um ENPS.
A hip´otese de mem´oria perfeita ´e necess´aria. Existem exemplos de jogos de mem´oria imperfeita que n˜ao possuem ENPS.
O seguinte algoritmo geral de indu¸c˜ao reversa para jogos na forma extensiva, sejam de in-forma¸c˜ao completa ou n˜ao, ´e v´alido para encontrar os ENPS:
1. Comece pelo t´ermino da ´arvore, determine os EN para todos os subjogos finais (subjogos que n˜ao possuem nenhum subjogo estrito);
2. Substitua cada subjogo pelo payoff de um de seus EN;
3. Repita os passos 1) e 2) para o jogo reduzido, continue at´e n˜ao restar nenhum subjogo; 4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um
EN).
Para jogos de informa¸c˜ao perfeita, esse algoritmo ´e igual ao algoritmo anterior.
3.4
Jogos Repetidos
Em um jogo do tipo dilema dos prisioneiros, seria poss´ıvel obter coopera¸c˜ao se repet´ıssemos o jogo diversas vezes? Com a repeti¸c˜ao, o n´umero de estrat´egias de cada jogador aumenta. Nesse caso, ´e poss´ıvel criar estrat´egias em que um jogador puna o seu rival caso ele n˜ao coopere.
Vamos ent˜ao analisar novamente o Dilema dos Prisioneiros (Exemplo 2): 1↓ / 2 → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2
Suponha que o jogador 1 adote a seguinte estrat´egia: na primeira intera¸c˜ao ele joga N C (co-operar). Nos per´ıodos seguintes, se o outro jogador escolheu N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contr´ario, o jogador 1 escolhe C (n˜ao cooperar) at´e o jogo terminar. Essa estrat´egia pode levar a algum tipo de coopera¸c˜ao? Mais especificamente, existe algum equil´ıbrio tal que os jogadores venham a adotar estrat´egias cooperativas? Para jogos do tipo dilema dos prisioneiros repetidos finitas vezes, a resposta ´e negativa. Para jogos repetidos indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva .
A no¸c˜ao de ENPS tem como consequˆencia que se o dilema dos prisioneiros for repetido um n´umero fixo (finito) de vezes, o ´unico equil´ıbrio de Nash perfeito em subjogos ser´a formado pelo EN do jogo em cada per´ıodo sendo jogado. Logo, n˜ao ´e poss´ıvel obter o resultado eficiente com a repeti¸c˜ao finita do jogo. Isso implica que qualquer dependˆencia hist´orica nas estrat´egias atuais ´e eliminada. Ou seja, tudo o que ocorreu antes ´e irrelevante para decidir o que fazer hoje. Para jogos que satisfa¸cam as condi¸c˜oes da proposi¸c˜ao, um ENPS n˜ao depende da hist´oria ocorrida no jogo em nenhum momento.
Por exemplo, uma consequˆencia desse fato ´e que se o dilema dos prisioneiros for jogado repeti-damente, por um per´ıodo determinado, continua sempre tendo a mesma solu¸c˜ao n˜ao cooperativa entre os jogadores, para cada rodada do jogo. Esse resultado segue da hip´otese de racionalidade sequencial. Por indu¸c˜ao reversa, na ´ultima rodada, ´e melhor n˜ao cooperar. Resolvendo de traz para diante, obtemos n˜ao-coopera¸c˜ao para todas as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de t´ermino conhecida pelos jogadores. Resolvendo o jogo por indu¸c˜ao reversa, cada jogador percebe que o seu rival ir´a descumprir o acordo de coopera¸c˜ao na ´ultima vez que interagirem. Eles se adiantam a isso e n˜ao cooperam na ´ultima rodada. Sabendo disso, os jogadores tamb´em n˜ao ir˜ao cooperar na pen´ultima rodada do jogo. Usando esse argumento, obtemos que os jogadores n˜ao cooperam em nenhuma rodada do jogo. Esse argumento, consequˆencia da defini¸c˜ao de ENPS, leva a resultados considerados pouco razo´aveis, como mostra o Exemplo 9 abaixo, em que o ´unico ENPS consiste nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).
Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo.
s I C P 1 1 s II C P 0 3 I C P s 2 2 s II C P 1 4 . . . ...sII C s P 97 100 99 99 s s I C P II C P 98 101 (100 100)
Para o jogo da centopeia, o ´unico ENPS consiste em todo jogador escolher P em todo momento do jogo. Portanto, o payoff de equil´ıbrio ´e 1 para cada jogador, e nenhuma coopera¸c˜ao ´e obtida.
Por´em, se o dilema dos prisioneiros for repetido infinitamente (ou se n˜ao tiver uma data fixa para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equil´ıbrio, dependendo do quanto os jogadores descontem o futuro.
As estrat´egias que levam a esse tipo de equil´ıbrio s˜ao chamadas estrat´egias gatilho (trigger ou Nash-reversion strategies). Um exemplo ´e a estrat´egia “olho-por-olho” (tit-for-tat), onde a estrat´egia de hoje do jogador ´e igual `a estrat´egia usada pelo seu advers´ario ontem.
Considere a seguinte estrat´egia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na primeira intera¸c˜ao ele joga N C (cooperar). Nos per´ıodos seguintes, se o outro jogador escolher N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contr´ario, o jogador i escolhe C (n˜ao cooperar) para sempre (note que a estrat´egia ´e extremamente punitiva: um desvio do rival e nunca mais a coopera¸c˜ao pode ser refeita). Suponha que a taxa de desconto intertemporal ´e 0 < δ < 1. Temos que o jogador 2 cooperar´a se:
∞ X t=0 −2δt≥ −1 + ∞ X t=1 −3δt ⇒ −2 1 − δ ≥ −1 + −3δ 1 − δ Logo, se: δ ≥ 1 2 = 50% ,
Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do equil´ıbrio cooperativo e seguindo o equil´ıbrio cooperativo, podem existir equil´ıbrios em que os jogadores adotem estrat´egias que envolvem coopera¸c˜ao. Esse resultado ´e conhecido como “Folk Theorem”.
Como a taxa de desconto intertemporal δ ´e determinada pela taxa de juros r do seguinte modo: δ = 1
1 + r,
ent˜ao uma vez determinada a taxa de desconto intertemporal, podemos tamb´em encontrar a taxa de juros associada. Para o exemplo acima, temos que r ≥ 1.
Leitura Sugerida
• Varian, cap´ıtulos 28 (A Teoria dos Jogos) e 29 (Aplica¸c˜oes da Teoria dos Jogos). • Nicholson e Snyder, cap´ıtulo 8 (Strategy and Game Theory).
Exerc´ıcios
1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula:
a) As estrat´egias estritamente dominantes e as estrat´egias estritamente dominadas, quando existirem.
b) As estrat´egias fracamente dominantes e as estrat´egias fracamente dominadas, quando existirem.
c) As estrat´egias que nunca s˜ao melhor resposta e as estrat´egias racionaliz´aveis.
d) Considere todo par de estrat´egias para cada um desses jogos e verifique quais s˜ao equil´ıbrios de Nash e quais n˜ao s˜ao, justificando pelo alguns desses pares para fim de aprendizagem (se vocˆe ainda estiver com dificuldades, continue escrevendo a justifica-tiva, at´e entender bem a l´ogica de se determinar um equil´ıbrio de Nash em estrat´egias puras).
e) Determine os equil´ıbrios de Nash que possuem de fato uma randomiza¸c˜ao ocorrendo para os exemplos 3 (problema de coordena¸c˜ao) e 4 (batalha dos sexos).
f) Procure determinar se existe algum EN com randomiza¸c˜ao para o jogo dilema dos pri-sioneiros. Quais s˜ao os valores para as probabilidades encontradas? O que isso significa? 2. Argumente, de maneira clara e concisa, porque a ordem de elimina¸c˜ao das estrat´egias n˜ao
afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.
3. Vimos a defini¸c˜ao de dominˆancia para estrat´egias puras. Estrat´egias mistas podem tamb´em dominar estrat´egias puras ou mesmo outras estrat´egias mistas. Considere o seguinte jogo e responda os itens a seguir.
1/2 L M R
U 3,0 0,-3 0,-4 D 2,4 4,5 -1,8
a) Mostre que as estrat´egias puras L e R n˜ao dominam estritamente a estrat´egia pura M . b) Mostre que M ´e estritamente dominada pela estrat´egia mista em que 2 escolhe L e R
com probabilidades iguais.
4. Calcule os EN dos seguintes jogos e verifique se existe alguma rela¸c˜ao desses equil´ıbrios com equil´ıbrios obtidos por meio de algum argumento de dominˆancia:
a) 1/2 L R U 1,1 0,0 D 0,0 0,0 b) 1/2 L R U 1,1 0,1
c)
1/2 L l m M
U 1,1 1,2 0,0 0,0
C 1,1 1,1 10,10 -10,-10 D 1,1 -10,-10 10,-10 1,-10
5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto seria uma oferta aceit´avel. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja, R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo ´e igual ou maior do que o que Rafael acha aceit´avel, ent˜ao eles dividem o dinheiro seguindo a oferta de Paulo. Caso contr´ario, o dinheiro ´e jogado fora. A utilidade de cada jogador ´e dada pelo tanto de dinheiro que ele recebe.
a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial). b) Quais s˜ao o(s) equil´ıbrio(s) de Nash em estrat´egias puras desse jogo?
6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.
D C
D (R$1, R$1) (R$3, R$0) C (R$0, R$3) (R$2, R$2)
a) Suponha que cada jogador deseja apenas obter o m´aximo de dinheiro poss´ıvel. Quais s˜ao os EN desse jogo?
Suponha agora que os dois jogadores s˜ao altru´ıstas, ou seja, cada um deles se importa com o bem-estar do rival. Em particular, se mi(s1, s2) ´e o payoff que o jogador i ganha e mj(s1, s2)
´e o payoff do jogador j, quando a estrat´egia jogada ´e (s1, s2), ent˜ao a utilidade do jogador i
´e dada por ui(s1, s2) = mi(s1, s2) + αmj(s1, s2), onde α ≥ 0.
b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo do tipo dilema dos prisioneiros?
c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores de α para os quais o jogo n˜ao ´e mais um dilema dos prisioneiros, encontre os EN. d) Existe algum valor de α para o qual qualquer combina¸c˜ao de estrat´egias puras ser´a um
equil´ıbrio?
7. Considere o jogo denotado por G(n, k) de adivinhar a m´edia (“guessing the average”, Osborne e Rubinstein), onde k ´e a quantidade de participantes que simultanemente escolhe um n´umero inteiro entre 1 e n (inclusive 1 e n). Um prˆemio de R$60 ´e dividido igualmente entre os jogadores que escolheram o n´umero mais perto da metade da m´edia de todas as escolhas (ou seja, se a metade da m´edia foi 3, e os n´umero mais pr´oximos foram 2 e 4, os participantes que escolheram esses valores dividem o prˆemio. J´a se a metade da m´edia foi 3,3, todos os participantes que escolheram 3 levam o prˆemio)
a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.
b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 ´e um EN. c) Argumente que em qualquer EN o prˆemio ´e dividido por todos os participantes. d) Argumente que o conjunto de estrat´egias descrito no item b) ´e o ´unico EN.
8. O ex´ercito de Pat´opolis deve decidir se ataca ou n˜ao o ex´ercito de Gans´opolis, que est´a ocupando uma ilha que pertencia `a Pat´opolis, situada entre as duas cidades. No caso de um ataque, o ex´ercito de Gans´opolis pode lutar ou recuar de volta `a sua cidade, por meio de uma ponte que liga a ilha `a cidade. Cada cidade prefere ocupar a ilha a n˜ao ocup´a-la, e uma guerra ´e o pior resultado poss´ıvel para ambas as cidades. Modele essa situa¸c˜ao como um jogo na forma extensiva e mostre que o ex´ercito de Gans´opolis pode melhorar seu payoff se queimar a ponte que liga a ilha `a sua cidade, eliminando a op¸c˜ao de recuar. Explique esse resultado em termos intuitivos e relacione com o que foi visto em aula.
9. Considere o seguinte jogo na forma extensiva:
t 1 E 2 2 M @ @ @ @ @ @ D t 2 r A A A A A A l 3 1 1 0 l A A A A A A r t 0 0 0 1 t t t t
a) Escreva o conjunto de estrat´egias desse jogo e encontre a forma estrat´egica associada. b) Encontre os EN em estrat´egias puras.
c) Encontre os ENPS em estrat´egias puras.
10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parˆenteses ´e do jogador 1 e o payoff na parte inferior ´e do jogador 2. Reponda aos itens abaixo.
2 0 v 1 E @ @ @ @ @ @ @@R S -D v 2 r @ @ @ @ @ @ R l ? m 1 3 1 2 4 0 l @ @ @ @ @ @ R r ? m v 4 0 0 2 3 3
a) Descreva os conjuntos de estrat´egias dos dois jogadores. b) Qual a representa¸c˜ao desse jogo na forma normal?
c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?
11. (P2-1/19) Considere o seguinte jogo na forma extensiva: r I ? L M H H H H H H H HHj R 0 2 r II r II a @ @ @ @ @ @ R b 1 1 −1 −1 −2 4 c @ @ @ @ @ @ R d r r I r P @ @ @ @ @ @ R Q −1 3 −1 5
As a¸c˜oes do jogador I est˜ao representadas por letras mai´usculas e as a¸c˜oes do jogador II por letras min´usculas. O payoff na parte superior em parˆenteses ´e do jogador I e o payoff na parte inferior ´e do jogador II.
a) Qual o n´umero de estrat´egias puras do jogador 1? E do jogador 2? b) Qual a representa¸c˜ao desse jogo na forma normal?
c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?
d) Quais s˜ao os equil´ıbrios de Nash (EN) em estrat´egias puras desse jogo? e) Quais s˜ao os EN perfeito em subjogos (em estrat´egias puras)?
12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de cima do vetor de payoffs ´e o da firma entrante e o payoff na parte de baixo desse vetor ´e o da firma monopolista. s Entrante ˜ nE @ @ @ @ R E 0 60 sMonopolista ˜ nL @ @ @ @ R L s Entrante GE A A A A U PE 8 30 15 15 PE A A A A U GE s −3 0 −12 −6
a) Determine os conjuntos de todas as estrat´egias para os dois jogadores. b) Encontre os EN em estrat´egias puras do jogo.
c) Encontre os ENPS do jogo.
d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo-nopolista escolheu ˜nL ou L. Descreva todas as estrat´egias que a firma Entrante possui agora.
13. (P4-1/19) Considere o seguinte jogo na forma extensiva: v Jog. 1 A @ @ @ @ @ @ @@ B v Jog. 2 Jog. 2 D A A A A A A AA F 2 0 D A A A A A A AA F 0 1 v Jog. 1 v A A A A A L 3 10 R 0 1 v A A A A A L 3 0 R 1 1
onde o payoff na parte superior em parˆenteses ´e do jogador 1 e o payoff na parte inferior em parˆenteses ´e do jogador 2.
a) Descreva as estrat´egias dos jogadores.
b) Derive a forma normal do jogo e encontre todos os equil´ıbrios de Nash (EN) do jogo em estrat´egias puras.
c) Encontre todos os equil´ıbrios de Nash perfeitos em subjogos (ENPS) em estrat´egias puras.