Microeconomia2Grad NA5 TJ

(1)

MICROECONOMIA 2 – GRADUAC

¸ ˜

AO

Departamento de Economia, Universidade de Bras´ılia

Notas de Aula 5 – Teoria dos Jogos

Prof. Jos´

e Guilherme de Lara Resende

1 Introdu¸

c˜

ao

1.1 Interdependˆ

encia Estrat´

egica

A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo analisado.

No modelo de consumo usual, o consumidor decide entre poss´ıveis cestas de bens, dados os pre¸cos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produ¸cão e dados os pre¸cos dos insumos e dos bens que vende. No modelo de equil´ıbrio geral competitivo, tanto os consumidores quanto as firmas tomam os pre¸cos como dados e não há intera¸cão estratégica entre os agentes econômicos.

Porém, existem situa¸cões onde os resultados das a¸cões de um agente dependem diretamente do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente depende não só da sua a¸cão, mas da a¸cão de outros agentes. Modelos de oligopólio são um exemplo, em que o lucro de determinada firma depende do que suas rivais fazem.

Um jogo então caracteriza qualquer situa¸cão desse tipo, em que cada participante deve levar em conta a estratégia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise resulta em um conceito de solu¸cão particular, chamado equil´ıbrio.

A maioria dos conceitos tem sua origem no conceito de equil´ıbrio de Nash e são, usualmente, equil´ıbrios de Nash que satisfazem certas propriedades. Por isso, são chamados refinamentos. Cada refinamento tenta solucionar alguma deficiência do conceito de equil´ıbrio de Nash particular a alguma situa¸cão ou modelo.

1.2 No¸

c˜

oes Preliminares

Defini¸cão (informal): Jogo. Um jogo refere-se a qualquer situa¸cão envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependência estratégica.

Vamos estudar jogos não-cooperativos: analisamos cada agente separadamente e não como um grupo. Essa defini¸cão não implica que um jogador não possa cooperar com o outro, ela é apenas de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não há grupos de agentes se comportando como um único agente.

(2)

Para descrevermos um jogo é necessário conhecermos três objetos: • Os jogadores,

• A regra do jogo,

• O resultado do jogo (payoff dos jogadores).

São feitas duas hipóteses básicas sobre os jogadores:

1. Os jogadores são racionais. As a¸cões de um jogador são consistentes com o objetivo desejado: maximizar o seu payoff.

2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con-seguem fazer as mesmas inferências que realizamos sobre a situa¸cão em que se encontram. A segunda hipótese não é tão inócua quanto parece. Na teoria de equil´ıbrio geral os indiv´ıduos são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos não precisam conhecer toda a estrutura de teoria de equil´ıbrio geral ao tomarem suas decisões.

As duas formas mais comuns de se representar um jogo s˜ao:

• Forma Estratégica: Representa¸cão em forma matricial. Esta forma é adequada para situa¸cões onde os jogadores se “movem” (decidem suas a¸cões) simultaneamente (modelo estático). Também conhecida como forma normal.

• Forma Extensiva: Representa¸cão em forma de árvore. Esta forma é adequada para situa¸cões onde exista uma ordem cronológica dos eventos do jogo (modelo dinâmico). Também conhecida como forma sequencial.

Existe uma correspondência entre essas duas formas, que veremos mais a frente. Vimos que o princ´ıpio básico de eficiência usado em economia é o critério de Pareto. Dizemos que o resultado A do jogo é Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar melhor em B do que em A.

Defini¸cão: Um resultado de um jogo é Pareto ótimo (ou eficiente de Pareto) se não é Pareto-dominado por nenhum outro resultado poss´ıvel para o jogo.

1.3 Conhecimento Comum

Uma hipótese usada em teoria dos jogos é a de conhecimento comum (“common knowledge”), que assume que a racionalidade dos jogadores e a estrutura do jogo são de conhecimento comum de todo jogador.

Se considerarmos dois jogadores, um determinado fato ´e de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo racioc´ınio valendo para o jogador 2.

(3)

Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedi-mentos de elimina¸cão de estratégias dominadas. Mais ainda, ela é importante para o conceito de equil´ıbrio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas condi¸cões).

Myerson argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do jogo é de conhecimento comum desses jogadores. A formaliza¸cão matemática dessa hipótese é complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para entender a importância dessa hipótese.

Myerson cita uma fábula que ilustra bem as implica¸cões da hipótese. Em uma vila, existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os homens da vila, exceto ao seu marido. Essas tradi¸cões são de conhecimento comum de todos os habitantes da vila.

Suponha que todas as esposas foram infi´eis. Logo, cada homem sabia da infidelidade de todas as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa havia sido infiel. Qual foi o resultado dessa revela¸c˜ao?

O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de número 100, todos se lamentaram. Tente entender porque a hipótese de conhecimento comum leva a esse resultado. Para isso, é necessário compreender o que a informa¸cão do visitante adicionou ao conhecimento dos homens da vila.

O racioc´ınio fica mais fácil de compreender se considerarmos primeiro o caso em que apenas uma esposa traiu o marido. A informa¸cão nova que o visitante revelou foi informar a todos da vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, não tinha conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciência de que a sua esposa é que fora infiel e se lamentaria na primeira noite depois da revela¸cão do visitante, já que os costumes da vila são de conhecimento comum de todos os seus habitantes.

Caso houvesse duas esposas infiéis, então 98 homens da vila saberiam que havia duas esposas infiéis e 2 homens teriam conhecimento de apenas um caso de infidelidade, já que não saberiam que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguém se lamentaria o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda noite, após observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que têm conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam conta de que foram tra´ıdos e se lamentariam. O racioc´ınio estende-se de modo análogo para o caso de 100 esposas infiéis: no centésimo dia, todos os maridos se dariam conta de que foram tra´ıdos e se lamentariam.

(4)

2 Jogos na Forma Estrat´

egica

2.1 Defini¸

c˜

oes e Exemplos de Jogos

Defini¸cão: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica é uma cole¸cão G = (Si, ui)I_i=1, onde I é o número de jogadores, Si é o conjunto de estratégias

dispon´ıveis ao jogador i, para todo i ∈ I, e ui :

QI

k=1Sk → R ´e a fun¸c˜ao de payoff (a utilidade)

do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I.

Observe que a interdependência estratégica entre os agentes aparece explicitamente na hipótese de que o payoff de cada jogador é descrita pela fun¸cão ui : S1× · · · × Si× · · · × SI → R, ou seja,

ui depende não apenas da estratégia si escolhida por i, mas também das estratégias de todos os

outros jogadores, s1, . . . , si−1, si+1, . . . , sI.

Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.

1↓ / 2 → Cara Coroa Cara −1, 1 1, −1 Coroa 1, −1 −1, 1

Nota¸cão: Vamos usar a seguinte conven¸cão, corriqueira e adotada em diversos livros, para todos os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador-coluna”).

Para o jogo do Exemplo 1, temos que: Jogadores: I = {1, 2};

Estrat´egias: S1 = S2 = {Cara, Coroa};

Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1;

u1(Cara,Cara) = u1(Coroa,Coroa) = −1;

u2(s1, s2) = −u1(s1, s2), ∀(s1, s2) ∈ S1 × S2.

No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo imprevis´ıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleatório ou de modo que o seu rival não saiba exatamente qual o lado da moeda será escolhido.

Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro jogador. Para jogos de soma zero com dois jogadores, os conceitos de solu¸cão usados podem envolver os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado por von Neuman e Morgenstern, no livro “theory of games and economic behavior ”, publicado em 1944 e um marco da teoria dos jogos.

(5)

Um tipo de jogo mais geral do que os de soma zero são os jogos de soma fixa (dos payoffs), também chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, então o jogo é de soma zero. Logo, jogos de soma zero são um tipo de jogos de soma fixa.

Em um jogo de soma fixa, um jogador só aumenta o seu payoff se o payoff do outro jogador se reduzir pelo valor desse aumento. Então qualquer resultado deste jogo é Pareto eficiente, pois aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse tipo de jogo é adequado para modelar situa¸cões em que se tem um “vencedor” e um “perdedor”. Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador ganhar, ele obtém o payoff +1, enquanto o perdedor obtém o payoff −1. Se o jogo empatar, cada jogador obtém payoff 0. Evidentemente, muitos dos jogos analisados em economia não são de soma fixa (ou seja, podemos dizer que são de soma variável ), como é o caso dos Exemplos 2 e 3 a seguir. Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos na prisão, por não ter colaborado com a justi¸ca. A matriz abaixo descreve este jogo.

L.A.↓ / Laelio → Confessar N˜ao Confessar Confessar −3, −3 −1, −5 N˜ao Confessar −5, −1 −2, −2

Exemplo 3: Problema de Coordena¸cão. Suponha que duas pessoas estão viajando separada-mente para o Rio de Janeiro e combinaram de se encontrar para almo¸car no dia seguinte. Porém esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almo¸car sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almo¸co no restaurante da barra é mais agradável do que o almo¸co no restaurante do centro. Porém, eles se desencontrarem é a pior situa¸cão poss´ıvel. A matriz abaixo descreve este jogo.

1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1

Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde. Concordaram com duas op¸cões: ir a um jogo de futebol ou fazer compras. Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras. A matriz abaixo descreve este jogo.

Nelson↓ / Renata → Futebol Compras

(6)

Os Exemplos 3 e 4 modelam problemas de coordena¸cão: os dois jogadores devem escolher suas estratégias de modo que fa¸cam o mesmo programa. Veremos mais à frente que cada um desses dois jogos possui dois equil´ıbrios de Nash em estratégias puras, em que ambos os jogadores devem coordenar suas estratégias para alcan¸car um desses equil´ıbrios. Além disso, o Exemplo 4 envolve uma disputa de poder, em que o equil´ıbrio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem juntos ao futebol), é diferente do equil´ıbrio que a jogadora 2, Renata, prefere, (C, C) (os dois irem juntos às compras). Ambos os jogadores preferem estar em uma situa¸cão de equil´ıbrio do que estar em uma situa¸cão de desequil´ıbrio, (F, C) ou (C, F ), ou seja, em que um escolhe um programa diferente do escolhido pelo outro. Temos então uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equil´ıbrio preferido.

2.2 Conceitos de Dominˆ

ancia e Estrat´

egias Racionaliz´

aveis

Nas defini¸cões a seguir vamos denotar por si uma estratégia qualquer de um jogador i arbitrário

e por Si o conjunto de todas as estrat´egias dispon´ıveis para o jogador i. Al´em disso, s−i denota

um grupo de estrat´egias para os outros jogadores que n˜ao o jogador i (ou seja, s−i especifica uma

estrat´egia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estrat´egias

dispon´ıveis para os outros jogadores que n˜ao o jogador i.

Defini¸cão: Estratégia Estritamente Dominante. A estratégia ˆsi é estritamente (ou

forte-mente) dominante para o jogador i em um dado jogo se para toda estrat´egia si 6= ˆsi, si ∈ Si,

vale:

ui(ˆsi, s−i) > ui(si, s−i), para todo s−i ∈ S−i.

Logo, uma estratégia ˆsi é estritamente dominante para o jogador i se ela for a única estratégia

que maximiza o payoff desse jogador, quaisquer que sejam as estrat´egias escolhidas pelos outros jogadores.

Para o jogo dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente dominante para os dois prisioneiros. Ela é a estratégia que gera o maior payoff para cada prisioneiro, qualquer que seja a escolha do outro prisioneiro. Dizemos que (C, C) é um equil´ıbrio em estratégias estritamamente dominantes.

Observe que o equil´ıbrio (C, C) é Pareto dominado pelo conjunto de estratégias (N C, N C), ou seja, cada jogador obtém um payoff maior em (N C, N C) do que em (C, C). Temos, então, um caso onde o comportamento individual maximizador dos agentes envolvidos resulta em um equil´ıbrio Pareto ineficiente. Logo, na presen¸ca de interdependência estratégica, a intera¸cão de jogadores cujo objetivo é maximizar o seu próprio bem-estar pode levar a situa¸cões Pareto-ineficientes.

Estratégias estritamente dominantes não são comuns. É comum situa¸cões onde não existem estratégias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra.

Exemplo 5: Observe que o jogo a seguir n˜ao possui nenhuma estrat´egia estritamente dominante:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5

(7)

Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar, de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas por qualquer jogador.

Defini¸cão: Estratégia Estritamente Dominada. Uma estratégia ¯si é estritamente (ou

forte-mente) dominada para o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:

ui(ˆsi, s−i) > u1(¯si, s−i), para todo s−i ∈ S−i.

Dizemos que ˆsi domina estritamente ¯si.

Observe que uma estratégia estritamente dominante domina estritamente todas as outras es-tratégias do jogador. Logo, todas as outras estratégias são estritamente dominadas pela estratégia estritamente dominante.

Vamos analisar o jogo descrito no Exemplo 5 acima, dado por:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5

Para o jogador 1, a estratégia D é estritamente dominada pela estratégia U . Essa é a única estratégia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin-armos essa estratégia do jogo, usando o argumento de que o jogador 1 nunca a escolherá, já que U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos então o seguinte jogo reduzido:

1↓ / 2 → L M R

U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1

Para esse jogo reduzido, a estrat´egia M domina estritamente R, para o jogador 2. Eliminando a estrat´egia R, obtemos:

1↓ / 2 → L M

U 5, 2 4, 3 C 1, 4 3, 2

J´a para este novo jogo reduzido, a estrat´egia U domina estritamente C, para o jogador 1. Eliminando C, obtemos:

1↓ / 2 → L M

(8)

Finalmente, a estratégia L é estritamente dominada por M , para o jogador 2, neste último subjogo. Por meio desse “procedimento de elimina¸cão de estratégias estritamente dominadas (PEEED)”, obtivemos (U, M ) (isto é, o jogador 1 escolhe U , o jogador 2 escolhe M ) como solu¸cão do jogo. Dizemos que (U, M ) é um equil´ıbrio obtido pela elimina¸cão de estratégias estritamente dominadas (e que U e M são estratégias que sobrevivem ao PEEED).

A ideia do procedimento é, portanto, simples. Ele usa implicitamente a hipótese de conhecimento comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos a solu¸cão (U, M ), supomos implicitamente que o jogador 2 sabe que o jogador 1 é racional e nunca jogará a estratégia D. Como o jogador 1 sabe que o jogador 2 é racional e também que 2 sabe que ele é racional e nunca jogará D, então o jogador 1 infere que 2 nunca jogará R. A continua¸cão desse racioc´ınio permite concluir que (U, M ) é a solu¸cão do jogo.

O problema com o PEEED é que ele também nem sempre leva a alguma solu¸cão. No Exemplo 5 abaixo, não existe nenhuma estratégia estritamente dominada e, portanto, não conseguimos eliminar nenhuma estratégia do jogo usando o PEEED. Logo, não conseguimos fazer qualquer predi¸cão mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou, pelo menos, o que não pode ser resultado).

Exemplo 6: Considere o jogo:

1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0

Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estrita-mente dominadas.

Podemos enfraquecer as defini¸cões de dominância estrita, relaxando a exigência de que o payoff seja sempre estritamente maior nas defini¸cões acima, de modo a obter o seguinte conceito.

Defini¸cão: Estratégia Fracamente Dominante. Uma estratégia ˆsi ∈ Si é fracamente

domi-nante para o jogador i se para toda estrat´egia si 6= ˆsi, si ∈ Si, valer que:

ui(ˆsi, s−i) ≥ ui(si, s−i), para todo si ∈ Si,

com desigualdade estrita para pelo menos um s−i.

Evidentemente, toda estratégia estritamente dominante é fracamente dominante, mas a volta não vale: no Exemplo 6 acima, as estratégias U de 1 e L de 2 são fracamente dominantes, mas não estritamente dominantes, já que para o jogador 1, quando 2 escolhe L, escolher U dá payoff estritamente maior do que escolher D. Porém se 2 escolhe R, então o payoff para 1 ao escolher U é igual (e não maior) ao payoff que ele obtém se escolher D. Note que racioc´ınio similar vale para o jogador 2, com rela¸cão a sua estratégia L. Dizemos que (U, L) é um equil´ıbrio formado por estratégias fracamente dominantes.

Problema similar ao que ocorre com a no¸cão de estratégias estritamente dominantes ocorre com o conceito de estratégias fracamente dominantes: pode ser que não exista solu¸cão para o jogo em estratégias fracamente dominantes, como o Exemplo 6 ilustra.

(9)

Exemplo 7: Considere o seguinte jogo: E D C (2, 1) (3, 0) M (4, 0) (2, 1) B (4, 4) (3, 4) ´

E fácil observar que não existe estratégia fracamente dominante para ambos os jogadores (apenas B é fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar o jogo acima, um relaxamento da no¸cão de estratégia estritamente dominada.

Defini¸cão: Estratégia Fracamente Dominada. Uma estratégia ¯sié fracamente dominada para

o jogador i quando existir uma outra estrat´egia ˆsi ∈ Si tal que:

ui(ˆsi, s−i) ≥ ui(¯si, s−i), para todo s−i ∈ S−i,

com desigualdade estrita para pelo menos um s−i. Dizemos ent˜ao que ˆsi domina fracamente ¯si.

Vamos aplicar um procedimento de elimina¸cão de estratégias fracamente dominadas (PEEFD) ao jogo do exemplo 7 acima. Podemos fazê-lo de três modos distintos:

1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D dão o mesmo payoff para o jogador 2 e não podemos eliminar nenhuma dessas estratégias. Sobram então (B, E) e (B, D) como poss´ıveis resultados do jogo.

2. Se eliminarmos primeiro C para o jogador 1, a estrat´egia E do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante, obtendo (B, D) (payoff (3,4)) como solu¸c˜ao.

3. Se eliminarmos primeiro M para o jogador 1, a estrat´egia D do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante, obtendo (B, E) (payoff (4,4)) como solu¸c˜ao.

Portanto, a ordem de elimina¸cão das estratégias fracamente dominadas pode afetar a solu¸cão obtida. Esta é uma caracter´ıstica ruim deste procedimento, pois a solu¸cão do jogo pode mudar conforme a ordem de elimina¸cão das estratégias. Este problema não ocorre quando eliminamos estratégias estritamente dominadas.

O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo-gadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a for¸ca dessa hipótese. Usando a hipótese de conhecimento comum, podemos eliminar outras estratégias além das dominadas.

Defini¸cão: Melhor Resposta. A estratégia ˆsi é a melhor resposta do jogador i à estratégia ˆs−i

dos outros jogadores se:

(10)

Portanto, a estratégia ˆsi é a melhor resposta do jogador i para a estratégia ˆs−i dos outros

jo-gadores se ela for a ou uma das escolhas ótimas de i quando ele acreditar que os outros jogadores irão selecionar a estratégia ˆs−i. Um jogador não deve escolher uma estratégia que nunca é uma

melhor resposta, pois neste caso não existe justificativa para o uso dessa estratégia. Observe que estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedi-mento de elimina¸cão de estratégias que nunca são a melhor resposta, de modo similar ao PEEED. Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hipótese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.

Defini¸cão: Estratégias Racionalizáveis. As estratégias em Si do jogador i que sobrevivem

ao procedimento de elimina¸cão de estratégias que nunca são a melhor resposta são chamadas racionalizáveis.

Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores (nenhum rival escolherá uma estratégia não racionalizável).

´

E poss´ıvel mostrar que as seguintes afirma¸c˜oes s˜ao verdadeiras:

• A ordem de remo¸cão das estratégias que nunca são a melhor resposta não altera o resultado obtido;

• Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma; • O conjunto de estratégias racionalizáveis está contido no conjunto de estratégias que

sobre-vivem ao PEEED;

• Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto de estratégias que sobrevivem ao PEEED.

Porém, o conceito de estratégia racionalizável nem sempre fornece uma solu¸cão. Para o Exemplo 3, a batalha dos sexos, todas as estratégias são racionalizáveis e, portanto, o conceito não informa nada sobre o que esperar como solu¸cão deste jogo. Queremos tornar as predi¸cões sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equil´ıbrio de Nash (EN), que, satisfeitas certas condi¸cões, sempre aponta pelo menos uma solu¸cão para qualquer jogo na forma estratégica. Esse é o mais importante conceito em teoria dos jogos.

(11)

2.3 Equil´ıbrio de Nash

O máximo que podemos desenvolver usando apenas a hipótese de conhecimento comum é o conceito de estratégias racionalizáveis, visto acima. Para obtermos qualquer outro conceito mais robusto, temos que adicionar alguma hipótese nova.

Defini¸cão: Equil´ıbrio de Nash em Estratégias Puras. Um conjunto de estratégias s∗ = (s∗₁, . . . , s∗_I) é um equil´ıbrio de Nash (EN) (em estratégias puras) para um determinado jogo se para todo jogador i, i = 1, . . . , I, valer que:

ui(s∗i, s ∗

−i) ≥ ui(si, s∗−i), para todo si ∈ Si.

Dizemos que um EN é estrito se as desigualdades acima forem estritas. Logo, em um EN estrito, não existe, para nenhum dos jogadores, nenhuma outra estratégia diferente da de equil´ıbrio que resulte em um payoff igual ao de equil´ıbrio, dado que os outros jogadores estão selecionando as suas estratégias de equil´ıbrio.

Em um equil´ıbrio de Nash, a estratégia de cada jogador é a melhor resposta para as estratégias que são de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam corretos sobre suas conjecturas a respeito das estratégias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas.

O conceito de EN traz uma predi¸cão mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estratégias são racionalizáveis, mas apenas (F, F ) e (C, C) são EN em estratégias puras. Vamos mostrar que (F, F ) é um EN estrito. Se 1 escolher F , então 2 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 2 para a escolha de F feita por 1. De modo similar, se 2 escolher F , então 1 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 1 para a escolha de F feita por 2. Isso mostra que (F, F ) é um EN estrito.

Usando um argumento similar, não é dif´ıcil observar que o jogo “Cara ou Coroa”, discutido no Exemplo 1 acima, não possui EN em estratégias puras. De modo geral, não podemos garantir a existência de EN em estratégias puras. Intuitivamente, qualquer solu¸cão do jogo “Cara ou Coroa” envolve ambos os jogadores escolhendo suas estratégias de modo imprevis´ıvel. Para formalizar essa possibilidade de randomiza¸cão, vamos introduzir o conceito de estratégias mistas.

Defini¸cão: Estratégias Mistas. Seja Si o conjunto de estratégias puras do jogador i. Uma

estratégia mista do jogador i é uma distribui¸cão de probabilidade sobre Si, ou seja, uma fun¸cão

σi : Si → [0, 1], que atribui uma probabilidade a cada estrat´egia pura do jogador i. Logo, temos

que:

0 ≤ σi(si) ≤ 1 , ∀si e

X

si∈Si

σi(si) = 1 .

O simplex de Si, representado por ∆Si, ´e o conjunto das estrat´egias mistas do jogador i. Este

conjunto inclui também as estratégias puras do jogador (estratégias mistas degeneradas), já que se σ(¯si) = 1 para alguma estratégia ¯si, então isso significa que ¯si é escolhida com probabilidade 1.

(12)

Se os jogadores randomizarem suas estratégias, então o resultado do jogo deixará de ser de-termin´ıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja σ = (σ1, σ2) uma cole¸cão de estratégias mistas para os jogadores 1 e 2. A utilidade esperada

do jogador 1 (similar para 2) para o conjunto de estrat´egias mistas σ ´e calculada como: u1(σ1, σ2) =

X

s1∈S1,s2∈S2

[σ1(s1) × σ2(s2)] × u1(s1, s2)

Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estrat´egias mistas σ1 = (1/4◦Ca, 3/4◦

Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do

jogador 1 quando ele escolhe a estratégia σ1 e o jogador 2 escolhe a estratégia σ2 é:

u1(σ1, σ2) =

X

s1∈S1,s2∈S2

σ1(s1) × σ2(s2) × u1(s1, s2)

= σ1(Ca) × σ2(Ca) × u1(Ca, Ca) + σ1(Ca) × σ2(Co) × u1(Ca, Co)+

+ σ1(Co) × σ2(Ca) × u1(Co, Ca) + σ1(Co) × σ2(Co) × u1(Co, Co)

= 1 4× 2 3 × (−1) + 1 4 × 1 3× (+1) + 3 4× 2 3 × (+1) + 3 4 × 1 3 × (−1) = 1 6

Podemos estender imediatamente os conceitos de estratégias dominantes e dominadas, proced-imentos de elimina¸cão e estratégias racionalizáveis, ao permitir que os jogadores possam escolher estratégias mistas, além de estratégias puras.

Defini¸cão: Equil´ıbrio de Nash. Um conjunto de estratégias σ∗ = (σ∗₁, . . . , σ∗_I) é um equil´ıbrio de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que:

ui(σ∗i, σ ∗

−i) ≥ u1(σi, σ∗−i), para todo σi ∈ ∆Si.

A defini¸cão acima de EN permite que os jogadores randomizem entre as estratégias puras. Logo, eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que, em equil´ıbrio, a hipótese de expectativas mutualmente corretas implica que cada jogador conhece o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus rivais).

Pela defini¸cão de EN com estratégias mistas, para cada conjunto de estratégias dos jogadores candidato a equil´ıbrio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégias can-didatas a equil´ıbrio. Considerando que existem infinitas estratégias mistas, este procedimento de cerifica¸cão para determinar EN é inviável. Como fazemos então para encontrar todos os equil´ıbrios de Nash? O teorema abaixo fornece uma resposta.

Teorema: Equivalência de Defini¸cões. As seguintes afirmativas são equivalentes: 1. (σ∗₁, σ₂∗) ∈ ∆(S1) × ∆(S2) é um equil´ıbrio de Nash;

2. Para todo jogador i, ui(σ∗1, σ2∗) = ui(si, σ∗−i), para todo si jogado com probabilidade positiva;

e ui(σ1∗, σ ∗

(13)

O teorema fornece um algoritmo para encontrar equil´ıbrios de Nash em estratégias mistas. Ele diz que em um EN em estratégias mistas, duas estratégias puras de um jogador que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que será igual ao payoff obtido no equil´ıbrio. Esse resultado é consequência de utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estratégias mistas. Caso existissem duas estratégias puras que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff maior do que o da outra, o jogador não deveria atribuir probabilidade positiva à estratégia que lhe dá o payoff mais baixo, pois isso reduziria o seu payoff de equil´ıbrio.

Ou seja, dadas as estratégias escolhidas em equil´ıbrio pelos outros jogadores, esse jogador é indiferente entre qualquer estratégia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estratégias puras lhe dão um payoff igual ou maior do que qualquer outra estratégia que ele não escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador é fazer (σ₁∗, σ∗₂) um equil´ıbrio.

Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem-plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz abaixo essa situa¸c˜ao.

1↓ / 2 → Cara (β) Coroa (1 − β) Cara (α) −1, 1 1, −1 Coroa (1 − α) 1, −1 −1, 1

Pelo teorema acima, essas randomiza¸c˜oes s˜ao um EN se, e somente se: u1(Ca, σ2) = u1(Co, σ2) e u2(σ1, Ca) = u2(σ1, Co),

onde σ1 e σ2 representam as estrat´egias mistas dos jogadores 1 e 2, respectivamente. Portanto:

u1(Ca, σ2) = u1(Co, σ2) ⇒ −1 × β + 1 × (1 − β) = 1 × β − 1 × (1 − β) ⇒ β = 0,5

u2(σ1, Ca) = u2(σ1, Co) ⇒ 1 × α − 1 × (1 − α) = −1 × α + 1 × (1 − α) ⇒ α = 0,5

Logo, σ1 = (1/2◦ Ca;1/2◦ Co) e σ2 = (1/2◦ Ca;1/2◦ Co) ´e um EN em estrat´egias mistas. Observe

que:

u1(Ca, σ2) = u1(Co, σ2) = u1(σ1, σ2) = 0

u2(σ1, Ca) = u2(σ1, Co) = u2(σ1, σ2) = 0 ,

(14)

2.4 Teorema de Existˆ

encia e Outros Resultados

Teorema de Existˆencia de Equil´ıbrio de Nash. Todo jogo finito na forma normal possui pelo menos um equil´ıbrio de Nash, assumindo que os jogadores possam usar estrat´egias mistas.

O Teorema de Existência garante que para todo jogo na forma estratégica finito existirá pelo menos um equil´ıbrio de Nash (EN). Logo o conceito de EN não é problemático no sentido que para qualquer jogo finito podemos garantir que existirá uma solu¸cão para ele, se usarmos o conceito de EN como solu¸cão para o problema de interdenpedência estratégica modelado no jogo.

A rela¸cão entre equil´ıbrio de Nash e os conceitos de equil´ıbrio com estratégias dominantes é descrita pelos seguintes resultados:

1. Se existir equil´ıbrio em estratégias estritamente dominantes, ele será único e será o único EN do jogo. O mesmo vale para equil´ıbrios obtidos com o PEEED: se existir, será único e o único EN do jogo.

2. Se existir equil´ıbrio em estratégias fracamente dominantes, então ele será um EN. Neste caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O Exemplo 6 acima ilustra esse caso, em que (D, R) é um EN formado por estratégias fracamente dominadas.

3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da ordem de elimina¸c˜ao adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele ser´a um EN.

Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6: 1↓ / 2 → L R

U 1, 1 0, 0 D 0, 0 0, 0

Esse jogo possui dois EN, dados por (U, L) e (D, R). Não existe equil´ıbrio em estratégias estritamente mistas. O EN (U, L) é também equil´ıbrio em estratégias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (D, R) é um equil´ıbrio formado por estratégias fracamente dominadas e portanto não pode ser encontrado usando o PEEFD.

O Exemplo 6 acima mostra que podem existir equil´ıbrios de Nash formados por estratégias fracamente dominadas. O resultado de um jogo ser desse tipo é algo estranho, pois envolve cada jogador escolher uma estratégia para a qual existe outra op¸cão que dará sempre um payoff maior ou igual, independentemente do que os outros jogadores fa¸cam. Existe um refinamento do EN para jogos na forma normal, chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equil´ıbrio ocorrer. O refinamento da mão-trêmula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfa¸ca a condi¸cão imposta pelo refinamento. No exemplo acima, apenas o EN (U, L) é perfeito da mão-trêmula.

Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não são considerados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento e algum ou alguns que não o satisfazem.

(15)

3 Jogos na Forma Extensiva

3.1 Introdu¸

c˜

ao

Sabemos que para descrevermos um jogo são necessários três objetos: 1) os jogadores; 2) a regra do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva é a representa¸cão mais adequada para situa¸cões dinâmicas.

Defini¸cão Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma extensiva (ou forma sequencial ) em forma de árvore, onde em cada conjunto de informa¸cão um jogador escolhe uma a¸cão que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes propriedades:

• Se inicia em um único nó de decisão, chamado nó inicial. Logo, todo nó do jogo que não é o nó inicial é um sucessor deste nó, no sentido que podemos descrever qualquer nó a partir do nó inicial mais uma série de a¸cões tomadas (a história ocorrida do jogo até aquele nó); • Todo nó do jogo, com exce¸cão do nó inicial (que não possui nenhum predecessor), tem um

´

unico n´o predecessor imediato;

• Nos nós finais do jogo, nenhum jogador faz qualquer escolha (nenhuma a¸cão pode ser tomada) e nestes nós são especificados os payoffs do jogo para a forma de como o jogo foi jogado, descrita pela história do jogo narrada pelo nó final considerado.

Defini¸cão: Jogo de Informa¸cão Perfeita. Um jogo é chamado de informa¸cão perfeita se cada jogador observa perfeitamente todas as a¸cões escolhidas por todos os jogadores que se moveram antes dele.

Em um jogo de informa¸cão perfeita, cada nó de decisão constitui um conjunto de informa¸cão por si só, já que todos os jogadores observam todas as decisões tomadas anteriormente a qualquer momento que for jogar. Se um jogo não for de informa¸cão perfeita, então existe pelo menos um ponto do jogo em que algum jogador não sabe o que foi escolhido no momento anterior. Neste caso, unimos os nós que fazem parte de um mesmo conjunto de informa¸cão por um retângulo pontilhado, como ilustra o jogo à direita na figura abaixo, indicando que existe (pelo menos) um conjunto de informa¸cão que contém mais de um nó de decisão de um jogador, o que significa que este jogador não sabe exatamente em que nó está do conjunto de informa¸cão (ou seja, ele não observa a tomada de decisão feita no nó predessor imediato).

Jogo de Informa¸c˜ao Perfeita

t 1 E @ @ @ @ @ @ D t 2 2 r A A A A A A l 1 0 l A A A A AA r t 0 3 t t t t

Jogo de Informa¸c˜ao Imperfeita

t 1 E @ @ @ @ @@ D t ₂ r A A A A A A l 1 0 l A A A A A A r t 0 3 t t t t

(16)

No jogo à esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada nó de decisão de 2 forma um conjunto de informa¸cão por si só. Já no jogo à direita da figura acima, o jogador 2 não observa se 1 escolhe E ou D, ou seja, os dois nós de decisão de 2 formam um único conjunto de informa¸cão.

Evidentemente, os nós de decisão que pertencem a um mesmo conjunto de informa¸cão devem ser todos referentes ao mesmo jogador. Além disso, as a¸cões que o jogador pode tomar em nós de decisão que estão no mesmo conjunto de informa¸cão devem ser iguais. Caso isso não ocorresse e existissem dois nós de decisão no mesmo conjunto de informa¸cão, com a¸cões não exatamente iguais, então o jogador seria capaz de inferir em que nó está, ao realizar que as a¸cões dispon´ıveis naquele nó são diferentes das a¸cões do outro nó. Portanto, nós de decisão que pertencem a um mesmo conjunto de informa¸cão pertencem ao mesmo jogador e possuem exatamente as mesmas a¸cões dispon´ıveis. Defini¸cão: Jogo de Memória Perfeita. Um jogo é de memória perfeita quando nenhum jogador esquece o que já sabia (inclusive a¸cões que já foram tomadas durante o desenrolar do jogo).

A árvore de jogo ilustrada na figura abaixo não apresenta memória perfeita. Neste exemplo, o jogador 1, na terceira rodada, após a sua escolha na primeira rodada e após a escolha do jogador 2 na segunda rodada, não se lembra de sua própria escolha feita na primeira rodada.

t 1 E H H H H H H H H H H H j D t 2 a @ @ @ @ @ @ R b t a A A A A A A U b t 1 A A A A A A U l r l r l r l r t @ @ @ @ @ @ R t A A A A A A U t A A A A A A U

Finalmente, existe uma outra defini¸cão, jogo de informa¸cão completa, que se refere a jogos em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que não observem alguma tomada de decisão (ou seja, um jogo de informa¸cão completa pode ser de informa¸cão imperfeita). Já em um jogo de informa¸cão incompleta, os jogadores podem não conhecer alguma informa¸cão relevante sobre o tipo dos seus rivais, tais como as preferências, as estratégias ou os payoffs dos outros jogadores. Um exemplo clássico de jogos de informa¸cão incompleta refere-se a leilões. Em um leilão, cada participante não sabe qual é a valora¸cão exata que os outros participantes atribuem ao objeto leiloado.

(17)

3.2 Rela¸

c˜

ao entre Forma Extensiva e Forma Normal

Um jogo representado na forma normal pode ser representado na forma extensiva sem am-biguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representa¸cão na forma normal, que se resume a representa¸cão de um jogo do tipo “Cara ou Coroa” discutido no Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha é do jogador 1 e na segunda linha, do jogador 2.

Jogador 1 escolhe primeiro

t 1 Ca @ @ @ @ @ @ Co t ₂ Co A A A A A A Ca −1 1 1 −1 Ca A A A A AA Co t 1 −1 −1 1 t t t t

Jogador 2 escolhe primeiro

t 2 Ca @ @ @ @ @@ Co t ₁ Co A A A A A A Ca −1 1 1 −1 Ca A A A A A A Co t 1 −1 −1 1 t t t t

A forma normal é uma estrutura mais simples do que a forma extensiva. Ela envolve menos objetos matemáticos do que a forma extensiva, porque a estratégia do jogador pode condensar uma quantidade enorme de informa¸cão sobre a tomada de decisão do jogador. Logo, encontrar a representa¸cão na forma normal do jogo analisado pode tornar mais fácil a determina¸cão dos EN de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estratégia para um jogo na forma extensiva.

A defini¸cão de estratégia para jogos simultâneos é simples e direta. No caso de jogos sequenciais, a defini¸cão de estratégia é mais elaborada, já que nesses jogos, um determinado jogador pode ter vários momentos de escolha de a¸cões ao longo do jogo. Por exemplo, em xadrez, as jogadas dos dois jogadores se alternam ao longo da partida.

Uma estratégia de um jogador para jogos sequenciais é uma regra que determina a escolha de a¸cão em todos os conjuntos de informa¸cão desse jogador no jogo. Logo, uma estratégia para o jogador i é um plano contingente completo: uma regra de decisão que especifica como o jogador i jogará em toda e qualquer circunstância do jogo em que ele possa vir a jogar. Isso significa que uma estratégia define a¸cões para todos os conjuntos de informa¸cão do jogo, mesmo que esses conjuntos de informa¸cão não sejam alcan¸cados durante o jogo.

(18)

Exemplo 8. Suponha o seguinte jogo sequencial: t 1 E @ @ @ @ @ @ D t 2 2 r A A A A A A l 6 4 10 10 f A A A A A A g t 0 0 14 8

Como o jogador 1 só possui um conjunto de informa¸cão, dado pelo nó de decisão inicial, onde as a¸cões dispon´ıveis são E e D, então 1 possui apenas duas estratégias: E e D. Já o jogador 2 possui dois conjuntos de informa¸cão distintos: 1) o nó de decisão alcan¸cado quando 1 escolhe E, que vamos denotar por x1, e onde 2 pode escolher as a¸cões l ou r; e 2) o nó de decisão alcan¸cado quando

1 escolhe D, que vamos denotar por x2, e onde 2 pode escolher as a¸c˜oes f ou g. Portanto, uma

estrat´egia para o jogador 2 pode ser descrita como (l em x1, g em x2), ou de modo mais simples,

(l, g). Essa estrat´egia significa que o jogador 2 escolhe l em x1 e g em x2. Fica claro ent˜ao que

uma estratégia define a¸cões em todos os pontos do jogo. Isto pode parecer desnecessário à primeira vista, mas para computarmos os EN, é importante que a estratégia seja completa nesse sentido.

Portanto, o conjunto das estratégias do jogador 2 é formado por (l, f ), (l, g), (r, f ), (r, g). Logo, o jogador 2 possui 22 = 4 estratégias (2 é o número de a¸cões em cada conjunto de informa¸cão, e 2 também é o número de conjuntos de informa¸cão do jogador 2).

Para determinarmos todos os equil´ıbrios de Nash em estratégias puras de um jogo na forma sequencial, o ideal é encontramos a representa¸cão do jogo na forma normal. O primeiro passo para isso é encontrar as estratégias de cada jogador.

No Exemplo 8 acima, vimos que o jogador 2 possui 4 estratégias e o jogador 1 possui 2 es-tratégias. Obtemos então a seguinte matriz de dimensão 2 por 4 para a representa¸cão desse jogo na forma normal:

1↓ / 2 → (l, f ) (l, g) (r, f ) (r, g) E 6, 4 6, 4 10, 10 10, 10 D 0, 0 14, 8 0, 0 14, 8

Preenchemos os payoffs na matriz usando a representa¸cão em forma de árvore do jogo. Por exemplo, se 2 escolheu E e 2 escolheu (l, f ), então o payoff resultante será (6, 4). Já se 1 escolher D e 2 escolher (l, f ), então percebemos que a a¸cão importante definida na estratégia de 2 quando 1 escolhe D é a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0).

Uma vez obtida a representa¸cão na forma normal do jogo, é fácil obter os EN em estratégias puras do jogo, que são três: (E; (r, f )), (D, (l, g)) e (D, (r, g)).

(19)

Veremos agora que alguns tipos de jogos possuem uma dinâmica de a¸cões escolhidas em tempos diferentes de tal modo que representá-los na forma normal e da´ı encontrarmos os EN pode não ser adequado, no sentido de que alguns destes EN não constituem solu¸cão razoável para a intera¸cão estratégica modelada. Mais especificamente, quando derivamos a forma normal associada a um jogo sequencial e encontrarmos os EN do jogo, alguns destes equil´ıbrios podem não ser cr´ıveis, ou seja, baseados em amea¸cas de um dos jogadores que não será cumprida caso tivesse que de fato ser levada a cabo. O exemplo a seguir ilustra esse problema.

Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo-nopolista mantém o mercado amea¸cando firmas entrantes de uma guerra de pre¸cos. Desse modo, o monopólio mantém seu lucro. Porém, se alguma firma de fato entrar neste mercado, a melhor estratégia para o monopolista é formar um cartel e dividir o lucro de monopólio, já que a guerra de pre¸cos traria preju´ızos não somente para a firma entrante, mas também para o incumbente. Essa situa¸cão estratégica é representada pelo seguinte jogo na forma extensiva.

t Entrante N˜ao Entra @ @ @ @ @ @ R Entra 0 20 tMonopolista −5 −5 10 10 Briga @ @ @ @ @ @ R Acomoda

A representa¸c˜ao na forma normal do jogo sequencial acima ´e:

Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar

N˜ao entra 0,20 0,20

Entra -5,-5 10,10

Existem dois EN em estrat´egias puras para o jogo:

1. firma entrante (E) Entra; monopolista (M ) Acomoda, se E entrar, e 2. firma entrante N˜ao entra; monopolista Briga se E entrar.

O segundo EN é baseado em uma amea¸ca vazia, não-cr´ıvel : M faz uma amea¸ca, que se for levada a sério, não precisará ser cumprida, pois nesse caso E terá escolhido não entrar. Porém, se E decidir entrar no mercado, o melhor para M será se acomodar. O refinamento de perfei¸cão em subjogos, que veremos a seguir, tenta eliminar EN baseados em amea¸cas não cr´ıveis, por não serem uma solu¸cão razoável para a intera¸cão estratégica modelada.

(20)

3.3 Equil´ıbrio de Nash Perfeito em Subjogos (ENPS)

Jogos de Informa¸c˜ao Perfeita

Vamos analisar jogos de informa¸cão perfeita primeiro. O objetivo é desenvolver um conceito de equil´ıbrio que elimine equil´ıbrios baseados em estratégias não-cr´ıveis, como no Exemplo 8 acima, onde o ideal seria obter (Entra, Ac se E entrou) como única solu¸cão da intera¸cão estratégica descrita. Portanto, queremos refinar o conceito de EN de modo que as solu¸cões do jogo ainda sejam EN, mas eliminando os EN baseados em estratégias que envolvam amea¸cas não-cr´ıveis. O Princ´ıpio da Racionalidade Sequencial (PRS), que exige que a estratégia de um jogador qualquer deve especificar a¸cões que são ótimas em cada ponto do jogo, é fundamental para obtermos esse refinamento.

Esse princ´ıpio é implementado em um jogo de informa¸cão perfeita pelo seguinte Algoritmo de Indu¸cão Reversa (“backward induction algorithm”):

1. Comece pelos nós de decisão finais da árvore (“nós penúltimos” – nós cujos sucessores são todos nós terminais);

2. Determine a escolha ótima dos jogadores que jogam nesses nós (problema de maximiza¸cão individual, sem intera¸cão estratégica);

3. Redesenhe a árvore, substituindo os nós de decisão final por um nó terminal, com payoff definido pela escolha ótima no passo 2);

4. Repita passos 1), 2) e 3) para esse jogo reduzido, at´e chegar ao n´o inicial do jogo.

A solu¸cão de indu¸cão reversa para jogos com informa¸cão perfeita se resume a que todos os jogadores fa¸cam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática, o jogo é resolvido do fim para o come¸co. O conjunto de estratégias puras s = (s1, s2, . . . , sI) é um

conjunto de estratégias de indu¸cão reversa para um jogo na forma extensiva se tiver sido obtido de acordo com o algoritmo de indu¸cão reversa. É poss´ıvel mostrar que todo conjunto de estratégias de indu¸cão reversa é um EN do jogo.

Resultado: Existência de Equil´ıbrio. Todo jogo na forma extensiva finito de informa¸cão perfeita tem um EN em estratégias puras, que pode ser encontrado usando indu¸cão reversa. Se os payoffs de cada jogador forem diferentes nos nós terminais, para todos os jogadores, então existirá um único EN que pode ser encontrado usando indu¸cão reversa.

Corolário. Todo jogo finito de informa¸cão perfeita tem (pelo menos) um EN em estratégias puras. Exemplo 8: Monopolista e Firma Entrante (continua¸cão). No jogo Monopolista/Entrante, existem dois EN em estratégias puras, mas apenas um EN obtido usando o algoritmo de indu¸cão reversa. O algoritmo elimina exatamente o EN baseado na amea¸ca não-cr´ıvel do monopolista abrir uma guerra de pre¸cos caso o entrante decida entrar. Esta amea¸ca não é cr´ıvel pois uma vez que a firma entrante entrar no mercado, se o monopolista fizer uma guerra de pre¸cos, ele próprio se prejudicará sem obter nenhum ganho.

Logo, todo conjunto de estratégias obtido usando o algoritmo de indu¸cão reversa acima é um EN do jogo. Mas nem todo EN do jogo pode ser obtido por indu¸cão reversa. Os EN que podem ser obtidos utilizando o algoritmo são chamados EN perfeitos em subjogos (ENPS), ou EN que satisfazem o critério de perfei¸cão em subjogos.

(21)

Jogos de Informa¸c˜ao Imperfeita

O algoritmo de indu¸cão reversa acima só se aplica para jogos de informa¸cão perfeita. Porém a ideia de racionalidade sequencial pode ser usada também para jogos de informa¸cão incompleta, por meio de um algoritmo similar de indu¸cão reversa.

A ideia central ´e definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser visto como um jogo por si s´o. A propriedade de racionalidade sequencial exige que um EN seja EN para cada subjogo do jogo original.

Defini¸c˜ao: Subjogo. Um subjogo de um jogo Γ na forma extensiva ´e um subconjunto do jogo tal que:

(i) Se inicia em um conjunto de informa¸cão que contém apenas um único nó de decisão, e contém todos os nós sucessores desse nó inicial;

(ii) Se o nó de decisão y pertence ao subjogo, então todo nó z que pertence ao conjunto de informa¸cão de y também pertence ao subjogo.

Todo jogo possui pelo menos um único subjogo, que seria o próprio jogo. Este é o caso do exemplo abaixo. Um subjogo estrito de um jogo é um subjogo que está contido de modo estrito no jogo, ou seja, é diferente (“menor”) que o jogo inteiro.

u 1 E @ @ @ @ @ @ D u ₂ r A A A A A A l 1 3 0 0 l A A A A A A r u 0 0 3 1 u u u u

Defini¸cão: ENPS em Estratégias Puras. O conjunto de estratégias s = (s1, s2, . . . , sI) do jogo

Γ ´e um equil´ıbrio de Nash perfeito em subjogos (ENPS) se s = (s1, s2, . . . , sI) induz um equil´ıbrio

de Nash em todo subjogo de Γ.

ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu. O contrário não é válido: existem EN que não são perfeitos em subjogos.

Teorema. Para todo jogo na forma extensiva finito de informa¸cão perfeita, o conjunto de es-tratégias de indu¸cão reversa é igual ao conjunto de ENPS em estratégias puras.

Logo, em jogos de informa¸cão perfeita, o conjunto de ENPS coincide com o conjunto de EN obtido usando o algoritmo de indu¸cão reversa visto acima. Porém, considerando jogos de informa¸cão imperfeita, nem todo jogo possui um ENPS em estratégias puras. O teorema a seguir garante a

(22)

Teorema: Existˆencia de ENPS (Selten). Todo jogo na forma extensiva finito com mem´oria perfeita possui um ENPS.

A hipótese de memória perfeita é necessária. Existem exemplos de jogos de memória imperfeita que não possuem ENPS.

O seguinte algoritmo geral de indu¸cão reversa para jogos na forma extensiva, sejam de in-forma¸cão completa ou não, é válido para encontrar os ENPS:

1. Comece pelo término da árvore, determine os EN para todos os subjogos finais (subjogos que não possuem nenhum subjogo estrito);

2. Substitua cada subjogo pelo payoff de um de seus EN;

3. Repita os passos 1) e 2) para o jogo reduzido, continue at´e n˜ao restar nenhum subjogo; 4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um

EN).

Para jogos de informa¸c˜ao perfeita, esse algoritmo ´e igual ao algoritmo anterior.

3.4 Jogos Repetidos

Em um jogo do tipo dilema dos prisioneiros, seria poss´ıvel obter coopera¸cão se repet´ıssemos o jogo diversas vezes? Com a repeti¸cão, o número de estratégias de cada jogador aumenta. Nesse caso, é poss´ıvel criar estratégias em que um jogador puna o seu rival caso ele não coopere.

Vamos então analisar novamente o Dilema dos Prisioneiros (Exemplo 2): 1↓ / 2 → Confessar Não Confessar Confessar −3, −3 −1, −5 Não Confessar −5, −1 −2, −2

Suponha que o jogador 1 adote a seguinte estratégia: na primeira intera¸cão ele joga N C (co-operar). Nos per´ıodos seguintes, se o outro jogador escolheu N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar) até o jogo terminar. Essa estratégia pode levar a algum tipo de coopera¸cão? Mais especificamente, existe algum equil´ıbrio tal que os jogadores venham a adotar estratégias cooperativas? Para jogos do tipo dilema dos prisioneiros repetidos finitas vezes, a resposta é negativa. Para jogos repetidos indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva .

A no¸cão de ENPS tem como consequência que se o dilema dos prisioneiros for repetido um número fixo (finito) de vezes, o único equil´ıbrio de Nash perfeito em subjogos será formado pelo EN do jogo em cada per´ıodo sendo jogado. Logo, não é poss´ıvel obter o resultado eficiente com a repeti¸cão finita do jogo. Isso implica que qualquer dependência histórica nas estratégias atuais é eliminada. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos que satisfa¸cam as condi¸cões da proposi¸cão, um ENPS não depende da história ocorrida no jogo em nenhum momento.

(23)

Por exemplo, uma consequência desse fato é que se o dilema dos prisioneiros for jogado repeti-damente, por um per´ıodo determinado, continua sempre tendo a mesma solu¸cão não cooperativa entre os jogadores, para cada rodada do jogo. Esse resultado segue da hipótese de racionalidade sequencial. Por indu¸cão reversa, na última rodada, é melhor não cooperar. Resolvendo de traz para diante, obtemos não-coopera¸cão para todas as rodadas do jogo.

Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de término conhecida pelos jogadores. Resolvendo o jogo por indu¸cão reversa, cada jogador percebe que o seu rival irá descumprir o acordo de coopera¸cão na última vez que interagirem. Eles se adiantam a isso e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em nenhuma rodada do jogo. Esse argumento, consequência da defini¸cão de ENPS, leva a resultados considerados pouco razoáveis, como mostra o Exemplo 9 abaixo, em que o único ENPS consiste nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1).

Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo.

s I C P 1 1 s II C P 0 3 I C P s 2 2 s II C P 1 4 . . . ...sII C s P 97 100 99 99 s s I C P II C P 98 101 (100 100)

Para o jogo da centopeia, o único ENPS consiste em todo jogador escolher P em todo momento do jogo. Portanto, o payoff de equil´ıbrio é 1 para cada jogador, e nenhuma coopera¸cão é obtida.

Por´em, se o dilema dos prisioneiros for repetido infinitamente (ou se n˜ao tiver uma data fixa para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equil´ıbrio, dependendo do quanto os jogadores descontem o futuro.

As estratégias que levam a esse tipo de equil´ıbrio são chamadas estratégias gatilho (trigger ou Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho” (tit-for-tat), onde a estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem.

Considere a seguinte estratégia para o i, i = 1, 2, chamada grim reaper (ou grim trigger ): na primeira intera¸cão ele joga N C (cooperar). Nos per´ıodos seguintes, se o outro jogador escolher N C (cooperar) no per´ıodo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não cooperar) para sempre (note que a estratégia é extremamente punitiva: um desvio do rival e nunca mais a coopera¸cão pode ser refeita). Suponha que a taxa de desconto intertemporal é 0 < δ < 1. Temos que o jogador 2 cooperará se:

∞ X t=0 −2δt≥ −1 + ∞ X t=1 −3δt ⇒ −2 1 − δ ≥ −1 + −3δ 1 − δ Logo, se: δ ≥ 1 2 = 50% ,

(24)

Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do equil´ıbrio cooperativo e seguindo o equil´ıbrio cooperativo, podem existir equil´ıbrios em que os jogadores adotem estratégias que envolvem coopera¸cão. Esse resultado é conhecido como “Folk Theorem”.

Como a taxa de desconto intertemporal δ ´e determinada pela taxa de juros r do seguinte modo: δ = 1

1 + r,

ent˜ao uma vez determinada a taxa de desconto intertemporal, podemos tamb´em encontrar a taxa de juros associada. Para o exemplo acima, temos que r ≥ 1.

Leitura Sugerida

• Varian, cap´ıtulos 28 (A Teoria dos Jogos) e 29 (Aplica¸c˜oes da Teoria dos Jogos). • Nicholson e Snyder, cap´ıtulo 8 (Strategy and Game Theory).

(25)

Exerc´ıcios

1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula:

a) As estrat´egias estritamente dominantes e as estrat´egias estritamente dominadas, quando existirem.

b) As estrat´egias fracamente dominantes e as estrat´egias fracamente dominadas, quando existirem.

c) As estratégias que nunca são melhor resposta e as estratégias racionalizáveis.

d) Considere todo par de estratégias para cada um desses jogos e verifique quais são equil´ıbrios de Nash e quais não são, justificando pelo alguns desses pares para fim de aprendizagem (se você ainda estiver com dificuldades, continue escrevendo a justifica-tiva, até entender bem a lógica de se determinar um equil´ıbrio de Nash em estratégias puras).

e) Determine os equil´ıbrios de Nash que possuem de fato uma randomiza¸c˜ao ocorrendo para os exemplos 3 (problema de coordena¸c˜ao) e 4 (batalha dos sexos).

f) Procure determinar se existe algum EN com randomiza¸cão para o jogo dilema dos pri-sioneiros. Quais são os valores para as probabilidades encontradas? O que isso significa? 2. Argumente, de maneira clara e concisa, porque a ordem de elimina¸cão das estratégias não

afeta o resultado do PEEED mas pode afetar o resultado do PEEFD.

3. Vimos a defini¸cão de dominância para estratégias puras. Estratégias mistas podem também dominar estratégias puras ou mesmo outras estratégias mistas. Considere o seguinte jogo e responda os itens a seguir.

1/2 L M R

U 3,0 0,-3 0,-4 D 2,4 4,5 -1,8

a) Mostre que as estratégias puras L e R não dominam estritamente a estratégia pura M . b) Mostre que M é estritamente dominada pela estratégia mista em que 2 escolhe L e R

com probabilidades iguais.

4. Calcule os EN dos seguintes jogos e verifique se existe alguma rela¸c˜ao desses equil´ıbrios com equil´ıbrios obtidos por meio de algum argumento de dominˆancia:

a) 1/2 L R U 1,1 0,0 D 0,0 0,0 b) 1/2 L R U 1,1 0,1

(26)

c)

1/2 L l m M

U 1,1 1,2 0,0 0,0

C 1,1 1,1 10,10 -10,-10 D 1,1 -10,-10 10,-10 1,-10

5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto seria uma oferta aceitável. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja, R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo é igual ou maior do que o que Rafael acha aceitável, então eles dividem o dinheiro seguindo a oferta de Paulo. Caso contrário, o dinheiro é jogado fora. A utilidade de cada jogador é dada pelo tanto de dinheiro que ele recebe.

a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial). b) Quais s˜ao o(s) equil´ıbrio(s) de Nash em estrat´egias puras desse jogo?

6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo.

D C

D (R$1, R$1) (R$3, R$0) C (R$0, R$3) (R$2, R$2)

a) Suponha que cada jogador deseja apenas obter o m´aximo de dinheiro poss´ıvel. Quais s˜ao os EN desse jogo?

Suponha agora que os dois jogadores s˜ao altru´ıstas, ou seja, cada um deles se importa com o bem-estar do rival. Em particular, se mi(s1, s2) ´e o payoff que o jogador i ganha e mj(s1, s2)

é o payoff do jogador j, quando a estratégia jogada é (s1, s2), então a utilidade do jogador i

´e dada por ui(s1, s2) = mi(s1, s2) + αmj(s1, s2), onde α ≥ 0.

b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo do tipo dilema dos prisioneiros?

c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores de α para os quais o jogo não é mais um dilema dos prisioneiros, encontre os EN. d) Existe algum valor de α para o qual qualquer combina¸cão de estratégias puras será um

equil´ıbrio?

7. Considere o jogo denotado por G(n, k) de adivinhar a média (“guessing the average”, Osborne e Rubinstein), onde k é a quantidade de participantes que simultanemente escolhe um número inteiro entre 1 e n (inclusive 1 e n). Um prêmio de R$60 é dividido igualmente entre os jogadores que escolheram o número mais perto da metade da média de todas as escolhas (ou seja, se a metade da média foi 3, e os número mais próximos foram 2 e 4, os participantes que escolheram esses valores dividem o prêmio. Já se a metade da média foi 3,3, todos os participantes que escolheram 3 levam o prêmio)

a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN.

b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 é um EN. c) Argumente que em qualquer EN o prêmio é dividido por todos os participantes. d) Argumente que o conjunto de estratégias descrito no item b) é o único EN.

(27)

8. O exército de Patópolis deve decidir se ataca ou não o exército de Gansópolis, que está ocupando uma ilha que pertencia à Patópolis, situada entre as duas cidades. No caso de um ataque, o exército de Gansópolis pode lutar ou recuar de volta à sua cidade, por meio de uma ponte que liga a ilha à cidade. Cada cidade prefere ocupar a ilha a não ocupá-la, e uma guerra é o pior resultado poss´ıvel para ambas as cidades. Modele essa situa¸cão como um jogo na forma extensiva e mostre que o exército de Gansópolis pode melhorar seu payoff se queimar a ponte que liga a ilha à sua cidade, eliminando a op¸cão de recuar. Explique esse resultado em termos intuitivos e relacione com o que foi visto em aula.

9. Considere o seguinte jogo na forma extensiva:

t 1 E 2 2 M @ @ @ @ @ @ D t ₂ r A A A A A A l 3 1 1 0 l A A A A A A r t 0 0 0 1 t t t t

a) Escreva o conjunto de estratégias desse jogo e encontre a forma estratégica associada. b) Encontre os EN em estratégias puras.

c) Encontre os ENPS em estrat´egias puras.

10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parênteses é do jogador 1 e o payoff na parte inferior é do jogador 2. Reponda aos itens abaixo.

2 0 v 1 E @ @ @ @ @ @ @_@_R S -D v 2 r @ @ @ @ @ @ R l ? m 1 3 1 2 4 0 l @ @ @ @ @ @ R r ? m v 4 0 0 2 3 3

a) Descreva os conjuntos de estrat´egias dos dois jogadores. b) Qual a representa¸c˜ao desse jogo na forma normal?

c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?

(28)

11. (P2-1/19) Considere o seguinte jogo na forma extensiva: r I ? L M H H H H H H H HHj R 0 2 r II r II a @ @ @ @ @ @ R b 1 1 −1 −1 −2 4 c @ @ @ @ @ @ R d r r I r P @ @ @ @ @ @ R Q −1 3 −1 5

As a¸cões do jogador I estão representadas por letras maiúsculas e as a¸cões do jogador II por letras minúsculas. O payoff na parte superior em parênteses é do jogador I e o payoff na parte inferior é do jogador II.

a) Qual o número de estratégias puras do jogador 1? E do jogador 2? b) Qual a representa¸cão desse jogo na forma normal?

c) Existe alguma estrat´egia dominada (estritamente ou fracamente) para algum dos jo-gadores?

d) Quais são os equil´ıbrios de Nash (EN) em estratégias puras desse jogo? e) Quais são os EN perfeito em subjogos (em estratégias puras)?

12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de cima do vetor de payoffs ´e o da firma entrante e o payoff na parte de baixo desse vetor ´e o da firma monopolista. s Entrante ˜ nE @ @ @ @ R E 0 60 sMonopolista ˜ nL @ @ @ @ R L s _Entrante GE A A A A U PE 8 30 15 15 PE A A A A U GE s −3 0 −12 −6

a) Determine os conjuntos de todas as estrat´egias para os dois jogadores. b) Encontre os EN em estrat´egias puras do jogo.

c) Encontre os ENPS do jogo.

d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo-nopolista escolheu ˜nL ou L. Descreva todas as estrat´egias que a firma Entrante possui agora.

(29)

13. (P4-1/19) Considere o seguinte jogo na forma extensiva: v Jog. 1 A @ @ @ @ @ @ @_@ B v Jog. 2 Jog. 2 D A A A A A A A_A F 2 0 D A A A A A A A_A F 0 1 v Jog. 1 v A A A A A L 3 10 R 0 1 v A A A A A L 3 0 R 1 1

onde o payoff na parte superior em parênteses é do jogador 1 e o payoff na parte inferior em parênteses é do jogador 2.

a) Descreva as estrat´egias dos jogadores.

b) Derive a forma normal do jogo e encontre todos os equil´ıbrios de Nash (EN) do jogo em estrat´egias puras.

c) Encontre todos os equil´ıbrios de Nash perfeitos em subjogos (ENPS) em estrat´egias puras.