Jogos dinâmicos com informação incompleta

(1)

Jogos dinâmicos com informação incompleta

Mas-Collel e Green – capítulo 9

R fi t d it d E ilíb i

Sabino Porto Jr - Teoria dos jogos - material não revisado

1 Refinamentos do conceito de Equilíbrio de Nash

Roteiro da aula:

R i lid d ü i l

• Racionalidade seqüencial

• Equilíbrio Bayesiano perfeito fraco

• [Equilíbrio bayesiano perfeito forte]

• Equilíbrio Seqüencial

• Forward Indução

• Aplicações de ENPS

• Equilíbrio de Nash Trembling Hand Extensivo

(2)

Racionalidade Seqüencial – a estratégia de um jogador deve especificar ações ótimas em todo ponto na árvore do jogo. Isso significa que o estratégias de equilíbrio especificam comportamento ótimo a partir de qualquer ponto de decisão na árvore do jogo.

T E

(0,2)

Um jogador é o Titular e o outro é um Entrante potencial.

Racionalidade Seqüencial:

depois de entrar a única estratégia ótima para o jogador E é escolher Acomodar

E

Out In

Sabino Porto Jr - Teoria dos jogos - material não revisado

3 (-3,-1) (2,1)

0 2 2 1 Forma Reduzida

Exemplo 1:

Jogo dinâmico finito de informação completa e perfeita

Podemos representar o jogo na forma normal:

Lutar se

Acomodar se Jogador T

(0,2) (0,2) (-3,1) (2,1)

Out In Jogador E

E joga In E joga In

(3)

Proposição: em jogos dinâmicos finitos de informação perfeita a Indução Retroativa captura a idéia de Racionalidade Seqüencial.

Teorema de Zermelo: Todo jogo finito de informação perfeita tem um Equilíbrio de Nash em Estratégias Puras que pode ser derivado através de Indução Retroativa. Além disso, se nenhum jogador tem os mesmos payoffs em qualquer dois nódulos terminais, então há um único Equilíbrio de Nash que pode ser

Sabino Porto Jr - Teoria dos jogos - material não revisado

5 derivado por Indução Retroativa.

(0,2)

Out In

E

A d L t

Jogador T Exemplo 2:

Jogo dinâmico de informação

completa e imperfeita

(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar

T

Acomodar

3,1 -2,-1

Lutar

1,-2 -3,-1

Acomodar Lutar

Joga dor E

Out In (0,2) (3,1)

E

ENPS – captura a idéia de

Racionalidade Seqüencial

(4)

O mesmo jogo representado na forma Normal

Acomodar se E Jogar In

Lutar se E Jogar In

Out, Acomodar Se In

0,2 0,2

Out, Lutar Se In 0,2 0,2

In Acomodar Se 3 1 -2 -1

Jogador T

g ador E

Sabino Porto Jr - Teoria dos jogos - material não revisado

7 In, Acomodar Se

In

3,1 2, 1

In, Lutar Se In 1,-2 -1,-1

Jo g

I. Proposição: em um jogo finito de informação perfeita todo nódulo de decisão informação perfeita todo nódulo de decisão inicia um subjogo;

II. Proposição: todo ENPS é um Equilíbrio de Nash, afinal, o jogo como um todo é um subjogo, mas nem todo Equilíbrio de Nash é um ENPS.

III. Proposição: Todo jogo finito de informação

perfeita tem ENPS de estratégias puras e, se

nenhum jogador tem os mesmos payoffs em

quaisquer dois nódulos terminais, então o

ENPS é único.

(5)

(0,2)

Out In

Small Large

E

A d L t

Jogador T Exemplo 3:

The Niche Choice Game

(-6,-6) (-1,1) (1,-1) (-3,-3) g Niche Niche

T

Acomodar

-6,-6 -1,1

Lutar

1,-1 -3,-3

Joga dor E

Sabino Porto Jr - Teoria dos jogos - material não revisado

9 Out In

(0,2) (1,-1)

E

(0,2) (-1,1) Out In

E Veja: os equilíbrios

são distintos e com implicações de ganhos distintas para o jogadores

Proposição: Considere um jogo na forma extensiva envolvendo sucessivas jogadas de T-jogos simultâneos com os jogadores observando as estratégias puras jogadas em cada jogo imediatamente depois que seu jogo é concluído.

Assuma que o payoff de cada jogador é igual à soma dos payoffs nas jogadas dos T-jogos. Se há um único Equilíbrio de Nash em cada T-jogo, então, há um ENPS que consiste em cada jogador jogar o EN em cada T-jogo, independentemente do que tenha acontecido previamente.

Idéia básica: aplicação da lógica de Indução Retroativa

Observação: ENPS exclui dependência da história de estratégias nessa classe de jogos.

Proposição: se cada subjogo tem um único EN, então, o ENPS não pode ser histórico depedente;

Jogo da Centópeia – enfraquece a noção de ENPS (ver

Rosenthal, 1981, para uma introdução olhar Montet e Serra)

(6)

Crenças e Racionalidade Seqüencial

9O ENPS nem sempre é suficiente para capturar Racionalidade Seqüencial

9Alguns jogos podem deixar passar ENPS em ameaças vazias:

ocorre quando o único subjogo do jogo é próprio jogo.

9Nesse caso todos os EN do jogo são também ENPS, inclusive os EN em ameaças vazias.

Sabino Porto Jr - Teoria dos jogos - material não revisado

11 (0,2)

Out In1 In2

E Exemplo 4:

Jogo dinâmico de informação

completa e imperfeita

(-1,-1) (3,0) (-1,-1) (2,1)

T

Agora:

O jogador Entrante possui duas estratégias para Entrar

A Firma Titular: é incapaz de antecipar qual a estratégia que

a Firma E usou se ela resolveu entrar.

(7)

(0,2)

Out In1 In2

E Exemplo 4:

Jogo dinâmico de informação

completa e

imperfeita ^Nova _eliminar ^questão: _o _EN ^como _não razoável???

Ob l j

(-1,-1) (3,0) (-1,-1) (2,1)

T ENPS1: (out, lutar

se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)

Observe: qualquer que seja a estratégia de Entrada do jogador E o Titular prefere Acomodar se a Entrada ocorrer.

Sabino Porto Jr - Teoria dos jogos - material não revisado

13 Nesse caso, o único subjogo é o próprio jogo, então, os dois EN _S são ENPS, ou seja, não é possível usar ENPS para selecionar entre os ENs.

A solução desse problema exige um novo refinamento da noção de Equilíbrio.

Comentários

Saída: reforçar a noção de Racionalidade Seqüencial.

Racionalidade Seqüencial: a Ação do jogador T deve ser ótima para alguma crença [do T] sobre qual a estratégia será usada pelo jogador E.

No jogo: Lutar se o E escolhe Entrar não é uma escolha ótima do jogador T para qualquer crença que o T possa ter.

Conseqüência desse novo raciocínio: devemos considerar Conseqüência desse novo raciocínio: devemos considerar formalmente a CRENÇA dos jogadores e usá-la para testar racionalidade seqüencial dos jogadores.

Novo conceito solução: Equilíbrio Bayesiano Perfeito Fraco ou

Equilíbrio Seqüencial Fraco (Myerson, 1991)

(8)

Equilíbrio Bayesiano Perfeito Fraco

• Exigência básica do EBP _fraco : em qualquer ponto do jogo uma estratégia do jogador deve prescrever ações ótimas a partir daquele ponto dadas as

t té i d j d t [d j d t

estratégias dos jogadores oponentes e e as suas [do jogador que toma decisão] crenças sobre o que ocorreu no jogo até aquele ponto de decisão. Além disso, suas crenças devem ser consistentes com as estratégias que estão sendo jogadas.

• Definições novas:

1. Sistema de crenças

2. Racionalidade Seqüencial de Estratégias

Sabino Porto Jr - Teoria dos jogos - material não revisado

15 q g

Crenças

Definição: um sistema de crenças em um jogo na forma extensiva é a especificação de uma probabilidade para cada nódulo de decisão x no jogo extensivo, tal que:

μ ^μ ( ) ^x ∈ [ ] ^0,1

( ) ¹

x CI

x CI

μ

∈

= ∀

∑

Sistema de Crenças: Especifica, para cada conjunto de informação, uma avaliação probabilística e essa avaliação deve ser realizada pelo jogador que toma decisão naquele ponto de decisão.

A avaliação consiste em estimar as probabilidades relativas de se encontrar [chegar a] em cada um dos pontos de decisão do conjunto de informação, condicionadas ao jogo realizar ou alcançar aquele conjunto de informação

É gerada pela natureza

condicionadas ao jogo realizar ou alcançar aquele conjunto de informação.

Utilidade esperada: dados um Conjunto de informação alcançado e um

conjunto de crenças, ou seja, as probabilidades condicionais de está em cada

ponto de decisão de seu conjunto de informação, estima-se a utilidade

esperada, se ele segue uma ou outra estratégia, dadas as escolhas dos

demais jogadores.

(9)

Utilidade Esperada: valor esperado da utilidade obtida com as escolhas do jogadores dadas suas crenças, conjuntos de informações e os payoffs possíveis e as escolhas dos demais jogadores.

[ ^/ ]

E U CI

Agora: racionalidade seqüencial exige que a escolha do jogador em cada ponto de decisão maximize a utilidade esperada do jogador que escolhe.

[

i

^/ ^{, , ,}

i i

]

E U CI μ s s

₋

Sabino Porto Jr - Teoria dos jogos - material não revisado

17 Definição de uma estratégia Seqüencialmente racional: uma estratégia em um jogo dinâmico é considerada seqüencialmente racional e um conjunto de informação e dado um sistema de crenças se, para o jogador i que escolhe no Conjunto de informação CI, temos:

/ , , , / , , ,

i i i i i i i

CI CI CI CI CI CI CI

E U ⎡ ⎣ CI μ s s

₋

⎤ ⎦ ≥ E U ⎡ ⎣ CI μ s % s

₋

⎤ ⎦ ∀ s % ∈ S

Se s satisfaz essa condição para todo Conjunto informação, então, dizemos que s é seqüencialmente racional dado o sistema de crenças.

Intuição: nas condições especificadas acima nenhum jogador acha interessante

desviar dadas as suas crenças sobre o que já ocorreu e sobre as estratégias dos

rivais.

(10)

Condições para definir um EBP _fraco

1) Estratégias devem ser seqüencialmente racionais dadas as crenças 2) Sempre que possível, crenças devem ser consistentes com as estratégias.

Ou seja, no equilíbrio jogadores devem ter crenças corretas sobre as

lh d t té i d t [f lt d fi i

escolhas de estratégias dos seus oponentes. [falta definir crenças consistentes]

Definição Crenças consistentes: para cada pondo de decisão pertencente a um conjunto de informação o jogador deve calcular a probabilidade de realização daquele ponto de decisão dado a estratégia s escolhida por ele. E deve atribuir probabilidades condicionais de está em cada um desses pontos de decisão dado que o jogo realiza ou alcança o conjunto de informação

Sabino Porto Jr - Teoria dos jogos - material não revisado

19 de decisão dado que o jogo realiza ou alcança o conjunto de informação, usando regra de Bayes.

( ) ( )

( )

Pr /

Pr / ,

Pr /

x CI

ob x s ob x CI s

ob x s

∈

= ∑ ′

Regra de Bayes:

(0,2)

Out In1 In2

E Exemplo 4:

Jogo dinâmico de informação

completa e imperfeita

Suponha que o jogador E usa a seguinte Estratégia Mista:

( )

1 2

1 1 1

( , , ) 4 2 4 , ,

Pr / 3 0,75

4 Out In In

ob CI s

=

⇒ = =

(-1,-1) (3,0) (-1,-1) (2,1)

T ENPS1: (out, lutar

se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)

( )

1

2

4 Usando Bayes:

1 2 2

Prob / decorrente de IN

1 1 3

4 2

1 4 1

Prob / decorrente de IN

3 3

4 Essas devem ser as crenças consistentes de T.

x CI x

= = →

+

′ = = → ′

Crenças de T consistentes com a Estratégia do jogador E.

Questão: as EM são não completas, pois alguns CI podem ser realizados com Probabilidade nula. Isso inviabilizaria o uso de regra de Bayes.

Saída: EBP

_fraco

permite atribuir qualquer probabilidade positiva a CI que não

seriam realizados no equilíbrio. [visão agnóstica] voltar aqui e conferir???

(11)

Equilíbrio Bayesiano Perfeito fraco

• Definição de EBP _fraco : a estratégia s e um sistema de crenças

( )

fraco

EBP = s , μ

ç _fraco g ç μ

constituem um EBP _fraco se eles possuem as seguintes propriedades:

i. A estratégia s é seqüencialmente racional dado o sistema de crenças μ

ii. O sistema de crenças μ é derivado de s através de regras de Bayes sempre que possível.

Sabino Porto Jr - Teoria dos jogos - material não revisado

21 ( )

( ) ( )

( )

sso significa que CI no qual Pr / 0, temos:

Pr / Pr /

I CI s

x x s x CI

μ CI s

∀ >

= ∀ ∈

Proposição: uma estratégia s é um Equilíbrio de Nash de um jogo na forma extensiva se e somente se existe um sistema de crenças µ tal que:

i. A estratégia s é seqüencialmente racional dado µ em todo conjunto de informação tal que Prob(CI / s) > 0 ii. O sistema de crenças µ é derivado de s através de

Regra de Bayes, sempre que possível.

Observação: exige-se racionalidade seqüencial apenas para o caminho do equilíbrio.

Proposição: todo equilíbrio Bayesiano perfeito fraco é um

equilíbrio de Nash, mas nem todo Equilíbrio de Nash é

um EBP _fraco .

(12)

(0,2)

Out In1 In2

E Voltanto ao Exemplo 4:

Jogo dinâmico de informação

completa e imperfeita

Equilíbrio Bayesiano Perfeito fraco:

Firma T deve jogar Acomodar se Entrada ocorre, porque esta é a ação ótima da firma iniciando em seu conjunto de informação para qualquer sistema de crenças.

(-1,-1) (3,0) (-1,-1) (2,1)

T ENPS1: (out, lutar

se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)

µ(x)= 1, pois a

Prob (CI/In1, acomodar se entrar)>0 EBPfraco = (Acomodar se entrar, 1) É único.

s=acomodar se E entrar – é uma estratégia seqüencialmente racional.

Sabino Porto Jr - Teoria dos jogos - material não revisado

23 E

2

E

1

Join Venture entry Game

0 Análise de possibilidades:

•Firma E ₂ deve aceitar a JV, pois isso garante um payoff positivo para ela, qualquer que seja a estratégia

0 0 3

(-1,0,2) (2,0,1) (1,1,-2) (4,4,0) (-1,0,2) (2,0,1)

2

Titular

E

1 Aceitar Rejeitar

In Out

0

3 q j g

escolhida pela firma T.

•Firma E ₁ deve propor a JV, pois se E ₂ aceita, a firma E ₁ estará melhor, qualquer que seja a estratégia escolhida por T.

Descrição:

Três Firmas: E1, E2, Titular

Firma E2 tem uma tecnologia importante para a firma E1

Firma Titular: observa se E1 entra mas não sabe se ela conta com a aliança de E2

A join Venture é imbatível mesmo se a firma Titular lutar.

(13)

( )

Pr CI

_Titular

/ s > 0

Aplicando Bayes: probabilidade do ponto de decisão do meio no Conjunto de informação do T = 1.0

A estratégia ótima de T no ponto de decisão do meio = Acomodar se a A estratégia ótima de T no ponto de decisão do meio = Acomodar se a Entrada ocorre.

( ) ( )

{ Pr JV, In se E declina , (Aceitar),

2

mod se Entra }

fraco

EBP = opor Aco ar

Outro ENPS, porém em ameaça vazia:

( ) ( ) ( )

{ se E declina se Entra }

ENPS = Out Out Declina Lutar

Sabino Porto Jr - Teoria dos jogos - material não revisado

25 ( ) ( ) ( )

{ , se E declina ,

2

, se Entra }

ENPS = Out Out Declina Lutar

Novo Exemplo:

E Jogador T: deseja lutar se E entra via IN

0 2

Out IN

1

IN

2

T T

entra via IN ₁

Jogador E: sua jogada ótima depende do

comportamento de T que é indicado por ou seja, deseja entrar se >-1.

μ

T

( ¹ − μ

T

)

γ γ

-1 3 2 -1 -2 -1 1

Solução: crenças consistentes exige-nos olhar apenas para o caso em que >0 γ

γ

(14)

( )

¹ 2

crença de T de que In é a estratégia que E escolherá se entrar.

1 crença de T de que In é a estratégia que E escolherá se entrar.

Titular Titular

μ μ

=

− =

Firma T deseja Lutar se e somente se:

Ganho de Lutar ≥ Ganho de Acomodar

( )

-1 2 1 1 2

3

T T

T

μ μ

μ

≥ − + − ⇒

≥ : 2 3

1

T

EBPfraco μ =

Sabino Porto Jr - Teoria dos jogos - material não revisado

27 ( )

1 2

1 1

3 Firma E deve aleatorizar no equilibrio com probabilidade positiva de jogar In e In μ

T

− =

T fraco

2 fraco

tuacoes que nao funcionam:

1) Se 2 em EBP isso geraria uma contradiçao, pois, nesse caso, 3

T deveria Lutar com prob. 1,0, isso implicaria que E deveria escolher In , .1, 0 o EBP iri

Si

com prob

μ >

⇒ a requerer μ

_T

=0, o que representa uma contradiçao.

T fraco

1 fraco

tuacoes que nao funcionam:

2) Se 2 em EBP isso geraria uma contradiçao, pois, nesse caso, 3

T deveria Acomodar com prob. 1,0, isso implicaria que E deveria escolher In , .1, 0 o EBP

Si

com prob

μ <

⇒ iria requerer μ

_T

=1, o que representa uma contradiçao.

: 2

T

EBPfraco μ =

( )

1 2

3 1 1

3 Firma E deve aleatorizar no equilibrio com probabilidade positiva de jogar In e In

T

μ μ

− =

(15)

( ) ( )

1 2

Isso significa que a probabilidade de T lutar deve fazer com que a firma E seja indiferente entre IN1 e IN2:

1 3 1 2 1

1 Payoff de Entr

IN IN

E E

Lutar Lutar Lutar Lutar

E E

s s s s

s

γ

⎡ ∏ ⎤ = ⎡ ∏ ⎤ ⇒

⎣ ⎦ ⎣ ⎦

− + − = + − ⇒

⎛ ⎞

= ⎜ ⎟ ⇒ Payoff de Entr ar é dado por:

Lutar

2 s ⁼ ^⎜ ⎝ γ + ^⎟ ⎠ ^⇒

( ) ( )

1 2

ar é dado por:

3 2

0 Pr 0

2

IN IN

E E E

E ou γ Out

γ

⎡ ∏ ∏ ⎤ = + > ⇒ =

⎣ ⎦ +

( 0 1 2 ) i

p a ra > 0 :

, , 0 , 2 1 , s = p ro b . d o jo g a d o r E 3 3

E B P fr a c o

s s s

γ

⎛ ⎞

= ⎜ ⎝ ⎟ ⎠ ↔

Sabino Porto Jr - Teoria dos jogos - material não revisado

29 1 2

T

e s c o lh e r o u t, In o u In , re s p e c tiv a m e n te .

1 2

;

2 3

L u ta r

s μ

γ

⎝ ⎠

= =

+

Comentários:

Por que esse EB é considerado fraco?

Resposta: O requerimento de consistência sobre a formação das crenças é mínimo, restringe-se apenas a estabelecer probabilidades não- negativas dentro de cada CI. São consistentes com estratégias de equilíbrio dentro do caminho de equilíbrio.

Ou seja, não é colocada nenhuma restrição sobre crenças fora do caminho de equilíbrio

crenças fora do caminho de equilíbrio.

Como fortalecer o EBP???

(16)

Os exemplos a seguir ilustram a necessidade de fortalecer o EBP.

Natureza

½ ½

EBPfraco:

Setas e [ ] Pr( CI ₁ /s)>0

1 2

x y y x

l r l r

2 10

[0,5] [0,5]

Pr( CI ₁ /s) 0 Pr( CI ₂ /s )=0

Ou seja, crenças definidas para o jogador 2 não são boas, pois o Conjunto de informação do 2 só pode ser realizado se o jogador 1 desviar e escolher y nos dois pontos de decisão.

Sabino Porto Jr - Teoria dos jogos - material não revisado

31 0

5 0 5 5

2 5 10

Necessitamos de crenças consistentes fora do caminho de equilíbrio...Saída será impor mais restrições sobre o sistema de crenças (jogos de sinalização ou outra opção).

(0,2)

Out In

E

A d L t

Jogador T

Voltando ao Exemplo 2:

(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar

T

Acomodar

3,1 -2,-1

Lutar

1,-2 -3,-1

Joga dor E

[1] [0]

( ) ( ) [ ]

{ ^, ^mod ^{se In ,} se E jogar In ; 1 }

fraco

EBP = Out aco ar Lutar μ =

Veja: não é um ENPS porque não especifica um EN do jogo pós- entrada. A crença do jogador T não é restringida se usarmos o

EBP

fraco

, ou seja, essa noção de equilíbrio não impõe restrições

para CI fora do equilíbrio (visão agnóstica)

(17)

Definição: Equilíbrio Seqüencial

(Kreps e Wilson, 1982)

Um par é um Equilíbrio Seqüencial de jogos na forma extensiva se tem as seguintes propriedades: ( ) ^s ^, ^μ

i. s é seqüencialmente racional dado o sistema de crenças ii. Existe uma seqüencia de Estratégias Mistas completas, tal que

μ

lim Onde:

é a crenças derivada do perfil de estratégias s , usando Bayes.

k k

μ μ

μ

=

→∞

→

=

Sabino Porto Jr - Teoria dos jogos - material não revisado

33 Proposição: todo Equilíbrio Seqüencial é um EBP _fraco , mas, em geral, o contrário não é verdade.

Intuição

Equilíbrio seqüencial exige que as crenças sejam justificadas a partir de um conjunto completo de Estratégias Mistas que são próximas a s ( equivale, aproximadamente, a uma pequena perturbação das estratégias de equilíbrio?)

Isso requer que os jogadores possam justificar

(aproximadamente) suas crenças através de alguma

historia na qual jogadores cometem erros com alguma

historia na qual jogadores cometem erros, com alguma

probabilidade positiva, ao escolher suas estratégias.

(18)

Voltando ao Exemplo:

Natureza

½ ½

Toda crença que pode ser derivada de qualquer

seqüência de EM

completas atribui igual probabilidade para os 2 pontos de decisão no CI 2.

1 2

x y y x

l r l r

2 10

[0,5] [0,5]

Equilibro Seqüencial único:

(y r) e igual nos dois p

Assim, em qualquer Equilíbrio Seqüencial o jogador 2 deve jogar r e o jogador 1 deve, portanto, jogar y.

μ

Sabino Porto Jr - Teoria dos jogos - material não revisado

35 0

5 0 5 5

2 5 10

(y,r) e igual nos dois pontos de decisão do CI

₂

μ

( ) ^{( )} ^{( )} ( )

²2

^{( )} ^{( )}

Jogar y daria mais para 1 e jogar r seria bom para o 2, pois:

E 0,5 5 0,5 5 5

E 0,5 2 0,5 10 6

l

r

Π = ⋅ + ⋅ =

(0,2)

Out In

E

A d L t

Jogador T

Voltando ao Exemplo 2:

(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar

T

Acomodar

3,1 -2,-1

Lutar

1,-2 -3,-1

Joga dor E

[1] [0]

( ) ( )

{ , Acomodar se In , mod se E joga In } =ENPS

único único

ES = In Aco ar

(19)

Verificação:

Considere o Conjunto de Informação do jogador T:

Tome uma EM-completa qualquer

Considere o ponto de decisão inicial a partir da entrada da firma E (ponto inicial do subjogo seguinte à entrada) Considere as crenças no CI T

Isso implica que qualquer estratégia no ES deve especificar EM no subjogo pós-entrada.

Sabino Porto Jr - Teoria dos jogos - material não revisado

37 Proposição: Em todo Equilíbrio Seqüencial de um jogo na forma extensiva a estratégia de equilíbrio constitui um ENPS do Jogo extensivo.

Comentários:

a) Equilíbrio seqüencial fortalece tanto o ENPS como EBP _fraco

b) Todo Equilíbrio Seqüencial é tanto um ENPS quanto um EBP _fraco

c) Em alguns casos, o sistema de crenças fora do equilíbrio exigido pelo ES, pode ser muito forte.

d) Por exemplo, eles podem implicar que dois jogadores com o mesmo CI devem ter

exatamente as mesmas crenças

independentemente dos desvios dos outros jogadores que têm levado o jogo a realizar uma dada parte da árvore.

e) Noção mais forte ENPTH – Selten, 1975.

(20)

(0,2)

Out In

E

Crenças Razoáveis e Forward Indução

Crenças Razoáveis:

especifica restrições adicionais (fora do caminho de equilíbrio) que crenças razoáveis deveriam

(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar

[1] T [0]

( ) ( ) [ ]

{ ^d ^I ^{E j} ^I ¹ }

EBP O t L t

ç satisfazer.

Sabino Porto Jr - Teoria dos jogos - material não revisado

39 ( ) ( ) [ ]

{ ^, ^mod ^{se In ,} se E jogar In ; 1 }

fraco

EBP = Out aco ar Lutar μ =

Razoabilidade para E: se entrar ele prefere jogar In2, pois, In ₂ > In ₁ , afinal (-2,3) > (-3,1)

Portanto, se resolver Entrar o jogador E prefere In ₂

Forward Indução

Forward Indução exclui um dos EN no sub-jogo pós-entrada.

Indução Retroativa: jogador decide qual é a sua ação ótima em algum ponto da arvore do jogo tomando como base as ações ótimas dos seus oponentes racionais em pontos de decisão ótimas dos seus oponentes racionais em pontos de decisão subseqüentes ou em posições posteriores do jogo.

Forward Indução: jogador raciocina sobre o que poderia ter acontecido, racionalmente, em movimentos prévios do jogo.

No exemplo a seguir: firma T decide sobre qual sua acao otima pós-entrada assumindo que a firma E comporta-se

racionalmente na sua decisão de entrada.

Problemas potenciais com FI:

O que aconteceria num mundo onde jogadores podem cometer erros com pequenas probabilidades positivas?

FI continua consistente?

(21)

(0,2)

Out In

E

SN LN

Jogador T

Voltando ao Exemplo 2:

Pós-entrada: 2 EN

minado por FI

(-6,-6) (-1,-1) (1,-1) (-3,-3) SN LN

T

^SN

-6,-6 -1,1

LN

1,-1 -3,-3

SN LN

Joga dor E

[1] [0]

Forward Indução: Para o Raciocínio do T: se o

EN elim

Sabino Porto Jr - Teoria dos jogos - material não revisado

41 Forward Indução: Para o jogador E, entrar e jogar SN se entrar é pior do que jogar OUT. E deve jogar LN no jogo pós-entrada.

Raciocínio do T: se o jogador E entrar ele vai jogar LN no jogo pós- entrada, dessa forma, T deve jogar SN.

Job Market Signaling

Qualidade é uma característica oculta, então, os que produzem alta qualidade tem um incentivo para emitir um sinal indicando a alta qualidade tem um incentivo para emitir um sinal indicando a sua qualidade.

Sinal credible: apenas se o produtor de baixa qualidade não tem interesse em emitir o mesmo sinal, ou seja, ele não sai

ganhando se emitir o mesmo sinal.

Custos de emitir sinal: toda emissão de sinal envolve custos e

t ã i i di íd d b i

esses custos são maiores para os indivíduos de baixa qualidade.

Portanto, o custo marginal de emitir um sinal a mais é maior

para o individuo de baixa que, por isso mesmo, acaba revelando

seu tipo e emitindo um sinal mais fraco.

(22)

Preço da revelação verdadeira: os recursos utilizados na emissão de sinal não propiciam qualquer utilidade direta.

Mercado de trabalho: alguns indivíduos são inatamente inteligentes e working hard e sabem disso.

Sinal: treinamento e certificados. Indivíduos fazem escolhas sobre seus anos de formação que ajudam a revelar seu tipo peessoal.

Empregador: faz uma escolha no escuro, pois não observa o tipo do empregado, apenas o sinal emitido. Oferece salarios maiores para o de alta na expectativa de atrair os mais produtivos.

Problema: o tipo de baixa nesse contexto não tem incentivos

Sabino Porto Jr - Teoria dos jogos - material não revisado

43 Problema: o tipo de baixa, nesse contexto, não tem incentivos para revelar verdadeiramente o seu tipo. Pois, supondo que a producao seja realizada em equipes, não é possivel distinguir de forma clara e objetiva o grau de contribuição de cada um para o resultado final da equipe. Ou seja, é impossível para o gerente identificar quem é quem. (L ou H)

Modelo:

H = tipo e alta produtividade e habilidade L = tipo de baixa produtividade e habilidade w _H = salário de alta oferecido pelo empregador w _H salário de alta oferecido pelo empregador w _L = salário de baixa oferecido pelo empregador w _H > w _L

C _H = custo da pós-graduação para H C _L = Custo da pós-graduação para L

C _L > C _H ( o trabalhador de baixa leva um ou dois

semestres a mais para terminar o curso e tem que

trabalhar muito mais forte para ser admitido numa boa

universidade)

(23)

Como induzir o L a falar a verdade?

[ ]

Se Melhor para L é aceitar W

Se H prefere obter o certificado Essas condições mantém-se se:

C

H L L L

H H L

W C W

W W C

− < →

− > →

[ ]

C Supondo:

H H L L

H L

W W C

C C

< − <

<

Exemplo:

1000 600

Nesse caso, o sinal só revela o tipo do trabalhador se:

400

H L

W W

C C

=

< <

Sabino Porto Jr - Teoria dos jogos - material não revisado

45 Ineficiência: o sinal implica em custo para a sociedade.

Modelo geral

2 Tipos de trabalhadores: H, L

% da população do tipo H que é de conhecimento comum.

ρ =

( )

Funçao Utilidade dos trabalhadores:

( )

i

2 2

U , ( ) ,

consumo de Lazer

valor de mercado de todos os outros bens e serviços ( ) 0 x

Se ( ) ( )

0; 0

i

g

g g

i i

x y x y i H L x

y UM x

x x UM x UM x

x x

β

β β

= + → =

=

> ∀

′′ > ⇒ ′ ′′ < ′

∂ > ∂ <

∂ x ∂ x

∂ ∂

(24)

Função consumo de lazer:

tempo que o indivíduo leva para obter educação dotação individual de tempo

x T e e T

= −

=

Relação da Utilidade do indivíduo e Educação:

A Ui cairá quando e aumentar por causa da utilidade marginal decrescente do x.

( ) ( )

ficado: Custo marginal da educação é positivo e crescente em e.

Função Utilidade do Trabalhador:

( ) ( )

Se e e UMg x e UMg x e Signi

U W C

′′ > ⇒ ′ ′′ > ′

Sabino Porto Jr - Teoria dos jogos - material não revisado

47 ( ) ( )

( ) renda que é uma funça do nível de educação (e).

( ) qua

i i

i

U W e C e W e

C e

= −

=

= ntidade de lazer que é sacrificada quando o trabalhador obtém e anos de educação.

( )

E x e m p lo :

( , ) ( )

( , ) 3

( ) 3

( 0 ) 0 ; 4 6 6

6

i i

i

U x y x y

x x

β β

β β β

β

= +

= ⇒

= = ⇒ Δ =

Δ

( ) ( )

6 1, 5 9

4 3 0 , 6 U M g ( x ) é d e c r e s c e n te e m x . 5

S u p o n h a q u e T = 2 4 , e n t ã o , C ( e ) :

(8 ) 2 4 1 6 1 4 , 7 1 2 2 , 7

(1 0 ) 2 4 1 4 3 , 4 7

0 , 7 7 x x

x C C C β β

β β

Δ = = ⇒ = ⇒

Δ

Δ = = ⇔

Δ

= − = − =

= − = ⇒

Δ 0 , 7 7 0 3 8 5

2 C

e = Δ

( ) ( )

0 , 3 8 5

0 , 8 3

(1 2 ) 2 4 1 2 4 , 3 0 , 4 1 5

2 P o r ta n t o , à m e d i d a q u e a u m e n t a o n í v e l d e e d u c a ç ã o , a u m e n t a o C M g d e a d q u i r i r m a is e d u c a ç ã o .

C C

β β e

=

= − = ⇒ Δ = =

Δ

(25)

Valor do produto marginal do indivíduo i:

( )

( ) ( )

( ) produtividade aumenta com o nível de educação.

Por definição:

i

H L

m e f e m e m e

=

+

⇒

( ) > ( )

( ) ( )

( ) ( ) ( )

2 2

2

2 2 2

:

1 3

( ) ; ( )

2 4

1 2

1 1

2 2

H L H L

H H

H

Exemplo

C e e C e e C e C e

xT x C e T T e

C e T T T e T e

β β β

= = → <

= − ⇒ = − − ⇔

⎡ ⎤ ⎡ ⎤

= ⎢ ⎣ − ⎥ ⎢ ⎦ ⎣ − − − − ⎥ ⎦ ⇒

Sabino Porto Jr - Teoria dos jogos - material não revisado

49 ( ) ¹

²

^.

2 : Educação C

H

e e Note

=

é mais do que um sinal, ela também aumenta a produtividade.

Simplificação inicial: a educação não afeta a produtividade.

2 i i

L H

m m

=

constante positiva m =

**Equilíbrio Pooling: (w, e)**

Os dois tipos obtém o mesmo nível de educação e recebem o mesmo salário no equilíbrio.

Equilíbrio: maximiza o lucro da firma e a

( )

C

H

e

Equilíbrio: maximiza o lucro da firma e a

utilidade do trabalhador.

(26)

Salário de equilíbrio:

( )

2 1

percentual da população que é de alta

W m m

ρ ρ

∗

= + −

= +

= percentual da população que é de alta.

Nível crítico g de educação: (crenças de Equilíbrio) ) se e < g Trablhador é tipo L W

) se e Trabalhador é do tipo H com probabilidade

a m

b g

ρ

∗

=

⇒ ⇒ =

≥ ⇒ e do

tipo L com probabilidade (1- ) W m m . ρ ρ ⇒

^∗

= ρ +

2

ções necessárias para que o trabalhador (H e L) aceitem o W : 1

Condi

^∗

Sabino Porto Jr - Teoria dos jogos - material não revisado

51

2

1 2 1

2 situação de total informação, e se e nao aumenta a produtividade, o melhor será:

e=0 i

e g m m g m

m m g m

Nessa ρ ρ

= ⇒ + − >

+ − >

∀

Equilíbrio Separador: tipo H obtém mais educação Equilíbrio Separador:

nivel critico de educaçao Esquema Salarial no Eq. Separador:

) Se e < g é um trabalhador L com prob. 1, pague m.

b) Se e g é um trabalhador H com prob. 1, pague 2m.

Ob

H L

e e g

a

∗

>

∗

=

⇒

≥ ⇒ servação:

Nenhum trabalhador escolherá e>g.

Se 0<e<g o trabalhador obterá o mesmo nível de salário que alguém com e=0.

Portanto, Independente do tipo o trabalhador obtera,

e =g ou e = 0 ⇒ Restrição de au to-seleção Incentivo-compatível.

e U _H U _L

0 m m

ndições Incentivo-compatíveis do Equilíbrio Separador:

1 3

Co

0 m m

g 2m-1/2g ² 2m-3/4g ²

2 2

1 3

2m- ; 2m-

2 4

3 1

4 2

H obterá e = g.

g- crítico (desencoraja L a tomar e=g)

g m m g

g m g

apenas

> > ⇒

> > → Ingredientes de decisão de um trabalhador

Indica o que maximiza U _i

(27)

Equilíbrio Separador: satisfaz a condição de auto- seleção.

Condição de auto-seleção: “cada trabalhador deve achar vantajoso emitir um sinal que é diferente de um sinal emitido pelo o outro tipo.”

Definição: Condição de auto seleção: em um equilíbrio Definição: Condição de auto-seleção: em um equilíbrio separador o resultado obtido por H não é preferido pelo tipo L e, similarmente, o resultado obtido pelo tipo L não é preferido pelo tipo H.

0

0 e g e

H H

e e g

L L

U U e

= =

> ∀

> ∀ ( )

2 2

:

9 da , :

3 1

12 18

4 2

L

Exemplo

Se m Valor PM entao

g m g g

=

> > ⇒ < < ⇒

Sabino Porto Jr - Teoria dos jogos - material não revisado

53 4 2

3, 464 4, 243

: 2 18

: 0 9

H H

L L

g

H e g W m

L e W m

< <

= ⇒ = =

Situação nova: educação aumenta a produtividade do trabalhador H e L, mas aumenta mais para o trabalhador H.

2 H

2 L

:

( ) 6 C (e )= 1 2 ( ) 3 C (e )= 3

4

H

L

E x e m p lo

m e e e

=

Informação completa e total: os tipos são de conhecimento comum e a competição assegura que os salários serão iguais aos valores das produtividades marginais dos indivíduos

2

:

6 1 . .

2 6 0 6 ( 6) 36

H H

e

H

H H

Equilibrio

MaxU W C e e C P O

U e e

^∗

m e W

= − = − ⇒

∂ = − = ⇒ = ⇒ = = =

∂

Tipo L tem interesse em blefar e passar como H, num mundo com informação incompleta, pois assim obtém U

_L

=9

2

3 3 . .

4 3 6 0 2 ( 2) 6

4 tilidade de L se blefar e passar como H:

U 36 3 (6) 9 3 4

L L

e

L

L L

L

e

MaxU W C e e C P O

U e e m e W

e U

∗

∂

= − = − ⇒

∂ = − = ⇒ = ⇒ = = =

∂

= − = >

e W U _H U _L

6 36 18 9

2 6 4 3

(28)

Conclusão: num mundo com Informação incompleta o resultado obtido com total informação não é um equilíbrio.

Firmas, agora, não pagariam W = 36 para todos com e>= 6.

( ) ( )

=1/3, o valor medio da PMg do trabalhador, sera dado por:

1 2

36 18 24 36 cro negativo.

3 3

Quando

Lu ρ

+ = < ⇒

( ) ( )

E q u ilib rio d a d o :

P ro d u tiv id a d e e s p e ra d a ( ) (1 ) ( )

1 2

( ) (1 ) ( ) 6 3 4

3 3

E q u ilib rio p o o lin g : W = W = 4 g

H L

m g m g

m g m g g g g

ρ

ρ ρ

= + −

+ − = + =

Sabino Porto Jr - Teoria dos jogos - material não revisado

55

L H

E q u ilib rio p o o lin g : W = W = 4 g R e s u m o :

S e e < g a s s u m e -s e q u e o tra b a lh a d o r ´´e L e p a g a -s e 3 e

S e e ≥ g a s s u m e -s e q u e o tra b a lh a d o r ´´e H c o m p ro b a b ilid a d e ρ e p a g a -s e 4 g .