Jogos dinâmicos com informação incompleta
Mas-Collel e Green – capítulo 9
R fi t d it d E ilíb i
Sabino Porto Jr - Teoria dos jogos - material não revisado
1
Refinamentos do conceito de Equilíbrio de Nash
Roteiro da aula:
R i lid d ü i l
• Racionalidade seqüencial
• Equilíbrio Bayesiano perfeito fraco
• [Equilíbrio bayesiano perfeito forte]
• Equilíbrio Seqüencial
• Forward Indução
• Aplicações de ENPS
• Aplicações de ENPS
• Equilíbrio de Nash Trembling Hand Extensivo
Racionalidade Seqüencial – a estratégia de um jogador deve especificar ações ótimas em todo ponto na árvore do jogo. Isso significa que o estratégias de equilíbrio especificam comportamento ótimo a partir de qualquer ponto de decisão na árvore do jogo.
T E
(0,2)
Um jogador é o Titular e o outro é um Entrante potencial.
Racionalidade Seqüencial:
depois de entrar a única estratégia ótima para o jogador E é escolher Acomodar
E
Out In
Sabino Porto Jr - Teoria dos jogos - material não revisado
3 (-3,-1) (2,1)
0 2 2 1 Forma Reduzida
Exemplo 1:
Jogo dinâmico finito de informação completa e perfeita
Podemos representar o jogo na forma normal:
Lutar se
Acomodar se Jogador T
(0,2) (0,2) (-3,1) (2,1)
Out In Jogador E
E joga In E joga In
Proposição: em jogos dinâmicos finitos de informação perfeita a Indução Retroativa captura a idéia de Racionalidade Seqüencial.
Teorema de Zermelo: Todo jogo finito de informação perfeita tem um Equilíbrio de Nash em Estratégias Puras que pode ser derivado através de Indução Retroativa. Além disso, se nenhum jogador tem os mesmos payoffs em qualquer dois nódulos terminais, então há um único Equilíbrio de Nash que pode ser
Sabino Porto Jr - Teoria dos jogos - material não revisado
5
derivado por Indução Retroativa.
(0,2)
Out In
E
E
A d L t
Jogador T Exemplo 2:
Jogo dinâmico de informação
completa e imperfeita
(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar
T
Acomodar3,1 -2,-1
Lutar
1,-2 -3,-1
Acomodar Lutar
Joga dor E
Out In (0,2) (3,1)
E
ENPS – captura a idéia de
Racionalidade Seqüencial
O mesmo jogo representado na forma Normal
Acomodar se E Jogar In
Lutar se E Jogar In
Out, Acomodar Se In
0,2 0,2
Out, Lutar Se In 0,2 0,2
In Acomodar Se 3 1 -2 -1
Jogador T
g ador E
Sabino Porto Jr - Teoria dos jogos - material não revisado
7 In, Acomodar Se
In
3,1 2, 1
In, Lutar Se In 1,-2 -1,-1
Jo g
I. Proposição: em um jogo finito de informação perfeita todo nódulo de decisão informação perfeita todo nódulo de decisão inicia um subjogo;
II. Proposição: todo ENPS é um Equilíbrio de Nash, afinal, o jogo como um todo é um subjogo, mas nem todo Equilíbrio de Nash é um ENPS.
III. Proposição: Todo jogo finito de informação
perfeita tem ENPS de estratégias puras e, se
nenhum jogador tem os mesmos payoffs em
quaisquer dois nódulos terminais, então o
ENPS é único.
(0,2)
Out In
Small Large
E
E
A d L t
Jogador T Exemplo 3:
The Niche Choice Game
(-6,-6) (-1,1) (1,-1) (-3,-3) g Niche Niche
T
Acomodar-6,-6 -1,1
Lutar
1,-1 -3,-3
Acomodar Lutar
Joga dor E
Sabino Porto Jr - Teoria dos jogos - material não revisado
9 Out In
(0,2) (1,-1)
E
(0,2) (-1,1) Out In
E Veja: os equilíbrios
são distintos e com implicações de ganhos distintas para o jogadores
Proposição: Considere um jogo na forma extensiva envolvendo sucessivas jogadas de T-jogos simultâneos com os jogadores observando as estratégias puras jogadas em cada jogo imediatamente depois que seu jogo é concluído.
Assuma que o payoff de cada jogador é igual à soma dos payoffs nas jogadas dos T-jogos. Se há um único Equilíbrio de Nash em cada T-jogo, então, há um ENPS que consiste em cada jogador jogar o EN em cada T-jogo, independentemente do que tenha acontecido previamente.
Idéia básica: aplicação da lógica de Indução Retroativa
Observação: ENPS exclui dependência da história de estratégias nessa classe de jogos.
Proposição: se cada subjogo tem um único EN, então, o ENPS não pode ser histórico depedente;
Jogo da Centópeia – enfraquece a noção de ENPS (ver
Rosenthal, 1981, para uma introdução olhar Montet e Serra)
Crenças e Racionalidade Seqüencial
9O ENPS nem sempre é suficiente para capturar Racionalidade Seqüencial
9Alguns jogos podem deixar passar ENPS em ameaças vazias:
ocorre quando o único subjogo do jogo é próprio jogo.
9Nesse caso todos os EN do jogo são também ENPS, inclusive os EN em ameaças vazias.
Sabino Porto Jr - Teoria dos jogos - material não revisado
11
(0,2)
Out In1 In2
E Exemplo 4:
Jogo dinâmico de informação
completa e imperfeita
(-1,-1) (3,0) (-1,-1) (2,1)
T
Agora:
O jogador Entrante possui duas estratégias para Entrar
A Firma Titular: é incapaz de antecipar qual a estratégia que
a Firma E usou se ela resolveu entrar.
(0,2)
Out In1 In2
E Exemplo 4:
Jogo dinâmico de informação
completa e
imperfeita Nova eliminar questão: o EN como não razoável???
Ob l j
(-1,-1) (3,0) (-1,-1) (2,1)
T ENPS1: (out, lutar
se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)
Observe: qualquer que seja a estratégia de Entrada do jogador E o Titular prefere Acomodar se a Entrada ocorrer.
Sabino Porto Jr - Teoria dos jogos - material não revisado
13
Nesse caso, o único subjogo é o próprio jogo, então, os dois EN S são ENPS, ou seja, não é possível usar ENPS para selecionar entre os ENs.
A solução desse problema exige um novo refinamento da noção de Equilíbrio.
Comentários
Saída: reforçar a noção de Racionalidade Seqüencial.
Racionalidade Seqüencial: a Ação do jogador T deve ser ótima para alguma crença [do T] sobre qual a estratégia será usada pelo jogador E.
No jogo: Lutar se o E escolhe Entrar não é uma escolha ótima do jogador T para qualquer crença que o T possa ter.
Conseqüência desse novo raciocínio: devemos considerar Conseqüência desse novo raciocínio: devemos considerar formalmente a CRENÇA dos jogadores e usá-la para testar racionalidade seqüencial dos jogadores.
Novo conceito solução: Equilíbrio Bayesiano Perfeito Fraco ou
Equilíbrio Seqüencial Fraco (Myerson, 1991)
Equilíbrio Bayesiano Perfeito Fraco
• Exigência básica do EBP fraco : em qualquer ponto do jogo uma estratégia do jogador deve prescrever ações ótimas a partir daquele ponto dadas as
t té i d j d t [d j d t
estratégias dos jogadores oponentes e e as suas [do jogador que toma decisão] crenças sobre o que ocorreu no jogo até aquele ponto de decisão. Além disso, suas crenças devem ser consistentes com as estratégias que estão sendo jogadas.
• Definições novas:
1. Sistema de crenças
2. Racionalidade Seqüencial de Estratégias
Sabino Porto Jr - Teoria dos jogos - material não revisado
15
q g
Crenças
Definição: um sistema de crenças em um jogo na forma extensiva é a especificação de uma probabilidade para cada nódulo de decisão x no jogo extensivo, tal que:
μ μ ( ) x ∈ [ ] 0,1
( ) 1
x CI
x CI
μ
∈
= ∀
∑
Sistema de Crenças: Especifica, para cada conjunto de informação, uma avaliação probabilística e essa avaliação deve ser realizada pelo jogador que toma decisão naquele ponto de decisão.
A avaliação consiste em estimar as probabilidades relativas de se encontrar [chegar a] em cada um dos pontos de decisão do conjunto de informação, condicionadas ao jogo realizar ou alcançar aquele conjunto de informação
É gerada pela natureza
condicionadas ao jogo realizar ou alcançar aquele conjunto de informação.
Utilidade esperada: dados um Conjunto de informação alcançado e um
conjunto de crenças, ou seja, as probabilidades condicionais de está em cada
ponto de decisão de seu conjunto de informação, estima-se a utilidade
esperada, se ele segue uma ou outra estratégia, dadas as escolhas dos
demais jogadores.
Utilidade Esperada: valor esperado da utilidade obtida com as escolhas do jogadores dadas suas crenças, conjuntos de informações e os payoffs possíveis e as escolhas dos demais jogadores.
[ / ]
E U CI
Agora: racionalidade seqüencial exige que a escolha do jogador em cada ponto de decisão maximize a utilidade esperada do jogador que escolhe.
[
i/ , , ,
i i]
E U CI μ s s
−Sabino Porto Jr - Teoria dos jogos - material não revisado
17
Definição de uma estratégia Seqüencialmente racional: uma estratégia em um jogo dinâmico é considerada seqüencialmente racional e um conjunto de informação e dado um sistema de crenças se, para o jogador i que escolhe no Conjunto de informação CI, temos:
/ , , , / , , ,
i i i i i i i
CI CI CI CI CI CI CI
E U ⎡ ⎣ CI μ s s
−⎤ ⎦ ≥ E U ⎡ ⎣ CI μ s % s
−⎤ ⎦ ∀ s % ∈ S
Se s satisfaz essa condição para todo Conjunto informação, então, dizemos que s é seqüencialmente racional dado o sistema de crenças.
Intuição: nas condições especificadas acima nenhum jogador acha interessante
desviar dadas as suas crenças sobre o que já ocorreu e sobre as estratégias dos
rivais.
Condições para definir um EBP fraco
1) Estratégias devem ser seqüencialmente racionais dadas as crenças 2) Sempre que possível, crenças devem ser consistentes com as estratégias.
Ou seja, no equilíbrio jogadores devem ter crenças corretas sobre as
lh d t té i d t [f lt d fi i
escolhas de estratégias dos seus oponentes. [falta definir crenças consistentes]
Definição Crenças consistentes: para cada pondo de decisão pertencente a um conjunto de informação o jogador deve calcular a probabilidade de realização daquele ponto de decisão dado a estratégia s escolhida por ele. E deve atribuir probabilidades condicionais de está em cada um desses pontos de decisão dado que o jogo realiza ou alcança o conjunto de informação
Sabino Porto Jr - Teoria dos jogos - material não revisado
19
de decisão dado que o jogo realiza ou alcança o conjunto de informação, usando regra de Bayes.
( ) ( )
( )
Pr /
Pr / ,
Pr /
x CI
ob x s ob x CI s
ob x s
∈
= ∑ ′
Regra de Bayes:
(0,2)
Out In1 In2
E Exemplo 4:
Jogo dinâmico de informação
completa e imperfeita
Suponha que o jogador E usa a seguinte Estratégia Mista:
( )
( )
1 2
1 1 1
( , , ) 4 2 4 , ,
Pr / 3 0,75
4 Out In In
ob CI s
=
⇒ = =
(-1,-1) (3,0) (-1,-1) (2,1)
T ENPS1: (out, lutar
se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)
( )
( )
1
2
4 Usando Bayes:
1 2 2
Prob / decorrente de IN
1 1 3
4 2
1 4 1
Prob / decorrente de IN
3 3
4
Essas devem ser as crenças consistentes de T.
x CI x
x CI x
= = →
+
′ = = → ′
Crenças de T consistentes com a Estratégia do jogador E.
Questão: as EM são não completas, pois alguns CI podem ser realizados com Probabilidade nula. Isso inviabilizaria o uso de regra de Bayes.
Saída: EBP
fracopermite atribuir qualquer probabilidade positiva a CI que não
seriam realizados no equilíbrio. [visão agnóstica] voltar aqui e conferir???
Equilíbrio Bayesiano Perfeito fraco
• Definição de EBP fraco : a estratégia s e um sistema de crenças
( )
fraco
EBP = s , μ
ç fraco g ç μ
constituem um EBP fraco se eles possuem as seguintes propriedades:
i. A estratégia s é seqüencialmente racional dado o sistema de crenças μ
ii. O sistema de crenças μ é derivado de s através de regras de Bayes sempre que possível.
Sabino Porto Jr - Teoria dos jogos - material não revisado
21
( )
( ) ( )
( )
sso significa que CI no qual Pr / 0, temos:
Pr / Pr /
I CI s
x x s x CI
μ CI s
∀ >
= ∀ ∈
Proposição: uma estratégia s é um Equilíbrio de Nash de um jogo na forma extensiva se e somente se existe um sistema de crenças µ tal que:
i. A estratégia s é seqüencialmente racional dado µ em todo conjunto de informação tal que Prob(CI / s) > 0 ii. O sistema de crenças µ é derivado de s através de
Regra de Bayes, sempre que possível.
Observação: exige-se racionalidade seqüencial apenas para o caminho do equilíbrio.
Proposição: todo equilíbrio Bayesiano perfeito fraco é um
equilíbrio de Nash, mas nem todo Equilíbrio de Nash é
um EBP fraco .
(0,2)
Out In1 In2
E Voltanto ao Exemplo 4:
Jogo dinâmico de informação
completa e imperfeita
Equilíbrio Bayesiano Perfeito fraco:
Firma T deve jogar Acomodar se Entrada ocorre, porque esta é a ação ótima da firma iniciando em seu conjunto de informação para qualquer sistema de crenças.
(-1,-1) (3,0) (-1,-1) (2,1)
T ENPS1: (out, lutar
se entrada ocorre) ENPS2: (In1, acomodar se entrada ocorre)
µ(x)= 1, pois a
Prob (CI/In1, acomodar se entrar)>0 EBPfraco = (Acomodar se entrar, 1) É único.
s=acomodar se E entrar – é uma estratégia seqüencialmente racional.
Sabino Porto Jr - Teoria dos jogos - material não revisado
23
E
2E
1Join Venture entry Game
0
Análise de possibilidades:
•Firma E 2 deve aceitar a JV, pois isso garante um payoff positivo para ela, qualquer que seja a estratégia
0 0 3
(-1,0,2) (2,0,1) (1,1,-2) (4,4,0) (-1,0,2) (2,0,1)2
Titular
E
1 Aceitar RejeitarIn Out
0
3
q j g
escolhida pela firma T.
•Firma E 1 deve propor a JV, pois se E 2 aceita, a firma E 1 estará melhor, qualquer que seja a estratégia escolhida por T.
Descrição:
Três Firmas: E1, E2, Titular
Firma E2 tem uma tecnologia importante para a firma E1
Firma Titular: observa se E1 entra mas não sabe se ela conta com a aliança de E2
A join Venture é imbatível mesmo se a firma Titular lutar.
( )
Pr CI
Titular/ s > 0
Aplicando Bayes: probabilidade do ponto de decisão do meio no Conjunto de informação do T = 1.0
A estratégia ótima de T no ponto de decisão do meio = Acomodar se a A estratégia ótima de T no ponto de decisão do meio = Acomodar se a Entrada ocorre.
( ) ( )
{ Pr JV, In se E declina , (Aceitar),
2mod se Entra }
fraco
EBP = opor Aco ar
Outro ENPS, porém em ameaça vazia:
( ) ( ) ( )
{ se E declina se Entra }
ENPS = Out Out Declina Lutar
Sabino Porto Jr - Teoria dos jogos - material não revisado
25
( ) ( ) ( )
{ , se E declina ,
2, se Entra }
ENPS = Out Out Declina Lutar
Novo Exemplo:
E Jogador T: deseja lutar se E entra via IN
0 2
Out IN
1IN
2T T
entra via IN 1
Jogador E: sua jogada ótima depende do
comportamento de T que é indicado por ou seja, deseja entrar se >-1.
μ
T( 1 − μ
T)
γ γ
-1 3 2 -1 -2 -1 1
Solução: crenças consistentes exige-nos olhar apenas para o caso em que >0 γ
γ
( )
1 2crença de T de que In é a estratégia que E escolherá se entrar.
1 crença de T de que In é a estratégia que E escolherá se entrar.
Titular Titular
μ μ
=
− =
Firma T deseja Lutar se e somente se:
Ganho de Lutar ≥ Ganho de Acomodar
( )
-1 2 1 1 2
3
T T
T
μ μ
μ
≥ − + − ⇒
≥ : 2 3
1
T
EBPfraco μ =
Sabino Porto Jr - Teoria dos jogos - material não revisado
27
( )
1 2
1 1
3
Firma E deve aleatorizar no equilibrio com probabilidade positiva de jogar In e In μ
T− =
T fraco
2 fraco
tuacoes que nao funcionam:
1) Se 2 em EBP isso geraria uma contradiçao, pois, nesse caso, 3
T deveria Lutar com prob. 1,0, isso implicaria que E deveria escolher In , .1, 0 o EBP iri
Si
com prob
μ >
⇒ a requerer μ
T=0, o que representa uma contradiçao.
T fraco
1 fraco
tuacoes que nao funcionam:
2) Se 2 em EBP isso geraria uma contradiçao, pois, nesse caso, 3
T deveria Acomodar com prob. 1,0, isso implicaria que E deveria escolher In , .1, 0 o EBP
Si
com prob
μ <
⇒ iria requerer μ
T=1, o que representa uma contradiçao.
: 2
T
EBPfraco μ =
( )
1 2
3 1 1
3
Firma E deve aleatorizar no equilibrio com probabilidade positiva de jogar In e In
T
T
μ μ
− =
( ) ( )
1 2
Isso significa que a probabilidade de T lutar deve fazer com que a firma E seja indiferente entre IN1 e IN2:
1 3 1 2 1
1 Payoff de Entr
IN IN
E E
Lutar Lutar Lutar Lutar
E E
s s s s
s
γ
⎡ ∏ ⎤ = ⎡ ∏ ⎤ ⇒
⎣ ⎦ ⎣ ⎦
− + − = + − ⇒
⎛ ⎞
= ⎜ ⎟ ⇒ Payoff de Entr ar é dado por:
Lutar
2
s = ⎜ ⎝ γ + ⎟ ⎠ ⇒
( ) ( )
1 2
ar é dado por:
3 2
0 Pr 0
2
IN IN
E E E
E ou γ Out
γ
⎡ ∏ ∏ ⎤ = + > ⇒ =
⎣ ⎦ +
( 0 1 2 ) i
p a ra > 0 :
, , 0 , 2 1 , s = p ro b . d o jo g a d o r E 3 3
E B P fr a c o
s s s
γ
⎛ ⎞
= ⎜ ⎝ ⎟ ⎠ ↔
Sabino Porto Jr - Teoria dos jogos - material não revisado
29
1 2
T
e s c o lh e r o u t, In o u In , re s p e c tiv a m e n te .
1 2
;
2 3
L u ta r
s μ
γ
⎝ ⎠
= =
+
Comentários:
Por que esse EB é considerado fraco?
Resposta: O requerimento de consistência sobre a formação das crenças é mínimo, restringe-se apenas a estabelecer probabilidades não- negativas dentro de cada CI. São consistentes com estratégias de equilíbrio dentro do caminho de equilíbrio.
Ou seja, não é colocada nenhuma restrição sobre crenças fora do caminho de equilíbrio
crenças fora do caminho de equilíbrio.
Como fortalecer o EBP???
Os exemplos a seguir ilustram a necessidade de fortalecer o EBP.
Natureza
½ ½
EBPfraco:
Setas e [ ] Pr( CI 1 /s)>0
1 2
x y y x
l r l r
2 10
2 10
[0,5] [0,5]
Pr( CI 1 /s) 0 Pr( CI 2 /s )=0
Ou seja, crenças definidas para o jogador 2 não são boas, pois o Conjunto de informação do 2 só pode ser realizado se o jogador 1 desviar e escolher y nos dois pontos de decisão.
Sabino Porto Jr - Teoria dos jogos - material não revisado
31 0
5
0 5 5
2
5 10
Necessitamos de crenças consistentes fora do caminho de equilíbrio...Saída será impor mais restrições sobre o sistema de crenças (jogos de sinalização ou outra opção).
(0,2)
Out In
E
E
A d L t
Jogador T
Voltando ao Exemplo 2:
(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar
T
Acomodar3,1 -2,-1
Lutar
1,-2 -3,-1
Acomodar Lutar
Joga dor E
[1] [0]
( ) ( ) [ ]
{ , mod se In , se E jogar In ; 1 }
fraco
EBP = Out aco ar Lutar μ =
Veja: não é um ENPS porque não especifica um EN do jogo pós- entrada. A crença do jogador T não é restringida se usarmos o
EBP
fraco, ou seja, essa noção de equilíbrio não impõe restrições
para CI fora do equilíbrio (visão agnóstica)
Definição: Equilíbrio Seqüencial
(Kreps e Wilson, 1982)
Um par é um Equilíbrio Seqüencial de jogos na forma extensiva se tem as seguintes propriedades: ( ) s , μ
i. s é seqüencialmente racional dado o sistema de crenças ii. Existe uma seqüencia de Estratégias Mistas completas, tal que
μ
lim Onde:
é a crenças derivada do perfil de estratégias s , usando Bayes.
k k
k k
μ μ
μ
=
→∞→
=
Sabino Porto Jr - Teoria dos jogos - material não revisado
33
Proposição: todo Equilíbrio Seqüencial é um EBP fraco , mas, em geral, o contrário não é verdade.
Intuição
Equilíbrio seqüencial exige que as crenças sejam justificadas a partir de um conjunto completo de Estratégias Mistas que são próximas a s ( equivale, aproximadamente, a uma pequena perturbação das estratégias de equilíbrio?)
Isso requer que os jogadores possam justificar
(aproximadamente) suas crenças através de alguma
historia na qual jogadores cometem erros com alguma
historia na qual jogadores cometem erros, com alguma
probabilidade positiva, ao escolher suas estratégias.
Voltando ao Exemplo:
Natureza
½ ½
Toda crença que pode ser derivada de qualquer
seqüência de EM
completas atribui igual probabilidade para os 2 pontos de decisão no CI 2.
1 2
x y y x
l r l r
2 10
2 10
[0,5] [0,5]
Equilibro Seqüencial único:
(y r) e igual nos dois p
Assim, em qualquer Equilíbrio Seqüencial o jogador 2 deve jogar r e o jogador 1 deve, portanto, jogar y.
μ
Sabino Porto Jr - Teoria dos jogos - material não revisado
35 0
5
0 5 5
2
5 10
(y,r) e igual nos dois pontos de decisão do CI
2μ
( ) ( ) ( ) ( )
22( ) ( )
Jogar y daria mais para 1 e jogar r seria bom para o 2, pois:
E 0,5 5 0,5 5 5
E 0,5 2 0,5 10 6
l
r
Π = ⋅ + ⋅ =
Π = ⋅ + ⋅ =
(0,2)
Out In
E
E
A d L t
Jogador T
Voltando ao Exemplo 2:
(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar
T
Acomodar3,1 -2,-1
Lutar
1,-2 -3,-1
Acomodar Lutar
Joga dor E
[1] [0]
( ) ( )
{ , Acomodar se In , mod se E joga In } =ENPS
único únicoES = In Aco ar
Verificação:
Considere o Conjunto de Informação do jogador T:
Tome uma EM-completa qualquer
Considere o ponto de decisão inicial a partir da entrada da firma E (ponto inicial do subjogo seguinte à entrada) Considere as crenças no CI T
Isso implica que qualquer estratégia no ES deve especificar EM no subjogo pós-entrada.
Sabino Porto Jr - Teoria dos jogos - material não revisado
37
Proposição: Em todo Equilíbrio Seqüencial de um jogo na forma extensiva a estratégia de equilíbrio constitui um ENPS do Jogo extensivo.
Comentários:
a) Equilíbrio seqüencial fortalece tanto o ENPS como EBP fraco
b) Todo Equilíbrio Seqüencial é tanto um ENPS quanto um EBP fraco
c) Em alguns casos, o sistema de crenças fora do equilíbrio exigido pelo ES, pode ser muito forte.
d) Por exemplo, eles podem implicar que dois jogadores com o mesmo CI devem ter
exatamente as mesmas crenças
independentemente dos desvios dos outros jogadores que têm levado o jogo a realizar uma dada parte da árvore.
e) Noção mais forte ENPTH – Selten, 1975.
(0,2)
Out In
E
E
Crenças Razoáveis e Forward Indução
Crenças Razoáveis:
especifica restrições adicionais (fora do caminho de equilíbrio) que crenças razoáveis deveriam
(-3,-1) (1,-2) (-2,-1) (3,1) Lutar Acomodar
[1] T [0]
( ) ( ) [ ]
{ d I E j I 1 }
EBP O t L t
ç satisfazer.
Sabino Porto Jr - Teoria dos jogos - material não revisado
39
( ) ( ) [ ]
{ , mod se In , se E jogar In ; 1 }
fraco
EBP = Out aco ar Lutar μ =
Razoabilidade para E: se entrar ele prefere jogar In2, pois, In 2 > In 1 , afinal (-2,3) > (-3,1)
Portanto, se resolver Entrar o jogador E prefere In 2
Forward Indução
Forward Indução exclui um dos EN no sub-jogo pós-entrada.
Indução Retroativa: jogador decide qual é a sua ação ótima em algum ponto da arvore do jogo tomando como base as ações ótimas dos seus oponentes racionais em pontos de decisão ótimas dos seus oponentes racionais em pontos de decisão subseqüentes ou em posições posteriores do jogo.
Forward Indução: jogador raciocina sobre o que poderia ter acontecido, racionalmente, em movimentos prévios do jogo.
No exemplo a seguir: firma T decide sobre qual sua acao otima pós-entrada assumindo que a firma E comporta-se
racionalmente na sua decisão de entrada.
Problemas potenciais com FI:
Problemas potenciais com FI:
O que aconteceria num mundo onde jogadores podem cometer erros com pequenas probabilidades positivas?
FI continua consistente?
(0,2)
Out In
E
E
SN LN
Jogador T
Voltando ao Exemplo 2:
Pós-entrada: 2 EN
minado por FI
(-6,-6) (-1,-1) (1,-1) (-3,-3) SN LN
T
SN-6,-6 -1,1
LN
1,-1 -3,-3
SN LN
Joga dor E
[1] [0]
Forward Indução: Para o Raciocínio do T: se o
EN elim
Sabino Porto Jr - Teoria dos jogos - material não revisado
41
Forward Indução: Para o jogador E, entrar e jogar SN se entrar é pior do que jogar OUT. E deve jogar LN no jogo pós-entrada.
Raciocínio do T: se o jogador E entrar ele vai jogar LN no jogo pós- entrada, dessa forma, T deve jogar SN.
Job Market Signaling
Qualidade é uma característica oculta, então, os que produzem alta qualidade tem um incentivo para emitir um sinal indicando a alta qualidade tem um incentivo para emitir um sinal indicando a sua qualidade.
Sinal credible: apenas se o produtor de baixa qualidade não tem interesse em emitir o mesmo sinal, ou seja, ele não sai
ganhando se emitir o mesmo sinal.
Custos de emitir sinal: toda emissão de sinal envolve custos e
t ã i i di íd d b i
esses custos são maiores para os indivíduos de baixa qualidade.
Portanto, o custo marginal de emitir um sinal a mais é maior
para o individuo de baixa que, por isso mesmo, acaba revelando
seu tipo e emitindo um sinal mais fraco.
Preço da revelação verdadeira: os recursos utilizados na emissão de sinal não propiciam qualquer utilidade direta.
Mercado de trabalho: alguns indivíduos são inatamente inteligentes e working hard e sabem disso.
Sinal: treinamento e certificados. Indivíduos fazem escolhas sobre seus anos de formação que ajudam a revelar seu tipo peessoal.
Empregador: faz uma escolha no escuro, pois não observa o tipo do empregado, apenas o sinal emitido. Oferece salarios maiores para o de alta na expectativa de atrair os mais produtivos.
Problema: o tipo de baixa nesse contexto não tem incentivos
Sabino Porto Jr - Teoria dos jogos - material não revisado
43
Problema: o tipo de baixa, nesse contexto, não tem incentivos para revelar verdadeiramente o seu tipo. Pois, supondo que a producao seja realizada em equipes, não é possivel distinguir de forma clara e objetiva o grau de contribuição de cada um para o resultado final da equipe. Ou seja, é impossível para o gerente identificar quem é quem. (L ou H)
Modelo:
H = tipo e alta produtividade e habilidade L = tipo de baixa produtividade e habilidade w H = salário de alta oferecido pelo empregador w H salário de alta oferecido pelo empregador w L = salário de baixa oferecido pelo empregador w H > w L
C H = custo da pós-graduação para H C L = Custo da pós-graduação para L
C L > C H ( o trabalhador de baixa leva um ou dois
semestres a mais para terminar o curso e tem que
semestres a mais para terminar o curso e tem que
trabalhar muito mais forte para ser admitido numa boa
universidade)
Como induzir o L a falar a verdade?
[ ]
[ ]
[ ]
Se Melhor para L é aceitar W
Se H prefere obter o certificado Essas condições mantém-se se:
C
H L L L
H H L
W C W
W C W
W W C
− < →
− > →
[ ]
C Supondo:
H H L L
H L
W W C
C C
< − <
<
Exemplo:
1000 600
Nesse caso, o sinal só revela o tipo do trabalhador se:
400
H L
H L
W W
C C
=
=
< <
Sabino Porto Jr - Teoria dos jogos - material não revisado
45
Ineficiência: o sinal implica em custo para a sociedade.
Modelo geral
2 Tipos de trabalhadores: H, L
% da população do tipo H que é de conhecimento comum.
ρ =
( )
Funçao Utilidade dos trabalhadores:
( )
i
2 2
U , ( ) ,
consumo de Lazer
valor de mercado de todos os outros bens e serviços ( ) 0 x
Se ( ) ( )
0; 0
i
g
g g
i i
x y x y i H L x
y UM x
x x UM x UM x
x x
β
β β
= + → =
=
=
> ∀
′′ > ⇒ ′ ′′ < ′
∂ > ∂ <
∂ x ∂ x
∂ ∂
Função consumo de lazer:
tempo que o indivíduo leva para obter educação dotação individual de tempo
x T e e T
= −
=
=
Relação da Utilidade do indivíduo e Educação:
A Ui cairá quando e aumentar por causa da utilidade marginal decrescente do x.
( ) ( )
ficado: Custo marginal da educação é positivo e crescente em e.
Função Utilidade do Trabalhador:
( ) ( )
Se e e UMg x e UMg x e Signi
U W C
′′ > ⇒ ′ ′′ > ′
Sabino Porto Jr - Teoria dos jogos - material não revisado
47
( ) ( )
( ) renda que é uma funça do nível de educação (e).
( ) qua
i i
i
U W e C e W e
C e
= −
=
= ntidade de lazer que é sacrificada quando o trabalhador obtém e anos de educação.
( )
E x e m p lo :
( , ) ( )
( , ) 3
( ) 3
( 0 ) 0 ; 4 6 6
6
i i
i
U x y x y
U x y x y
x x
β β
β β β
β
= +
= +
= ⇒
= = ⇒ Δ =
Δ
( ) ( )
( ) ( )
6 1, 5 9
4
3 0 , 6 U M g ( x ) é d e c r e s c e n te e m x . 5
S u p o n h a q u e T = 2 4 , e n t ã o , C ( e ) :
(8 ) 2 4 1 6 1 4 , 7 1 2 2 , 7
(1 0 ) 2 4 1 4 3 , 4 7
0 , 7 7 x x
x C C C β β
β β
β β
Δ = = ⇒ = ⇒
Δ
Δ = = ⇔
Δ
= − = − =
= − = ⇒
Δ 0 , 7 7 0 3 8 5
2 C
e = Δ
( ) ( )
0 , 3 8 5
0 , 8 3
(1 2 ) 2 4 1 2 4 , 3 0 , 4 1 5
2
P o r ta n t o , à m e d i d a q u e a u m e n t a o n í v e l d e e d u c a ç ã o , a u m e n t a o C M g d e a d q u i r i r m a is e d u c a ç ã o .
C C
β β e
=
= − = ⇒ Δ = =
Δ
Valor do produto marginal do indivíduo i:
( )
( ) ( )
( ) produtividade aumenta com o nível de educação.
Por definição:
i
H L
m e f e m e m e
=
+⇒
( ) > ( )
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
2 2
2
2 2 2
:
1 3
( ) ; ( )
2 4
1 2
1 1
2 2
H L H L
H H
H
Exemplo
C e e C e e C e C e
xT x C e T T e
C e T T T e T e
β β β
= = → <
= − ⇒ = − − ⇔
⎡ ⎤ ⎡ ⎤
= ⎢ ⎣ − ⎥ ⎢ ⎦ ⎣ − − − − ⎥ ⎦ ⇒
Sabino Porto Jr - Teoria dos jogos - material não revisado
49
( ) 1
2.
2 : Educação C
He e Note
=
é mais do que um sinal, ela também aumenta a produtividade.
Simplificação inicial: a educação não afeta a produtividade.
2
i i
L H
m m
m m
=
=
constante positiva m =
Equilíbrio Pooling: (w*, e*)
Os dois tipos obtém o mesmo nível de educação e recebem o mesmo salário no equilíbrio.
Equilíbrio: maximiza o lucro da firma e a
( )
C
He
Equilíbrio: maximiza o lucro da firma e a
utilidade do trabalhador.
Salário de equilíbrio:
( )
2 1
percentual da população que é de alta
W m m
W m m
ρ ρ
ρ ρ
∗
∗
= + −
= +
= percentual da população que é de alta.
Nível crítico g de educação: (crenças de Equilíbrio) ) se e < g Trablhador é tipo L W
) se e Trabalhador é do tipo H com probabilidade
a m
b g
ρ
∗
=
⇒ ⇒ =
≥ ⇒ e do
tipo L com probabilidade (1- ) W m m . ρ ρ ⇒
∗= ρ +
2
ções necessárias para que o trabalhador (H e L) aceitem o W : 1
Condi
∗Sabino Porto Jr - Teoria dos jogos - material não revisado
51
2
2
1 2 1
2
situação de total informação, e se e nao aumenta a produtividade, o melhor será:
e=0 i
e g m m g m
m m g m
Nessa ρ ρ
= ⇒ + − >
+ − >
∀
Equilíbrio Separador: tipo H obtém mais educação Equilíbrio Separador:
nivel critico de educaçao Esquema Salarial no Eq. Separador:
) Se e < g é um trabalhador L com prob. 1, pague m.
b) Se e g é um trabalhador H com prob. 1, pague 2m.
Ob
H L
e e g
a
∗
>
∗=
⇒
≥ ⇒ servação:
Nenhum trabalhador escolherá e>g.
Se 0<e<g o trabalhador obterá o mesmo nível de salário que alguém com e=0.
Portanto, Independente do tipo o trabalhador obtera,
e =g ou e = 0 ⇒ Restrição de au to-seleção Incentivo-compatível.
e U H U L
0 m m
ndições Incentivo-compatíveis do Equilíbrio Separador:
1 3
Co
0 m m
g 2m-1/2g 2 2m-3/4g 2
2 2
2 2
1 3
2m- ; 2m-
2 4
3 1
4 2
H obterá e = g.
g- crítico (desencoraja L a tomar e=g)
g m m g
g m g
apenas
> > ⇒
> > → Ingredientes de decisão de um trabalhador
Indica o que maximiza U i
Equilíbrio Separador: satisfaz a condição de auto- seleção.
Condição de auto-seleção: “cada trabalhador deve achar vantajoso emitir um sinal que é diferente de um sinal emitido pelo o outro tipo.”
Definição: Condição de auto seleção: em um equilíbrio Definição: Condição de auto-seleção: em um equilíbrio separador o resultado obtido por H não é preferido pelo tipo L e, similarmente, o resultado obtido pelo tipo L não é preferido pelo tipo H.
0
0
e g e
H H
e e g
L L
U U e
U U e
= =
= =
> ∀
> ∀ ( )
2 2
:
9 da , :
3 1
12 18
4 2
L
Exemplo
Se m Valor PM entao
g m g g
=
> > ⇒ < < ⇒
Sabino Porto Jr - Teoria dos jogos - material não revisado
53
4 2
3, 464 4, 243
: 2 18
: 0 9
H H
L L
g
H e g W m
L e W m
< <
= ⇒ = =
= ⇒ = =
Situação nova: educação aumenta a produtividade do trabalhador H e L, mas aumenta mais para o trabalhador H.
2 H
2 L
:
( ) 6 C (e )= 1 2 ( ) 3 C (e )= 3
4
H
L
E x e m p lo
m e e e
m e e e
=
=
Informação completa e total: os tipos são de conhecimento comum e a competição assegura que os salários serão iguais aos valores das produtividades marginais dos indivíduos
2
:
6 1 . .
2
6 0 6 ( 6) 36
H H
e
H
H H
Equilibrio
MaxU W C e e C P O
U e e
∗m e W
= − = − ⇒
∂ = − = ⇒ = ⇒ = = =
∂
Tipo L tem interesse em blefar e passar como H, num mundo com informação incompleta, pois assim obtém U
L=9
2
2
3 3 . .
4
3 6 0 2 ( 2) 6
4
tilidade de L se blefar e passar como H:
U 36 3 (6) 9 3 4
L L
e
L
L L
L
e
MaxU W C e e C P O
U e e m e W
e U
∗
∂
= − = − ⇒
∂ = − = ⇒ = ⇒ = = =
∂
= − = >
e W U H U L
6 36 18 9
2 6 4 3
Conclusão: num mundo com Informação incompleta o resultado obtido com total informação não é um equilíbrio.
Firmas, agora, não pagariam W = 36 para todos com e>= 6.
( ) ( )
=1/3, o valor medio da PMg do trabalhador, sera dado por:
1 2
36 18 24 36 cro negativo.
3 3
Quando
Lu ρ
+ = < ⇒
( ) ( )
E q u ilib rio d a d o :
P ro d u tiv id a d e e s p e ra d a ( ) (1 ) ( )
1 2
( ) (1 ) ( ) 6 3 4
3 3
E q u ilib rio p o o lin g : W = W = 4 g
H L
H L
m g m g
m g m g g g g
ρ
ρ ρ
ρ ρ
= + −
+ − = + =
Sabino Porto Jr - Teoria dos jogos - material não revisado
55
L H
E q u ilib rio p o o lin g : W = W = 4 g R e s u m o :
S e e < g a s s u m e -s e q u e o tra b a lh a d o r ´´e L e p a g a -s e 3 e
S e e ≥ g a s s u m e -s e q u e o tra b a lh a d o r ´´e H c o m p ro b a b ilid a d e ρ e p a g a -s e 4 g .
Se e < g, qual será a escolha de H: W = 4g ou W = 3e???
U
H2
1,35 4 6,65 e 4,5
4 0,5
2U
H= − e e
4 Se e < ≤ ⇒ g
2 2
4
3 0,5 4 0,5
tan , tipo H obtem e = g e recebe W=4g, quando g 4
H
Se e g
e e U g g
Por to
< ≤ ⇒
− < ≤ −
≤
Decisão do Tipo L:
U L
2
0,9 2
2/34,45 e 3,0
4 0,75
2U
L= − e e
2 / 3
2
S ≤
Sabino Porto Jr - Teoria dos jogos - material não revisado
57
2 2
2 / 3
2/3
2
3 0, 75 4 0, 75
tan , tipo L obtem e = g 2 e recebe W=4g, quando g 4
L