Dilema dos Prisioneiros

(1)

Definição de jogo

Um jogo consistem em

I um conjunto N de jogadores;

I para cada jogador i emN,

um conjuntoS_i das estratégias do jogadori;

uma função utilidadeu_i deS emR, onde S =×_i∈NS_i.

Alternativamente, pode-se dar funções custoci e nãoui.

(2)

Definição de jogo

Um jogo consistem em

I um conjunto N de jogadores;

um conjuntoS_i das estratégias do jogadori;

uma função utilidadeu_i deS emR, onde S =×_i∈NS_i. Alternativamente, pode-se dar funções custoci e nãoui.

(3)

Dilema dos Prisioneiros

I Dois prisioneiros Ae Binterrogados separadamente

I Duas possíveis respostas: confessar ou silenciar

I Duração da pena depende das respostas Matriz de custo

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

(4)

Dilema dos Prisioneiros

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

I conjunto de jogadores: {A,B}

I conjuntos de estratégias SA =SB ={Confessa,Silencia}

I S =S_A×S_B

I funções custo c_A ec_B dadas pela matriz acima

(5)

Batalha dos Sexos

I Um casal (R e G) escolhendo uma atividade de lazer

I Duas possibilidades: ir ao cinemaou andar de bike

I Cada um prefere um pouco mais uma à outra atividade mas preferem fazer algo juntos

Matriz de utilidade

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(6)

Batalha dos Sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

I conjunto de jogadores: {R,G}

I conjuntos de estratégias SR =SG ={Cinema,Pedalar}

I S =S_R×S_G

I funções utilidades u_R eu_G dadas pela matriz acima

(7)

Notação e conceitos básicos

Considere um jogoJ dado por

I um conjunto N= [n]de jogadores;

um conjuntoSi das estratégias do jogadori;

uma função utilidadeu_i deS emR, onde S =×_i∈NS_i.

Notação:

Para um vetors = (s1, . . . ,s_n)em S, e um jogadori, s−i é o vetor(s₁, . . . ,si−1,s_i+1, . . . ,s_n).

Parar∈S_i,(r,s−i) é o vetor(s1, . . . ,si−1,r,s_i+1, . . . ,s_n)∈S. Vetor de estratégias obtido des trocando-ses_i porr.

(8)

Notação e conceitos básicos

uma função utilidadeu_i deS emR, onde S =×_i∈NS_i. Notação:

Para um vetors = (s1, . . . ,s_n)em S, e um jogador i, s−i é o vetor(s₁, . . . ,si−1,s_i+1, . . . ,s_n).

Parar∈S_i,(r,s−i) é o vetor(s1, . . . ,si−1,r,s_i+1, . . . ,s_n)∈S. Vetor de estratégias obtido des trocando-ses_i porr.

(9)

Notação e conceitos básicos

Parar∈S_i,(r,s−i) é o vetor(s₁, . . . ,s_i−1,r,s_i+1, . . . ,s_n)∈S.

Vetor de estratégias obtido des trocando-ses_i porr.

(10)

Notação e conceitos básicos

Parar∈S_i,(r,s−i) é o vetor(s₁, . . . ,s_i−1,r,s_i+1, . . . ,s_n)∈S.

Vetor de estratégias obtido des trocando-ses_i porr.

(11)

Estratégias dominantes

Estratégiar emS_i édominante para o jogadori

seu_i(s)≤u_i(r,s−i) para todo vetor de estratégiass em S.

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Não há estratégias dominantes neste jogo.

(12)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Dilema dos prisioneiros

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

Confessaé estratégia dominante para os dois prisioneiros.

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(13)

Estratégias dominantes

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(14)

Estratégias dominantes

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes. É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(15)

Estratégias dominantes

Na maioria dos jogos, não há estratégias dominantes. É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

(16)

Estratégias dominantes

Na maioria dos jogos, não há estratégias dominantes.

É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

(17)

Estratégias dominantes

É interessante projetar jogos com estratégias dominantes.

Outro exemplo: Leilões do segundo preço.

(18)

Estratégias dominantes

É interessante projetar jogos com estratégias dominantes.

Outro exemplo: Leilões do segundo preço.

(19)

Noção de equilíbrio

Parar∈S_i,(r,s−i) é o vetor(s1, . . . ,s_i−1,r,s_i+1, . . . ,s_n)∈S.

Jogadori está satisfeitocom s emS

seu_i(s)≥u_i(r,s−i) para toda estratégia r em S_i.

(Diz-se quei não tem incentivo para mudar de estratégia.) Um vetors em S é umequilíbrio de Nash

se todo jogador está satisfeito coms.

Um jogo pode ter mais do que um equilíbrio de Nash, ou pode não ter nenhum equilíbrio de Nash.

(20)

Noção de equilíbrio

(Diz-se quei não tem incentivo para mudar de estratégia.)

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

(21)

Noção de equilíbrio

(22)

Noção de equilíbrio

(23)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,sn) se u_i(s)≥u_i(r,s−i), para toda estratégiar emS_i.

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Equilíbrios de Nash: (Cinema,Cinema) e (Pedalar,Pedalar)

(24)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,s_n) se u_i(s)≥u_i(r,s−i), para toda estratégiar emS_i.

Dilema dos prisioneiros:

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

Único equilíbrio de Nash: (Confessa,Confessa)

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(25)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,sn) se u_i(s)≥u_i(r,s−i), para toda estratégiar emS_i.

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(26)

Equilíbrio de Nash

B

A pedra papel tesoura

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

Não há equilíbrio de Nash!

(27)

Equilíbrio de Nash

B

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

Não há equilíbrio de Nash!

(28)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição: adversário tira proveito de estratégias determinísticas. Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário Ao detectar sua estratégia, adversário passa a vencer.

(29)

Estratégias puras versus mistas

é uma distribuição de probabilidades no conjuntoSi.

Particularmente interessante emjogos com repetição: adversário tira proveito de estratégias determinísticas. Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

(30)

Estratégias puras versus mistas

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição:

adversário tira proveito de estratégias determinísticas.

Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

(31)

Estratégias puras versus mistas

I jogar sempre a jogada anterior do adversário

Ao detectar sua estratégia, adversário passa a vencer.

(32)

Estratégias puras versus mistas

(33)

Estratégias puras versus mistas

é uma distribuição de probabilidades no conjuntoSi. Estratégias emS_i são então chamadas depuras.

Discutimosequilíbrio de Nash com estratégias puras.

Para definição mais ampla, precisamos de mais notação.

(34)

Estratégias puras versus mistas

(35)

Estratégias puras versus mistas

(36)

Estratégias puras versus mistas

Umaestratégia mistapara o jogadori

é umadistribuição de probabilidades no conjuntoSi. Sejaσ um vetor de estratégias mistas.

Ou seja, para cada jogadori,

σ_i é uma distribuição de probabilidades em S_i.

Qual é autilidade esperadado jogadori para σ? E[ui(σ)] = X

s∈S

ui(s)Pr_σ[s], onde Pr_σ[s] =Q

jσ_j(s_j).

(Considera-se que os jogadores são independentes.)

(37)

Estratégias puras versus mistas

σ_i é uma distribuição de probabilidades em S_i. Qual é autilidade esperadado jogadori para σ?

E[ui(σ)] = X

s∈S

jσ_j(s_j).

(38)

Estratégias puras versus mistas

E[ui(σ)] = X

s∈S

ui(s)Pr_σ[s],

onde Pr_σ[s] =Q

jσ_j(s_j).

(39)

Estratégias puras versus mistas

E[ui(σ)] = X

s∈S

jσ_j(s_j).

(40)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si.

σ é um equilíbrio de Nash (de estratégias mistas) se todo jogador está satisfeito comσ.

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(41)

Equilíbrio de Nash

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si. σ é um equilíbrio de Nash (de estratégias mistas) se

todo jogador está satisfeito comσ.

Exemplo:

(42)

Equilíbrio de Nash

E[u_i(σ)]≥E[u_i(ρ, σ−i)] para toda estratégia mistaρ sobre S_i. σ é um equilíbrio de Nash (de estratégias mistas) se

Ou seja, emσ, nenhum jogador tem incentivo para mudar de estratégia (mista).

Exemplo:

(43)

Equilíbrio de Nash

Exemplo:

(44)

Equilíbrio de Nash

Exemplo:

(45)

Teorema de Nash

As hipóteses são necessárias:

existem jogos com númeroinfinitode jogadores e jogos com conjuntos de estratégiasinfinitos sem equilíbrio de Nash.

(46)

Teorema de Nash

As hipóteses são necessárias:

existem jogos com númeroinfinitode jogadores e jogos com conjuntos de estratégiasinfinitos sem equilíbrio de Nash.

(47)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias (soma dos custos ou utilidades dos jogadores)

Jogo de congestionamento B

A P Q

P 2 5

2 7

Q 6 1

4 1

Valores sociais 4,12, 10 e 2.

I Valor social ótimo

(soma máxima das utilidades dos jogadores)

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S)

(48)

Mais alguns conceitos básicos

(49)

Mais alguns conceitos básicos

(50)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias

Pedra-papel-tesoura

B

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

(51)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias

(soma dos custos/utilidades zero p/ todo s em S) Pedra-papel-tesoura

B

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

(52)

Complexidade computacional

Jogos de soma zero com dois jogadores Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

m: número de estratégias do jogador 1 n: número de estratégias do jogador 2

Basta dar uma matriz, pois o jogo é de soma zero. O custo do jogador 1 é o ganho do jogador 2 e vice-versa. Pelo Teorema de Nash, sempre existe um equilíbrio. Como podemos resolver esse problema?

(53)

Complexidade computacional

Basta dar uma matriz, pois o jogo é de soma zero.

O custo do jogador 1 é o ganho do jogador 2 e vice-versa.

Pelo Teorema de Nash, sempre existe um equilíbrio. Como podemos resolver esse problema?

(54)

Complexidade computacional

Pelo Teorema de Nash, sempre existe um equilíbrio.

Como podemos resolver esse problema?

(55)

Complexidade computacional

Pelo Teorema de Nash, sempre existe um equilíbrio.

Como podemos resolver esse problema?

(56)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

O que é um equilíbrio?

São duas distribuições de probabilidade, ou seja, vetoresp, com m entradas, eq, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n tais que...

Antes de responder...

Se o jogador 1 usa a estratégia (mista)p e o 2 usa a q, qual é o valor esperado que o jogador 1 ganha?

(57)

Jogos de soma zero com dois jogadores

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

(58)

Jogos de soma zero com dois jogadores

I P

ip_i =1 e p_i ≥0 parai =1, . . . ,m

I P

(59)

Jogos de soma zero com dois jogadores

I P

ip_i =1 e p_i ≥0 parai =1, . . . ,m

I P

Se o jogador 1 usa a estratégia (mista)p e o 2 usa aq, qual é o valor esperado que o jogador 1 ganha?

(60)

Jogos de soma zero com dois jogadores

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jq_j =1 eq_j ≥0 paraj =1, . . . ,n.

Considere queAé a matriz custo do jogador 1.

X

ij

a_ijp_iq_j = X

i

p_iX

j

a_ijq_j = pAq

(61)

Jogos de soma zero com dois jogadores

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jq_j =1 eq_j ≥0 paraj =1, . . . ,n.

Considere queAé a matriz custo do jogador 1.

X

ij

a_ijp_iq_j = X

i

p_iX

j

a_ijq_j = pAq

(62)

Jogos de soma zero com dois jogadores

A: matriz utilidade do jogador 1

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Valor esperado que o jogador 1 ganhaé pAq.

Uma vez que o jogador 1 escolhep,

o jogador 2 escolheq que minimiza a utilidade de 1. Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA. Assim jogador 1 escolhep quemaximize esse mínimo.

(63)

Jogos de soma zero com dois jogadores

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

o jogador 2 escolheq que minimiza a utilidade de 1.

Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA. Assim jogador 1 escolhep quemaximize esse mínimo.

(64)

Jogos de soma zero com dois jogadores

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

das estratégias que correspondem a entradas mínimas depA.

Assim jogador 1 escolhep quemaximize esse mínimo.

(65)

Jogos de soma zero com dois jogadores

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

das estratégias que correspondem a entradas mínimas depA.

Assim jogador 1 escolhep quemaximize esse mínimo.

(66)

Jogos de soma zero com dois jogadores

I P

ip_i =1 e p_i ≥0 parai =1, . . . ,m,

I P

jq_j =1 eq_j ≥0 paraj =1, . . . ,n.

Jogador 2 gosta de estratégias que correspondem

a entradas mínimas depA, assim 1 quer encontrarp que

maximizev sujeito aP

ipi =1

sujeito a (pA)_j ≥v para j =1, . . . ,n sujeito a p_i ≥0 parai =1, . . . ,m.

(67)

Jogos de soma zero com dois jogadores

I P

ip_i =1 e p_i ≥0 parai =1, . . . ,m,

I P

jq_j =1 eq_j ≥0 paraj =1, . . . ,n.

Jogador 2 gosta de estratégias que correspondem

a entradas mínimas depA, assim 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)_j ≥v para j =1, . . . ,n sujeito a p_i ≥0 parai =1, . . . ,m.

(68)

Jogos de soma zero com dois jogadores

Jogador 1 quer encontrarp que maximizev

sujeito aP

ip_i =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a p_i ≥0 parai =1, . . . ,m.

Jogador 2 quer encontrarq que minimizev

sujeito aP

iqi =1

sujeito a (Aq)_i ≤v para i =1, . . . ,m sujeito a q_j ≥0 paraj =1, . . . ,n.

(69)

Jogos de soma zero com dois jogadores

sujeito aP

ip_i =1

sujeito aP

iqi =1

sujeito a (Aq)_i ≤v parai =1, . . . ,m sujeito a q_j ≥0 paraj =1, . . . ,n.

(70)

Jogos de soma zero com dois jogadores

sujeito aP

ip_i =1

sujeito aP

iq_i =1

sujeito a (Aq)i ≤v parai =1, . . . ,m sujeito a q_j ≥0 paraj =1, . . . ,n.

Estes sãoprogramas lineares, e um é o dual do outro!

(71)

Jogos de soma zero com dois jogadores

sujeito aP

ip_i =1

sujeito aP

iq_i =1

sujeito a (Aq)i ≤v parai =1, . . . ,m sujeito a q_j ≥0 paraj =1, . . . ,n.

Estes sãoprogramas lineares, e um é o dual do outro!

(72)

Jogos com dois jogadores

Problema: Dada uma matriz Am×n

(representando um jogo de dois jogadores de soma zero), encontrar um equilíbrio de Nash (de estratégias mistas).

Conclusão:

Este problema pode ser resolvido em tempo polinomial (usando programação linear).

E para jogos que não sejam de soma zero?

(73)

Jogos com dois jogadores

Conclusão:

(74)

Jogos com dois jogadores

Conclusão:

(75)

Complexidade computacional

Os seguintes problemas sãoNP-completos:

dado um jogo de duas pessoas na forma matricial, decidir se este jogo tem

I pelo menos dois equilíbrios de Nash;

I dadok, um equilíbrio de Nash em que o jogador 1 tem utilidade pelo menos k;

I dadok, um equilíbrio de Nash com valor social pelo menosk;

I dadok, um equilíbrio de Nash com pelo menosk estratégias no seu suporte;

I dados, um equilíbrio de Nash com s no suporte;

I dados, um equilíbrio de Nash sem s no suporte.