• Nenhum resultado encontrado

Dilema dos Prisioneiros

N/A
N/A
Protected

Academic year: 2022

Share "Dilema dos Prisioneiros"

Copied!
75
0
0

Texto

(1)

Definição de jogo

Um jogo consistem em

I um conjunto N de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi.

Alternativamente, pode-se dar funções custoci e nãoui.

(2)

Definição de jogo

Um jogo consistem em

I um conjunto N de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi. Alternativamente, pode-se dar funções custoci e nãoui.

(3)

Dilema dos Prisioneiros

I Dois prisioneiros Ae Binterrogados separadamente

I Duas possíveis respostas: confessar ou silenciar

I Duração da pena depende das respostas Matriz de custo

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

(4)

Dilema dos Prisioneiros

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

I conjunto de jogadores: {A,B}

I conjuntos de estratégias SA =SB ={Confessa,Silencia}

I S =SA×SB

I funções custo cA ecB dadas pela matriz acima

(5)

Batalha dos Sexos

I Um casal (R e G) escolhendo uma atividade de lazer

I Duas possibilidades: ir ao cinemaou andar de bike

I Cada um prefere um pouco mais uma à outra atividade mas preferem fazer algo juntos

Matriz de utilidade

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

(6)

Batalha dos Sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

I conjunto de jogadores: {R,G}

I conjuntos de estratégias SR =SG ={Cinema,Pedalar}

I S =SR×SG

I funções utilidades uR euG dadas pela matriz acima

(7)

Notação e conceitos básicos

Considere um jogoJ dado por

I um conjunto N= [n]de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi.

Notação:

Para um vetors = (s1, . . . ,sn)em S, e um jogadori, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S. Vetor de estratégias obtido des trocando-sesi porr.

(8)

Notação e conceitos básicos

Considere um jogoJ dado por

I um conjunto N= [n]de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi. Notação:

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S. Vetor de estratégias obtido des trocando-sesi porr.

(9)

Notação e conceitos básicos

Considere um jogoJ dado por

I um conjunto N= [n]de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi. Notação:

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Vetor de estratégias obtido des trocando-sesi porr.

(10)

Notação e conceitos básicos

Considere um jogoJ dado por

I um conjunto N= [n]de jogadores;

I para cada jogador i emN,

um conjuntoSi das estratégias do jogadori;

uma função utilidadeui deS emR, onde S =×i∈NSi. Notação:

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Vetor de estratégias obtido des trocando-sesi porr.

(11)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Não há estratégias dominantes neste jogo.

(12)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Dilema dos prisioneiros

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

Confessaé estratégia dominante para os dois prisioneiros.

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Não há estratégias dominantes neste jogo.

(13)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Batalha dos sexos

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Não há estratégias dominantes neste jogo.

(14)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes. É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(15)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes. É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(16)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes.

É interessante projetar jogos com estratégias dominantes. Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(17)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes.

É interessante projetar jogos com estratégias dominantes.

Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(18)

Estratégias dominantes

Estratégiar emSi édominante para o jogadori

seui(s)≤ui(r,s−i) para todo vetor de estratégiass em S.

Um jogo em que todos os jogadores têm uma estratégia dominante é umjogo com estratégias dominantes.

Exemplo: Dilema dos Prisioneiros.

Na maioria dos jogos, não há estratégias dominantes.

É interessante projetar jogos com estratégias dominantes.

Outro exemplo: Leilões do segundo preço.

Estratégia dominante: valor do item para o jogador.

(19)

Noção de equilíbrio

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Jogadori está satisfeitocom s emS

seui(s)≥ui(r,s−i) para toda estratégia r em Si.

(Diz-se quei não tem incentivo para mudar de estratégia.) Um vetors em S é umequilíbrio de Nash

se todo jogador está satisfeito coms.

Um jogo pode ter mais do que um equilíbrio de Nash, ou pode não ter nenhum equilíbrio de Nash.

(20)

Noção de equilíbrio

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Jogadori está satisfeitocom s emS

seui(s)≥ui(r,s−i) para toda estratégia r em Si.

(Diz-se quei não tem incentivo para mudar de estratégia.)

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

Um jogo pode ter mais do que um equilíbrio de Nash, ou pode não ter nenhum equilíbrio de Nash.

(21)

Noção de equilíbrio

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Jogadori está satisfeitocom s emS

seui(s)≥ui(r,s−i) para toda estratégia r em Si.

(Diz-se quei não tem incentivo para mudar de estratégia.) Um vetors em S é umequilíbrio de Nash

se todo jogador está satisfeito coms.

Um jogo pode ter mais do que um equilíbrio de Nash, ou pode não ter nenhum equilíbrio de Nash.

(22)

Noção de equilíbrio

Para um vetors = (s1, . . . ,sn)em S, e um jogador i, s−i é o vetor(s1, . . . ,si−1,si+1, . . . ,sn).

Parar∈Si,(r,s−i) é o vetor(s1, . . . ,si−1,r,si+1, . . . ,sn)∈S.

Jogadori está satisfeitocom s emS

seui(s)≥ui(r,s−i) para toda estratégia r em Si.

(Diz-se quei não tem incentivo para mudar de estratégia.) Um vetors em S é umequilíbrio de Nash

se todo jogador está satisfeito coms.

Um jogo pode ter mais do que um equilíbrio de Nash, ou pode não ter nenhum equilíbrio de Nash.

(23)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,sn) se ui(s)≥ui(r,s−i), para toda estratégiar emSi.

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Equilíbrios de Nash: (Cinema,Cinema) e (Pedalar,Pedalar)

(24)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,sn) se ui(s)≥ui(r,s−i), para toda estratégiar emSi.

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

Dilema dos prisioneiros:

B

A Confessa Silencia

Confessa 4 5

4 1

Silencia 1 2

5 2

Único equilíbrio de Nash: (Confessa,Confessa)

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Equilíbrios de Nash: (Cinema,Cinema) e (Pedalar,Pedalar)

(25)

Equilíbrio de Nash

Jogadori está satisfeitocom s = (s1, . . . ,sn) se ui(s)≥ui(r,s−i), para toda estratégiar emSi.

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

Batalha dos sexos:

G

R Cinema Pedalar

Cinema 4 2

5 2

Pedalar 1 5

1 4

Equilíbrios de Nash: (Cinema,Cinema) e (Pedalar,Pedalar)

(26)

Equilíbrio de Nash

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

B

A pedra papel tesoura

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

Não há equilíbrio de Nash!

(27)

Equilíbrio de Nash

Um vetors em S é umequilíbrio de Nash se todo jogador está satisfeito coms.

B

A pedra papel tesoura

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

Não há equilíbrio de Nash!

(28)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição: adversário tira proveito de estratégias determinísticas. Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário Ao detectar sua estratégia, adversário passa a vencer.

(29)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi.

Particularmente interessante emjogos com repetição: adversário tira proveito de estratégias determinísticas. Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário Ao detectar sua estratégia, adversário passa a vencer.

(30)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição:

adversário tira proveito de estratégias determinísticas.

Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário Ao detectar sua estratégia, adversário passa a vencer.

(31)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição:

adversário tira proveito de estratégias determinísticas.

Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário

Ao detectar sua estratégia, adversário passa a vencer.

(32)

Estratégias puras versus mistas

Até agora, jogador escolhe estratégiadeterministicamente.

Mas o jogador pode adotar estratégiaaleatorizada!

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Particularmente interessante emjogos com repetição:

adversário tira proveito de estratégias determinísticas.

Exemplo: Repetição do jogo Pedra-Papel-Tesoura:

I jogar sempre pedra

I jogar circularmente pedra, papel e tesoura

I jogar sempre a jogada anterior do adversário Ao detectar sua estratégia, adversário passa a vencer.

(33)

Estratégias puras versus mistas

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Estratégias emSi são então chamadas depuras.

Discutimosequilíbrio de Nash com estratégias puras.

Para definição mais ampla, precisamos de mais notação.

(34)

Estratégias puras versus mistas

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Estratégias emSi são então chamadas depuras.

Discutimosequilíbrio de Nash com estratégias puras.

Para definição mais ampla, precisamos de mais notação.

(35)

Estratégias puras versus mistas

Uma estratégiamistapara o jogadori

é uma distribuição de probabilidades no conjuntoSi. Estratégias emSi são então chamadas depuras.

Discutimosequilíbrio de Nash com estratégias puras.

Para definição mais ampla, precisamos de mais notação.

(36)

Estratégias puras versus mistas

Umaestratégia mistapara o jogadori

é umadistribuição de probabilidades no conjuntoSi. Sejaσ um vetor de estratégias mistas.

Ou seja, para cada jogadori,

σi é uma distribuição de probabilidades em Si.

Qual é autilidade esperadado jogadori para σ? E[ui(σ)] = X

s∈S

ui(s)Prσ[s], onde Prσ[s] =Q

jσj(sj).

(Considera-se que os jogadores são independentes.)

(37)

Estratégias puras versus mistas

Umaestratégia mistapara o jogadori

é umadistribuição de probabilidades no conjuntoSi. Sejaσ um vetor de estratégias mistas.

Ou seja, para cada jogadori,

σi é uma distribuição de probabilidades em Si. Qual é autilidade esperadado jogadori para σ?

E[ui(σ)] = X

s∈S

ui(s)Prσ[s], onde Prσ[s] =Q

jσj(sj).

(Considera-se que os jogadores são independentes.)

(38)

Estratégias puras versus mistas

Umaestratégia mistapara o jogadori

é umadistribuição de probabilidades no conjuntoSi. Sejaσ um vetor de estratégias mistas.

Ou seja, para cada jogadori,

σi é uma distribuição de probabilidades em Si. Qual é autilidade esperadado jogadori para σ?

E[ui(σ)] = X

s∈S

ui(s)Prσ[s],

onde Prσ[s] =Q

jσj(sj).

(Considera-se que os jogadores são independentes.)

(39)

Estratégias puras versus mistas

Umaestratégia mistapara o jogadori

é umadistribuição de probabilidades no conjuntoSi. Sejaσ um vetor de estratégias mistas.

Ou seja, para cada jogadori,

σi é uma distribuição de probabilidades em Si. Qual é autilidade esperadado jogadori para σ?

E[ui(σ)] = X

s∈S

ui(s)Prσ[s], onde Prσ[s] =Q

jσj(sj).

(Considera-se que os jogadores são independentes.)

(40)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si.

σ é um equilíbrio de Nash (de estratégias mistas) se todo jogador está satisfeito comσ.

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(41)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si. σ é um equilíbrio de Nash (de estratégias mistas) se

todo jogador está satisfeito comσ.

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(42)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si. σ é um equilíbrio de Nash (de estratégias mistas) se

todo jogador está satisfeito comσ.

Ou seja, emσ, nenhum jogador tem incentivo para mudar de estratégia (mista).

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(43)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si. σ é um equilíbrio de Nash (de estratégias mistas) se

todo jogador está satisfeito comσ.

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(44)

Equilíbrio de Nash

Jogadori está satisfeitocom σ se

E[ui(σ)]≥E[ui(ρ, σ−i)] para toda estratégia mistaρ sobre Si. σ é um equilíbrio de Nash (de estratégias mistas) se

todo jogador está satisfeito comσ.

Exemplo:

ρ= (1/3,1/3,1/3) é uma estratégia mista para os jogadores de Pedra-Papel-Tesoura, e(ρ, ρ) é um equilíbrio de Nash.

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

(45)

Teorema de Nash

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

As hipóteses são necessárias:

existem jogos com númeroinfinitode jogadores e jogos com conjuntos de estratégiasinfinitos sem equilíbrio de Nash.

(46)

Teorema de Nash

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um equilíbrio de Nash de estratégias mistas.

As hipóteses são necessárias:

existem jogos com númeroinfinitode jogadores e jogos com conjuntos de estratégiasinfinitos sem equilíbrio de Nash.

(47)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias (soma dos custos ou utilidades dos jogadores)

Jogo de congestionamento B

A P Q

P 2 5

2 7

Q 6 1

4 1

Valores sociais 4,12, 10 e 2.

I Valor social ótimo

(soma máxima das utilidades dos jogadores)

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S)

(48)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias (soma dos custos ou utilidades dos jogadores)

I Valor social ótimo

(soma máxima das utilidades dos jogadores)

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S)

(49)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias (soma dos custos ou utilidades dos jogadores)

I Valor social ótimo

(soma máxima das utilidades dos jogadores)

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S)

(50)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias

I Valor social ótimo

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S)

Pedra-papel-tesoura

B

A pedra papel tesoura

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

(51)

Mais alguns conceitos básicos

I Custo ou valor social de um vetor de estratégias

I Valor social ótimo

I Jogos de soma zero

(soma dos custos/utilidades zero p/ todo s em S) Pedra-papel-tesoura

B

A pedra papel tesoura

pedra 0 1 −1

0 −1 1

papel −1 0 1

1 0 −1

tesoura 1 −1 0

−1 1 0

(52)

Complexidade computacional

Jogos de soma zero com dois jogadores Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

m: número de estratégias do jogador 1 n: número de estratégias do jogador 2

Basta dar uma matriz, pois o jogo é de soma zero. O custo do jogador 1 é o ganho do jogador 2 e vice-versa. Pelo Teorema de Nash, sempre existe um equilíbrio. Como podemos resolver esse problema?

(53)

Complexidade computacional

Jogos de soma zero com dois jogadores Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

m: número de estratégias do jogador 1 n: número de estratégias do jogador 2

Basta dar uma matriz, pois o jogo é de soma zero.

O custo do jogador 1 é o ganho do jogador 2 e vice-versa.

Pelo Teorema de Nash, sempre existe um equilíbrio. Como podemos resolver esse problema?

(54)

Complexidade computacional

Jogos de soma zero com dois jogadores Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

m: número de estratégias do jogador 1 n: número de estratégias do jogador 2

Basta dar uma matriz, pois o jogo é de soma zero.

O custo do jogador 1 é o ganho do jogador 2 e vice-versa.

Pelo Teorema de Nash, sempre existe um equilíbrio.

Como podemos resolver esse problema?

(55)

Complexidade computacional

Jogos de soma zero com dois jogadores Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

m: número de estratégias do jogador 1 n: número de estratégias do jogador 2

Basta dar uma matriz, pois o jogo é de soma zero.

O custo do jogador 1 é o ganho do jogador 2 e vice-versa.

Pelo Teorema de Nash, sempre existe um equilíbrio.

Como podemos resolver esse problema?

(56)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

O que é um equilíbrio?

São duas distribuições de probabilidade, ou seja, vetoresp, com m entradas, eq, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n tais que...

Antes de responder...

Se o jogador 1 usa a estratégia (mista)p e o 2 usa a q, qual é o valor esperado que o jogador 1 ganha?

(57)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

O que é um equilíbrio?

São duas distribuições de probabilidade, ou seja, vetoresp, com m entradas, eq, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n tais que...

Antes de responder...

Se o jogador 1 usa a estratégia (mista)p e o 2 usa a q, qual é o valor esperado que o jogador 1 ganha?

(58)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

O que é um equilíbrio?

São duas distribuições de probabilidade, ou seja, vetoresp, com m entradas, eq, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n tais que...

Antes de responder...

Se o jogador 1 usa a estratégia (mista)p e o 2 usa a q, qual é o valor esperado que o jogador 1 ganha?

(59)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

O que é um equilíbrio?

São duas distribuições de probabilidade, ou seja, vetoresp, com m entradas, eq, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n tais que...

Antes de responder...

Se o jogador 1 usa a estratégia (mista)p e o 2 usa aq, qual é o valor esperado que o jogador 1 ganha?

(60)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Considere queAé a matriz custo do jogador 1.

Se o jogador 1 usa a estratégia (mista)p e o 2 usa aq, qual é o valor esperado que o jogador 1 ganha?

X

ij

aijpiqj = X

i

piX

j

aijqj = pAq

(61)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Considere queAé a matriz custo do jogador 1.

Se o jogador 1 usa a estratégia (mista)p e o 2 usa aq, qual é o valor esperado que o jogador 1 ganha?

X

ij

aijpiqj = X

i

piX

j

aijqj = pAq

(62)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Valor esperado que o jogador 1 ganhaé pAq.

Uma vez que o jogador 1 escolhep,

o jogador 2 escolheq que minimiza a utilidade de 1. Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA. Assim jogador 1 escolhep quemaximize esse mínimo.

(63)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Valor esperado que o jogador 1 ganhaé pAq.

Uma vez que o jogador 1 escolhep,

o jogador 2 escolheq que minimiza a utilidade de 1.

Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA. Assim jogador 1 escolhep quemaximize esse mínimo.

(64)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Valor esperado que o jogador 1 ganhaé pAq.

Uma vez que o jogador 1 escolhep,

o jogador 2 escolheq que minimiza a utilidade de 1.

Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA.

Assim jogador 1 escolhep quemaximize esse mínimo.

(65)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Valor esperado que o jogador 1 ganhaé pAq.

Uma vez que o jogador 1 escolhep,

o jogador 2 escolheq que minimiza a utilidade de 1.

Ou seja, olhando o vetorpA, o jogador 2 gosta

das estratégias que correspondem a entradas mínimas depA.

Assim jogador 1 escolhep quemaximize esse mínimo.

(66)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Jogador 2 gosta de estratégias que correspondem

a entradas mínimas depA, assim 1 quer encontrarp que

maximizev sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

(67)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Vetoresp, com mentradas, e q, com n entradas,

I P

ipi =1 e pi ≥0 parai =1, . . . ,m,

I P

jqj =1 eqj ≥0 paraj =1, . . . ,n.

Jogador 2 gosta de estratégias que correspondem

a entradas mínimas depA, assim 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

(68)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Jogador 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

Jogador 2 quer encontrarq que minimizev

sujeito aP

iqi =1

sujeito a (Aq)i ≤v para i =1, . . . ,m sujeito a qj ≥0 paraj =1, . . . ,n.

(69)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

A: matriz utilidade do jogador 1

Jogador 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

Jogador 2 quer encontrarq que minimizev

sujeito aP

iqi =1

sujeito a (Aq)i ≤v parai =1, . . . ,m sujeito a qj ≥0 paraj =1, . . . ,n.

(70)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

Jogador 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

Jogador 2 quer encontrarq que minimizev

sujeito aP

iqi =1

sujeito a (Aq)i ≤v parai =1, . . . ,m sujeito a qj ≥0 paraj =1, . . . ,n.

Estes sãoprogramas lineares, e um é o dual do outro!

(71)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

Jogador 1 quer encontrarp que maximizev

sujeito aP

ipi =1

sujeito a (pA)j ≥v para j =1, . . . ,n sujeito a pi ≥0 parai =1, . . . ,m.

Jogador 2 quer encontrarq que minimizev

sujeito aP

iqi =1

sujeito a (Aq)i ≤v parai =1, . . . ,m sujeito a qj ≥0 paraj =1, . . . ,n.

Estes sãoprogramas lineares, e um é o dual do outro!

(72)

Jogos com dois jogadores

Problema: Dada uma matriz Am×n

(representando um jogo de dois jogadores de soma zero), encontrar um equilíbrio de Nash (de estratégias mistas).

Conclusão:

Este problema pode ser resolvido em tempo polinomial (usando programação linear).

E para jogos que não sejam de soma zero?

(73)

Jogos com dois jogadores

Problema: Dada uma matriz Am×n

(representando um jogo de dois jogadores de soma zero), encontrar um equilíbrio de Nash (de estratégias mistas).

Conclusão:

Este problema pode ser resolvido em tempo polinomial (usando programação linear).

E para jogos que não sejam de soma zero?

(74)

Jogos com dois jogadores

Problema: Dada uma matriz Am×n

(representando um jogo de dois jogadores de soma zero), encontrar um equilíbrio de Nash (de estratégias mistas).

Conclusão:

Este problema pode ser resolvido em tempo polinomial (usando programação linear).

E para jogos que não sejam de soma zero?

(75)

Complexidade computacional

Os seguintes problemas sãoNP-completos:

dado um jogo de duas pessoas na forma matricial, decidir se este jogo tem

I pelo menos dois equilíbrios de Nash;

I dadok, um equilíbrio de Nash em que o jogador 1 tem utilidade pelo menos k;

I dadok, um equilíbrio de Nash com valor social pelo menosk;

I dadok, um equilíbrio de Nash com pelo menosk estratégias no seu suporte;

I dados, um equilíbrio de Nash com s no suporte;

I dados, um equilíbrio de Nash sem s no suporte.

Referências

Documentos relacionados

Verificada a efetividade da proposta, a Comissão de Licitações declarou vencedor o licitante Francisco Souza Lima Helm, sendo o total do item 14 licitado o valor de

cada um deles se as estratégias individuais são melhores respostas para o outro. Computar a melhor resposta de cada jogador para cada estratégia do outro jogador, e

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Desta maneira, observando a figura 2A e 2C para os genótipos 6 e 8, nota-se que os valores de captura da energia luminosa (TRo/RC) são maiores que o de absorção (ABS/RC) e

A participação foi observada durante todas as fases do roadmap (Alinhamento, Prova de Conceito, Piloto e Expansão), promovendo a utilização do sistema implementado e a

A aplicação do presente Acordo Coletivo de Trabalho, em todos os seus termos, se restringe a UNIDADE DE PRESTAÇÃO DE SERVIÇOS DE CONCRETO COM DENOMINAÇÃO ENGEMIX do

elrow revela lineup para o Sambódromo Anhembi e anuncia edição no Green

Os autores relatam a primeira ocorrência de Lymnaea columella (Say, 1817) no Estado de Goiás, ressaltando a importância da espécie como hospedeiro intermediário de vários parasitos