Forma padrão dos LPs

(1)

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz A_m×n,

encontrar um equilíbrio de Nash (de estratégias mistas).

Jogador 1 quer encontrar p que maximize v

sujeito a ^P_i p_i = 1

sujeito a (pA)_j ≥ v para j = 1, . . . , n sujeito a p_i ≥ 0 para i = 1, . . . , m.

(2)

Jogos de soma zero com dois jogadores

sujeito a (pA)_j ≥ v para j = 1, . . . , n sujeito a p_i ≥ 0 para i = 1, . . . , m. Jogador 2 quer encontrar q que

minimize w

sujeito a ^P_i q_i = 1

sujeito a (Aq)_i ≤ w para i = 1, . . . , m sujeito a q_j ≥ 0 para j = 1, . . . , n.

(3)

Jogos de soma zero com dois jogadores

sujeito a (pA)_j ≥ v para j = 1, . . . , n sujeito a p_i ≥ 0 para i = 1, . . . , m. Jogador 2 quer encontrar q que

minimize w

sujeito a (Aq)_i ≤ w para i = 1, . . . , m

(4)

Forma padrão dos LPs

Programa primal:

minimize cx

sujeito a Ax ≥ b x ≥ 0

(5)

Forma padrão dos LPs

Programa primal:

minimize cx

sujeito a Ax ≥ b x ≥ 0

Programa dual:

maximize by

sujeito a A^T y ≤ c

(6)

Primeiro LP em forma padrão

sujeito a (pA)_j ≥ v para j = 1, . . . , n sujeito a p_i ≥ 0 para i = 1, . . . , m. Forma padrão:

minimize −v⁺ + v⁻ sujeito a − P

i p_i ≥ −1 P

i p_i ≥ 1

−v⁺ + v⁻ + P

i a_ijp_i ≥ 0 para j = 1, . . . , n v⁺, v⁻, p_i ≥ 0 para i = 1, . . . , m

(7)

Segundo LP em forma padrão

Jogador 2 quer encontrar q que minimize w

sujeito a (Aq)_i ≤ w para i = 1, . . . , m sujeito a q_j ≥ 0 para j = 1, . . . , n.

Forma padrão:

maximize −w⁺ + w⁻ sujeito a − P

i q_i ≤ −1 P

i q_i ≤ 1

(8)

LPs em forma padrão

i p_i ≥ −1 P

i p_i ≥ 1

−v⁺ + v⁻ + P

i a_ijp_i ≥ 0 para j = 1, . . . , n v⁺, v⁻, p_i ≥ 0 para i = 1, . . . , m maximize −w⁺ + w⁻

sujeito a − P

i q_i ≤ −1 P

i q_i ≤ 1

−w⁺ + w⁻ + P

j a_ijq_j ≤ 0 para i = 1, . . . , m w⁺, w⁻, q_j ≥ 0 para j = 1, . . . , n

(9)

Programa primal

i p_i ≥ −1 P

i p_i ≥ 1

−v⁺ + v⁻ + P

i a_ijp_i ≥ 0 para j = 1, . . . , n v⁺, v⁻, p_i ≥ 0 para i = 1, . . . , m c = (−1, 1, 0, . . . , 0) e b = (−1, 1, 0, . . . , 0)





0 0 −1 · · · −1 0 0 1 · · · 1





(10)

Relação entre os valores dos LPs

v = X

j

q_j

v = X

j

(vq_j)

≤ X

j

X

i

a_ijp_i

q_j = X

i

X

j

a_ijq_j p_i

≤ X

i

wp_i = X

i

p_i

w = w

(11)

Relação entre os valores dos LPs

v = X

j

q_j

v = X

j

(vq_j)

≤ X

j

X

i

a_ijp_i

q_j = X

i

X

j

a_ijq_j p_i

≤ X

i

wp_i = X

i

p_i

w = w

Para soluções ótimas, os valores v^∗ e w^∗ são iguais e se q_j^∗ > 0 então ^P_i a_ijp^∗_i = v^∗

∗ ∗ ∗

(12)

Relação entre os valores dos LPs

v = X

j

q_j

v = X

j

(vq_j)

≤ X

j

X

i

a_ijp_i

q_j = X

i

X

j

a_ijq_j p_i

≤ X

i

wp_i = X

i

p_i

w = w

Para soluções ótimas, os valores v^∗ e w^∗ são iguais e se q_j^∗ > 0 então ^P_i a_ijp^∗_i = v^∗

se p^∗_i > 0 então ^P_j a_ijq_j^∗ = w^∗

Toda estratégia no suporte de uma estrategia mista ótima tem o mesmo valor esperado (o valor ótimo).

(13)

Jogos com dois jogadores

Problema: Dada uma matriz A_m×n

representando um jogo de dois jogadores de soma zero, encontrar um equilíbrio de Nash (de estratégias mistas).

(14)

Jogos com dois jogadores

Conclusão:

Este problema pode ser resolvido em tempo polinomial (usando programação linear).

(15)

Jogos com dois jogadores

Conclusão:

E para jogos que não sejam de soma zero?

(16)

Jogos com dois jogadores

Conclusão:

E para jogos que não sejam de soma zero?

Veremos mais adiante.

(17)

Estratégias mistas

Uma estratégia mista para o jogador i

é uma distribuição de probabilidades no conjunto S_i. Seja σ um vetor de estratégias mistas.

Ou seja, para cada jogador i,

σ_i é uma distribuição de probabilidades em S_i.

(18)

Estratégias mistas

σ_i é uma distribuição de probabilidades em S_i. Qual é a utilidade esperada do jogador i para σ?

(19)

Estratégias mistas

σ_i é uma distribuição de probabilidades em S_i. Qual é a utilidade esperada do jogador i para σ?

U_i(σ) = E[u_i(σ)] = X

s∈S

u_i(s)Pr_σ[s],

(20)

Equilíbrio de Nash

Jogador i está satisfeito com σ se

E[u_i(σ)] ≥ E[u_i(ρ, σ_−i)] para toda estratégia mista ρ sobre S_i.

(21)

Equilíbrio de Nash

U_i(σ) ≥ U_i(ρ, σ_−i) para toda estratégia mista ρ sobre S_i.

(22)

Equilíbrio de Nash

U_i(σ) ≥ U_i(ρ, σ_−i) para toda estratégia mista ρ sobre S_i. σ é um equilíbrio de Nash (de estratégias mistas)

se todo jogador está satisfeito com σ.

Ou seja, em σ, nenhum jogador tem incentivo para mudar de estratégia (mista).

(23)

Equilíbrio de Nash

U_i(σ) ≥ U_i(ρ, σ_−i) para toda estratégia mista ρ sobre S_i. σ é um equilíbrio de Nash (de estratégias mistas)

se todo jogador está satisfeito com σ.

Ou seja, em σ, nenhum jogador tem incentivo para mudar de estratégia (mista).

Teorema (Nash, 1951): Todo jogo com um número finito de jogadores e conjuntos finitos de estratégias tem um

(24)

Teorema de Ponto Fixo de Brouwer

Teorema de Ponto Fixo de Brouwer (1909):

Toda função contínua f : D → D, onde D é um subconjunto compacto e convexo do IR^m, tem um ponto fixo.

(25)

Teorema de Ponto Fixo de Brouwer

Ponto fixo: x em D tal que f(x) = x.

(26)

Teorema de Ponto Fixo de Brouwer

Conjunto compacto: fechado e limitado.

(27)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D.

(28)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D. Comentários na aula:

Teorema do Ponto Fixo de Brouwer para m = 1 e m = 2.

(29)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D. Comentários na aula:

(30)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D.

(31)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D. Seja m_i = |S_i| e m = P

i m_i.

Σ_i: conjunto das estratégias mistas para i

(32)

Teorema de Ponto Fixo de Brouwer

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D. Seja m_i = |S_i| e m = P

i m_i.

Σ_i: conjunto das estratégias mistas para i

(Σ_i = {p ∈ IR^mⁱ : p(s) ≥ 0 ∀s ∈ S_i e ^P_s∈S_i p(s) = 1} ⊆ IR^mⁱ) O conjunto Σ = Σ1 × · · · × Σ_n ⊆ IR^m é compacto e convexo.

(33)

Prova do Teorema de Nash

equilíbrio de Nash de estratégias mistas.

(34)

Prova do Teorema de Nash

Prova: Considere a função f : Σ → Σ definida por f(σ) = ρ, onde ρ_i = arg max_ρ^′_i_∈Σi{U_i(ρ^′_i, σ_−i) − ||ρ^′_i − σ_i||²}.

(35)

Prova do Teorema de Nash

A função g_i(ρ^′_i) = U_i(ρ^′_i, σ_−i) − ||ρ^′_i − σ_i||² é côncava, logo tem um único máximo, e assim f está bem-definida.

(36)

Prova do Teorema de Nash

A função g_i(ρ^′_i) = U_i(ρ^′_i, σ_−i) − ||ρ^′_i − σ_i||² é côncava, logo tem um único máximo, e assim f está bem-definida.

De fato, g_i : Σ_i → IR é uma função quadrática e côncava:

g_i(ρ^′_i) = X

s∈S

u_i(s) Y

j6=i

σ_j(s_j) ρ^′_i(s_i) − X

s∈Sⁱ

(ρ^′_i(s) − σ_i(s))².

(37)

Prova do Teorema de Nash

(38)

Prova do Teorema de Nash

Note ainda que a função ρ_i é contínua em σ.

(39)

Prova do Teorema de Nash

Então, pelo Teorema de Brouwer, f tem um ponto fixo σˆ.

(40)

Prova do Teorema de Nash

Então, pelo Teorema de Brouwer, f tem um ponto fixo σˆ. Vamos mostrar que σˆ é um equilíbrio de Nash!

(41)

Prova do Teorema de Nash

Pelo Teorema de Brouwer, f tem um ponto fixo σˆ.

Suponha, por contradição, que σˆ não é equilíbrio de Nash.

(42)

Prova do Teorema de Nash

Existe i e ρ^′_i em Σ_i tq U_i(ρ^′_i, σˆ_−i) = U_i(σ) +ˆ δ, para δ > 0.

(43)

Prova do Teorema de Nash

Existe i e ρ^′_i em Σ_i tq U_i(ρ^′_i, σˆ_−i) = U_i(σ) +ˆ δ, para δ > 0.

(44)

Prova do Teorema de Nash

Existe i e ρ^′_i em Σ_i tq U_i(ρ^′_i, σˆ_−i) = U_i(σ) +ˆ δ, para δ > 0. Vamos escolher α ∈ (0, 1] tq ρˆ_i = σˆ_i + α(ρ^′_i − σˆ_i)

contraria o fato de f(σ) =ˆ σˆ.

Note que tal ρˆ_i ∈ Σ_i pois é combinação convexa de σˆ_i e ρ^′_i.

(45)

Prova do Teorema de Nash

Considere f : Σ → Σ definida por f(σ) = ρ,

onde ρ_i = arg max_ρ^′_i_∈Σi{U_i(ρ^′_i, σ_−i) − ||ρ^′_i − σ_i||²}. Pelo Teorema de Brouwer, f tem um ponto fixo σˆ.

Existe i e ρ^′_i em Σ_i tq U_i(ρ^′_i, σˆ_−i) = U_i(σ) +ˆ δ, para δ > 0. Vamos escolher α tal que ρˆ_i = σˆ_i + α(ρ^′_i − σˆ_i)

(46)

Prova do Teorema de Nash

Para σ fixo, U_i(ρ_i, σ_−i) é linear em ρ_i, logo U_i(ρ_i − σˆ_i, σˆ_−i) = U_i(ρ_i, σˆ_−i) − U_i(σ) =ˆ δ e

(47)

Prova do Teorema de Nash

Para σ fixo, U_i(ρ_i, σ_−i) é linear em ρ_i, logo U (ρ − σˆ , σˆ ) = U (ρ , σˆ ) − U (σ) =ˆ δ e

(48)

Prova do Teorema de Nash

Considere a função f : Σ → Σ definida por f(σ) = ρ, onde ρ_i = arg max_ρ^′_i_∈Σi{U_i(ρ^′_i, σ_−i) − ||ρ^′_i − σ_i||²}.

Se o ponto fixo σˆ de f não é equilíbrio de Nash, então existe i e ρ^′_i em Σ_i tq U_i(ρ^′_i, σˆ_−i) = U_i(σ) +ˆ δ, para δ > 0. Seja ρˆ_i = σˆ_i + α(ρ^′_i − σˆ_i) para algum α > 0.

(49)

Prova do Teorema de Nash

Conforme calculamos, U_i(ρˆ_i, σˆ_−i) = U_i(σ) +ˆ α δ.

(50)

Prova do Teorema de Nash

Conforme calculamos, U_i(ρˆ_i, σˆ_−i) = U_i(σ) +ˆ α δ. Se α < δ/||ρ^′_i − σˆ_i||², então

U_i(ρˆ_i, σˆ_−i) − ||ρˆ_i − σˆ_i||² = U_i(σ) +ˆ α δ − ||ρˆ_i − σˆ_i||²

= U_i(σ) +ˆ α δ − α²||ρ^′_i − σˆ_i||²

> U_i(σ),ˆ

(51)

Prova do Teorema de Nash

Conforme calculamos, U_i(ρˆ_i, σˆ_−i) = U_i(σ) +ˆ α δ. Se α < δ/||ρ^′_i − σˆ_i||², então

U_i(ρˆ_i, σˆ_−i) − ||ρˆ_i − σˆ_i||² = U_i(σ) +ˆ α δ − ||ρˆ_i − σˆ_i||²

= U (σ) +ˆ α δ − α²||ρ^′ − σˆ ||²