Jogos Gráﬁcos

(1)

Jogos Gráficos

Renzo Gonzalo Gómez Diaz

Instituto de Matemática e Estatística Universidade de São Paulo

Junho 2013

(2)

Introdução

- Para representar um jogo em forma normal, precisa-se uma quantidade exponencial de números que depende do número de jogadores e de estratégias.

- Jogos gráficos são uma representação que aproveita situações onde a utilidade de um jogador está determinada pelas ações de um

subconjunto de jogadores.

(3)

Introdução

Alguns exemplos:

- Balanceamento de carga numa rede de computadores.

- Intercâmbio comercial entre regiões (ou países).

(4)

Jogos Gráficos

Definição

Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesM_i, que descreve a utilidade do jogadori.

- Denotamos porS_i o conjunto de estratégias do jogadori. S_i ={0,1} para todoi=1,2, . . . ,n.

- Neste caso, um perfil de estratégias mistas é dado por um vetor

~

p∈[0,1]ⁿ, tal que pi é a probabilidade do jogadori escolher a estratégia 0.

(5)

Jogos Gráficos

Definição

Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesM_i, que descreve a utilidade do jogadori.

- Denotamos porS_i o conjunto de estratégias do jogadori. S_i ={0,1}

para todoi=1,2, . . . ,n.

- Neste caso, um perfil de estratégias mistas é dado por um vetor

~

p∈[0,1]ⁿ, tal que pi é a probabilidade do jogadori escolher a estratégia 0.

(6)

Algoritmo TreeNash

- Precisa que o grafo definido pelo jogo seja uma árvore.

- Está composto de duas fases:

1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.

2 Fase ascendente: Devolve um equilíbrio de Nash.

Estrutura de dados

- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).

- Cada entradaT(w,v)tem uma lista de testemunhas (witness).

(7)

Algoritmo TreeNash

- Precisa que o grafo definido pelo jogo seja uma árvore.

- Está composto de duas fases:

1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.

2 Fase ascendente: Devolve um equilíbrio de Nash.

Estrutura de dados

- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).

- Cada entradaT(w,v)tem uma lista de testemunhas (witness).

(8)

Algoritmo TreeNash - Início

1 Escolher um vértice Z arbitrariamente como raiz.

2 Encontrar a ordem dos vértices de G segundo uma busca em profundidade a partir deZ.

3 Para cada vérticeV ∈V(G), fazemosT(w,v) =0,∀v,w ∈[0,1].

(9)

Algoritmo TreeNash - Fase descendente

1 para todo V ∈V(G)na ordem dada pela DFS faça

2 SejaW o pai doV (ou NIL seV é a raiz).

3 seV é folhaentão

4 para todow,v∈[0,1], tal queV=vé melhor resposta paraW =wfaça

5 T(w,v)←1

6 senão

7 SejamU~= (U1, . . . ,Uk)os filhos deV; sejaT(v,ui)a tabela passada porUi

paraV.

8 para todow,v∈[0,1]faça

9 para todoestratégia mista~u= (u1, . . . ,u_k)deU~faça

10 sev =V é melhor resposta paraW =w, ~U=~ueT(v,u_i) =1 parai=1, . . . ,k então

11 T(w,v)←1

12 Adicione~uà lista de testemunhas deT(w,v)

13 Passar tabelaT(w,v)deV paraW

(10)

Algoritmo TreeNash - Fase descendente

V1

V2

V₄

T(v2,v4)

T(v1,v2) V3

V₅

T(v3,v5) V₆

T(v3,v6)

T(v1,v3)

(11)

Algoritmo TreeNash - Fase ascendente

1 para todoV ∈V(G)desde a raiz (em ordem reverso ao dado pela DFS)faça

2 SejaU~= (U₁, . . . ,U_k)os filhos deV (ou vazio seV for uma folha)

3 seV é raizentão

4 Escolha arbitrariamentev∈[0,1], tal queT(v) =1.

5 senão

6 SejaW o pai deV e(w,v)os valores passados porW aV.

7 EtiqueteV com o valorv

8 Escolha qualquer testemunhau~tal queT(w,v) =1 (ouT(v) =1)

9 Parai=1, . . . ,kpasse(v,ui)deV paraUi

(12)

Algoritmo TreeNash - Fase ascendente

p^∗₁

p^∗₂ p^∗₄

p₄^∗

p₂^∗ p₃^∗

p₅^∗ p^∗₅ p₆^∗

p₆^∗

p^∗₃

(13)

TreeNash

Notação:

- G^V : Subárvore deG com raiz emV.

- M^V_W_=w : Subconjunto de matrizes deM, dos vértices emG^V, tal que a matrizM_V tem fixado a estratégia do seu paiW =w.

Proposição

SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(G^V,M^V_W_=w)tal queV =v.

(14)

TreeNash

Notação:

- G^V : Subárvore deG com raiz emV.

- M^V_W_=w : Subconjunto de matrizes deM, dos vértices emG^V, tal que a matrizM_V tem fixado a estratégia do seu paiW =w.

Proposição

SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(G^V,M^V_W_=w)tal queV =v.

(15)

Prova:Por indução na altura deG^V.

SeV é folha deG, então comoT(w,v) =1, pela condição da linha 4 da fase descendente, tem-se queV =v é melhor resposta paraW =w. Logo,G^V está em equilíbrio seV =v eW =w.

SeG^V tem altura maior do que 1. Sejam{U1,U2, . . . ,Uk}os filhos de V emG e~u= (u1, . . . ,uk)um testemunha deT(w,v) =1. Então, T(v,u_i) =1 parai=1, . . . ,k, logo pela hipótese de indução, seV joga a estratégia mistav, existe um equilíbrio de Nash em(G^Uⁱ,M^U_Vⁱ_=v)tal queUi=ui parai=1, . . . ,k.

Alem disso,V =v é melhor resposta paraW =w eUi =ui, logo (G^V,M^V_W_=w)tem um equilíbrio tal queV =v.

(16)

TreeNash

Corolário

Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).

Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.

(17)

TreeNash

Corolário

Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).

Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.

(18)

ApproximateTreeNash

-Equilíbrio de Nash

Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todop_i⁰∈[0,1]tem-se que

Mi(~p) + ≥ Mi(p⁰_i, ~p_−i).

1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.

2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(_τ¹2)entradas.

(19)

ApproximateTreeNash

-Equilíbrio de Nash

Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todop_i⁰∈[0,1]tem-se que

Mi(~p) + ≥ Mi(p⁰_i, ~p_−i).

1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.

2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(_τ¹2)entradas.

(20)

ApproximateTreeNash

Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.

9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça

10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,u_i) = 1 parai = 1, . . . ,k então

11 T(w,v)←1

Logo, aquele laço consome tempoO((¹_τ)^2k).

Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.

(21)

ApproximateTreeNash

Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.

9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça

10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,u_i) = 1 parai = 1, . . . ,k então

11 T(w,v)←1

Logo, aquele laço consome tempoO((¹_τ)^2k).

Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.

(22)

ApproximateTreeNash

Teorema [1]

Para todo >0, sejaτ ≤min(/2^k+2(klg(k)),2/klg²(k/2)). Então o algoritmo ApproximateTreeNash calcula um-equilíbrio de Nash para o jogo(G,M).

(23)

Lema 1[1]

Seja~p,~q∈[0,1]^k tal que|pi−q_i| ≤τ parai=1,2, . . . ,k.

Seτ ≤2/(k²log(k/2)),

|Qk

i=1p_i−Qk

i=1q_i| ≤ (2klg(k))τ.

Lema 2 [1]

Seja~p,~qestratégias mistas, tal que|pi−qi| ≤τ parai=1,2, . . . ,k.

Seτ ≤2/(k²log(k/2)),

|Mi(~p)−M_i(~q)| ≤ 2^k+1(klg(k))τ.

Lema 3 [1]

Seja~pum equilíbrio de Nash para(G,M), e seja~qo perfil mais próximo

2

(24)

ExactTreeNash

No caso em queG é uma árvore pode-se mostrar o seguinte lema,

Lema 4 [1]

SejamJ um jogo de k+2 jogadores(V,W,U1, . . . ,Uk). Seja M_V(v, ~u,w)a utilidade esperada deV no perfil(v, ~u,w)e defina

∆(~u,w) =MV(0, ~u,w)−MV(1, ~u,w).

SejamI1, . . . ,Ik ⊆[0,1] e

W = {w ∈ [0,1] :∃~u∈I1×. . .×Ik,∆(~u,w) =0}.

Então,W ou é vazio ou um intervalo em[0,1] ou a união de dois intervalos disjuntos em[0,1].

(25)

ExactTreeNash

- Pelo Lema 4, fixado um intervalo para cadaUi, ondeT(v,ui) =1, isto gera no máximo 2 interválos ondeT(w,v) =1.

- Logo, na fase descendente o número de regiões cresce de forma exponencial em cada nível.

- Pode-se mostrar que uma folhaV tem no máximo 3 intervalos onde T(w,v) =1. Portanto, o número de regiões éO(3ⁿ).

- Neste caso, o algoritmo é exponencial emne não no grau máximo do grafo.

(26)

Referencias

Michael Kearns, Michael Littman, and Satinder Singh.

Graphical models for game theory.

InProceedings of the Seventeenth Conference Annual Conference on Uncertainty in Artificial Intelligence (UAI-01), pages 253–260, San Francisco, CA, 2001. Morgan Kaufmann.

Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay V. Vazirani.

Algorithmic Game Theory.

Cambridge University Press, New York, NY, USA, 2007.