Jogos Gráficos
Renzo Gonzalo Gómez Diaz
Instituto de Matemática e Estatística Universidade de São Paulo
Junho 2013
Introdução
- Para representar um jogo em forma normal, precisa-se uma quantidade exponencial de números que depende do número de jogadores e de estratégias.
- Jogos gráficos são uma representação que aproveita situações onde a utilidade de um jogador está determinada pelas ações de um
subconjunto de jogadores.
Introdução
Alguns exemplos:
- Balanceamento de carga numa rede de computadores.
- Intercâmbio comercial entre regiões (ou países).
Jogos Gráficos
Definição
Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesMi, que descreve a utilidade do jogadori.
- Denotamos porSi o conjunto de estratégias do jogadori. Si ={0,1} para todoi=1,2, . . . ,n.
- Neste caso, um perfil de estratégias mistas é dado por um vetor
~
p∈[0,1]n, tal que pi é a probabilidade do jogadori escolher a estratégia 0.
Jogos Gráficos
Definição
Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesMi, que descreve a utilidade do jogadori.
- Denotamos porSi o conjunto de estratégias do jogadori. Si ={0,1}
para todoi=1,2, . . . ,n.
- Neste caso, um perfil de estratégias mistas é dado por um vetor
~
p∈[0,1]n, tal que pi é a probabilidade do jogadori escolher a estratégia 0.
Algoritmo TreeNash
- Precisa que o grafo definido pelo jogo seja uma árvore.
- Está composto de duas fases:
1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.
2 Fase ascendente: Devolve um equilíbrio de Nash.
Estrutura de dados
- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).
- Cada entradaT(w,v)tem uma lista de testemunhas (witness).
Algoritmo TreeNash
- Precisa que o grafo definido pelo jogo seja uma árvore.
- Está composto de duas fases:
1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.
2 Fase ascendente: Devolve um equilíbrio de Nash.
Estrutura de dados
- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).
- Cada entradaT(w,v)tem uma lista de testemunhas (witness).
Algoritmo TreeNash - Início
1 Escolher um vértice Z arbitrariamente como raiz.
2 Encontrar a ordem dos vértices de G segundo uma busca em profundidade a partir deZ.
3 Para cada vérticeV ∈V(G), fazemosT(w,v) =0,∀v,w ∈[0,1].
Algoritmo TreeNash - Fase descendente
1 para todo V ∈V(G)na ordem dada pela DFS faça
2 SejaW o pai doV (ou NIL seV é a raiz).
3 seV é folhaentão
4 para todow,v∈[0,1], tal queV=vé melhor resposta paraW =wfaça
5 T(w,v)←1
6 senão
7 SejamU~= (U1, . . . ,Uk)os filhos deV; sejaT(v,ui)a tabela passada porUi
paraV.
8 para todow,v∈[0,1]faça
9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça
10 sev =V é melhor resposta paraW =w, ~U=~ueT(v,ui) =1 parai=1, . . . ,k então
11 T(w,v)←1
12 Adicione~uà lista de testemunhas deT(w,v)
13 Passar tabelaT(w,v)deV paraW
Algoritmo TreeNash - Fase descendente
V1
V2
V4
T(v2,v4)
T(v1,v2) V3
V5
T(v3,v5) V6
T(v3,v6)
T(v1,v3)
Algoritmo TreeNash - Fase ascendente
1 para todoV ∈V(G)desde a raiz (em ordem reverso ao dado pela DFS)faça
2 SejaU~= (U1, . . . ,Uk)os filhos deV (ou vazio seV for uma folha)
3 seV é raizentão
4 Escolha arbitrariamentev∈[0,1], tal queT(v) =1.
5 senão
6 SejaW o pai deV e(w,v)os valores passados porW aV.
7 EtiqueteV com o valorv
8 Escolha qualquer testemunhau~tal queT(w,v) =1 (ouT(v) =1)
9 Parai=1, . . . ,kpasse(v,ui)deV paraUi
Algoritmo TreeNash - Fase ascendente
p∗1
p∗2 p∗4
p4∗
p2∗ p3∗
p5∗ p∗5 p6∗
p6∗
p∗3
TreeNash
Notação:
- GV : Subárvore deG com raiz emV.
- MVW=w : Subconjunto de matrizes deM, dos vértices emGV, tal que a matrizMV tem fixado a estratégia do seu paiW =w.
Proposição
SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(GV,MVW=w)tal queV =v.
TreeNash
Notação:
- GV : Subárvore deG com raiz emV.
- MVW=w : Subconjunto de matrizes deM, dos vértices emGV, tal que a matrizMV tem fixado a estratégia do seu paiW =w.
Proposição
SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(GV,MVW=w)tal queV =v.
Prova:Por indução na altura deGV.
SeV é folha deG, então comoT(w,v) =1, pela condição da linha 4 da fase descendente, tem-se queV =v é melhor resposta paraW =w. Logo,GV está em equilíbrio seV =v eW =w.
SeGV tem altura maior do que 1. Sejam{U1,U2, . . . ,Uk}os filhos de V emG e~u= (u1, . . . ,uk)um testemunha deT(w,v) =1. Então, T(v,ui) =1 parai=1, . . . ,k, logo pela hipótese de indução, seV joga a estratégia mistav, existe um equilíbrio de Nash em(GUi,MUVi=v)tal queUi=ui parai=1, . . . ,k.
Alem disso,V =v é melhor resposta paraW =w eUi =ui, logo (GV,MVW=w)tem um equilíbrio tal queV =v.
TreeNash
Corolário
Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).
Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.
TreeNash
Corolário
Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).
Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.
ApproximateTreeNash
-Equilíbrio de Nash
Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todopi0∈[0,1]tem-se que
Mi(~p) + ≥ Mi(p0i, ~p−i).
1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.
2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(τ12)entradas.
ApproximateTreeNash
-Equilíbrio de Nash
Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todopi0∈[0,1]tem-se que
Mi(~p) + ≥ Mi(p0i, ~p−i).
1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.
2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(τ12)entradas.
ApproximateTreeNash
Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.
8 para todow,v∈[0,1]faça
9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça
10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,ui) = 1 parai = 1, . . . ,k então
11 T(w,v)←1
12 Adicione~uà lista de testemunhas deT(w,v)
Logo, aquele laço consome tempoO((1τ)2k).
Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.
ApproximateTreeNash
Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.
8 para todow,v∈[0,1]faça
9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça
10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,ui) = 1 parai = 1, . . . ,k então
11 T(w,v)←1
12 Adicione~uà lista de testemunhas deT(w,v)
Logo, aquele laço consome tempoO((1τ)2k).
Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.
ApproximateTreeNash
Teorema [1]
Para todo >0, sejaτ ≤min(/2k+2(klg(k)),2/klg2(k/2)). Então o algoritmo ApproximateTreeNash calcula um-equilíbrio de Nash para o jogo(G,M).
Lema 1[1]
Seja~p,~q∈[0,1]k tal que|pi−qi| ≤τ parai=1,2, . . . ,k.
Seτ ≤2/(k2log(k/2)),
|Qk
i=1pi−Qk
i=1qi| ≤ (2klg(k))τ.
Lema 2 [1]
Seja~p,~qestratégias mistas, tal que|pi−qi| ≤τ parai=1,2, . . . ,k.
Seτ ≤2/(k2log(k/2)),
|Mi(~p)−Mi(~q)| ≤ 2k+1(klg(k))τ.
Lema 3 [1]
Seja~pum equilíbrio de Nash para(G,M), e seja~qo perfil mais próximo
2
ExactTreeNash
No caso em queG é uma árvore pode-se mostrar o seguinte lema,
Lema 4 [1]
SejamJ um jogo de k+2 jogadores(V,W,U1, . . . ,Uk). Seja MV(v, ~u,w)a utilidade esperada deV no perfil(v, ~u,w)e defina
∆(~u,w) =MV(0, ~u,w)−MV(1, ~u,w).
SejamI1, . . . ,Ik ⊆[0,1] e
W = {w ∈ [0,1] :∃~u∈I1×. . .×Ik,∆(~u,w) =0}.
Então,W ou é vazio ou um intervalo em[0,1] ou a união de dois intervalos disjuntos em[0,1].
ExactTreeNash
- Pelo Lema 4, fixado um intervalo para cadaUi, ondeT(v,ui) =1, isto gera no máximo 2 interválos ondeT(w,v) =1.
- Logo, na fase descendente o número de regiões cresce de forma exponencial em cada nível.
- Pode-se mostrar que uma folhaV tem no máximo 3 intervalos onde T(w,v) =1. Portanto, o número de regiões éO(3n).
- Neste caso, o algoritmo é exponencial emne não no grau máximo do grafo.
Referencias
Michael Kearns, Michael Littman, and Satinder Singh.
Graphical models for game theory.
InProceedings of the Seventeenth Conference Annual Conference on Uncertainty in Artificial Intelligence (UAI-01), pages 253–260, San Francisco, CA, 2001. Morgan Kaufmann.
Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay V. Vazirani.
Algorithmic Game Theory.
Cambridge University Press, New York, NY, USA, 2007.