• Nenhum resultado encontrado

Jogos Gráficos

N/A
N/A
Protected

Academic year: 2022

Share "Jogos Gráficos"

Copied!
26
0
0

Texto

(1)

Jogos Gráficos

Renzo Gonzalo Gómez Diaz

Instituto de Matemática e Estatística Universidade de São Paulo

Junho 2013

(2)

Introdução

- Para representar um jogo em forma normal, precisa-se uma quantidade exponencial de números que depende do número de jogadores e de estratégias.

- Jogos gráficos são uma representação que aproveita situações onde a utilidade de um jogador está determinada pelas ações de um

subconjunto de jogadores.

(3)

Introdução

Alguns exemplos:

- Balanceamento de carga numa rede de computadores.

- Intercâmbio comercial entre regiões (ou países).

(4)

Jogos Gráficos

Definição

Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesMi, que descreve a utilidade do jogadori.

- Denotamos porSi o conjunto de estratégias do jogadori. Si ={0,1} para todoi=1,2, . . . ,n.

- Neste caso, um perfil de estratégias mistas é dado por um vetor

~

p∈[0,1]n, tal que pi é a probabilidade do jogadori escolher a estratégia 0.

(5)

Jogos Gráficos

Definição

Um jogo gráfico é um par(G,M), ondeG é um grafo não-dirigido, com conjunto de vértices{1, . . . ,n}, eMé o conjunto denmatrizesMi, que descreve a utilidade do jogadori.

- Denotamos porSi o conjunto de estratégias do jogadori. Si ={0,1}

para todoi=1,2, . . . ,n.

- Neste caso, um perfil de estratégias mistas é dado por um vetor

~

p∈[0,1]n, tal que pi é a probabilidade do jogadori escolher a estratégia 0.

(6)

Algoritmo TreeNash

- Precisa que o grafo definido pelo jogo seja uma árvore.

- Está composto de duas fases:

1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.

2 Fase ascendente: Devolve um equilíbrio de Nash.

Estrutura de dados

- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).

- Cada entradaT(w,v)tem uma lista de testemunhas (witness).

(7)

Algoritmo TreeNash

- Precisa que o grafo definido pelo jogo seja uma árvore.

- Está composto de duas fases:

1 Fase descendente: Calcula as melhores respostas de um vértice considerando as estratégias mistas da sua vizinhança.

2 Fase ascendente: Devolve um equilíbrio de Nash.

Estrutura de dados

- Cada vérticeV tem associado uma tabela bináriaT(w,v)ondew é a estratégia mista do pai deV ev é a estratégia mista de V, no caso da raíz éT(v).

- Cada entradaT(w,v)tem uma lista de testemunhas (witness).

(8)

Algoritmo TreeNash - Início

1 Escolher um vértice Z arbitrariamente como raiz.

2 Encontrar a ordem dos vértices de G segundo uma busca em profundidade a partir deZ.

3 Para cada vérticeV ∈V(G), fazemosT(w,v) =0,∀v,w ∈[0,1].

(9)

Algoritmo TreeNash - Fase descendente

1 para todo V V(G)na ordem dada pela DFS faça

2 SejaW o pai doV (ou NIL seV é a raiz).

3 seV é folhaentão

4 para todow,v[0,1], tal queV=vé melhor resposta paraW =wfaça

5 T(w,v)1

6 senão

7 SejamU~= (U1, . . . ,Uk)os filhos deV; sejaT(v,ui)a tabela passada porUi

paraV.

8 para todow,v[0,1]faça

9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça

10 sev =V é melhor resposta paraW =w, ~U=~ueT(v,ui) =1 parai=1, . . . ,k então

11 T(w,v)1

12 Adicione~uà lista de testemunhas deT(w,v)

13 Passar tabelaT(w,v)deV paraW

(10)

Algoritmo TreeNash - Fase descendente

V1

V2

V4

T(v2,v4)

T(v1,v2) V3

V5

T(v3,v5) V6

T(v3,v6)

T(v1,v3)

(11)

Algoritmo TreeNash - Fase ascendente

1 para todoV V(G)desde a raiz (em ordem reverso ao dado pela DFS)faça

2 SejaU~= (U1, . . . ,Uk)os filhos deV (ou vazio seV for uma folha)

3 seV é raizentão

4 Escolha arbitrariamentev[0,1], tal queT(v) =1.

5 senão

6 SejaW o pai deV e(w,v)os valores passados porW aV.

7 EtiqueteV com o valorv

8 Escolha qualquer testemunhau~tal queT(w,v) =1 (ouT(v) =1)

9 Parai=1, . . . ,kpasse(v,ui)deV paraUi

(12)

Algoritmo TreeNash - Fase ascendente

p1

p2 p4

p4

p2 p3

p5 p5 p6

p6

p3

(13)

TreeNash

Notação:

- GV : Subárvore deG com raiz emV.

- MVW=w : Subconjunto de matrizes deM, dos vértices emGV, tal que a matrizMV tem fixado a estratégia do seu paiW =w.

Proposição

SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(GV,MVW=w)tal queV =v.

(14)

TreeNash

Notação:

- GV : Subárvore deG com raiz emV.

- MVW=w : Subconjunto de matrizes deM, dos vértices emGV, tal que a matrizMV tem fixado a estratégia do seu paiW =w.

Proposição

SejaV ∈V(G)eW o pai deV. T(w,v) =1 se existe um equilíbrio de Nash para(GV,MVW=w)tal queV =v.

(15)

Prova:Por indução na altura deGV.

SeV é folha deG, então comoT(w,v) =1, pela condição da linha 4 da fase descendente, tem-se queV =v é melhor resposta paraW =w. Logo,GV está em equilíbrio seV =v eW =w.

SeGV tem altura maior do que 1. Sejam{U1,U2, . . . ,Uk}os filhos de V emG e~u= (u1, . . . ,uk)um testemunha deT(w,v) =1. Então, T(v,ui) =1 parai=1, . . . ,k, logo pela hipótese de indução, seV joga a estratégia mistav, existe um equilíbrio de Nash em(GUi,MUVi=v)tal queUi=ui parai=1, . . . ,k.

Alem disso,V =v é melhor resposta paraW =w eUi =ui, logo (GV,MVW=w)tem um equilíbrio tal queV =v.

(16)

TreeNash

Corolário

Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).

Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.

(17)

TreeNash

Corolário

Seja(G,M)qualquer jogo gráfico tal queG é uma árvore. Então, o algoritmo TreeNash encontra um equilíbrio de Nash de(G,M).

Problema: Precisa-se uma representação compacta para as tabelas T(w,v)no algoritmo TreeNash.

(18)

ApproximateTreeNash

-Equilíbrio de Nash

Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todopi0∈[0,1]tem-se que

Mi(~p) + ≥ Mi(p0i, ~p−i).

1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.

2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(τ12)entradas.

(19)

ApproximateTreeNash

-Equilíbrio de Nash

Um perfil de estratégias mistas~pé um-equilíbrio de Nash se para todo jogadori e para todopi0∈[0,1]tem-se que

Mi(~p) + ≥ Mi(p0i, ~p−i).

1 Dado um valorτ∈(0,1], cada jogadori pode escolher como estratégia mistapi ∈ {0, τ,2τ, . . . ,1}.

2 Logo, no algoritmo TreeNash, cada vérticeV passa uma tabela T(w,v)com(τ12)entradas.

(20)

ApproximateTreeNash

Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.

8 para todow,v[0,1]faça

9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça

10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,ui) = 1 parai = 1, . . . ,k então

11 T(w,v)1

12 Adicione~uà lista de testemunhas deT(w,v)

Logo, aquele laço consome tempoO((1τ)2k).

Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.

(21)

ApproximateTreeNash

Notamos que dadoτ >0, o consumo de tempo do algoritmo está dominado pelas linhas 8-12 da fase descendente do TreeNash.

8 para todow,v[0,1]faça

9 para todoestratégia mista~u= (u1, . . . ,uk)deU~faça

10 sev =V é melhor resposta paraW =w, ~U =~ue T(v,ui) = 1 parai = 1, . . . ,k então

11 T(w,v)1

12 Adicione~uà lista de testemunhas deT(w,v)

Logo, aquele laço consome tempoO((1τ)2k).

Agora, vamos ver como a escolha deτ afeta a qualidade dos equilíbrios encontrados pelo algoritmo ApproximateTreeNash.

(22)

ApproximateTreeNash

Teorema [1]

Para todo >0, sejaτ ≤min(/2k+2(klg(k)),2/klg2(k/2)). Então o algoritmo ApproximateTreeNash calcula um-equilíbrio de Nash para o jogo(G,M).

(23)

Lema 1[1]

Seja~p,~q∈[0,1]k tal que|pi−qi| ≤τ parai=1,2, . . . ,k.

Seτ ≤2/(k2log(k/2)),

|Qk

i=1pi−Qk

i=1qi| ≤ (2klg(k))τ.

Lema 2 [1]

Seja~p,~qestratégias mistas, tal que|pi−qi| ≤τ parai=1,2, . . . ,k.

Seτ ≤2/(k2log(k/2)),

|Mi(~p)−Mi(~q)| ≤ 2k+1(klg(k))τ.

Lema 3 [1]

Seja~pum equilíbrio de Nash para(G,M), e seja~qo perfil mais próximo

2

(24)

ExactTreeNash

No caso em queG é uma árvore pode-se mostrar o seguinte lema,

Lema 4 [1]

SejamJ um jogo de k+2 jogadores(V,W,U1, . . . ,Uk). Seja MV(v, ~u,w)a utilidade esperada deV no perfil(v, ~u,w)e defina

∆(~u,w) =MV(0, ~u,w)−MV(1, ~u,w).

SejamI1, . . . ,Ik ⊆[0,1] e

W = {w ∈ [0,1] :∃~u∈I1×. . .×Ik,∆(~u,w) =0}.

Então,W ou é vazio ou um intervalo em[0,1] ou a união de dois intervalos disjuntos em[0,1].

(25)

ExactTreeNash

- Pelo Lema 4, fixado um intervalo para cadaUi, ondeT(v,ui) =1, isto gera no máximo 2 interválos ondeT(w,v) =1.

- Logo, na fase descendente o número de regiões cresce de forma exponencial em cada nível.

- Pode-se mostrar que uma folhaV tem no máximo 3 intervalos onde T(w,v) =1. Portanto, o número de regiões éO(3n).

- Neste caso, o algoritmo é exponencial emne não no grau máximo do grafo.

(26)

Referencias

Michael Kearns, Michael Littman, and Satinder Singh.

Graphical models for game theory.

InProceedings of the Seventeenth Conference Annual Conference on Uncertainty in Artificial Intelligence (UAI-01), pages 253–260, San Francisco, CA, 2001. Morgan Kaufmann.

Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay V. Vazirani.

Algorithmic Game Theory.

Cambridge University Press, New York, NY, USA, 2007.

Referências

Documentos relacionados

Ainda segundo Gil (2002), como a revisão bibliográfica esclarece os pressupostos teóricos que dão fundamentação à pesquisa e às contribuições oferecidas por

Com base nos resultados da pesquisa referente à questão sobre a internacionalização de processos de negócios habilitados pela TI com o apoio do BPM para a geração de ganhos para

Observamos que existem lacunas no conhecimento sobre como sintetizar resultados de estudos que utilizaram métodos qualitativos, assim como já acontece com estudos da

Estudos da neurociência sustentam que a música e a linguagem são duas formas de comunicação humana que estão próximas em se tratando de processamento mental e

Se no cadastro da administradora, foi selecionado na aba Configurações Comissões, para que as comissões fossem geradas no momento da venda do contrato, já é

- Remover as pastilhas usadas e retornar todo o parafuso de regulagem em seguida montar uma pastilha nova do lado da roda, empurrando com a mão a pinça no sentido do cilindro de

Os autores relatam a primeira ocorrência de Lymnaea columella (Say, 1817) no Estado de Goiás, ressaltando a importância da espécie como hospedeiro intermediário de vários parasitos

‣ Provides a comprehensive, industry agreed definition for information that flows through the enterprise and between service providers and their business partners. Supported by