• Nenhum resultado encontrado

Mecanismos Online

N/A
N/A
Protected

Academic year: 2022

Share "Mecanismos Online"

Copied!
39
0
0

Texto

(1)

Visão Geral Definições Resultados

Mecanismos Online

Fabio Alexandre Campos Tisovec

Instituto de Matemática e Estatística - Universidade de São Paulo

June 17, 2013

Fabio Alexandre Campos Tisovec Mecanismos Online

(2)

Visão Geral Definições Resultados

Conteúdo

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(3)

Visão Geral Definições Resultados

Conteúdo

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(4)

Visão Geral Definições Resultados

Conteúdo

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(5)

Visão Geral Definições Resultados

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(6)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(7)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(8)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(9)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(10)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(11)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(12)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(13)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(14)

Visão Geral Definições Resultados

Caracterização do Problema

Problemas considerados:

Conjunto de jogadores varia ao longo do tempo.

Conjunto de possíveis decisões futuras não é conhecido a priori.

Exemplos:

Venda de passagens aéreas onde compradores surgem ao longo do tempo.

Alocação de recursos computacionais a processos que surgem ao longo do tempo.

Leilão de espaço de anúncios em portais de busca.

Alocação de tarefas dentre um grupo de trabalho cujos integrantes mudam ao longo do tempo.

Venda de produtos cuja volatilidade é maior do que a duração do leilão.

Fabio Alexandre Campos Tisovec Mecanismos Online

(15)

Visão Geral Definições Resultados

Abordagem Utilizada

O foco do estudo é no mecanismo e suas propriedades, não em como cada jogador chega em sua estratégia.

Em geral, o problema é modelado como uma forma de leilão.

Inicialmente inclui várias suposições e posteriormente mostra maneiras de relaxar algumas destas.

Fabio Alexandre Campos Tisovec Mecanismos Online

(16)

Visão Geral Definições Resultados

Abordagem Utilizada

O foco do estudo é no mecanismo e suas propriedades, não em como cada jogador chega em sua estratégia.

Em geral, o problema é modelado como uma forma de leilão.

Inicialmente inclui várias suposições e posteriormente mostra maneiras de relaxar algumas destas.

Fabio Alexandre Campos Tisovec Mecanismos Online

(17)

Visão Geral Definições Resultados

Abordagem Utilizada

O foco do estudo é no mecanismo e suas propriedades, não em como cada jogador chega em sua estratégia.

Em geral, o problema é modelado como uma forma de leilão.

Inicialmente inclui várias suposições e posteriormente mostra maneiras de relaxar algumas destas.

Fabio Alexandre Campos Tisovec Mecanismos Online

(18)

Visão Geral Definições Resultados

Abordagem Utilizada

O foco do estudo é no mecanismo e suas propriedades, não em como cada jogador chega em sua estratégia.

Em geral, o problema é modelado como uma forma de leilão.

Inicialmente inclui várias suposições e posteriormente mostra maneiras de relaxar algumas destas.

Fabio Alexandre Campos Tisovec Mecanismos Online

(19)

Visão Geral Definições Resultados

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(20)

Visão Geral Definições Resultados

Mecanismo

Dados instantes discretos de tempoT ={1,2, . . .}, um mecanismo faz uma sequencia de decisõesk = (k1,k2, . . .), ondekt representa a decisão tomada no instantet.

T pode ser ilimitado ou não.

Fabio Alexandre Campos Tisovec Mecanismos Online

(21)

Visão Geral Definições Resultados

Caracterização dos Jogadores

Mecanismo trata os jogadores subdividindo-os em tipos.

Para cada jogadori, sejaθi = (ai,di,wi)∈Θseu tipo, onde:

Θé o conjunto de todos os possíveis tipos de jogadores.

ai representa o momento de chegada do jogadori no jogo.

di representa o momento de saída do jogadorido jogo.

wi representa a valoração do jogadori, e é invariante a todos os eventos que ocorrem fora do intervalo[ai,di].

θi define uma função de valoraçãovi = (θi,k[ai,t])∈R, t∈[ai,di].

Fabio Alexandre Campos Tisovec Mecanismos Online

(22)

Visão Geral Definições Resultados

Mecanismo Online com Revelação Direta

Sejaω∈Ωo conjunto de eventos estocásticos que ocorrem no ambiente e que não estão sub o controle nem do mecanismo, nem dos jogadores. Sejaωt as

informações conhecidas no momentotde tais eventos, ωt ∈Ωtt∈Tt = Ω.

Sejaθt o conjunto dos jogadores que fazem seu lance no instantet.

Sejaht = (θ1, . . . , θt1, . . . , ωt;k1, . . . ,kt−1)∈Ht o estado do mecanismo no instantet, onde Ht é o conjunto de todos os possíveis estados no instantet.

SejaK(ht)o conjunto de todas as decisões possíveis no instantet e sejaI(ht)o conjunto de todos os jogadores ativos no instantet.

Fabio Alexandre Campos Tisovec Mecanismos Online

(23)

Visão Geral Definições Resultados

Mecanismo Online com Revelação Direta

Um Mecanismo Online com Revelação DiretaM = (π,x) restringe cada jogador a fazer um único lance informando seu tipo e define uma política de decisãoπ={πt},t ∈T e uma política de pagamentox ={xt},t ∈T, onde a decisão

πt(ht)∈K(ht)é tomada com base no estadoht e o pagamento xit(ht)∈Ré coletado de cada agentei ∈I(ht).

Fabio Alexandre Campos Tisovec Mecanismos Online

(24)

Visão Geral Definições Resultados

Lances com Falsidade Limitada

SejaC(θi)⊆Θo conjunto de possíveis lances do jogador i, cujo tipo real éθi.

Um modelo que satisfazlances falsos sem chegadas prematurasimplica que para um jogador

i,C(θi) ={θˆi = (ˆai,dˆi,wˆi) :ai ≤ˆai ≤dˆi,wˆi ∈W}.

Um modelo que satisfazlances falsos sem saídas atrasadasimplica que para um jogador

i,C(θi) ={θˆi = (ˆai,dˆi,wˆi) : ˆai ≤dˆi ≤di,wˆi ∈W}.

Um modelo que satisfaz ambas as restrições é ditocom restrições razoaveis de falsidade nos lances.

Fabio Alexandre Campos Tisovec Mecanismos Online

(25)

Visão Geral Definições Resultados

Mecanismo Online à Prova de Estratégia (Induz à Verdade)

Sejaθ−i = (θ1, . . . , θi−1, θi+1, . . .).

Sejapi(θ, ω) = Σt∈Txit.

Um mecanismo online é à prova de estratégia dado lances com falsidade limitada se:

vii, π(θi, θ−i0 , ω))−pii, θ−i0 , ω)≥ vii, π(ˆθi, θ−i0 , ω))−pi(ˆθi, θ−i0 , ω),

∀θˆi ∈C(θi),∀θi,∀θ0−i ∈C(θ−i),∀θ−i,∀ω ∈Ω.

Fabio Alexandre Campos Tisovec Mecanismos Online

(26)

Visão Geral Definições Resultados

Domínios Online de um Único Valor

SejaLi ={li1,li2, . . .}um conjunto composto por conjuntos de items que o jogadoritem interesse.

Em um domínio online de um único valor, cada jogadori é definido porθi = (ai,di,(ri,Li)),ri ∈R, ondeθi define a função de valoraçãovii,k) =

ri,∃j∈N,t∈[ai,di]|lij⊆kit 0,cc

Fabio Alexandre Campos Tisovec Mecanismos Online

(27)

Visão Geral Definições Resultados

Valor Crítico

SejaDi(π(θi, θ−i, ω))∈ {0,1}tal que vale 1 se a políticaπtoma alguma decisão interessante para o jogadori, ou zero caso contrário.

O valor crítico para o jogadori, dadoθi = (ai,di,(ri,Li)), uma políticaπem um domínio de valor único eθ−i eωfixos, é definido como:

v(ac

i,di,Li)−i, ω) =n

minri0|Di(π((ai,di,(ri0,Li)),θ−i,ω))=1

∞,cc

Fabio Alexandre Campos Tisovec Mecanismos Online

(28)

Visão Geral Definições Resultados

Monotonicidade

Uma políticaπé monotônica se

((Di(π((ai,di,(ri,Li)), θ−i, ω)) =1)∧(ri >v(ac

i,di,Li)−i, ω))) =⇒ (Di(π((ai,di,(ri0,Li)), θ−i, ω)) =1),∀ri0 >ri,∀θ−i,∀ω∈Ω.

Fabio Alexandre Campos Tisovec Mecanismos Online

(29)

Visão Geral Definições Resultados

1 Visão Geral

2 Definições

3 Resultados

Fabio Alexandre Campos Tisovec Mecanismos Online

(30)

Visão Geral Definições Resultados

Lema 1

Lema 1.

Dada uma política monotônica, o valor crítico do jogador i independe do valor ri e aumenta monotonicamente em

intervalos sucessivamente mais apertados de chegada e saída.

Demonstração.

Fixeθ−i, ω ∈Ω. Assuma por contradição quea0i ≥ai,di0 ≤di, porémri0<ri, onderi0 =v(ac0

i,di0,Li)−i, ω)eri =v(ac

i,di,Li)−i, ω).

Nestas condiçõesDi(π((ai,di,(ri,Li)), θ−i, ω)) =0, mas Di(π((a0i,di0,(ri,Li)), θ−i, ω)) =1, contradizendo a monotonicidade.

Fabio Alexandre Campos Tisovec Mecanismos Online

(31)

Visão Geral Definições Resultados

Lema 1

Lema 1.

Dada uma política monotônica, o valor crítico do jogador i independe do valor ri e aumenta monotonicamente em

intervalos sucessivamente mais apertados de chegada e saída.

Demonstração.

Fixeθ−i, ω ∈Ω. Assuma por contradição quea0i ≥ai,di0 ≤di, porémri0<ri, onderi0 =v(ac0

i,di0,Li)−i, ω)eri =v(ac

i,di,Li)−i, ω).

Nestas condiçõesDi(π((ai,di,(ri,Li)), θ−i, ω)) =0, mas Di(π((a0i,di0,(ri,Li)), θ−i, ω)) =1, contradizendo a monotonicidade.

Fabio Alexandre Campos Tisovec Mecanismos Online

(32)

Visão Geral Definições Resultados

Teorema 1

Teorema 1.

É possível implementar uma política monotônica que induz à verdade em um domínio de valor único em conjuntos de interesse conhecidos e com restrições razoaveis de falsidade nos lances.

Demonstração.

Defina a política de pagamento onde xit(ht) =

vc

ai,diˆ,Li)θ−i,ω),se(Di(π(ˆθi,θˆ−i,ω))=1)∧(t=ˆdi) 0,cc

Fixeθi, θ−i, ω∈Ωe assuma que o jogadori fala a verdade em seu lance.

Fabio Alexandre Campos Tisovec Mecanismos Online

(33)

Visão Geral Definições Resultados

Teorema 1

Teorema 1.

É possível implementar uma política monotônica que induz à verdade em um domínio de valor único em conjuntos de interesse conhecidos e com restrições razoaveis de falsidade nos lances.

Demonstração.

Defina a política de pagamento onde xit(ht) =

vc

ai,diˆ,Li)θ−i,ω),se(Di(π(ˆθi,θˆ−i,ω))=1)∧(t=ˆdi) 0,cc

Fixeθi, θ−i, ω∈Ωe assuma que o jogadori fala a verdade em seu lance.

Fabio Alexandre Campos Tisovec Mecanismos Online

(34)

Visão Geral Definições Resultados

Teorema 1

Demonstração - caso a).

Se a políticaπ não toma nenhuma decisão interessante para o jogadori, isto implica quev(ac

i,di,Li)−i, ω)>ri.

Neste caso, a única forma deste jogador passar a ser alocado (receber alguma decisão interessante) é trocar seu lance para algumθi0 = (ai,di,(ri0,Li)),ri0>ri, porém esta alteração implica que o jogadori terá utilidade negativa caso passe a ser alocado.

Fabio Alexandre Campos Tisovec Mecanismos Online

(35)

Visão Geral Definições Resultados

Teorema 1

Demonstração - caso b).

Se a políticaπ toma alguma decisão interessante para o jogadori, isto implica que sua utilidade é não-negativa, pois v(ac

i,di,Li)−i, ω)≤ri.

Além disso, pelo Lema 1 seu valor crítico e, por decorrência, sua utilidade independem de seu valorri, portanto não é possível ao jogadoriaumentar sua utilidade declarando algum θˆi 6=θi.

Fabio Alexandre Campos Tisovec Mecanismos Online

(36)

Visão Geral Definições Resultados

Resultados

Lema 2.

Em um domínio de valor único em conjuntos de interesse conhecidos, qualquer mecanismo online para agentes racionais necessariamente deve coletar pagamentos equivalentes aos valores críticos de cada jogador alocado.

teorema 2.

Em um domínio de valor único em conjuntos de interesse conhecidos e com restrições razoaveis de falsidade nos lances, qualquer políticaπ que induz à verdade e que não paga

jogadores não alocados precisa necessariamente ser monotônica.

Fabio Alexandre Campos Tisovec Mecanismos Online

(37)

Visão Geral Definições Resultados

Resultados

Lema 2.

Em um domínio de valor único em conjuntos de interesse conhecidos, qualquer mecanismo online para agentes racionais necessariamente deve coletar pagamentos equivalentes aos valores críticos de cada jogador alocado.

teorema 2.

Em um domínio de valor único em conjuntos de interesse conhecidos e com restrições razoaveis de falsidade nos lances, qualquer políticaπ que induz à verdade e que não paga

jogadores não alocados precisa necessariamente ser monotônica.

Fabio Alexandre Campos Tisovec Mecanismos Online

(38)

Visão Geral Definições Resultados

Algoritmo

Considere que a cada instante de tempo há exatamente um item à venda.

Seja um lance do jogadoridefinido porθˆi = (ˆai,dˆi,wˆi),wˆi ∈R, necessariamente feito no instantet = ˆai.

(i) A cada instante de tempo, aloque o item ao jogador não alocado com o maior lance, decidindo empates ao acaso.

(ii) Cada jogador paga seu valor crítico no momento de sua partida.

Fabio Alexandre Campos Tisovec Mecanismos Online

(39)

Visão Geral Definições Resultados

Referências

Algorithmic Game Theory, Noam Nisan, Tim Roughgarden, Eva Tardos, Vijay V Vazirani, Cambridge University Press.

Fabio Alexandre Campos Tisovec Mecanismos Online

Referências

Documentos relacionados

A partir da junção da proposta teórica de Frank Esser (ESSER apud ZIPSER, 2002) e Christiane Nord (1991), passamos, então, a considerar o texto jornalístico como

4.. Neste capítulo iremos analisar o modo como a política perspectiva o problema da protecção ambiental e como isso se reflecte na regulação

Na tentativa de reduzir este comprometimento, alguns artifícios são utilizados, como a adição de enzimas exógenas, probióticos, prebióticos, simbióticos e

Objetivando-se correlacionar a incapacidade e a escala qualitativa de dor do questionário Roland-Morris Brasil, e a escala qualitativa de dor e o constructo

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

Modeladora  –   Equipamento profissional para indústria alimentícia destinado à. modelar massas pela sua passagem entre