• Nenhum resultado encontrado

SMA-14 - Teoria dos Jogos 1

N/A
N/A
Protected

Academic year: 2021

Share "SMA-14 - Teoria dos Jogos 1"

Copied!
35
0
0

Texto

(1)

TEORIA DOS

JOGOS – PARTE 1

Prof. Pablo A. Sampaio

(2)

REVISÃO

Vimos arquiteturas de agentes

 Para construir agentes para qualquer problema

Quanto aos problemas, focamos mais em agentes

cooperativos

 Satisfação de restrição distribuída

 Otimização distribuída  Várias técnicas

(3)

A PARTIR DESTA AULA

Self-interested agents

Vou traduzir como agentes egoístas

 Quer dizer que cada um tem suas próprias preferências/objetivos

 Eles podem até cooperar, se houver uma coincidência eventual de interesses

Aplicações: agentes que fazem comércio, preparam viagens,

etc.

Vamos ver um modelo matemático para representar

adequadamente este tipo de agente

(4)

1. INTRODUÇÃO À

TEORIA DOS JOGOS

(5)

JOGO

Parte da ideia de agentes baseados em utilidade

 Função de utilidade avalia cada estado

Quando dois ou mais agentes agem com funções de

utilidade diferentes, e as ações de um afetam o outro,

chamamos esta situação de um jogo

Uma maneira simples de representar é como uma tabela

 Linhas: ações do agente 1

 Coluna: ações do agente 2

 Célula: par dos valores de utilidade

(6)

EXEMPLO DE JOGO

Dilema do Prisioneiro: dois cúmplices presos são

interrogados separadamente

 É preciso que ambos colaborem para comprovar totalmente o crime

 O que é mais racional fazer?

(https://en.wikipedia.org/wiki/Prisoner %27s_dilema)

(7)

SOBRE O JOGO ANTERIOR

Qual ação escolher...

 Se você tiver uma ideia do que o seu colega vai fazer?

 Se você puder se comunicar com ele antes?

Qual o comportamento esperado (do ponto de vista dos

interrogadores)?

 E se esse cenário for repetido múltiplas vezes? (E infinitas?)

A Teoria dos Jogos tenta responder a essas e outras questões

Dependendo, a ação esperada pode ser Cooperate ou Defect

(8)

JOGOS E AGENTES

Entenda um jogo (da Teoria dos Jogos) como um modelo

matemático útil para modelar agentes egoístas

 Um modelo é uma simplificação do mundo real (mas que preserva algumas características), criado para estudar algo algum fenômeno

Na verdade, a Teoria dos Jogos têm vários modelos de jogos

A forma de tabela, do exemplo, é um desses...

(9)

FORMA NORMAL

É o modelo de representação de jogos mais usado e que

serve de referência para outros

 Muitas das outras formas de representar podem ser convertidas para esta

Para 2 jogadores, é uma representação na forma de tabela

(como o exemplo dado)

(10)

FORMA NORMAL

(11)

CASOS ESPECIAIS DA

FORMA NORMAL

Dependendo dos valores das utilidades, os jogos podem ter

características especiais, criando tipos de jogos

Veremos dois tipos especiais a seguir:

1. Dilema do Prisioneiro

2. Common-payoff game

(12)

1. DILEMA DO PRISIONEIRO

GENERALIZADO

 O exemplo clássico deste tipo de jogo é o primeiro exemplo que demos  O exemplo dá nome à essa classe

É qualquer jogo com a forma abaixo, onde T > R > P > S :

(https://en.wikipedia.org/wiki/Prisoner %27s_dilema)

(13)

OUTRO EXEMPLO

Problema do TCP: é melhor uma implementação

correta (C) ou defectiva (D) do TCP?

 A correta tem que reduzir a velocidade em caso de conflito

 A defectiva nunca reduz

 Porém, se todos implementarem defectivamente, todos ficam com dificuldades de enviar pacotes

(14)

2. COMMON-PAYOFF GAME

 Agentes podem fazer as mesmas ações e recebem a utilidade igual, para cada saída do jogo

 Não há conflito de interesses: basta escolher a ação que é maximamente benéfica para todos

(15)

EXEMPLO

Em um lugar sem leis de trânsito, dois carros dirigem em

uma mesma via

(16)

3. ZERO-SUM GAME

Também chamado “Constant-sum game”

Em todas as situações, a soma dá uma constante

 É comum estudar o caso

Especialmente relevante no caso de 2 agentes

(17)

EXEMPLO: MATCHING

PENNIES

Cada pessoa mostra uma moeda virada

 Se estiverem viradas do mesmo lado, o jogador 1 ganha

(18)
(19)

1. Como como (1 agente) joga?

2. Como todos vocês jogam?

(Qual a representação matemática destas coisas?)

PERGUNTAS

(20)

2. ESTRATÉGIAS E

PERFIS

(21)

Chamamos de estratégia à forma como 1 agente define

suas ações

Estratégia pura – é uma única ação

Exemplos:

 (a esposa sempre escolhe assistir LW)

 

(22)

Estratégia mista – é uma função que mapeia ação em

probabilidade

 Agente escolhe ação aleatoriamente, segundo tais probabilidades

Exemplo:

Esposa tem 70% de chance de escolher LW Notação:

E tem 30% de chance de escolher WL Notação:

 

(23)

Existe alguma discussão acadêmica sobre o que significa, na

prática, uma estratégia mista

Vamos pensar em termos de um jogo que pode vir a se repetir,

mas não de forma imediata

 Ex.: disputa de pênaltis

 Aleatorizar evita que o adversário se aproveite de você

Ou de múltiplas ações em paralelo

(de um mesmo agente)

 Ex.: fabricar peças

(sportv.globo.com )

(24)

EXEMPLO

Voltando ao Problema do TCP

Pensar em fabricantes que implementam o TCP em placas físicas (irreal?)

(25)

ALEATORIZAÇÃO NO JOGO

TCP

Exemplo de estratégia pura (1 jogador)

= jogar C

Fabricante i faz todas as suas placas com implementações corretas

Exemplo de estratégia mista (1 jogador)

= jogar C com 30% de chance / jogar D com 70% de chance

Fabricante i faz 30% de suas placas corretas e 70% com defeito

(26)

COMO TODOS VOCÊS

JOGAM?

Um pressuposto comum em jogos da Forma Normal é que

 Os agentes decidem a ação em paralelo

 Sem conhecimento das decisões um do outro

Assim, o “jogo de todos” é uma mera “coleção” das

estratégias independentes dos agentes...

(27)

Perfil de estratégias: é uma tupla com as estratégias de

todos os n agentes

 Notação:

É o perfil (e não a estratégia) que define a recompensa /

utilidade de cada agente

 

COMO TODOS VOCÊS

JOGAM?

(28)

Quanto todos os agentes têm estratégias puras (i.e., onde

cada agente faz 1 ação)

Recompensa: consultar diretamente na tabela!

PERFIL DE ESTRATÉGIAS

PURAS

(29)

EXEMPLO

Perfil de estratégias

pura :

 Recompensas / utilidades:

E para este outro perfil?

 

Guerra do Casal: que

filme assistir?

LW – Lethal Weapon

(30)

Quando todos os agentes adotam estratégias mistas (ações

com probabilidades)

Recompensa: calcular a recompensa/utilidade esperada

 Média das recompensas (para todas as combinações de ações) ponderada pela probabilidade de ocorrer cada combinação de ações

 

é o conjunto de todas as tuplas de

ações possíveis.

 

A função dá a probabilidade da

tupla acontecer, dado o perfil de estratégias .

 

PERFIL DE ESTRATÉGIAS

MISTAS

(31)

PERFIL DE ESTRATÉGIAS

MISTAS

Todos os agentes adotam estratégias mistas (ações com

probabilidades)

Recompensa: calcular a recompensa/utilidade esperada

 Média das recompensas (das possíveis combinações de ações) ponderada pela probabilidade de ocorrer cada combinação de ações

 

Onde:

é a ação do agente j (na tupla )

é a prob. do agente j executar

(32)

EXEMPLO

Perfil de estratégias mistas para a Guerra do Casal:

= (�

����

,�

����

)

onde:

 ����� = {�� : 20% ; �� :80%}  ����� = {�� :100%; �� : 0%}

Recompensas esperadas:

 uwife()= 1.(20% . 100%) + 0.(80%.100%) + 0.(0%)+ 2.(0%) = 0,2  uhusb()= 2.(20% . 100%) + 0.(80%.100%) + 0.(0%)+ 1.(0%) = 0,4

 

(33)

PRÓXIMA AULA

Como os agentes deveriam jogar? Qual opção é mais

racional?

(34)

REFERÊNCIAS

Material e figuras obtidos das referências abaixo:

1.

Livro do Shoham, cap. 3

2.

“Agentes baseados em utilidade” (slides de aula),

prof. Ricardo Prudêncio (CIn/UFPE)

(35)

"Porque o que sucede aos filhos dos homens, isso

mesmo também sucede aos animais, e lhes sucede

a mesma coisa; como morre um, assim morre o

outro; e todos têm o mesmo fôlego, e a vantagem

dos homens sobre os animais não é nenhuma,

porque todos são vaidade."

Referências

Documentos relacionados

BISAVÔ: HOLLYLANE RENAISSENCE (I.A.) 3° MÃE: ECRL “ANI” CASCALHO BRIAR MASTER... DEBORA ZABELINA ULISSES

Pode dizer-se que não só institui uma teoria para o proletariado, que lhe explica a sua situação histórica e lhe dá as armas de que ele necessita para a transformar, como

O estudo da lógica da trisseção do cubo e o exercício de implementação desta lógica por meio de técnicas de desenho paramétrico resultaram na estruturação de um

Segundo Boziki; Silva; Printes (2011), a utilização de agrotóxicos, além de causar impactos ao meio ambiente, vem acometendo a saúde humana através da

 Ao clicar no botão Congurar Apresentação de Slides , uma caixa de diálogo será aberta (gura 59), para que congurações sejam estabelecidas, tais como tipo

A idéia foi que Goiânia se tornasse a referência de progresso para o estado de Goiás e fizesse parte da história do Brasil com a imagem de uma cidade moderna.. Com base no

- Se tiver quaisquer efeitos indesejáveis, incluindo possíveis efeitos indesejáveis não indicados neste folheto, fale com o seu médico, farmacêutico ou enfermeiro4. O que precisa

O atendimento que ocorria na unidade era de acordo com a necessidade das usuárias, as quais eram orientadas a realizar atividades físicas, ações que dessem prazer a elas,