Introdução a teoria dos jogos
Sabino da Silva Porto Junior
Fevereiro de 2008 1
James Waldegrave: primeiro a apresentar o conceito de solução de um jogo de estratégia mista em uma carta enviada em 1713 a Pierre Rémond de Montmort.
Cournot: Reserches sur les principes Mathematiques de la Theorie des Richesses.
Ernst Zermelo: Teorema sobre o jogo do Xadrez (1913), em cada etapa do jogo pelo menos um
Fevereiro de 2008 3
st e e o eo e a sob e o jogo do ad e ( 9 3), e cada e apa do jogo pe o e os u jogador possui uma estratégia que o levará a vitória ou ao empate. Primeiro a usar a semântica da otimalidade em jogos.
Emile Borel: jogos simétricos de soma zero com dois jogadores e com um número finito n de estratégias para cada jogador. Procurou a solução Minimax e provou em 1921 a existência de solução para n = 3 e em 1924 para n=5.
John Von Neumann: em 1928, usando topologia e cálculo funcional, mostrou a existência de solução em estratégias mistas para um jogo de soma zero com dois jogadores e um número arbitrário n de estratégias puras. Introuziu a forma extensa do jogo.
Definição
“A teoria dos jogos é uma teoriamatemática criada para se modelar matemática criada para se modelar fenômenos que podem ser
observados quando dois ou mais agentes de decisão interagem entre si.”
“teoria dos modelos matemáticos que estuda a escolha de decisoes otimas sob condicoes de conflito.”
Aplicações: eleições, balanços de poder, leiloes, economia, evolução
Jogo Estático ou Estratégico: jogadas simultâneas (ação igual a estratégia)
Regras 1. Jogadores 2. Estratégias
3. Ganhos para cada combinação de estratégias
Fevereiro de 2008 5
Albert W. Tucker (1950) Situação:
Dois ladrões, M e T, são
capturados e acusados de um mesmo crime.
Presos em selas separadas e sem poderem se comunicar entre si, o p
delegado de plantão faz a seguinte proposta: cada um pode escolher entre confessar e não confessar o crime....
Equilíbrio em Estratégias Dominantes John Forbes Nash Junior
1949 – Tese de doutorado na universidade de Princenton – Non-cooperative Games. Artigos: 1950 – Equilibrium points in N-person games.
1950- The Baragaining Problem 1951 – Non-cooperative games
Tchaikovsky
Confessar Não confessar
(negar) M t Confessar (-5,-5) (0,-10) Jonh Nash (nobel de 1994)
1953 - Two person cooperative games
Fevereiro de 2008 7 Maestro Não confessar (-10,0) (-1,-1)
coluna
s1
s2
s3
s4
Eliminação sequencial de estratégias estritamente dominadas
linha
g1
g2
g3
g4
(5,2) (2,6) (0,0) (9,5) (2,2) (7,0) (1,4) (1,3) (1,1) (5,1) (1,1) (5,1) (3,2) (0,2) (4,8) (0,4) J d l ã i t té i d i tJogador coluna não possui estratégia dominante. Do ponto do vista do coluna, estratégia s1 é
Guerra dos sexos
Mulher
Futebol Cinema Futebol (10,5) (0 0) (3 3) Fevereiro de 2008 9 Homem Cinema (0,0) (5,10) (0,0) (3,3)DILEMA DOS PRISIONEIROS – Jogo Estático de informação completa
C D C D 3,3 1,5 5,1 2,2 (3,3) Ganho do
linha Observe o resultado do
jogo:
Se o linha joga C, o coluna joga D (5>3);
Se o linha joga D, o Coluna joga D (2>1)
Portanto, D é um ESTRATÈGIA DOMINANTE para o jogador linha e para o jogador coluna. (1,5)
Se jogarem suas estratégias dominantes o resultado é pior para os dois. (2,2) < (3,3) Fevereiro de 2008 11 Ganho do coluna (5,1) (2,2) EED: resultado sub-ótimo
Divida a Torta com seu oponente!!
Como dividi-la de tal forma que os
dois indivíduos fiquem fiquem satisfeitos???
Qual arranjo ou acordo seria
aceitável???
Você aceitaria ficar A B com o lado A??? Fevereiro de 2008 13 A E agora, você A B você aceitaria?? ?A cereja do bolo: um dos jogadores adora cerejas... Se você revela o quanto gosta de cerejas, pode perder a perder a capacidade de barganha Fevereiro de 2008 15 A B
Ponto de decisão inicial
Jogo dinâmico ou extensivo de informação completa Árvore do Jogo Ponto de decisão Pontos terminais CORTAR PONTO SEC NÃO CORTAR Fevereiro de 2008 17 G T G T CPERS CPERS (1,2) (3,3) (5,-4) (4,2) (2,-3) Governo CPERS Governo (-4,3) (-1,-1) (1,2) Gov (-1,1) (-3,-3) (-1,6) CPERS
Presidente Presidente U Aceita Veta Aceita Veta (3,3) (2,2) (4,1) (2,2) Congresso Presidente Aceita Veta (1,4) (2,2) (2,2) Fevereiro de 2008 19 Veta M (3,3) (1,4) (4,1) (2 2) Presidente
“Em problemas de decisão individual maior liberdade de ação nunca é pior. Em Games, ao contrário, maior liberdade de ação ou maior conjunto de opções, pode ser pior porque i b i fl i d (2,2) (4,1) (2,2) (1,4) (2,2) (2 2) U Presidente Presidente Congresso Veta
isso acaba influenciando a ação dos outros jogadores.” (Dixit e Nalebuff, p. 43). Vantagens do Commitment
Jogo de Xadrez
•20 braços iniciais a partir da raiz (jogador de peças brancas pode mover qualquer um de seus 8 peões um ou dois quadrados a frente e pode mover um de seus cavalos em uma ou duas maneiras.
•Jogador de peças negras: tem 20 movimentos disponiveis para cada ramo. •Até aqui: 400 caminhos distintos •Número de nódulos possíveis é muito grande
•O método de árvores não consegue
Fevereiro de 2008 21
•O método de árvores não consegue resolver e não há computador capaz de resolver esse problema.
•Usar outros métodos...
Partida contra Verdasco é a mais longa da história do Australian Open – 5h14min – (no dia seguinte Nadal venceria Federer em uma partida de 3h22min)
NÚMEROS DA PARTIDA
Rafael Nadal Fernando Verdasco
12 Aces 20 128/176 = 73% % de 1º saque 146/216 = 68% 3 Duplas faltas 4 3 Duplas faltas 4 92/128 = 72% % de pontos no 1º saque 103/146 = 71% 28/48 = 58% % de pontos no 2º saque 36/70 = 51% 52 Bolas Vencedoras 95 25 Erros não-forçados 76 77/261 = 36% % de pontos na devolução 56/176 = 32% 4/20 = 20% Break points 2/4 = 50% Fevereiro de 2008 23 193 Total de pontos 192 16/23 = 70% Subidas à rede 33/51 = 65%
Estratégia de Polinização
•
“as vespas cultivam as flores para seus propósitos e as flores
domesticam as vespas para os propósitos delas. Os participantes
não estão agindo pelo bem do ciclo eles estão no ciclo pelo seu
não estão agindo pelo bem do ciclo, eles estão no ciclo pelo seu
próprio bem.
•
Mutualismo natural: flores em benefício de vespas, vespas em
benefício de flores.
Qual o verdadeiro significado do “em benefício”?
Resposta: DNA” (
Richard Dawkins, 2003,p. 288)“Nem de longe lembra uma vespa fêmea.” (Senhora, defensora do design inteligente em inteligente, em carta dirigida a Dawkins) Fevereiro de 2008 25 Ophrys vermixia!!! Ao buscar o néctar a vespa acaba polinizando as orquídeas...
Eficiência econômica e decisão na
margem
Baixo custo para a orquídea – pólen e
Descubra que caminho leva a vila dos verdadeiros fazendo apenas uma
Tente novamente!!! Vila dos verdadeiros p pergunta. Qual a estrada leva à vila dos que sempre falam a verdade?
Siga a
esquerda Dúvida: a pessoa que respondeu é honesto ou veio da vila azul??? Se você fosse membro da
outra vila, como você responderia à questão: o caminho à esquerda leva à vila dos honestos??
Fevereiro de 2008 27
Vila do s mentirosos
Agora as respostas independem do tipo da pessoa que responde. Se a verdade é
Sim ambos
Se você fosse membro da outra
vila, como você responderia à questão: o caminho à esquerda leva à vila dos honestos?? Sim, ambos responderão NÃO
Raciocínio: se a resposta correta é Não e o estranho é um mentiroso. Ele sabe que se fosse verdadeiro responderia Não, mas como é um
A verdade é...
SIM
NÃO
Quadro de respostas possíveis.
Faça o contrário e O estranho é....
SIM
NÃO
Verdadeironão
sim
Mentirosonão
sim
Problema:só funciona com mentirosos literaischegue ao seu objetivo
Fevereiro de 2008 29
com mentirosos literais (ou compulsivos, mentem mecanicamente)
Mentirosos estratégicos-tentariam, deliberadamente, enganar o viajante (mentem quando é conveniente).
Exemplo com mentirosos estratégicos: mais realista.
Corretor de fundos
Situação dos valores dos fundos: Go up
Down
Tipo de corretor: Honesto Desonesto
Objetivo ideal: comprar quando o valor está baixo e vender quando está alto.(comprar na baixa e vender na alta).
Pergunta inteligente: se você fosse um corretor de tipo oposto, como responderia à seguinte questão: estes valores estão em alta ou em baixa?
Quadro de respostas:
A verdadeira resposta é
...
Questõesfuncionam inteligentescom mentirosonãoO corretor é Up Down Honesto down up Mentiroso literal down up
funcionam com mentiroso estratégico, ao fazer isso, ele daria uma resposta que induziria você a pensar que o estoque estaria indo na direção contrária o que seria conveniente para o mentiroso.
Saída: criar um esquema de incentivo para que ele fale a verdade. Por exemplo, criar um esquema de Fevereiro de 2008 31 Mentiroso estratégico up down criar um esquema de comissao para que ele assuma uma parcela das eventuais perdas.
Mecanismo de Screening
Definição
• Esquema de Incentivo: é uma estratégia
t
t
i fl
i
ã
ã
que
tenta
influenciar
uma
ação
não
observável de outro jogador, dando a ele
alguma
recompensa
ou
penalidade
baseada em um resultado observável
daquela ação.
airton senna japao
Fevereiro de 2008 33
QWERT – Convenções, cultura e mudança
Questão: onde encontrar um amigo na noite de POA?
Saída: não importa qual convenção escolhemos Saída: não importa qual convenção escolhemos, desde que todos concordem com a mesma convenção.
Por vezes uma convenção é muito melhor do
que a outra, mesmo assim ela não será,
necessariamente, adotada.
Se alguma mudança nas circunstâncias torna uma outra convenção mais desejável, mesmo assim, outra convenção mais desejável, mesmo assim, pode ser muito difícil adotar a mudança.
Fatos históricos:
1873- Christopher Scholes cria o design qwerty Objetivo: maximizar a distância entre as letras mais usadas para provocar uma digitação mais lenta, ou seja, evitar “atropelamento” das teclas.
1904 – Remington Produção em massa de máquinas de escrever com o novo teclado.
Fevereiro de 2008 35
1914: Máquinas elétricas;
DSK - Divorak´s Simplified Keyboard
Reduz em 50% a distância dos dedos em relação às letras mais
d I d ã d 10% t d
usadas. Isso provoca uma redução de 10% no tempo de digitação.
Mesmo assim, qwerty continua sendo usado até hoje, inclusive nos computadores modernos.
Circulo vicioso completo:
Todos usam QWERTY Todos usam QWERTY Aprendemos QWERTY
1939 – 1945 : Marinha norteamericana passa a usar DSK e o custo de retreinamento é recuperado completamente em 10 dias.
Observação: só funcionava plenamente para iniciantes na datilografia
para iniciantes na datilografia.
Hoje: computadores podem trocar para DSK, porém o digitador tem que converter o teclado mentalmente para DSK. Ou seja, iniciantes tem que aprender QWERTY.
Jogo: jogadores são as empresas e a escolha do design a estratégia.
Fevereiro de 2008 37
Eq. Nash: o % usado de cada tecnologia é uma constante no tempo. Ou seja, esse jogo dinâmico converge para um Equilíbrio.
Efeito vagão: as decisões descoordenadas de indivíduos, mantém-nos presos a QWERTY.
Nenhum uso individual pode mudar uma convenção social.
Matemática: dois equilíbrios no final Matemática: dois equilíbrios no final 1. Todos usam DSK
2. 98% usam QWERTY
Não diz nada a respeito da qualidade do equilíbrio ou sobre qual equilíbrio será escolhido.
História importa: o acidente histórico que levou ao qwerty capturou aproximadamente 100% dos digitadores e se autoperpetuou mesmo que a motivação original para usar qwerty não exista mais.
Ou seja, um evento aleatório pode levar a um equilíbrio inferior que se autoperpetua.
Sempre há a possibilidade de melhorar a vida de todos.
Como fazer para sair de uma situação de Path dependence???
Ação coordenada pode o mudar para um equilíbrio melhor.
Não é necessário converter todos, mas apenas a massa crítica.
Como mudar para o DSK?
a) Se a principal industria produzir DSK
b) Se o governo federal treinar em
Fevereiro de 2008 39
b) Se o governo federal treinar em DSK
Obama e o petróleo, é possível mudar???
Equilíbrio de baixo nível Custo médio de QWERTY CMe0 Q* Custo médio DSK QD
Chance de que o próximo digitador usará QWERTY
95 Percentual de digitadores usando QWERTY 50 70 85 Apesar desse handicap o qwerty domina o equilíbrio Fevereiro de 2008 41 98 72 Chance de que o próximo digitador usará QWERTY
72 98
Percentual de digitadores usando QWERTY
Se o percentual de digitadores usando QWERTY cair abaixo de 72% o DSK dominará e o qwerty será abandonado no qwerty será abandonado no futuro.