Fevereiro de 2008 1
Introdução a teoria dos jogos
Sabino da Silva Porto Junior
Sportojr@gmail.com
Fevereiro de 2008 2
James Waldegrave: primeiro a apresentar o conceito de solução de um jogo de estratégia mista em
uma carta enviada em 1713 a Pierre Rémond de Montmort.
Cournot: Reserches sur les principes Mathematiques de la Theorie des Richesses. Ernst Zermelo: Teorema sobre o jogo do Xadrez (1913), em cada etapa do jogo pelo menos um
jogador possui uma estratégia que o levará a vitória ou ao empate. Primeiro a usar a semântica da otimalidade em jogos.
Emile Borel: jogos simétricos de soma zero com dois jogadores e com um número finito n de
estratégias para cada jogador. Procurou a solução Minimax e provou em 1921 a existência de solução para n = 3 e em 1924 para n=5.
John Von Neumann: em 1928, usando topologia e cálculo funcional, mostrou a existência de solução
em estratégias mistas para um jogo de soma zero com dois jogadores e um número arbitrário n de estratégias puras. Introuziu a forma extensa do jogo.
Definição
“A teoria dos jogos é uma teoria matemática criada para se modelar fenômenos que podem ser observados quando dois ou mais agentes de decisão interagem entre si.”“teoria dos modelos matemáticos que estuda a escolha de decisoes otimas sob condicoes de conflito.” Aplicações: eleições, balanços de poder, leiloes, economia, evolução genética, esportes, etc.
Fevereiro de 2008 5 Jogo Estático ou Estratégico: jogadas
simultâneas (ação igual a estratégia)
Regras 1. Jogadores 2. Estratégias
3. Ganhos para cada combinação de estratégias
Fevereiro de 2008 6
Albert W. Tucker (1950) Situação:
Dois ladrões, M e T, são capturados e acusados de um mesmo crime.
Presos em selas separadas e sem poderem se comunicar entre si, o delegado de plantão faz a seguinte proposta: cada um pode escolher entre confessar e não confessar o crime.... Fevereiro de 2008 7 Não confessar Confessar Maestro Não confessar (negar) Confessar
Tchaikovsky
(-5,-5) (0,-10) (-10,0) (-1,-1) Jonh Nash (nobel de 1994)Equilíbrio em Estratégias Dominantes John Forbes Nash Junior
1949 – Tese de doutorado na universidade de Princenton – Non-cooperative Games. Artigos: 1950 – Equilibrium points in N-person games.
1950- The Baragaining Problem 1951 – Non-cooperative games 1953 - Two person cooperative games
Fevereiro de 2008 8
g4
g3
g2
g1
linhas4
s3
s2
s1
coluna
(5,2) (2,6) (0,0) (9,5) (2,2) (7,0) (1,4) (1,3) (1,1) (5,1) (1,1) (5,1) (3,2) (0,2) (4,8) (0,4)Jogador coluna não possui estratégia dominante. Do ponto do vista do coluna, estratégia s1 é estritamente dominada.
Do ponto de vista do linha: estratégia g1 é estritamente dominada...etc.
Eliminação sequencial de estratégias estritamente dominadas
Fevereiro de 2008 9 (5,10) (0,0) Cinema (10,5) Futebol Homem Cinema Futebol
Guerra dos sexos
Mulher
(0,0) (3,3) Fevereiro de 2008 10 2,2 5,1 1,5 3,3 C D D C (3,3) Ganho do linha Ganho do coluna Observe o resultado do jogo: Se o linha joga C, o coluna joga D (5>3); Se o linha joga D, o Coluna joga D (2>1)Portanto, D é um ESTRATÈGIA DOMINANTE para o jogador linha e para o jogador coluna. (5,1)
(1,5)
(2,2)
DILEMA DOS PRISIONEIROS – Jogo Estático de informação completa
EED: resultado sub-ótimo
Se jogarem suas estratégias dominantes o resultado é pior para os dois. (2,2) < (3,3)
Divida a Torta com seu oponente!!
Como dividi-la de tal forma que os dois indivíduos
fiquem satisfeitos???
Fevereiro de 2008 13
Qual arranjo ou acordo seria
aceitável???
A B Você aceitaria ficar com o lado A??? Fevereiro de 2008 14 A B E agora, você aceitaria?? ? Perceba, a torta foi dividida pelo seu oponente...Equilíbrio de Nash: eu divido, você escolhe
Fevereiro de 2008 15
A cereja do bolo: um dos jogadores adora cerejas...
A B Se você revela o quanto gosta de cerejas, pode perder a capacidade de barganha Fevereiro de 2008 16
Fevereiro de 2008 17 Ponto de decisão
Ponto de decisão inicial
Pontos terminais Jogo dinâmico ou extensivo de informação completa Árvore do Jogo CORTAR PONTO G T G T CPERS CPERS SEC NÃO CORTAR (1,2) (3,3) (-4, 5) (4,2) Esse foi o raciocínio que prevaleceu: o
governo assinou um decreto que virou ameaça vazia, e a greve ocorreu de fato e novos desdobramentos ocorreram...
Fevereiro de 2008 18 Governo CPERS Governo (2,-3) (-4,3) (-1,-1) (1,2) Greve Aula Corta o ponto Não corta Corta o p onto Não Corta (-1,1) (-3,-3) (-1,6) aula greve corta r Ncorta PL – grev e Decre to Gov CPERS G o v
Ameaça crível: ao aprovar o projeto
de lei o governo tornaria inescapável a punição e o sindicato teria que negociar. O problema do governo seria convencer os aliados a votar a favor do projeto....
Jogo anterior com ameaça vazia do governo Congresso Presidente Presidente Presidente U + M U M Nenh um Aceita Veta Aceita Veta Aceita Veta (3,3) (2,2) (4,1) (2,2) (1,4) (2,2) (2,2)
Situação real: nos
EUA presidente ou aceita ou veta. U + M Acei ta Veta M Veta M Veta a mbos (3,3) (1,4) (4,1) (2,2) (4,1) (2,2) (1,4) (2,2) (2,2) U M Nenhum Presidente Presidente Presidente Congresso Aceita Veta Aceita Veta
“Em problemas de decisão individual maior liberdade de ação nunca é pior. Em Games, ao contrário, maior liberdade de ação ou maior conjunto de opções, pode ser pior porque isso acaba influenciando a ação dos outros jogadores.” (Dixit e Nalebuff, p. 43). Vantagens do Commitment
Fevereiro de 2008 21
Jogo de Xadrez
•20 braços iniciais a partir da raiz (jogador de peças brancas pode mover qualquer um de seus 8 peões um ou dois quadrados a frente e pode mover um de seus cavalos em uma ou duas maneiras. •Jogador de peças negras: tem 20 movimentos disponíveis para cada ramo.
•Até aqui: 400 caminhos distintos
•Número de nódulos possíveis é muito grande: 10120( 1 com 120 zeros depois dele...)
•Um supercomputador necessitaria de 10103anos para examinar todos os nódulos
•O método de árvores não consegue resolver e não há computador capaz de resolver esse problema.
•Usar outros métodos...
Fevereiro de 2008 22
Partida contra Verdasco é a mais longa da história do Australian Open – 5h14min – (no dia seguinte Nadal venceria Federer em uma partida de 3h22min)
Fevereiro de 2008 23 33/51 = 65% Subidas à rede 16/23 = 70% 192 Total de pontos 193 2/4 = 50% Break points 4/20 = 20% 56/176 = 32% % de pontos na devolução 77/261 = 36% 76 Erros não-forçados 25 95 Bolas Vencedoras 52 36/70 = 51% % de pontos no 2º saque 28/48 = 58% 103/146 = 71% % de pontos no 1º saque 92/128 = 72% 4 Duplas faltas 3 146/216 = 68% % de 1º saque 128/176 = 73% 20 Aces 12 Fernando Verdasco Rafael Nadal NÚMEROS DA PARTIDA Fevereiro de 2008 24
Estratégia de Polinização
• “as vespas cultivam as flores para seus propósitos e as flores domesticam as vespas para os propósitos delas. Os participantes não estão agindo pelo bem do ciclo, eles estão no ciclo pelo seu próprio bem.
• Mutualismo natural: flores em benefício de vespas, vespas em benefício de flores.
Qual o verdadeiro significado do “em benefício”? Resposta: DNA” (Richard Dawkins, 2003,p. 288)
Fevereiro de 2008 25 Ophrys vermixia!!! “Nem de longe lembra uma vespa fêmea.” (Senhora, defensora do design inteligente, em carta dirigida a Dawkins)
Ao buscar o néctar a vespa acaba polinizando as orquídeas...
Fevereiro de 2008 26
Eficiência econômica e decisão na
margem
Baixo custo para a orquídea – pólen e design Vila dos verdadeiros Vila do s mentirosos Descubra que caminho leva
a vila dos verdadeiros fazendo apenas uma pergunta.
Qual a estrada leva à vila dos que sempre falam a verdade?
Siga a
esquerda Dúvida:a pessoa que
respondeu é honesto ou veio da vila azul??? Tente novamente!!!
Se você fosse membro da outra vila, como você responderia à questão: o caminho à esquerda leva à vila dos honestos??
Agora as respostas independem do tipo da pessoa que responde. Se a verdade é Sim, ambos responderão NÃO
Se você fosse membro da outra
vila, como você responderia à questão: o caminho à esquerda leva à vila dos honestos??
Raciocínio:se a resposta correta é
Nãoe o estranho é um mentiroso.
Ele sabe que se fosse verdadeiro responderia Não, mas como é um mentiroso responde Sim.
Se a verdade é Sim, ambos
Fevereiro de 2008 29
sim
não
Mentirososim
não
VerdadeiroNÃO
SIM
O estranho é.... A verdade é... Quadro de respostas possíveis.Problema:só funciona com mentirosos literais (ou compulsivos, mentem mecanicamente)
Mentirosos
estratégicos-tentariam, deliberadamente, enganar o viajante (mentem quando é conveniente). Faça o contrário e chegue ao seu objetivo Fevereiro de 2008 30
Exemplo com mentirosos estratégicos: mais realista.
Corretor de fundos Situação dos valores dos fundos: Go up
Down Tipo de corretor: Honesto Desonesto
Objetivo ideal: comprar quando o valor está baixo e vender quando está alto.(comprar na baixa e vender na alta).
Pergunta inteligente: se você fosse um corretor de tipo oposto, como responderia à seguinte questão: estes valores estão em alta ou em baixa?
Fevereiro de 2008 31
Quadro de respostas:
Down Up down up Mentiroso estratégico up down Mentiroso literal up down Honesto O corretor éA verdadeira resposta é
...
Questões inteligentes não funcionam com mentiroso estratégico, ao fazer isso, ele daria uma resposta que induziria você a pensar que o estoque estaria indo na direção contrária o que seria conveniente para o mentiroso.Saída: criar um
esquema de incentivo para que ele fale a verdade. Por exemplo, criar um esquema de comissao para que ele assuma uma parcela das eventuais perdas.
Mecanismo de Screening
Fevereiro de 2008 32
Definição
• Esquema de Incentivo: é uma estratégia
que tenta influenciar uma ação não
observável de outro jogador, dando a ele
alguma recompensa ou penalidade
baseada em um resultado observável
daquela ação.
Fevereiro de 2008 33 airton senna Japão
Fevereiro de 2008 34
QWERT – Convenções, cultura e mudança
Questão: onde encontrar um amigo na noite de POA?
Saída: não importa qual convenção escolhemos, desde que todos concordem com a mesma convenção.
Por vezes uma convenção é muito melhor do que a outra, mesmo assim ela não será, necessariamente, adotada.
Se alguma mudança nas circunstâncias torna uma outra convenção mais desejável, mesmo assim, pode ser muito difícil adotar a mudança.
Fatos históricos:
1873- Christopher Scholes cria o design qwerty Objetivo: maximizar a distância entre as letras mais usadas para provocar uma digitação mais lenta, ou seja, evitar “atropelamento” das teclas. 1904 – Remington Produção em massa de máquinas de escrever com o novo teclado.
1914: Máquinas elétricas; DSK - Divorak´s Simplified Keyboard
Reduz em 50% a distância dos dedos em relação às letras mais usadas. Isso provoca uma redução de 10% no tempo de digitação.
Mesmo assim, qwerty continua sendo usado até hoje, inclusive nos computadores modernos.
Circulo vicioso completo:
Todos usam QWERTY Aprendemos QWERTY Fábricas produzem QWERTY
Fevereiro de 2008 37 1939 – 1945 : Marinha norteamericana
passa a usar DSK e o custo de retreinamento é recuperado completamente em 10 dias. Observação: só funcionava plenamente para iniciantes na datilografia. Hoje: computadores podem trocar para DSK, porém o digitador tem que converter o teclado mentalmente para DSK. Ou seja, iniciantes tem que aprender QWERTY.
Jogo: jogadores são as empresas e a escolha do design a estratégia. Eq. Nash: o % usado de cada tecnologia é uma constante no tempo. Ou seja, esse jogo dinâmico converge para um Equilíbrio.
Fevereiro de 2008 38
Efeito vagão: as decisões descoordenadas de indivíduos, mantém-nos presos a QWERTY.
Nenhum uso individual pode mudar uma convenção social.
Matemática: dois equilíbrios no final 1. Todos usam DSK
2. 98% usam QWERTY
Não diz nada a respeito da qualidade do equilíbrio ou sobre qual equilíbrio será escolhido.
História importa: o acidente histórico que levou ao qwerty capturou aproximadamente 100% dos digitadores e se autoperpetuou mesmo que a motivação original para usar qwerty não exista mais.
Ou seja, um evento aleatório pode levar a um equilíbrio inferior que se autoperpetua.
Sempre há a
Fevereiro de 2008 39
Sempre há a possibilidade de melhorar a vida de todos.
Como fazer para sair de uma situação de Path dependence??? Ação coordenada pode o mudar para
um equilíbrio melhor.
Não é necessário converter todos, mas apenas a massa crítica. Como mudar para o DSK? a) Se a principal industria produzir
DSK
b) Se o governo federal treinar em DSK
Obama e o petróleo, é possível mudar???
Fevereiro de 2008 40 Custo médio de QWERTY CMe0 Q* Custo médio DSK QD Equilíbrio de baixo nível
Fevereiro de 2008 41 Percentual de digitadores
usando QWERTY Chance de que o próximo
digitador usará QWERTY 95 50 70 85 Apesar desse handicap o qwerty domina o equilíbrio Fevereiro de 2008 42 72 98 98 72 Percentual de digitadores usando QWERTY Chance de que o próximo
digitador usará QWERTY
Se o percentual de digitadores usando QWERTY cair abaixo de 72% o DSK dominará e o qwerty será abandonado no futuro.