Teoria
Teoria de de Jogos Jogos
Fátima Barros
« Introdução: o que é a Teoria de Jogos
« Concorrência como um Jogo
« O jogo da negociação
Sumário
Sumário
Os gestores tomam decisões estratégicas a todo o momento.
«
Um gestor pensa de uma forma estratégica
sempre que existem interacções entre as suas decisões e as decisões dos outros indivíduos;
sempre que ao tomar uma decisão o gestor tem que pensar na forma como os outros vão actuar ou reagir:
ü Quais são os objectivos deles?
ü Quais são as opções que têm?
Inventores da Teoria
Inventores da Teoria de de Jogos Jogos
John von Neumann Oskar Morgenstern
“Os problemas típicos de comportamento económico são estritamente idênticos às
noções matemáticas de jogos de estratégia”
Na concorrência entre duas empresas pela quota de mercado, existem regras:
« Os jogadores escolhem as suas acções dentro de um conjunto definido de acções possíveis;
« Existe uma relação (algumas vezes previsível - xadrez - outras envolvendo o factor sorte - poker) entre as acções dos jogadores e o resultado final;
A A Teoria de Teoria de Jogos Jogos... ...
«
Foi inicialmente aplicada a situações militares (início da década de 50) nomeadamente para a determinação das melhores estratégias.
«
Nos negócios, tal como na guerra, o decisor deve
antecipar as reacções dos outros.
O O que é que é então então a a Teoria de Teoria de Jogos Jogos? ?
É o estudo do comportamento racional em situações que envolvem interdependência.
«
Interdependência: significa que qualquer
jogador que participa no jogo é afectado
Comportamento Racional Comportamento Racional
Comportamento racional: dados os seus objectivos os jogadores fazem o melhor que podem.
Serão os indivíduos racionais? Nem
sempre!!!
Método da Teoria
Método da Teoria de Jogos de Jogos
“Put yourself in the other person’s shoes”
«
É a essência do método utilizado na Teoria dos Jogos pois permite a um indivíduo
prever as acções que os outros indivíduos
escolherão e assim poder tomar a melhor
Teoria
Teoria de Jogos de Jogos
«
A Teoria de Jogos, tal como qualquer outra teoria geral, mostra como situações aparentemente
diferentes têm uma mesma estrutura essencial.
«
O conhecimento adquirido através da experiência, pelo contrário, é específico às suas origens. Os
indivíduos podem não se aperceber que as mesmas ideias se podem aplicar a outras situações.
«
A experiência ajuda a ver as árvores; a Teoria de
Jogos ajuda a ver a floresta.
Jogar um Jogo é como dividir um bolo...
Jogar um Jogo é como dividir um bolo...
«
Jogadores enfrentam motivações contraditórias:
ü As suas acções afectam a dimensão do bolo e todos os participantes concordam em querer que a
dimensão do bolo seja a maior possível.
ü Mas todos querem que a sua fatia do bolo seja grande. As estratégias dos jogadores para
aumentarem a sua fatia do bolo podem provocar uma redução da dimensão do próprio bolo.
ü Existe um conflito entre querer aumentar a dimensão
« Introdução: o que é a Teoria de Jogos
« Concorrência como um Jogo
« O jogo da negociação
Sumário
Sumário
Concorrência como
Concorrência como um Jogo um Jogo
Elementos
Elementos de um Jogo de um Jogo
• Jogadores
• Indivíduos (Xadrez, Poker)
• Empresas (Oligopólio)
• Países (Conflitos Militares)
• Estratégias
• Pagamentos (Payoffs)
Classificação
Classificação dos dos Jogos Jogos
«
Ordem das Jogadas
ü Jogos Simultâneos
Ex: Concurso Público ü Jogos Sequências
Ex: Leilão Inglês
«
Objectivos dos Jogadores
ü Jogos Cooperativos
ü Jogos Não Cooperativos
Jogos
Jogos Não Cooperativos Não Cooperativos
Jogos Simultâneos
Jogo da Publicidade Jogo da Publicidade
• Dois Jogadores: {TMN, Vodafone}
• Duas Estratégias: {Faz Pub., Não Faz Pub.}
• Questão:
• Qual é o resultado deste jogo?
Jogo da Publicidade Jogo da Publicidade
10, 5 15, 0 6 , 8 10 , 2
TMN
Pub N/ Pub
Vodafone
Pub
N/ Pub
Estratégia Dominante Estratégia Dominante
«
Estratégia que é sempre escolhida por um jogador independentemente da estratégia escolhida pelo outro jogador
«
(Pub, Pub) Equilíbrio em Estratégias
Dominantes
Equilíbrio de
Equilíbrio de Nash Nash (I) (I)
«
O conceito de equilíbrio de Nash é baseado na seguinte ideia: o resultado de um jogo é definido por um conjunto de acções tais que, para cada jogador, cada acção é a melhor
resposta às acções de todos os outros jogadores.
«
Um conjunto de acções representa um EN se
nenhum dos jogadores tiver incentivo para
se desviar da sua acção, dadas as acções
dos outros jogadores.
Equilíbrio
Equilíbrio de Nash de Nash
Um par de estratégias (a*,b*) representa uma solução de equilíbrio num jogo com dois jogadores se a* é uma estratégia óptima para o jogador A se o jogador B escolher b*
e b* é uma estratégia óptima para B se o
jogador A escolher a*.
Jogo da Publicidade Alterado Jogo da Publicidade Alterado
10, 5 15, 0 6 , 8 20 , 2
TMN
Pub N/ Pub
Vodafone
Pub
N/ Pub
Jogo Jogo 3: Guerra dos Sexos 3: Guerra dos Sexos
2 , 1 0 , 0 0 , 0 1 , 2
Jogador A
Ballet Futebol
Jogador
B
Ballet
Jogo Jogo 3 : Guerra dos Sexos 3 : Guerra dos Sexos
«
Não há estratégias dominantes!
• A melhor escolha de B depende do que ele pensa que A irá jogar.
«
Dois resultados possíveis:
• (ballet, ballet)
• (futebol, futebol)
Jogo Jogo 4 4
0, 0 0, -1 1, 0 -1, 3
Jogador A
E D
Jogador B
E
D
Empresa A
Empresa B
7.5
10
15
7.5 10 15
112.5, 112.5
125, 93.75
112.5, 56.25
95.75, 125
100, 100
75, 50
56.25, 112.5
50, 75
0, 0
Concorrência em Nível de Produção
Concorrência em Nível de Produção
Ainda
Ainda as estratégias dominantes as estratégias dominantes
«
Indiana Jones and The Last Crusade
«
Corrida dos 100 metros livres
«
“Mr. Reagan has sensed that the Republicans
have what game theorists call a “dominant
strategy — one that makes a player better
off than his opponent, no matter what
“Crime e
“Crime e Castigo” Castigo ”
O Dilema dos Prisioneiros
Questão Questão
Será que o Equilíbrio de Nash de um
determinado jogo leva a um resultado que é (Pareto) eficiente ?
Resposta
Dilema
Dilema dos Prisioneiros dos Prisioneiros
Equilíbrio não cooperativo: (C, C)
-3, -3 0, -6
-6, 0 -1, -1
Confessar Negar
Negar Confessar
Jogador A
Jogador B
Dilema
Dilema dos Prisioneiros dos Prisioneiros
«
É um equilíbrio em estratégias dominantes!
««
Problema: Problema :
Qualquer que seja a estratégia do rival a melhor estratégia de um jogador é jogar de uma forma
Isto é, escolher confessar.
Se houvesse
entre os dois por forma a que os dois negassem a acusação então (N,N) podia ser um equilíbrio.
Dilema
Dilema dos prisioneiros dos prisioneiros
Jogos
Jogos Não Cooperativos Não Cooperativos
Jogos Sequenciais
Estaladiço
Empr Doce
esa
A
Estaladiço Doce
-5, -5 20, 10
10, 20 -5, -5
Empresa B
Estalad.
Doce Estalad.
Estalad. -- Empresa B Doce -- Empresa B
-5, -5
Empr. A
20, 10 10, 20
Escolha
Escolha de Produtos de Produtos - - Jogo Sequencial Jogo Sequencial
Forma Extensiva
Forma Extensiva
Sub Sub - - Game Perfect Nash Equilibrium Game Perfect Nash Equilibrium
«
SPNE é o conjunto de estratégias para cada jogador que constituem um equilíbrio de
Nash em qualquer um dos sub-jogos, isto é qualquer subconjunto do jogo que começa num ponto qualquer mas em que a história passada do jogo é common knowledge para todos os jogadores.
Num SPNE cada jogador escolhe a estratégia
Conclusão Conclusão
«
B poderia ameaçar A de jogar “Doce” se A escolhesse “Doce
”.A empresa B ganha 10 quando poderia ganhar 10 20 20
se A escolhesse “Estaladiço”!
Problema Problema: :
«
Esta ameaça não seria credível dado que A joga primeiro.
«
Quando B joga já não pode alterar a jogada de A pelo que seria irracional escolher Doce que
corresponde a um pagamento inferior.
Como?
Como?
«
Exemplo:
ü B envia um agente C para jogar o jogo em seu lugar. C tem ordens para escolher Doce se A escolher Doce.
«
Mas:
C tem de agir de acordo com as ordens recebidas (punição)
A conhece as ordens recebidas por C
Caso Caso de Entrada de Entrada no Mercado no Mercado
. Empresa instalada
entrante entrante
instalada instalada instalada instalada
P
M =55P
L=30P
L=30P
c=40P
L=30P
c=40entra fora entra fora
Π =2 350 Π =1 725
Jogos Sequenciais Jogos Sequenciais
«
Qualquer jogo com um número finito de estratégias pode ser, em princípio, resolvido do fim para o
princípio (backwards) é possível encontrar a
melhor estratégia.
Xadrez
Xadrez : é um : é um jogo sequencial jogo sequencial
• que pode ser representado por uma árvore.
• Problema: Consideremos a abertura do jogo
• As peças brancas podem abrir com 20
estratégias possíveis. As peças negras têm
igualmente 20 estratégias possíveis. Depois de
uma jogada dos dois jogadores temos já 400
possibilidades.
Regra
Regra
Atenção
Atenção : Se o jogo : Se o jogo é sequencial é sequencial
«
A ideia de estratégia dominante altera-se.
«
Se o rival joga primeiro podemos sempre
escolher a nossa estratégia dominante porque esta é sempre a nossa melhor resposta.
«
Se nós jogamos em primeiro lugar temos a
possibilidade de influenciar o comportamento
Jogador A E D
5, 8 7, 7
8, 6 4, 3
E
Jogador B D
A
B
B
(8, 5) (6, 8)
(7, 7) (3, 4) E
E
E D
D
Jogo simultâneo:
Eq: B joga D e A joga E Jogo sequencial:
Eq: A joga D e B joga E
Estratégias Dominadas Estratégias Dominadas
«
Uma estratégia é dominada quando é uniformemente pior do que qualquer outra estratégia.
Uma estratégia dominada deve ser sempre evitada
Empresa A ( líder )
Empresa B (seguidora)
7.5
10
7.5 10 15
112.5, 112.5
125, 93.75
112.5, 56.25
95.75, 125
100, 100
75, 50
56.25, 112.5
50, 75
0, 0
Oligopólio
Oligopólio com com Competição na Quantidade Competição na Quantidade (equilíbrio de
(equilíbrio de Stackelberg Stackelberg ) )
A saber A saber : :
«
Para se poder resolver um jogo sequencial usando indução retrógada é necessário que:
ü as jogadas de cada jogador sejam observadas pelos outros jogadores.
ü as jogadas sejam irreversíveis.
Ainda os Jogos Não Cooperativos Ainda os Jogos Não Cooperativos
“Tão amigos que nós (agora) somos…”
OPEP OPEP
« Década de 70: países da OPEP acordaram num aumento do preço do crude: de $3/barril em 1973 atingiu mais de
$30/barril em 1980.
« Finais dos anos 70: previa-se que o preço do barril atingisse os $100 no final do século.
« Surpreendentemente o cartel pareceu sofrer um colapso: os preços desceram atingindo os $10 em 1986 e subiram para $18 em 1987.
A invasão do Kuwait pelo Iraque provocou uma nova
Evolução do Preço do Petróleo (1970-1996)
Evolução do Preço do Petróleo (1970-1996)
Porquê
Porquê o o Colapso Colapso do Cartel? do Cartel?
è A história da OPEP é apenas um jogo!
è Jogadores: Irão, Iraque
è Níveis de Produção: 2 ou 4 milhões de barris/dia
è Produção total no mercado mundial Preço
2+2=4 $25
2+4=6 $15
4+4=8 $10
O O Jogo Jogo
46, 42
52, 22
26, 44
32, 24 Produção
do Irão
Produção do Iraque 2 4 2
4
O O Jogo Jogo do Cartel do Cartel
«
Se ambos os países mantiverem os acordos de quotas de produção, os preços são altos logo os lucros serão elevados.
«
Mas…cada um tem uma estratégia
dominante que consiste em aumentar
unilateralmente a sua quota.
O comportamento O comportamento das das empresas determina empresas determina a a dimensão
dimensão do bolo! do bolo!
Cooperação Concorrência
Aumenta o excedente do consumidor
Jogos Repetidos Jogos Repetidos
Outra vez o Dilema dos Prisioneiros
Problema
Problema do do Dilema Dilema dos Prisioneiros dos Prisioneiros
è Não há comunicação
è Não há compromissos vinculativos
è O jogo só é jogado uma vez:
não existe a possibilidade de punir logo não existem mecanismos para incentivar
cooperação.
è O que é que acontece se o jogo se repetir (com os mesmos jogadores?)
Resolver
Resolver o o Problema Problema do Dilema do Dilema dos dos Prisioneiros Prisioneiros
«
Num jogo repetido cada jogador pode criar uma reputação de cooperação
«
Não existe um acordo Explícito ( como no Cartel) mas os jogadores têm um
comportamento cooperativo!
«
No início da segunda etapa do jogo os
jogadores observam o resultado da 1ª etapa (ex. Os lucros)
«
O pagamento do jogo é a soma dos pagamentos em cada uma das etapas.
1, 1 5, 0 0, 5 4, 4 NC
A
C
B
NC C
Jogamos
Jogamos 2 vezes 2 vezes o o Dilema dos Dilema dos Prisioneiros Prisioneiros
Jogo Repetido Jogo Repetido
è Os dois jogadores têm interesse em jogar (C,C) .
è Mas, cada jogador pode ter interesse em dar um sinal de cooperação e joga “cooperativo” C na primeira etapa do jogo.
è Mas se um joga cooperativo C a melhor estratégia para o outro é jogar NC.
«
Suponhamos na 1ª etapa:
ü A joga C e B joga NC . Resultado: (0, 5)
«
Então na 2ª etapa:
ü A joga NC e B joga NC. Resultado : (1,1)
«
Resultado Final: (0, 5)+(1, 1) = (1, 6)
«
Antecipando este resultado A teria interesse em jogar NC na 1ª etapa, B jogava também NC e o resultado final seria: (1, 1)+(1, 1) =
Jogador
Jogador A é A é Míope Míope
Equilíbrio
Equilíbrio de Nash de Nash
«
Se ambos jogassem cooperativo na 1ª etapa, na 2ª etapa ambos continuavam a jogar cooperativo e o resultado seria:(4,4)+(4,4)=(8,8)
«
Problema: Na 2ª etapa, como o jogo acaba , o efeito reputação deixa de ter valor - cada jogador tem interesse em jogar a estratégia dominante logo o resultado do 2º jogo é (NC, NC).
«
Antecipando o resultado da 2ª etapa, ambos os
Será possível uma solução cooperativa Será possível uma solução cooperativa num num jogo não cooperativo? jogo não cooperativo ?
««
Se o Se o jogo jogo tem um tem um número finito número finito de de etapas etapas o equilíbrio o equilíbrio de Nash do de Nash do Dilema Dilema dos dos
Prisioneiros
Prisioneiros é é (NC,NC) (NC,NC) em cada etapa. em cada etapa .
Não é possível uma solução cooperativa!
ê Exemplo de uma Grim Trigger Strategy:
Na 1ª etapa o jogador coopera: C Se o
Se o jogo jogo for for jogado um jogado um número infinito número infinito de de vezes? vezes ?
«
Em cada etapa, os indivíduos sabem que o jogo ainda vai ser jogado mais uma vez logo há (potenciais) benefícios de jogar
cooperativamente.
Jogo infinito Jogo infinito
«
Se ambos os jogadores adoptarem uma
Grim Trigger Strategy então o resultado
deste jogo repetido indefinidamente vai
ser (C,C)
Tit- Tit -for for- -Tat Tat ou Olho ou Olho- -por por -Olho - Olho
«
Tit-for-Tat Strategy: estratégia do Perdão
ü Eu coopero : Jogo C. Se na jogada
seguinte observo que o meu rival jogou C volto a jogar C; Se observo que ele jogou NC jogo NC
ü Se mais tarde observo que ele jogou C,
Negociação Negociação
«
Negócios e Política Internacional: as partes muitas vezes negoceiam a divisão do ganho total: o bolo.
«
É necessário conhecer as regras do jogo:
ü quem faz a oferta a quem;
ü O que é que acontece se as negociações falharem.
Exemplo de Negociação Exemplo de Negociação
« Empresa e sindicato negoceiam aumento salarial
« Estratégias são variações de salários
« Sucesso nas negociações gera um excedente de $600 milhões que deve ser dividido entre as partes
« Falha das negociações resulta numa perda para a empresa de $100 milhões e para o sindicato de $3 milhões
Empresa
Sindicato
W=$10
W=$5
W=$1
W=$10 W=$5 W=$1
100, 500
-100, -3
-100, -3
-100, -3
300, 300
-100, -3
-100, -3
Nash Bargaining Nash Bargaining : :
Divisão Justa:
Divisão Justa: Natural focal Natural focal point point
Nash Bargainning Nash Bargainning
«
Negociação com propostas simultâneas resulta num problema de coordenação
«
Experiências sugerem que os jogadores coordenam para a solução “fair”
«
O que é que acontece se o jogo for
sequencial fazendo a empresa uma oferta
Empresa
10 5 1
Sindicato
Sindicato
Sindicato
Aceita Rejeita
100, 500 -100, -3
300, 300 -100, -3 Rejeita
Rejeita
500, 100 -100, -3
Jogo na
Jogo na forma extensiva forma extensiva
Aceita
Aceita
Empresa
10 5 1
Sindicato
Sindicato
Aceita Rejeita
100, 500 -100, -3 Aceita 300, 300
-100, -3 Rejeita
Apenas
Apenas um equilíbrio um equilíbrio ! !
Negociação Negociação
è
Lojas: “Take-it-or-leave it” rule
è
Uma caracteristica das negociações é que tempo é
dinheiro. Quando as negociações se prolongam o
bolo vai-se reduzindo.
Jogo Jogo do Ultimato do Ultimato
« Mello e Belmiro têm que dividir 1000 euros entre eles. Cada um sabe que o jogo tem a seguinte estrutura:
ü Iª Etapa: Mello propõe ficar com uma determinada parte dos 1000 euros. Em seguida Belmiro ou aceita, caso em que o jogo termina e Belmiro recebe a parte restante dos 1000 euros; ou rejeita a proposta e nesse caso o jogo continua.
ü 2ª Etapa: A quantia a ser dividida ficou agora reduzida a 900 euros (os advogados cobraram 100 pelas negociações da primeira etapa).
Belmiro propõe agora a parte dos 900 euros com que fica. Em