TEORIA DOS JOGOS
Prof.: Anderson Antonio Denardin
JOGOS COOPERATIVOS X JOGOS NÃO
COOPERATIVOS
¾ Jogo Cooperativo: ocorre quando seus participantes podem
negociar contratos vinculativos entre si, permitindo que planejem estratégias em conjunto.
¾ Ex.: Duas empresas de um mesmo setor que estejam
negociando um investimento em conjunto para desenvolver uma nova tecnologia (considerando que nenhuma isoladamente teria know-how suficiente para obter sucesso sozinha).
¾ Jogos Não Cooperativos: ocorre quando não existe a
possibilidade de negociação contratual entre as partes envolvidas no jogo.
¾ Ex.: Duas empresas concorrentes levam em consideração os
prováveis comportamentos uma da outra e determinam independentemente uma estratégia de preços ou de quantidades.
JOGOS COOPERATIVOS X JOGOS NÃO
COOPERATIVOS
¾
OBS.: a diferença fundamental entre os jogos
cooperativos e os não cooperativos está na
possibilidade de negociar e implementar
contratos. Nos jogos cooperativos, os contratos
vinculativos são possíveis; nos jogos não
cooperativos não existe esta possibilidade.
JOGOS NÃO
COOPERATIVOS
O QUE É UM JOGO?
¾
Definição: pode-se definir um jogo como “uma
representação formal de uma situação onde um
número de indivíduos interagem em um cenário
de interdependência estratégica”, isto é, o bem
estar de cada um depende não apenas das
próprias ações, mas também das ações dos
demais envolvidos. Assim, a ação ótima em geral
dependerá da expectativa sobre o que os demais
jogadores irão fazer. [Mas-Collel et. Al. (1995, p.
219)].
JOGO NÃO-COOPERATIVO
¾
Assim, a teoria dos jogos não cooperativos
procura entender e explicar como os
jogadores (sejam eles indivíduos, empresas,
organizações, governos, países, etc...)
tomam suas decisões, ou fazem suas
escolhas em situação de interação
estratégica.
PRESSUPOSTOS BÁSICOS
¾
Para entender como funciona a dinâmica do jogo,
ou seja, como os jogadores fazem suas escolhas
num contexto de interação estratégica, assume-se
como premissa básica que os jogadores são
racionais.
¾
Os jogadores se comportam de forma racional na
medida em que as relações de preferência que
norteiam suas escolhas possam ser ordenadas de
forma coerente, e consistente, assim, podemos
dizer que as relações de preferência dos
indivíduos são estabelecidas obedecendo o
princípio da racionalidade.
¾
Afirmar que os jogadores são racionais em teoria dos
jogos significa afirmar que suas preferências são
racionais. Assim, afirmar que uma relação de
preferência é racional significa que a relação binária
de preferência apresenta as seguintes propriedades
básicas:
- As preferências são completas;
- As preferências são transitivas;
PRESSUPOSTOS BÁSICOS
¾ Preferências Completas: a relação de preferência sobre um
conjunto de escolhas possíveis é completa, quando é possível estabelecer um ordenamento de preferências, isto é, entre duas escolhas factíveis, sempre é possível dizer se a primeira é ao menos tão boa quanto a segunda, se a segunda é ao menos tão boa quanto a primeira, ou se existe uma relação de indiferença entre as duas alternativas. Ou seja, os agentes envolvidos no jogo são capazes de definir suas preferências em relação a qualquer escolha possível.
¾ Ex.:
x
ey Є A
. Temos as seguintes possibilidades. ¾x
é preferível ay
;¾
y
é preferível ax
; ¾x
é indiferente ay
.PRESSUPOSTOS BÁSICOS
¾
Preferências Transitivas: a relação de preferência sobre
um conjunto de escolhas possíveis é transitiva, quando
existe consistência nas escolhas.
¾
Ex.:
x, y e z Є A.
Temos as seguintes possibilidades.
¾Se x for preferível a y;
¾
Se y for preferível a z;
¾
Então, pelo princípio da transitividade, x deve ser
MODELOS DE JOGOS: UMA
REPRESENTAÇÃO FORMAL DE
INTERAÇÃO ESTRATÉGICA
¾
Ao modelar um jogo o que se está fazendo é representar
uma situação de interação estratégica de forma
abstrata, focalizando-se apenas nos elementos
considerados mais importantes para explicar como os
agentes (jogadores) interagem entre si. Assim, qualquer
modelo sempre será
uma representação muito
simplificada de uma realidade infinitamente mais
complexa.
¾
É importante que o modelo, na medida em que
incorpore os elementos relevantes e sua estrutura seja
coerente com a forma pela qual se processa a interação
estratégica, sirva como um guia eficiente para o
entendimento de fenômenos da vida econômica,
empresarial e social.
ELEMENTOS BÁSICOS DE UM JOGO
¾
Jogador: é qualquer indivíduo ou organização envolvido no
processo de interação estratégica, e que tenha autonomia
para tomar decisões estratégicas. Um número finito de
jogadores (i=1,...n) participa do processo de interação
estratégica.
¾
Ação ou Movimento (Estratégia): representa uma
escolha que o jogador pode fazer em um dado momento do
jogo. Cada jogador dispõe de um certo número de ações
disponíveis, e essas ações formam um “conjunto de ações”.
Em um jogo em que cada jogador é identificado por um
subíndice i, onde i = 1,...,n, o conjunto de ações do i-ésimo
jogador lista todas as ações disponíveis para aquele jogador
e pode ser representado da seguinte forma:
ELEMENTOS BÁSICOS DE UM JOGO
¾
Payoffs (ganho ou recompensa): representa o
resultado que o jogador obtém depois de encerrado o
jogo, tomando em conta suas próprias escolhas, e a dos
demais jogadores. Um elemento importante de um jogo é
a “função de recompensa” de cada jogador, a qual
especifica um valor numérico que nos ajuda a perceber
como o jogador avalia um determinado resultado do jogo.
Dados dois resultados possíveis x e y, uma função de
recompensa para o jogador será representada por:
F(x) ≥ F(y) sempre que x for preferível à y.
JOGOS ESTÁTICOS (SIMULTÂNEOS)
DE INFORMAÇÃO COMPLETA
¾
Jogos estáticos ou simultâneos: são aqueles
em que os jogadores escolhem simultaneamente
suas ações ou estratégias, então eles recebem
um
payoff, o qual
depende da combinação de
ações escolhidas.
¾
Jogos de Informação Completa: a função
payoff
de cada jogador, ou seja, a função que
determina o resultado obtido pelos jogadores
resultante das ações ou estratégias adotadas, é
de conhecimento comum entre todos os
participantes do jogo.
REPRESENTAÇÃO DE JOGOS ESTÁTICOS
DE INFORMAÇÃO COMPLETA: FORMA
NORMAL OU ESTRATÉGICA.
¾
Definição: a representação na forma
normal de um jogo J, com N jogadores,
especifica, para cada jogador i, um
conjunto de estratégias A
i, e uma função
de ganho u
i(a
1,...,a
n), onde a
iЄ A
i.
Formalmente, escreve-se:
J = [N, {A
i}, {u
i(.)}]
REPRESENTAÇÃO DE JOGOS ESTÁTICOS
DE INFORMAÇÃO COMPLETA: FORMA
NORMAL OU ESTRATÉGICA.
¾
Em suma, a representação de um jogo na
forma normal define:
- Quais são os jogadores envolvidos no jogo;
- Quais são as estratégias disponíveis para
cada um dos jogadores;
- Os payoffs (ganhos) para cada jogador
referente a todos os resultados possíveis.
EXEMPLO 1 - Problema da Renovação dos
Empréstimos Bancários.
¾ DESCRIÇÃO:
¾ Suponha que, para iniciar suas atividades, uma empresa tomou
emprestado R$ 5 milhões em um banco A, e mais R$ 5 milhões em um banco B, perfazendo um total de R$ 10 milhoes em empréstimos. Vamos supor que em virtude de maus negócios, após um ano de operações, seus ativos se depreciaram, ou seja, os ativos que correspondiam a R$ 10 milhões (5+5) valem apenas R$ 6 milhões, insuficiente para cobrir o total de empréstimos, caso os bancos decidam cobrá-lo. Ainda existe a perspectiva de que a empresa continue operando por mais um ano.
¾ Neste caso, os bancos possuem duas ações ou estratégias disponíveis:
Renovar ou não os empréstimos.
¾ Caso decida renovar, ele continua recebenco o pagamento dos juros.
Caso decida não renovar, a empresa é obriada a reembolsar o principal do empréstimo.
¾ Se os bancos decidirem renovar os empréstimos, a empresa consegue
se manter operando por mais um ano, pagando normalmente os juros a partir de sua receita corrente, no valor de R$ 1 milhão para cada banco. Após isso a empresa seria obrigada a decretar falência.
EXEMPLO 1 - Problema da Renovação dos
Empréstimos Bancários.
¾ Continuação:
¾ Assim, no final, a empresa seria obrigada a decretar falência, de modo
que os bancos dividiriam os ativos no valor de R$ 6 milhões, resultando para cada banco um total de R$ 4 milhoes ( sendo R$ 3 milhões do principal + R$ 1 milhão pelo pagamento dos juros.
¾ Todavia, se um dos bancos decide não renovar seu crédito, ele recebe
integralmente seu empréstimo de R$ 5 milhões, mas acabaria precipitando a falência da empresa. Como a empresa seria obrigada a pagar o empréstimo para o banco que não renovou, restaria para o banco que renovou, apenas os ativos remanescentes no valor de R$ 1 milhão.
¾ Por fim, se ambos decidem não renovar os empréstimos, a empresa é
obrigada a decretar falência imediatamente, o que leva os dois bancos a partilhar seus ativos, obtendo R$ 3 milhões cada um.
Questão relevante: Se você fosse o banqueiro, qual sua melhor
Informações Relevantes
¾ Jogadores:
¾ 2 jogadores (Banco A e Banco B); ¾ Ações ou Estratégias:
¾ A = {Renova; Não Renova} ¾ B = {Renova; Não Renova} ¾ Payoffs:
¾ O ganho ou recompensa que cada jogador recebe por suas escolhas u(.). (A Renova, B Renova) = (4, 4)
(A Renova, B Não Renova) = (1, 5) (A Não Renova, B Renova) = (5, 1) (A Não Renova e B Não Renova) = (3, 3)
REPRESENTAÇÃO DE JOGO NA FORMA
NORMAL OU ESTRATÉGICA
3, 3 5, 1 NÃO RENOVA 1, 5 4, 4 RENOVA NÃO RENOVA RENOVABANCO B
BANCO A
¾
DESCRIÇÃO:
¾
Dois prisioneiros foram acusados de ter colaborado na
prática de um crime. Eles foram colocados em celas
separadas, não podendo se comunicar um com o outro.
¾
Solicitou-se a cada um que confessasse.
¾
Se ambos os prisioneiros confessarem, cada um será
condenado a seis anos de prisão.
¾
Se ambos não confessar, cada um receberá um ano de
reclusão.
¾
Se um prisioneiro confessar o crime e outro não, aquele
que confessou será liberado da pena, enquanto o que não
confessou pegará nove anos de prisão.
¾
Questão relevante: Se você fosse um desses prisioneiros,
qual seria sua opção, confessar ou não confessar?
EXEMPLO 2 – Dilema dos Prisioneiros.
Informações Relevantes
¾ Jogadores:
¾ 2 jogadores (Prisioneiro 1 e Prisioneiro 2 ); ¾ Ações ou Estratégias:
¾ A = {Confessa; Não Confessa} ¾ B = {Confessa; Não Confessa} ¾ Payoffs:
¾ O ganho ou recompensa que cada jogador recebe por suas escolhas u(.). (P1 Confessa, P2 Confessa) = (-6, -6)
(P1 Confessa, P2 Não Confessa) = (0, -9) (P1 Não Confessa, P2 Confessa) = (-9, 0) (P1 Não Confessa e P2 Não Confessa) = (-1, -1)
-6, -6 0, -9 CONFESSA -9, 0 -1, -1 NÃO CONFESSA CONFESSA NÃO CONFESSA PRISIONEIRO 2 PRISIONEIRO 1
REPRESENTAÇÃO DE JOGO NA FORMA
NORMAL OU ESTRATÉGICA
RESOLUÇÃO DE JOGOS ESTÁTICOS DE
INFORMAÇÃO COMPLETA
¾
Deve-se ter em mente que, solucionar um jogo significa
buscar determinar quais estratégias jogadores racionais
adotariam em ambientes onde o princípio de
racionalidade dos agentes envolvidos no jogo é de
conhecimento comum.
¾
Discutir a solução de um jogo significa abordar
“métodos de previsão” dos seus resultados, os quais
devem manter duas características principais:
¾
- O método deve ser preciso;
¾- O método deve ser abrangente.
Método Preciso
¾
Definição: se refere ao fato de que, uma vez
previsto um resultado, a probabilidade de que
ele realmente venha a ocorrer em uma
manifestação real do jogo será tanto maior
quanto mais preciso tiver sido o método de
previsão utilizado.
Método Abrangente
¾
Definição: Diz respeito ao número de situações
onde exista interdependência estratégica entre
os envolvidos, e que o referido método
consegue oferecer um resultado amplamente
provável.
RESOLUÇÃO DE JOGOS ESTÁTICOS DE
INFORMAÇÃO COMPLETA
¾
Em geral, existe um
tradoff
entre precisão
e abrangência, ou seja, os métodos mais
precisos são os menos abrangentes, ou
vice-versa.
¾
Analisaremos os métodos em ordem
decrescente de precisão, porém, em ordem
crescente de abrangência.
ESTRATÉGIAS (ESTRITAMENTE) DOMINANTES
¾
Definição: Em um jogo estático de informação
completa com n jogadores (sendo n finito), uma
estratégia a
ié dita uma estratégia estritamente
dominante, para um jogador i qualquer, se ela gera o
maior payoff (ganho) para ele toda vez que ele a jogar,
independente das estratégias dos outros jogadores, isto
é, se
u
i(a
i, a
-i) > u
i(a’
i, a
-i),
para todo a’
iЄ A
i, a
i≠ a’
i, e para todo a
-iЄ A
i.
Em outras palavras, a estratégia a
ié estritamente
dominante para o jogador i se ela é a melhor ação que
ele pode tomar (de modo a gerar para si o maior payoff
possível), independente do que os demais jogadores
façam.
EXEMPLO 1 - Problema da Renovação
dos Empréstimos Bancários.
3, 3 5, 1 NÃO RENOVA 1, 5 4, 4 RENOVA NÃO RENOVA RENOVA
BANCO B
BANCO A
-6, -6 0, -9 CONFESSA -9, 0 -1, -1 NÃO CONFESSA CONFESSA NÃO CONFESSA PRISIONEIRO 2 PRISIONEIRO 1EXEMPLO 3 – Todos os Jogadores, menos
um, tem Estratégias Dominantes
6, 6 3, 5 3, 2 B 5, 3 0, 2 4, 0 M
Jogador 1
5, 3 4, 0 0, 1 A D C EJogador 2
Conclusões
¾ Se um jogador dispõe de uma estratégia que é estritamente
dominante, ele, sendo recional, deve sempre jogá-la, pois, por definição, não haverá nada melhor a fazer.
¾ Se todos os envolvidos em um determinado jogo possuem
estratégias estritemente dominantes, seu resultado torna-se facilmente conhecido, dada a racionalidade de todos os agentes.
¾ O grau de acuidade dessa previsão é, de fato, extremamente
apurado, dado que é pouco provável que algém escolha fazer algo que seja reconhecidamente preferível a ele sempre.
¾ Caso tenha uma situação onde todos os jogadores, menos um,
tenham estratégias estritamente dominantes, o resultados da interação também pode ser facilmente previsto. O que ocorrerá é que o jagador que não possui uma estratégia que seja estritamente dominante escolherá a alternativa que lhe dará maior utilidade, tomando como dado que os outros jogadores irão jogar aquelas estratégias que forem dominantes.
ESTRATÉGIAS (ESTRITAMENTE)
DOMINADAS
¾
Definição: Em um jogo estático de informação completa
com n jogadores (sendo n finito), sejas a’
ie a”
iduas
estratégias possíveis para o jogador i (i.é. a’
ie a”
iЄ A
i). A
estratégia a’
ié estritamente dominada por a”
ise, para
toda combinação de estratégias dos outros jogadores, o
payoff (ganho) de i jogando a’
ifor sempre estritamente
menor que jogando a”
i, isto é, se:
u
i(a’
i, a
-i) < u
i(a”
i, a
-i),
para todo a’
ie a”
iЄ A
i, a’
i≠ a”
i, e para todo a
-iЄ A
i.
Ou seja, uma estratégia será estritamente dominada por
uma outra se ela conferir ao seu jogador um payoff
sempre inferior ao propiciado pela estratégia alternativa,
independente do que os outros jogadores possam fazer.
Eliminação Iterativa de Estratégias
Estritamente Dominadas (EIEED)
¾ Compreende um método símples para determinar o resultado de um
jogo simultâneo. Em alguns casos, os jogadores têm uma ou mais opções de estratégias que proporcionam resultados melhores do que alguma outra estratégia, “não importando o que os demais jogadores façam”.
¾ Neste caso, a análise do jogo fica bastante facilitada, pois, se uma
opção lhe confere um resultado sempre melhor do que outra, independendo do que os outros façam, por que razão escolher a outra opção, que proporciona um resultado pior, se você for um agente racional?
¾ O método que analisaremos, denominado “eliminação iterativa de
estratégias estritamente dominadas”, depende de que os agentes sejam racionais, mas também, que cada um deles saiba que os outros também são racionais, e que todos os jogadores sabem que todos os jogadores sabem que os jogadores são racionais, e assim por diante, indefinidamente.
EXEMPLO 1 -
Eliminação Iterativa de
Estratégias Estritamente Dominadas (EIEED)
1, -2 0, 1 1, 3 B
Jogador 1
-1, 3 1, 5 2, 2 A E D CJogador 2
Jogador 2
0, 1 1, 3 BJogador 1
1, 5 2, 2 A D CEXEMPLO 1 – Jogo Reduzido
Jogador 2
1, 5 2, 2 AJogador 1
D CEXEMPLO 1 – Resultado
Jogador 2
1, 5 AJogador 1
DOBS.: Este resultado constitui um Equilíbrio em
Estratégias Estritamente Dominantes.
EXEMPLO 2 – Concorrência no Mercado
Automobilístico.
1, 0 0, 6 1, 1 Não Competir 2, 3 2, 1 2, 2 Importar da MatrizGW
1, 3 4, 1 1, 4 Lançar Modelo Próprio Reduzir Preço Manter Preço Lançar Nova VersãoKM
Descrição: duas empresas, a KM e a GW , competem no mercado automobilistico. A empresa KM já tem seu modelo de utilitário, que é um sucesso, entquanto a GW ainda não oferece nenhum modelo de utilitário.
EXEMPLO 2 – Concorrência no Mercado
Automobilístico
(Jogo Reduzido).
2, 3 2, 1 2, 2 Importar da Matriz
GW
1, 3 4, 1 1, 4 Lançar Modelo Próprio Reduzir Preço Manter Preço Lançar Nova VersãoKM
EXEMPLO 2 – Concorrência no Mercado
Automobilístico
(Jogo Reduzido).
KM
2, 3 2, 2 Importar da MatrizGW
1, 3 1, 4 Lançar Modelo Próprio Reduzir Preço Lançar Nova VersãoEXEMPLO 2 – Concorrência no Mercado
Automobilístico
(Jogo Reduzido).
KM
2, 3 2, 2 Importar da MatrizGW
Reduzir Preço Lançar Nova VersãoEXEMPLO 2 – Concorrência no mercado
automobilístico
(Jogo Reduzido).
KM
2, 3 Importar da MatrizGW
Reduzir PreçoOBS.: Este resultado constitui um Equilíbrio em
Estratégias Estritamente Dominantes.
EXEMPLO 3 – Concorrência no Setor de
Detergentes Biodegradáveis.
Descrição: A empresa de detergente X deve decidir se lança, ou não,
um produto biodegradável para competir com o produto biodegradável de sua concorrente, a empresa Y. Esta última, por sua vez, tem de decidir se aumenta, ou não, os gastos de propaganda com o seu produto.
2, 7 2, 4 Não Lança o Produto Biodegradável
Empresa X
7, 3 5, 5 Lança o Produto Biodegradável Não Aumentar os Gastos com Publicidade Aumentar os Gastos com PublicidadeEmpresa Y
EXEMPLO 3 – Concorrência no Setor de Detergentes
Biodegradáveis (Jogo Reduzido).
7, 3 5, 5 Lança o Produto Biodegradável
Empresa X
Não Aumentar os Gastos com Publicidade Aumentar os Gastos com PublicidadeEmpresa Y
EXEMPLO 3 – Concorrência no Setor de Detergentes
Biodegradáveis (Jogo Reduzido).
Empresa Y
5, 5 Lança o Produto BiodegradávelEmpresa X
Aumentar os Gastos com PublicidadeOBS.: Este resultado constitui um Equilíbrio em
Estratégias Estritamente Dominantes.
ESTRATÉGIAS (FRACAMENTE)
DOMINADAS
¾ Definição: Em um jogo estático de informação completa com n
jogadores (sendo n finito), sejas a’i e a”i duas estratégias possíveis para o jogador i (i.é. a’i e a”i Є Ai). A estratégia a’i é fracamente dominada por a”i se, para toda combinação de estratégias dos outros jogadores, o payoff (ganho) de i jogando a’i for sempre menor ou igual que jogando a”i, isto é, se:
ui(a’i, a-i) ≤ ui(a”i, a-i), para todo a’i e a”iЄ Ai, a’i≠ a”i, e para todo a-iЄ Ai.
Uma estratégia fracamente dominada por outra é, portanto, um conceito próximo, mas distinto do conceito de estratégia estritamente dominadas. A diferença é que o primeiro requer que a dominada nunca seja melhor que a que domina (sendo pior em pelo menos um caso), enquanto o último exige que a dominada seja, sempre, estritamente pior que a que domina.
EXEMPLO 1 – Eliminação Iterada de
Estratégias Fracamente Dominadas
Jogador 2
3, 5 5, 3 BJogador 1
4, 3 5, 3 C 4, 3 3, 4 A E DEXEMPLO 1 – Eliminação Iterada de
Estratégias Fracamente Dominadas
Jogador 2
Nivel 1 3, 5 5, 3 BJogador 1
4, 3 5, 3 C 4, 3 3, 4 A E D Nível 2Jogador 2
4, 3 5, 3 C 4, 3 3, 4 AJogador 1
E DJogador 2
Nivel 3 5, 3 C 3, 4 AJogador 1
DJogador 2
Nível 4 5, 3 C DJogador 1
EXEMPLO 1 – Eliminação Iterada de
Estratégias Fracamente Dominadas
Jogador 2
Nivel 1 3, 5 5, 3 BJogador 1
4, 3 5, 3 C 4, 3 3, 4 A E D Nível 2Jogador 2
4, 3 5, 3 C 3, 5 5, 3 AJogador 1
E DJogador 2
Nivel 3 4, 3 C 3, 5 AJogador 1
DJogador 2
Nível 4 4, 3 C DJogador 1
Eliminação Iterada de Estratégias
Fracamente Dominadas
CONCLUSÃO:
Eliminação iterativa de estratégias
fracamente dominadas pode levar a resultados distintos
dependendo de onde se começa o processo e, portanto,
não é conseqüência da racionalidade dos jogadores.
ESTRATÉGIAS RACIONALIZÁVEIS
¾ Sempre que conseguirmos obter um equilíbrio em estratégias
estritamente dominantes, ou seja, quando a eliminação interativa de estratégias estritamente dominadas nos deixar com apenas uma estratégia para cada jogador, diz-se que o jogo analisado é
solucionavel por dominância. As estratégias que resultam da
eliminação interativa de estratégias estritamente dominadas, mesmo que seja mais do que uma para cada jogador, são chamadas
racionalizáveis.
¾ Definição: Estratégias racionalizáveis são aquelas que podem ser
jogadas em um jogo onde a estrutura do jogo e a racionalidade dos jogadores são de conhecimento comum (common knouledge) entre eles. Mais formalmente, em um jogo simultâneo, as estratégias ai que sobrevivem à eliminação interativa de estratégias que nunca são melhor resposta são conhecidas como as estratégias racionalizáveis do jogador i.
Limitação do Método de Eliminação
Iterativa de Estratégias Estritamente
Dominadas (EIEED)
Ex.: Uma empresa, a qual chamamos de Empresa Y, tem
de decidir se entra no mercado brasileiro de produtos
siderúrgicos, no qual outra empresa nacional, chamada
Empresa X, já domina uma parcela significativa do
comércio desses produtos
.
Limitação do Método de Eliminação
Iterativa de Estratégias Estritamente
Dominadas (EIEED)
-1, 2 2, 1 1, 0 Não Investir 0, -1 1, 0 2, 1 Investir Empresa X Exportar em Larga Escala Exportar em Pequena Escala Não ExportarEmpresa Y
Obs.: Não obstante a simplicidade do método de eliminação interativa de estratégias estritamente dominadas, ele apresenta uma grave limitação: nem todos os jogos apresentam estratégias estritamente dominadas.
Limitação do Método de Eliminação
Iterativa de Estratégias Estritamente
Dominadas (EIEED)
Uma vez que, nem todos os jogos apresentam estratégias
estritamente dominadas, não é possível estabelecer um
equilíbrio com base em estratégias estritamente
dominantes. Portanto, exige-se um método mais
“abrangente” do que o método de eliminação interativa
de estratégias estritamente dominadas para se
estabelecer o melhor desfecho para o jogo.
Necessita-se de um conceito mais geral de solução de
jogos simultâneos, que permita tratar tanto de jogos que
possuem estratégias estritamente dominadas e que,
portanto, podem ser resolvidos pela eliminação interativa
de estratégias estritamente dominadas, como também de
jogos nos quais não é possível identificar estratégias
dominadas. Este conceito é chamado “equilíbrio de
Nash”.
EQUILÍBRIO DE NASH
Conceito: Diz-se que uma combinação de
estratégias constitui um equilíbrio de Nash
quando cada estratégia é a melhor resposta
possível às estratégias dos demais jogadores, e
isso é verdade para todos os jogadores. Ou seja,
cada um dos jogadores que fazem parte do jogo,
ao definir sua estratégia, estará fazendo o
melhor que pode, levando em conta o que seus
oponentes estão fazendo.
EQUILÍBRIO DE NASH
¾ Definição:em um jogo simultâneo, as estratégias (a*1,....,a*n) constituem um Equilíbrio de Nash se, para todo jogador i, a*i é a melhor resposta às estratégias especificadas dos outros (N-1) jogadores, a*-i, isto é, se:
ui(a*i, a*-i) ≥ ui(ai,a*-i) para todo aiЄ Ai , para todo jogador i = 1,...,N.
De forma equivalente, podemos definir as estratégias (a*1,...,a*n) como um Equilíbrio de Nash caso, para todo jogador i, a estratégia a*i resolver o problema de
maxui(ai, a-i*), escolhendo entre todos aiЄ Ai.
Podemos, ainda, dizer que um conjunto de estratégias constitui um “Equilíbrio de Nash” se, caso todos os jogadores N - 1 (menos um), joguem as estratégias definidas pelo E.N, de modo que, para o N-ésimo jogador não exista nada melhor a fazer a não ser, também, escolher a estratégia para ele definida no “Equilíbrio de Nash”. Isso deve valer para todos os jogadores tomados individualmente.
EQUILÍBRIO DE NASH
Como Encontrá-lo?
Para encontrar um Equilíbrio de Nash, basta
identificar a(s) melhor(es) resposta(s) de um
jogador, diante de cada estratégia escolhida
pelo(s) outro(s) jogador(es). Ao proceder assim
para todos eles, quando houver uma coincidência
entre as melhores respostas para todos os
envolvidos, esse conjunto de estratégias será
identificada como um “equilíbrio de Nash”.
EQUILÍBRIO DE NASH
Como Encontrá-lo?
¾ Uma forma de fazer isso seria:
¾ Primeiro: indicar a estratégia que resulta na “maior recompensa” para
o jogador que está situado nas linhas, para cada uma das estratégias escolhidas pelo jogador que se encontra nas colunas. Podemos fazer isso colocando a letra “l” no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da linha.
¾ Segundo: indicar a estratégia que resulta na “maior recompensa” para
o jogador que está situado nas colunas, para cada uma das estratégias escolhidas pelo jogador que se encontra nas linhas. Podemos fazer isso colocando a letra “c” no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da coluna.
¾ Este processo se repete para cada uma das linhas, bem como, para
cada uma das colunas.
¾ Após aplicarmos o método de assinar a melhor resposta do jogador nas
linhas para cada estratégia do jogador nas colunas, bem como, assinalar a melhor resposta do jogador nas colunas para cada estratégia do jogador nas linhas, sempre que uma combinação de estratégias estiver assinalada “simultaneamente”, essa combinação de estratégias será um “Equilíbrio de Nash”.
EQUILÍBRIO DE NASH
-1, 2 2, 1 1, 0 Não Investir 0, -1 1, 0 2, 1 Investir Empresa X Exportar em Larga Escala Exportar em Pequena Escala Não ExportarEmpresa Y
EQUILÍBRIO DE NASH
0, 3 1, 4 4, 2 BJogador 1
6, 8 0, 5 1, 1 C 3, 2 5, 1 2, 3 A F E DJogador 2
Exemplo 2:EQUILÍBRIO DE NASH ESTRITO
Um equilíbrio de Nash estrito exige que:
ui(a*
i, a*
-i) > ui(a
i,a*
-i) para todo a
ie todo i.
-1, 2 2, 1 1, 0 Não Investir 0, -1 1, 0 2, 1 Investir Empresa X Exportar em Larga Escala Exportar em Pequena Escala Não Exportar
Empresa Y
EQUILÍBRIO DE NASH NÃO ESTRITO
Um equilíbrio de Nash não estrito exige que:
ui(a*
i, a*
-i) ≥ ui(a
i,a*
-i) para todo a
ie todo i.
-1, 2 2, 1 2, 0 Não Investir 0, -1 1, 0 2, 1 Investir Empresa X Exportar em Larga Escala Exportar em Pequena Escala Não Exportar
Empresa Y
EQUILÍBRIO EM ESTRATÉGIAS ESTRITAMENTE
DOMINANTES E EQUILÍBRIO DE NASH ESTRITO
Acabamos de ver que, mesmo que não haja equilíbrio em estratégias estritamente dominantes, pode haver um equilíbrio de Nash no jogo. Isso nos leva a fazer a pergunta inversa: se houver um equilíbrio em estratégias estritamente dominantes, ele será também um equilíbrio de Nash?
País B
1.700, 1.700 (700), 2.300 Tarifa Baixa 2.300, (700) 800, 800 Tarifa AltaPaís A
Tarifa Baixa Tarifa AltaEQUILÍBRIO EM ESTRATÉGIAS ESTRITAMENTE
DOMINANTES E EQUILÍBRIO DE NASH ESTRITO
Se houver um equilíbrio em estratégias estritamente dominantes, ele será também um equilíbrio de Nash?
Resposta:
Se um jogo apresenta um equilíbrio em estratégias estritamente
dominantes, esse equilíbrio é, necessariamente, também um equilíbrio de Nash estrito. Isso porque o equilíbrio de Nash estrito estabelece que:
ui(a*i, a*-i) > ui(ai,a*-i) para todo ai e todo i.
Ou seja, o equilíbrio de Nash estrito estabelece que uma dada estratégia de um jogador (representada por a*i) deve resultar em uma recompensa estritamente maior do que qualquer outra estratégia desse jogador (representada por ai), dadas as estratégias dos demais jogadores (representada por a-i), e isso deve ser verdade para todos os jogadores.
CASOS EM QUE EXISTEM MAIS DE UM
EQUILÍBRIO DE NASH
Pode acontecer casos em que existam mais do que um equilíbrio de Nash:
Empresa Y
(AntiVírus)
1, 2 0, -1 Não Desenvolver -1, -2 2, 1 DesenvolverEmpresa X
(Programas)
Não Atualizar AtualizarCASOS EM QUE EXISTEM MAIS DE UM
EQUILÍBRIO DE NASH
Ex.: Batalha dos Sexos – O problema da coordenação com Várias Opções.
Ele
2, 1 -1, -1 Cinema -1, -1 1, 2 FutebolEla
Cinema FutebolCOMO SELECIONAR ENTRE VÁRIOS
EQUILÍBRIOS DE NASH NA PRÁTICA?
O CONCEITO DE PONTO FOCAL
Na medida em que determinados resultados sejam melhores para todos os agentes, abre-se espaço para a possibilidade de cooperação entre eles, no sentido preciso de coordenar suas ações de forma a garantir o melhor resultado possível para todos.
Será justamente na análise da possibilidade de coordenação de agentes como forma de obter solução cooperativas, que será definido o concenti de “ponto focal”:
Conceito: um “ponto focal” é um elemento que se destaca de um contexto, e que permite aos jogadores coordenarem suas decisões em um detre vários equilíbrios de Nash possíveis. OBS.: Os jogadores ganham sempre que conseguirem
coordenar suas ações, embora têm preferêncaias distintas sobre que tipo de coordenação deve ser adotada.
UM CASO EM QUE NÃO HÁ EQUILÍBRIO DE NASH
Exemplo: Jogo de Combinar Moedas
Jogador 2
-1, 1 1, -1 Coroa 1, -1 -1, 1 CaraJogador 1
Coroa CaraUM CASO EM QUE NÃO HÁ EQUILÍBRIO DE NASH
Exemplo: Jogo de Par ou Impar
Jogador 2
1, -1 -1, 1 Impar -1, 1 1, -1 ParJogador 1
Impar ParESTABILIDADE, EXISTÊNCIA E UNICIDADE DO
EQUILÍBRIO DE NASH
Conceito de Estabilidade:
Caso se tenha um determinado conjunto de estratégias,
conhecido por todos e previsto como a solução de um jogo estático, ele deverá constituir-se em um Equilíbrio de Nash. Se isso não ocorrer, então, por definição, existirá algum jogador que poderá obter payoff maior jogando outra estratégia: ele não teria, portanto, incentivo em jogar a estratégia proposta inicialmente, sendo racional. Assim, se um determinado conjunto de estratégia é previsto como a solução de um jogo estático, ele deverá ser um Equilíbrio de Nash. Nesse sentido dizemos que o E.N é “estratégicamente estável” (ou self-enforcing).
Formalmente, suponha que (a*1 ,,...,a*n) é a solução proposta
para um determinado jogo mas não é um E.N, então, para ao menos um jogador i, existe uma estratégia alternativa para a qual:
ui(a*1 ,,...,a*n) < ui (a**1 ,,...,a**n)
E o jogador i preferirá jogar a**i , onde (a**1 ,,...,a**n) é a
solulção.
ESTABILIDADE, EXISTÊNCIA E UNICIDADE DO
EQUILÍBRIO DE NASH
Com relação à existência e unicidade do Equilíbrio de Nash:
Segundo o teorema provado por Nash em 1951, sabe-se que,
sempre existirá “pelo menos um” equilíbrio de Nash, ainda que envolva estratégias mistas, desde que o jogo em análise seja finito.
Teorema de Nash: em todo jogo finito J = [N finito, {Ai} finito, {ui(.)}]
existe pelo menos um equilíbrio de Nash, ainda que envolva apenas estratégias mistas.
APLICAÇÕES DO EQUILÍBRIO DE NASH
O conceito de equilíbrio de Nash tem sido amplamente utilizado para
a compreensão do comportamento das empresas no mercado, em especial, no comportamento das empresas em mercados não competitivos, organizados sob forma de “Oligopólio”.
Até então, tratamos o processo de escolhas estratégicas dos
jogadores considerando suas decisões tomando em conta variáveis discretas. Embora essa simplificação não altere a essência do argumento, ela limita as possibilidades de análise.
Uma vez que a escolha de preços e quantidades representam as
variáveis estratégicas mais importantes para a tomada de decisão das empresas, observa-se que, as empresas estabelecidas não dispõem apenas da opção de escolher o preço e a quantidade a um dado nível pré estabelecido (discretos), mas dispõem de um intervalo contínuo de diferentes possibilidades de preços e quantidades disponíveis. Neste caso as empresas dispõem de estratégias
contínuas, uma vez que as variáveis que compõem o conjunto de
estratégias variam continuamente.
Assim, o modelo de jogo mais adequado para tratar desse tipo de
situação é um jogo simultâneo de estratégias contínuas.
APLICAÇÕES DO EQUILÍBRIO DE NASH
OLIGOPÓLIO
Características:
Em um mercado organizado sob a forma de oligopólio tem como
principal característica o fato de poucas empresas serem responsáveis pela maior parte ou pela totalidade da produção;
Os produtos produzidos pelas empresas podem ou não ser
diferenciados;
Em alguns mercados oligopolísticos, algumas ou todas as empresas
auferem lucros substanciais a longo prazo, dado que, barreiras à entrada tornam difíceis ou impossíveis que concorrentes venham a se estabelecer no mercado;
Nesses mercados, cada empresa determina seu preço ou a
quantidade que irá produzir tomando como base considerações estratégicas relativas ao comportamento de suas concorrentes.
A noção de equilíbrio para estes mercados sugere que cada
empresa procura fazer o melhor que pode, tomando em conta o que suas concorrentes estejam fazendo.
APLICAÇÕES DO EQUILÍBRIO DE NASH
Dois exemplos clássicos de jogos simultâneos
com estratégias contínuas são aplicados para
analisar mercados não competitivos, ou seja,
mercados que se organizam sob a forma de
Oligopólios:
Î
Modelo de Cournot.
Î
Modelo de Bertrand.
MODELO DE COURNOT
Características:
Este modelo deriva seu nome do economista francês
Antoine Cournot (1838).
Considera-se um modelo simples de duopólio onde
existem duas empresas concorrendo entre si (Empresa 1
e Empresa 2);
As empresas fabricam produtos homogêneos e
conhecem a curva de demanda de mercado;
Cada empresa deve decidir quanto deverá produzir, e
elas tomarão esta decisão “simultaneamente”;
Ao tomar suas decisões, cada empresa procurara fazer o
melhor que pode levando em conta o que sua
concorrente estará fazendo.
Como regra de comportamento, supomos que cada
empresa busca maximizar seu lucro, ou recompensa.
MODELO DE COURNOT
Descrição do Modelo:
Quantidades produzidas:
– q1= quantidade produzida pela Firma 1 – q2= quantidade produzida pela Firma 2;
Função Demanda de Mercado:
P(Q) = a – bQ,
– P(Q) representa o preço de mercado como função da quantidade total produzida (Q);
– Q = q1+ q2;
MODELO DE COURNOT
Função Receita Total:
Função de Custo da Firma: C(Q) = cqi
2 1 2 1 1 1 2 1 1 1 1
P
(
Q
)
q
(
a
bQ
)
q
[
a
b
(
q
q
)]
q
aq
bq
bq
q
RT
=
=
−
=
−
+
=
−
−
2 2 2 1 2 2 2 1 2 2 2 P(Q)q (a bQ)q [a b(q q )]q aq bq q bq RT = = − = − + = − − 1 1cq
CT
=
2 2cq
CT
=
MODELO DE COURNOT
1 2 1 2 1 1 2 1 1(
q
,
q
)
=
aq
−
bq
−
bq
q
−
cq
π
2 2 1 2 2 2 2 1 2(
q
,
q
)
=
aq
−
bq
−
bq
q
−
cq
π
Função Lucro Total:
i i
i
i
(
q
)
=
RT
−
CT
π
MODELO DE COURNOT
0 2 0 1 2 1 1 = ⇒ − − − = ∂ ∂ c bq bq a q π 0 2 0 1 2 2 2 = ⇒ − − − = ∂ ∂ c bq bq a q π Maximização de Lucro:
i i p i i q RT CT Max i − = ∞ < < 0 ) ( πMODELO DE COURNOT
1
Firma
da
Reação
de
Função
2
2 1b
c
bq
a
q
=
−
−
Colocando q
1e q
2em evidência obtemos as
funções de reações das empresas 1 e 2:
2
Firma
da
Reação
de
Função
2
1 2b
c
bq
a
q
=
−
−
Î A função de reação da firmas 1 demonstra que, ela determina
seu nível de produção q1,tomando em conta o que a firma 2 está fazendo, ou seja, seu nível de produção q2.
Î De modo equivalente, a função de reação da firmas 2
demonstra que, ela determina seu nível de produção q2, tomando em conta o que a firma 1 está fazendo, ou seja, seu nível de produção q .
MODELO DE COURNOT
Considerando o sistema de equações representado pela
função de reação das duas firmas e resolvendo para q
1e
q
2simultaneamente, obtemos as quantidades de
equilíbrio para cada uma das firmas:
b
c
a
q
3
* 1−
=
b
c
a
q
3
* 2−
=
Esses valores para q*1 e q*2 correspondem ao equilíbrio de Cournot,
o qual também é identificado como um equilíbrio de Nash, dado que, cada uma das empresas em questão, ao escolher seu nível de produção, estará fazendo o melhor que pode em função daquilo que as demais empresas concorrentes estão fazendo. E as concorrentes estão agindo da mesma forma.
OBS.: Para esses valores, nenhum dos dois jogadores tem qualquer
incentivo para alterar suas estratégias, porque uma é a melhor resposta à outra, e vice-versa.
MODELO DE COURNOT
Representação Geométrica para o equilíbrio de
Cournot-Nash:
* 2 q * 1 q b c a 2 − b c a 2 − b c a− b c a− 1 Empresa da reação de Função 2 2 1 b c bq a q= − − 2 Empresa da reação de Função 2 1 2 b c bq a q = − − Equilíbrio de Cournot-Nash 2 q 1 qO MODELO DE COURNOT E A EFICIÊNCIA
DE PARETO
Exemplo:
Função de Demanda:
P = 100 – Q
Função de Custos:
C
1= 4q
1C
2= 4q
2MODELO DE BERTRAND
MODELO DE BERTRAND
Características:
Este modelo deriva seu nome do economista francês
Joseph Louis François Bertrand (1883).
Considera-se um modelo simples de duopólio onde
existem duas empresas concorrendo entre si (Empresa 1
e Empresa 2);
As empresas fabricam produtos homogêneos e
conhecem a curva de demanda de mercado;
Ao contrario do que ocorre com o modelo de Cournot, no
modelo de Bertand as empresa devem determinar
“simultaneamente”
seus preços em vez das quantidades.
Ao tomar suas decisões, cada empresa procurara fazer o
melhor que pode levando em conta o que sua
concorrente estará fazendo.
Como regra de comportamento, supomos que cada
empresa busca maximizar seu lucro, ou recompensa.
MODELO DE BERTRAND
Descrição do Modelo:
Quantidades produzidas:
– p1= preço cobrado pela Firma 1 – p2= preço cobrado pela Firma 2;
Função Demanda de Mercado:
q
1= a – p
1+ bp
2q
2= a – p
2+ bp
1MODELO DE BERTRAND
Função Receita Total:
Função de Custo da Firma: C(Q) = c
2 1 2 1 1 2 1 1 1 1 1
p
q
p
(
a
p
bp
)
ap
p
bp
p
RT
=
=
−
+
=
−
+
1 1cq
CT
=
1 2cq
CT
=
2 1 2 2 2 1 2 2 2 2 2p
q
p
(
a
p
bp
)
ap
p
bp
p
RT
=
=
−
+
=
−
+
MODELO DE BERTRAND
2 1 2 1 2 1 1 2 1 2 1 1 1 1 1 1= pq −cq = p(a−p +bp )−c(a−p +bp )=ap −p +bp p −ac+cp −cbp π i i i i(p ) = RT −CT π Função Lucro Total:
1 2 2 1 2 2 2 1 2 1 2 2 2 2 2 2=pq −cq =p(a−p +bp)−c(a−p +bp)=ap −p +bpp −ac+cp −cbp π
MODELO DE BERTRAND
0 2 0 1 2 1 1 = ⇒ − + + = ∂ ∂ c bp p a p π 0 2 0 2 1 2 2 = ⇒ − + + = ∂ ∂ c bp p a p π Maximização de Lucro:
i i p i i p RT CT Max i − = ∞ < < 0 ) ( πMODELO DE BERTRAND
1
da Firma
Reação
de
o
Funçã
2
2 1c
bp
a
p
=
+
+
Colocando p
1e p
2em evidência obtemos as
funções de reações das empresas 1 e 2:
2
da Firma
Reação
de
o
Funçã
2
1 2c
bp
a
p
=
+
+
Î A função de reação da firmas 1 demonstra que, ela determina
seu preço p1tomando em conta o que a firma 2 está fazendo, ou seja, o preço que a firma 2 está cobrando p2.
Î De modo equivalente, a função de reação da firmas 2
demonstra que, ela determina seu preço q2,tomando em conta o que a firma 1 está fazendo, ou seja, o preço p1.
MODELO DE BERTRAND
Considerando o sistema de equações representado pela
função de reação das duas firmas e resolvendo para p
1e
p
2simultaneamente, obtemos os preços de equilíbrio para
cada uma das firmas:
b
c
a
p
−
+
=
2
* 1b
c
a
p
−
+
=
2
* 2 Esses valores para p*1e p*2correspondem ao equilíbrio de Bertrand,
o qual também é identificado como um equilíbrio de Nash, dado que, cada uma das empresas em questão, ao escolher seu preço, estará fazendo o melhor que pode em função daquilo que as demais empresas concorrentes estão fazendo. E as concorrentes estão agindo da mesma forma.
OBS.: Para esses valores, nenhum dos dois jogadores tem qualquer
incentivo para alterar suas estratégias, porque uma é a melhor resposta à outra, e vice-versa.
MODELO DE BERTRAND
2 p * 2 p * 1 p p1 1 Firma da Reação de Função 2 2 1 b p a p = + 2 Firma da Reação de Função 2 2 1 b p a p = + Equilíbrio de Bertrand 1 da Firma Reação de o Funçã 2 2 1 c bp a p= + +Representação Geométrica para o equilíbrio de Bertrand 2 da Firma Reação de o Funçã 2 1 2 c bp a p = + +
ESTRATÉGIAS MISTAS
¾ Em um jogo simultâneo, onde Ai constitui um conjunto de estratégia disponível para o jogador i, as estratégias (a*1,....,a*n) constituem um Equilíbrio de Nash se, para todo jogador i, a*i é a melhor resposta às estratégias especificadas pelos outros (N-1) jogadores, a*-i, isto é, se:
ui(a*i, a*-i) ≥ ui(ai,a*-i) para todo aiЄ Ai , para todo jogador i = 1,...,N.
¾ Por esta definição, não é possível estabelecer um equilíbrio de Nash em um jogo que tem como propósito combinar moedas, pois não existe coincidência de estratégias que representam melhor resposta para ambos os jogadores.
Jogador 2
-1, 1 1, -1 Coroa 1, -1 -1, 1 CaraJogador 1
Coroa CaraESTRATÉGIAS MISTAS
¾
Em um jogo em que cada jogador gostaria de adivinhar o
que o outro jogador estaria disposto a fazer, não é possível
estabelecer um equilíbrio de Nash na forma padrão (com
estratégias puras) porque a solução do jogo envolve
“incerteza” sobre as estratégias que os demais jogadores
estariam dispostos a adotar [Harsanyi (1973)].
¾
O conceito de estratégias mistas procura capturar as
incertezas inerentes à solução de um jogo, buscando
estabelecer a distribuição de probabilidade envolvida nas
estratégias
A
idisponíveis para um jogador i.
ESTRATÉGIAS MISTAS
¾
Até então, identificamos as diferentes ações que um
jogador pode tomar, disponíveis no conjunto
A
i, como
“estratégias puras”. Assim, no jogo de lançamento de
moedas
A
iconsiste de duas estratégias puras {Cara,
Coroa}.
¾
A estratégia mista para o jogador i é a distribuição de
probabilidade (q, 1-q), onde “q”
representa a
probabilidade de jogar Cara, e “1-q” a probabilidade de
jogar Coroa, sendo “0<q<1”.
¾
Supondo que um jogador i tem K estratégias puras A
i=
{a
i1,...a
ik}. Então, uma estratégia mista para o jogador
i é representada pela distribuição de probabilidade
(p
i1,....p
ik), onde p
ikcorresponde a probabilidade de o
jogador i jogar a estratégia a
ik, para k=1,...,k. Desde que
p
iké uma probabilidade, exige-se que 0 ≤ p
ik≤1 para
k=1...k, e p
i1+....+p
ik=1.
ESTRATÉGIAS MISTAS
¾
Definição:
Em um jogo na forma normal J = {S
1...S
n;
u
1...u
n}, onde S
i= {s
i1, ...s
ik} representa o conjunto
de estratégias, uma “estratégia mista” para o jogador i é
definida pela distribuição de probabilidade p
i= (p
i1,....p
ik),
onde 0 ≤ p
ik≤1 para k=1...k, e p
i1+....+p
ik=1.
¾
Ou seja, se, em vez de escolher dentre um conjunto de
estratégias
S
i= {s
i1, ...s
ik}
uma dada estratégia
s
ipara jogá-la com certeza (empregando estratégias puras),
um jogador decide alternar entre diferentes estratégias
aleatóriamente, atribuindo uma probabilidade a cada
estratégia a ser escolhida, diz-se que o jogador utiliza
“estratégias mistas”.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾
Definição de Equilíbrio de Nash:
¾
Em um jogo normal com N jogadores J =
{A
1,...,A
n;u
1,...u
n}, a estratégia mista (p*
1,...,p*
n)
constitui um equilíbrio de Nash se a estratégia
mista de cada jogador representar a melhor
resposta para a estratégia mista dos demais
jogadores envolvidos no jogo.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾ Exemplo: Jogo das Moedas
¾ Suponha que o jogador 1 está incerto quanto a estratégia que o jogador
2 irá adotar, portanto, acredita que o jogador 2 jogará Cara com probabilidade “q” e jogará Coroa com probabilidade “1-q”. Ou seja, o jogador 1 acredita que o jogador 2 jogará a “estratégia mista” (q, 1-q). Dada esta crença, o peyoff espefado pelo jogador 1 é dado por.
Jogador 2 -1, 1 1, -1 Coroa (1-q) (1).(q)+(-1).(1-q) = 2q-1 1, -1 Coroa (-1).(q)+(1).(1-q) = 1-2q -1, 1 Cara Jogador 1 Cara (q) ¾ Possibilidades:
¾ Cara > Coroa se: 1-2q>2q-1, ou seja, q < ½. ¾ Cara < Coroa se: 1-2q<2q-1, ou seja, q > ½. ¾ Cara = Coroa se: 1-2q=2q-1, ou seja, q = ½.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
1 0 - 1 - 1 1 1 Recompensa Espereada pelo Jogador 1 Recompensa Espereada pelo Jogador 1 Cara Coroa qRecompensa esperada pelo jogador 1, dada a
estratégia mista (q, 1-q) do jogador 2.
1/2
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾
Considere (r,1-r) a estratégia mista na qual o jogador 1 joga
Cara com probabilidade “r” e joga Coroa com probabilidade
“1-r”. Para cada valor de “q” entre zero e um, é possível
computar o valor de r denotado por r*(q), tal que (r, 1-r) é a
melhor resposta para o jogador 1 para (q, 1-q) do jogador
2.
¾
Assim, o payoff esperado pelo jogador 1 jogando (r, 1-r)
quando o jogador 2 joga (q, 1-q) é:
rq.(-1)+r.(1-q).(1)+(1-r).q.(1)+(1-r)(1-q).(-1)
= (2q-1)+r.(2- 4q)
¾
Esta expressão nos fornece a recompensa esperada pelo
jogador 1 (REJ1) para qualquer estratégia mista que o
jogador 2 adotar
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾ Exemplo: Jogo das Moedas
¾ Suponha que o jogador 2 está incerto quanto a estratégia que
o jogador 1 irá adotar, portanto, acredita que o jogador 1 jogará Cara com probabilidade “r” e jogará Coroa com probabilidade “1-r”. Dada esta crença, o peyoff espefado pelo jogador 2 é dado por.
-1, 1 1, -1 Coroa (1-r) Jogador 2 (-1).(r)+(1).(1-r) = 1-2r 1, -1 Coroa (1).(r)+(-1).(1-r) = 2r-1 -1, 1 Cara (r) Jogador 1 Cara ¾ Possibilidades:
¾ Cara > Coroa se: 2r-1>1-2r, ou seja, r > ½. ¾ Cara < Coroa se: 2r-1<1-2r, ou seja, r < ½. ¾ Cara = Coroa se: 2r-1=1-2r, ou seja, r = ½.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
1 0 - 1 - 1 1 1 Recompensa Espereada pelo Jogador 2 Recompensa Espereada pelo Jogador 2 Cara Coroa rRecompensa esperada pelo jogador 2, dada a
estratégia mista (r, 1-r) do jogador 1.
1/2
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾
Considere (q,1-q) a estratégia mista na qual o jogador 1
joga Cara com probabilidade “q” e joga Coroa com
probabilidade “1-q”. Para cada valor de “r” entre zero e um,
é possível computar o valor de q denotado por q*(r), tal que
(q, 1-q) é a melhor resposta para o jogador 1 para (r, 1-r)
do jogador 2.
¾
Assim, o payoff esperado pelo jogador 2 jogando (q, 1-q)
quando o jogador 1 joga (r, 1-r) é:
rq.(1)+r.(1-q).(-1)+(1-r).q.(-1)+(1-r)(1-q).(1)
= (1- 2q)+r.(4q-2)
¾
Esta expressão nos fornece a recompensa esperada pelo
jogador 2 (REJ2) para qualquer estratégia mista que o
jogador 1 adotar.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
(-1).(q)+(1).(1-q) = 2q-1 1, -1 -1, 1 Coroa (1-r) Jogador 2 (-1).(r)+(1).(1-r) = 1-2r -1, 1 Coroa (1-q) (1).(r)+(-1).(1-r) = 2r-1 (1).(q)+(-1).(1-q) = 1-2q 1, -1 Cara (r) Jogador 1 Cara (q)EXISTÊNCIA DE EQUILÍBRIO DE NASH
EM ESTRATÉGIAS MISTAS
¾ Caso o jogador 1 adote a estratégia mista temos: ¾ (r, 1-r) = (1/2, 1/2)
¾ Caso o jogador 2 adote a estratégia mista temos: ¾ (q, 1-q) = (1/2, 1/2)
¾ Caso os dois jogadores adotarem a estratégia mista temos um
equilíbrio em estratégias mistas, no sentido que nenhum dos jogadores consegue melhorar suas recompensas esperadas alterando a probabilidade de escolha de uma das duas estratégias, ou mesmo adotando uma estratégia pura qualquer, nenhum deles consegue surpreender o outro, o que quer que faça. Podemos, assim, representar o equilíbrio como segue:
E.N = ((r, 1-r);(q, 1-q)) = ((1/2, 1/2);(1/2, 1/2))
¾ Assim, em equilíbrio, há 50% de chance de o jogador 1 adotar r e
50% de chance de adotar 1-r; e há 50% de chance de o jogador 2 adotar q e 50% de chance de adotar 1-q.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
De um modo geral verifica-se que, em todo
jogo em que há um número finito de
jogadores, com um número finito de
estratégias, mesmo que não haja um
equilíbrio de Nash em estratégias puras,
sempre haverá um equilíbrio de Nash,
mesmo que seja em estratégias mistas.
CASOS EM QUE EXISTE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS PURAS E MISTA
Ex.: Batalha dos Sexos – O problema da coordenação com Várias Opções. Ele 1, 2 0, 0 Cinema (1-q) 0, 0 Cinema (1-r) 2, 1 Futebol (r)
Ela
Futebol (q)EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
Ex.: Batalha dos Sexos – O problema da coordenação com Várias Opções. Ele 1, 2 0, 0 Cinema (1-q) 0.q + 1.(1-q) 1 – q 0, 0 Cinema (1-r) 2.q + 0.(1-q) 2q 2, 1 Futebol (r)
Ela
Futebol (q) ¾ Possibilidades:¾ Futebol > Cinema se: 2q >1 - q, ou seja, q > 1/3. ¾ Futebol < Cinema se: 2q <1 - q, ou seja, q < 1/3. ¾ Futebol = Cinema se: 2q =1 - q, ou seja, q = 1/3
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
1 0 1 2 Recompensa Espereada por ela Recompensa Espereada por ela Cinema Futebol qRecompensa esperada por ela, dada a estratégia mista
(q, 1-q) adotada por ele.
EXISTÊNCIA DE EQUILÍBRIO DE NASH EM
ESTRATÉGIAS MISTAS
¾
Considere (r,1-r) a estratégia mista na qual ela joga Futebol
com probabilidade “r” e joga Cinema com probabilidade
“1-r”. Para cada valor de “q” entre zero e um, é possível
computar o valor de r denotado por r*(q), tal que (r, 1-r) é a
melhor resposta para ela para (q, 1-q) d’ela.
¾
Assim, o payoff esperado por ela jogando (r, 1-r) quando o
ele joga (q, 1-q) é:
rq.(2)+r.(1-q).(0)+(1-r).q.(0)+(1-r)(1-q).(1)
= (1-q)+r.(3q-1)
¾