Teoria dos Jogos (Aula 1)
Introdução
Como as pessoas se comportam em situações estratégicas?
-Estratégias: situações em que cada pessoa, ao escolher suas ações, leva em consideração a forma como as outras pessoas reagirão a ela.
-Barganha entre dois países: qualquer decisão que um país tome, afeta a decisão do outro. Estudo sistemático dessas estratégias, onde o que um fizer irá alterar o tradeoff do outro. Por exemplo, se um país pode escolher em atacar ou não e, dado isso, o outro país avalia o que irá fazer dada essa escolha.
-Competitividade entre empresas: uma empresa ao tomar decisões quanto a sua produção deverá levar em consideração a consequência desse ato para as demais empresas e como que a partir disso, elas tomarão suas decisões – a Teoria dos Jogos é útil para entender o comportamento dos oligopólios.
Por que oligopólios? Nos mercados competitivos, cada empresa é tão pequena em comparação com o tamanho que as interações estratégicas com elas são irrelevantes. No monopólio, não existem interações estratégicas, pois só há uma empresa no mercado.
Exemplo Clássico
-O Dilema dos Prisioneiros: é um “jogo” entre dois prisioneiros que ilustra como é difícil manter a cooperação, mesmo quando esta é mutualmente benéfica.
Dois suspeitos são presos e acusados de um crime. A polícia não têm evidências suficientes para condenar os suspeitos, a menos que um confesse. A polícia, então, prende os suspeitos em celas separadas e explicar as consequências que se seguirão a partir das decisões escolhidas por cada um: (1) se nenhum deles confessar, então, ambos serão condenados por um delito menor e condenados a um mês de prisão; (2) se ambos confessarem, então, ambos serão condenados à prisão por seis meses e (3) se um confessa, mas o outro não, então, quem confessou será solto (espécie de recompensa) e o outro será condenado a nove meses de prisão.
Cada prisioneiro possui duas estratégias: confessar ou permanecer em silêncio. A sentença que cada um receberá (payoff) depende da estratégia escolhida por ele e da estratégia escolhida por seu cúmplice no crime.
A forma de representar esse jogo é por meio da matriz da Figura 1. O par de payoff ) significa se o Prisioneiro 1 confessar e o Prisioneiro 2 não confessar, quem confessou será solto e o outro ficará preso por 9 meses. Nesse caso, os payoffs ou são negativos ou são zero, pois eles estão perdendo o direito de ficar em liberdade.
Figura 1: O Dilema dos Prisioneiros
Alguns símbolos e seus respectivos significados:
- Jogo de n-jogadores, em que os jogadores são numerados de 1 até n e um jogador arbitrário é chamada de jogador i. Nesse exemplo, ;
- é o conjunto de estratégias do jogador i (espaço de estratégias do jogador i). Cada espaço apresenta quais são as possibilidades de escolha de cada jogador i. Nesse exemplo, temos que ;
- é uma estratégia arbitrária desse conjunto de estratégias ;
- é a função utilidade do jogador i, em que é o payoff do
jogador i se os jogadores escolherem as estratégias . Associa o nível de
utilidade de um jogador a partir da sua escolha às escolhas de todos os outros jogadores que não o jogador i ;
A notação matemática para um jogo é
, ou seja, é formado pelo espaço de estratégias dos n-jogadores e suas funções utilidade – payoffs – .
Jogos Estáticos de Informação Completa
Os jogos estáticos são também considerados como jogos simultâneos, pois as escolhas de cada jogador ocorrem “ao mesmo tempo”. O simultaneamente significa não o ato em sim, mas que um jogador ao tomar a sua decisão desconhece a escolha feita pelo outro.
O fato de a informação completa ser completa significa que a função utilidade de cada jogador é de “conhecimento comum”. Ou seja, cada jogador conhece, além da sua, a utilidade para cada combinação de escolhas.
No exemplo do Dilema dos Prisioneiros temos um jogo estático, pois cada prisioneiro desconhece a decisão do outro antes de tomar a sua. Além disso, é um jogo de informação completa, pois cada prisioneiro sabe quais são as opções de escolha (confessar ou não confessar) que o outro dispõe e dada a escolha de cada um, conhece o payoff de cada um, inclusive o seu.
-O jogo em sua Forma Normal (ou estratégica): cada jogador escolhe, simultaneamente, uma estratégia e a combinação das estratégias escolhidas por cada jogador determina o payoff de cada um.
Quais são os jogadores envolvidos? Quais as estratégias disponíveis a cada um deles? Quais os payoffs para cada resultado possível?
- Estratégias Estritamente Dominadas: o jogo pode ser resolvido em torno da ideia de que um jogador racional (racionalidade) não irá escolher uma estratégia estritamente dominada. Sejam e ̂ ( ) duas estratégias factíveis para o jogador i do jogo na forma normal G. A estratégia é estritamente dominada pela estratégia ̂ se para qualquer combinação factível das estratégias dos outros jogadores o payoff de i associado à estratégia ̂ é estritamente maior que o ganho associado à estratégia . Ou seja, não há suposição que o jogador i possa fazer a respeito das estratégias dos outros jogadores que possa o levar a utilizar a estratégia .
̂
Ou seja, ̂ é dita uma estratégia estritamente dominante do jogador i se ela gera o maior
payoff para ele toda vez que ele a jogar, independente das estratégias escolhidas pelos demais
jogadores.
-Princípio da Racionalidade: estratégias que possuem payoff menor do que outras, independente da ação dos oponentes, nunca serão usadas.
O prisioneiro 1 vai escolher confessar. O prisioneiro 2 também irá escolher confessar. Isso ocorre, pois a estratégia confessar possui um payoff maior do que não confessar . A opção de não confessar, então, nunca será utilizada.
No jogo O Dilema dos Prisioneiros, cada jogador escolheu sua estratégia dominante, a de confessar; a que do ponto de vista individual proporciona um maior payoff. No entanto, quando ambos optam por confessar, o resultado do jogo é um pior payoff para ambos . Se eles cooperassem, se um confiasse no outro, eles deveriam escolher não confessar, pois o resultado seria um melhor payoff para ambos .
Um tenta enganar o outro, pois a opção de confessar, inicialmente, é mais vantajosa. No entanto, como o outro também pensa do mesmo modo, o resultado final é pior para ambos. A cooperação é irracional do ponto de vista individual. No exemplo do Dilema dos Prisioneiros, no momento em que estão separados e têm a oportunidade de confessar ou não, cada um é guiado por um interesse próprio, sem espaço para uma cooperação.
Exemplo 2
Duas empresas de cerveja têm as seguintes opções: investir em propaganda ou não investir. A matriz desse jogo é apresentada na Figura 2.
Figura 2: Empresas de Cerveja
Investir em propaganda é uma estratégia dominante e Não Investir em propaganda é uma estratégia dominada.
Seria melhor para ambas as empresas não adotar essa ação (de Investir em propaganda), mas como elas não conseguem se coordenar, elas acabam tomando uma decisão que é pior para ambas.
A falta de coordenação entre as pessoas resulta num payoff pior para as mesmas.
Exemplo 3
Figura 3: Exemplo 3 – parte I
Para o Jogador 1 nem a opção Cima, nem Baixo são estritamente dominadas: Cima é melhor do que Baixo se o Jogador 2 escolher Esquerda ( ), mas Baixo é melhor do que Cima, se o Jogador 2 escolher Direita ( ). No entanto, para o Jogador 2, a opção Direita é estritamente dominada pela opção Meio ( ), sendo assim , pelo princípio da racionalidade, ele nunca jogará a opção Direita. Então, já que Direita nunca será escolhida, podemos eliminar a coluna com os payoffs dessa opção e reduzir o jogo à Figura 4.
Figura 4: Exemplo 3 – parte II
A matriz da Figura 4 funciona como se fosse um novo jogo. Agora, para o Jogador 1 a opção Baixo é estritamente dominada por Cima. Pelo princípio da racionalidade o Jogador nunca escolherá a opção Baixo e, como isso, podemos descartar a linha com os payoffs dessa opção e reduzir o jogo à Figura 5.
Agora, temos que para o Jogador 2, a opção Esquerda é estritamente dominada pela Meio, sendo assim, o resultado do jogo é , ou seja, o Jogador 1 escolhe Cima e o Jogador 2 escolhe Meio.
O processo feito acima é denominado de eliminação interada de estratégias estritamente dominadas.
-Eliminação Interada de Estratégias Estritamente Dominadas: nenhum jogador racional escolhe uma estratégia sabendo que se escolhesse outra iria ter maior payoff. Então, podemos descartá-las e, como isso, temos um novo jogo.
1º Eliminar as estratégias estritamente dominadas de ; 2º Eliminar as estratégias estritamente dominadas de ; ...
Esse processo continua “enquanto” o jogo não tem solução. Esse procedimento funciona como uma espécie de “while”.