2.1 COOPERAÇÃO
2.1.2 Dilema do prisioneiro
O dilema do prisioneiro é um caso clássico estudado pela teoria dos jogos
que, no entendimento de Turocy e Stengel (2001), é o estudo formal de conflito
e cooperação. Essa teoria conceitua-se a partir de jogos teóricos aplicáveis
sempre que as ações dos diversos agentes são interdependentes. Estes
agentes podem ser indivíduos, grupos, empresas, ou qualquer combinação
destes. Os conceitos da teoria dos jogos fornecem uma linguagem para
formular, estruturar, analisar e entender os cenários estratégicos.
O estudo de um duopólio, por Antoine Cournot em 1838, é o exemplo
mais antigo de uma análise da teoria dos jogos formal. Depois disso é preciso
esperar o matemático Emile Borel, que sugeriu uma teoria formal de jogos em
1921, a qual foi promovida por John von Neumann em 1928 como uma "teoria
de jogos de salão”. Depois da publicação, em 1944, do volume “Teoria dos
Jogos e Comportamento Econômico” pelos economistas von Neumann e
Morgenstern, esta teoria foi estabelecida como um campo separado de
pesquisa. Em 1950, John Nash demonstrou que os jogos finitos sempre têm
um ponto de equilíbrio em que todos os jogadores escolhem ações que são
melhores para eles dado as escolhas de seus oponentes. Este conceito central
da teoria dos jogos não-cooperativos tem sido um ponto focal de análise desde
então. Nas décadas de 1950 e 1960, a teoria dos jogos foi ampliada, sendo
aplicada aos problemas da guerra e da política (TUROCY; STENGEL, 2001).
A teoria dos jogos, nos anos 1960, se tornou uma das ferramentas
padrão utilizada por muitos economistas políticos, enquanto alguns cientistas
políticos a descartavam por considerá-la apenas como outra forma de teoria da
escolha racional. Nesse período, essa teoria tornou-se uma ferramenta
utilizada e aceita pela maioria dos economistas (OSTROM, 2007).
A teoria dos jogos pode fornecer indicativos sobre estratégias possíveis
de serem adotadas pelas diferentes partes interessadas em função da
viabilidade de consenso, compromisso ou cooperação e de que tipos de
cooperação melhor refletem os interesses das partes interessadas e atingem
os seus objetivos. Outras vantagens é a possibilidade de formar coalizões, da
gama de resultados possíveis no âmbito da dinâmica de tomada de decisões
não cooperativas e da possibilidade de alcançar uma solução ótima ou
satisfatória para todas as partes interessadas (COLYVAN; JUSTUS; REGAN,
2011).
A teoria dos jogos oferece uma maneira de caracterizar o comportamento
de grupos, tanto de animais quanto de pessoas, oferecendo opções
potencialmente úteis para a compreensão de comportamentos agregados
inatos de muitas pessoas, como os relacionados às estratégias de utilização
dos recursos. A força da teoria dos jogos é que a mesma pode caracterizar
estratégias humanas gerais de cooperação e decisões relacionadas ao uso de
recursos (DODDS, 2005).
A partir dessa teoria, Hardin (1968) presumiu um jogo de jogadores,
considerando como participantes os pastores que usam uma pastagem de
prado comum. Neste prado existe um limite superior para o número de animais
que podem pastar numa determinada estação e sejam bem alimentados. Para
um jogo de duas pessoas, a estratégia de "cooperar" pode ser pensada como
a pastagem de L/2 animal para cada pastor. A estratégia de "defeito" é cada
pastor colocar mais animais que L/2, já que ele acha que pode vender com
lucro (dado os seus custos privados).
No caso de um jogo com 2 pastores, se ambos os pastores limitarem a
sua pastagem para L/2, eles vão obter 10 unidades de lucro. Se ambos
escolher a estratégia de defeito, eles vão obter zero de lucro. Se um deles
limita o seu número de animais para L/2, enquanto o outro colocar mais
animais, o "desertor" obtém 11 unidades de lucro e o que limitou a lotação de
animais perde 1.
Se cada um escolhe de forma independente, sem a capacidade de se
envolver em um contrato vinculativo, cada um escolhe sua estratégia
dominante, que é a de desertar. Como ambos desertam, eles obtêm lucro zero.
Esse jogo era chamado por Hardin de “Jogo do Pastor” (Figura 01) e possui a
mesma estrutura que a do jogo de dilema do prisioneiro.
Segundo Ostrom (1990), o dilema do prisioneiro é a formalização da
"Tragédia dos Comuns" na forma de um jogo. O jogo demonstra que os
indivíduos, ao tomarem decisões visando aos interesses individuais, atingem
um resultado ineficiente no sentido de Pareto
3. Dessa forma, o dilema do
prisioneiro sugere que as estratégias individuais racionais levam a resultados
coletivamente irracionais.
Figura 01: Jogo do Pastor de Hardin, ou dilema do prisioneiro. Fonte: Ostrom (1990, p.4)
O dilema do prisioneiro é talvez o jogo mais conhecido em toda a literatura
da teoria dos jogos, especialmente na literatura discursiva aplicada às ciências
3 OÓtimo de Pareto é um conceito de economia desenvolvido pelo economista italiano Vilfredo
Pareto. Entende-se que uma situação econômica é ótima no sentido de Pareto se não for possível melhorar a situação, ou, mais genericamente, a utilidade, de um agente, sem degradar a situação ou utilidade de qualquer outro agente econômico (BRANDÃO, 2012).
sociais.
Para especificar a estrutura de um jogo e prever os resultados, Ostrom
(2009, p. 8) afirma que o teórico deve postular:
1. as características dos atores envolvidos (incluindo o modelo da escolha humana adotada pelo teórico);
2. as posições que detêm (por exemplo, primeiro motor ou jogador de linha);
3. o conjunto de ações que os atores podem tomar em nós específicos em uma árvore de decisão;
4. a quantidade de informação disponível em um nó de decisão; 5. os resultados que os atores afetam conjuntamente;
6. o conjunto de funções que mapeiam atores e ações em nós de decisão em resultados intermediários ou finais; e
7. os benefícios e os custos atribuídos à vinculação das ações escolhidas e obtidas (Tradução nossa).
Na visão de Axelrod e Hamilton (1981) no caso do dilema do prisioneiro,
num jogo sem repetição, sem comunicação, nenhuma estratégia pode dominar
a estratégia de deserção pura. Assim, nesse jogo desertar é a estratégia
dominante para os diferentes jogadores.
A Figura 2 mostra a matriz de payoff de um jogo do tipo dilema do
prisioneiro e evidencia a falta de cooperação (deserção) como estratégia
dominante. Se o jogador B coopera, a escolha entre a cooperação que rende R
(a recompensa pela cooperação mútua) ou deserção que produz T (a tentação
de deserção) é automática. Como T> R, vale a pena o jogador A desertar. Por
outro lado, em caso de deserção do jogador B, a escolha entre a cooperação
que produz S (retorno do otário) ou deserção que produz P (a punição por
deserção mútua) é também automática. Como P> S, o jogador A escolherá
desertar. Assim, não importa o que o jogador B faz, o jogador A sempre vai
preferir desertar, pois T>R>P>S. Essa solução não é a mais eficiente para o
conjunto dos jogadores, pois R é superior a P, mas é a mais seguro para cada
jogador de modo individual.
Player B Player A C Cooperação D Deserção C Cooperação R = 3 Recompensa para cooperação mútua S = 0 Pagamento de otário D Deserção T = 5 Tentação para deserção P = 1 Punição por deserção mútua
Fig. 2. Indicação dos retornos do Jogador A em função das ações de ambos jogadores. Fonte: Axelrod; Hamilton (1981, p. 1392, Tradução nossa)
Assim, o dilema do prisioneiro representa bem o dilema entre cooperar e
trair. O jogo original foi baseado a partir de dois suspeitos, A e B, que são
presos pela polícia. A polícia, não tendo provas suficientes para os condenar
separa os prisioneiros em salas diferentes e oferece a ambos o mesmo acordo
(CRISPINO; SANTOS, 2011, p. 15):
1. Se um dos prisioneiros confessar (trair o outro) e o outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos.
2. Se ambos ficarem em silêncio (colaborarem um com ou outro), a polícia só pode condená-los a 1 ano cada um.
3. Se ambos confessarem (traírem o comparsa), cada um leva 5 anos de cadeia.
Cada prisioneiro toma uma decisão sem saber a escolha do outro, visto
que eles não podem conversar. O cenário de forma completa e as opções e
implicações para cada jogador, estão contidas na Quadro 02.
P R IS IO N E IRO B PRISIONEIRO A Decisões Possíveis
Colaborar (silêncio) Trair (confessar) Colaborar
(silêncio) 1 ano (A), 1 ano (B) 10 anos (A), Livre (B) Trair (confessar) Livre (A), 10 anos (B) 5 anos (A), 5 anos (B) Quadro 02: Matriz de opções – dilema do prisioneiro
Fonte: Pyndyck; Rubinfeld (2002, p. 470).