• Nenhum resultado encontrado

Equação 18 – Valor presente das recompensas de n etapas trazidas a etapa atual

2.3 Fundamentos Para Desenvolvimento do Jogo Proposto Sob a Ótica da Teoria

2.3.2 Soluções para situações de interação estratégica

Feitas as considerações sobre o modelamento, pode-se incursionar sobre como os jogadores tomam suas decisões em situações de interação estratégica, ou seja, como se deve jogar um jogo. Para isso, é preciso determinar quais serão os resultados mais prováveis do jogo caso os jogadores ajam racionalmente. Adicionalmente objetiva-se buscar a combinação de estratégias que os jogadores poderão adotar, ou seja, procura-se encontrar quais serão suas ações e quais consequências essas ações terão para os outros jogadores. Novamente são necessárias mais definições e conceituações que subsidiem algumas asserções para análise.

Uma informação do jogo é dita de Conhecimento Comum quando todos os jogadores conhecem a informação e todos os jogadores sabem que todos os jogadores conhecem a informação, de forma iterativa e infinita (FIANI, 1961). Em decorrência disso pode-se definir que um jogo é dito de informação completa quando as recompensas dos jogadores são de Conhecimento Comum.

Uma vez que os jogadores são racionais, afirmar que as recompensas dos jogadores são de Conhecimento Comum significa dizer que nenhum dos jogadores possui dúvidas sobre

o resultado que os demais estão buscando obter (HARSANYI, 1967). Assim, cada jogador sabe exatamente com quem está jogando, pois sabe quais são os objetivos dos outros jogadores. Os melhores resultados são definidos segundo o valor das recompensas

esperadas, dada a escolha de pelo menos uma opção (HARSANYI, 1967).

Os valores das recompensas visam ordenar as preferências dos jogadores Ao se analisar uma situação de interação estratégica é possível que os agentes tenham uma ou mais opções de estratégia que proporcionem resultados melhores do que alguma outra estratégia, não importando o que os demais façam. De posse dessa informação um agente racional sempre escolherá a(s) opção(ões) que proporcionem resultados melhores e, por conseguinte, elimine as várias estratégias que são menos interessantes, segundo seu objetivo (MYERSON, 1999).

Uma estratégia nestas condições é uma Estratégia Estritamente Dominante. Algebricamente, tem-se: seja um dado jogador i, cujas estratégias são representadas como si. As estratégias dos demais jogadores são representadas como s-i onde o subíndice -i significa que se trata das estratégias de todos os jogadores que não o jogador i. Seja i a Função de Recompensa do jogador i, que especifica uma recompensa para o jogador i de acordo com a estratégia que ele e os demais jogadores adotam. A Equação 7 mostra a situação em que uma dada estratégia do jogador i, denominada si *, é estritamente dominante em relação a uma outra estratégia si** para este jogador.

i (si*, s-i) > i (si**, s-i), para todo s-i Equação 7 – Estratégia estritamente dominante

A desigualdade representa o fato de que a recompensa proporcionada por si* ao jogador i é estritamente superior às recompensas proporcionadas pela estratégia si** que o jogador i pode adotar, quaisquer que sejam as estratégias adotadas pelos demais jogadores (NASH, 1951). A estratégia com dominância fraca é uma estratégia que pode ser melhor do que outra em pelo menos uma situação, sendo no restante das vezes apenas tão boa quanto esta outra. As equações 8 e 9 mostram algebricamente a dominância fraca.

i (si**, s-i) i (si*, s-i), para todo s-i Equação 8 – Primeira condição para dominância fraca e

i (si**, s-i) > i (si*, s-i), para algum s-i Equação 9 – Segunda condição para dominância fraca onde

i é índice que representa um jogador, si são as estratégias do jogador i

s-i são as estratégias dos demais jogadores i é a Função de Recompensa do jogador i.

si** é uma estratégia fracamente dominante em relação a uma outra estratégia si* do jogador i.

Essa desigualdade representa o fato de que a recompensa proporcionada por si** ao jogador i é maior ou igual às recompensas proporcionadas pela estratégia si*, quaisquer que sejam as estratégias adotadas pelos demais jogadores e, para pelo menos uma das estratégias que os demais jogadores possam adotar, a estratégia fracamente dominante si** produz recompensas melhores do que si* (MYERSON, 1999).

Além da identificação de estratégias dominantes e dominadas, tem-se um método para determinar o resultado de um jogo, isto é, que estratégias os jogadores devem escolher para obterem as melhores recompensas, que é a Eliminação Iterativa de estratégias estritamente

dominadas. Assim, sempre que se obtiver um equilíbrio em estratégias estritamente

dominantes, ou seja, quando a Eliminação Iterativa de estratégias estritamente dominadas deixar com apenas uma estratégia para cada jogador, diz-se que o jogo analisado é solucionável por dominância.

Há uma outra forma de se fazer a Eliminação Iterativa de estratégias estritamente dominadas chamadas estratégias racionalizáveis. O inverso, contudo, não é necessariamente verdade, pois nem toda estratégia que não pode ser eliminada em um processo de Eliminação Iterativa de estratégias estritamente dominadas é, necessariamente, racionalizável (MAMAS, 2002).

Quando se supõe que a racionalidade dos jogadores é de Conhecimento Comum, diz- se que está sendo adotada a Hipótese do Conhecimento Comum da racionalidade. O conceito de Melhor resposta em Teoria dos Jogos pode ser descrito supondo-se um Jogo Simultâneo com dois jogadores (i e j) em que a estrutura do jogo e a racionalidade de ambos os jogadores são de Conhecimento Comum e se nesse jogo alguma estratégia si** do jogador i sempre produz um resultado pior para o jogador i do que todas as outras, não importando o que o jogador j faça, e não há nenhuma razão, qualquer que seja a conjectura do jogador i a

respeito das estratégias que o jogador j possa querer jogar, que justifique o jogador i escolher a estratégia si** . A Equação 10 apresenta algebricamente o conceito.

i (si*, s-i) i (si**, s-i) para algum s-i e para todo si** diferente de si* Equação 10 – Conceito de melhor resposta

onde

si* é uma dada estratégia de um jogador i

si** é uma outra qualquer estratégia de um jogador i, que não seja si*. s-i é a estratégia escolhida dos demais jogadores.

i é a Função de Recompensa do jogador i.

Dessa forma, afirmar que uma dada estratégia si* de um jogador i é a melhor resposta deste jogador i a uma dada estratégia s-i dos demais jogadores significa afirmar que, se os demais jogadores escolherem a combinação de estratégias s-i, a estratégia si* é a que dá a melhor recompensa ao jogador i quando comparada a qualquer outra estratégia si** (NASH, 1951).

Pode acontecer que uma outra estratégia nunca seja a melhor resposta para um dado jogador, qualquer que seja a estratégia que os outros jogadores decidam jogar. Uma estratégia si* nunca é a melhor resposta para qualquer outra estratégia que os demais jogadores decidam jogar s-i. A Equação 11 mostra algebricamente o conceito.

i (si*, s-i) > i (si**, s-i) para algum si** diferente de si* e para todo s-i. Equação 11 – Desdobramento do conceito de melhor resposta

onde:

si* é uma dada estratégia de um jogador i

si** é uma outra qualquer estratégia de um jogador i, que não seja si*. s-i é a estratégia escolhida dos demais jogadores.

i é a Função de Recompensa do jogador i.

Ou seja, se existe sempre alguma estratégia diferente de si* que dá uma recompensa maior para todas as estratégias que os demais jogadores possam escolher, segue-se que si**; nunca é uma melhor resposta para o jogador i (MYERSON, 1999). Com isso pode-se evoluir o conceito de um tipo de estratégia que é dita estritamente dominada para um dado jogador quando ela nunca é uma melhor resposta para este jogador (MYERSON, 1999). Se uma estratégia nunca é a melhor resposta para um dado jogador i, não há qualquer crença do jogador i a respeito do que os demais jogadores possam fazer que justifique o jogador i jogar a

estratégia que nunca é a melhor resposta. A solução por dominância é restrita (MYERSON, 1999).

Pela necessidade de um conceito mais geral de solução de Jogos Simultâneos, que permita tratar tanto de jogos que possuem estratégias estritamente dominadas quanto de jogos nos quais não é possível identificar estratégias dominadas, surgiu o chamado Equilíbrio de

Nash (FIANI, 1961).

2.3.2.1 O Equilíbrio de Nash

Diz-se que uma combinação de estratégias constitui um Equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores. Uma dada estratégia si* de um jogador i é considerada a melhor resposta desse jogador i a uma dada estratégia s-i dos demais jogadores se não há outra estratégia disponível para o jogador i que produza uma recompensa mais elevada do que si*, quando uma dada combinação de estratégias s-i é jogada pelos demais jogadores.

O Equilíbrio de Nash exige que todas as estratégias adotadas por todos os jogadores sejam as melhores respostas às estratégias dos demais. A Equação 12 mostra algebricamente o conceito.

i (si*, s-i*) i (si, s-i*), para todo si e todo i Equação 12 – Equilíbrio de Nash

onde

si é uma dada estratégia de um jogador i

si** é uma estratégia de um jogador i, que faz parte do Equilíbrio de Nash. s-i* é a estratégia escolhida dos demais jogadores, que faz parte do Equilíbrio de Nash.

i é a Função de Recompensa do jogador i.

O Equilíbrio de Nash não exige que as estratégias jogadas resultem em recompensas estritamente superiores às demais recompensas, ou seja, mesmo sem equilíbrio em estratégias estritamente dominantes, pode haver um Equilíbrio de Nash no jogo (NASH, 1951). Havendo um equilíbrio por dominância, essa solução é, necessariamente, também um Equilíbrio de Nash estrito. Por decorrência, quando se elimina estratégias estritamente dominadas, se houver um equilíbrio, esse equilíbrio será também um Equilíbrio de Nash estrito (MYERSON, 1999). Por outro lado, ao se eliminar estratégias fracamente dominadas, também pode-se eliminar equilíbrios de Nash que não são estritos (NASH, 1951).

2.3.2.2 Melhoria Paretiana

Quando a situação de pelo menos um agente melhora, sem que a situação de nenhum dos outros agentes piore, diz-se que houve uma melhoria paretiana, ou uma melhoria no sentido de Pareto (SEN, 1970). Ela permite identificar possibilidades de aumento de eficiência que não teriam, em princípio, razão para enfrentar nenhum tipo de oposição, uma vez que, se devido a alguma mudança, um agente melhora sem que os outros piorem, não haveria oposição a essa mudança que produz maior eficiência (SEN, 1970). Se em uma dada situação não é mais possível melhorar a situação de um agente sem piorar a de outro, diz-se que essa situação é um ótimo de Pareto, ou seja, nas condições apresentadas ganhos de eficiência não são mais possíveis (SEN, 1970).

Se os jogadores não alternam suas estratégias aleatoriamente pode muito bem acontecer que não haja um Equilíbrio de Nash, ou seja, situações em que os agentes não possuem qualquer estímulo para mudar suas decisões. O conceito do Equilíbrio de Nash permanece útil para a compreensão e análise de Jogos Simultâneos, ainda que não produza um único resultado. Como decorrência da situação de várias situações de equilíbrio é necessário conhecer o conceito de Ponto Focal onde se faz a análise da possibilidade de coordenação de agentes como forma de obter soluções cooperativas. Um Ponto Focal é um elemento que se destaca de um contexto, e que permite aos jogadores coordenarem suas decisões em um dentre vários equilíbrios de Nash possíveis, na medida em que determinados resultados sejam melhores para todos os agentes eles podem coordenar suas ações de forma a garantir o melhor resultado possível para todos, ou seja escolher estratégias cooperativas (SCHELLING, 1960). A coordenação dos agentes exige o compartilhamento de experiências (SCHELLING, 1960). O Ponto Focal como elemento de coordenação espontânea dos agentes se restringe essencialmente a pequenos grupos, dada a necessidade da familiaridade na interpretação do meio em que interagem (SEN, 1970). E essa familiaridade somente pode ser obtida por meio de experiências comuns (SCHELLING, 1960), reforçando assim a influência do contexto sobre a decisão, o aparente paradoxo já discutido.

Outros elementos que podem ser definidos a partir da questão de troca de experiências são os de jogo não cooperativo e cooperativo. Um jogo é dito não cooperativo quando os jogadores não podem estabelecer compromissos garantidos. Se os jogadores podem estabelecer compromissos, e esses compromissos possuem garantias efetivas, diz-se que o jogo é cooperativo (NASH, 1951). As situações em que cada jogador esteja apenas buscando

o melhor para si mesmo, o resultado final para todos é o pior possível (AXELROD; DION, 1988).

2.3.2.3 Jogos estritamente competitivos

Se os jogadores ao invés de visarem exclusivamente suas próprias recompensas, objetivarem infringir o maior dano possível uns aos outros? Esses são jogos estritamente

competitivos ou de soma zero. Essa característica impõe a condição de que não haja

combinação de estratégias preferível a qualquer dos dois jogadores simultaneamente (BINMORE, 2008). Um exemplo é o jogo de conflito permanente no qual não se pode determinar estratégias que sejam reciprocamente as melhores respostas para cada jogador de forma direta (NEUMANN, VON; MORGENSTERN, 1944). Os jogadores estão buscando causar o maior dano possível um ao outro e a melhor resposta a isso somente pode ser minimizar suas perdas (método Minimax).

2.3.2.4 Estratégias Mistas

Uma vez em conflito, como evitar que o inimigo surpreenda?

Estratégias mistas estão diretamente associadas a tentar surpreender e evitar ser surpreendido. Quando os jogadores partem do princípio de que os demais jogadores podem surpreendê-los, intencionalmente ou não, é razoável supor que eles podem escolher tomar suas decisões tentando evitar o pior resultado que podem obter (SCHELLING, 1960), ou seja, assumem uma opção estratégica que visa a neutralizar os efeitos da estratégia escolhida pelo outro jogador. Um jogador utiliza estratégias mistas quando decide alternar entre suas estratégias aleatoriamente, atribuindo uma probabilidade a cada estratégia a ser escolhida, ao invés de escolher uma dada estratégia de forma certa. Caso contrário, diz-se que emprega estratégias puras.

Todos os conceitos e definições foram aplicados, em resumo, para situações de interação estratégica em que cada jogador ignora as escolhas feitas pelos demais jogadores. O Equilíbrio de Nash nesse tipo de interação estratégica é aquele em que todos os jogadores estão adotando as melhores respostas possíveis ao que os demais podem vir a fazer. O equilíbrio é observado, pois ninguém ganharia nada se alterasse sua escolha, porém o que aconteceria se os agentes pudessem conhecer de antemão as decisões do outro agente?