• Nenhum resultado encontrado

6 Teoria dos Jogos em GAL

N/A
N/A
Protected

Academic year: 2021

Share "6 Teoria dos Jogos em GAL"

Copied!
44
0
0

Texto

(1)

Teoria dos Jogos em GAL

Neste capítulo, relacionaremos os modelos da Teoria dos Jogos às estrutu-ras de GAL, e os conceitos de soluções às fórmulas de GAL. Apesar da maioria dos conceitos da Teoria dos Jogos poder ser modelada utilizando apenas as características de primeira-ordem de GAL, optamos por representar as conse-qüências das ações tomadas em cada tipo interação através de estados. Assim, por exemplo, em jogos estratégicos, temos que cada perfil de ações é repre-sentado por um estado. Para referenciarmos e denotarmos as ações tomadas, utilizaremos símbolos (ai :→ Ai), um para cada jogador i ∈ N, que têm suas interpretações variando de acordo com o perfil de ações que o estado representa. A partir daí, as fórmulas para os conceitos de soluções são definidas utilizando estes símbolos. A idéia de tal caracterização é encapsular as conseqüências das interações por estados, objetivando um melhor entendimento sobre os jogos.

Este capítulo é dividido da seguinte forma: a seção 6.1 apresenta os jogos estratégicos como estruturas de GAL, bem como os conceitos de equilíbrio de Nash, de ótimo de Pareto, e de equilíbrio de Nash de estratégias mistas como fórmulas de GAL; a seção 6.2 provê duas versões de estruturas de GAL para os jogos extensivos, e ainda as fórmulas de GAL para cada versão dos conceitos de equilíbrio de Nash e de subjogo perfeito. Uma versão está relacionada à versão matricial de um jogo extensivo, enquanto que a outra está relacionada à versão extensiva; os jogos extensivos com informação quase perfeita e imperfeita são apresentados nas seções 6.3 e 6.4, respectivamente; os jogos de coalizões com utilidades transferíveis e o seu principal conceito de solução, core, são representados em GAL na seção 6.5. Alguns diferentes conceitos de soluções são também apresentados; nas duas seções posteriores dois novos modelos são desenvolvidos e representados em GAL com a finalidade de ilustrar como GAL se adapta a novos tipos de jogos e pode prover novos conceitos de soluções de forma intuitiva; e, por fim, na seção 6.8 modelamos jogos de coalizões sem utilidades transferíveis.

As provas dos teoremas, que garantem as correspondências entre a Teoria dos Jogos e GAL, são apresentadas no apêndice B, objetivando uma leitura mais suave deste capítulo.

(2)

6.1

Jogo Estratégico em GAL

Um jogo estratégico Γ = #N, (Ai), (ui)$ pode ser modelado em uma

estrutura GΓ de GAL da seguinte forma. Cada perfil de ações a = (ai)

!

i∈NAi (do jogo estratégico Γ) é mapeado em um estado a (da estrutura de

GΓ), onde, para cada jogador i ∈ N, o símbolo ai :→ Ai designa neste estado a ação ai do jogador i (do perfil a que originou o estado), em outras palavras, o símbolo ai é interpretado de forma não-rígida e sua interpretação depende do perfil que originou o estado. As funções de utilidades são definidas como no jogo estratégico e suas interpretações são rígidas1. A relação ≥ é definida

com o seu significado usual. Como jogo estratégico é um jogo de apenas um lance, o conjunto inicial dos estados é o conjunto dos estados do jogo, e nenhum jogador pode fazer uma escolha em cada estado, ou seja Ne=∅. Desta forma, o conjunto de ações da estrutura de GAL é o conjunto vazio. A definição formal é apresentada abaixo.

Definição 6.1 Um jogo estratégico Γ = #N, (Ai), (ui)$ é mapeado em uma estrutura de GAL como segue.

A linguagem não-lógica é definida por #S, F, P, N$, onde

S = {(Ai),R}, temos um sort R para representar as utilidades e para

cada jogador i ∈ N um sort Ai.

F = {(ai), (ui)}, temos, para cada jogador i ∈ N, um símbolo ai :→ Ai

e um símbolo funcional ui :!i∈NAi → R.

P = {≥}, um símbolo predicativo ≥: R × R. N = N, o conjunto de jogadores do jogo Γ.

A estrutura de GAL GΓ=#SE, SEo,CA, (DAi,DR)i∈N, (ai,e, ui)i∈N,e∈SE, (≥), (Ne)e∈SE$, onde

SE = A, o conjunto de estados é o conjunto dos perfis de estratégias A =!i∈NAi do jogo estratégico Γ.

SEo = A.

CA = ∅, o jogo não possui evolução.

Cada domínio DAi é interpretado como o conjunto Ai do jogo Γ; e o

domínio DR é interpretado como o conjunto de todos os possíveis valores das utilidades de Γ. Note que este conjunto é finito se o jogo é finito.

1Lembre-se que em uma interpretação rígida a interpretação é a mesma em todos os estados.

(3)

Cada símbolo ai é interpretada no estado e ∈ SE como a ação do jogador

i de acordo com o perfil de ações a = #a1, . . . , ai, . . . , an$ do jogo Γ que

originou o estado e, i.e. ai,e = ai.

Cada símbolo funcional ui é interpretado como a função de utilidade ui

do jogo Γ de forma rígida.

O símbolo predicativo ≥ é interpretado de forma rígida como o predicado maior ou igual.

Ne=∅, pois o jogo não tem evolução.

Iremos utilizar um abuso de notação e representar um jogo estratégico

#N, (Ai), (ui)$ como a seguinte estrutura de GAL #A, A, ∅, (Ai,R), (ai,a, ui), (≥), ∅$ com linguagem não-lógica #(Ai,R),(ai :→ Ai, ui : A→ R), (≥: R × R),

N$, onde A = !i∈NAi é o conjunto dos perfis de estratégias, i é um jogador, e ai,a = ai para cada a = #a1, . . . , ai, . . . , an$ ∈ A.

Para exemplificar, considere o exemplo 2.2, Batalha dos Sexos, apresen-tado na seção 2.1. Representamos novamente este jogo nesta seção utilizando a sua forma matricial na figura 6.1.a. A linguagem não-lógica para este jogo es-tratégico é #{A1, A2,R}, {a1 :→ A1, a2 :→ A2, u1 : A1×A2 → R, u2 : A1×A2

R}, (≥: R × R), {1, 2}$. A estrutura de GAL para esta linguagem não-lógica é

GBoS =#A, A, ∅, (A1, A2,R), (a1,a, a2,a, u1, u2), (≥), ∅$, onde

A ={#B, B$, #B, S$, #S, B$, #S, S$}A1 = A2 ={B, S} e R = {0, 1, 2}u1(B, B) = 2, u1(B, S) = 0, u1(S, B) = 0, u1(S, S) = 1, u2(B, B) = 1, u2(B, S) = 0, u2(S, B) = 0, u2(S, S) = 2. – a1,"B,B#= B, a2,"B,B#= B, a1,"B,S# = B, a2,"B,S#= S, a1,"S,B# = S, a2,"S,B# = B, a1,"S,S# = S, a2,"S,S# = S

Na figura 6.1.b, apresentamos parte da estrutura de GAL para este exemplo. Os estados são representados pelos círculos que são rotulados com o perfil de ações da qual cada estado foi originado. As interpretações dos símbolos (ai)são apresentadas dentro dos círculos. Os domínios são apresentados pelos conjuntos logo abaixo dos círculos. Nesta figura, não apresentamos a definição das funções de utilidades. Por exemplo, o perfil de ações #B, B$ é mapeada em um círculo rotulado com #B, B$ no qual os símbolos a1 e a2 são interpretadas

como B e B, respectivamente.

(4)

B S B S 2,1 0,0 0,0 1,2

(a) - Representação Matricial

!" a1= B a2= B #B, B$ !" a1= B a2= S #B, S$ !" #$ a1= S a2= B #S, B$ !" #$ a1= S a2= S #S, S$ R = {0, 1, 2} A1= A2= {B, S}

(b)− GBoS Estrutura de GAL

Figura 6.1: Jogo estratégico Batalha dos Sexos.

6.1.1

Fórmula de Equilíbrio de Nash

Expressamos equilíbrio de Nash através de uma fórmula de GAL, tal que esta fórmula é satisfeita em um estado se, e somente se, o perfil de ações, que o estado representa, é um equilíbrio de Nash.

Sejam #A, A, ∅, (Ai,R), (ai,a, ui), (≥), ∅$ uma estrutura de GAL com linguagem não-lógica #(Ai,R) , (ai :→ Ai, ui : A → R) , (≥: R × R), N$, e (vAi) variáveis de sorts (Ai), onde i ∈ N, a ∈ A e n é o número de jogadores em N. Uma fórmula de equilíbrio de Nash Equilibrium é definida como segue.

" i∈N∀v

Ai(ui(a1, . . . , an)≥ ui(a1, . . . , vAi, . . . , an))

Para jogos com dois jogadores, como no exemplo 2.2, Batalha dos Sexos, temos a seguinte fórmula de equilíbrio de Nash.

(∀vA1(u1(a1, a2)≥ u1(vA1, a2)))∧ (∀vA2(u2(a1, a2)≥ u2(a1, vA2)))

Abaixo iremos demonstrar que #B, B$ é um equilíbrio de Nash. Desta forma, temos que a fórmula de GAL descrita acima é satisfeita no estado

#B, B$. Sejam σA1 e σA2 funções de valorações para os sorts A1 e A2,

respec-tivamente.

GBoS, σA1, σA2 |="B,B#∀vA1(u1(a1, a2) ≥ u1(vA1, a2)) ∧ ∀vA2(u2(a1, a2) ≥ u2(a1, vA2))

⇐⇒def GBoS, σA1, σA2 |="B,B#∀vA1(u1(a1, a2) ≥ u1(vA1, a2)) (veja 6-1)

E GBoS, σA1, σA2 |="B,B#∀vA2(u2(a1, a2) ≥ u2(a1, vA2)) (veja 6-2).

(5)

GBoS, σA1, σA2 |="B,B#∀vA1(u1(a1, a2) ≥ u1(vA1, a2)) (6-1)

⇐⇒def ∀d1∈ {B, S} temos que

GBoS, σA1(vA1|d1), σA2 |="B,B#u1(a1, a2) ≥ u1(vA1, a2)

⇐⇒def ∀d1∈ {B, S} temos que

u1(¯σA1(vA1|d1)(#B, B$, a1), ¯σA2(#B, B$, a2)) ≥

u1(¯σA1(vA1|d1)(#B, B$, vA1), ¯σA2(#B, B$, a2))

⇐⇒def ∀d1∈ {B, S} temos que

u1(B, B) ≥ u1(¯σA1(vA1|d1)(#B, B$, vA1), B)

⇐⇒def u1(B, B) ≥ u1(B, B) e u1(B, B) ≥ u1(S, B)

⇐⇒def 2 ≥ 2 e 2 ≥ 0

GBoS, σA1, σA2 |="B,B#∀vA2(u2(a1, a2) ≥ u2(a1, vA2)) (6-2)

⇐⇒def ∀d2∈ {B, S} temos que

GBoS, σA1, σA2(vA2|d2) |="B,B#u2(a1, a2) ≥ u2(a1, vA2)

⇐⇒def ∀d2∈ {B, S} temos que

u2(¯σA1(#B, B$, a1), ¯σA2(vA2|d2)(#B, B$, a2)) ≥

u2(¯σA1(#B, B$, a1), ¯σA2(vA2|d2)(#B, B$, vA2))

⇐⇒def ∀d2∈ {B, S} temos que

u2(B, B) ≥ u2(B, ¯σA2(vA2|d2)(#B, B$, vA2))

⇐⇒def u2(B, B) ≥ u2(B, B) e u2(B, B) ≥ u2(B, S)

⇐⇒def 1 ≥ 1 e 1 ≥ 0

Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.1 (página 204) do apêndice B.

Teorema 6.2 Sejam Γ um jogo estratégico, a∗ = (a

i)um perfil de ações de Γ,

GΓ uma estrutura de GAL para Γ como definido na seção 6.1, e α uma fórmula de Equilíbrio de Nash como definido acima.

a∗ é um equilíbrio de Nash em Γ ⇐⇒ GΓ|= a∗ α

(6)

Podemos utilizar apenas as características de uma linguagem de primeira-ordem para caracterizar o conceito de equilíbrio de Nash. Abaixo apresentamos uma fórmula que é verdadeira se, e somente se, existe um perfil de ações que é um equilíbrio de Nash. Note que a fórmula abaixo não é dependente de uma estrutura temporal. GΓ |= ∃vA∗1. . . v An #" i∈N∀v Ai(ui(v A1, . . . , v An)≥ ui(v A1, . . . , vAi, . . . , v An)) $ 6.1.2

Fórmula de Ótimo de Pareto

A idéia da representação de ótimo de Pareto como uma fórmula de GAL é semelhante a definição da fórmula de equilíbrio de Nash apresentada na seção 6.1.1.

Sejam (vAi) variáveis de sorts (Ai). Define-se uma fórmula de ótimo de Pareto como segue.

¬    ∃vA1. . .∃vAn     # " i∈N ui(vA1, . . . , vAn)≥ ui(a1, . . . , an) $ # ( i∈N ui(vA1, . . . , vAn) > ui(a1, . . . , an) $        

Para um jogo estratégico de dois jogadores, como no exemplo 2.3, Dilema

do Prisioneiro, temos a seguinte fórmula de equilíbrio de Pareto.

¬ , ∃vA1∃vA1 , (u1(vA1, vA2)≥ u1(a1, a2)∧ u2(vA1, vA2)≥ u2(a1, a2)) (u1(vA1, vA2) > u1(a1, a2)∨ u2(vA1, vA2) > u2(a1, a2))

--Para o exemplo 2.3, Dilema do Prisioneiro, temos que a fórmula acima é satisfeita no estado #NC, NC$.

Abaixo é apresentado o teorema que garante o mapeamento de ótimo de Pareto, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.2 (página 205) do apêndice B.

Teorema 6.3 Sejam Γ um jogo estratégico, a∗ = (a

i) um perfil de estratégias

de Γ, GΓ uma estrutura de GAL para Γ como definido na seção 6.1, e α uma fórmula de ótimo de Pareto como definido acima.

a∗ é um ótimo de Pareto em Γ ⇐⇒ GΓ|= a∗ α

Assim como na seção 6.1.1, podemos utilizar apenas lógica de primeira-ordem para caracterizar ótimo de Pareto.

(7)

6.1.3

Fórmula de Equilíbrio de Nash de Estratégias Mistas

Como o conceito de equilíbrio de Nash de estratégias mistas utiliza, para cada jogador i ∈ N, um conjunto de estratégias mistas ∆Ai, um conjunto de estratégias degeneradas ΞAi, e uma função de utilidade Ui calculada em função de um perfil de estratégias mistas (τi), adicionamos estes conjuntos e funções à estrutura de GAL de um jogo estratégico. Dito isto, definimos um jogo estratégico como #A, A, ∅, (Ai, ∆Ai, ΞAi,R), (ai,a, ui, Ui), (≥), ∅$ com linguagem não-lógica #(Ai,R), (ai :→ Ai, ui : A → R, Ui : ∆ → R),(≥: R × R), N$, onde

A =!i∈NAi é o conjunto dos perfis de ações, i é um jogador, e ∆ = ! i∈N

∆Ai, e para cada a = #a1, . . . , ai, . . . , an$ ∈ A, temos ai,a= ai.

Como o conceito de equilíbrio de estratégias mistas é definido sobre as estratégias mistas e não utilizamos símbolos para representá-los a cada estado, utilizamos variáveis livres para caracterizar equilíbrio de Nash de estratégias mistas. Assim, a fórmula de equilíbrio de Nash de estratégia mistas, que tem variáveis livres v∆Ai, é um equilíbrio de Nash de estratégias mistas se, e somente se, existem funções de valorações σ∆Ai que tornam a fórmula verdadeira.

Sejam (vAi) variáveis de sorts (∆Ai), e (vΞAi) variáveis de sorts (ΞAi), uma fórmula de equilíbrio de Nash de estratégias mistas é definido como segue.

" i∈N∀v

ΞAi(Ui(vA1, . . . , v∆An)≥ Ui(vA1, . . . , vΞAi, . . . , v∆An))

Note que aqui estamos utilizando apenas a linguagem de primeira-ordem de GAL.

Para jogos com dois jogadores como no exemplo 2.2, Batalha dos Sexos, temos a seguinte fórmula de equilíbrio de Nash.

,

(∀vΞA1(U1(vA1, v∆A2)≥ U1(vΞA1, v∆A2)))

(∀vΞA2(U2(vA1, v∆A2)≥ U2(vA1, vΞA2)))

-No exemplo 2.2, Batalha dos Sexos, a estrutura de GAL GBoS (veja a figura 6.1.b) com as funções de valoração σA1 e σA2, onde σA1(vA1) = #2 3, 1 3$ e σA2(vA2) = # 1 3, 2 3$ temos que GBoS, σA1, σA2 |=   (∀vΞA1(U1(vA1, vA2) ≥ U1(vΞA1, vA2)))∧ (∀vΞA2(U2(vA1, vA2) ≥ U2(vA1, vΞA2)))   ⇐⇒def GBoS, σA1, σA2 |= ∀vΞA1(U1(vA1, vA2) ≥ U1(vΞA1, vA2)) (prova 6-3)

E GBoS, σA1, σA2 |= ∀vΞA2(U2(vA1, vA2) ≥ U2(vA1, vΞA2)) (prova 6-4)

(8)

GBoS, σA1, σA2 |= ∀vΞA1(U1(vA1, vA2) ≥ U1(vΞA1, vA2)) (6-3) ⇐⇒def ∀d1∈ {#1, 0$, #0, 1$} temos que

GBoS, σA1(vΞA1|d1), σA2 |= (U1(vA1, vA2) ≥ U1(d1, vA2)) ⇐⇒def ∀d1∈ {#1, 0$, #0, 1$} temos que

U1 ./2 3,13 0 ,/13,2301≥ U1 . d1, /1 3,23 01 ⇐⇒def U1./23,130,/13,2301 ≥ U1.#1, 0$,/13,2301 E U1./23,130,/13,2301 U1.#0, 1$,/13,2301 GBoS, σA1, σA2 |= ∀vΞA2(U2(vA1, vA2) ≥ U2(vA1, vΞA2)) (6-4) ⇐⇒def ∀d2∈ {#1, 0$, #0, 1$} temos que

GBoS, σA1, σA2(vΞA2|d2) |= (U2(vA1, vA2) ≥ U2(vA1, vΞA2)) ⇐⇒def ∀d2∈ {#1, 0$, #0, 1$} temos que

U2./23,130,/13,2301≥ U2./23,130, d21 ⇐⇒def U2./23,130,/13,2301 ≥ U2./23,130, (1, 0)1 E U2./23,130,/13,2301 U2 ./2 3,13 0 ,#0, 1$1

Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash de estratégias mistas, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.3 (página 206) do apêndice B.

Teorema 6.4 Sejam Γ um jogo estratégico, τ∗ = (τ

i) um perfil de estratégias

mistas, GΓ um estrutura de GAL para Γ como definido na seção 6.1.3, (σ∆Ai) funções de valorações de sorts (∆Ai), e α uma fórmula de equilíbrio de Nash

de estratégias mistas como definido acima.

i) é um equilíbrio de estratégias mistas em Γ

⇐⇒ GΓ, (σ∆Ai)|= α, onde cada σ∆Ai(vAi) = τi∗

(9)

6.2

Jogo Extensivo com Informação Perfeita em GAL

Abaixo serão apresentados duas versões de jogo extensivo com informa-ção perfeita em estruturas de GAL. Na primeira versão, seguimos a idéia de jogo estratégico como estrutura de GAL (seção 6.1), e cada estado é repre-sentado por um perfil de estratégias para cada jogador. Na segunda versão, apresentamos uma versão mais natural de um jogo extensivo no qual cada estado é representado por um histórico. Em ambos os casos, os conceitos de soluções de equilíbrio de Nash e de subjogo perfeito são definidos através de fórmulas de GAL.

6.2.1

Versão Matricial em GAL de Jogo Extensivo

Na primeira versão, a idéia de representar um jogo extensivo com informação perfeita2 como estrutura de GAL segue o caso de jogo estratégico

como estrutura de GAL apresentado na seção 6.1. Esta representação está relacionada a versão matricial de um jogo extensivo com informação perfeita. Assim, modelamos cada perfil de estratégias s como um estado s, no qual, para cada jogador i, um símbolo si :→ Sié utilizado para representar a estratégia do jogador i, e sua interpretação depende da estratégia si. Por exemplo, o perfil de

estratégias ##A$, #L$$ no exemplo 2.10 é mapeado no estado ##A$, #L$$, onde os símbolos s1 e s2 são as estratégias #A$ e #L$, respectivamente. Representamos

também cada conjunto das estratégias Si de cada jogador i ∈ N, o conjunto dos históricos H, o conjunto dos históricos terminais T, e o conjunto dos históricos não-terminais NT. As funções P, ui,O e Oh são definidas como

no jogo extensivo, e suas interpretações são rígidas.

Definição 6.5 Um jogo extensivo com informação perfeita Γ = #N, P, H, (ui)$

é mapeado em uma estrutura de GAL como segue. A linguagem não-lógica é definida por #S, F, P, N$

S = {(Si), H, T, N T,R}, temos um sort H para os históricos, T

para os terminais, NT para os não-terminais, R para as utilidades, e, para cada jogador i ∈ N, um sort Si.

F = {P, (ui), (si), O, Oh}, os símbolos funcionais P : NT → N, O :!i∈NSi → T , Oh : H×!i∈NSi → T , e para cada jogador i ∈ N

um símbolo si :→ Si e um símbolo funcional ui :!i∈NSi → R.

P ={≥}, um símbolo predicativo ≥: R × R.

2Para ver a definição de jogo extensivo com informação perfeita, veja a seção 2.2 (página 33).

(10)

N = N, o conjunto de jogadores de Γ.

A estrutura de GAL GΓ =#SE, SEo,CA, (DSi,DH,DT,DN T,DR)i∈N, (P, ui, si,e, O, Oh)i∈N,e∈SE, (≥), (Ne)e∈SE$, onde

SE = S, o conjunto dos estados é o conjunto dos perfis de estratégias de Γ.

SEo = S, pois nesta versão a evolução do jogo não ocorre na

estrutura temporal de GΓ.

CA = ∅, pois nesta versão a evolução do jogo não ocorre na estrutura temporal de GΓ.

Cada domínio DSi é o conjunto das estratégias Si do jogo Γ; o

domínio DH é o conjunto dos históricos de Γ; o domínio DT é o

conjunto dos históricos terminais de Γ; o domínio DN T é o conjunto

dos históricos não-terminais de Γ; o domínio DR é o conjunto de todo os possíveis valores das utilidades do jogo Γ. Note que este conjunto é finito, se o jogo for finito.

Cada símbolo si é interpretado no estado e ∈ SE como a

es-tratégia do jogador i de acordo com o perfil de eses-tratégias s = #s1, . . . , si, . . . , sn$ do jogo Γ que originou o estado e, i.e. si,e = si;

As funções P, ui, O, Oh são interpretadas de forma rígida como

as funções do jogo Γ.

O predicado ≥ é interpretado de forma rígida como no jogo Γ.

Ne =∅, pois nesta versão a evolução do jogo não ocorre na estrutura

temporal de GΓ.

Iremos utilizar um abuso de notação, e representar um jogo extensivo com informação perfeita #N, P, H, (ui)$ como a seguinte estrutura de GAL

#S, S, ∅, (Si, H, T, N T,R), (P, ui, si,s, O, Oh), (≥), ∅$ com linguagem não-lógica

#(Si, H, T, N T,R) , (P : NT → N, ui : T → R, si :→ Si, O : S → T, Oh :

H× S → T ) , (≥: R × R), N$

Abaixo apresentamos o jogo extensivo do exemplo 2.10 como uma estru-tura de GAL para jogo extensivo na versão matricial. Como esta representação é mais parecida com a forma matricial do jogo extensivo, apresentamos na fi-gura 6.2 a forma matricial deste jogo, bem como parte da estrutura de GAL definida abaixo.

Exemplo 6.6 A estrutura de GAL para o exemplo 2.10 é definida por #S, S, ∅, (S1, S2, H, T, N T,R), (P, u1, u2, s1,s, s2,s, O, Oh), ( ≥ ), ∅$ com

lin-guagem não-lógica #(S1, S2, H, T, N T,R), (P : NT → {1, 2}, u1 : S1 × S2

R, u2 : S1× S2 → R, s1 :→ S1, s2 :→ S2, O : S1× S2 → T, Oh : H× S1× S2

T ), (≥: R × R), {1, 2}$ onde

(11)

#A$ #B$ #L$ #R$ 0,0 1,2 2,1 1,2

(a) - Representação Matricial

!" #$ s1="A# s2="L# ##A$, #L$$ !" #$ s1="A# s2="R# ##A$, #R$$ !" #$ s1="B# s2="L# ##B$, #L$$ !" #$ s1="B# s2="R# ##B$, #R$$ R = {0, 1, 2} S1= {#A$, #B$}, S2= {#L$, #R$} (b)- Estrutura de GAL G6.6

Figura 6.2: Jogo extensivo do exemplo 2.10 S = {##A$, #L$$, ##A$, #R$$, ##B$, #L$$, ##B$, #R$$}. S1 ={#A$, #B$} e S2 ={#L$, #R$}.

H = {∅, (A), (B), (A, L), (A, R)}. T = {(B), (A, L), (A, R)}. NT = {∅, (A)}. R = {0, 1, 2}. P(∅) = 1 e P((A)) = 2. s1,""A#,"L## = A, s1,""A#,"R## = A, s1,""B#,"L## = B, s1,""B#,"R##= B s2,""A#,"L## = L, s2,""A#,"R## = R, s2,""B#,"L## = L, s2,""B#,"R##= R.

O(#A$, #L$) = (A, L), O(#A$, #R$) = (A, R), O(#B$, #L$) = (B), O##B$, #R$$ = (B).

Oh(∅, #A$, #L$) = (A, L), Oh((A),#A$, #L$) = (A, L),

Oh((A, L),#A$, #L$) = (A, L), Oh((A, R),#A$, #L$) = (A, R),

Oh((B),#A$, #L$) = (B), Oh(∅, #A$, #R$) = (A, R),

Oh((A),#A$, #R$) = (A, R), Oh((A, L),#A$, #R$) = (A, L),

Oh((A, R),#A$, #R$) = (A, R), Oh((B),#A$, #R$) = (B),

Oh(∅, #B$, #L$) = (B, L), Oh((A),#B$, #L$) = (A, L),

Oh((A, L),#B$, #L$) = (A, L), Oh((A, R),#B$, #L$) = (A, R), Oh((B),#B$, #L$) = (B), Oh(∅, #B$, #R$) = (B, R),

Oh((A),#B$, #R$) = (A, R), Oh((A, L),#B$, #R$) = (A, L), Oh((A, R),#B$, #R$) = (A, R), Oh((B),#B$, #R$) = (B). u1((B)) = 1, u1((A, L)) = 0, u1((A, R)) = 2

u2((B)) = 2, u2((A, L)) = 0, u2((A, R)) = 1

(12)

6.2.2

Fórmula de Equilíbrio de Nash para a Versão Matricial

A representação de equilíbrio de Nash para jogo extensivo é similar ao caso de equilíbrio de Nash para jogo estratégico apresentada na seção 6.1.1. A fórmula de equilíbrio de Nash para jogo extensivo na versão matricial é definida da seguinte forma.

Sejam (vSi)variáveis de sorts (Si). "

i∈N∀v

Si(ui(O(s1, . . . , sn))≥ ui(O(s1, . . . , vSi, . . . , sn)))

A fórmula de equilíbrio de Nash para um jogo com dois jogadores, como no exemplo 6.6, é definida da seguinte forma.

∀vS1(u1(O(s1, s2))≥ u1(O(vS1, s2)))∧ ∀vS2(u2(O(s1, s2))≥ u2(O(s1, vS2)))

Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita nos estados

##A$, #R$$ e ##B$, #L$$. Desta forma, temos que

G6.6 |=""A#,"R##∀vS1(u1(O(s1, s2))≥ u1(O(vS1, s2)))∧∀vS2(u2(O(s1, s2))≥ u2(O(s1, vS2)))

G6.6 |=""B#,"L##∀vS1(u1(O(s1, s2))≥ u1(O(vS1, s2)))∧∀vS2(u2(O(s1, s2))≥ u2(O(s1, vS2)))

Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.2.1 (página 207) do apêndice B.

Teorema 6.7 Sejam Γ um jogo extensivo com informação perfeita, s∗ = (s i)

um perfil de estratégias para Γ, GΓ uma estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, e α uma fórmula de equilíbrio de Nash para GΓ como definido acima.

Um perfil de estratégias s∗ é um equilíbrio de Nash para Γ ⇐⇒ G

Γ |=s∗ α

6.2.3

Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Matricial A idéia de representar equilíbrio de subjogo perfeito para jogo extensivo na versão matricial é similar ao caso de representar equilíbrio de Nash para jogo estratégico apresentada na seção 6.1.1. A fórmula de equilíbrio de subjogo perfeito para jogo extensivo na versão matricialé definida da seguinte forma.

(13)

Sejam vN T uma variável de sort NT , e (vSi) variáveis de sorts (Si). ∀vN T # " i∈N P (vN T) = i→ ∀vSi(ui(Oh(vN T, s1, . . . , sn))≥ ui(Oh(vN T, s1, . . . , vSi, . . . , sn))) $

A fórmula de equilíbrio de subjogo perfeito para um jogo com dois jogadores, como no exemplo 6.6, é definida da seguinte forma.

∀vN T ,

(P (vN T) = 1→ ∀vS1(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, vS1, s2))))

(P (vN T) = 2→ ∀vS2(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, s1, vS2))))

-Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita no estado

##A$, #R$$. Desta forma, temos que G6.6 |=""A#,"R##∀vN T

,

(P (vN T) = 1 → ∀vS1(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, vS1, s2))))

(P (vN T) = 2 → ∀vS2(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, s1, vS2))))

-Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de subjogo perfeito, tal como descrito acima. A prova do mesmo é encontrada na seção B.2.2 (página 208) do apêndice B.

Teorema 6.8 Sejam Γ um jogo extensivo com informação perfeita, s∗ = (s i)

um perfil de estratégias para Γ, GΓ uma estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, e α uma fórmula de equilíbrio de subjogo perfeito para GΓ como definido acima.

Um perfil de estratégias s∗ é um equilíbrio de subjogo perfeito para Γ

⇐⇒ GΓ |=s∗ α

6.2.4

Versão Extensiva em GAL de Jogo Extensivo

Podemos modelar um jogo extensivo com informação perfeita Γ =

#N, H, P, (ui)$ em GAL de uma forma mais intuitiva, onde a estrutura de GAL é representada pela sua forma extensiva. Cada histórico h ∈ H (do jogo extensivo) é representado por um estado h, no qual o símbolo h :→ H denota o histórico h, que originou o estado, do jogo extensivo Γ. O conjunto de ações da estrutura de GAL é determinado pelas ações a partir de cada histórico não-terminal. A função P determina o jogador que faz a escolha a cada estado, i.e. Nh ={P (h)}. Os conjuntos das estratégias (Si) dos jogadores, e ainda as funções O e Oh, são definidos na estrutura de GAL, e têm suas interpretações rígidas definidas como no jogo extensivo Γ. Formalmente, temos a definição abaixo.

(14)

Definição 6.9 Um jogo extensivo Γ = #N, H, P, (ui)$ é mapeado em uma estrutura de GAL na versão extensiva como segue.

A linguagem não-lógica é definida por #S, F, P, N$, onde

S = {H, T, (Si),R}, temos o sort H para os históricos, T para os

históricos terminais, o sort R para as utilidades e, para cada jogador i∈ N, um sort Si.

F = {h, (ui), O, Oh}, temos os símbolos funcionais O : !i∈NSi

T, Oh : H×!i∈NSi → T , o símbolo h :→ H, e, para cada jogador

i∈ N, um símbolo funcional ui : T → R.

P ={≥}, um símbolo predicativo ≥: R × R.

N = N, o conjunto de jogadores de Γ.

A estrutura de GAL GΓ =#SE, SEo,CA, (DSi,DH,DR)i∈N, (he, ui, O, Oh)i∈N,e∈SE, (≥), (Ne)e∈SE$, onde

SE = H, o conjunto dos estados é o conjunto dos históricos de Γ.

SEo = {∅}, o estado inicial é o estado representado pelo histórico

∅.

Para todo histórico h de Γ e toda ação a ∈ A(h) tal que (h, a) ∈ H, temos que #h, (h, a)$ ∈ CA.

Cada domínio DSi é o conjunto das estratégias Si do jogador i de Γ; o domínio DH é o conjunto dos históricos de Γ; o domínio DT é

o conjunto dos históricos terminais de Γ; e, finalmente, o domínio DR é o conjunto de todos os possíveis valores das utilidades de Γ. Perceba que este conjunto é finito, se o jogo é finito.

O símbolo h é interpretado no estado e ∈ SE como o histórico h do jogo Γ que originou o estado e, i.e. he = h; As funções ui, O, Oh

são interpretadas rigidamente como as funções do jogo Γ.

O predicado ≥ é interpretado de forma rígida como no jogo Γ.

Ne = {P (h)}, a função P do jogo Γ determina qual jogador toma

uma decisão no estado e ∈ SE, onde o estado e foi originado do histórico h.

Iremos utilizar um abuso de notação e representar um jogo extensivo Γ = #N, P, H, (ui)$ como a seguinte estrutura de GAL #H, Ho,CA, (H, T, Si,R), (hh, ui, O, Oh), ( ≥ ),(Nh)$ com linguagem não-lógica #(H, T, Si,R) , (h :→ H, ui : T → R, O : S → T, Oh : H × S → T )

, (≥: R × R), N$.

Abaixo apresentamos o jogo extensivo do exemplo 2.10 como estrutura de GAL para jogo extensivo na versão extensiva. Na figura 6.3, apresentamos

(15)

0,0 2,1 1,2 A B L R % 1 ! ! !!" # # # # $ % 2 ! !!" # # # $

(a) - Representação Extensiva (b) - Estrutura de GAL G6.10

& ' ( ) h = {1} % % % & '''( & ' ( ) h = (A) {2} ) ) ) ) * ++++, (B) (A) & ' ( ) h = (A, L) {} (A, L) (A, R) & ' ( ) h = (A, R) {} & ' ( ) h = (B) {} S1= {#A$, #B$}, S2= {#L$, # R$}, R = {0, 1, 2} H ={∅, (A), (B), (A, L), (A, R)}

T ={(B), (A, L), (A, R)}

Figura 6.3: Exemplo 2.10.

a forma extensiva deste jogo, bem como parte da estrutura de GAL definida abaixo.

Exemplo 6.10 A estrutura de GAL para o exemplo 2.10 é definido por #H, Ho,CA, (H, T, S1, S2,R), (hh, u1, u2, O, Oh), ( ≥ ), (Nh)$ com linguagem

não-lógica #(H, T, S1, S2,R), (h :→ H, u1 : T → R, u2 : T → R, O : S1× S2 T, Oh : H× S1× S2 → T ), (≥: R × R), {1, 2}$ onde

H = {∅, (A), (B), (A, L), (A, R)}.

Ho ={∅}.

CA = {#∅, (A)$, #∅, (B)$, #(A), (A, L)$, #(A), (A, R)$}. S1 ={#A$, #B$} e S2 ={#L$, #R$}.

T = {(B), (A, L), (A, R)}. R = {0, 1, 2}.

h =∅, h(A) = (A), h(B) = (B), h(A,L) = (A, L), h(A,R)= (A, R).

O(#A$, #L$) = (A, L), O(#A$, #R$) = (A, R), O(#B$, #L$) = (B), O(#B$, #R$) = (B).

Oh(∅, #A$, #L$) = (A, L), Oh((A),#A$, #L$) = (A, L),

Oh((A, L),#A$, #L$) = (A, L), Oh((A, R),#A$, #L$) = (A, R), Oh((B),#A$, #L$) = (B), Oh(∅, #A$, #R$) = (A, R),

Oh((A),#A$, #R$) = (A, R), Oh((A, L),#A$, #R$) = (A, L), Oh((A, R),#A$, #R$) = (A, R), Oh((B),#A$, #R$) = (B),

Oh(∅, #B$, #L$) = (B, L), Oh((A),#B$, #L$) = (A, L),

Oh((A, L),#B$, #L$) = (A, L), Oh((A, R),#B$, #L$) = (A, R),

Oh((B),#B$, #L$) = (B), Oh(∅, #B$, #R$) = (B, R),

(16)

Oh((A),#B$, #R$) = (A, R), Oh((A, L),#B$, #R$) = (A, L), Oh((A, R),#B$, #R$) = (A, R), Oh((B),#B$, #R$) = (B).

u1((B)) = 1, u1((A, L)) = 0, u1((A, R)) = 2

u2((B)) = 2, u2((A, L)) = 0, u2((A, R)) = 1

N∅ ={1}, N(A) ={2}, N(B) = N(A,L) = N(A,R) ={}

6.2.5

Fórmula de Equilíbrio de Nash para a Versão Extensiva

Nesta versão a representação de equilíbrio de Nash difere da fórmula de equilíbrio de Nash apresentada na seção 6.2.2. Como em cada estado não fazemos referência as estratégias dos jogadores (não existem símbolos em cada mundo para representá-los), utilizamos variáveis livres para caracterizar equilíbrio de Nash. Assim, a fórmula de equilíbrio de Nash, que tem variáveis livres (v∗

Si), uma para cada jogador i, é um equilíbrio de Nash se, e somente se, existem funções de valorações (σSi) que tornam a fórmula verdadeira.

Sejam Γ um jogo extensivo com informação perfeita, GΓ uma estrutura

de GAL para Γ como definido em 6.2.4, (v∗

Si) variáveis de sorts (Si) e (vSi) variáveis de sorts (Si). Uma fórmula de equilíbrio de Nash para GΓ é

definida como segue.

" i∈N∀vSi . ui(O(v∗S1, . . . , v Sn))≥ ui(O(v S1, . . . , vSi, . . . , v Sn)) 1

Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de Nash verdadeira para as funções de valorações σS1 e σS2, onde σS1(v∗S1) = #A$ e

σS2(v∗S2) = #R$. G6.10, σS1, σS2 |= , ∀vS1 . u1(O(v∗ S1, v S2))≥ u1(O(vS1, vS∗2)) 1 ∀vS2 . u2(O(v∗S1, v∗S2))≥ u2(O(vS1, vS2)) 1

-O mesmo ocorre quando as funções de valoração σS1 e σS2 atribuem #B$

e #L$, respectivamente, ou seja, σS1(vS∗1) =#B$ e σS2(vS∗2) =#L$.

Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.3.1 (página 210) do apêndice B.

Teorema 6.11 Sejam Γ um jogo extensivo com informação perfeita, s∗ = (s i)

um perfil de estratégias para Γ, GΓ uma estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, (σSi)funções de valorações de sorts (Si),

e α uma fórmula de equilíbrio de Nash para GΓ como definido acima.

(17)

Um perfil de estratégias (s∗

i) é um equilíbrio Nash para Γ

⇐⇒ GΓ, (σSi)|= α, onde cada σSi(vS∗i) = s i

6.2.6

Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Extensiva A idéia para representar equilíbrio de subjogo perfeito segue a idéia da seção 6.2.5, onde utilizamos variáveis livres para caracterizar equilíbrio de Nash. O argumento utilizado é semelhante, pois não temos símbolos para representar as estratégias a cada estado. Assim, a fórmula de equilíbrio de subjogo perfeito, que tem variáveis livres (v∗

Si), uma para cada jogador i ∈ N, é um equilíbrio de subjogo perfeito se e somente se existem funções de valorações (σSi) que satisfazem a fórmula a partir do estado inicial ∅ (i.e. em todos os subjogos).

Sejam Γ um jogo extensivo com informação perfeita, e GΓ uma estrutura

de GAL como definido na seção 6.2.4, e (vSi) variáveis de sorts (Si) e (v∗Si) variáveis de sorts (Si). Uma fórmula de equilíbrio de subjogo perfeito para GΓ é definida como segue.

[AG] # " i∈N i→ ∀vSi . ui(Oh(h, vS1, . . . , v∗Sn))≥ ui(Oh(h, vS1, . . . , vSi, . . . , v Sn)) 1$

Note que a fórmula interna ao operador modal [AG] representa que se um jogador tem que tomar uma decisão, então está é ótima no subjogo do histórico h, levando em consideração as estratégias dos outros jogadores. O operador modal [AG] aplicado a esta fórmula representa que cada decisão de cada jogador em cada subjogo é ótima.

Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de subjogo perfeito satisfeita no histórico inicial com as funções de valorações σS1 e σS2,

onde σS1(vS∗1) = #A$ e σS2(vS∗2) =#R$. G6.10, σS1, σS2 |=∅ [AG] , 1→ ∀vS1 . u1(Oh(h, v∗S1, v∗S2))≥ u1(Oh(h, vS1, v∗S2)) 1 2→ ∀vS2 . u2(Oh(h, v∗ S1, v S2))≥ u2(Oh(h, v S1, vS2)) 1

-Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de subjogo perfeito, tal como descrito acima. A prova do mesmo é encontrada na seção B.3.2 (página 211) do apêndice B.

Teorema 6.12 Sejam Γ um jogo extensivo com informação perfeita, s∗ = (s i)

um perfil de estratégias para Γ, GΓ uma estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, (σSi)funções de valorações de sorts (Si),

e α uma fórmula de equilíbrio de subjogo perfeito para GΓ como definido acima.

(18)

Um perfil de estratégias (s∗

i) é um equilíbrio de subjogo perfeito para Γ

⇐⇒ GΓ, (σSi)|=∅ α, onde cada σSi(vS∗i) = s i

6.2.7

Quantificando em Jogos Extensivos

Nesta seção, iremos nos focar nas definições de equilíbrio de Nash (EN) e equilíbrio de subjogo perfeito (ESP) para jogos extensivos com informação perfeita, com o intuito de analisarmos as diferentes formas de quantificação. Para tal análise, iremos utilizar as definições de jogos extensivos em GAL na versão matricial e na versão extensiva.

O conceito de solução de EN requer que a estratégia de cada jogador seja ótima, dadas as estratégias dos outros jogadores. O conceito de solução de ESP requer que a estratégia de cada jogador seja ótima em cada instante do jogo, dadas as estratégias dos outros jogadores. Na definição do conceito de ESP, temos uma descrição explícita da estrutura do jogo, enquanto que em EN a estrutura do jogo não é referenciada. As definições de EN para jogos extensivos desconsideram, assim, a estrutura do jogo. Podemos ver isto bem claramente na citação abaixo do livro A course in Game Theory, que é um dos livros mais citados de Teoria dos Jogos.

“The first solution concept [nash equilibrium] we define for an extensive

game ignores the sequential structure of the games; it treats the strategies as choices that are made once and for all before play begins.”(OR94, pages 93)

Iremos demonstrar que isto não é verdadeiro, ou seja, que o conceito de equilíbrio de Nash para jogos extensivos considera a estrutura seqüencial do jogo. Iremos nesta seção caracterizar EN através da estrutura do jogo. Dito de forma simples, o conceito de EN para um jogo extensivo requer que as estratégias sejam ótimas no caminho que ocorre quando cada jogador segue a sua estratégia, desconsiderando assim a racionalidade dos jogadores nos históricos que não ocorrem neste caminho. Na verdade, veremos em seções posteriores que tal caracterização é também válida para jogos com informação imperfeita e quase perfeita.

Alguns autores (FT91, Ros06) comentam, a exemplo da citação abaixo, sobre o conceito de caminho no conceito de equilíbrio de Nash, porém suas definições formais são apresentadas da forma usual.

“We also saw that some of these Nash Equilibria may rely on “empty

threats” of suboptimal play at histories that are not expected to occur - that is, at histories off the path of the equilibrium.”(FT91, pages 72)

Vejamos o exemplo apresentado na figura 6.4 abaixo. Em Teoria dos Jogos, costuma-se dizer que a solução ##B$, #R$$, que é um equilíbrio de Nash,

(19)

não é razoável na medida em que se o jogador 2 tiver que tomar uma decisão no histórico não-terminal (A), então ele obterá uma melhor utilidade caso mude sua estratégia para #L$, obtendo uma utilidade de 3 ao invés de 1, que é o equilíbrio. Assim, ele tem um incentivo para desviar do equilíbrio. Apesar disso ser usualmente aceito pelos teóricos de jogos, argumentamos que se os jogadores racionalizam suas estratégias somente ao longo do histórico terminal, que resultará das estratégias escolhidas, então o conceito de equilíbrio de Nash é razoável.

A caracterização do conceito de EN, como acima exposto, parece mais relacionada a visão dos conceitos soluções como uma descrição do compor-tamento de agentes racionais (ou humanos), enquanto que a interpretação do conceito de ESP a uma prescrição ou conselho para os jogadores em como agir. Voltemos ao exemplo da figura 6.4 para demonstrar que a solução

##B$, #R$$ é razoável quando os jogadores racionalizam como acima exposto.

Para vermos isto, considere que o jogador 1 tenha escolhido a ação B no histórico inicial, então o jogo alcançará o estado terminal (B), e o jogo estará terminado. Notemos que se o jogador 2 não for racional nos históricos que não são alcançados ao longo do histórico terminal (B), então ele pode tomar a estratégia #R$, que resultará em uma utilidade pior para o jogador 1, tornando assim a escolha da estratégia #B$ melhor do que a estratégia #A$. Desta forma, os jogadores racionalizam ao longo dos históricos ∅ e (B), que são os históricos que ocorrem a partir do perfil de estratégias ##B$, #R$$.

L R

A 3,2 1,1 B 2,1 2,1

(a) - Representação Extensiva (b) - Representação Matricial 3, 2 1, 1 2, 1 A B L R % 1 ! ! !!" # # # # $ % 2 ! !!" # # # $

Figura 6.4: Exemplo de um jogo extensivo.

Estamos argumentando o seguinte: o critério de racionalidade sobre os históricos, que nunca são alcançáveis, não é condição necessária para que uma solução seja considerada razoável. No exemplo da figura 6.5 abaixo, que é um jogo de soma zero3, isto fica ainda mais aparente, pois neste caso temos

duas soluções de EN: ##B$, #L$$ e ##B$, #R$$. Ambos os perfis de estratégias 3Jogo de soma zero é um jogo que um jogador ganha e o outro perde, a exemplo do xadrez e do jogo da velha.

(20)

conduzem a mesma solução, que é o histórico terminal (B). Assim, o jogador 2 é indiferente à estratégia adotada no histórico (A), uma vez que este histórico nunca será alcançado.

L R

A 1,-1 -1,1 B 1,-1 1,-1

(a) - Representação Extensiva (b) - Representação Matricial

1,−1 −1, 1 1,−1 A B L R % 1 ! ! !!" # # # # $ % 2 ! !!" # # # $

Figura 6.5: Exemplo de um jogo extensivo de soma zero.

Agora voltemos as considerações sobre as definições de equilíbrio de Nash e de subjogo perfeito para jogo extensivo com informação perfeita. As definições 6.13 e 6.14 são relativas a equilíbrio de subjogo perfeito, enquanto que as definições 6.15 e 6.16 são relativas a equilíbrio de Nash. Note o enfoque em negrito dado a quantificação das estratégias. Iremos caracterizar estas definições através de fórmulas de GAL para a versão matricial e a versão extensiva. As definições abaixo quantificam sobre os caminhos de um jogo extensivo. Embora não possamos expressar de uma forma direta o conceito de caminho na versão matricial, uma vez que não temos operadores sobre caminhos, podemos tentar simulá-lo através de uma quantificação universal sobre os históricos.

Definição 6.13 (Versão De Dicto) Um equilíbrio de subjogo perfeito para um jogo extensivo com informação perfeita #N, H, P, (ui)$ é um perfil de

estratégias s∗tal que para todo jogador i ∈ N e para todo histórico não-terminal

h∈ H para o qual P (h) = i, temos que

ui(Oh(h, s∗1, . . . , s∗n))≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n))

para toda estratégia si ∈ Si.

Definição 6.14 (Versão De Re) Um equilíbrio de subjogo perfeito para um jogo extensivo com informação perfeita #N, H, P, (ui)$ é um perfil de estratégias s∗ tal que para todo jogador i ∈ N, para toda estratégia s

i ∈ Si

e para todo histórico não-terminal h ∈ H para o qual P (h) = i, temos que ui(Oh(h, s∗1, . . . , s∗n)) ≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n)).

(21)

Definição 6.15 (Versão De Dicto) Um equilíbrio de Nash para um jogo extensivo com informação perfeita Γ = #N, H, P, (ui)$ é um perfil de estratégias

s∗ tal que para todo jogador i e para todo histórico não-terminal h ∈ H ao longo

do histórico terminal que resulta do perfil de estratégias s∗ (i.e. h ∈ O(s)) para

o qual P (h) = i, temos que

ui(Oh(h, s∗1, . . . , s∗n))≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n)),

para toda estratégia si ∈ Si.

Definição 6.16 (Versão De Re) Um equilíbrio de Nash para um jogo extensivo com informação perfeita Γ = #N, H, P, (ui)$ é um perfil de estratégias

s∗ tal que para todo jogador i, para toda estratégia s

i ∈ Si e para todo

histórico não-terminal h ∈ H ao longo do histórico terminal que resulta do perfil de estratégias s∗ (i.e. h ∈ O(s)) para o qual P (h) = i, temos que

ui(Oh(h, s∗1, . . . , s∗n))≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n)).

A definição 6.13 foi caracterizada na versão matricial na seção 6.2.3 como a fórmula 6-5 abaixo; e na versão extensiva na seção 6.2.6 como a fórmula 6-6 abaixo. ∀vN T # " i∈N P (vN T) = i→ ∀vSi(ui(Oh(vN T, s1, . . . , sn))≥ ui(Oh(vN T, s1, . . . , vSi, . . . , sn))) $ (6-5) [AG] # " i∈N i→ ∀vSi . ui(Oh(h, vS∗1, . . . , v Sn))≥ ui(Oh(h, v S1, . . . , vSi, . . . , v Sn)) 1$ (6-6) A fórmula 6-6 equivale a fórmula 6-8 abaixo devido a equivalência entre a quantificação universal De Re e De Dicto do operador [AG] (veja a seção 5.1.1). As fórmulas 6-7 e 6-8 caracterizam a definição 6.14. Por outro lado, a fórmula 6-5 equivale a fórmula 6-7 abaixo, pois a quantificação universal sobre cada estratégia pode ser colocada anteriormente à quantificação universal sobre os históricos não-terminais, uma vez que eles quantificam sobre domínios diferentes. Assim, do ponto de vista da representação matricial e extensiva, as definições 6.13 e 6.14 são equivalentes.

(22)

∀vS1. . .∀vSn∀vN T #" i∈N P (vN T) = i → (ui(Oh(vN T, s1, . . . , sn))≥ ui(Oh(vN T, s1, . . . , vSi, . . . , sn))) $ (6-7) ∀vS1. . .∀vSn[AG] # " i∈N i→.ui(Oh(h, v∗S1, . . . , vSn))≥ ui(Oh(h, v∗S1, . . . , vSi, . . . , vS∗n)) 1$ (6-8)

Para ilustrar, considere novamente o exemplo da figura 6.4 (página 128). A fórmula abaixo caracteriza equilíbrio de subjogo perfeito para a versão matricial e é satisfeita apenas no estado ##A$, #L$$.

GΓ |=""A#,"L##∀vN T ,

(P (vN T) = 1→ ∀vS1(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, vS1, s2))))

(P (vN T) = 2→ ∀vS2(u1(Oh(vN T, s1, s2))≥ u1(Oh(vN T, s1, vS2))))

-Na versão extensiva, a fórmula de equilíbrio de subjogo perfeito abaixo é satisfeita apenas para as funções de valorações σS1 e σS2, onde σS1(v∗S1) = #A$

e σS2(vS∗2) =#L$. GΓ, σS1, σS2 |=∅ [AG] , 1→ ∀vS1 . u1(Oh(h, vS∗1, v S2))≥ u1(Oh(h, vS1, vS∗2)) 1 2→ ∀vS2 . u2(Oh(h, vS1, vS2))≥ u2(Oh(h, vS1, vS2)) 1

-Agora iremos caracterizar a definição 6.15 como fórmulas de GAL para a versão matricial e para a versão extensiva. Esta definição supõe que os jogadores têm suas racionalidades limitadas no sentido que eles só racionalizam suas estratégias ao longo dos históricos não-terminais resultantes das suas estratégias, desconsiderando assim a racionalidade nos outros pontos do jogo. Esta solução difere de equilíbrio de subjogo perfeito na medida em que ela considera apenas parte dos subjogos, e não todos como no caso de subjogo perfeito.

Na versão matricial não temos como expressar o conceito de caminho, então a fórmula de equilíbrio de Nash é definida através de uma quantifica-ção universal sobre os históricos não-terminais, no entanto, considerando as racionalidades dos jogadores somente nos históricos que resultam quando cada jogador segue sua estratégia. A caracterização é como segue abaixo.

(23)

∀vN T    vN T ∈ O(s1, . . . , sn) → # " i∈N P (vN T) = i → ∀vSi(ui(Oh(vN T, s1, . . . , sn)) ≥ ui(Oh(vN T, s1, . . . , vSi, . . . , sn))) $    (6-9)

Um perfil de estratégias s é um equilíbrio de Nash se, e somente se, a fórmula 6-9 é satisfeita no estado que representa este perfil de estratégias. Mais a frente iremos demonstrar que esta fórmula caracteriza equilíbrio de Nash.

Por outro lado, na versão extensiva temos como expressar caminho através do operador [EG]. Dito isto, a caracterização é como segue.

[EG]    h∈ O(v S1, . . . , v Sn) # " i∈N i→ ∀vSi . ui(Oh(h, vS∗1, . . . , v Sn))≥ ui(Oh(h, v S1, . . . , vSi, . . . , v∗Sn)) 1$    (6-10) Um perfil de estratégias s = (si) é um equilíbrio de Nash se, e somente se, a fórmula 6-10 é satisfeita no histórico inicial ∅, onde cada σSi(vS∗i) = si. Mais a frente iremos demonstrar que esta fórmula caracteriza equilíbrio de Nash.

Para ilustrar, considere novamente o exemplo da figura 6.4 (página 128). A fórmula que caracteriza equilíbrio de Nash para a versão matricial é satisfeita no estado ##A$, #L$$ e no estado ##B$, #R$$. Assim, temos que

GΓ |=""A#,"L##∀vN T     vN T ∈ O(s1, s2) → , (P (vN T) = 1 → ∀vS1(u1(Oh(vN T, s1, s2)) ≥ u1(Oh(vN T, vS1, s2))))∧ (P (vN T) = 2 → ∀vS2(u1(Oh(vN T, s1, s2)) ≥ u1(Oh(vN T, s1, vS2)))) -    GΓ |=""B#,"R##∀vN T     vN T ∈ O(s1, s2) → , (P (v N T) = 1 → ∀vS1(u1(Oh(vN T, s1, s2)) ≥ u1(Oh(vN T, vS1, s2))))∧ (P (vN T) = 2 → ∀vS2(u1(Oh(vN T, s1, s2)) ≥ u1(Oh(vN T, s1, vS2)))) -   

Na versão extensiva a fórmula de equilíbrio de Nash é satisfeita no histórico inicial quando: σS1(vS∗1) = #A$ e σS2(v∗S2) = #L$; σS1(vS∗1) = #B$ e σS2(v∗S2) =

#R$. Assim, temos que GΓ, σS1,σS2|=∅ [EG] , h∈O(vS∗1, v S2) , 1→ ∀vS1 . u1(Oh(h, v∗S1, vS2))≥ u1(Oh(h, vS1, vS∗2)) 1 2→ ∀vS2 . u2(Oh(h, v∗ S1, v S2))≥ u2(Oh(h, v S1, vS2)) 1

--A fórmula 6-9 equivale a fórmula 6-11 abaixo, pois a quantificação universal sobre cada estratégia pode ser colocada anteriormente à quantificação universal sobre os históricos não-terminais, uma vez que eles quantificam sobre domínios diferentes.

Mostramos na seção 5.1.1 que, para a quantificação universal do operador

(24)

[EG], temos que De Dicto implica em De Re. Assumindo que a fórmula 6-10 (a prova será apresentada a seguir) representa EN, temos que se uma solução é um EN, então ela satisfaz a fórmula 6-10 (versão De Dicto). Daí, usando a implicação de De Dicto em De Re, temos que esta solução também satisfaz a fórmula 6-12 (versão De Re). Por outro lado, não temos que De Re implica

De Dicto, assim uma solução pode satisfazer a fórmula 6-12 (versão De Re)

e não satisfazer a fórmula 6-10 (versão De Dicto), ou seja, a solução pode não ser um EN. Como conseqüência, a fórmula 6-12 (versão De Re) parece não definir o conceito de EN. Contudo, isto não ocorre. A justificativa é que o operador [EG] não está escolhendo um caminho qualquer, e sim o caminho definido pelas estratégias. Resumidamente, temos que ambas as fórmulas 6-10 e 6-12 representam o conceito de EN.

∀vS1. . .∀vSn∀vN T    vN T ∈ O(s1, . . . , sn) → # " i∈N P (vN T) = i → (ui(Oh(vN T, s1, . . . , sn)) ≥ ui(Oh(vN T, s1, . . . , vSi, . . . , sn))) $    (6-11) ∀vS1. . .∀vSn[EG]    h∈ O(v S1, . . . , vS∗n) # " i∈N i.ui(Oh(h, vS∗1, . . . , v∗Sn)) ≥ ui(Oh(h, (v S1, . . . , vSi, . . . , v∗Sn))) 1$    (6-12)

Uma última observação se faz necessária: as fórmulas a seguir são semel-hantes as fórmulas que caracterizam EN, contudo, as mesmas não restringem a racionalidade a apenas os históricos no caminho das estratégias, e sim a qual-quer caminho a partir do histórico inicial. Para os exemplos 6.5 e 6.4 as soluções de EN coincidem. Daí, surge a questão: essas fórmulas representam EN? No exemplo do dilema do prisioneiro apresentado na figura 6.6 abaixo, vemos que estas fórmulas não representam EN, uma vez que as soluções ##C$, #NC, C$$ e

##NC$, #C, NC$$ são satisfeitas na estrutura de GAL que representa este jogo.

De fato, em EN, a racionalidade está limitada aos históricos que ocorrem no caminho das estratégias, e não a qualquer caminho. Para ver que a solução

##C$, #NC, C$$ é um ‘falso’ EN veja que no estado inicial, onde o jogador

1 toma uma decisão, a melhor coisa a fazer é escolher C, pois ele obterá 4 em vez de 0. Por outro lado, no estado que representa o histórico (NC), a melhor escolha para o jogador 2 é C, pois ele obterá 4 ao invés de 3, caso ele escolhesse NC. Assim, temos que os caminhos ∅, (NC), (NC, NC) e ∅, (NC), (NC, C) validam a solução. Contudo, vale observar, como dito acima, que estes caminhos não são o caminho que, de fato, ocorre, que é

(25)

∅, (C), (C, NC). Em outras palavras, a racionalidade do jogador 2 é testada no

estado (NC) e não no estado que, de fato, ocorre (C). De forma semelhante, podemos demonstrar que a solução ##NC$, #C, NC$$ não é um EN.

[EG]# " i∈N i→ ∀vsi . ui(Oh(h, v∗ s1, . . . , v sn))≥ ui(Oh(h, (v s1, . . . , vsi, . . . , vs∗n))) 1$ (6-13) ∀vs1. . .∀vsn[EG] # " i∈N i→.ui(Oh(h, vs1, . . . , vsn))≥ ui(Oh(h, (vs1, . . . , vsi, . . . , vs∗n))) 1$ (6-14) #C$ #NC$ #C, C$ #C, NC$ #NC, C$ #NC, NC$ 2,2 2,2 4,0 4,0 0,4 3,3 0,4 3,3

(a) - Jogo Estratégico (b) - Jogo Extensivo

2,2 4,0 0,4 3,3 C NC C NC C NC % 1 ! ! !!" # # # # $ % 2 ! !!" # # # $ % 2 ! !!" # # # $

Figura 6.6: Dilema do Prisioneiro na versão extensiva com informação perfeita.

Concluímos por dizer que as alternativas de quantificação De Re e De

Dicto para os principais conceitos de soluções, equilíbrio de Nash e equilíbrio

de subjogo perfeito, para jogos extensivos são equivalentes.

Apresentamos abaixo os teoremas que garantem os mapeamentos de equilíbrio de Nash e equilíbrio de subjogo perfeito como descrito nesta seção. As provas dos mesmos são encontradas, respectivamente, nas seções B.4.2 e B.4.3 (páginas 215 e 217) do apêndice B. Fundamental, para tais provas é o lema apresentado a seguir que garante a correção das definições de equilíbrio de Nash 6.15 e 6.16, cuja prova é encontrada na seção B.4.1 (página 214) do apêndice B.

Lema 6.2.7 As seguintes asserções são equivalentes.

1. Para todo jogador i N temos que ui(O(s∗

1, . . . , s∗n))

ui(O(s∗1, . . . , si, . . . , s∗n)) para todo si ∈ Si.

2. Para todo h ∈ O(s∗

1, . . . , s∗n) para o qual P (h) = i vale que

ui(Oh(h, s∗1, . . . , s∗n))≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n))para todo si ∈ Si.

3. Para todo si ∈ Si e para todo h ∈ O(s∗1, . . . , s∗n) para o qual P (h) = i vale que ui(Oh(h, s∗1, . . . , s∗n))≥ ui(Oh(h, s∗1, . . . , si, . . . , s∗n)).

(26)

Teorema 6.17 Sejam Γ um jogo extensivo, s∗ = (s

i) um perfil de estratégias

para Γ, GΓ a estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, α1 a fórmula 6-9 de equilíbrio de Nash na versão De Dicto, α2 a fórmula 6-11 de equilíbrio de Nash na versão De Re, β1 a fórmula 6-5 de equilíbrio de subjogo perfeito na versão De Dicto, e β2 a fórmula 6-7 de equilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s∗ é um EN para Γ ⇐⇒ GΓ|= s∗ α1.

2. Um perfil de estratégias s∗ é um EN para Γ ⇐⇒ GΓ|= s∗ α2.

3. Um perfil de estratégias s∗ é um ESP para Γ ⇐⇒ GΓ |= s∗ β1.

4. Um perfil de estratégias s∗ é um ESP para Γ ⇐⇒ GΓ |= s∗ β2.

Teorema 6.18 Sejam Γ um jogo extensivo, s∗ = (s

i) um perfil de estratégias

para Γ, GΓ a estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, α1 a fórmula 6-10 de equilíbrio de Nash na versão De Dicto, α2 a fórmula 6-12 de equilíbrio de Nash na versão De Re, β1 a fórmula 6-6 de equilíbrio de subjogo perfeito na versão De Dicto, e β2 a fórmula 6-8 de equilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s∗ é um EN para Γ ⇐⇒ GΓ, (σ

Si) |=∅ α1, onde

cada σSi(vS∗i) = s i.

2. Um perfil de estratégias s∗ é um EN para Γ ⇐⇒ GΓ, (σ

Si) |=∅ α1, onde

cada σSi(vS∗i) = s i.

3. Um perfil de estratégias s∗ é um ESP para Γ ⇐⇒ GΓ, (σ

Si)|=∅ β1, onde

cada σSi(vS∗i) = s i.

4. Um perfil de estratégias s∗ é um ESP para Γ ⇐⇒ GΓ, (σ

Si)|=∅ β2, onde

cada σSi(vS∗i) = s i.

(27)

6.2.8

Outras soluções para Jogos Extensivos

O que faremos nesta seção é propor soluções alternativas para jogos extensivos, e caracterizarmos através de exemplos quando estas soluções são “razoáveis” ou não. Novamente, uma solução é razoável se ela requer algum tipo de racionalidade dos jogadores, no sentido que os jogadores ao tomarem suas decisões utilizam algum processo de otimização, mesmo que este seja parcial.

Iremos considerar dois tipos de soluções: soluções que utilizam o conceito de estratégias4, como no caso de equilíbrio de subjogo perfeito; e ainda, soluções

que se baseiam apenas nas seqüências de ações tomadas pelos jogadores (históricos terminais). Estas últimas soluções têm a finalidade de caracterizar jogadores que possuem limitações quando racionalizam sobre as possíveis soluções. Assim, ao invés de racionalizar sobre todas as possíveis estratégias, eles consideram apenas suas ações e conseqüências durante seus planos de ações.

Para exemplificarmos estes conceitos, considere o jogo extensivo como mostrado na figura 6.7 na sua versão extensiva e matricial. Para este jogo, o jogador 1 tem duas estratégias #A$ e #B$, e o jogador 2 tem duas estratégias #L$ e #R$. Utilizando os conceito de soluções para estratégias temos as seguintes possíveis soluções: ##A$, #L$$; ##A$, #R$$; ##B$, #L$$; e ##B$, #R$$. Note que na solução ##B$, #L$$ o jogador 2 especificou uma ação que nunca irá se realizar, uma vez que o jogador 1 escolheu B no histórico inicial, terminando assim, o jogo no histórico terminal (B). O mesmo fato ocorre na solução ##B$, #R$$. Desta forma, algumas das soluções que iremos propor consideram apenas as seqüências das ações tomadas pelos jogadores, sem que eles tenham que definir ações que nunca são alcançáveis. No jogo da figura 6.7, temos apenas as soluções (B), (A, L) e (A, R), que são os históricos terminais, como soluções que se baseiam apenas nas seqüências das ações.

Os exemplos utilizados nesta seção estão apresentados na forma extensiva e matricial de jogos extensivos com informação perfeita, contudo, quando apre-sentarmos as soluções, estaremos nos referindo a definição de jogos extensivo em GAL na versão extensiva, que foi apresentada na seção 6.2.4. Escolhemos apresentar os jogos desta forma para evitar uma notação mais densa.

Abaixo apresentamos diversos conceitos de soluções, que serão represen-tados como fórmulas de GAL, para jogos extensivos. A cada fórmula apresen-taremos uma explicação do que cada fórmula significa, bem como exemplos que ajudam a caracterizar quando estes conceitos são “razoáveis” ou não. Os 4Uma estratégia de um jogador i é uma função que atribui uma ação à cada histórico não-terminal h para o qual P (h) = i.

Referências

Documentos relacionados

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais

hospitalizados, ou de lactantes que queiram solicitar tratamento especial deverão enviar a solicitação pelo Fale Conosco, no site da FACINE , até 72 horas antes da realização

Foram desenvolvidas duas formulações, uma utilizando um adoçante natural (stévia) e outra utilizando um adoçante artificial (sucralose) e foram realizadas análises

(2019) Pretendemos continuar a estudar esses dados com a coordenação de área de matemática da Secretaria Municipal de Educação e, estender a pesquisa aos estudantes do Ensino Médio

5.2 Importante, então, salientar que a Egrégia Comissão Disciplinar, por maioria, considerou pela aplicação de penalidade disciplinar em desfavor do supramencionado Chefe

São considerados custos e despesas ambientais, o valor dos insumos, mão- de-obra, amortização de equipamentos e instalações necessários ao processo de preservação, proteção

Tabela 25A – Análise da frequência de índices dos grupos de recipientes existentes, com água e com larva na Supervisão Técnica de São Matheus de 2012 a 2016 e suas proporções

A atribuição de incentivos financeiros à equipa multiprofissional depende da concretização dos critérios para atribuição das unidades contratualizadas (UC) referentes às