• Nenhum resultado encontrado

2. R EVISÃO B IBLIOGRÁFICA

2.1. M INORITY GAME (MG)

2.1.3. G RANDE C ANÔNICO M INORITY GAME (GCMG)

No modelo MG padrão, os agentes devem escolher entre duas ações a cada intervalo de tempo t, por exemplo: comprar ou vender seus ativos. Entretanto, no mercado real, os agentes optam por escolher o melhor momento para negociar seus ativos a fim de obter maior lucro. Eles observam o mercado passivamente, mentalmente vão modificando suas várias estratégias, até que suas confianças superem um valor limiar, então eles surgem e fazem um negócio. Ou seja, nesse modelo além das estratégias de comprar e vender, é permitido ao agente não participar de negócios até que o mercado lhe seja favorável. A estrutura do minority game foi generalizada por Jefferies et al. (2001) para incorporar a variável do número de agentes ativos. Os agentes neste modelo generalizado, conhecido como ‘grand canonical minority game’ (GCMG), possuem um nível de confiança r e somente participa dos negócios se o escore de sua melhor estratégia for maior do que esse nível de confiança. Essa propriedade, onde os agentes somente participam quando eles estiverem suficientemente confiantes de sucesso, é um ingrediente crucial para construir um próspero modelo de mercado de multi-agentes.

O modelo GCMG possui seis parâmetros: o número de agentes (N), a memória de cada agente (m), o número de estratégias de cada agente (s), o escore mínimo que a melhor estratégia deve gerar para que o agente participe dos negócios (r), o horizonte de tempo (T) e o tamanho de incremento contra o qual os movimentos ativos são julgados L[t]. A dinâmica desse modelo é a seguinte:

Os agentes nesse modelo representam indivíduos financeiros ou instituições que são capazes de movimentar o mercado financeiro com suas ordens. Os números de agentes mais

comuns nas simulações do minority game são 101 e 501. Cada agente tem acesso a informações globais para tomar suas decisões, essas informações globais são limitadas a m bites da história do passado recente. Os valores mais comuns para memória dos agentes são: 3 e 6, ou seja, cada agente terá acesso aos três ou aos seis últimos resultados do mercado para tomar suas decisões de investimento para o próximo período. Para o caso de m=3, o número de estratégias de cada agente será 23= 8 e o número total de estratégias disponíveis, ou o livro de estratégias, será 28256. Já para o caso de m = 6, existem 26= 64 estratégias para cada

agente e um livro com 2 = 1,8446x1064 19

estratégias.

Cada agente recebe no início do jogo s estratégias as quais são distribuídas aleatoriamente. Os agentes são adaptativos, ou seja, eles podem mudar suas estratégias em cada “jogada”, escolhendo aquela que lhe for mais favorável. Para o caso de s = 2, um exemplo de estratégia é s’ = {1 -1 -1 -1 -1 -1 1 1} e s’’ = {1 1 1 1 1 1 1 -1}, no momento imediatamente anterior à tomada de decisão para a próxima etapa do jogo, o agente verifica qual das duas estratégias lhe garante a maior recompensa e fixa essa estratégia como sendo a sua melhor para o próximo período. Se o valor da recompensa dessa estratégia for menor do que a contagem mínima para participar, ele se abstém do jogo e fica aguardando uma melhor oportunidade para participar.

A contagem mínima para participar do jogo é r = 4. Segundo Johnson et al. (2003) esse valor representa um desvio padrão para o mercado de lançamento-moeda (coin-toss market) com taxa de sucesso de SR = 0. O parâmetro L[t] o qual representa a atratividade do mercado pode ser independente do tempo, mas por simplicidade, vamos assumir como constante e igual 0,001. Ressaltamos que L pode assumir qualquer valor real, inclusive zero. Finalmente, o intervalo de tempo em que o jogo é desenvolvido, ou seja, o tempo de

maturidade dos ativos no caso de um mercado financeiro. O horizonte de tempo mais comum é T = 500, ou seja, o jogo se repetirá por 500 períodos de tempo.

A função de retornos (pay-off) é dada pela equação

 

1  t

1

/

 

1

R R

g t  a  Dt  L t . (2.5)

Na equação (2.5),  t R

a representa a melhor estratégia do agente baseada na história

recente, e pode conter (1=comprar, -1= vender),  o sinal da expressão [.], D

 

t1  a demanda do mercado por ativos,  a sensibilidade do mercado eL t

 

1 atratividade do mercado (benchmark).

A demanda por ativos no tempo imediatamente anterior é dada por

2

 

  1 1 P t R R R D tn t a    

. (2.6)

Na equação (2.6), n tR

 

é o número de agentes escolhendo seguir a sugestão de

investimento do livro de estratégia R* no tempo t. Os agentes sempre usam seus livros de estratégias executando a mais alta delas, ou seja, SR* max[{ } ]SR s porém somente participa

dos negócios se o resultado da sua melhor estratégia for maior do que a contagem mínima para que o agente participe r. Se SR*r, então o agente não participa.

 

t 1 2

 

t PH

 

t P/ 2 H D

t 1

/ L t

 

1

  

 

     . (2.7)

A equação (2.7) representa uma operação binária onde a cada intervalo de tempo, o bite mais a esquerda da informação global é substituído pelo último resultado do jogo. Em que, 

 

t1 representa a informação global disponível para o próximo período de tempo,

 

t

 a informação global atual, P o valor da informação global (P = 2m), H[.] é uma função Heaviside, D t[( 1) ] representa a demanda do mercado momentos antes dos agentes fixarem suas estratégias,  a sensibilidade do mercado eL t

 

1 representa a atratividade do mercado.

A riqueza inicial dos agentes é gerada de forma igualitária através da equação

(0) *

WN T (2.8)

Na equação (2.8), N é o número de participantes do mercado, T é número de períodos da simulação. No caso de um mercado de opção, T representa o tempo de maturidade do ativo. Escolhemos essa fórmula para a riqueza inicial para que não haja agente com riqueza negativa no decorrer dos negócios.

A riqueza dos agentes que participam dos negócios é atualizada a cada período de tempo, a riqueza dos agentes que não participam permanece a mesma, o que permite a alteração de agentes seguidos e de agentes seguidores. Este processo representa muito bem as oscilações de um mercado do mundo real, principalmente mercados de ações, onde a riqueza do agente pode sofrer modificações a cada momento dependente de suas estratégias de negócios. A riqueza dos agentes que participam dos negócios é dada por:

i i

( ) W (t-1) + g ( )

i

W tt (2.9)

Na equação (2.9), gi(t) é pay-off do agente gerado pelo sucesso de sua melhor estratégia, dada pela equação 2.5, W(t-1) é a riqueza do agente acumulada até o espaço de tempo imediatamente anterior.

Documentos relacionados