• Nenhum resultado encontrado

Lideranças em jogos equilibrados: Teoria x Intuição

N/A
N/A
Protected

Academic year: 2021

Share "Lideranças em jogos equilibrados: Teoria x Intuição"

Copied!
8
0
0

Texto

(1)

Lideranças em jogos equilibrados:

Teoria x Intuição

Fábio Mello Valladão (UFF) Lucas Rodrigues Batista Sanns (UFF)

Maiara Gripp de Souza (UFF) Orientadores: Douglas Rodrigues (UFF)

e Karina Yuriko Yaginuma (UFF)

Email de contato: f.m.valladao.1@gmail.com, lucassanns@gmail.com, maiaragripp@gmail.com

Resumo: Nessa trabalho apresentamos um intuitiva introdução ao mundo dos passeios aleatórios e dos pro-cessos estocásticos. Com o uso de ferramentas extremamente simples, como a combinatória e probabilidade elementar, apresentaremos os resultados obtidos sobre as utuações do processo advindo do lançamento in-dependente de moedas honestas. Realizamos diversas implementações computacionais, através do programa R, buscando reforçar empiricamente os resultados observados na teoria.

Palavras-chave: passeio aleatório, utuações, processos estocásticos. Introdução

Esse trabalho é motivado por um jogo extremamente intuitivo: dois indivíduos competindo em um jogo de cara ou coroa. A regra é simples. Inicialmente, cada um dos jogadores escolhe uma face da moeda. Realizamos então sucessivos lançamentos independentes dessa moeda honesta, e a cada rodada o perdedor paga uma unidade monetária ao ganhador.

Esse inocente jogo é o cenário ideal para se iniciar o estudo dos passeios aleatórios, e nosso principal objetivo neste trabalho é compreender como ocorre a utuação do processo ao longo da evolução temporal.

Através de métodos elementares de combinatória e de probabilidade, buscamos resultados teóricos e práticos que, além de extremamente relevantes, desaam nossa intuição e senso comum.

Um dos resultados mais surpreendentes que observamos diz respeito aos tempos de liderança. Intuitiva-mente, devido a equivalência da chance de vitória dos competidores a cada rodada, somos levados a crer que ocorre ao longo do jogo uma intensa troca de liderança entre os jogadores. No entanto, apresentamos resultados teóricos e práticos, através de simulações computacionais, que comprovam que o mais comum é a ocorrência de longos períodos de liderança para um dos competidores.

Material e métodos

Vamos denir o que é um jogo de moedas para nosso estudo.

Neste trabalho utilizamos por modelo uma moeda honesta, onde cada lançamento resulta em cara ou coroa com a mesma probabilidade (a saber, 0.5). Suponha que dois indivíduos ctícios, João e Mateus, zeram uma aposta, que consiste em lançar uma moeda honesta diversas vezes. Para cada cara obtida, João recebe 1 real de Mateus, ao passo que deve pagar 1 real para ele cada vez que sai uma coroa. Ao nal de n lançamentos consecutivos, onde n ∈ N+, poderemos avaliar os saldos dos dois indivíduos. Arbitrariamente,

(2)

vamos trabalhar com o saldo de João (embora o método seja análogo para o saldo de Mateus). Temos que esse valor pode ser positivo, se o número de caras for maior que o de coroas, negativo, se saírem mais coroas que caras, ou nulo, caso a quantidade de caras e coroas sejam iguais (observe que esse último caso só pode ocorrer se o número de lançamentos for par).

Vamos pensar nesse jogo como um passeio aleatório. Cada cara será representada numericamente por +1 e cada coroa por -1. Em um eixo cartesiano, começamos na origem, que representa o momento que precede o primeiro lançamento da moeda. Se o primeiro lançamento consistir na face cara ligamos o ponto (0,0) ao (1,1) com um segmento de reta. Se o segundo lançamento for coroa, por exemplo, ligamos o ponto (1,1) ao (2,0), e assim por diante. Vamos chamar o eixo das abcissas de Lançamentos ou Passos, e o das ordenadas de Saldo, ou Soma. Portanto, para um ponto (n,k) arbitrário, k representa o saldo de João no instante n (ou seja, após n lançamentos da moeda). Já o gráco que representa esse jogo é chamado de caminho, e dizemos que ele tem tamanho 2n se é composto por 2n passos, por exemplo.

Veremos a seguir mais detalhes sobre o funcionamento do processo descrito, ou seja, sobre as utuações decorrentes desses lançamentos.

Lançamentos de moeda

Considere um vetor E = (e1, e2, ..., en) de tamanho n ∈ N+, cujos elementos ei correspondem ao resultado

do lançamento de uma moeda, e podem assumir apenas os valores 1, se for cara, e -1, se for coroa. Suponha que p é a quantidade de elementos iguais a 1 e q a quantidade de elementos iguais a -1, p, q ≥ 0. Então, temos que:

n = p + q (1)

Para um inteiro k denimos Sk como a soma dos k primeiros termos do vetor E.

Em um plano geométrico, podemos interpretar cada observação ek como a inclinação de um segmento de

reta que vai do ponto (k − 1, Sk−1) ao ponto (k, Sk).

Assim, como S0 = 0, Sk− Sk−1 = ±1 = ek. Chamaremos de r a soma de todos os termos de E, ou seja

Sn= r. Obtemos que, pela denição de Sn:

r = p − q (2)

As n observações do vetor formam linhas poligonais que vão do ponto (0, 0) ao ponto (n, r). Ao longo de todos esses caminhos, para cada ek observação, o gráco tem vértice no ponto (k, Sk). Veja a Figura 1,

(3)

Figura 1: Gráco de linhas Poligonais

Como, para cada observação, só existem duas direções (ou resultados de moeda) possíveis, para n observa-ções temos 2n caminhos possíveis de tamanho n.

Inicialmente, queremos contar o número de formas de um evento ocorrer. Suponha que queiramos saber de quantas formas se podem obter 6 caras e 3 coroas em 9 lançamentos de moeda. Nesse caso, nosso r seria r = p − q = 3e n = 9. Isso é o mesmo que perguntar quantos caminhos possíveis existem do ponto (0,0) ao ponto (9,3) no gráco. Ou ainda, de quantas formas conseguimos andar n espaços escolhendo p deles para serem subidas (observe que, analogamente, poderíamos também escolher q descidas entre os n passos).

Nn,r= n p  =n q  (3) Vale ressaltar que, a menos que n e r sejam da forma (1) e (2) não é possível atingir um determinado ponto (n, r), ou seja Nn,r = 0. Por exemplo, se n = 3, não existe nenhum caminho tal que r = 0. Observe que o

caminho da Figura 1 é apenas um dos 29 = 512caminhos de tamanho n = 9 e um dos N

9,3= 84caminhos

da origem ao ponto (9, 3). O que, no nosso exemplo de moedas, signica que em 9 lançamentos temos 512 distribuições possíveis de caras ou coroas, e 84 formas de sortear 6 caras e 3 coroas.

Lema 1 (Princípio da Reexão). O número de caminhos de A até B que tocam ou cruzam o eixo t é igual ao número de caminhos que vão de A' até B.

(4)

é, escolha t de tal forma que Sa>0,...,St−1>0, St=0. Então,

(−Sa, −Sa−1, ..., −St−1, St= 0, St+1, St+2, ..., Sb)

é um caminho que vai de A' até B e que tem T=(t,0) como seu primeiro vértice no eixo t.

Como as partes AT e A'T são reexões uma da outra segue-se que existe o mesmo número de caminhos de A e de A0 até T, logo o número de caminhos de caminhos que vão de A' a B e os caminhos que vão de A a

B e que teêm um ou mais vértices no eixo t são iguais.

E se estivéssemos interessados na primeira vez que o gráco volta à origem? Em um número 2v de passos temos que um primeiro retorno à origem ocorre se:

(S1 6= 0, S26= 0, ..., S2v−1 6= 0, S2v = 0)

Chamaremos a probabilidade de primeiro retorno à origem no momento 2v de f2v, e deniremos f0 = 0.

Uma volta à origem em um momento 2n pode ou não ser o primeiro retorno. Se não for, signica que foi precedida por um primeiro retorno à origem em algum momento 2v tal que 2v < 2n. Considerando que um primeiro retorno à origem em 2v e um em 2k, v 6= k, são eventos disjuntos, anal, não se pode ter um primeiro retorno à origem duas vezes. Podemos interpretar a probabilidade de voltar à origem em um momento 2v como a soma das probabilidade de todos os eventos em que houve uma primeira volta anterior a 2n passos, com um novo retorno no momento 2n − 2k, e o caso em que 2n é, de fato, o primeiro retorno. u2n= f2u2n−2+ f4u2n−4+ ... + f2nu0 (4)

A probabilidade de retorno à origem é de extrema importância para a teoria de utuações em passeios aleatórios, estando presente em quase todas as fórmulas, e a razão para isso se apresenta no seguinte lema: Teorema 1 (O Lema Principal). A probabilidade de que nenhum retorno à origem ocorra até o passo 2n (este incluso), é a mesma que a probabilidade de um retorno ocorrer no passo 2n.

P {S1 6= 0, ...S2n 6= 0} = P {S2n= 0} = u2n n > 0

Se para todo n, S2n 6= 0, signica que o gráco não corta o eixo das abcissas, assim ou todos os valores são

positivos, ou todos são negativos.

{S16= 0, S2 6= 0, ..., S2v−16= 0, S2v6= 0} = {S1> 0, ..., S2v> 0} U {S1< 0, ..., S2v< 0}

(5)

P {S1 > 0, ...S2n > 0} =

1

2u2n (5)

Um resultado semelhante ao Lema Principal é:

P {S1 ≥ 0, ...S2n≥ 0} = u2n (6)

Um caminho de tamanho 2n cujos vértices estão sempre acima do eixo das abcissas passa obrigatoriamente pelo ponto (1, 1). A probabilidade de atingir esse ponto é 1

2. Se pensarmos nesse ponto como a nova origem

de um caminho de tamanho 2n − 1 onde o gráco está acima ou toca o eixo das abcissas, temos: 1

2P {S1 ≥ 0, ..., S2n−1 ≥ 0} = P {S1 > 0, ...S2n> 0} = 1

2u2n (7)

Primeiro retorno à origem

Quando se trata do primeiro retorno à origem em 2n, notamos que o mesmo acontece quando o evento A = {S1 6= 0, S2 6= 0, ..., S2n−26= 0} acontece e o evento B = {S1 6= 0, S2 6= 0, ..., S2n6= 0} NÃO acontece.

Veja que A não faz qualquer restrição sobre S2n podendo este ser igual ou diferente de zero quando A

ocorre. B já é mais restritivo. Seja C = {S1 6= 0, S26= 0, ..., S2n= 0}, P(C) é a probabilidade de primeiro

retorno à origem no passo 2n, que denotaremos por:

f2n= u2n−2− u2n (8)

Resultados e discussão

Intuitivamente, a maioria das pessoas pensa que num jogo prolongado de lançamento de moedas,cada um dos jogadores caria metade do tempo liderando, e que a liderança mudaria frequentemente de um para o outro. Mas como mostra o próximo teorema, isso não ocorre. Se calcularmos a probabilidade da última visita tem sido em k (em 2n ensaios) veremos que os pontos com maiores probabilidades são nas extremidades, ou seja que o passeio aleatório percorreu quase 2n passos, sem retornar a origem. Logo sem mudança de liderança. Teorema 2 (Lei dos Arcos senos para últimas equalizações). A probabilidade de que o último retorno à origem ocorra no momento 2k, em 2n passos, é:

α2n = u2ku2n−2k (9)

Demonstração: : Conforme o Lema 1 da seção anterior, sabemos que: u2k= P {S2k = 0} = P {S1 6= 0, ..., S2n 6= 0}

(6)

Podemos, portanto, interpretar a igualdade (9) da seguinte forma, mais intuitiva: u2ku2n−2k= P {S2k = 0} ∗ P {S16= 0, ..., S2n−2k 6= 0}

Note que se garantirmos que S2k = 0, podemos transladar o gráco que se inicia na origem para o ponto

2k sem mudança na probabilidade:

P {S1 6= 0, ..., S2n−2k6= 0} = P {S2k+16= 0, ..., S2n6= 0/S2k= 0}

O último retorno à origem em 2k ocorre quando existe um retorno em 2k, e mais nenhum retorno nos próximos 2n − 2k passos.

α2n= P {{S2k = 0} ∩ {S2k+16= 0, ..., S2n 6= 0}}

Pelo resultado de probabilidade condicional:

P {{S2k = 0} ∩ {S2k+16= 0, ..., S2n 6= 0}} = P {S2k = 0} ∗ P {S2k+16= 0, ..., S2n6= 0/S2k= 0}

α2n = u2ku2n−2k

Figura 2: Exemplo de caminho com 2n passos, onde a última equalização acontece no momento 2k. Note que, nesse caso especíco, k=6 e n=15.

Teorema 3 (Lei do arco seno para tempos de permanência). Para caminhos de tamanho 2n que partam da origem, a probabilidade de que 2k lados quem acima do eixo (ou seja, 2k passos positivos) e 2n − 2k

(7)

abaixo dele, é de exatamente α2k,2n.

Teorema 4. A probabilidade de que, até o instante 2n + 1, ocorram exatamente r mudanças de sinal vale 2 · P (S2n+1 = 2r + 1), para r = 0, 1, · · · , n.

Uma consequência surpreendente do teorema acima é que a probabilidade de que, até o instante 2n + 1, ocorram exatamente r mudanças de sinal é uma função decrescente em r. Isso signica que, independente do número de lançamentos, o evento de que a liderança não mude nunca é mais provável do que qualquer número xo de trocas de liderança.

Conclusão

No presente trabalho analisamos a teoria de passeios aleatórios através de sua simples relação com os lançamentos de uma moeda honesta. Foi interessante notar que, com ferramentas básicas (como a análise combinatória, noções de probabilidade condicional, entre outras) pudemos chegar a conclusões que ajudam a explicar situações reais, mas que desaam por vezes o senso comum. Por exemplo, por que em um campeonato onde dois times se destacam e possuem características muito semelhantes (como bons jogadores, patrocínio, etc.), a liderança não passa com frequência de um time para o outro?

Através dos conhecimentos fundamentais de probabilidade, derivamos também ferramentas simples e po-derosas, como o Principio da Reexão, que nos permite provar resultados interessantes, como o seguinte: a probabilidade de que um empate ocorra em um determinado instante é igual à probabilidade de que nenhuma equalização ocorra até, inclusive, aquele mesmo momento. Isso quer dizer que num campeonato de futebol, por exemplo, caso estejamos interessados em avaliar a quantidade de vitórias dos dois times favoritos, obteremos a seguinte conclusão não intuitiva: a chance da quantidade de vitórias se igualar na décima rodada (ou em qualquer outra, na verdade) é igual a de que um desses dois times tenha se mantido invicto em relação ao outro, desde o início, até o m da rodada escolhida.

Mas e quando um dos dois times passa à frente do outro, o que podemos armar sobre seu tempo de liderança a partir daquele momento? Alguns dos teoremas que provamos nos falam sobre isso. Temos, por exemplo, que a probabilidade de um time conquistar a liderança no início do jogo tem relação simétrica com a probabilidade de que o último empate ocorra ao nal. Isso quer dizer que se um dos favoritos assume a liderança na rodada 2 (instante n = 1), a probabilidade de que se mantenha invicto em relação ao outro até o m do campeonato (que termina com a rodada 2n), é a mesma de que suas vitórias se igualem no momento 2n − 2 (duas rodadas antes do m), independentemente do que ocorreu ao longo da competição. Mais ainda, a última equalização tem probabilidade máxima de ocorrer nos extremos, diminui conforme se aproxima do meio, e volta a aumentar ao aproximar-se do nal.

Isso nos dá uma noção sobre algo surpreendente: ao contrário da intuição, a liderança num jogo como o que propusemos não passa com tanta frequência de um indivíduo ao outro como poderíamos imaginar. De fato, temos como resultado que, se deveriam ocorrer r trocas de liderança em uma competição de duração 2n, devemos esperar apenas √2r dessas trocas para um jogo análogo, que possua o dobro de duração

(8)

(tamanho 4n). Para competições bastante longas, portanto, podemos visualizar claramente o efeito disso, que podemos chamar de tempos de liderança prolongada.

Concluímos também que a probabilidade de um indivíduo car na liderança 2k instantes (não necessaria-mente consecutivos) dentre um total de 2n, é a mesma que a probabilidade do último empate entre os dois competidores ocorrer exatamente no instante 2k. Esse resultado, muito interessante por sinal, nos desaa. Ao mesmo tempo que não se consegue encontrar uma explicação para esse comportamento, também não é possível aceitá-lo como mera coincidência. Fica aí uma indicação de que ainda há trabalho a ser feito.

Referências

1. Feller, W. Introdução à teoria das probabilidades e suas aplicações: Parte 1 - Espaços amostrais discretos. 1a Ed. São Paulo: Edgard Blücher, 1976.

Referências

Documentos relacionados

O Climate Policy Initiative/ Núcleo de Avaliação de Políticas Climáticas da PUC-Rio trabalha para aprimorar políticas públicas de energia e uso da terra gerando evidências para

DATA: 17/out PERÍODO: MATUTINO ( ) VESPERTINO ( X ) NOTURNO ( ) LOCAL: Bloco XXIB - sala 11. Horário Nº Trabalho Título do trabalho

E, para tornar mais explícitos esses “eixos norteadores”, João dos Reis Silva Júnior aborda alguns traços constitutivos da produção do Nupes, entre os quais: embora seja focada

Figura 23: Gráfico da evolução da degradação de moléculas de nitrometano em função do tempo de simulação na densidade de 1,9 g/cm³ e temperatura de 2400 K, nos sistemas

O relato é de natureza aplicada e apresenta abordagem qualitativa, pois teve como objetivo gerar conhecimentos para aplicação prática do uso de gamificação através

Vale observar também que a temperatura máxima à qual o fluxo de calor sujeita a placa no caso simulado é próxima da temperatura de ebulição, o que corrobora a escolha

No dia do batismo, quando Ele recebeu o Espírito Santo no dia em que João batizou, João disse: “Eu observei e vi o Espírito de Deus descendo como uma pomba do céu, e uma Voz

“Diz Manuel José Teixeira Franco, e mais moradores da Comarca do Rio das Velhas, da Capitania de Minas Gerais, não se como fieis Vassalos de Vossa Majestade,