• Nenhum resultado encontrado

2.5 Jogos evolucionários

2.5.2 Protocolo de Rubinstein

Com a finalidade de obter um maior payoff para suas ações, os indivíduos dentro de um jogo podem vir a negociar entre si. Para que a negociação tenha sucesso para todos os envolvidos neste processo de barganha, é necessário que os agentes sejam altamente racionais e tenham pleno conhecimento das preferências dos demais in- divíduos [24]. Isto sugere um jogo de informação completa, que não é a categoria predominante dos cenários reais.

Surge então o Protocolo de Ofertas Alternadas de Rubinstein. Este protocolo de negociação consiste na barganha entre dois indivíduos, onde cada um lança uma determinada oferta logo após avaliar a oferta realizada pelo oponente na etapa anterior. Sendo assim, são possíveis três ações em cada etapa da iteração:

1. aceitar a oferta do oponente; 2. lançar nova oferta;

Assim como na barganha axiomática de Nash, o protocolo de Rubinstein tam- bém tem um ponto de equilíbrio. A diferença está no fato de que o protocolo de Rubinstein implementa um fator de normalização chamado de fator de desconto, aplicado diretamente à função de payoff do agente.

No modelo clássico de Rubinstein, dois jogadores barganham entre si a divisão de certa quantia monetária x ∈ [0, 1], tal que a primeira oferta é (x, 1 − x). A distribuição de recompensas é (δ1−iu

1(x), δ1−iu2(x)), onde δ ∈ [0, 1] é um fator de

desconto, atualizado a cada rodada de negociação i.

Um jogo neste formato pode ser descrito pela forma extensiva conforme a fi- gura 2.5, onde as curvas pontilhadas representam a existência de uma infinidade de escolhas possíveis para p1 e p2 respectivamente. Além disso, existe um número

infinito de sequências para o jogo a partir da escolha inicial. Cada jogador pode, tempestivamente, optar por aceitar (acc) ou recusar (rej) a oferta feita por seu opo- nente.

Figura 2.5: Protocolo de Rubinstein para partilha monetária simples.

Eventualmente, os agentes não entrarão em acordo após um certo deadline3. Na

ocorrência desta situação, para que o processo de negociação não seja inteiramente desperdiçado, é aplicada a arbitragem da oferta final. Neste ponto, entra em cena o árbitro da negociação, que escolhe uma dentre as diversas ofertas apresentadas pelos jogadores[25].

Este protocolo pode ser modelado da seguinte maneira: supor o conjunto X composto por todos os pares de utilidade (x, y) para os jogadores u1 e u2, e as épocas

t = 0, 1, ..., n. Na época 0, o jogador P1propõe a oferta (x0, y0) ao árbitro. Tal oferta é

observável por P2, que decidirá pela aceitação ou oferecerá ao árbitro uma contra-

proposta (x1, y1). Nesta notação, para bens infinitamente divisíveis, xi ∼ (xi, 1 − xi),

ou seja, quando um jogador apresenta um valor x, seu oponente recebe a proposta y = 1 − x.

O jogo acaba assim que alguma oferta for aceita na época t = 0, ..., n − 1. Se nenhuma oferta for acatada neste intervalo de tempo, o árbitro tem a responsabili- dade de escolher na época t = n a oferta (xn, yn) ∈ {(x0, y0), ..., (xn−1, yn−1)}, conforme

seus critérios de justiça na divisão de bens e custos.

Uma possível aplicação do protocolo de Rubinstein com arbitragem da oferta final é justamente a alocação de slots de partida para aeronaves em um aeroporto.

Supor que, após j rodadas de negociação, a última oferta apresentada (e recusada) é (xj, yj), equivalente à alocação dos slots s1 e s2 para as aeronaves p1 e p2, respec-

tivamente. Sendo s1 e s2 slots válidos, o árbitro poderá impor, considerando-se as

devidas restrições e probabilidades, a oferta (xj−1, yj−1) ou a oferta (xj, yj), que são

as duas últimas ofertas válidas que expressam a preferência de cada um dos joga- dores. Isto equivale a atribuir a p1 e p2 os slots livres s

0

1 e s

0

2 mais próximos a s1 e

Capítulo 3

Processos decisórios e CDM

Todo processo de tomada de decisão envolve ao menos três passos bem definidos, sendo eles a identificação da situação, o diagnóstico e a escolha da ação. Ao tomar uma decisão, o agente espera contar com certa informação, obtida a partir de seu conhecimento do ambiente. Das informações disponíveis, o agente averigua aque- las que lhe são relevantes e, a partir da combinação das operações de percepção, memória ativa (se for o caso) e racionalidade, o agente pode realizar a verificação dos cenários atual e futuro, podendo assim decidir por adotar o comportamento mais adequado aos seus interesses [4].

Este capítulo expõe a racionalidade por trás dos processos de tomada de decisão. A primeira seção apresenta o conceito de utilidade esperada, que é o norte para a escolha estratégica. Em seguida, são apresentadas as características dos processos estocásticos, modelados sob a propriedade de Markov. O capítulo é encerrado com o estudo do processo de tomada colaborativa de decisão (CDM) e a sua aplicação no contexto aeroportuário, onde recebe o nome de A-CDM (Airport Collaborative Decision Making).

3.1

Utilidade esperada

Dentro do estudo da Teoria dos Jogos, a mensuração da utilidade de uma decisão é definida por uma função de mesmo nome: a função de utilidade. Quanto maior for o valor de retorno desta função, mais interessante é a escolha por esta ação em especial. Esta utilidade é construída a partir do estudo formal dos parâmetros de influência previamente estabelecidos, que representam o conhecimento que o agente tem a respeito de si mesmo e do ambiente no qual está inserido.

A incerteza na escolha de uma ação geralmente é resultado da falta de conheci- mento ou compreensão da situação corrente. De fato, algumas situações dependem de eventos probabilísticos ou estocásticos, que são modelados como ações tomadas por um agente externo chamado natureza. Quando o cenário apresenta algum grau de incerteza quanto ao resultado final, o agente deve ter preferências quanto à sele- ção de suas ações, segundo a associação de probabilidades a estas. Neste contexto, surgem as estratégias mistas e a função de utilidade esperada (UE), formalizada na equação 3.1, onde S é a estratégia escolhida e E é a evidência disponível. Um

agente é considerado racional se e somente se ele escolhe a ação que resulta na mais alta utilidade esperada.

U E(A|E) = X

i

P (ui(S)|S, E)(ui(S)) (3.1)