9ª Aula – Negociação
Luciano Reis Coutinho, Prof.
lrc@deinf.ufma.br
2 Sistemas Multiagentes 2
8ª Aula – Competição
SMA = Agentes + Interação Social
Interação Social =
Comunicação + Coordenação
Coordenação entre agentes competitivos ou com interesses conflitantes Coordenação entreagentes benevolentes ou com interesses comuns
3 Sistemas Multiagentes 3
8ª Aula – Competição
Teoria dos Jogos
1947 Morgenstern e von Neumann
1950 John Nash Equilibrium
1980 IAD/RDP - Quadro Negro - CNET
1986 Jeffrey Rosenschein Cooperation without communication
2009 Shoham and Leyton- Brown Livro MAS, fundamentos:
- Algorithmic - Game-Theoretic - Logical
Introdução da Teoria Jogos Em SMAs.
SMAsCooperativos
4 Sistemas Multiagentes 4
8ª Aula – Competição
Teoria dos Jogos ( Parsons e Wooldridge 2000 ):
◦Game theory is a close relative of decision theory, which studies interactions between self-interested agents.
◦In Game theory
study of multi-agent interactions, particularly those involving negotiation and coordination.
◦Questão Básica sobre encontros entre agentes:
What is the best — most rational — thing an agent can do?
5 Sistemas Multiagentes 5
8ª Aula – Competição
Respostas em termos de :
◦
Estratégias Dominantes;
◦
Equilibrium Nash;
◦
Pareto optimalidade;
◦
Maximização do bem-estar social.
6 Sistemas Multiagentes 6
8ª Aula – Competição
Estratégias Dominantes
◦
Diz-se que uma estratégia s
ié dominante para o agente i se - não importando que estratégia s
jo agente j escolha-, i se dará no mínimo tão bem escolhendo s
iquanto escolhendo qualquer outra.
Equilíbrio NASH
◦
Em geral, diz-se que duas estratégias s
ie s
jestão em equilíbrio Nash se:
1) Supondo de que o agente i escolhe si, o agente j não pode fazer melhor do que realizar sj;
2) Supondo de que o agente j escolhe sj, o agente i não pode fazer melhor do que realizar si;
7 Sistemas Multiagentes 7
8ª Aula – Competição
Pareto Optimalidade
◦
Um resultado da ação conjunta de agentes é dito Pareto ótimo (ou Pareto eficiente) se não existe nenhum outro resultado possível que faça um dos agentes ―mais feliz‖ sem tornar um outro agente
―menos feliz‖.
Maximização do Bem-Estar Social
◦
O bem-estar social de um resultado é definido como a soma das utilidades de cada agente a partir do resultado:
8 Sistemas Multiagentes 8
8ª Aula – Competição
Exemplo: Dilema do Prisioneiro
◦
Matriz de Payoff:
Equilíbrio NASH
9 Sistemas Multiagentes 9
8ª Aula – Competição
Exemplo: Dilema do Prisioneiro
◦
Matriz de Payoff:
PARETO Ótimo
10 Sistemas Multiagentes 10
8ª Aula – Competição
Exemplo: Dilema do Prisioneiro
◦
Matriz de Payoff:
Bem Estar Social Max:
ui(C,C) +uj(C,C)=6
11 Sistemas Multiagentes 11
8ª Aula – Competição
Exemplo: Jogo do Covarde (Chicken Game)
◦
Matriz de Payoff:
Equilíbrios NASH
12 Sistemas Multiagentes 12
8ª Aula – Competição
Exemplo: Jogo do Covarde (Chicken Game)
◦
Matriz de Payoff:
PARETO Ótimo
13 Sistemas Multiagentes 13
8ª Aula – Competição
Exemplo: Jogo do Covarde (Chicken Game)
◦
Matriz de Payoff:
Bem Estar Social Max:
ui(C,C) +uj(C,C)=4 ui(C,D) +uj(C,D)=4 ui(D,C) +uj(D,C)=4
14 Sistemas Multiagentes 14
8ª Aula – Competição
Exemplo: Caça ao Cervo (Stag Hunt)
◦
Matriz de Payoff:
Bem Estar Social Max:???
Equilíbrio(s) NASH ???
PARETO Ótimos ???
15 Sistemas Multiagentes 15
8ª Aula – Competição
Exemplo: Jogo do Atraso
◦
Matriz de Payoff:
Bem Estar Social Max:???
Equilíbrio(s) NASH ???
PARETO Ótimos ???
16 Sistemas Multiagentes 16
8ª Aula – Competição
Em suma,
◦A Teoria dos Jogos oferece um formalismo matemático para analisar ou projetar situações | protocolos de interação entre agentes com interesses próprios, em geral conflitantes (competição, negociação, etc).
Como Por exemplo:
◦Situações de decisão conjunta
Protocolos de votação
◦Situações de alocação de recursos
Protocolos de leilões
17 Sistemas Multiagentes 17
8ª Aula – Competição
Limitações | críticas,
◦
Baseada em hipóteses simplificadoras, nem sempre realistas
Os agentes são 100% racionais
As possíveis ações/estados formam um conjunto fixo e previamente conhecido
Cada agente sabe das preferências dos outros
Cada agente sabe das potencialidades/limites dos outros
18 Sistemas Multiagentes 18
8ª Aula – Competição
Negociação
Barganha
◦Domínios de Tarefas
◦Protocolo de Concessão Monotônica
◦A Estratégia Zeutehn
◦SEMINÁRIO:
Algoritmo BarSSA
Argumentação
◦Modos de Argumentação
◦Argumentação Abstrata
◦SEMINÁRIO:
Argumentação para SOA
Leituras Recomendadas
19 Sistemas Multiagentes 19
8ª Aula – Competição
Em casos extremos, para um agente ganhar algo em uma interação, SEMPRE um ou mais agentes têm de perder na mesma proporção …
◦Encontros Puramente Competitivos
◦Caso especial, encontros SOMA ZERO !
No entato, em vários casos reais, há um meio termo mais produtivo para as partes envolvidas …
◦Vide Dilema do Prisioneiro
… mas que só pode ser explorado se os agentes tiverem a possibilidade de SE COMUNICAR, e CONFIAR MUTUAMENTE na palavra do outro !
Questão Central
◦Como chegar a um acordo, i.e., um resultado agradável para todos os participantes, quando for possível?
20 Sistemas Multiagentes 20
8ª Aula – Competição
Resposta : NEGOCIAÇÃO
◦
Via BARGANHA
◦
Via ARGUMENTAÇÃO
21 Sistemas Multiagentes 21
8ª Aula – Competição
Negociação
Barganha
◦Domínios de Tarefas
◦Protocolo de Concessão Monotônica
◦A Estratégia Zeutehn
◦SEMINÁRIO:
Algoritmo BarSSA
Argumentação
◦Modos de Argumentação
◦Argumentação Abstrata
◦SEMINÁRIO:
Argumentação para SOA
Leituras Recomendadas
22 Sistemas Multiagentes 22
8ª Aula – Competição
Tipo de negociação que se desenrola em rodadas (rounds) de ◦ .... Proposta (Contra-)Proposta ...
◦Quando proposta e contra-proposta são iguais ou melhor do que o esperado a negociação termina e tem-se um ACORDO !
◦Quando a negociação termina em proposta e contra-proposta diferentes ou abaixo do esperado NÃO HÁ ACORDO !
23 Sistemas Multiagentes 23
8ª Aula – Competição
A partir desta definição pode-se dizer que leilões são um tipo particular de Barganha
◦
Dedicada à alocação de Bens e Recursos
Nesta aula iremos enfatizar Barganha em Domínio de TAREFAS
24 Sistemas Multiagentes 24
8ª Aula – Competição
Formalmente, um domínio de tarefas é uma tripla
T, Ag, c onde
•T é o conjunto (finito) de Tarefas;
•Ag = {1, ..., n} é o conjunto de agentes;
•c : ℘(T) ℝ+é uma função que define do custo de executar cada subconjunto de tarefas.
Uma alocação é uma sequência T
1, T
2, ..., T
n
onde T
i T para cada i Ag.
25 Sistemas Multiagentes 25
8ª Aula – Competição
Considere um domínio de tarefa no qual interagem dois agentes 1 e 2;
Dada uma alocação T
1, T
2, um acordo consiste em uma (re)alocação = D
1, D
2 das tarefas em T
1 T
2aos agentes 1 e 2;
A utilidade de um acordo para um agente i é dado por
utility
i( ) = c(T
i) – c(D
i)
26 Sistemas Multiagentes 26
8ª Aula – Competição
O conjunto de acordos sobre o qual os agentes irão negociar são aqueles:
◦
Individualmente racionais: i.e., os agentes não estarão interessados em acordos com utilidade negativa; melhor fazer as tarefas originalmente alocadas.
◦
Pareto eficientes: i.e., os agentes podem sempre transformar um acordo Pareto não-eficiente em um Pareto eficiente fazendo um dos agentes
―mais feliz‖ sem prejudicar os outros.
27 Sistemas Multiagentes 27
8ª Aula – Competição Sistemas Multiagentes 2828
8ª Aula – Competição
Regras do Protocolos . . .
◦No 1o. round, agentes propõem simultaneamente acordos dentro do conjunto de negociação;
◦Chega-se a um entendimento, se um agente acha que o acordo proposto pelo outro é pelo menos tão bom ou melhor que sua proposta;
◦Se não há entendimento, a negociação prossegue ao próximo round de propostas simultâneas;
◦No round u + 1, não é permitido a nenhum agente fazer uma proposta que seja pior do que a feita no round anterior;
◦Se nenhum agente cede um pouco mais em um dado round u > 0, então a negociação termina sem sucesso.
29 Sistemas Multiagentes 29
8ª Aula – Competição
Como os agentes devem proceder usando o protocolo de concessões monotônicas ?
Três pontos chave:
◦Qual a primeira proposta a fazer ?
A mais desejada pelo agente (óbvio) !
◦Em um dado round, quem deve ceder ?
Quem tem mais utilidade a perder !
Dando empate, joga uma moeda …
◦Se um agente deve ceder, então quanto ele deve ceder?
Apenas ―o suficiente‖ para mudar o cenário de perda.
30 Sistemas Multiagentes 30
8ª Aula – Competição
O protocolo não garante sucesso, mas garante um fim para toda negociação;
◦Complexidade : O ( 2 |T| )
Não garante maximização do bem-estar social, mas garante a racionalidade individual e a Pareto optimalidade;
Com relação à estabilidade, o uso da estratégia Zeuthen leva a um equilíbrio NASH.
◦Assim, dado que um agentes esteja usando Zeuthen, um outro agente não pode fazer melhor que usar Zeuthen.
31 Sistemas Multiagentes 31
8ª Aula – Competição
Nas palavras de (Rosenschein and Zlotkin, 1994, p. 46):
◦
This is of particular interest to the designer of automated agents. It does away with any need for secrecy on the part of the programmer. An agent‘s strategy can be publicly known, and no other agent designer can exploit the information by choosing a different strategy. In fact, it is desirable that the strategy be known, to avoid inadvertent conflicts.
32 Sistemas Multiagentes 32
8ª Aula – Competição
33 Sistemas Multiagentes 33
8ª Aula – Competição
Negociação
Barganha
◦Domínios de Tarefas
◦Protocolo de Concessão Monotônica
◦A Estratégia Zeutehn
◦SEMINÁRIO:
Algoritmo BarSSA
Argumentação
◦Modos de Argumentação
◦Argumentação Abstrata
◦SEMINÁRIO:
Argumentação para SOA
Leituras Recomendadas
34 Sistemas Multiagentes 34
8ª Aula – Competição
De modo geral, argumentação em um contexto multiagente consiste em um processo pelo qual um dos agentes tenta convencer um ou mais outros da verdade (ou falsidade) de algum estado de coisas.
◦É um processo de tentar chegar a um acordo conjunto sobre em quê acreditar .
◦É um problema apenas quando as várias crenças são contraditórias .
35 Sistemas Multiagentes 35
8ª Aula – Competição
Segundo (Gilbert 1994):
◦
Lógico
Baseado em raciocínio dedutivo, provas lógico- formais;
◦
Emocional
Apelo a emoções, sentimentos, etc.
◦
Visceral
Apelo aos aspectos físicos, biológicos ou sociais.
◦
Kisceral
Apelo aos aspectos místicos, religiosos, etc.
36 Sistemas Multiagentes 36
8ª Aula – Competição
Referência
◦ Dung, P. M. (1995) On the acceptability of arguments and its fundamental role in non-monotonic reasoning, logic programming and n-person games. AI, 77, 321- 357.
Seja a notação x y, significando:
◦Argumento x ataca argumento y;
◦Ou, x é um contra-exemplo para y.
Um sistema de argumentação abstrata é um par A = X ,
onde
◦X é um conjunto de argumentos
◦ X X, é uma relação binária representando a noção de ataque entre argumentos;
37 Sistemas Multiagentes 37
8ª Aula – Competição
Dado um sistema de argumentação abstrata, o que interessa é a estrutura geral de uma argumentação
◦
Não interessa o conteúdo de cada argumento em X
◦
Nem a natureza da relação de ataque.
Por exemplo:
38 Sistemas Multiagentes 38
8ª Aula – Competição
Por exemplo:
Questão Básica:
◦
Em que acreditar ???
39 Sistemas Multiagentes 39
8ª Aula – Competição
Critérios de (Vreeswijk and Prakken, 2000, p. 242)
Dado um sistema de argumentação abstrata <X,>, definem-se:
◦Um argumento x ∈ X é atacado por um conjunto de argumentos Y ⊆ X se ∃y: y ∈ Y ∧ y x (i.e., pelo menos um membro de Y ataca x);
◦Um argumentox ∈ X é aceitável (ou ‗IN‘ )com respeito a um conjunto de argumentos Y ⊆ X se cada atacante de x em Y é também atacado;
◦Um conjunto de argumentos Y é livre de conflito se nenhum argumento em Y ataca algum outro argumento em Y;
◦Um conjunto de argumentos livre de conflito Y é admissível se cada argumento em Y é aceitável com respeito a Y .
40 Sistemas Multiagentes 40
8ª Aula – Competição
Um outro exemplo:
41 Sistemas Multiagentes 41
8ª Aula – Competição Sistemas Multiagentes 4242
8ª Aula – Competição
Sobre Negociação
◦ROSENSCHEIN and ZLOTKIN (1994) Rules of Ecounter:
Designing Conventions for Automated Negotiation among Computers. MIT Press, Cambridge.
Sobre Barganha
◦Cap. 15 de WOOLDRIDGE, M. (2009) An Introduction to MultiAgent Systems. John Wiley & Sons Ltd.
Sobre Argumentação
◦Cap. 16 de WOOLDRIDGE, M. (2009) An Introduction to MultiAgent Systems. John Wiley & Sons Ltd.
◦Dung, P. M. (1995) On the acceptability of arguments and its fundamental role in non-monotonic reasoning, logic programming and n-person games. AI, 77, 321-357.