pesquisa em metaconlingências.
Pyego de Cravalho C osta'v Cldii»srt de Ponles Vieira Nogueira'
I .ucas Calda»'
I emanda Duarte'
Laércia Alm»u Vasconcelos1 April Hecker* Daniele Ortuv Sigrid S. C/Ienn1' 1 Wniversidcidc dc Hrasilia
9
Wnivcrsify o! Nortb lcx>isJogo do Dilema do Prisioneiro
O Jogo Dilema do Prisioneiro (PDG) foi criado por l ucker om 1950 (Axelrod, 2006). A situação original onvolve os seguintes personagens e contexto: dois ladrões, Al e Bob, sâo capturados e acusados de um mesmo crime. Presos om colas separadas e sem a comunicação entre eles, o delegado de plantao faz a seguinte proposta: cada um pode escolher entre confessar ou negar o crime. A pena que eles deverão cumprir depende da combinação da respostas de ambos. So nenhum deles confessar, ambos serão submetidos a uma pena de um ano. Se os dois confessarem, então ambos terão pona de cinco anos. Mas se um confessar e o outro negar, então o que confessou será libertado o o outro será condenado a 10 anos de prisão. Vale ressaltar, que o delegado não possui provas suficientes para incriminação dos suspeitos pelo crime, mas possui para outros crimes classificados como mais brandos. Portanto, a prova de que nocessita ó a confissão. A matriz a seguir apresenta as conseqüências do jogo Dilema do Prisioneiro, em cujas células se aloca as conseqüências das escolhas combinadas
Bob
Confessar Negar
Al Confessar -5 ,-5 0 , -10
Negar -10 , 0 -1 . -1
Figura 1 Matriz de consequências no PDG original Cada célula possui poyoffs correspondentes à combinaçào de respostas de Al e Bob
O Im b u íd o le v o o rtfx4o (In C A P E S
1
/1 t ) D y o g o d o C 0 <>*Ut, C U fiit u i cki P V N u y u e tifi L ik . h i C n k l « » F n m a r x lft D im rltv L a à r t i a A V * f t c n n c « l o « . Ap ril B o c k w 4 O O m it o ln O rtu . S to rk ) S f ik in nDe acordo com a situação que é apresentada pode-se observar que individualmonto ó mais vantajoso para o infrator confessar o crimo. Tomando Al como oxemplo, podc*sc raciocinar da seguinte forma: se Bob confessar, ó melhor que Al também confesse, pois dessa forma ele evitará pegar a pena severa o cumprirá uma pena média; caso Bob negue, também é melhor que Al confesse pois em voz do cumprir uma pena branda ele será liberado (enquanto Bob cumprirá uma pena severa). O mesmo raciocínio vale para Bob. No ontanto, é mais vantajoso para o grupo (Al e Bob) quo os dois neguem o crime (ambos cumprindo uma pena branda) (Silverstein, Cross, Brown & Rachlin, 1998).
O Jogo do Dilema do Prisioneiro - Prisoner's Dilemma Game (PDG) - é um instrumento de pesquisa amplamente utilizado om áreas diversas tais como a biologia, oconomia, direito, psicologia, filosofia, computação, lingüística o ciôncia política (Lima, 2005). Essa diversidade de áreas podo ser explicada pela possibilidade do quantificação de interações sociais a partir do PDG. Ao considerar a ároa da matemática aplicada, a teoria dos jogos, o PDG é um dos mais divulgados entro outros como, a Tragédia dos Comuns e a Batalha dos Sexos (Fiani, 2004). A teoria dos jogos envolve investigação e análise de modelos matemáticos da escolha de decisões ótimas sob condições do conflito (Axelrod, 2006).
Os jogos da teoria dos jogos constituem uma classo de fenômenos chamados dilema social. Kollock (1998) define diloma social como a situação aonde um indivíduo tem uma escolha a fazer entre ganhos individuais e ganhos grupais, sendo os ganhos individuais sempre maiores o/ou menos atrasados que os grupais. O paradigma do dilema do prisioneiro já captura a imagmaçao dos cientistas sociais por mais do trôs décadas em parto porque parece que ele ilumina aspectos sociais fundamentais do comportamento humano o o potoncial intorosso social ao invés do puro intorosse Individual, por isso sondo considerado um dilema social.
O arranjo experimental básico para uma pesquisa utilizando o PDG ó constituído de dois participantes com a possibilidade de escolher, a cada tentativa, entro duas alternativas, a alternativa cooperativa e a alternativa competitiva.
Dessa forma, a combinação das oscolhas dos jogadores determina os pontos individuais Nosto jogo, os termos cooporação e competição são detinidos de acordo com a ação do participante baseada om interesses do grupo ou om interesses individuais respectivamente. Dessa forma, cada jogador tem a possibilidade de ganhar mais pontos escolhendo a alternativa competitiva, no entanto, se ambos competirem eles ganharão menos pontos do que se tivossom escolhido a alternativa cooperativa (Faleiros, 2009). Vale ressaltar que os termos cooperação e competição são omitidos para os jogadores.
O PDG refere-se ao jogo com dois jogadores composto por apenas uma tentativa e com duas altornativas do oscolha. Existem outras possibilidades como o IPDG que se refere ao PDG com várias tentativas e o NPDG que é o PDG jogado por mais do dois jogadores (Axelrod & Hamilton, 1981; Komorita, 1980; Yi & Rachlin, 2004). O IPDG dá aos participantes a oportunidade de desenvolver estratégias durante o jogo, dontre elas: sempre cooperar (ALLC), sempre competir (ALLD), alternar entro cooperar o competir (ALTDC), escolher aleatoriamente (RAN) e escolher a mesma altornativa que o outro jogador escolheu na tentativa anterior (TFT ou Tit for Tat - "olho por olho, dente por dente"). Outra variação do PDG é o SPD (Dilema do Prisioneiro Sequencial) em que as escolhas dos participantes se dá do forma soquencial c não simultanoamcnto como geralmente acontece, ou seja, quando o jogo possui dois participantes, o primeiro jogador faz a sua oscolha o esta é observada polo segundo antes de anunciar a sua escolha (Oskamp, 1971).
Segundo Rachlin e cols. (2001) o comportamento do jogador no IPDG depende da oxporiôncia em tentativas anteriores e da probabilidade da reciprocidade do outro jogador om futuras tentativas O comportamento de um jogador está relacionado ao comportamonto do outro jogador de duas formas: 1) a resposta do jogador A funciona como estimulo discriminativo para a resposta do jogador B na tentativa seguinte (jogos simultâneos) ou na mesma tontativa (jogos soqüonciais) c 2) a conseqüência para a resposta do logador B depende da resposta do |ogador A na mesma tentativa. Esta interdepondôncia entre os comportamentos dos jogadores caracteriza o comportamento social que ó definido por contingências comportamentais entrelaçadas (Andery, Michelleto & Sério, 2005) - o comportamonto de um organismo exercendo a função de estímulo antocodonto o/ou conseqüonto para o comportamonto de outro organismo - o que justifica a utilização do IPDG para a investigação do fonômenos sociais.
tstudos sobre o comportamento social utilizando o IPDG investigaram a influência do algumas variáveis nas oscolhas dos indivíduos. Dentre elas, a probabilidade de reciprocidade pelo adversário (Baker & Rachlin, 2001), a história do exposição a algumas estratégias (Silverstein, Cross, Brown & Rachlin, 1998), o acesso intermitente à pontuação recebida (Silverstein, Cross, Brown & Rachlin, 1998), o acesso à soma da pontuação do oulro participante (Faleiros, 2009) e a estratégia utilizada pelo adversário (Yi & Rachlin, 2004).
O eloito da comunicação entre os participantes loi investigado no ostudo de Bohnot o Froy (1998). Participnntos humanos foram divididos om grupos do quatro o designados a uma de (rês condições experimentais: (a) Anônimo, em que os quatro jogadores não podiam se ver ou se comunicar e o anonimato era mantido; (b) Com identificação silenciosa, om quo os jogadores se viam mas não podiam se comunicar; (c) Com comunicação frente a fronte, em que os participante se viam o podiam se comunicar. Os resultados mostraram que a porcentagem de cooporação dos participantes do grupo com idontificação silenciosa foi significativamente maior do que a porcentagem do cooperaçao observada nos participantes do grupo anônimo (23% o 12% rospectivamonto). Os participantes do grupo com comunicação fronte a frente obtiveram os níveis mais altos de cooperaçao (78%).
Faleiros (2009) manipulou o acesso â soma da pontuação do outro participante Os participantes jogaram contra um jogador virtual cujas respostas seguiam a estratógia TFT. Havia trôs grupos de acordo com o acosso à soma da pontuação obtida polo jogador virtual (que eles acreditavam ser um jogador real): Grupo Som Acesso (SA), om que o participante nunca tinha acosso à soma da pontuação do jogador virtual; Grupo Acesso Sempre (AS), em que o participante sempre tinha acesso à soma da pontuação do jogador virtual, e Grupo Acesso Randômico (AR), em quo o jogador tinha acosso à soma da pontuação do jogador virtual apenas om tentativas randomicamente selecionadas, Todos os participantes tinham acesso ã sua própria pontuação em todas as tentativas. Os resultados sugorom que o acesso à pontuação obtida pelo adversário diminui a taxa do cooperação. O grupo com acesso randômico apresentou os níveis mais baixos de cooperação.
Clark o Softon (2001) utilizaram o Jogo do Dilema do Prisioneiro com oscolhas seqüenciais (SPD - Diloma do Prisioneiro Sequencial). Nesta variação do jogo, o primoiro jogador escolho cooperar ou competir o, após observar esta oscolha, o segundo jogador faz a sua escolha. O SPD aqui utilizado continha apenas uma tentativa. O objetivo do estudo foi invostigar o aumento do custo da reciprocidade positiva (cooperar quando o outro coopera) na taxa do escolhas cooperativas omitidas pelos participantes. Cada participante jogou dez vezes com dez participantes díforentes. Houvo também a
Í f - /> Dywgo Or C Cmlu, Clnriuiut du P V Nojjiifiittt. l itc*» CmIiIm» FttnutiHif) Dunrln. 1 nóri:)uA
manipulação da pontuação rocebida pelos participantes de duas formas: (1) a pontuação para as quatro combinações possíveis foi dobrada; (2) apenas o valor recebido pelo participante que compote quando o outro participante coopera foi dobrado (aumento do custo da reciprocidade positiva). Os resultados mostraram que dobrar todos os valoros recebidos pelos participantes nâo afetou significativamonte a taxa de reciprocidade positiva, mas esta taxa diminuiu quando apenas o valor para a resposta do competição diante da resposta de cooperação do outro participante foi dobrado.
Valluri (2006') aponta que a utilização de escolhas sequenciais no ÍPDG gera níveis mais altos do cooperação em comparação à versão simultânea do jogo. No entanto, ao utilizar o PDG com apenas uma tentativa, escolhas seqüenciais o escolhas simultâneas goram nívois semelhantes de cooporação.
Yi o Rachlin (2004) no Experimento 1, utilizaram o INPDG com cinco participantes com o objetivo do avaliar o efeito das estratégias TFT e RAN nas escolhas dos participantes. Os cinco participantes de cada grupo jogavam ao mesmo tempo, na mesma sala (em cabines isoladas), cada um utilizando um computador, o acroditavam estarem jogando uns com os outros (eles não podiam so comunicar durante o jogo). Na verdade, cada participante jogava com quatro jogadores virtuais (DPs) cujas ostratógias eram pró-determinadas de acordo com a condição (TFT ou RAN). Na estratégia TFT todos os participantes virtuais começavam escolhendo Y. Após a escolha do participante um dos DPs copiava a resposta do participante. Logo se na primeira tentativa o participante oscolhosso X, na tentativa 2, um dos DPs cscolhorin X o os outros 3 Y o assim por diante. A cada tentativa os participantes deveriam escolher entre X (competir) e Y (cooperar), e os pontos que eles recebiam dependiam tanto das suas oscolhas como das oscolhas dos jogadores virtuais de acordo com as soguintes oquaçõos:
Y = n x 3 X = Y W n = número do possoas que escolhem Y
As equações acima indicam que o número de pontos recebidos pelos participantes que escolhem a opção Y é igual ao número do participantes que escolhem esta opção multiplicado por trôs. O númoro do pontos recebidos pelos participantes que escolhem a opção X ó igual ao númoro do pontos recebidos pelos participantes que escolhem a opção Y somado a sete unidades. Dessa forma, se três participantes escolherem a opção Y o dois escolherem a opção X, os que escolhem a opção Y recebem 9 pontos e os que escolhem a opção X recebem 16 (Yi & Rachlin, 2004).
Os resultados mostraram uma maior frequência de cooperação para os participantes que jogaram contra a ostratógia TFT. Além disso, foi observado quo mesmo no grupo RAN (em que as rospostas dos jogadores virtuais não deveriam 1er influência sobre as respostas do participante) o participante cooperava com uma menor probabilidado após uma tontativa na qual todos os 4 DPs competiam (Yi & Rachlin, 2004).
O estudo acima citado é de importância fundamental para os procedimentos de metacontingência utilizando PDG, pois foi o primeiro ostudo em análise do comportamento com mais de 2 pessoas e com sua fórmula viabiliza os pontos resultantes de forma a nao descaracterizar o jogo como diloma social.
Todos estes ostudos relatados utilizaram versões do PDG amplamonto
divulgados na litoratura de comportamento social o economia comportamental (e.g., Axolrod, 1980; Kieslor & cols, 1996). O IPDG (várias tentativas), o NPDG (mais do dois participantes) o o SPD (escolhas seqüenciais) tôm om comum o fato de envolvorom a liberação dn uma pontuação para cada participante a partir da combinação das escolhas de todos os mombros. Esto tipo de manipulação, como já foi visto, ó ideal para o estudo do comportamento social já que as conseqüências individuais dependem das respostas dos outros participantes, o que caracteriza as contingências com portam entais entrelaçadas. No entanto, para o estudo do metacontingências, faz-se necessário que haja, além das consequências individuais, conseqüências para o grupo contingente à omissão de entrelaçamentos específicos.
Metacontingência ó a relação contingente de um ambionte externo (consequência cultural), com as CCEs o o produto agrogado (Glonn, 2004). Pertoncom a essas CCEs as contingências operantes que mantém o responder do cada participante, permitindo a essa consequência cultural selecionar e manter o padrão de CCEs.
No presente momento existem dois arranjos exporimentais para o estudo de metacontingência com PDG Ambas com as mesmas premissas, utilizando fórmulas para cálculos dos pontos o o conceito de consequência cultural como evento ambiental selecionador de padrão do entrelaçamento de contingências (CCE) e o produto resultante dessas CCEs (Glenn, 2008). Uma parte importante do conceito em metacontingência são as linhagens comportamentais que são repetições de CCEs intra e entre gerações, selecionada pelos eventos ambientais culturais (Glenn, 2003). Para se adequar ao conceito foi utilizado o INPDG (mais de uma tentativa e mais de 2 participantes) com 3 e 4 participantes. Para esse fim as escolhas entro duas alternativas são as respostas individuais, as CCEs são as interações das respostas como estimulação antecedente o/ou conseqüento de um participante para os demais; o produto agregado é a soma dos pontos individuais e a conseqüência cultural é um feedback de mercado que adiciona ou remove pontos para o grupo dependendo da CCE e Produto Agregado gorado pelas escolhas dos participantes, como ilustrado na figura 2.
Cpto de 2 ou mm* ( » « • O M i Ci# r#co»r«nt#* * #*nr#i«<;a<k"U no ambwiite Produto cultural Pof\hi^»o r aonmuuut» i AçAo do arriMente ftxMfno / S Mt>laconting*rK.iN
Consequência
CuíturaiFigura 2 - Esquema de metacontingência envolvendo o INPDG
Arranjo Experimental 1 (Ortu, Glenn e Woelz, 2008)
Nesse arranjo experimental sào usados 5 contputadores om rede (um para cada participante o um para o experimentador). É dito aos participantes que eles são donos de uma emprosa e a quantia que eles ganharão no experimento dopendem do que eles escolheram na sessão. A fórmula que determinava os pontos dos participantes foi:
C Q Dyngn dn C. Co«lu, ClnrltM (to P V Noyimira. Lucnt ChIiím». FbttmmiI« Diwrtn. Lafecia A
X = n x 4 Y = X + 7 n = número de pessoas que escolhem X
Cada tentativa consisto de um tempo determinado pelo experimentador, ondo os participantes devem fazer uma escolha entre X ou Y (assim como no experimento do Yi o Rachlin, 2004) No inicio da tontativa aparecia a monsagom para que escolhossom (Figura 3).
Flyura 3 - Tela inicial vista por cada um dos participantes, do programa usado por Becker e Glenn (2010) e Ortu, Glenn e Woelz (2008).
Logo após a resposta de um participante, sua escolha se torna visível aos domais. Quando todos fazom suas oscolhas, a pontuação do cada participante ó apresentada. (Figura 4)
«•v* 1 Wü0
Go «tend1 X You choote. Y * p+rm I <Yi il « (O «0*4 II '«*Figura 4 - Apresentação dos pontos individuais após a escolha de todos os participantes
A conseqüência cultural é apresentada como o quanto será adicionado ou retirado de cada participante baseado no montanto para o grupo e é aplicado imediatamente, como um feedback de mercado sobre itens dossa empresa vendidos (figura 5). Essa conseqüência é apresentada em esquema do razão variável 2 (VR 2). É importante salientar três coisas nessa arranjo experimental; 1) um participante podo esperar os demais responderom para cscolhcr a sua alternativa (sc aproximando do modo sequencial do PDG); 2) há um chat do comunicação entre os participantes durante todo o jogo e 3) os participantes não se vêem O critério para mudança de fase consistia na emissão do 8 coordenações (todos respondendo na mosma alternativa) consocutivas de acordo com a contingência.
Figura 5 - Gxemplo de apresentação da consequência cultural
Arranjo Experimental 2 (Costa, 2009; Nogueira, 2009)
fcsse arranjo é baseada no estudo de Vi o Rachlin (2004) e Ortu, Glenn o Woelz (2008).
Assim como no arranjo experimental anterior há duas alternativas, a fórmula utilizada foi a mesma do estudo acima (uma adaptação da fórmula usada em Yi o Rachlin, 2004)
Nesse arranjo experimental as alternativas são dois cartões coloridos: um verde e um vermelho. O primeiro correspondia à alternativa competitiva ou do maior ganho individual e diminuição dos ganhos do grupo, e o segundo era a opção cooperativa diminuindo assim os ganhos individuais, porém maximizando os pontos do grupo.
Esse arranjo experimental foi realizado com 3 o 4 participantes e de forma simultânea e soquencial. A forma simultânea (Costa, 2009 e Nogueira, 2009) consistia em dizer "Escolham um cartáo" e todos deveriam apresentar suas escolhas simultanoamonte. Essas escolhas eram projetadas om uma planilha de Excel©, por um datashow em uma ela do projeção do 1,5 x 1,5 m, quo retornava com os valoros calculados das pontuações obtidas. No primeiro ostudo os participantes estavam soparados por placas de madeira, que formavam cabines lado a lado para quatro participantes. O segundo estudo não separava os participantes, mas estos permaneciam lado a lado.
r *
O y e y o d o C C o » l » . C l u r l » * * i k t P V N o y m H r H . L i k ; h » C h U I i i » . H i r r u t n r i « D i m í t n l a é n u u AJ Q
VH« (x> no »< lo » . A(>r!l B f t r k o r D u n io lo O r t u S t g r k l S ü l o n nNa Figura 6 ó apresentada a tela de início com um campo para cada participante, uma caixa do grupo o a pontuação atualizada a cada tentativa. A figura 7 apresenta os pontos individuais corrospondentes às escolhas e o momento da apresentação da conseqüôncia cultural em uma simulação do algumas tenatativas.
E l ,
P o n to » n ' m t i . 1 * W 1 p \ u - - 9 --- J 0 Q__
& 0 0 G c 6 0 1 C • 1 0 0 ft 0 « 0 0 • 0 0 » 0 0 0 TíTi " f c f l f l i llFigura 6 - Tela inicial antes das escolhas dos cartões (superior) Nas 3 primeiras colunas i Inserido a escolha dos participantes1 g(vermelho) e i (verde) No segundo conjunto de colunas nomeadas P1/P2/P3 aparecem os pontos calculados a partir da combinação de escolhas A coluna nomeada Total, apresenta o Produto Agregado (soma dos pontos Individuais) e a coluna verde nomeada Mercado apresenta o (eeüback tíe mercado (consequência cultural). Ainda l\á dois conjuntos de colunas denominadas pontos Na mais acima sSo os pontos Individuais e do grupu E na logo inferior a soma dos pontos Individuais e do grupo após a divisào
Coelho* h w m ] * 9 9 9 0 I i - l i ... ~~~ * PI Pi « ( t» 'í 12 17 A 11 11 ! » 1 0 9 i 0 I) 0 0 0 0 u 0
fl
I H MtHOitO OfftCAfK)Figura 7 Apresenta as mesmas informações que a tala inicial (Figura 6), com a aimulaçâo da algumas combinações possíveis, pontuação individual, produto agregado e a consequência cultural quando o VR 2 estava em vigor na tentativa O número 60 na coluna mercado indicava que a CCE apresentada na tentativa era a alvo de seleção, as demais combmaçoes guiavam o número 0 na coluna Mercado
A forma seqüencial desse arranjo experimental foi realizada por Nogueira (2009) onde um participante realizava sua escolha apenas após escolha prévia por outro participante (com exceção do primeiro), soh solicitação do experimentador. Vain ressaltar quo a ordem dos participantes variava no docorrer do experimento.
Ambos os estudos pesquisaram o papel da comunicação, pormítindo-a para os grupos com comunicação e nào fornecendo essa opção aos grupos sem comunicação. A comunicação neste arranjo experimental é diforonte da presente no anterior. Nesta era vocal e permitida apenas a cada bloco de tentativas (10 ou 20) era pormitido aos grupos verbais que se comunicassem por uma quantidade de tempo O bloco do oscolhas era todo realizado sem interação verbal alguma. A justificativa para isso era verificar a extensão do controlo verbal sobro as respostas e doixar o momonto de escolha mais próximo do PDG tradicional onde nào havia comunicação. A consequência cultural para essa arranjo experimental também era chamada de feedback de mercado que era adição (Costa, 2009 e Norgueira, 2009) ou retiradas (Costa, 2009) de pontos de uma caixa própria (dependendo do que se pretendia selecionar) chamada caixa do grupo, que ao final era rateado pelos participantes.
Fm ambos os arranjos além da pergunta central de se uma conseqüência cultural é capaz de selecionar determinados padrões recorrentes de CCE, existom outras possíveis variáveis passíveis de serem manipuladas. Dentre elas estão: 1) transmissão para outras gerações; 2) papel da magnitude do conseqüências individuais x culturais; 3) acoplamento do consequências culturais do um grupo a outro, tornando* a não contingente às CCEs do novo grupo; 4) probabilidade de conseqüência cultural; 5) custo da resposta diferenciado para a produção do conseqüência cultural. Dentro outras tantas possíveis variávois a serem testadas com PDG o com metacontingôncias.
Para concluir, os estudos utilizando ambos os arranjos têm logrado êxito em obter seleção do CCEs pela adição de conseqüência cultural, a despeito da diferonça do como esta é apresentada (Costa, 2009; Nogueira, 2009; Ortu, Glnnn e Woelz, 2008). Os dados presentes nesses estudos apontam o PDG como uma ferramenta com potencial para figurar entre as possibilidades metodológicas para pesquisa em metacontingência. Dentre as razões está: 1) o PDG pode ser manipulado para inserir uma séria do variáveis; 2) pela característica de interdependência do jogo, ele fica facilmente caracterizado como um exemplo de contingências comportamentais entrelaçadas; e 3) há a separação entre os termos de uma metacontingência. Existem algumas dificuldades, no entanto. A primeira delas se refere ao produto agregado ser a mora soma dos Individuais, seria interessante colocá-lo do outra forma; a conseqüência cultural e individual poderiam ter qualidades reforçadoras distintas para haver uma maior separação entre ambas; e em um jogo com tentativas, a m anipulação da apresentação da conseqüência cultural, fica restrito a esquemas de reforçamento de razão.
R e fe rê n c ia s
Andery, M A ; Micheletto, N., & Sério, T. M (2005) A Análise de fenômenos sociais: esboçando uma proposta para a Identificação de contingências entrelaçadas e metacontingôncias Enr Todorov J C.; Martone, R C & Moreira, M B (Orfls ) Metocontingôncias' Comportamento, Culturo e Sociodode (pp 129-147) Santo Andrè1 ESETnc
Axelrod, R. (2006). The Evolution of Cooperation Revised Edition New York-NY' Basic Books