• Nenhum resultado encontrado

Exemplo simples de tomada de decisão e o problema das 3 portas

Este é um problema bastante conhecido e aparentemente contra intuitivo para muitos que o encontram pela primeira vez. Pode ser facilmente resolvido usando teoria de probabilidade e ajuda a ilustrar um problema de teste de hipóteses, que permite fazer uma decisão sobre que curso de ação deve-se tomar.

O nome do jogo está associado a um programa de TV e a seu anfitrião: Monty Hall. Considere o seguinte jogo assimétrico, entre um jogador Je a bancaB. Bmonta o jogo da seguinte forma que é de conhecimento público. Há tres portas fechadas e atrás de uma delas há um prêmio e nada atrás das outras duas. Bpede ao jogadorJque aponte uma das portas. EntãoB, que sabe onde está prêmio, diz:

“nao vou tocar a porta que voce escolheu e vou abrir uma das outras duas, que eu sei que estará vazia”. Efetivamente, abre uma das outras duas e mostra que está vazia. Não existe a possibilidade de que abra a porta do prêmio. Bagora dá uma nova chance aJe pergunta se quer mudar de opinião sobre a porta que escolheu. Jtem à sua frente duas possibilidades (i) muda ou (ii) mantém a escolha inicial. O que deve ser decidido é se tanto faz mudar ou não ou seja se há uma melhor estratégia e caso haja, qual é.

A resposta é que sim há uma estratégia melhor e ela é queJdeve MUDAR de porta. Muitas pessoas neste ponto reclamam e discordam. Pare para pensar se isto é óbvio ou não.

A solução do problema pode ser encontrada de várias maneiras, mas aqui estamos interessados em aprender sobre teste de hipóteses. A obtenção da resposta decorre de aplicar a seguinte estrategia: Escreva quais são as asserções possíveis e depois escreva as probabilidades e use quando e se possível, a regra de Bayes.

Considere as seguintes asserções, para cadai=1, 2, ou 3:

Nome Asserção

Hi: “O prêmio está atrás da portai”

Di; “a bancaBabre a portai”

Ii “Japonta inicialmente a portai”

Suponha queI1é verdade e deve ser entendido como dado do problema, pois determina simplesmente as condições em que se dará o jogo. Qualquer outra porta que tivesse escolhido seria chamada aqui de porta1.

Qual é a probabilidade a priori de que o prêmio esteja na portai?

Raciocinado de acordo com um principio de razão insuficiente, Jdeve atribuirP(Hi) =1/3, já que não há informação para diferenciar uma porta da outra. E após ter feito a escolha inicial da porta? Ainda deve serP(Hi|I1) =1/3, pois o simples fato de apontar a porta não deveria mudar a probabilidade de esconder o prêmio.

A pergunta queJestá se fazendo poderá ser respondida só após receber a informação deB, por exemplo que a porta 3 é aberta, ou sejaD3é verdade. Isto é informação relevante: o prêmio não está atrás de 3. Esta informação forma o conjunto de dados queJusará para decidir.

O teste de hipótese deve decidir entreH1eH2, sob a luz da

informação recebida, o que significa que deve compararP(H1|D3I1)e P(H2|D3I1). Definamosrpor

r:= P(H1|D3I1) P(H2|D3I1)

Ser>1, dada a informação disponívelH1é mais provável e a porta 1 deverá se escolhida. Ser<1, a porta 2, e ser=1, tanto faz.

Para calcular essas probabilidades usaremos a regra de Bayes. A probabilidade conjunta deHieDjdadoIkpode ser escrita de duas formas diferentes:

P(HiDj|Ik) = P(Hi|Ik)P(Dj|HiIk)

= P(Dj|Ik)P(Hi|DjIk), (6.61) isto é, para analisar a probabilidade conjunta deHieDjserem verdade dadoIk, primeiro podemos considerarHie depois, sendoHi verdade, considerar a probabilidade deDjser verdade, dadoHi, sempre dadoIk, assim obtemos a primeira equação. Podemos inverter a ordem, começando por analisarDj, obtendo a segunda equação. Os dois resultados devem ser iguais, pois se não fossem certamente seriamos levados a uma inconsistência, assim segue a regra de Bayes:

P(Hi|DjIk) = P(Hi|Ik)P(Dj|HiIk) P(Dj|Ik) .

Novamente esta regra é a base para qualquer problema onde nova informaçãoDjnos leve a rever o que pensamos das diferentes hipótesesHi. Isto é, descreve a forma como devemos mudar a atualização de probabilidades em face à nova informaçãoDj. O teste de hipótese requer calcular

r= P(H1|D3I1)

P(H2|D3I1) = P(H1|I1)P(D3|H1I1) P(H2|I1)P(D3|H2I1).

Agora devemos calcular cada um dos quatro fatores que aparecem no lado direito da equação acima. Repetimos queapriori

P(H1|I1) =P(H2|I1) =P(H3|I1) =1/3 por simetria.

As verossimilhanças por outro lado nâo sao iguais e este é o ponto surpreendente. Consideremos primeiroP(D3|H1I1). Estas condições descrevem a situação em queBsabe que o prêmio está na porta1e que foi indicada porJ. EntãoBpoderá escolher entre as portas 2 e 3.

Qual é o motivo para queBabra uma ou outra com diferente probabilidade? Não há. EntãoP(D2|H1I1) =P(D3|H1I1), mas como Bdeve escolher entre uma e outra e nao há mais possibilidades temos queP(D2|H1I1) =P(D3|H1I1) =1/2. Ou seja, sob as condiçõesH1I1

a banca conclui queD2eD3são exaustivas, mutuamente exclusivas e logo concluimos que a probabilidade de estar atrás da porta2é o dobro que estar atrás da porta1e portanto a estrategia é que deverá mudar da porta1para a2.

Considere a generalização do problema acima paraNportas,k prêmios e a abertura deaportas. Considere um prêmio, um milhão de portas e a abertura de 999.998 portas. So ficam duas portas fechadas, uma indicada porJinicialmente e outra escolhida porB cuidadosamente. ChamemosD/856.322a asserção “Abriu584.416 portas e pulou a584.417que J tinha escolhido, depois abriu até a856.321e pulou a porta856.322e continuou abrindo até chegar à última”. Só temos duas hipóteses a confrontar: HJque diz que o prêmio está atrás da porta escolhida pelo jogador, 584.417 eHBque diz que o prêmio está atrás da porta 856.322, pulada pela banca. Fica mais intuitivo ? O teste de hipóteses dá

É claro agora que o fato de J escolher aleatoriamente, sem informação nenhuma que quebre a simetria inicial entre as portas, leva a a que o prêmio tenha uma probabilidade muito baixa de estar na que escolheu. A banca sabe onde está o prêmio. Cuidadosamente evita uma porta em particular,abrindo todas as outras. O conjunto de portas não apontado inicialmente porJtem uma probabilidade P(HJ) =1−N1 de conter o prêmio. A informação queBfornece ao abrir as portas evita dizer qualquer informação sobre o domínio apontado por J, sem revelar exatamente a localização do prêmio. A cada porta aberta, a probabilidade queJtenha acertado não muda, nem a probabilidadeP(HJ)mas esta se distribui igualmente por um número cada vez menor de portas. Quando só sobra uma porta fechada além da escolhida inicialmente, toda essa probabilidade se concentra.

Exercícios Propostos

• Laplace estudou o seguinte problema:

Considere três urnas idénticas. Com base unicamente na informação a seguir

1. Cada urma tem duas bolas. Uma tem duas bolas brancas (U0), outra tem uma branca e uma preta (U1) e a terceira duas pretas (U2).

2. Independentemente de qualquer outra coisa, uma urna é escolhida sem que haja preferência por alguma delas.

3. Da urna escolhida uma bola é extraida. A bola é branca e colocada novamente na urna

4. Da mesma urna, uma bola é escolhida. Novamente a bola é branca.

calcule a probabilidade que a urna escolhida sejaU1e a probabilidade que sejaU2. Valendo zero pontos, a probabilidade de serU3.

Tente estruturar a sua solução de forma a que seja útil para atacar outros problemas. Defina as asserções importantes no problema, por exemploW1= "a primeira bola extraida é branca". Defina qual é a asserção cuja probabilidade é pedida, incluindo (!!!) as condições. Use argumentos de simetria onde for necessário e não esqueça de

identificar onde estes argumentos foram usados. Use as regras do produto e soma, use marginalização e independência.

1.b)Caso geral: TemosM+1 urnas indexadas porKque toma valores inteiroskde zero aM. Nak-ésima urnakbolas são pretas e as outras M−ksão brancas. Uma urna é escolhida sem que haja preferência por alguma em especial. Uma bola é retirada, sua cor anotada, sendo recolocada na urna. Isto é repetidoNvezes com a mesma urna. O número de bolas pretas extraidas no total é J. Qual é a probabilidade dak−ésima urna ter sido escolhida dadosM,NeJ: P(k|M,N,J)? Dica: Suponhakconhecido e calcule a probabilidade deJ. Faça a inversão.

Documentos relacionados