• Nenhum resultado encontrado

O Teorema de Bayes Mario F. Triola

N/A
N/A
Protected

Academic year: 2021

Share "O Teorema de Bayes Mario F. Triola"

Copied!
9
0
0

Texto

(1)

O Teorema de Bayes

Mario F. Triola

O conceito de probabilidade condicional é apresentado em Introdução à Estatística. Observamos que a probabilidade condicional de um evento é a probabilidade obtida com a condição adicional de que algum outro evento já ocorreu. Usamos para designar a probabilidade condicional de ocorrência do evento B, dado que o evento A já ocorreu. A seguinte fórmula foi fornecida para se encontrar :

)

| (B A P )

| (B A P

) (

) e ) (

|

( P A

B A A P

B

P =

Além da fórmula acima, o livro-texto incluiu também esta “abordagem intuitiva para se encontrar uma probabilidade condicional”:

A probabilidade condicional de B dado A pode ser encontrada supondo-se que o evento A já ocorreu e, trabalhando-se sob essa hipótese, calculando-se a probabilidade de que o evento B ocorra.

Nesta seção, estendemos a discussão da probabilidade condicional para incluir aplicações do teorema de Bayes (ou regra de Bayes), que usamos para rever um valor de probabilidade com base em informação adicional obtida posteriormente. Uma idéia- chave para se entender a essência do teorema de Bayes é reconhecer que estamos trabalhando com eventos seqüenciais, pelos quais novas informações são obtidas para se rever a probabilidade do evento inicial. Nesse contexto, os termos probabilidade a priori e probabilidade a posteriori são comumente usados.

Definições

Uma probabilidade a priori é um valor de probabilidade inicial originalmente obtido antes que seja obtida qualquer informação adicional.

Uma probabilidade a posteriori é um valor de probabilidade que foi revisto usando-se informação adicional obtida posteriormente.

Exemplo 1

A organização Gallup seleciona aleatoriamente um adulto americano para uma pesquisa sobre o uso de cartão de crédito. Use probabilidades subjetivas para estimar o seguinte: a. Qual é a probabilidade de o sujeito selecionado ser homem?

b. Depois de selecionado o sujeito, sabe-se que essa pessoa estava fumando um charuto durante a entrevista. Qual é a probabilidade de que o sujeito selecionado seja homem?

c. Qual dos resultados anteriores é uma probabilidade a priori? Qual resultado é uma probabilidade a posteriori?

(2)

Solução

a. Aproximadamente, metade da população americana é constituída por homens, de modo que estimamos a probabilidade de se selecionar um sujeito homem como 0,5. Representando um homem por M, podemos expressar essa probabilidade como: . P(M)=0,5

b. Embora algumas mulheres fumem charutos, a grande maioria dos que fumam charutos é constituída por homens. Uma aproximação razoável é a de que 85% dos que fumam charutos sejam homens. Com base nessa informação adicional subseqüente, de que o respondente da pesquisa estava fumando um charuto, estimamos a probabilidade de essa pessoa ser um homem como 0,85. Representando um homem por M e um fumante de charuto por C, podemos expressar esse resultado como: P(M |C)=0,85.

c. Na parte (a), o valor de 0,5 é a probabilidade inicial, de modo que nos referimos a ela como probabilidade a priori. Como a probabilidade de 0,85 na parte (b) é uma probabilidade revista com base na informação adicional de que o sujeito da entrevista estava fumando um charuto, esse valor de 0,85 é a probabilidade a posteriori.

O Reverendo Thomas Bayes [1701 (aproximadamente) – 1761] era um pastor inglês e um matemático. Embora nenhum de seus trabalhos tenha sido publicado durante sua vida, publicações posteriores incluíam o seguinte teorema (ou regra), que ele desenvolveu para a determinação de probabilidades de eventos pela incorporação de informação sobre eventos subseqüentes.

Teorema de Bayes

A probabilidade de um evento A, dado que o evento B ocorreu depois, é

[

( ) ( | )

] [

( ) ( | )

]

)

| ( ) ) (

|

( P A P B A P A P B A

A B P A B P

A

P ⋅ + ⋅

= ⋅

Essa é uma expressão formidável, mas vamos simplificar seu cálculo. Veja o exemplo seguinte, que ilustra o uso da expressão acima, mas focaliza, também, o método alternativo com base em uma aplicação mais intuitiva do teorema de Bayes.

Exemplo 2

No condado de Orange, 51% dos adultos são homens. (Não é necessária muita matemática para se deduzir que os outros 49% são mulheres.) Seleciona-se aleatoriamente um adulto para uma pesquisa sobre uso de cartão de crédito:

a. Ache a probabilidade a priori de que a pessoa selecionada seja um homem. b. Sabe-se, depois, que o sujeito de pesquisa selecionado estava fumando um

charuto e que 1,7% das mulheres fumam charutos (com base em dados da Substance Abuse and Mental Health Services Administration). Use essa

(3)

informação adicional para encontrar a probabilidade de que o sujeito selecionado seja um homem.

Solução

Vamos usar a seguinte notação:

=

M homem M = mulher (não um homem)

=

C fumante de charuto C = não fumante de charuto

a. Antes de usarmos a informação dada na parte b, sabemos apenas que 51% dos adultos no condado de Orange são homens, de modo que a probabilidade de se selecionar aleatoriamente um homem é dada por P(M)=0,51.

b. Com base na informação adicional dada, temos o seguinte: 51

, 0 ) (M =

P pois 51% dos adultos são homens 49

, 0 ) (M =

P pois 49% dos adultos são mulheres (não homens) 095

, 0 )

| (C M =

P pois 9,5% dos homens fumam charutos (isto é, a probabilidade de se obter alguém que fume charuto, dado que a pessoa é um homem, é 0,095).

017 , 0 )

| (C M =

P pois 1,7% das mulheres fuma charutos (isto é, a probabilidade de se obter alguém que fume charuto, dado que a pessoa é uma mulher, é 0,017.)

Vamos, agora, aplicar o teorema de Bayes usando a fórmula anterior, com M no lugar de A, e C no lugar de B. Obtemos o seguinte resultado:

[ ] [ ]

[ ] [ ]

do) (arredonda 853

, 0

85329341 ,

0

017 , 0 49 , 0 095 , 0 51 , 0

095 , 0 51 , 0

)

| ( ) ( )

| ( ) (

)

| ( ) ) (

| (

=

=

⋅ +

= ⋅

⋅ +

= ⋅

M C P M P M C P M P

M C P M C P

M P

Antes de sabermos que o sujeito de pesquisa fumava um charuto, havia uma probabilidade de 0,51 de que esse sujeito fosse homem (porque 51% dos adultos do condado de Orange são homens). No entanto, depois de sabermos que o sujeito fumava um charuto, revisamos a probabilidade para 0,853. Há uma probabilidade de 0,853 de que um respondente que fume charuto seja homem.

(4)

Isso faz sentido, porque a probabilidade de um homem cresce enormemente com a informação adicional de que o sujeito fuma charutos (porque muito mais homens fumam charutos do que mulheres).

Teorema de Bayes Intuitivo

A solução anterior ilustra a aplicação do teorema de Bayes com o cálculo usando a fórmula. Infelizmente, o cálculo é complicado o bastante para se criar uma quantidade grande de oportunidades de erro e/ou substituição incorreta dos valores de probabilidade envolvidos. Felizmente, eis uma outra abordagem, que é mais intuitiva e mais fácil:

Suponha algum valor conveniente para o total de itens envolvidos e depois construa uma tabela de linhas e colunas com as freqüências das células baseadas nas probabilidades conhecidas.

Para o exemplo anterior, suponha simplesmente algum valor para a população adulta do condado de Orange, digamos 100.000, e use a informação dada para construir uma tabela, tal como a que é mostrada a seguir.

Encontrando o número de homens que fumam charutos: Se 51% dos 100.000 adultos são homens, então há 51.000 homens. Se 9,5% dos homens fumam charutos, então o número dos homens que fumam charutos é 9,5% de 51.000, ou

. Veja a entrada de 4845 na tabela. Os outros homens que não fumam charutos devem ser

4845 000

. 51 095 ,

0 × =

155 . 46 4845 000

.

51 − = . Veja o valor de 46.155 na tabela. Encontrando o número de mulheres que fumam charutos: Com raciocínio análogo, 49% dos 100.000 adultos são mulheres, de modo que o número de mulheres é 49.000. Dado que 1,7% das mulheres fumam charutos, o número de mulheres que fumam charutos é 0,017×49.000=833

48167 833=

. O número de mulheres que não fumam charutos é 49.000− . Veja as entradas de 833 e 48.167 na tabela.

C

(Fumante de Charuto)

C

(Não Fumante de Charuto) Total

M (homem) 4845 46.155 51.000

M (mulher) 833 48.167 49.000

Total 5678 94.322 100.000

A tabela acima envolve aritmética relativamente simples: Partição da população considerada em diferentes categorias de células através da determinação das porcentagens adequadas.

Agora, podemos facilmente abordar a questão-chave como a seguir: Para encontrar a probabilidade de obter um sujeito homem, dado que o sujeito fuma charuto, simplesmente use a mesma probabilidade condicional descrita no livro-texto. Para encontrar a probabilidade de obter um homem dado que o sujeito fuma charuto, restrinja-se à coluna da tabela dos fumantes de charutos e então ache a probabilidade de obter um homem nessa coluna. Entre os 5678 fumantes de charutos, há 4845 homens, de modo que a probabilidade que procuramos é 4845 5678=0,85329341. Isto é,

853 , 0 085329341 5678

4845 )

|

(M C = = =

P (arredondado).

(5)

Teorema de Bayes Generalizado

A fórmula anterior do teorema de Bayes e o exemplo precedente usam exatamente duas categorias do evento A (homem e mulher), mas a fórmula pode ser estendida para incluir mais de duas categorias. O exemplo que se segue ilustra essa extensão e também uma aplicação prática do teorema de Bayes ao controle da qualidade na indústria. Ao lidarmos com mais de duas categorias da A e A , devemos estar certos de que os múltiplos eventos satisfaçam duas condições importantes:

1. Os eventos devem ser disjuntos (sem interseção).

2. Os eventos devem ser exaustivos, o que significa que sua combinação inclui todas as possibilidades.

Exemplo 3

Um transmissor de localização de emergência de uma aeronave (TLE) é um aparelho projetado para transmitir um sinal no caso de queda. A Altigauge Manufacturing Company faz 80% dos TLEs, a Bryant Company faz 15% deles, e a Chartair Company faz os outros 5%. Os TLEs feitos pela Altigauge têm taxa de defeituosos de 4%, os da Bryant têm taxa de defeituosos de 6%, e os da Chartair, taxa de 9% (o que ajuda a explicar por que a Chartair tem a menor fatia do mercado).

a. Se um TLE é selecionado aleatoriamente da população original de todos os TLEs, ache a probabilidade de que tenha sido fabricado pela Altigauge Manufacturing Company.

b. Se um TLE é selecionado aleatoriamente e testado e se verifica que é defeituoso, ache a probabilidade de ele ter sido fabricado pela Altigauge Manufacturing Company.

Solução

Usaremos a seguinte notação:

Altigauge pela

fabricado TLE

A=

Bryant pela

fabricado TLE

B=

Chartair pela

fabricado TLE

C=

defeituoso é

TLE D=

bom) é (ou defeituoso é

não TLE D=

a. Se um TLE é selecionado aleatoriamente da população geral de todos os TLEs, a probabilidade de ter sido fabricado pela Altiguage é 0,8 (porque a Altigauge fabrica 80% deles).

b. Se sabemos agora que o TLE foi testado e é defeituoso, desejamos revisar a probabilidade da parte (a) de modo que a nova informação possa ser usada. Desejamos encontrar o valor de , que é a probabilidade de que o TLE tenha sido fabricado pela Altigauge, dado que é defeituoso. Com base na informação dada, sabemos estas probabilidades:

)

| (A D P

(6)

80 , 0 ) (A =

P pois a Altiguage fabrica 80% dos TLEs 15

, 0 ) (B =

P pois a Bryant fabrica 15% dos TLEs 05

, 0 ) (C =

P pois a Chartair fabrica 5% dos TLEs 04

, 0 )

| (D A =

P pois a taxa de defeituosos da Altigauge é de 4% 06

, 0 )

| (D B =

P pois a taxa de defeituosos da Bryant é de 6% 09

, 0 )

| (D C =

P pois a taxa de defeituosos da Chartair é de 9%

Eis o teorema de Bayes estendido para incluir três eventos correspondentes à seleção dos TLEs provenientes das três fábricas (A, B, C):

[ ] [ ] [ ]

[ ] [ ] [ ]

do) (arredonda 703

, 0

09 , 0 05 , 0 06 , 0 15 , 0 04 , 0 80 , 0

04 , 0 80 , 0

)

| ( ) ( )

| ( ) ( )

| ( ) (

)

| ( ) ) (

| (

=

⋅ +

⋅ +

= ⋅

⋅ +

⋅ +

= ⋅

C D P C P B D P B P A D P A P

A D P A D P

A P

Teorema de Bayes Intuitivo: Vamos agora encontrar usando uma tabela. Vamos admitir, arbitrariamente, que 10.000 TLEs tenham sido fabricados. (A solução não depende do número selecionado, mas é útil selecionar um número bastante grande de modo que as células na tabela sejam números inteiros.) Como 80% dos TLEs são fabricados pela Altigauge, temos 8000 TLES feitos pela Altigauge e 4% deles (ou 320) são defeituosos. Também, se 320 dos TLEs da Altigauge são defeituosos, os outros 7680 não o são. Veja os valores de 320 e 7680 na tabela abaixo. Os outros valores são encontrados com o mesmo raciocínio.

)

| (A D P

D (defeituosos)

D

(não defeituosos) Total

A (Altigauge) 320 7680 8.000

B (Bryant) 90 1410 1.500

C (Chartair) 45 455 500

Total 455 9545 10.000

Desejamos encontrar a probabilidade de que um TLE tenha sido fabricado pela Altigauge, dado que ele é defeituoso. Como temos a condição de que ele é defeituoso, podemos consultar a primeira coluna de valores, onde vemos que a probabilidade é de 320/455 = 0,703 (arredondado). Esse é o mesmo resultado obtido com a fórmula do teorema de Bayes.

O exemplo anterior envolve uma extensão do teorema de Bayes para três eventos, representados por A, B, C. Com base no formato da fórmula usada na solução, é fácil estender o teorema, de modo que ele possa ser usado com quatro ou mais eventos. (Veja os Exercícios 11 e 12.)

(7)

Exercícios

Resultados de Teste de Gravidez. Nos Exercícios 1 e 2, consulte os resultados resumidos na tabela a seguir.

Resultado do Teste é Positivo

(Indicação de Gravidez)

Resultado do Teste é Negativo

(Sem Indicação de Gravidez)

Pessoa Está Grávida 80 5

Pessoa Não Está Grávida 3 11

1. a. Se um dos 99 sujeitos de teste é selecionado aleatoriamente, qual é a probabilidade de se obter uma pessoa grávida?

b. Um sujeito de teste é selecionado aleatoriamente e faz um teste de gravidez. Qual é a probabilidade de se obter uma pessoa grávida, dado que o resultado do teste é positivo?

2. a. Um dos 99 sujeitos de teste é selecionado aleatoriamente. Qual é a probabilidade de se obter uma pessoa que não esteja grávida?

b. Um sujeito de teste é selecionado aleatoriamente e faz um teste de gravidez. Qual é a probabilidade de se obter uma pessoa que não esteja grávida, dado que o resultado do teste é negativo?

3. Resultados de Sondagem No condado de Orange, 51% dos adultos são homens. Um adulto é selecionado aleatoriamente para uma pesquisa que envolve o uso de cartão de crédito. (Veja o Exemplo 2 nesta seção.)

a. Ache a probabilidade a priori de que a pessoa selecionada seja uma mulher. b. Sabe-se, depois, que a pessoa selecionada para a sondagem estava fumando

charuto. Além disso, 9,5% dos homens fumam charutos, enquanto 1,7% das mulheres o fazem (com base em dados de Substance Abuse and Mental Health Services Administration). Use essa informação adicional para encontrar a probabilidade de que o sujeito selecionado seja uma mulher.

4. Transmissores de Localização de Emergência Um transmissor de localização de emergência (TLE) de aeronaves é um aparelho projetado para transmitir um sinal no caso de queda. A Altigauge Manufacturing Company fabrica 80% dos TLEs, a Bryant Company fabrica 15% deles e a Chartair Company fabrica os outros 5%. Os TLEs fabricados pela Altigauge têm uma taxa de defeituosos de 4%, os fabricados pela Bryant têm um taxa de defeituosos de 6%, e os da Chartair, uma taxa de defeituosos de 9%. (Esses são os mesmos resultados do Exemplo 3 nesta seção.)

a. Ache a probabilidade de se selecionar aleatoriamente um TLE e se obter um fabricado pela Bryant Company.

b. Se um TLE é selecionado aleatoriamente e testado, ache a probabilidade de ter sido fabricado pela Bryant Company, dado que o TLE é defeituoso.

5. Transmissores de Localização de Emergência Use os mesmos dados sobre TLEs do Exercício 4.

(8)

a. Ache a probabilidade de se selecionar aleatoriamente um TLE e se obter um fabricado pela Chartair Company.

b. Um TLE é selecionado aleatoriamente e testado. Se o teste indica que o TLE é defeituoso, ache a probabilidade de ele ter sido fabricado pela Chartair Company.

6. Transmissores de Localização de Emergência Use os mesmos dados sobre TLEs do Exercício 4. Um TLE é selecionado aleatoriamente e testado. Se o teste indica que o TLE não é defeituoso, ache a probabilidade de ele ter sido fabricado pela Autigauge Company.

7. Apelações e Sentenças Em um estudo de apelações e sentenças de prisão, verificou-se que 45% dos sujeitos estudados foram mandados para a prisão. Entre esses enviados à prisão, 40% escolheram admitir culpa. Entre os que não foram enviados à prisão, 55% escolheram admitir culpa.

a. Se um dos sujeitos de estudo é selecionado aleatoriamente, ache a probabilidade de se obter alguém que não tenha sido enviado à prisão.

b. Se um sujeito de estudo é selecionado aleatoriamente e se verifica que esse sujeito entrou com uma apelação de admissão de culpa, ache a probabilidade de que essa pessoa não tenha sido enviada à prisão.

8. Apelações e Sentenças Use os mesmos dados do Exercício 7.

a. Se um dos sujeitos de estudo é selecionado aleatoriamente, ache a probabilidade de se obter alguém que tenha sido enviado à prisão.

b. Se um sujeito de estudo é selecionado aleatoriamente e se verifica que ele entrou com uma apelação de admissão de culpa, ache a probabilidade de que essa pessoa tenha sido enviada à prisão.

9. HIV O New York State Health Department registra uma taxa de 10% para o HIV para a população “de risco”. Sob certas condições, um teste preliminar de controle para o HIV é correto 95% das vezes. (Os sujeitos não são comunicados de sua infecção pelo HIV até que testes adicionais verifiquem os resultados.) Se alguém é selecionado aleatoriamente da população de risco, qual é a probabilidade de ser uma pessoa infectada pelo HIV, sabendo-se que seu resultado no teste preliminar foi positivo?

10. HIV Use os mesmos dados do Exercício 9. Se alguém é selecionado aleatoriamente da população de risco, qual é a probabilidade de que seja portador do HIV, sabendo-se que seu resultado no teste preliminar foi negativo? 11. Estendendo o Teorema de Bayes O Exemplo 3 nessa seção incluiu uma

extensão do teorema de Bayes para incluir três eventos, representados por A, B, C. Escreva uma expressão que estenda o teorema de Bayes de modo que ele possa ser usado para se encontrar , admitindo-se que o evento inicial possa ocorrer de quatro maneiras: A, B, C, D.

)

| (A Z P

12. Extensões do Teorema de Bayes No Exemplo 2, usamos apenas os eventos iniciais de A e A . No Exemplo 3, usamos os eventos iniciais A, B e C. Se os

(9)

eventos B e C no Exemplo 3 forem combinados e designados como A , poderemos achar usando o formato mais simples do teorema de Bayes dado no Exemplo 2. Como o valor resultante de no Exemplo 3 seria afetado pelo uso da abordagem simplificada?

)

| (A D P

)

| (A D P

Respostas dos Exercícios Ímpares

1. a. 85 99 ou 0,859 b. 80 83 ou 0,964 3. a. 0,49

b. 0,147 5. a. 0,05

b. 0,0989 7. a. 0,55

b. 0,627 9. a. 0,679

11.

[ ] [ ] [ ] [ ]

)

| ( ) ( )

| ( )

)

C Z

P ( )

| ( ) ( (

) (

| ( ) ) (

|

( P A P P B P Z B P C P D P Z D

A Z P A Z P

AZ | A) + ⋅ + + ⋅

P = ⋅

Referências

Documentos relacionados

Sem desconsiderar as dificuldades próprias do nosso alunado – muitas vezes geradas sim por um sistema de ensino ainda deficitário – e a necessidade de trabalho com aspectos textuais

Em nosso espaço de coworking, localizado no Brooklin, você encontrá uma variedade de pensadores inovadores, focados em seus trabalhos e em metas para alcançar o sucesso.. Com

Assim, com o aprofundamento e a apreciação das perspectivas educacionais, esta estratégia não apenas vai contribuir para uma estruturação inter-pessoal

Acaso não seja possível o pagamento de todos os credores titulares de créditos entre R$ 5.000,01 (cinco mil e um centavo) até R$ 7.500,00, em razão de o valor adquirido com

Varr edura TCP Window ( cont inuação) ACK- win manipulado Não Responde ACK- win manipulado ICMP Tipo 3 Firewall Negando Firewall Rejeitando Scanner de Porta... Var r edur a FI N/

quedar-se na expectativa para ver co mo se comporia o mercado, mas lambém o fato de que as exportações nos últimos tempos têm incluído consignações de fonte

Concentração de determinada substância, acima da qual podem ocorrer alterações prejudiciais à qualidade do solo e da água subterrânea VALOR DE PREVENÇÃO -

Os motins na América Portuguesa tanto quanto na Espanhola derivam do colapso das formas acomodativas - como será melhor explicado à frente -, ou melhor dizendo, do rompimento