• Nenhum resultado encontrado

3.2 – Modelos de probabilidade discretos Função massa de probabilidade.

No documento IntProbabilidadeReanimat (páginas 69-83)

Como dissemos anteriormente uma variável aleatória é uma variável que associa valores numéricos aos resultados de uma experiência aleatória. Vimos também na secção anterior, que o facto de termos um modelo de probabilidade associado ao fenómeno aleatório, permite-nos associar probabilidades aos valores da variável aleatória, as quais devem satisfazer deterrminadas propriedades.

Dada uma variável aleatória discreta X, que assume um número finito de valores distintos x1, x2, …, xi, …, xN, então as probabilidades pi=P(X=xi), i=1,…,N, devem satisfazer as seguintes condições: i) 0 ≤ pi ≤1, i =1,…,N ii) pi i=1 N

= 1

O conjunto {(xi, pi), i=1,…,N} constitue a distribuição de probabilidades de X, também chamada de função massa de probabilidade de X.

Exemplo 3.2.1 – Um casal planeou ter 3 filhos. Admitindo igual probabilidade para o nascimento de um rapaz ou de uma rapariga, considere a variável aleatória que representa o número de raparigas de entre os 3 filhos e determine a sua função massa de probabilidade.

Resolução: Este exemplo é idêntico ao exemplo 3.1.1, se identificarmos o nascimento de uma filha como o resultado de saída de cara no lançamento da moeda equilibrada, já que admitimos igual probabilidade para o nascimento de rapaz e rapariga. Assim, a variável aleatória X, que representa o número de raparigas, num casal de 3 filhos, tem a seguinte função massa de probabilidade:

X=i 0 1 2 3

P(X=i) (1/2)3 3x(1/2)3 3x(1/2)3 (1/2)3

Uma vez definida a função massa de probabilidade, podemos determinar facilmente probabilidades de acontecimentos relacionados com o fenómeno aleatório em estudo. Por exemplo:

Probabilidade do casal ter mais do que uma rapariga: P(X>1) = P(X≥2) = P(X=2) + P(X=3)

Probabilidade do casal só ter rapazes: P(X=0) = 1/8

Probabilidade do casal ter 1 ou 2 raparigas: P(1≤X≤2) = P(X=1) + P(X=2)

= 3/8+3/8 = 3/4

Exemplo 3.2.1 (continuação) – Repetindo o exemplo anterior, mas considerando agora 4 filhos e representando por Y a variável aleatória que representa o número de raparigas num casal de 4 filhos, para obter a sua distribuição de probabilidades, veja-se o exemplo 2.1.2, obtendo-se imediatamente:

Y=i 0 1 2 3 4

P(Y=i)=pi 1/24 4 x 1/24 6 x 1/24 4 x 1/24 1/24

Exemplo 3.2.2 - Numa determinada Faculdade, o Conselho Directivo (CD) escolheu aleatoriamente 3 estudantes para integrarem este órgão, como representantes das opiniões dos estudantes. No que diz respeito à avaliação contínua, sabe-se que 40% dos alunos são a favor e os estudantes que compõem o grupo têm opiniões independentes uns dos outros.

a) Representando por X a variável aleatória que representa o número de estudantes que integram o CD, que são a favor da avaliação contínua, vem que X pode assumir os valores 0, 1, 2 ou 3. Se representarmos os estudantes por A, B e C, quando são a favor, e por A , B e C , quando são contra, todas as possíveis combinações de opiniões são:

ABC AB C A B C A B C A BC A B C A B C A B C X=3 X=2 X=1 X=0 Assim, P(X=0) = P( A B C ) = 0.63 = 0.216 P(X=1) = P(A B C ou A B C ou A B C) = P(A B C ) + P( A B C ) + P( A B C) = 0.4

0.6

0.6 + 0.6

0.4

0.6 + 0.6

0.6

0.4 = 3

0.4

0.62 = 0.432 P(X=2) = P(AB C ) + P( A BC) + P(A B C) = 0.4

0.4

0.6 + 0.6

0.4

0.4 + 0.4

0.6

0.4 = 3

0.42

0.6 = 0.288

P(X=3) = P(ABC) = 0.43

= 0.064

pelo que a função massa de probabilidade será:

X=i 0 1 2 3

P(X=i) 0.216 0.432 0.288 0.064

b) Em termos de X, o acontecimento “a maioria dos representantes dos alunos é a favor da avaliação contínua” exprime-se simplesmente X≥2, pelo que a probabilidade daquele acontecimento será P(X≥2) = 0.288 + 0.064 = 0.352.

3.2.1 – Distribuição de probabilidades versus distribuição de frequências

A distribuição de probabilidade da variável aleatória não é mais do que um modelo matemático que se idealizou para descrever o comportamento do fenómeno aleatório em estudo. Assim, se tivessemos observado o fenómeno aleatório repetidas vezes, e aqui apelamos para que se recorde a definição que demos de fenómeno aleatório - fenómenos cujos resultados individuais são incertos, mas para os quais se admite uma regularidade a longo termo, possibilitando a obtenção de um padrão genérico de comportamento, a distribuição de frequências obtida a partir das observações feitas, dar-nos-ia uma imagem desse tal padrão genérico de comportamento, a distribuição de probabilidade ou função massa de probabilidade.

Exemplo 3.2.3 (Graça Martins et al, 1999) - Seja X a variável aleatória que representa o número de caras que saem no lançamento de 4 moedas. Obtenha uma aproximação para a distribuição de probabilidades de X.

Resolução: Começamos por obter a distribuição de probabilidades de X e de seguida obtemos a aproximação, por intermédio da distribuição de frequências, comparando ainda os resultados obtidos.

1 . Distribuição de probabilidades

A experiência aleatória que consiste em verificar o número de caras que saem no lançamento de 4 moedas é idêntica à que consiste em verificar o número de filhas dos casais de 4 filhos, se admitirmos que a probabilidade de nascer rapaz é igual à de nascer rapariga, ou seja 1/2. Então o modelo para a variável aleatória X já foi obtido no exemplo 4

Distribuição de probabilidades de X

X=xi 0 1 2 3 4

pi=P(X=xi) 0.0625 0.250 0.375 0.250 0.0625

2 . Distribuição de frequências

Numa turma de 14 alunos pede-se a cada aluno que repita 20 vezes a experiência de lançar as 4 moedas e que registe o número de faces obtidas em cada lançamento. Uma vez realizadas as experiências cada aluno indica os resultados que obteve, de forma a preencher uma tabela com 14 colunas: Aluno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 1 1 1 4 0 0 1 2 1 1 1 2 1 2 1 1 0 2 0 3 1 2 2 3 3 1 3 4 1 2 3 2 2 2 3 1 3 3 2 0 1 2 3 2 2 1 2 2 1 2 1 1 2 2 1 3 2 3 2 3 1 2 1 3 2 4 4 3 2 2 0 1 1 1 3 2 1 2 2 3 3 3 3 0 3 1 1 2 3 2 3 1 0 2 2 3 1 4 2 3 3 2 3 1 1 2 2 4 1 3 2 4 3 3 2 2 3 2 2 3 2 2 3 3 2 2 2 1 3 1 3 3 4 2 1 1 2 3 4 0 1 2 1 1 2 1 2 1 2 3 2 2 1 2 3 0 2 2 2 3 2 2 1 1 3 2 3 1 1 2 2 2 3 2 3 1 2 2 2 4 0 1 2 3 2 0 3 1 3 2 0 3 2 2 2 1 1 3 1 2 2 1 4 2 1 2 1 3 3 2 3 1 2 2 3 2 2 1 3 1 2 4 1 3 3 4 3 3 0 4 1 4 2 2 2 0 4 4 3 1 3 2 1 1 2 2 4 3 3 1 1 1 3 2 2 1 2 2 3 1 2 3 2 2 2 2 2 3 1 0 3 2 2 2 3 1 2 4 1

A partir da tabela anterior constrói-se a tabela de frequências relativas:

Distribuição das frequências relativas

nº faces 0 1 2 3 4

freq. relat. 0.057 0.261 0.371 0.243 0.068

A seguir apresentamos uma representação gráfica conjunta da distribuição de frequências (diagrama de barras) e da distribuição de probabilidades, onde se pode verificar como a distribuição de frequências é uma boa aproximação para a distribuição de probabilidades e portanto o modelo proposto parece ser adequado para descrever o fenómeno em estudo:

3.2.2. – Valor médio e desvio padrão de uma variável aleatória discreta 3.2.2.1 – Valor médio de uma variável aleatória discreta

Em Estatística, uma das formas utilizadas para resumir a informação contida nos dados é através do cálculo de certas medidas, a que se dá o nome de estatísticas – medidas calculadas a partir dos dados, antes de serem organizados na forma de uma tabela de frequências, ou a partir da distribuição de frequências dos dados, depois de serem organizados. Destas medidas destacámos a média, como medida de localização do centro da distribuição de frequência dos dados e o desvio padrão amostral, como medida de variabilidade dos dados, relativamente à medida de localização mais utilizada, a média.

Então, de acordo com o que dissemos na secção anterior, parece natural estender a definição de média e de desvio padrão amostral, agora para o caso de termos a distribuição de probabilidades.

Considerando o exemplo anterior, vejamos como calcular a média da amostra, a partir dos dados agrupados:

x = 0

0.057 + 1

0.261 + 2

0.371 + 3

0.243 + 4

0.068 = 2.004

Se na expressão anterior substituirmos as frequências relativas pelas probabilidades, de acordo com a distribuição de probabilidades, então obteremos uma característica idêntica à média, mas agora associada à variável aleatória, a que damos o nome de valor médio, e representamos por

 = 0

0.0625 + 1

0.250 + 2

0.375 + 3

0.250 + 4

0.0625 = 2 De um modo geral tem-se

Dada uma variável aleatória discreta que assume os valores x1, x2, …, xk, com probabilidades p1, p2, …, pk, define-se valor médio de X, e representa-se por , como sendo o valor que se obtém multiplicando os valores que a variável assume pelas respectivas probabilidades

  = x1 p1+ x2 p2+ … + xk pk =

i1 k

xi pi

Exemplo 3.2.4 – De acordo com o Census 2001, a distribuição do número de pessoas por agregado familiar é a seguinte:

Dimensão

agregado 1 2 3 4 5 6 7 8 9 ≥10

agregados 631762 1036312 918735 718492 226234 76714 25390 9563 4074 348

Um Censo é uma sondagem em que toda a População é inquirida, tornando possível obter um modelo exacto da sua distribuição. Neste caso, a partir da tabela anterior construímos o seguinte modelo de probabilidade para a variável aleatória X, que representa o número de pessoas que constituem um agregado familiar, escolhido ao acaso, de entre os agregados familiares portugueses:

X=i 1 2 3 4 5 6 7 8 9 10

P(X=i) 0.1732 0.2841 0.2519 0.1970 0.0620 0.0210 0.0070 0.0026 0.0011 0.0001

O modelo só não traduz completamente a realidade porque substituímos todos os valores ≥10, que a variável assumia, pelo ponto 10, uma vez que o número de casos em que a dimensão do agregado é superior a 10 é muito pequeno e tem pouco significado. Assim, achámos razoável considerar o modelo anterior, já que convém não esquecer que o que se procura é um modelo que seja útil e que traduza tão fielmente quanto possível, a realidade.

Agora, a partir da tabela anterior, podemos calcular a dimensão média dos agregados familiares portugueses, obtendo-se o valor de 2.8 pessoas por agregado familiar. Esta informação é bastante importante para os empresários que se dedicam à construção civil. Efectivamente o

investimento em casas com muitas assoalhadas não se justifica, já que a grande parte dos agregados familiares é constituído pelo casal e um filho.

Podemos também a partir da função massa de probabilidade anterior, calcular probabilidades de alguns acontecimentos, nomeadamente, a probabilidade de um agregado familiar, escolhido ao acaso:

a) Ser constituído por mais de 3 pessoas  P(X>3) = P(X≥4) = 0.2908 b) Ter entre 2 e 4 pessoas  P(2≤X≤4) = 0.7330

c) Ter menos de 4 pessoas  P(X<4) = 1-P(X≥4) = 1-0.2908 = 0.7092

Repare-se que a percentagem de agregados familiares que tem entre 2 e 4 pessoas é de cerca de 73%, o que vai de encontro à observação que fizémos anteriormente sobre o número de assoalhadas das casas.

Suponhamos agora que se recolheu uma amostra de 100 agregados familiares e se registou a respectiva dimensão (No anexo 1 apresentamos um processo para simular a recolha de uma amostra aleatória a partir de uma determinada distribuição de probabilidade discreta):

2 4 2 1 1 2 3 1 5 2 4 4 3 1 1 3 4 2 1 3 1 1 2 6 4 3 4 5 2 5 3 4 5 2 5 2 2 3 2 1 5 4 1 1 2 3 3 3 6 1 2 1 2 2 4 1 1 5 4 2 5 4 2 5 3 2 2 2 5 4 3 2 4 2 4 3 1 4 2 5 3 2 3 2 3 3 2 2 2 4 1 2 3 3 2 2 4 1 3 4

A média desta amostra é 2.79.

Recolheram-se mais algumas amostras, tendo-se registado as respectivas médias. Obtiveram-se valores todos diferentes uns dos ourtros, embora aproximados. Como seria de esperar, a média varia de amostra para amostra, já que existe sempre uma certa variabilidade presente na amostra. Pelo contrário o valor médio é um valor fixo – é uma característica do fenómeno aleatório em estudo, que normalmente é desconhecido, se não tivermos um modelo de probabilidade que o descreva, mas para o qual se pode obter um valor aproximado, recolhendo uma amostra e calculando a média. Pode-se mostrar (embora saia do âmbito deste curso) que:

Dado qualquer fenómeno aleatório cujos resultados sejam numéricos e que tenha valor médio , então, à medida que se repete o fenómeno, a média dos resultados observados aproxima-se cada vez mais do valor médio, isto é, à medida que a dimensão da amostra aumenta, a média da amostra tende a aproximar-se do valor médio do fenómeno aleatório.

A propriedade anterior explica a razão pela qual as casas de jogo não vão à ruína. Efectivamente, um jogador pode ao fim de alguns jogos estar a ganhar ou a perder dinheiro! Mas o que é certo é que ao fim de muitos jogos o valor médio do lucro pode-se prever e é sempre um ganho para a casa de jogo!

Exemplo 3.2.5 (Adaptado de Mann, 1995) – Num jogo semelhante à Raspadinha, cada bilhete custa 1 euro e os prémios que se podem ganhar são 500 euros, 23 euros, 13 euros, 7 euros, 3 euros e 1 euro. Cada bilhete tem uma superfície susceptível de ser raspada, a qual revela um dos prémios anteriores ou nenhum prémio. São postos em circulação 6 000 000 bilhetes, de acordo com a seguinte distribuição:

Prémio Número de bilhetes

0 4 640 940 1 999 960 3 222 000 7 60 000 9 37 500 13 24 000 23 15 000 500 600 Total = 6 000 000

Será que um indivíduo que jogue sistematicamente este jogo, pode vir a ter a esperança de ficar rico?

Resolução:

Representando por X a variável aleatória que representa o lucro de um jogador que jogue neste jogo, temos X = xi P(X= xi) -1 0.77349 0 0.16666 2 0.03700 6 0.01000 8 0.00625 12 0.00400 22 0.00250 499 0.00010

Utilizámos a regra de Laplace para calcular as probabilidades anteriores. O valor médio da variável aleatória X é –0.43659. Qual a interpretação que podemos dar a este resultado? Significa que se considerarmos todos os jogadores, eles perdem em média aproximadamente 44 cêntimos por bilhete. Podemos ainda fazer a seguinte interpretação: Só 56.34% (100cêntimos- 43.659) do dinheiro gasto pelos jogadores é que reverte para esses mesmos jogadores na forma de prémios. O restante, ou seja 43.66% será para pagar as despesas e o que sobrar será lucro para a empresa detentora do jogo.

Exemplo 3.2.6 (adaptado de Moore, 1997) – Uma companhia de seguros instituiu um seguro de vida com a duração de 5 anos, para indivíduos de 21 anos, do sexo masculino, segundo a seguinte modalidade: a companhia paga uma indemnização de 100 mil euros se o segurado morrer nos próximos 5 anos, sendo o prémio anual de 250 euros. Pretende-se saber qual o lucro esperado para a companhia de seguros, tendo em conta as seguintes probabilidades:

Idade morte 21 22 23 24 25 ≥26

Probabilidade .0018 .0019 .0019 .0019 .0019 .9906

Resolução:

Seja X a v.a. que representa o lucro auferido pela companhia de seguros ao longo dos anos em que o seguro é válido:

Idade morte 21 22 23 24 25 26

X -99750 -99500 -99250 -99000 -98750 1250

Probabilidade .0018 .0019 .0019 .0019 .0019 .9906

Utilizando a expressão para o cálculo do valor médio temos que o lucro esperado é de aproximadamente 305 euros.

Tendo em conta o resultado anterior estaria disposto a assumir perante um amigo a responsabilidade que a companhia de seguros assume perante os seus segurados? Obviamente que não! O risco seria enorme. Como a companhia de seguros faz milhares de apólices deste tipo, tem um lucro garantido, já que o valor médio é positivo.

3.2.2.2 – Desvio padrão de uma variável aleatória discreta

Retomando o exemplo 3.2.3 que serviu para introduzir o valor médio a partir da média, vamos agora calcular a variância amostral para os mesmos dados agrupados

s2 = (0-2.004)2

0.057 + (1-2.004)2

0.261 + (2-2.004)2

0.371 + (3-2.004)2

0.243 + (4- 2.004)2

0.068

Se na expressão anterior substituirmos as frequências relativas pelas probabilidades, de acordo com a distribuição de probabilidades, e a média pelo valor médio, então obteremos uma característica idêntica à variância amostral, mas agora associada à variável aleatória, a que damos o nome de variância (populacional), e representamos por 2,

2

= (0-2)2

0.0625 + (1-2)2

0.250 + (2-2)2

0.375 + (3-2)2

0.250 + (4-2)2

0.0625 = 1 donde o desvio padrão (populacional),  vem igual a 1.

Dada uma variável aleatória discreta que assume os valores x1, x2, …, xk, com probabilidades p1, p2, …, pk, define-se variância (populacional) de X, e representa-se por , como sendo o valor

  = (x1 - ) 2 p1+ (x2 - ) 2 p2+ … + (xk - ) 2 pk = i1 k

(xi - ) 2 pi

À raiz quadrada da variância chamamos desvio padrão (populacional).

Exemplo 3.2.4 (Continuação) – Utilizando a expressão anterior, facilmente se obtém que o desvio padrão da variável aleatória que representa o número de pessoas de um agregado familiar português é 1.34.

Tal como no caso do desvio padrão amostral, que mede a maior ou menor variabilidade dos dados relativamente à média, também o desvio padrão (populacional) mede a maior ou menor variabilidade com que a variável aleatória se distribui relativamente ao seu valor médio.

Exemplo 3.2.5 (Graça Martins et al, 1999) - O João pergunta ao Miguel o que é que ele prefere: ganhar 25 euros, qualquer que seja o resultado observado no lançamento de uma moeda, ou ganhar 75 euros se no lançamento da moeda sair face, e perder 25 euros se sair coroa? O Miguel fica indeciso e pede-lhe um conselho. O que é que lhe aconselharia?

Resolução:

Na 1ªhipótese ganha sempre 25 euros, pelo que o lucro esperado é 25 euros.

Na 2ª hipótese temos uma variável que assume os valores –25 euros (perda) e 75 euros (ganho) com probabilidade 1/2:

Valor -25 euros 75 euros

Probabilidade 0.5 0.5

O valor médio desta variável é

-25 euros x 0.5 + 75 euros x 0.5 = 25 euros

Aparentemente as duas hipóteses são equivalentes pois em média dariam o mesmo ganho. O que é que então nos pode levar a decidir por uma ou outra das hipóteses? Vejamos o que se passa com a variabilidade: no 1º caso a variabilidade é igual a zero, pois temos um acontecimento certo, enquanto que no 2º caso a variância é igual a

(-25 euros – 25 euros)2x 0.5 + (75 euros –25 euros)2 x 0.5 = (50 euros)2

pelo que o desvio padrão é igual 50 euros. Isto significa que, embora em média, as duas hipóteses sejam equivalentes, na 2º hipótese corre-se um risco, pois se numa jogada se pode ganhar 75 euros, também se pode perder 25 euros!

Existem alguns modelos de probabilidade que merecem relevo especial, devido a serem muito utilizados em situações da vida real. Um desses exemplos é o modelo Binomial, que apresentamos na secção seguinte.

3.2.3 – O Modelo Binomial

Consideremos as seguintes situações e as variáveis aleatórias indicadas:

Num estudo de opinião sobre se as pessoas são ou não a favor do aborto, seleccionam- se aleatoriamente 100 lisboetas e pergunta-se a cada um se é a favor do aborto; o número de pessoas que responde “sim” é uma variável aleatória X;

Numa escola com 2000 alunos, em que a percentagem de raparigas é 60%, seleccionam-se aleatoriamente 15 para organizarem as festas de fim de ano lectivo; o número de raparigas que pertence a esta comissão é uma variável aleatória Y;

Considera-se um lote de 50 peças produzidas por uma máquina que produz 5% de peças defeituosas; o número de peças defeituosas no lote das 50 é uma variável aleatória Z.

De todos os doentes que sofrem de uma doença do estômago, 45% apresentam melhoras com um determinado medicamento. Seja U a variável aleatória que representa o número de doentes que apresentam melhoras, de entre os próximos 30 a tomarem o medicamento.

Todas as situações descritas anteriormente podem ser modeladas pelo mesmo modelo de probabilidade, já que são idênticas nos seguintes aspectos:

i) Considera-se à partida um número fixo n de experiências aleatórias, a que é usual chamar provas;

ii) Os resultados das experiências são independentes uns dos outros;

iii) Em cada experiência pode-se obter um de dois resultados possíveis, a que chamamos sucesso ou insucesso;

iv) A probabilidade de sucesso p, é constante de experiência para experiência.

À variável X que representa o número de sucessos nas n provas chama-se variável aleatória com distribuição Binomial de parâmetros n e p e representa-se por XB(n,p).

Os valores que esta variável pode assumir são

0, 1, 2, …, n

Para descrever completamente a variável aleatória em estudo é necessário calcular a probabilidade da variável aleatória ssumir cada um dos valores anteriores. Antes de obtermos o modelo geral, vejamos o seguinte exemplo:

Exemplo 3.2.6 - Um rapaz vai para um exame de escolha múltipla em que cada questão tem 5 respostas possíveis, das quais só uma é a certa. O rapaz não estudou, pelo que responde sistematicamente ao acaso. Estude a variável X que representa o número de respostas certas num exame de 4 questões.

Resolução:

O número X de respostas certas pode ser igual a 0, 1, 2, 3 ou 4 e a probabilidade de responder certo a uma questão é 0.2.

P(X=1)=P(1 resposta certa e 3 respostas erradas) = 4 x 0.751 x (1-0.75)3 (o coeficiente 4 corresponde ao número de maneiras de escolher a resposta certa, de entre os 4) P(X=2)=P(2 respostas certas e 2 respostas erradas) = 6 x 0.752 x (1-0.75)2 (o coeficiente 6

corresponde ao número de maneiras de escolher as 2 respostas certas, de entre os 4) P(X=3)=P(3 respostas certas e 1 resposta errada) = 4 x 0.753 x (1-0.75)1 (o coeficiente 4

corresponde ao número de maneiras de escolher as 3 respostas certas, de entre os 4) P(X=4)=P(4 respostas certas e 0 respostas erradas) = 1 x 0.754 x (1-0.75)0

Do cálculo combinatório, sabe-se que o número de maneiras possíveis de escolher k sucessos de entre n observações é dado pelo coeficiente binomial

Ckn  n k      = n! k! (n - k)!

Com esta notação P(X=k) =

Ck 4

x 0.75k x (1-0.75)4-k, com k=0, 1, 2, 3 ou 4.

De um modo geral, se X tem distribuição Binomial de parâmetros n e p,

P(X=k) =

Ck n

x pk x (1 - p)n-k para k = 0,1,2,…, n.

Exemplo 3.2.7 (Adaptado de Moore, 1996)– Segundo a genética, os descendentes herdam os genes dos pais, independentemente uns dos outros. Se ambos os pais têm genes sanguíneos de tipo A e O, cada descendente tem uma probabilidade 0.25 de ter dois genes O, isto é sangue de tipo O. Se uma destas famílias tem 5 descendentes, qual a probabilidade de dois deles terem sangue de tipo O?

Resolução:

Seja X a variável aleatória que representa o número de descendentes em 5, que tem sangue de tipo O. Então, X tem uma distribuição Binomial de parâmetros 5 e 0.25, ou seja

XB (5,0.25) Para calcular a probabilidade pretendida, temos

P(X=2) = C25 0.252x0.753 = 0.26

Aplicação do modelo Binomial (Graça Martins et al, 1999)

Na vida real surgem-nos com frequência situações que podem ser bem modeladas pelo modelo Binomial. Por exemplo, suponhamos que recolhemos uma amostra aleatória de 15 alunos de

uma universidade com 10000 alunos, onde sabemos que a percentagem de raparigas é 51%. Qual a distribuição da variável aleatória que representa o número de raparigas na amostra seleccionada? Será que estamos numa situação em que se aplica o modelo Binomial? Não, se pensarmos estritamente nas condições que nos conduzem a este modelo, nomeadamente no facto de ser constante a percentagem de sucessos, quando se realizam as sucessivas provas (selecção dos alunos). No caso presente, se ao seleccionarmos o primeiro aluno dos 10000 alunos, retirarmos uma rapariga, ficamos com 5099 raparigas, pelo que a probabilidade de sucesso para a prova seguinte será de 509/9999 = 0.509950995…: se pelo contrário o aluno seleccionado for rapaz, a probabilidade de sucesso para a prova seguinte será 510/9999 = 0.510051005…. No entanto, estes valores são tão próximas de 0.51, que em termos práticos podemos dizer que o facto de termos retirado um elemento da população, não alterou a sua composição. O mesmo raciocínio pode ser feito para as provas seguintes. Assim, podemos dizer que a variável aleatória que representa o número de raparigas (sucessos) na amostra de 15 alunos, pode ser aproximadamente modelada por uma distribuição Binomial de parâmetros n=15 e p=0.51.

Quando o número de elementos de uma população é substancialmente maior que a dimensão n de uma amostra aleatória simples retirada dessa população, então o número de sucessos obtidos na amostra pode ser aproximadamente modelado pela distribuição Binomial, com parâmetros n e p, sendo p a proporção de sucessos na população. A aproximação é tanto melhor, quanto maior for a dimensão da população, quando comparada com a da amostra.

Exemplo 3.2.8 – O Departamento de Controlo de Qualidade de uma empresa selecciona, do conjunto de parafusos produzidos durante uma hora por uma máquina, uma amostra de 10 parafusos para inspecção. Sabe-se que a percentagem de parafusos defeituosos produzidos pela máquina é de 10%. Qual a probabilidade de na amostra seleccionada não haver parafusos defeituosos?

Resolução:

Se representarmos por X a variável que representa o número de parafusos defeituosos em 10, temos que a distribuição de X pode ser considerada Binomial de parâmetros 10 e 0.10, isto é,

XB (10, 0.1) Então, a probabilidade pretendida será

P(X = 0) = 0.3487

Podemos concluir do resultado anterior que, embora a percentagem de obter parafusos defeituosos seja de 10%, há uma probabilidade relativamente elevada (aproximadamente 35%) de seleccionarmos 10 parafusos, todos bons. Significa isto que numa inspecção sobre a qualidade dos parafusos, amostras de dimensão 10 são demasiado pequenas.

3.3

– Modelos de probabilidade contínuos. Função densidade de

No documento IntProbabilidadeReanimat (páginas 69-83)

Documentos relacionados