VARIÁVEL ALEATÓRIA
É uma função que associa um número real a cada evento elementar de um espaço amostral. Notação: X, Y, Z, W, ... .
Quando uma variável aleatória assume apenas um número finito de valores ela se denomina variável aleatória discreta.
Exemplo:
E: lançar duas moedas distintas Ω: { CC, CK, KC, KK}
Consideremos a variável aleatória X que indica a ocorrência de caras. Assim: X(CC) = 0
X(CK) = 1 X(KC) = 1 X(KK) =2
Função probabilidade:
A probabilidade de uma variável aleatória X assumir o valor k, e indicamos por 𝑝(𝑋 = 𝑘) é dada pela função distribuição de probabilidade. No caso do exemplo anterior, temos:
𝑃(𝑋 = 0) = 1/4 𝑃(𝑋 = 1) = 2/4 𝑃(𝑋 = 2) = 1/4
Distribuição de Bernoulli:
Neste caso, a variável aleatória X assume apenas dois valores: X = 0 (fracasso)
X = 1 (sucesso)
Nestas condições, se 𝑝(𝑋 = 0) = 𝑝 e 𝑝(𝑋 = 1) = 𝑞 segue que: 𝑝 + 𝑞 = 1
Exemplo:
E: lançar um dado Ω:{1, 2, 3, 4, 5, 6}
Considerando sucesso a ocorrência do número 6, segue que: 𝑝(𝑋 = 1) = 𝑝(6) =16 (p) 𝑝(𝑋 = 0) = 𝑝({1, 2,3,4,5}) =56 (q) 𝑝 + 𝑞 =1 6+ 5 6= 1 (100%) DISTRIBUIÇÃO BINOMIAL
Neste caso, consideremos a ocorrência de n eventos do tipo Bernoulli, estatisticamente independentes todos com a mesma probabilidade de sucesso p e de fracasso q. Consideremos agora a variável aleatória Y que indica a ocorrência de sucesso nos n eventos. Então:
0 ≤ 𝑌 ≤ 𝑛
Exemplo:
Lançar um dado 10 vezes. Assim, considerando SUCESSO a ocorrência do número 6 (em cada lançamento), se Y é a variável aleatória que indica o número de sucessos nos 10 lançamentos, segue que:
0 ≤ 𝑌 ≤ 10 Nestas condições, 𝑝(𝑌 = 0) = 𝑝(𝑌 = 10) = A fórmula:
𝑝(𝑋 = 𝑘) = (
𝑛
𝑘) 𝑝
𝑘𝑞
𝑛−𝑘= 𝐶
𝑛,𝑘𝑝
𝑘𝑞
𝑛−𝑘 Exemplos:1) Uma moeda honesta é lançada 6 vezes. Qual a probabilidade de observarmos exatamente 2 caras? R: 23,44%
2) Um time de futebol tem probabilidade 𝑝 = 3/5 de vencer todas as vezes que joga. Se disputar 5 partidas, qual a probabilidade de que vença ao menos uma? R: 98,97%
EXERCÍCIOS
1. Em uma caixa temos: 3 bolas verdes, 2 bolas brancas e 4 bolas pretas.
Retiram-se 3 bolas desta caixa, sucessivamente, com reposição. Qual
a probabilidade de ser obter:
a) Nenhuma vez a bola verde?
b) 3 vezes a bola branca?
c) No máximo uma bola branca
d) Pelo menos uma vez a bola preta?
2. Uma certa companhia de aviação chegou a conclusão que 5% das
pessoas que fazem reserva em determinado voo não comparecem ao
embarque. Consequentemente adotou a política de reservar 77 lugares
nos seus aviões que têm 75 lugares. Determine a probabilidade de que
todas as pessoas que comparecerem ao embarque de um voo
selecionado ao acaso, encontrarão lugar.
3. Um indústria examina a cada hora 30 peças. Se for encontrada ao
menos 1 peça defeituosa, a fabricação é interrompida e a causa é
pesquisada. A porcentagem de peças com defeito é conhecida e tem
sido sempre de 5%. Considerando um dia de trabalho com 8 horas,
quantas vezes por dia, no máximo, podemos esperar que a fabricação
seja interrompida?
DISTRIBUIÇÃO DE POISSON
Para entender esta distribuição, devemos observar que em muitos casos conhecemos o número de sucessos, mas não podemos determinar, por não ter sentido, o número de fracassos ou de provas.
Exemplificando, se anotarmos o número de carros que passam por um posto de pedágio durante determinado intervalo de tempo, saberemos o número de sucessos, mas não sabemos nem podemos determinar o número de fracassos, ou seja, o número de carros que deixaram de passar pelo posto.
Da mesma forma, o número de emendas em um determinado comprimento de fita colante, pode ser determinado, mas não tem sentido indagarmos pelo número de emendas que não ocorreram.
Não podemos assim, evidentemente, aplicar neste caso o modelo Binomial, pois nos falta o número de fracassos e, consequentemente, o número de provas, que é indeterminado.
Entretanto, analisando os exemplos acima, vemos que em todos eles há uma variável que condiciona de certa forma a probabilidade de sucessos: se aumentarmos, no posto de pedágio, o tempo de observação, a probabilidade de observamos a passagem de um carro tende a aumentar, da mesma forma que se aumentarmos o comprimento de fita colante a ser observado, a probabilidade de aparecer uma emenda também tende a aumentar.
Vamos chamar esta variável de t, e formular as seguintes hipóteses que nos permitirão construir um modelo capaz de explicar os problemas do tipo que acabamos de mencionar.
1ª HIPÓTESE: Para um intervalo de observação Δt suficientemente pequeno (ou seja,
para Δt tendendo a zero) a probabilidade de um sucesso é proporcional ao intervalo: 𝒑 ( 𝑿 = 𝟏, 𝜟𝒕 ) = 𝝀 . 𝜟𝒕
2ª HIPÓTESE: Para um intervalo de observação Δt suficientemente pequeno, a
probabilidade de ocorrer mais do que um sucesso é desprezível, ou seja 𝒑 ( 𝑿 > 𝟏, 𝜟𝒕 ) = 𝟎
3ª HIPÓTESE: Como consequência das hipóteses acima, a probabilidade de não ocorrer
nenhum sucesso no intervalo de observação Δt será:
𝒑 ( 𝑿 = 𝟎, 𝜟𝒕 ) = 𝟏 − 𝒑 ( 𝑿 = 𝟏 ) = 𝟏 − 𝝀 . 𝜟𝒕
4ª HIPÓTESE: As ocorrências de sucessos em intervalos Δt disjuntos são
Ora, o nosso problema é determinar p ( X = k ) em um intervalo t. Observe que este intervalo pode ser um tempo t, um comprimento t, etc., onde a variável X pode assumir um número finito de valores ( 0, 1, 2, 3, . . . ).
Entretanto, como as nossas hipóteses foram formuladas para um intervalo Δt suficientemente pequeno, vamos dividir o intervalo t em n partes iguais, com n suficientemente grande, de tal modo que
𝚫𝐭 = 𝐭 / 𝐧 seja suficientemente pequeno para n suficientemente grande, ou seja, Δt tende a zero quando n tende ao infinito.
Observe agora que:
1°) Em cada Δt só pode ocorrer um sucesso com probabilidade
𝒑 ( 𝑿 = 𝟏 , 𝜟𝒕 ) = 𝝀 . 𝜟𝒕 = 𝝀 .𝒕 𝒏
2°) Em cada Δt pode não ocorrer nenhum sucesso (fracasso) com probabilidade
𝒑 ( 𝑿 = 𝟎 , 𝜟𝒕 ) = 𝟏 − 𝝀 . 𝜟𝒕 = 𝟏 − 𝝀 .𝑡 𝑛
3°)O que ocorre em um intervalo 𝜟𝒕 = 𝒕 / 𝒏 não depende do que ocorre nos outros
intervalos. Assim, temos todas as condições de aplicar uma binomial com n provas, ou seja: 𝑝(𝑘, 𝑡) = lim 𝑛→∞𝐶𝑛,𝑘( 𝑡 𝑛) 𝑘 (1 −𝑡 𝑛) 𝑛−𝑘
e desenvolvendo o limite acima, obtemos a fórmula da distribuição de Poisson:
𝒑(𝑿 = 𝒌, 𝒕) =
(𝒌!𝒕)𝒌𝒆
𝒕Onde e é o número irracional de Neper sendo;
e = 2,7182818284590452353602874...
PROPRIEDADES
1ª) A soma das probabilidades 𝑝 (𝑋 = 𝑘) para todos os valores da variável k é igual a
1 (100%).
2ª) A média ou Esperança Matemática da distribuição de Poisson é dada por:
𝑬(𝑿, 𝒕) =𝒕
.
Assim a fórmula da distribuição de Poisson pode ser escrita como:
𝒑(𝑿 = 𝒌, 𝒕) =
(𝝁)
𝒌𝒌!
𝒆
𝝁EXERCÍCIOS
Na resolução dos exercícios, vamos utilizar o número e com arredondamento para quatro casas decimais, ou seja: e = 2,7183.
1) Suponhamos que em média, o número de carros que chega a um posto de pedágio em 10 segundos seja igual a 3. Determine a probabilidade de que cheguem 0, 1, 2, 3, . . . carros ao posto em um intervalo de 10 segundos.
NÚMERO DE CARROS A CADA 10 SEG (K) PROBABILIDADE p( k,10seg ) NÚMERO DE CARROS A CADA 10 SEG (K) PROBABILIDADE p( k,10seg ) 0 7 1 8 2 9 3 10 4 11 5 12 6 13
2) Suponhamos que em média uma pessoa em 500 cometa um erro numérico ao preparar o Imposto de Renda. Se 1.120 formulários de Imposto de renda forem selecionados ao acaso e examinados, determine a probabilidade de que:
a) dois formulários tenham erro; b) nenhum formulário tenha erro;
c) no máximo um formulário tenha erro; d) pelo menos um formulário tenha erro.
3) Uma fábrica de automóveis verificou que ao testar seu carro na pista de provas, há em média, um estouro de pneu a cada 300 km, e que o número de pneus estourados segue aproximadamente uma distribuição de Poisson. Qual a probabilidade de que em um teste de 900 km, haja no máximo um pneu estourado?
4) Os operários de uma grande indústria têm solicitado em média 584 consultas médicas por ano. O médico comparece à indústria apenas uma vez por dia. Apresentam-se duas alternativas para remunerar o trabalho médico:
a) pagar um salário de R$ 12.000,00 por mês, independentemente do número de consultas havidas;
b) pagar R$ 350,00 pela primeira consulta do dia, e R$ 100,00 por consulta adicional do mesmo dia.
Qual das duas alternativas é a mais econômica à indústria? (considere que a indústria trabalha todos os dias do ano – 365 dias).
K p ( K ) P ( K ) . Custo 0 1 2 3 4 5 6 7 8 9
DISTRIBUIÇÃO NORMAL (DE GAUSS)
Uma variável aleatória contínua apresenta uma Distribuição Normal de probabilidade, quando a sua Função Densidade de Probabilidade é dada por:
a curva representativa de f(x) que recebe o nome de curva normal está representado abaixo:
PROPRIEDADES DA CURVA NORMAL
1. A curva normal é simétrica em relação a reta: 𝑥 = 𝜇
2. A curva normal apresenta pontos de inflexão em: 𝑥 = 𝜇 − 𝜎 𝑒 𝑥 = 𝜇 + 𝜎 3. lim
𝑥→−∞𝑓(𝑥) = 0 𝑒 lim𝑥→+∞𝑓(𝑥) = 0
4. ∫−∞+∞𝑓(𝑥)𝑑𝑥= 1
5. p( X = k ) = 0. Como consequência deste fato resulta que:
p ( a ≤ x ≤ b ) = p ( a < x ≤ b ) = p ( a ≤ x < b ) = p ( a < x < b )
6. A probabilidade p( a ≤ x ≤ b) é dada pela área da região sob a curva normal definida pelo intervalo [ a , b ].
OBSERVAÇÕES IMPORTANTES
Entretanto esta integral não pode ser calculada analiticamente, e, portanto, a probabilidade só poderá ser obtida aproximadamente, por meio de integração numérica. Observe ainda que para cada valor de µ e , teríamos que obter p( a ≤ x ≤ b) para os diversos valores de a e b.
z f z
Para contornar este problema, utiliza-se uma variável z, denominada variável reduzida ou padronizada, que também possui distribuição normal.
Esta distribuição z foi escolhida em função de apresentar parâmetros mais simples:
Qualquer outra distribuição normal X com média µ e desvio-padrão pode ser transformada para efeito do cálculo de áreas, na distribuição normal padronizada z através da seguinte mudança de variável:
Graficamente, esta mudança equivale a uma translação rígida da curva normal na direção do eixo x porém no sentido contrário.
Uma vez que a distribuição normal padronizada Z não depende da média µ e do desvio-padrão e, tendo em vista que qualquer outra distribuição normal X pode ser transformada, para efeito de cálculo de áreas, na distribuição Z, é necessário agora gerar apenas uma tabela para a distribuição normal padronizada.
A TABELA NORMAL
É uma tabela de dupla entrada que contém apenas os valores positivos de z e a área correspondente compreendida entre 0 e z.
OBSERVAÇÃO
Conhecendo-se a área especificada na tabela, qualquer outro tipo de área pode ser determinada utilizando-se a simetria da curva normal
x f x