• Nenhum resultado encontrado

APOSTILA DE ESTATÍSTICA -PARTE B

N/A
N/A
Protected

Academic year: 2021

Share "APOSTILA DE ESTATÍSTICA -PARTE B"

Copied!
11
0
0

Texto

(1)

VARIÁVEL ALEATÓRIA

É uma função que associa um número real a cada evento elementar de um espaço amostral. Notação: X, Y, Z, W, ... .

Quando uma variável aleatória assume apenas um número finito de valores ela se denomina variável aleatória discreta.

Exemplo:

E: lançar duas moedas distintas Ω: { CC, CK, KC, KK}

Consideremos a variável aleatória X que indica a ocorrência de caras. Assim: X(CC) = 0

X(CK) = 1 X(KC) = 1 X(KK) =2

Função probabilidade:

A probabilidade de uma variável aleatória X assumir o valor k, e indicamos por 𝑝(𝑋 = 𝑘) é dada pela função distribuição de probabilidade. No caso do exemplo anterior, temos:

𝑃(𝑋 = 0) = 1/4 𝑃(𝑋 = 1) = 2/4 𝑃(𝑋 = 2) = 1/4

Distribuição de Bernoulli:

Neste caso, a variável aleatória X assume apenas dois valores: X = 0 (fracasso)

X = 1 (sucesso)

Nestas condições, se 𝑝(𝑋 = 0) = 𝑝 e 𝑝(𝑋 = 1) = 𝑞 segue que: 𝑝 + 𝑞 = 1

Exemplo:

E: lançar um dado Ω:{1, 2, 3, 4, 5, 6}

(2)

Considerando sucesso a ocorrência do número 6, segue que: 𝑝(𝑋 = 1) = 𝑝(6) =16 (p) 𝑝(𝑋 = 0) = 𝑝({1, 2,3,4,5}) =56 (q) 𝑝 + 𝑞 =1 6+ 5 6= 1 (100%) DISTRIBUIÇÃO BINOMIAL

Neste caso, consideremos a ocorrência de n eventos do tipo Bernoulli, estatisticamente independentes todos com a mesma probabilidade de sucesso p e de fracasso q. Consideremos agora a variável aleatória Y que indica a ocorrência de sucesso nos n eventos. Então:

0 ≤ 𝑌 ≤ 𝑛

Exemplo:

Lançar um dado 10 vezes. Assim, considerando SUCESSO a ocorrência do número 6 (em cada lançamento), se Y é a variável aleatória que indica o número de sucessos nos 10 lançamentos, segue que:

0 ≤ 𝑌 ≤ 10 Nestas condições, 𝑝(𝑌 = 0) = 𝑝(𝑌 = 10) = A fórmula:

𝑝(𝑋 = 𝑘) = (

𝑛

𝑘) 𝑝

𝑘

𝑞

𝑛−𝑘

= 𝐶

𝑛,𝑘

𝑝

𝑘

𝑞

𝑛−𝑘 Exemplos:

1) Uma moeda honesta é lançada 6 vezes. Qual a probabilidade de observarmos exatamente 2 caras? R: 23,44%

2) Um time de futebol tem probabilidade 𝑝 = 3/5 de vencer todas as vezes que joga. Se disputar 5 partidas, qual a probabilidade de que vença ao menos uma? R: 98,97%

(3)

EXERCÍCIOS

1. Em uma caixa temos: 3 bolas verdes, 2 bolas brancas e 4 bolas pretas.

Retiram-se 3 bolas desta caixa, sucessivamente, com reposição. Qual

a probabilidade de ser obter:

a) Nenhuma vez a bola verde?

b) 3 vezes a bola branca?

c) No máximo uma bola branca

d) Pelo menos uma vez a bola preta?

2. Uma certa companhia de aviação chegou a conclusão que 5% das

pessoas que fazem reserva em determinado voo não comparecem ao

embarque. Consequentemente adotou a política de reservar 77 lugares

nos seus aviões que têm 75 lugares. Determine a probabilidade de que

todas as pessoas que comparecerem ao embarque de um voo

selecionado ao acaso, encontrarão lugar.

3. Um indústria examina a cada hora 30 peças. Se for encontrada ao

menos 1 peça defeituosa, a fabricação é interrompida e a causa é

pesquisada. A porcentagem de peças com defeito é conhecida e tem

sido sempre de 5%. Considerando um dia de trabalho com 8 horas,

quantas vezes por dia, no máximo, podemos esperar que a fabricação

seja interrompida?

(4)

DISTRIBUIÇÃO DE POISSON

Para entender esta distribuição, devemos observar que em muitos casos conhecemos o número de sucessos, mas não podemos determinar, por não ter sentido, o número de fracassos ou de provas.

Exemplificando, se anotarmos o número de carros que passam por um posto de pedágio durante determinado intervalo de tempo, saberemos o número de sucessos, mas não sabemos nem podemos determinar o número de fracassos, ou seja, o número de carros que deixaram de passar pelo posto.

Da mesma forma, o número de emendas em um determinado comprimento de fita colante, pode ser determinado, mas não tem sentido indagarmos pelo número de emendas que não ocorreram.

Não podemos assim, evidentemente, aplicar neste caso o modelo Binomial, pois nos falta o número de fracassos e, consequentemente, o número de provas, que é indeterminado.

Entretanto, analisando os exemplos acima, vemos que em todos eles há uma variável que condiciona de certa forma a probabilidade de sucessos: se aumentarmos, no posto de pedágio, o tempo de observação, a probabilidade de observamos a passagem de um carro tende a aumentar, da mesma forma que se aumentarmos o comprimento de fita colante a ser observado, a probabilidade de aparecer uma emenda também tende a aumentar.

Vamos chamar esta variável de t, e formular as seguintes hipóteses que nos permitirão construir um modelo capaz de explicar os problemas do tipo que acabamos de mencionar.

1ª HIPÓTESE: Para um intervalo de observação Δt suficientemente pequeno (ou seja,

para Δt tendendo a zero) a probabilidade de um sucesso é proporcional ao intervalo: 𝒑 ( 𝑿 = 𝟏, 𝜟𝒕 ) = 𝝀 . 𝜟𝒕

2ª HIPÓTESE: Para um intervalo de observação Δt suficientemente pequeno, a

probabilidade de ocorrer mais do que um sucesso é desprezível, ou seja 𝒑 ( 𝑿 > 𝟏, 𝜟𝒕 ) = 𝟎

3ª HIPÓTESE: Como consequência das hipóteses acima, a probabilidade de não ocorrer

nenhum sucesso no intervalo de observação Δt será:

𝒑 ( 𝑿 = 𝟎, 𝜟𝒕 ) = 𝟏 − 𝒑 ( 𝑿 = 𝟏 ) = 𝟏 − 𝝀 . 𝜟𝒕

4ª HIPÓTESE: As ocorrências de sucessos em intervalos Δt disjuntos são

(5)

Ora, o nosso problema é determinar p ( X = k ) em um intervalo t. Observe que este intervalo pode ser um tempo t, um comprimento t, etc., onde a variável X pode assumir um número finito de valores ( 0, 1, 2, 3, . . . ).

Entretanto, como as nossas hipóteses foram formuladas para um intervalo Δt suficientemente pequeno, vamos dividir o intervalo t em n partes iguais, com n suficientemente grande, de tal modo que

𝚫𝐭 = 𝐭 / 𝐧 seja suficientemente pequeno para n suficientemente grande, ou seja, Δt tende a zero quando n tende ao infinito.

Observe agora que:

1°) Em cada Δt só pode ocorrer um sucesso com probabilidade

𝒑 ( 𝑿 = 𝟏 , 𝜟𝒕 ) = 𝝀 . 𝜟𝒕 = 𝝀 .𝒕 𝒏

2°) Em cada Δt pode não ocorrer nenhum sucesso (fracasso) com probabilidade

𝒑 ( 𝑿 = 𝟎 , 𝜟𝒕 ) = 𝟏 − 𝝀 . 𝜟𝒕 = 𝟏 − 𝝀 .𝑡 𝑛

3°)O que ocorre em um intervalo 𝜟𝒕 = 𝒕 / 𝒏 não depende do que ocorre nos outros

intervalos. Assim, temos todas as condições de aplicar uma binomial com n provas, ou seja: 𝑝(𝑘, 𝑡) = lim 𝑛→∞𝐶𝑛,𝑘( 𝑡 𝑛) 𝑘 (1 −𝑡 𝑛) 𝑛−𝑘

e desenvolvendo o limite acima, obtemos a fórmula da distribuição de Poisson:

𝒑(𝑿 = 𝒌, 𝒕) =

(𝒌!𝒕)𝒌

𝒆

𝒕

Onde e é o número irracional de Neper sendo;

e = 2,7182818284590452353602874...

PROPRIEDADES

1ª) A soma das probabilidades 𝑝 (𝑋 = 𝑘) para todos os valores da variável k é igual a

1 (100%).

2ª) A média ou Esperança Matemática da distribuição de Poisson é dada por:

𝑬(𝑿, 𝒕) =𝒕

.

Assim a fórmula da distribuição de Poisson pode ser escrita como:

𝒑(𝑿 = 𝒌, 𝒕) =

(𝝁)

𝒌

𝒌!

𝒆

𝝁

(6)

EXERCÍCIOS

Na resolução dos exercícios, vamos utilizar o número e com arredondamento para quatro casas decimais, ou seja: e = 2,7183.

1) Suponhamos que em média, o número de carros que chega a um posto de pedágio em 10 segundos seja igual a 3. Determine a probabilidade de que cheguem 0, 1, 2, 3, . . . carros ao posto em um intervalo de 10 segundos.

NÚMERO DE CARROS A CADA 10 SEG (K) PROBABILIDADE p( k,10seg ) NÚMERO DE CARROS A CADA 10 SEG (K) PROBABILIDADE p( k,10seg ) 0 7 1 8 2 9 3 10 4 11 5 12 6 13

2) Suponhamos que em média uma pessoa em 500 cometa um erro numérico ao preparar o Imposto de Renda. Se 1.120 formulários de Imposto de renda forem selecionados ao acaso e examinados, determine a probabilidade de que:

a) dois formulários tenham erro; b) nenhum formulário tenha erro;

c) no máximo um formulário tenha erro; d) pelo menos um formulário tenha erro.

3) Uma fábrica de automóveis verificou que ao testar seu carro na pista de provas, há em média, um estouro de pneu a cada 300 km, e que o número de pneus estourados segue aproximadamente uma distribuição de Poisson. Qual a probabilidade de que em um teste de 900 km, haja no máximo um pneu estourado?

4) Os operários de uma grande indústria têm solicitado em média 584 consultas médicas por ano. O médico comparece à indústria apenas uma vez por dia. Apresentam-se duas alternativas para remunerar o trabalho médico:

(7)

a) pagar um salário de R$ 12.000,00 por mês, independentemente do número de consultas havidas;

b) pagar R$ 350,00 pela primeira consulta do dia, e R$ 100,00 por consulta adicional do mesmo dia.

Qual das duas alternativas é a mais econômica à indústria? (considere que a indústria trabalha todos os dias do ano – 365 dias).

K p ( K ) P ( K ) . Custo 0 1 2 3 4 5 6 7 8 9

(8)

DISTRIBUIÇÃO NORMAL (DE GAUSS)

Uma variável aleatória contínua apresenta uma Distribuição Normal de probabilidade, quando a sua Função Densidade de Probabilidade é dada por:

a curva representativa de f(x) que recebe o nome de curva normal está representado abaixo:

PROPRIEDADES DA CURVA NORMAL

1. A curva normal é simétrica em relação a reta: 𝑥 = 𝜇

2. A curva normal apresenta pontos de inflexão em: 𝑥 = 𝜇 − 𝜎 𝑒 𝑥 = 𝜇 + 𝜎 3. lim

𝑥→−∞𝑓(𝑥) = 0 𝑒 lim𝑥→+∞𝑓(𝑥) = 0

4. ∫−∞+∞𝑓(𝑥)𝑑𝑥= 1

5. p( X = k ) = 0. Como consequência deste fato resulta que:

p ( a ≤ x ≤ b ) = p ( a < x ≤ b ) = p ( a ≤ x < b ) = p ( a < x < b )

6. A probabilidade p( a ≤ x ≤ b) é dada pela área da região sob a curva normal definida pelo intervalo [ a , b ].

OBSERVAÇÕES IMPORTANTES

Entretanto esta integral não pode ser calculada analiticamente, e, portanto, a probabilidade só poderá ser obtida aproximadamente, por meio de integração numérica. Observe ainda que para cada valor de µ e , teríamos que obter p( a ≤ x ≤ b) para os diversos valores de a e b.

(9)

z f z

Para contornar este problema, utiliza-se uma variável z, denominada variável reduzida ou padronizada, que também possui distribuição normal.

Esta distribuição z foi escolhida em função de apresentar parâmetros mais simples:

Qualquer outra distribuição normal X com média µ e desvio-padrão  pode ser transformada para efeito do cálculo de áreas, na distribuição normal padronizada z através da seguinte mudança de variável:

Graficamente, esta mudança equivale a uma translação rígida da curva normal na direção do eixo x porém no sentido contrário.

Uma vez que a distribuição normal padronizada Z não depende da média µ e do desvio-padrão  e, tendo em vista que qualquer outra distribuição normal X pode ser transformada, para efeito de cálculo de áreas, na distribuição Z, é necessário agora gerar apenas uma tabela para a distribuição normal padronizada.

A TABELA NORMAL

É uma tabela de dupla entrada que contém apenas os valores positivos de z e a área correspondente compreendida entre 0 e z.

OBSERVAÇÃO

Conhecendo-se a área especificada na tabela, qualquer outro tipo de área pode ser determinada utilizando-se a simetria da curva normal

x f x

(10)
(11)

EXERCÍCIOS

As alturas dos alunos de uma escola apresentam distribuição normal com:

Escolhido um aluno ao acaso:

a) Qual a probabilidade de que a sua altura seja maior do que 1,70 m?

b) Qual a probabilidade de que a sua altura seja menor do que 1,55 m?

c) Qual a probabilidade de que a sua altura seja menor do que 1,72 m?

d) Qual a probabilidade de que a sua altura seja maior do que 1,43 m?

e) Qual a probabilidade de que a sua altura esteja entre 1,85 e 1,91 m?

f) Qual a probabilidade de que a sua altura esteja entre 1,44 e 1,78 m?

g) Se 10% dos alunos da escola são considerados “altos”, qual a altura

mínima para esta categoria? (PROBLEMA INVERSO)

h) Se 15% dos alunos da escola são considerados “baixos”, qual a altura

máxima para esta categoria? (PROBLEMA INVERSO)

Referências

Documentos relacionados

É o conjunto de fundamentos básicos que diferencia o futebol dos demais esportes, cuja peculiaridade esta, principalmente, no uso dos pés e pernas para executar as ações básicas

servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...

Estes resultados sugerem que a utilização in vitro dos extratos botânicos aquosos in natura e desidratado de embaúba no cultivo de larvas não foram eficazes no

Frente ao exposto, este trabalho teve por objetivo avaliar discentes da disciplina de Matemática Discreta nos conteúdos de lógica formal, teoria dos conjuntos e

Por meio do ordenamento dos ciclos de fácies, foram caracterizadas seis seqüências deposicionais, formadas por ciclos siliciclásticos regressivo-transgressivos, R-T (seqüências S1 e

Trata-se de um estudo descritivo com abordagem quantitativa O local escolhido como cenário para a pesquisa foi a Faculdade de Enfermagem Nova Esperança de Mossoró – FACENE/RN

Não diga “amém” para tudo e, quando for dizer, saiba que o nosso Deus, que é o nosso Rei e o único que é Fiel, vai fazer com que assim seja feita a vontade d’Ele em nós e

manutenção mensal da ferramenta, devem então ser gerados mensalmente.  Seleção do caminho para armazenamento de relatórios