Slide 1
Capítulo 5
Distribuição de Probabilidade Normal
5-1 Visão Geral
5-2 A Distribuição Normal Padrão
5-3 Aplicações da Distribuição Normal
5-4 Distribuições Amostrais e Estimadores 5-5 O Teorema Central do Limite
5-6 A Normal como uma aproximação à Binomial
5-7 Determinando a Normalidade
Slide 2
Variáveis Aleatórias Contínuas e Distribuições de Probabilidade
Seção 5-1
Visão Geral
Distribuição Uniforme
A variável assume valores em um intervalo de valores.50,0 52,0 1/ ∆ =0,5
Área=1 P(x)
Comprimento (cm) Curva de Densidade
(ou função de densidade de probabilidade) é o gráfico deuma distribuição de probabilidade contínua
A área total sob uma curva é igual a 1. A área corresponde à probabilidade.
Comprimento (cm)
Slide 3
Seção 5-2
A Distribuição Normal Padrão
Machos Fêmeas
Comprimento (cm)
π σ
σ µ
) 2 (
2
2
1
−
−
=
x
x e P
Distribuição de probabilidade aleatória simétrica em forma de sino
A distribuição normal padrão tem média igual a 0 e desvio padrão igual a 1
Z
Slide 4
Determinação de probabilidades
Programas de computador (ex: R, excel), calculadoras e tabelas de probabilidade
Copyright © 2004 Pearson Education, Inc.
Slide 5
Exemplo:
Termômetros com uma leitura média de 0 graus e um desvio padrão de 1 grau no ponto de congelamento da agua. Se um termômetro é aleatoriamenteselecionado, encontre a probabilidade de que no ponto de congelamento a leitura seja de menos que 1,58 graus celsius.
94,29% dos termômetros tem leituras de 1,58 graus ou menos no congelamento.
A probabilidade de que o termômetro escolhido meça menos que 1,58 graus no ponto de congelamento e de 0,9429.
Z=1,58 0
P ( z < 1,58) = 0,5 + 0,4429 = 0,9429
Exemplo:
Se um termômetro é aleatoriamente selecionado encontre a probabilidade de que a leitura seja superior a –1,23 graus no ponto de congelamento.Área
=0,5+0,3907
=0,8907
Áreas encontradas com auxílio da tabela A-2
Z=-1,23 0
89,07% dos termometros tem leituras superiores a –1,23 graus no ponto de congelamento
A probabilidade de ser escolhido um termômetro com leitura
superior a -1,23 graus é 0,8907 Área=0,9429
Slide 6
Exemplo:
Encontre a probabilidade de que um termômetro aleatoriamente selecionado tenha uma leitura entre –2,00 e 1,50 graus no ponto de congelamento da água.Se muitos termômetros forem testados, então 91,04% deles irão marcar entre –2,0 e 1,5 graus no ponto de congelamento da água
P (0 < z < 1,5) = 0,4332 P (- 2,0 < z < 0) = 0,4772
P (- 2,0 < z < 1,50) = 0,4332 + 0,4772 = 0,9104
A probabilidade de que seja escolhido um termômetro com leitura entre – 2,0 e 1,5 graus é 0,9104.
A área total a esquerda de z=1,50 e 0,9332
A área a esquerda de z=-2,00 e 0,0228
Área = 0,4332 + 0,4772 =0,9104
z = 1,50
z = -2,00 0
Copyright © 2004 Pearson Education, Inc.
Slide 7
Encontrando um escore z quando é dada uma probabilidade com o uso da tabela
Desenhe a curva em forma de sino com a identificação da região de probabilidade
desejada. Localize a probabilidade mais próxima no corpo da tabela e identifique o escore z correspondente.
Exemplo: Encontrando o Percentil 95 (P
95)
1,645
(escore z será positivo)
Z=?
5% ou 0,05
0
Area=0,95
área=0,025 área=0,025
(escore z será positivo e negativo)
-1,96 0 1,96
Exemplo: Encontrando os limites dos 2,5% menores e dos 2,5%
maiores, ou seja P
2,5e P
97,5Copyright © 2004 Pearson Education, Inc.
Slide 8
Seção 5-3
Aplicações das Distribuições Normais
Normais não-padronizadas tem µ µ µ µ ≠ ≠ ≠ ≠ 0 ou σ σ σ σ ≠ ≠ ≠ ≠ 1 (ou ambos).
Nestescasos converte-se os valores para escores z e os procedimentos para cálculo de probabilidades da seção anterior podem ser usados.
Distribuição normal não-padronizada Distribuição normal padronizada
σ µ
= x − z
Exemplo: Probabilidade de coleta de peixes com peso inferior a 38,8 cm em uma população com média (µ) de 36 cm e desvio padrão (σ) de 1,4 cm
0 , 4 2
, 1
0 , 36 8
,
38 − =
− =
= σ x µ z
36,0 38,8
0 2,00
x –
comprimento (cm) Z
P ( x < 38,8) = P( z < 2) = 0,9772
Slide 9
Exemplo: Probabilidade de peso entre 140 e 211 kg em uma população de marlin azul com peso médio (µ) de 143 kg e desvio padrão (σ) de 29 kg
σ σ σ
σ = 29 µ
µ µ
µ = 143
P(–0,10< z <2,34) = P(0< z <2,34) + P(-0,1< z <0) = 0,4904 + 0,0398 =
0,5302 Há uma probabilidade de 0,5302
de que seja capturado um agulhão com peso entre 140 e 211 kg ou 53,02% dos agulhões tem peso entre 140 e 211 kg
10 , 29 0
143 140
34 , 29 2
143 211
−
− =
=
− =
=
z z
x –
peso (kg) Z
Área total a esquerda de 211 kg é 0,9904
Slide 10
Encontrando a variável (x) a partir de uma probabilidade
σ σ µ
µ ∴ = + ⋅
= x − x z
z
x = µ µ µ µ + ( z . σ σ σ σ )
x = 14,4 + (2,05 . 1,0) x = 16,45
da tabela tem-se z = 2,05
O peso de 16,5 kg separa os menores 98%
dos maiores 2%
98% das albacoras pesam menos que 16,5 kg
Exemplo:
Encontrando o percentil 98 (P98) para uma população de albacora-laje de média (µ) 14,4 kg e desvio padrão (σ) 1,0 kg= 16,45
x –
peso (kg) Z
Desenhe a curva de distribuição normal e indique a área de probabilidade
apropriada, e identifique o valor z que corresponde a essa área, usando a tabela de probabilidade. Converta o valor de z em x.
Slide 11
x = 27,0 + (–1,645 • 1.3) = 24,8615
Exemplo: Encontrando o percentil 05 (P
05) para uma população de tubarão-azul com média (µ) de 27 kg e desvio padrão ( σ ) 1,3 kg
45% 50%
x –
peso (kg) Z
Seção 5-4
Distribuições Amostrais e Estimadores
Distribuição amostral de uma estatística
(ex: média ou proporções) - e a distribuição de probabilidade de médias (ou proporções) amostrais, com todas as amostras tendo o mesmo tamanho amostral n.Variabilidade amostral
- o valor de uma estatística (ex: média) depende dos valores em particular incluídos na amostra e, varia de uma amostra pra outra. Essa e a variabilidade amostral.O peso de 24,9 separa os 95% mais
pesados dos demais indivíduos
Slide 12
F,F - 1,1
Distribuições amostrais
Exemplo.
Uma população grande constituida de indivíduos com os seguintes pesos e sexos 1kg-femea, 2kg-macho, e 5kg-femea. São então feitas seleções de 2 indivíduos aleatoriamente. Há portanto, nove tipos possíveis de amostras.a. Cálculo das estatísticas (média, mediana, amplitude, variância, desv. padrão, prop. de fêmeas) b. Cálculo da média para cada estatística
média mediana
amplitude
x ~ x s
2s
variância desvpad
prop. fêm. probabilidade amostras
Média das estatísticas Parâmetros
A média da estatística é igual ao parâmetro?
sim não não sim não sim
F,M - 1,2 F,F - 1,5 M,F - 2,1
M,M - 2,2 M,F - 2,5 F,F - 5,1 F,M - 5,2 F,F - 5,5
Copyright © 2004 Pearson Education, Inc.
Slide 13
Interpretação das distribuições amostrais
– A média de estatísticas amostrais não-viesadas coincidem com os parâmetros populacionais.Estatísticas nao-viesadas: média, variância, proporção Estatísticas viesadas: median, amplitude, desvio padrão
Seção 5-5
O teorema central do limite
Dado que:
1. A variável aleatória x tem uma distribuição (que pode ser ou não normal) com média µ e desvio padrão σ .
2. Amostras de mesmo tamanho n são aleatoriamente selecionadas da população.
Conclusões:
1. A distribuição das médias amostrais , irá se aproximar de uma distribuição normal à medida que n aumenta.
2. A média de todas as médias amostrais é a média µ da população.
3. O desvio padrão de todas as médias amostrais é . x
σ n
Regras práticas:
1. Mesmo que a população original não for normalmente distribuida, a distribuição amostral das médias se aproxima de uma normal se n é maior que 30. A aproximação se torna melhor a medida que n aumenta.
2. Se a população original for normalmente distribuida, então as médias amostrais serão normalmente distribuidas para qualquer tamanho amostral .
Slide 14
µ µ
x=
x n σ = σ
Notação
Média das médias amostrais
Desvio padrão das médias amostrais (“erro padrão da média”)
Distribuição de contagens de filhotes em proles de um tubarão
Distribuição de 50 médias de amostras de tamanho 4
n = 4
x
Número de filhotes
F re q ü ên ci a F re q ü ên ci a
Média do número de filhotes
Slide 15
P( > 167) = P(z > -0,60) = 0,5 + P(0< z < 0,60) = 0,5 + 0,2257 = 0,7257
a) Se um espécime é selecionado, qual e a probabilidade de que ele pese mais que 167 gramas?
17 , 29 0
172
167 − = − z =
Exemplo:
Dada uma população de um determinado caranguejo com os pesosnormalmente distribuidos com média de 172 gramas e um desvio padrão de 29 gramas:
P(x > 167) = P(z > -0,17) = 0,5 + P(0< z < 0,17) = 0,5 + 0,0675 = 0,5675
b) Se 12 espécimes são coletados aleatoriamente, qual é a probabilidade de que o peso médio seja maior que 167 gramas?
60 , 37158 0
, 8
172
167 − = −
z =
Slide 16
Regra do evento raro – Se, sob uma dada hipótese, a probabilidade de um
evento particular observado for excepcionalmente pequena, concluimos que a hipótese provavelmente não é correta
Exemplo: Dada a hipótese de que uma população de um determinado tubarão na área de reprodução tenha peso médio de 98,6 kg e desvio padrão de 0,62 kg.
Se uma amostra de tamanho 106 é selecionada, qual é a probabilidade de se obter uma média de 98,2 kg ou menos?
0602197 ,
0 106
62 ,
0 =
=
=
x
n
σ σ 6 , 64
060217 ,
0
6 , 98 2
,
98 − = −
− =
=
−
=
n x x
z
x x
σ µ σ
µ
P( < 98,2) = P(z < -6,64) = 0,5 – 0,4999 < 0,0001 Interpretação …
1
−
⋅ −
= N
n N
x
n σ σ
Correção de populações finitas -
No teorema central do limite se a amostra supera 5% do tamanho da população (n > 0,05 . N) usa-se uma correção para o erro padrãoFator de correção para população finita
Copyright © 2004 Pearson Education, Inc.
Slide 17
Revisão da Distribuição Binomial
1. O procedimento deve ter um número fixo de tentativas.
2. As tentativas devem ser independentes.
3. As respostas das tentativas podem ser classificadads em duas categorias.
4. As probabilidades de sucesso devem permanecer constantes em cada tentativa.
Solução: uso da fórmula binomial, da tabela A-1, ou de programas computacionais
Seção 5-6
A Normal como aproximação da Binomial
p n ⋅
µ = σ = n ⋅ p ⋅ q
média desvio padrão
np ≥ ≥ ≥ ≥ 5 nq ≥ ≥ ≥ ≥ 5
n = 14 p = 0,5
P ro b ab ili d ad e
Casos em que a normal é uma boa aproximação
Número de fêmeas em 14 nascimentos
Slide 18
Procedimento para uso de uma distribuição Normal para aproximar uma Binomial
1. Tente resolver usando a formula da binomial, a tabela A-1 ou algum programa. Caso isso nao seja possível …
2. Avalie se a distribuicao normal seria uma boa aproximação pela verificação de np ≥ ≥ ≥ ≥ 5 e nq ≥ ≥ ≥ ≥ 5.
3. Encontre os valores de média e desvio padrão
4. Identifique o valor discreto x (número de sucessos) e o tipo de probabilidade que você está procurando (pelo menos x, mais de x, no máximo x, menos de x ou exatamente x). Mude o valor discreto de x pela adição e/ou subtração de 0,5 de acordo com a probabilidade que se quer calcular (ver quadro da
próxima página).
5. Calcule o escore z correspondente ao valor de x corrigido e encontre a probabilidade desejada usando a tabela A-2
p n ⋅
µ = σ = n ⋅ p ⋅ q
Slide 19
x = pelo menos 120
= 120, 121, 122, . . .
x = mais de 120
= 121, 122, 123, . . .
x = no maximo 120
= 0, 1, . . . 118, 119, 120
x = menos de 120
= 0, 1, . . . 118, 119
x = exatamente 120
Slide 20
Seção 5-7
Determinando a Normalidade
Procedimento:
1. Histograma: Construa um histograma. Rejeite a normalidade se o histograma se afasta muito de uma forma de sino.
2. Outliers: Identifique outliers. Rejeite a normalidade se há muitos outliers 3. Gráfico dos quantis normais: Se o histograma é simétrico e se há no
máximo um outlier, construa um gráfico da seguinte forma:
a. Organize os dados em ordem crescente
b. Usando o tamanho amostral n, identifique as áreas de 1/(2n), 3/(2n), 5/(2n),
7/(2n), e assim por diante. Essas são as áreas acumuladas a esquerda dos valores correspondentes na amostra.
c. Use a distribuição normal padrão (Tabela A-2) para encontrar os escores z correspondentes às áreas estimadas em (b).
d. Faca um diagrama de dispersão com os valores x observados na amostra e os valores z calculados em (c).
e. Se o padrão de dispersão á razoavelmente próximo de uma linha reta, então os dados devem ter vindo de uma população com distribuição normal.
Slide 21