Notas de Aula
Estatística Elementar
10ª Edição
10ª Edição
by Mario F. Triola
Capítulo 6
Distribuição de Probabilidade
Normal
6-1 Visão Geral
6-2 Distribuição Normal Padronizada 6-3 Aplicações da Distribuição Normal
6-4 Distribuições Amostrais e Estimadores 6-5 O Teorema Central do Limite
Slide Slide 2
6-6 Normal para Aproximar a Binomial 6-7 Verificando Normalidade
Seção 6-1
Visão Geral
Visão Geral
Created by Erin Hodgess, Houston, Texas
Este capítulo foca em:
Variáveis aleatórias contínuas
Distribuição Normal
Visão Geral
Distribuição Normalf(x) =
σσσσ
2ππππ
x-µµµµ σσσσ)
2(
e2 -1 Slide Slide 4 Figura 6-1 Fórmula 6-1f(x) =
σσσσ
2ππππ
Seção 6-2
Distribuição Normal
Padronizada
Padronizada
Created by Erin Hodgess, Houston, Texas
Ponto Chave
Esta seção apresenta a distribuição normal padronizada, que tem três propriedades:
1. Tem forma de sino. 1. Tem forma de sino. 2. Tem média igual a 0.
3. Tem desvio padrão igual a 1.
É extremamente importante desenvolver a
Slide Slide 6 É extremamente importante desenvolver a habilidade para se determinar as áreas (ou as probabilidades ou freqüências relativas) correspondente a várias regiões sob o gráfico da distribuição normal padronizada.
Definição
Uma
variável
aleatória
contínua
tem
distribuição
uniforme
se
seus
valores
se
distribuição
uniforme
se
seus
valores
se
espalham
uniformemente
sobre a faixa de
valores de probabilidades.
O gráfico da distribuição uniforme resulta em
uma forma retangular.
Uma
curva de densidade
é o gráfico de uma
distribuição de probabilidade contínua. Ele deve
satisfazer as seguintes propriedades:
Definição
satisfazer as seguintes propriedades:
1.A área total sob a curva deve ser igual a 1.
2.Cada ponto na curva deve ter uma altura vertical
que é 0 ou maior. (Isto é, a curva não pode estar
abaixo do eixo x.)
Slide Slide 8
abaixo do eixo x.)
Como a área total sob a curva de
Área e Probabilidade
Como a área total sob a curva de
densidade é igual a 1, há uma
correspondência entre área e
probabilidade.
Usando a Área para Encontrar
Probabilidades
Slide
Slide 10
Definição
A distribuição normal padronizada é uma
distribuição
de
probabilidade
com
média
igual a 0 e desvio padrão igual a 1, e a área
igual a 0 e desvio padrão igual a 1, e a área
total sob sua curva de densidade é igual a 1.
Encontrando Probabilidades
-Tabela A-2
Incluída na contra capa do livro
No cartão de fórmulas e tabelas
No apêndice
Slide
Encontrando Probabilidades –
Outros Métodos
STATDISK
STATDISK
Minitab
Excel
TI-83/84
Tabela A-2 - Exemplo
Slide
Escore z
Distância
na escala horizontal da distribuição
Usando a Tabela A-2
Distância
na escala horizontal da distribuição
normal
padronizada;
refere-se
à
coluna
à
esquerda e à linha superior da Tabela A-2.
Área
Região
sobre a curva; refere-se aos valores no
Se
termômetros
científicos
têm
uma
leitura média de 0 graus e um desvio
Exemplo - Termômetros
leitura média de 0 graus e um desvio
padrão
de
1
grau
no
ponto
de
congelamento da água, e se um destes
termômetros
é
selecionado
ao
acaso,
encontre a probabilidade de, no ponto de
congelamento da água, a leitura ser menor
Slide
Slide 16
congelamento da água, a leitura ser menor
que
1.58
graus.
P(z < 1.58) =
Exemplo - Cont
Look at Tabela A-2
Slide
P (z < 1.58) = 0.9429
Exemplo - cont
P (z < 1.58) = 0.9429
Exemplo - cont
Slide
Slide 20
A probabilidade de que o termômetro selecionado medirá a temperatura de congelamento da água em um valor menor ou igual a 1.58 graus é 0.9429.
P (z < 1.58) = 0.9429
Exemplo - cont
94.29% dos termômetros têm leitura menor que 1.58 graus.
Se termômetros têm uma leitura média de 0 graus e
um desvio padrão de 1 grau, e se um destes
termômetros é selecionado ao acaso, calcule a
probabilidade de que sua leitura no ponto de
Exemplo - cont
probabilidade de que sua leitura no ponto de
congelamento da água seja maior que
–1.23
graus.
P (z >
–1.23) = 0.8907
Slide
Slide 22
A probabilidade de que o termômetro selecionado tenha leitura superior a -1.23 graus é 0.8907.
P (z >
–1.23) = 0.8907
Exemplo - cont
Um termômetro é selecionado aleatoriamente. Calcule a probabilidade de que sua leitura (no ponto de congelamento da água) esteja entre –2.00 e 1.50 graus.
P (z < –2.00) = 0.0228
Exemplo - cont
P (z < –2.00) = 0.0228 P (z < 1.50) = 0.9332 P (–2.00 < z < 1.50) = 0.9332 – 0.0228 = 0.9104 Slide Slide 24 A probabilidade de que o termômetro escolhido tenha leitura entre – 2.00 e 1.50 graus é 0.9104.P (z < –2.00) = 0.0228
Um termômetro é selecionado aleatoriamente. Calcule a probabilidade de que sua leitura (no ponto de congelamento da água) esteja entre –2.00 e 1.50 graus.
Exemplo - Modificado
P (z < –2.00) = 0.0228 P (z < 1.50) = 0.9332 P (–2.00 < z < 1.50) =
0.9332 – 0.0228 = 0.9104
Se vários termômetros são selecionados ao acaso e testados no ponto de congelamento da água, então temos que 91.04% destes
P(a < z < b)
determina a probabilidade de que o escore z esteja entre a
Notação
determina a probabilidade de que o escore z esteja entre a e b.
P(z > a)
determina a probabilidade de que o escore z é maior que
a.
Slide
Slide 26
a.
P(z < a)
determina a probabilidade de que o escore z é menor que
Calculando o Escore z Para
Probabilidades Dadas Usando a
Tabela A-2
1. Desenhe a curva da normal e identifique a região
1. Desenhe a curva da normal e identifique a região
sob a curva que corresponde à probabilidade
dada.
Se
esta
região
não
é
uma
região
acumulativa a partir da esquerda, trabalhe com
áreas
conhecidas
que
sejam
acumuladas
à
esquerda.
2. Usando a área acumulada à esquerda, localize a
probabilidade mais próxima no
corpo
da Tabela
Calculando o Escore z para
Probabilidades Dadas
5% ou 0.05
Slide
Slide 28 (Escore z será positivo)
Figura 6-10
Calculando o Escore z para
Probabilidades Dadas - cont
5% ou 0.05
Figura 6-10
Encontrando o 95º Percentil
1.645
Calculando o Escore z para
Probabilidades Dadas - cont
Slide
Slide 30
Figura 6-11
Encontrando o 2.5% inferior e o 2.5% superior
Calculando o Escore z para
Probabilidades Dadas - cont
Figura 6-11
Encontrando o 2.5% inferior e o 2.5% superior
Calculando o Escore z para
Probabilidades Dadas - cont
Slide
Slide 32
Figura 6-11
Encontrando o 2.5% inferior e o 2.5% superior
Recapitulando
Nesta seção apresentamos:
Curvas de densidade.
Relação entre área e probabilidade
Distribuição normal padronizada.
Usando a Tabela A-2.
Seção 6-3
Aplicações da
Distribuição Normal
Distribuição Normal
Slide Slide 34Created by Erin Hodgess, Houston, Texas
Ponto Chave
Esta seção apresenta métodos para trabalhar
com
distribuições
normais
que
não
são
com
distribuições
normais
que
não
são
padronizadas. Isto é, a média não é 0 ou o
desvio padrão não é 1, ou ambos.
O ponto chave é que podemos usar uma
conversão simples que nos permite padronizar
qualquer distribuição normal de modo que os
qualquer distribuição normal de modo que os
mesmos métodos da seção anterior possam
ser utilizados.
Fórmula de Conversão
x –
µ
z
Fórmula 6-2x –
µ
σσσσ
z
=
Arredonde os escores z para 2 casas decimais
Slide
Convertendo Para uma
Distribuição Normal Padronizada
x –
µµµµ
σσσσ
z =
No Problema do Capítulo, notamos que a carga
Exemplo – Peso de Passageiros
de Táxis Aquáticos
No Problema do Capítulo, notamos que a carga de segurança para um táxi aquático era de 3500 libras (aproximadamente 1588 kg). Também notamos que o peso médio dos passageiros é considerado igual a 140 libras. Assuma o pior caso de que todos os passageiros são homens. Assuma também que o peso destes homens são
Slide
Slide 38 normalmente distribuídos com média 172 libras e
desvio padrão de 29 libras. Se um homem é selecionado ao acaso, qual é a probabilidade de que ele pese menos do que 174 libras?
Exemplo - cont
z = 174 – 172 29 = 0.07 σ = 29 µµµµ = 172 29 σ = 29 Figura 6-13Exemplo - cont
P ( x < 174 lb.) = P(z < 0.07) σ = 29 µµµµ = 172 P ( x < 174 lb.) = P(z < 0.07) = 0.5279 σ = 29 Slide Slide 40 Figura 6-131. Não confunda escores z e áreas. Os escores z são
distâncias ao longo da escala horizontal, enquanto que as áreas são regiões sob a curva normal. A
Cuidados Para Ter em Mente
que as áreas são regiões sob a curva normal. A Tabela A-2 lista os escores z na coluna à esquerda e na linha superior, e as áreas são encontradas no corpo da Tabela.
2. Escolha o lado correto (direito/esquerdo) do gráfico.
3. Um escore z deve ser negativo toda vez que ele se 3. Um escore z deve ser negativo toda vez que ele se localizar na metade esquerda da distribuição normal. 4. Áreas (ou probabilidades) são positivoas ou nulas, portanto nunca serão negativas.
Procedimento para Calcular
Valores Usando a Tabela A-2 e a
Fórmula 6-2
1. Esboce a curva da distribuição normal, introduza a probabilidade ou percentagem dada na região apropriada do gráfico e identifique o valor x de seu interesse.
identifique o valor x de seu interesse.
2. Use a Tabela A-2 para encontrar o escore z correspondente à área acumulada à esquerda de x. Consulte o corpo da Tabela A-2 para encontrar a área mais próxima, então identifique o escore z correspondente.
3. Usando a Fórmula 6-2, introduza os valores de µ, σσσσ, e o escore z encontrado no passo 2, e resolva para x.
Slide
Slide 42
x = µ + (z • σσσσ) (Outra forma para a Fórmula 6-2)
(Se z está localizado à esquerda da média, tenha certeza de que seja um número negativo.)
4. Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema.
Exemplo – Mais Leves e Mais
Pesados
Use os dados do exemplo anterior para determinar que peso separa os 99.5% mais leves dos 0.5% que peso separa os 99.5% mais leves dos 0.5% homens mais pesados.
x =
µµµµ
+ (z ●σσσσ
)x = 172 + (2.575 •••• 29)
Exemplo – Mais Leves e Mais
Pesados - cont
x = 172 + (2.575 •••• 29)
x = 246.675 (247 rounded)
Slide
O peso de 247 libras separa os 99.5% mais leves dos 0.5% mais pesados.
Exemplo – Mais Leves e Mais
Pesados - cont
Recapitulando
Nesta seção apresentamos:
Distribuição normal não padronizada.
Convertendo para uma distribuição normal
padronizada.
Procedimentos para calcular valores usando a
Slide
Slide 46
Procedimentos para calcular valores usando a
Tabela A-2 e a Fórmula 6-2.
Seção 6-4
Distribuições Amostrais e
Estimadores
Estimadores
Created by Erin Hodgess, Houston, Texas
Ponto Chave
O objetivo principal desta seção é entender o
conceito de
distribuição amostral de uma
conceito de
distribuição amostral de uma
estatística
, a qual é a distribuição de todos
os valores da estatística quando todas as
possíveis amostras de mesmo tamanho são
observadas.
Nós
também
veremos
que
algumas
Slide
Slide 48
Nós
também
veremos
que
algumas
estatísticas são melhores que outras para
estimar parâmetros populacionais.
Definição
A
distribuição amostral de uma estatística
(tal
como
a
proporção
amostral
ou
a
média
como
a
proporção
amostral
ou
a
média
amostral) é a distribuição de todos os valores
da
estatística
quando
todas
as
possíveis
amostras
de
mesmo
tamanho
n
são
Definição
A
distribuição
amostral
de
uma
A
distribuição
amostral
de
uma
proporção
é a distribuição das proporções
amostrais, com todas as amostras tendo o
mesmo
tamanho
amostral
n
são
selecionadas de uma mesma população.
Slide
Propriedades
Proporções
amostrais
tendem
a
se
aproximarem
do
valor
da
proporção
aproximarem
do
valor
da
proporção
populacional.
(Ou seja, todas as possíveis
proporções
amostrais
têm
média
igual
à
proporção populacional.)
Sob certas condições, a distribuição da
proporção amostral pode ser aproximada pela
distribuição normal.
Definição
A
distribuição amostral da média
é
a
A
distribuição amostral da média
é
a
distribuição das médias amostrais, com
todas as amostras tendo o mesmo tamanho
amostral n selecionadas de uma mesma
população.
(A distribuição amostral da
média é tipicamente representada como
uma
distribuição
de
probabilidade
no
Slide
Slide 52
uma
distribuição
de
probabilidade
no
formato de uma tabela, histograma de
probabilidade ou fórmula.)
Definição
O valor de uma estatística, tal como a média
O valor de uma estatística, tal como a média
amostral x, depende dos valores incluídos na
amostra estudada, e geralmente variam de
amostra para amostra. Esta variabilidade das
estatísticas
é
chamada
de
variabilidade
Estimadores
Algumas
estatísticas
funcionam
melhores
que outras como estimadores de parâmetros
populacionais. O exemplo que se segue
ilustra esta propriedade.
Slide
Exemplo - Distribuições Amostrais
Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.
a. Para cada amostra, calcule a média, mediana, amplitude, variância e desvio padrão.
b. Para cada estatística do item (a), calcule a b. Para cada estatística do item (a), calcule a média com base em todas as amostras.
Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.
Distribuições Amostrais
2 com reposição. Há 9 possíveis amostras.
a. Para cada amostra, calcule a média, mediana, amplitude, variância e desvio padrão.
Veja a Tabela 6-7 no próximo slide.
Slide
Slide 56
Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.
Distribuições Amostrais
b. Para cada estatística do item (a), calcule a média com base em todas as amostras
As médias são apresentadas abaixo dos valores amostrais na Tabela 6-7.
Slide
Slide 58
Interpretação das Distribuições
Amostrais
Nós podemos ver que usando as estatísticas
amostrais para estimar parâmetros populacionais, amostrais para estimar parâmetros populacionais, algumas são melhores que outras, no sentido de “acertarem” o valor do parâmetro em questão, e são portanto preferíveis para obtermos bons resultados. Tais estatísticas são chamadas de estimadores centrados ou não viesados..
Estatísticas que acertam o valor dos parâmetros populacionais: média, variância, proporção
Estatísticas que não acertam o valor do parâmetro populacional: mediana, amplitude, desvio padrão
Recapitulando
Nesta seção apresentamos:
Distribuição amostral de uma estatística.
Distribuição amostral de uma proporção.
Distribuição amostral da média.
Variabilidade Amostral.
Slide
Slide 60
Variabilidade Amostral.
Seção 6-5
O Teorema Central do
Limite
Limite
Created by Erin Hodgess, Houston, Texas
Ponto Chave
Os procedimentos desta seção formam a
Os procedimentos desta seção formam a
base
para
a
estimação
de
parâmetros
populacionais e para os testes de hipótese –
tópicos a serem discutidos ao longo dos
capítulos seguintes.
Slide
Teorema Central do Limite
1. Uma variável aleatória x tem uma distribuição (que
Dado que:
1. Uma variável aleatória x tem uma distribuição (que pode ser normal ou não) com média µ e desvio padrão
σσσσ
.2. Amostras aleatórias simples todas de tamanho n são selecionadas da população. (As amostras são selecionadas de tal maneira que todas as amostras possíveis de mesmo tamanho n têm a mesma chance possíveis de mesmo tamanho n têm a mesma chance de serem selecionadas.)
1. A distribuição da média amostral x irá, com
Conclusões:
Teorema Central do Limite
-cont
1. A distribuição da média amostral x irá, com
o
aumento
do
tamanho
da
amostra,
aproximar-se de uma
Distribuição Normal
.
2. A média das médias amostrais é a média
populacional µ.
Slide
Slide 64
3. O desvio padrão de todas as médias
amostrais é
σ/
σ/
σ/
σ/
.
.
.
.
Regras Práticas Comumente Usadas
1. Para amostras de tamanho n maiores que
30, a distribuição das médias amostrais pode
ser aproximada razoavelmente bem pela
ser aproximada razoavelmente bem pela
Distribuição Normal.
A aproximação fica
cada vez melhor com o aumento do tamanho
amostral n.
2. Se a população original é normalmente
distribuída. Então as médias amostrais serão
normalmente distribuídas para
qualquer
tamanho amostral n (e não apenas para
valores de n maiores que 30).
Notação
A média das médias amostrais
µ = µ
o desvio padrão das médias amostrais
µ
x
= µ
n
σ
x
=
σ
Slide Slide 66(geralmente chamado de erro padrão da média)
n
Simulação com Números
Aleatórios
Gere 500.000 números aleatórios, e os agrupe em 5000 amostras de 100 números cada. Calcule a ,média de cada amostra.
Apesar dos 500.000 números terem uma distribuição uniforme, a distribuição das 5.000 médias amostrais é aproximadamente igual uma Distribuição Normal!
Com o aumento do tamanho
Ponto Importante
Com o aumento do tamanho
amostral temos que a
distribuição amostral das
médias amostrais aproxima-se
da Distribuição Normal.
Slide
Slide 68
da Distribuição Normal.
Dado que a população de homens tem o peso
distribuído normalmente com média 172 lb e um
Exemplo – Segurança em Táxi
Aquático
distribuído normalmente com média 172 lb e um
desvio padrão de 29 lb:
a) se um homem é selecionado aleatoriamente,
calcule a probabilidade de que seu peso seja
maior que 175 lb.
b) se 20 homens diferentes são selecionados
aleatoriamente, calcule a probabilidade de que
aleatoriamente, calcule a probabilidade de que
seu peso médio seja maior que 175 lb (ou seja,
que o peso total destes homens exceda a
a) se um homem é selecionado aleatoriamente,
calcule a probabilidade de que o seu peso não
seja maior do que 175 lb.
Exemplo – cont
z = 175 – 172 = 0.10 29
Slide
b) se 20 homens diferentes são selecionados
aleatoriamente, calcule a probabilidade de que
seu peso médio seja maior que 175 lb.
Exemplo – cont
z = 175 – 172 = 0.46 29
a) se um homem é selecionado aleatoriamente, a probabilidade de que o seu peso seja maior que 175 lb é:
Exemplo - cont
b) se 20 homens são selecionados aleatoriamente, a probabilidade de que o peso médio seja maior que 175 lb é:
P(x > 175) = 0.3228
é:P(x > 175) = 0.4602
Slide Slide 72P(x > 175) = 0.3228
É muito mais fácil que um valor individual se distancie da média que um grupo de 20 valores se desviem da média.
Interpretação dos Resultados
Dado que a capacidade de um taxi aquático é
Dado que a capacidade de um taxi aquático é
de 3500 libras, temos uma grande chance
(com probabilidade 0,3228) de que ele seja
sobrecarregado
ao
termos
20
homens
Correção para População Finita
Quando amostramos sem reposição e o tamanho da amostra n é maior que 5% da população finita de tamanho N, ajuste o desvio padrão das médias
N –
n
σσσσ
x
=
σσσσ
n
N –
1
tamanho N, ajuste o desvio padrão das médias amostrais pelo fator de correção:
Slide
Slide 74
fator de correção
Recapitulando
Nesta seção apresentamos:
Nesta seção apresentamos:
Teorema Central do Limite.
Regras Práticas.
Efeitos do tamanho amostral.
Seção 6-6
Normal para Aproximar a
Binomial
Binomial
Slide
Slide 76
Created by Erin Hodgess, Houston, Texas
Ponto Chave
Esta seção apresenta um método para usar a distribuição normal como uma aproximação para a distribuição normal como uma aproximação para a distribuição de probabilidade binomial.
Se as condições de np ≥ 5 e nq ≥ 5 são ambas satisfeitas, então as probabilidades de uma distribuição de probabilidade binomial podem ser aproximadas usando uma distribuição normal com média µ = np e
desvio padrão σ = √npq
Revisão
Distribuição de Probabilidade binomial
1. O experimento deve ter um número fixo de realizações.
1. O experimento deve ter um número fixo de realizações.
2. As realizações devem ser independentes.
3. Cada realização deve ter todos os resultados classificados
em duas categorias.
4. A probabilidade de sucesso permanece constante em todas as realizações.
Slide
Slide 78 Calcule as probabilidades pela fórmula da distribuição
Aproximação da Distribuição Binomial
pela Distribuição Normal
np
≥≥≥≥
5
nq
≥≥≥≥
5
então
µ = np
e
σσσσ
= npq
E a variável aleatória tem
(normal)
Procedimento para Usar a Distribuição
Normal para Aproximar uma Distribuição
Binomial
1. Estabeleça que a distribuição normal é uma aproximação razoável para a distribuição binomial aproximação razoável para a distribuição binomial verificando se np ≥≥≥≥ 5 e nq ≥≥≥≥ 5.
2. Calcule os valores dos parâmetros µ e
σσσσ
calculandoµ = np e σσσσ = npq.
3. Identifique os valores discretos de x (o número de sucessos). Mude os valores discretos substituindo-os
Slide
Slide 80 sucessos). Mude os valores discretos substituindo-os pelos intervalos de x – 0.5 para x + 0.5. (Veja correção de continuidade discutido posteriormente nesta seção.) Desenhe uma curva normal e indique os valores de µ ,
4. Substitua x por x – 0.5 ou x + 0.5, o que for mais
Procedimento para Usar a Distribuição
Normal para Aproximar uma Distribuição
Binomial - cont
4. Substitua x por x – 0.5 ou x + 0.5, o que for mais apropriado.
5. Usando x – 0.5 ou x + 0.5 (o que for mais adequado) ao invés de x, calcule a área correspondente para a probabilidade desejada primeiro calculando o escore z e em seguida calculando a área a esquerda do valor e em seguida calculando a área a esquerda do valor ajustado de x.
Calcule a probabilidade de
“Pelo menos 122 homens” entre 213 passageiros
Exemplo – Número de Homens
Entre os Passageiros
“Pelo menos 122 homens” entre 213 passageiros
Slide
Slide 82
Definição
Quando usamos a distribuição normal (que é
uma distribuição de probabilidade
contínua
)
como
uma
aproximação
à
distribuição
binomial (que é
discreta
), uma
correção de
continuidade
é
feita
no
valor
numérico
discreto
x
da
distribuição
binomial
representando o valor simples x pelo intervalo
da forma
da forma
de x – 0.5 para x + 0.5
Procedimento para Correção de
Continuidade
1. Quando usar a distribuição normal como uma aproximação para a distribuição binomial, sempre use a correção de continuidade.
2. Ao usar a correção de continuidade, primeiro identifique o valor discreto x que é relevante para o problema da distribuição binomial.
3. Desenhe uma distribuição normal centrada em torno de µ, e então desenhe uma área vertical centrada em
Slide
Slide 84 de µ, e então desenhe uma área vertical centrada em
x. Mark the left side of the strip with the number x –
0.5, and mark the right side with x + 0.5. For x = 122, draw a strip from 121.5 to 122.5. Consider the area of the strip to represent the probability of discrete whole number x.
4. Agora determine se o valor de x será incluído na
Procedure for Continuity
Corrections - cont
4. Agora determine se o valor de x será incluído na probabilidade que você deseja calcular. A seguir, determine quais destas probabilidades será calculada: pelo menos x, no máximo x, maior que x, menor que x, ou exatamente x. Sombreie a área a esquerda ou a direita da marca vertical conforme apropriado, e também sombreie o interior das marcas verticais se e
também sombreie o interior das marcas verticais se e somente se x será incluído. A região sombreada total corresponde a probabilidade a ser calculada.
x
=pelo menos
122 (inclui 122 e acima)x
=mais que
122 (não inclui 122) Figura 6-22 (não inclui 122)x
=no máximo
122 (inclui 122 e abaixo)x
=menor que
122 Slide Slide 86x
=menor que
122 (não inclui 122)x
=exatamente
122Recapitulando
Nesta seção apresentamos: Nesta seção apresentamos:
Aproximação para a distribuição binomial com a distribuição normal.
Procedimentos para usar a distribuição normal para aproximar a distribuição binomial.
Correção de continuidade.
Seção 6-7
Verificando Normalidade
Slide
Slide 88
Created by Erin Hodgess, Houston, Texas
Ponto Chave
Esta seção apresenta critérios para determinar
Esta seção apresenta critérios para determinar
se os requisitos de uma distribuição normal
são satisfeitos.
Os critérios envolvem a inspeção visual de um
histograma para ver se aparenta ter um
formato
de
sino,
identificação
de
algum
formato
de
sino,
identificação
de
algum
outlier, e a construção de um novo gráfico
chamado de
plot de quantis normal
.
Definição
Um
plot de quantis normal quantile plot
(ou
gráfico de probabilidades normal
) é
(ou
gráfico de probabilidades normal
) é
uma gráfico que traça os pontos (x,y),
onde cada valor x é do conjunto de dados
originais e cada valor y é o escore z
correspondente que é o quantil esperado
Slide
Slide 90
correspondente que é o quantil esperado
de uma distribuição normal padronizada.
Métodos para Determinar se os
Dados Tem Distribuição Normal
1.
Histograma:
Construa
um
histograma.
Rejeite a normalidade se o histograma difere
Rejeite a normalidade se o histograma difere
dramaticamente de uma curva de sino.
2.
Outliers:
Identifique os outliers.
Rejeite a
normalidade se há mais que um outlier
presente.
3.
Plot de Quantis Normal:
Se o histograma é
basicamente simétrico e se há no máximo um
outlier, construa um
plot de quantis normal
a.Ordene os dados em ordem crescente.
3.
Plot de Quantis Normal
Procedimentos para Determinar se os
Dados Tem Distribuição Normal - cont
a.Ordene os dados em ordem crescente.
b.Com uma amostra de tamanho n, cada valor representa uma proporção de 1/n da amostra. Usando o valor conhecido do tamanho amostral n, identifique as áreas de 1/2n, 3/2n, 5/2n, 7/2n, e assim por diante. Estas são as áreas acumuladas à esquerda dos valores amostrais correspondentes.
Slide
Slide 92 esquerda dos valores amostrais correspondentes.
c.Use a distribuição normal padronizada (Tabela A-2, software ou calculadora) para calcular os escores z correspondentes às áreas acumuladas calculadas no passo (b).
d. Match the original sorted data values with their corresponding z scores found in Step (c), then plot the
Procedure for Determining Whether Data
Have a Distribuição Normal - cont
corresponding z scores found in Step (c), then plot the points (x, y), where each x is an original sample value and y is the corresponding z score.
e. Examine the normal quantile plot using these criteria: If the points do not lie close to a straight line, or if the points exhibit some systematic pattern that is not a straight-line pattern, then the data appear to come from straight-line pattern, then the data appear to come from a population that does not have a Distribuição Normal. If the pattern of the points is reasonably close to a straight line, then the data appear to come from a population that has a Distribuição Normal.
Exemplo
Slide
Slide 94 Interpretation: Because the points lie reasonably
close to a straight line and there does not appear to be a systematic pattern that is not a straight-line pattern, we conclude that the sample appears to
Recapitulando
Nesta seção apresentamos: Nesta seção apresentamos:
Plot de quantis normal.
Procedimentos para determinar se os dados tem uma distribuição normal.