Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

(1)

Notas de Aula

Estatística Elementar

10ª Edição

by Mario F. Triola

(2)

Capítulo 6

Distribuição de Probabilidade

Normal

6-1 Visão Geral

6-2 Distribuição Normal Padronizada 6-3 Aplicações da Distribuição Normal

6-4 Distribuições Amostrais e Estimadores 6-5 O Teorema Central do Limite

Slide Slide 2

6-6 Normal para Aproximar a Binomial 6-7 Verificando Normalidade

(3)

Seção 6-1

Visão Geral

Created by Erin Hodgess, Houston, Texas

(4)

Este capítulo foca em:

Variáveis aleatórias contínuas

Distribuição Normal

Visão Geral

Distribuição Normal

f(x) =

_σσσσ

2

ππππ

x-µµµµ σσσσ

)

2

(

e2 -1 Slide Slide 4 Figura 6-1 Fórmula 6-1

f(x) =

_σσσσ

2

ππππ

(5)

Seção 6-2

Distribuição Normal

Padronizada

(6)

Ponto Chave

Esta seção apresenta a distribuição normal padronizada, que tem três propriedades:

1. Tem forma de sino. 1. Tem forma de sino. 2. Tem média igual a 0.

3. Tem desvio padrão igual a 1.

É extremamente importante desenvolver a

Slide Slide 6 É extremamente importante desenvolver a habilidade para se determinar as áreas (ou as probabilidades ou freqüências relativas) correspondente a várias regiões sob o gráfico da distribuição normal padronizada.

(7)

Definição

Uma

variável

aleatória

contínua

tem

distribuição

uniforme

se

seus

valores

se

distribuição

uniforme

se

seus

valores

se

espalham

uniformemente

sobre a faixa de

valores de probabilidades.

O gráfico da distribuição uniforme resulta em

uma forma retangular.

(8)

Uma

curva de densidade

é o gráfico de uma

distribuição de probabilidade contínua. Ele deve

satisfazer as seguintes propriedades:

Definição

satisfazer as seguintes propriedades:

1.A área total sob a curva deve ser igual a 1.

2.Cada ponto na curva deve ter uma altura vertical

que é 0 ou maior. (Isto é, a curva não pode estar

abaixo do eixo x.)

(9)

Como a área total sob a curva de

Área e Probabilidade

Como a área total sob a curva de

densidade é igual a 1, há uma

correspondência entre área e

probabilidade.

(10)

Usando a Área para Encontrar

Probabilidades

Slide

Slide 10

(11)

Definição

A distribuição normal padronizada é uma

distribuição

de

probabilidade

com

média

igual a 0 e desvio padrão igual a 1, e a área

total sob sua curva de densidade é igual a 1.

(12)

Encontrando Probabilidades

-Tabela A-2

Incluída na contra capa do livro

No cartão de fórmulas e tabelas

No apêndice

Slide

(13)

Encontrando Probabilidades –

Outros Métodos

STATDISK

Minitab

Excel

TI-83/84

(14)

Tabela A-2 - Exemplo

Slide

(15)

Escore z

Distância

na escala horizontal da distribuição

Usando a Tabela A-2

Distância

na escala horizontal da distribuição

normal

padronizada;

refere-se

à

coluna

à

esquerda e à linha superior da Tabela A-2.

Área

Região

sobre a curva; refere-se aos valores no

(16)

Se

termômetros

científicos

têm

uma

leitura média de 0 graus e um desvio

Exemplo - Termômetros

leitura média de 0 graus e um desvio

padrão

de

1 grau

no

ponto

de

congelamento da água, e se um destes

termômetros

é

selecionado

ao

acaso,

encontre a probabilidade de, no ponto de

congelamento da água, a leitura ser menor

Slide

Slide 16

congelamento da água, a leitura ser menor

que

1.58 graus.

(17)

P(z < 1.58) =

Exemplo - Cont

(18)

Look at Tabela A-2

Slide

(19)

P (z < 1.58) = 0.9429

Exemplo - cont

(20)

P (z < 1.58) = 0.9429

Exemplo - cont

Slide

Slide 20

A probabilidade de que o termômetro selecionado medirá a temperatura de congelamento da água em um valor menor ou igual a 1.58 graus é 0.9429.

(21)

P (z < 1.58) = 0.9429

Exemplo - cont

94.29% dos termômetros têm leitura menor que 1.58 graus.

(22)

Se termômetros têm uma leitura média de 0 graus e

um desvio padrão de 1 grau, e se um destes

termômetros é selecionado ao acaso, calcule a

probabilidade de que sua leitura no ponto de

Exemplo - cont

probabilidade de que sua leitura no ponto de

congelamento da água seja maior que

–1.23

graus.

P (z >

–

1.23) = 0.8907

Slide

Slide 22

A probabilidade de que o termômetro selecionado tenha leitura superior a -1.23 graus é 0.8907.

(23)

P (z >

–

1.23) = 0.8907

Exemplo - cont

(24)

Um termômetro é selecionado aleatoriamente. Calcule a probabilidade de que sua leitura (no ponto de congelamento da água) esteja entre –2.00 e 1.50 graus.

P (z < –2.00) = 0.0228

Exemplo - cont

P (z < –2.00) = 0.0228 P (z < 1.50) = 0.9332 P (–2.00 < z < 1.50) = 0.9332 – 0.0228 = 0.9104 Slide Slide 24 A probabilidade de que o termômetro escolhido tenha leitura entre – 2.00 e 1.50 graus é 0.9104.

(25)

P (z < –2.00) = 0.0228

Um termômetro é selecionado aleatoriamente. Calcule a probabilidade de que sua leitura (no ponto de congelamento da água) esteja entre –2.00 e 1.50 graus.

Exemplo - Modificado

P (z < –2.00) = 0.0228 P (z < 1.50) = 0.9332 P (–2.00 < z < 1.50) =

0.9332 – 0.0228 = 0.9104

Se vários termômetros são selecionados ao acaso e testados no ponto de congelamento da água, então temos que 91.04% destes

(26)

P(a < z < b)

determina a probabilidade de que o escore z esteja entre a

Notação

determina a probabilidade de que o escore z esteja entre a e b.

P(z > a)

determina a probabilidade de que o escore z é maior que

a.

Slide

Slide 26

a.

P(z < a)

determina a probabilidade de que o escore z é menor que

(27)

Calculando o Escore z Para

Probabilidades Dadas Usando a

Tabela A-2

1. Desenhe a curva da normal e identifique a região

sob a curva que corresponde à probabilidade

dada.

Se

esta

região

não

é

uma

região

acumulativa a partir da esquerda, trabalhe com

áreas

conhecidas

que

sejam

acumuladas

à

esquerda.

2. Usando a área acumulada à esquerda, localize a

probabilidade mais próxima no

corpo

da Tabela

(28)

Calculando o Escore z para

Probabilidades Dadas

5% ou 0.05

Slide

Slide 28 (Escore z será positivo)

Figura 6-10

(29)

Calculando o Escore z para

Probabilidades Dadas - cont

5% ou 0.05

Figura 6-10

Encontrando o 95º _Percentil

1.645

(30)

Calculando o Escore z para

Probabilidades Dadas - cont

Slide

Slide 30

Figura 6-11

Encontrando o 2.5% inferior e o 2.5% superior

(31)

Calculando o Escore z para

Probabilidades Dadas - cont

Figura 6-11

(32)

Calculando o Escore z para

Probabilidades Dadas - cont

Slide

Slide 32

Figura 6-11

(33)

Recapitulando

Nesta seção apresentamos:

Curvas de densidade.

Relação entre área e probabilidade

Distribuição normal padronizada.

Usando a Tabela A-2.

(34)

Seção 6-3

Aplicações da

Distribuição Normal

(35)

Ponto Chave

Esta seção apresenta métodos para trabalhar

com

distribuições

normais

que

não

são

com

distribuições

normais

que

não

são

padronizadas. Isto é, a média não é 0 ou o

desvio padrão não é 1, ou ambos.

O ponto chave é que podemos usar uma

conversão simples que nos permite padronizar

qualquer distribuição normal de modo que os

mesmos métodos da seção anterior possam

ser utilizados.

(36)

Fórmula de Conversão

x –

µ

z

Fórmula 6-2

x –

µ

σσσσ

z

=

Arredonde os escores z para 2 casas decimais

Slide

(37)

Convertendo Para uma

Distribuição Normal Padronizada

x –

µµµµ

σσσσ

z =

(38)

No Problema do Capítulo, notamos que a carga

Exemplo – Peso de Passageiros

de Táxis Aquáticos

No Problema do Capítulo, notamos que a carga de segurança para um táxi aquático era de 3500 libras (aproximadamente 1588 kg). Também notamos que o peso médio dos passageiros é considerado igual a 140 libras. Assuma o pior caso de que todos os passageiros são homens. Assuma também que o peso destes homens são

Slide

Slide 38 normalmente distribuídos com média 172 libras e

desvio padrão de 29 libras. Se um homem é selecionado ao acaso, qual é a probabilidade de que ele pese menos do que 174 libras?

(39)

Exemplo - cont

z = 174 – 172 29 = 0.07 σ = 29 µµµµ = 172 29 σ = 29 Figura 6-13

(40)

Exemplo - cont

P ( x < 174 lb.) = P(z < 0.07) σ = 29 µµµµ = 172 P ( x < 174 lb.) = P(z < 0.07) = 0.5279 σ = 29 Slide Slide 40 Figura 6-13

(41)

1. Não confunda escores z e áreas. Os escores z são

distâncias ao longo da escala horizontal, enquanto que as áreas são regiões sob a curva normal. A

Cuidados Para Ter em Mente

que as áreas são regiões sob a curva normal. A Tabela A-2 lista os escores z na coluna à esquerda e na linha superior, e as áreas são encontradas no corpo da Tabela.

2. Escolha o lado correto (direito/esquerdo) do gráfico.

3. Um escore z deve ser negativo toda vez que ele se 3. Um escore z deve ser negativo toda vez que ele se localizar na metade esquerda da distribuição normal. 4. Áreas (ou probabilidades) são positivoas ou nulas, portanto nunca serão negativas.

(42)

Procedimento para Calcular

Valores Usando a Tabela A-2 e a

Fórmula 6-2

1. Esboce a curva da distribuição normal, introduza a probabilidade ou percentagem dada na região apropriada do gráfico e identifique o valor x de seu interesse.

identifique o valor x de seu interesse.

2. Use a Tabela A-2 para encontrar o escore z correspondente à área acumulada à esquerda de x. Consulte o corpo da Tabela A-2 para encontrar a área mais próxima, então identifique o escore z correspondente.

3. Usando a Fórmula 6-2, introduza os valores de µ, σσσσ, e o escore z encontrado no passo 2, e resolva para x.

Slide

Slide 42

x = µ + (z • σσσσ) (Outra forma para a Fórmula 6-2)

(Se z está localizado à esquerda da média, tenha certeza de que seja um número negativo.)

4. Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema.

(43)

Exemplo – Mais Leves e Mais

Pesados

Use os dados do exemplo anterior para determinar que peso separa os 99.5% mais leves dos 0.5% que peso separa os 99.5% mais leves dos 0.5% homens mais pesados.

(44)

x =

µµµµ

+ (z ●

σσσσ

)

x = 172 + (2.575 •••• 29)

Exemplo – Mais Leves e Mais

Pesados - cont

x = 172 + (2.575 •••• 29)

x = 246.675 (247 rounded)

Slide

(45)

O peso de 247 libras separa os 99.5% mais leves dos 0.5% mais pesados.

Exemplo – Mais Leves e Mais

Pesados - cont

(46)

Recapitulando

Nesta seção apresentamos:

Distribuição normal não padronizada.

Convertendo para uma distribuição normal

padronizada.

Procedimentos para calcular valores usando a

Slide

Slide 46

Procedimentos para calcular valores usando a

Tabela A-2 e a Fórmula 6-2.

(47)

Seção 6-4

Distribuições Amostrais e

Estimadores

(48)

Ponto Chave

O objetivo principal desta seção é entender o

conceito de

distribuição amostral de uma

conceito de

distribuição amostral de uma

estatística

, a qual é a distribuição de todos

os valores da estatística quando todas as

possíveis amostras de mesmo tamanho são

observadas.

Nós

também

veremos

que

algumas

Slide

Slide 48

Nós

também

veremos

que

algumas

estatísticas são melhores que outras para

estimar parâmetros populacionais.

(49)

Definição

A

distribuição amostral de uma estatística

(tal

como

a

proporção

amostral

ou

a

média

como

a

proporção

amostral

ou

a

média

amostral) é a distribuição de todos os valores

da

estatística

quando

todas

as

possíveis

amostras

de

mesmo

tamanho

n

são

(50)

Definição

A

distribuição

amostral

de

uma

A

distribuição

amostral

de

uma

proporção

é a distribuição das proporções

amostrais, com todas as amostras tendo o

mesmo

tamanho

amostral

n

são

selecionadas de uma mesma população.

Slide

(51)

Propriedades

Proporções

amostrais

tendem

a

se

aproximarem

do

valor

da

proporção

aproximarem

do

valor

da

proporção

populacional.

(Ou seja, todas as possíveis

proporções

amostrais

têm

média

igual

à

proporção populacional.)

Sob certas condições, a distribuição da

proporção amostral pode ser aproximada pela

distribuição normal.

(52)

Definição

A

distribuição amostral da média

é

a

A

distribuição amostral da média

é

a

distribuição das médias amostrais, com

todas as amostras tendo o mesmo tamanho

amostral n selecionadas de uma mesma

população.

(A distribuição amostral da

média é tipicamente representada como

uma

distribuição

de

probabilidade

no

Slide

Slide 52

uma

distribuição

de

probabilidade

no

formato de uma tabela, histograma de

probabilidade ou fórmula.)

(53)

Definição

O valor de uma estatística, tal como a média

amostral x, depende dos valores incluídos na

amostra estudada, e geralmente variam de

amostra para amostra. Esta variabilidade das

estatísticas

é

chamada

de

variabilidade

(54)

Estimadores

Algumas

estatísticas

funcionam

melhores

que outras como estimadores de parâmetros

populacionais. O exemplo que se segue

ilustra esta propriedade.

Slide

(55)

Exemplo - Distribuições Amostrais

Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.

a. Para cada amostra, calcule a média, mediana, amplitude, variância e desvio padrão.

b. Para cada estatística do item (a), calcule a b. Para cada estatística do item (a), calcule a média com base em todas as amostras.

(56)

Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.

Distribuições Amostrais

2 com reposição. Há 9 possíveis amostras.

a. Para cada amostra, calcule a média, mediana, amplitude, variância e desvio padrão.

Veja a Tabela 6-7 no próximo slide.

Slide

Slide 56

(57)

(58)

Uma população consiste dos valores 1, 2, e 5. Nós selecionamos aleatoriamente amostras de tamanho 2 com reposição. Há 9 possíveis amostras.

Distribuições Amostrais

b. Para cada estatística do item (a), calcule a média com base em todas as amostras

As médias são apresentadas abaixo dos valores amostrais na Tabela 6-7.

Slide

Slide 58

(59)

Interpretação das Distribuições

Amostrais

Nós podemos ver que usando as estatísticas

amostrais para estimar parâmetros populacionais, amostrais para estimar parâmetros populacionais, algumas são melhores que outras, no sentido de “acertarem” o valor do parâmetro em questão, e são portanto preferíveis para obtermos bons resultados. Tais estatísticas são chamadas de estimadores centrados ou não viesados..

Estatísticas que acertam o valor dos parâmetros populacionais: média, variância, proporção

Estatísticas que não acertam o valor do parâmetro populacional: mediana, amplitude, desvio padrão

(60)

Recapitulando

Nesta seção apresentamos:

Distribuição amostral de uma estatística.

Distribuição amostral de uma proporção.

Distribuição amostral da média.

Variabilidade Amostral.

Slide

Slide 60

Variabilidade Amostral.

(61)

Seção 6-5

O Teorema Central do

Limite

(62)

Ponto Chave

Os procedimentos desta seção formam a

base

para

a

estimação

de

parâmetros

populacionais e para os testes de hipótese –

tópicos a serem discutidos ao longo dos

capítulos seguintes.

Slide

(63)

Teorema Central do Limite

1. Uma variável aleatória x tem uma distribuição (que

Dado que:

1. Uma variável aleatória x tem uma distribuição (que pode ser normal ou não) com média µ e desvio padrão

σσσσ

.

2. Amostras aleatórias simples todas de tamanho n são selecionadas da população. (As amostras são selecionadas de tal maneira que todas as amostras possíveis de mesmo tamanho n têm a mesma chance possíveis de mesmo tamanho n têm a mesma chance de serem selecionadas.)

(64)

1. A distribuição da média amostral x irá, com

Conclusões:

Teorema Central do Limite

-cont

1. A distribuição da média amostral x irá, com

o

aumento

do

tamanho

da

amostra,

aproximar-se de uma

Distribuição Normal

.

2. A média das médias amostrais é a média

populacional µ.

Slide

Slide 64

3. O desvio padrão de todas as médias

amostrais é

σ/

.

(65)

Regras Práticas Comumente Usadas

1. Para amostras de tamanho n maiores que

30, a distribuição das médias amostrais pode

ser aproximada razoavelmente bem pela

Distribuição Normal.

A aproximação fica

cada vez melhor com o aumento do tamanho

amostral n.

2. Se a população original é normalmente

distribuída. Então as médias amostrais serão

normalmente distribuídas para

qualquer

tamanho amostral n (e não apenas para

valores de n maiores que 30).

(66)

Notação

A média das médias amostrais

µ = µ

o desvio padrão das médias amostrais

µ

x

= µ

n

σ

x

=

σ

(geralmente chamado de erro padrão da média)

n

(67)

Simulação com Números

Aleatórios

Gere 500.000 números aleatórios, e os agrupe em 5000 amostras de 100 números cada. Calcule a ,média de cada amostra.

Apesar dos 500.000 números terem uma distribuição uniforme, a distribuição das 5.000 médias amostrais é aproximadamente igual uma Distribuição Normal!

(68)

Com o aumento do tamanho

Ponto Importante

Com o aumento do tamanho

amostral temos que a

distribuição amostral das

médias amostrais aproxima-se

da Distribuição Normal.

Slide

Slide 68

da Distribuição Normal.

(69)

Dado que a população de homens tem o peso

distribuído normalmente com média 172 lb e um

Exemplo – Segurança em Táxi

Aquático

distribuído normalmente com média 172 lb e um

desvio padrão de 29 lb:

a) se um homem é selecionado aleatoriamente,

calcule a probabilidade de que seu peso seja

maior que 175 lb.

b) se 20 homens diferentes são selecionados

aleatoriamente, calcule a probabilidade de que

seu peso médio seja maior que 175 lb (ou seja,

que o peso total destes homens exceda a

(70)

a) se um homem é selecionado aleatoriamente,

calcule a probabilidade de que o seu peso não

seja maior do que 175 lb.

Exemplo – cont

z = 175 – 172 = 0.10 29

Slide

(71)

b) se 20 homens diferentes são selecionados

aleatoriamente, calcule a probabilidade de que

seu peso médio seja maior que 175 lb.

Exemplo – cont

z = 175 – 172 = 0.46 29

(72)

a) se um homem é selecionado aleatoriamente, a probabilidade de que o seu peso seja maior que 175 lb é:

Exemplo - cont

b) se 20 homens são selecionados aleatoriamente, a probabilidade de que o peso médio seja maior que 175 lb é:

P(x > 175) = 0.3228

é:

P(x > 175) = 0.4602

P(x > 175) = 0.3228

É muito mais fácil que um valor individual se distancie da média que um grupo de 20 valores se desviem da média.

(73)

Interpretação dos Resultados

Dado que a capacidade de um taxi aquático é

de 3500 libras, temos uma grande chance

(com probabilidade 0,3228) de que ele seja

sobrecarregado

ao

termos

20 homens

(74)

Correção para População Finita

Quando amostramos sem reposição e o tamanho da amostra n é maior que 5% da população finita de tamanho N, ajuste o desvio padrão das médias

N –

n

σσσσ

_x

=

σσσσ

n

N –

1

tamanho N, ajuste o desvio padrão das médias amostrais pelo fator de correção:

Slide

Slide 74

fator de correção

(75)

Recapitulando

Nesta seção apresentamos:

Teorema Central do Limite.

Regras Práticas.

Efeitos do tamanho amostral.

(76)

Seção 6-6

Normal para Aproximar a

Binomial

Slide

Slide 76

(77)

Ponto Chave

Esta seção apresenta um método para usar a distribuição normal como uma aproximação para a distribuição normal como uma aproximação para a distribuição de probabilidade binomial.

Se as condições de np ≥ 5 e nq ≥ 5 são ambas satisfeitas, então as probabilidades de uma distribuição de probabilidade binomial podem ser aproximadas usando uma distribuição normal com média µ = np e

desvio padrão σ = √npq

(78)

Revisão

Distribuição de Probabilidade binomial

1. O experimento deve ter um número fixo de realizações.

2. As realizações devem ser independentes.

3. Cada realização deve ter todos os resultados classificados

em duas categorias.

4. A probabilidade de sucesso permanece constante em todas as realizações.

Slide

Slide 78 Calcule as probabilidades pela fórmula da distribuição

(79)

Aproximação da Distribuição Binomial

pela Distribuição Normal

np

≥≥≥≥

5 nq

≥≥≥≥

5 então

µ = np

e

σσσσ

= npq

E a variável aleatória tem

(normal)

(80)

Procedimento para Usar a Distribuição

Normal para Aproximar uma Distribuição

Binomial

1. Estabeleça que a distribuição normal é uma aproximação razoável para a distribuição binomial aproximação razoável para a distribuição binomial verificando se np ≥≥≥≥ 5 e nq ≥≥≥≥ 5.

2. Calcule os valores dos parâmetros µ e

σσσσ

calculando

µ = np e σσσσ = npq.

3. Identifique os valores discretos de x (o número de sucessos). Mude os valores discretos substituindo-os

Slide

Slide 80 sucessos). Mude os valores discretos substituindo-os pelos intervalos de x – 0.5 para x + 0.5. (Veja correção de continuidade discutido posteriormente nesta seção.) Desenhe uma curva normal e indique os valores de µ ,

(81)

4. Substitua x por x – 0.5 ou x + 0.5, o que for mais

Procedimento para Usar a Distribuição

Normal para Aproximar uma Distribuição

Binomial - cont

4. Substitua x por x – 0.5 ou x + 0.5, o que for mais apropriado.

5. Usando x – 0.5 ou x + 0.5 (o que for mais adequado) ao invés de x, calcule a área correspondente para a probabilidade desejada primeiro calculando o escore z e em seguida calculando a área a esquerda do valor e em seguida calculando a área a esquerda do valor ajustado de x.

(82)

Calcule a probabilidade de

“Pelo menos 122 homens” entre 213 passageiros

Exemplo – Número de Homens

Entre os Passageiros

“Pelo menos 122 homens” entre 213 passageiros

Slide

Slide 82

(83)

Definição

Quando usamos a distribuição normal (que é

uma distribuição de probabilidade

contínua

)

como

uma

aproximação

à

distribuição

binomial (que é

discreta

), uma

correção de

continuidade

é

feita

no

valor

numérico

discreto

x

da

distribuição

binomial

representando o valor simples x pelo intervalo

da forma

de x – 0.5 para x + 0.5

(84)

Procedimento para Correção de

Continuidade

1. Quando usar a distribuição normal como uma aproximação para a distribuição binomial, sempre use a correção de continuidade.

2. Ao usar a correção de continuidade, primeiro identifique o valor discreto x que é relevante para o problema da distribuição binomial.

3. Desenhe uma distribuição normal centrada em torno de µ, e então desenhe uma área vertical centrada em

Slide

Slide 84 de µ, e então desenhe uma área vertical centrada em

x. Mark the left side of the strip with the number x –

0.5, and mark the right side with x + 0.5. For x = 122, draw a strip from 121.5 to 122.5. Consider the area of the strip to represent the probability of discrete whole number x.

(85)

4. Agora determine se o valor de x será incluído na

Procedure for Continuity

Corrections - cont

4. Agora determine se o valor de x será incluído na probabilidade que você deseja calcular. A seguir, determine quais destas probabilidades será calculada: pelo menos x, no máximo x, maior que x, menor que x, ou exatamente x. Sombreie a área a esquerda ou a direita da marca vertical conforme apropriado, e também sombreie o interior das marcas verticais se e

também sombreie o interior das marcas verticais se e somente se x será incluído. A região sombreada total corresponde a probabilidade a ser calculada.

(86)

x

=

pelo menos

122 (inclui 122 e acima)

x

=

mais que

122 (não inclui 122) Figura 6-22 (não inclui 122)

x

=

no máximo

122 (inclui 122 e abaixo)

x

=

menor que

122 Slide Slide 86

x

=

menor que

122 (não inclui 122)

x

=

exatamente

122

(87)

Recapitulando

Nesta seção apresentamos: Nesta seção apresentamos:

Aproximação para a distribuição binomial com a distribuição normal.

Procedimentos para usar a distribuição normal para aproximar a distribuição binomial.

Correção de continuidade.

(88)

Seção 6-7

Verificando Normalidade

Slide

Slide 88

(89)

Ponto Chave

Esta seção apresenta critérios para determinar

se os requisitos de uma distribuição normal

são satisfeitos.

Os critérios envolvem a inspeção visual de um

histograma para ver se aparenta ter um

formato

de

sino,

identificação

de

algum

formato

de

sino,

identificação

de

algum

outlier, e a construção de um novo gráfico

chamado de

plot de quantis normal

.

(90)

Definição

Um

plot de quantis normal quantile plot

(ou

gráfico de probabilidades normal

) é

(ou

gráfico de probabilidades normal

) é

uma gráfico que traça os pontos (x,y),

onde cada valor x é do conjunto de dados

originais e cada valor y é o escore z

correspondente que é o quantil esperado

Slide

Slide 90

correspondente que é o quantil esperado

de uma distribuição normal padronizada.

(91)

Métodos para Determinar se os

Dados Tem Distribuição Normal

1. Histograma:

Construa

um

histograma.

Rejeite a normalidade se o histograma difere

dramaticamente de uma curva de sino.

2. Outliers:

Identifique os outliers.

Rejeite a

normalidade se há mais que um outlier

presente.

3. Plot de Quantis Normal:

Se o histograma é

basicamente simétrico e se há no máximo um

outlier, construa um

plot de quantis normal

(92)

a.Ordene os dados em ordem crescente.

3. Plot de Quantis Normal

Procedimentos para Determinar se os

Dados Tem Distribuição Normal - cont

a.Ordene os dados em ordem crescente.

b.Com uma amostra de tamanho n, cada valor representa uma proporção de 1/n da amostra. Usando o valor conhecido do tamanho amostral n, identifique as áreas de 1/2n, 3/2n, 5/2n, 7/2n, e assim por diante. Estas são as áreas acumuladas à esquerda dos valores amostrais correspondentes.

Slide

Slide 92 esquerda dos valores amostrais correspondentes.

c.Use a distribuição normal padronizada (Tabela A-2, software ou calculadora) para calcular os escores z correspondentes às áreas acumuladas calculadas no passo (b).

(93)

d. Match the original sorted data values with their corresponding z scores found in Step (c), then plot the

Procedure for Determining Whether Data

Have a Distribuição Normal - cont

corresponding z scores found in Step (c), then plot the points (x, y), where each x is an original sample value and y is the corresponding z score.

e. Examine the normal quantile plot using these criteria: If the points do not lie close to a straight line, or if the points exhibit some systematic pattern that is not a straight-line pattern, then the data appear to come from straight-line pattern, then the data appear to come from a population that does not have a Distribuição Normal. If the pattern of the points is reasonably close to a straight line, then the data appear to come from a population that has a Distribuição Normal.

(94)

Exemplo

Slide

Slide 94 Interpretation: Because the points lie reasonably

close to a straight line and there does not appear to be a systematic pattern that is not a straight-line pattern, we conclude that the sample appears to

(95)

Recapitulando

Nesta seção apresentamos: Nesta seção apresentamos:

Plot de quantis normal.

Procedimentos para determinar se os dados tem uma distribuição normal.