Notas de Aula
Estatística Elementar
10ª Edição
10ª Edição
by Mario F. Triola
Slide Slide 1Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Capítulo 8
Teste de Hipótese
8-1 Visão Geral 8-1 Visão Geral
8-2 Fundamentos do Teste de Hipótese
8-3 Testando Afirmações sobre uma Proporção
8-4 Testando Afirmações sobre uma Média: σ Conhecido
8-5 Testando Afirmações sobre uma Média: σ
Desconhecido Desconhecido
8-6 Testando Afirmações sobre o Desvio Padrão ou Variância
Seção 8-1
Visão Geral
Slide Slide 3
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Created by Erin Hodgess, Houston, Texas
Definições
Em estatística, uma
hipótese
é uma afirmação
Em estatística, uma
hipótese
é uma afirmação
ou setença sobre as propriedades de uma
população.
Um
Teste de hipótese
(ou
teste de significância
)
é um procedimento padronizado para testar
uma afirmação sobre as propriedades de uma
uma afirmação sobre as propriedades de uma
população.
Regra do Evento Raro para a
Inferência Estatística
Se,
sob
uma
dada
suposição,
a
probabilidade de um evento particular
observado é excepcionalmente pequena,
nós
concluímos
que
a
suposição
provavelmente não é correta.
Slide Slide 5
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo: As Indústrias ProCare Ltda. forneceram, certa vez, um produto chamado “Gender Choice” (Escolha o Sexo) que, de acordo com a propaganda, permitia aos casais “aumentar em até 80% as suas chances de ter uma menina.” Suponha que façamos um experimento com 100 casais que querem ter meninas e que eles sigam o Gender Choice, “um sistema fácil de usar em casa” descrito na Choice, “um sistema fácil de usar em casa” descrito na embalagem cor de rosa para meninas. Com o propósito de testar a afirmação de que há um acréscimo na proporção de meninas vamos assumir que o Gender Choice não tem efeito. Usando o bom senso e nenhum método formal de estatística, o que podemos concluir sobre a suposição de nenhum efeito do Gender Choice se 100 casais usando Gender Choice tiverem 100 bebês sendo:
Gender Choice tiverem 100 bebês sendo:
a) 52 meninas? b) 97 meninas?
Exemplo:
Indústrias ProCare Industries Ltda.: Parte a)a) Nós em geral esperamos cerca de 50 meninas em 100 nascimentos. O resultado de 52 meninas é bastante próximo de 50, então não podemos é bastante próximo de 50, então não podemos concluir que o Gender Choice é realmente eficaz. Se os 100 casais não usaram nenhum método especial para seleção de gênero, o resultado de 52 meninas pode ocorrer facilmente. A suposição de não efeito do Gender Choice aparenta ser correta. Não temos
Slide Slide 7
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Choice aparenta ser correta. Não temos evidência para afirmar que p Gender Choice é eficiente.
Exemplo:
Indústrias ProCare Industries Ltda.: Parte b)b) O resultado de 97 meninas em 100 nascimentos é extremamente improvável de acontecer. é extremamente improvável de acontecer. Podemos explicar este fato por duas maneiras: Um evento extremamente raro ocorreu devido a fatores aleatórios, ou o Gender Choice é eficiente. A probabilidade extremamente baixa em termos 97 meninas em 100 nascimentos é uma forte evidência contra a suposição inicial de que o evidência contra a suposição inicial de que o Gender Choice não funciona.
Seção 8-2
Fundamentos de Teste de
Hipótese
Hipótese
Slide Slide 9Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Created by Erin Hodgess, Houston, Texas
Pontos Chave
Esta seção apresenta os componentes individuais de um teste de hipótese, e as seções seguintes usarão estes componentes em um procedimento claro e objetivo.
A função de cada um deles deve ser bem compreendido: A função de cada um deles deve ser bem compreendido:
Hipótese Nula Hipótese Alternativa Estatística do Teste Região Crítica Nível de Significância Nível de Significância Valor Crítico
Dada
uma
afirmação,
identificar
as
hipóteses nula e alternativa, e expressá-las
em forma simbólica.
Seção 8-2 Objetivos
em forma simbólica.
Dada
uma
afirmação
e
uma
amostra,
calcular o valor da estatística do teste.
Dado um nível de significância. Identificar
o(s) valor(es) crítico(s).
Dado o valor da estatística do teste,
Slide
Slide 11
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Dado o valor da estatística do teste,
identificar o P-valor.
Formar uma conclusão a respeito do teste
de hipótese em uma linguagem simples e
não técnica.
Exemplo:
Vamos usar novamente o exemplo do Gender Choice que foi distribuido pelaws Indústrias ProCare. As Indústrias ProCare afirmaram que os casais que usarem a caixa rosa do Gender Choice terão as chances de terem meninas maiores que 50%, ou 0,5. Vamos novamente considerar o experimento onde 100 casais usam o Gender Choice com a onde 100 casais usam o Gender Choice com a intenção de terem uma menina. Vamos assumir que nos 100 nascimentos temos exatamente 52 meninas, e vamos formalizar algumas análises:Sob circunstâncias normais a proporção de meninas é de 0,5, então a afirmação de que o Gender Choice é funcional pode ser expressa como p > 0,5.
Usando a distribuição normal como uma aproximação à binomial nós achamos que P(52 ou mais meninas em 100 nascimentos) = 0,3821.
Slide
Slide 13
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Nós não podemos excluir o efeito aleatório como uma possível explicação. Concluímos, então, que a proporção de meninas que nasceram de casais que usaram o Gender Choice não é significantemente maior do que o número esperado devido a fatores aleatórios.
Afirmação: Para casais que usam Gender Choice, a proporção de meninas é p > 0.5.
Observações
Suposição de trabalho: A proporção de meninas é p = 0.5 (com o Gender Choice sem surtir efeito).
Há duas possíveis explicações para o resultado de 52 meninas
Assumindo que p = 0.5, nós usamos a distribuição normal como uma aproximação à distribuição binomial para achar que P (Pelo menos 52 meninas em 100 nascimentos) = 0.3821.
ˆ
A amostra apresenta 52 meninas em 100 nascimentos, então a proporção amostral é p = 52/100 = 0.52.
(com o Gender Choice sem surtir efeito).
Há duas possíveis explicações para o resultado de 52 meninas em 100 nascimentos: Ou uma variação aleatória ocorreu (com probabilidade igual a 0.3821), ou a proporção de meninas
Componentes de um
Componentes de um
Teste de Hipótese
Formal
Slide Slide 15Hipótese Nula:
H
0
A
hipótese nula
(denotada por H
0) é
uma suposição de que o valor de um
0uma suposição de que o valor de um
parâmetro populacional (tal como a
proporção, média ou desvio padrão) é
igual a
algum valor pré-fixado.
Nós testamos a hipótese nula
diretamente.
Hipótese Alternativa:
H
1
A
hipótese alternativa
(denotada por
H ou H ou H ) é a suposição de que
H
1ou H
aou H
A) é a suposição de que
o parâmetro populacional tem um
valor que difere do apresentado na
hipótese nula.
A forma simbólica para a hipótese
Slide
Slide 17
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
A forma simbólica para a hipótese
alternativa
deve
usar
um
destes
sinais:
≠≠≠≠
, <, >.
Notas sobre Como Formar suas
Próprias Afirmações (Hipóteses)
Se você está executando um estudo e
quer usar um teste de hipótese para
basear
a sua afirmação, esta afirmação
dever ser escrita de tal forma que se
torne a hipótese alternativa.
Notas sobre Como Identificar
H
0
e H
1
Figura 8-2
Slide
Slide 19
Exemplo:
Identifique as hipóteses nulas e alternativas. Use a Figura 8-2 e com base nas afirmações dadas expresse as hipóteses nula e alternativa correspondentes em forma simbólica.a) A proporção de motoristas que admitem passar em sinal vermelho é maior que 0,5.
b) A altura média dos jogadores de basquetes da liga profissional é de no máximo 2,14m.
c) O desvio padrão do escore de QI dos atores é igual c) O desvio padrão do escore de QI dos atores é igual
Exemplo:
Identifique as hipóteses nulas e alternativas. Use a Figura 8-2 e com base nas afirmações dadas expresse as hipóteses nula e alternativa correspondentes em forma simbólica.a) A proporção de motoristas que admitem ultrapassar o sinal vermelho é maior que 0,5. No passo 1 da Figura 8-2, nós expressamos a afirmação dada como p > 0.5. No passo 2I, nós vemos que se p > 0.5 é falso, então p ≤≤≤≤ 0.5 deve ser verdadeiro. No passo 3, observamos que a expressão p > 0.5 não contém a igualdade, então nós determinamos a hipótese alternativa H1 como p > 0.5, e a hipótese nula H0 como p =
Slide
Slide 21
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
alternativa H1 como p > 0.5, e a hipótese nula H0 como p = 0.5.
Exemplo:
Identifique as hipóteses nulas e alternativas. Use a Figura 8-2 e com base nas afirmações dadas expresse as hipóteses nula e alternativa correspondentes em forma simbólica.b) A altura média dos jogadores de basquetes da liga profissional é de no máximo 2,14m. No passo 1 da Figura 8-2 nós expressamos “a média é de no máximo 2,14m” simbolicamente como µµµµ ≤≤≤≤ 2,14. No passo 2, nós vemos que se µµµµ ≤≤≤≤ 2,14 é falsam então µ > 2,14 deve ser verdadeiro. No passo 3, nós vemos que se a expressão
µ > 2,14 não contém a igualdade, então a hipótese alternativa H será µ > 2,14, e H será µ = 2,14.
Exemplo:
Identifique as hipóteses nulas e alternativas. Use a Figura 8-2 e com base nas afirmações dadas expresse as hipóteses nula e alternativa correspondentes em forma simbólica.c) O desvio padrão do escore de QI dos atores é igual a 15. No passo 1 da Figura 8-2 nós representamos esta afirmação como σσσσ = 15. No passo 2, vemos que se σσσσ = 15 é falso, então σσσσ ≠ ≠ ≠ ≠ 15 deve ser verdadeiro. No passo 3, temos que a hipótese alternativa H1 será σσσσ ≠ ≠ ≠ ≠ 15, e que
σσσσ
Slide
Slide 23
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
1
A
estatística do teste
é um valor usado
Estatística de Teste
A
estatística do teste
é um valor usado
para tomar a decisão sobre a hipótese nula,
e é calculada convertendo a estatística
amostral em um escore com a suposição
de que a hipótese nula é verdadeira.
Estatística do Teste - Fórmulas
z
=p - p
/\pq
√√√√
Estatística do
teste para
proporções
z
=
x - µ
x
σ
σ
σ
σ
n
Estatística do
teste para
média
pq
n
√√√√
proporções
Estatística do
Slide Slide 25Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
χχχχ
2
=
(n – 1)s
2
σσσσ
2222Estatística do
teste para
desvio
padrão
Exemplo:
Uma pesquisa com uma amostra
aleatória de 880 motoristas adultos mostrou
que 56% (ou p = 0.56) destes respondentes
admitiram que ultrapassavam o sinal fechado.
admitiram que ultrapassavam o sinal fechado.
Encontre o valor da estatística do teste para a
afirmação de que a maioria dos adultos
admitem ultrapassar o sinal fechado. (Na
Seção 8-3 nós veremos que há algumas
suposições a serem observadas. Para este
exemplo, admitamos que estas suposições
exemplo, admitamos que estas suposições
são obedecidas e vamos nos focar em
encontrar a estatística do teste adequada.)
Solução:
O exemplo anterior mostrou que a
afirmação
dada
resulta
nas
seguintes
hipóteses nula e alternativa: H
0: p=0.5 e H
1:
p>0.5. Devido a trabalharmos sob a suposição
de que a hipótese nula é verdadeira, ou seja,
p=0.5, nós temos a seguinte estatística do
p=0.5, nós temos a seguinte estatística do
teste:
pq
√√√√
z = p – p
/\=
0.56 - 0.5
(
0.5)(0.5)
√√√√
=
3.56
Slide Slide 27Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
n
pq
√√√√
√√√√
(
0.5)(0.5)
880
Interpretação:
Nós
sabemos
dos
capítulos anteriores que o valor de
z=3,56 é excepcionalmente alto. Isto
z=3,56 é excepcionalmente alto. Isto
indica que mais que ser maior que
50%, o resultado amostral de 56% é
significativamente
maior que 50%.
Veja figura abaixo:
Região Crítica, Valor Crítico,
Estatística do Teste
Slide
Slide 29
Região Crítica
A
região crítica
(ou
região de rejeição
) é o
A
região crítica
(ou
região de rejeição
) é o
conjunto de valores para a estatística do
teste que nos faz rejeitar a hipótese nula.
Por exemplo, veja a região sombreada em
vermelho na figura anterior.
Nível de Significância
O
nível de significância
(denotado por
αααα
)
é a
probabilidade de que a estatística do teste irá
probabilidade de que a estatística do teste irá
pertencer à região crítica quando a hipótese
nula for verdadeira. Este é o mesmo
αααα
que
introduzimos na Seção 7-2. Valores comuns
para
αααα
são 0.05, 0.01, e 0.10.
Slide
Slide 31
Valor Crítico
Um
valor crítico
é qualquer valor que separa a
região crítica (onde rejeitamos a hipótese
região crítica (onde rejeitamos a hipótese
nula) dos valores da estatística do teste que
não nos faz rejeitar a H
0. O valor crítico
depende da natureza da hipótese nula, da
distribuição amostral que é utilizada, e do
nível de significância
αααα
.
Veja na figura anterior
nível de significância
αααα
.
Veja na figura anterior
que o valor crítico de z=1.645 corresponde ao
nível de significância de
αααα
=0.05.
Testes Bilateral, Unilateral à
Esquerda e Unilateral à Direita
As
caudas
em uma distribuição são
regiões
nos
extremos
das
mesmas
limitados por valores críticos.
Slide
Slide 33
Teste Bilateral
H
0: =
H
1:
≠≠≠≠
αααα
é dividido igualmente entre as duas caudas da região críticaH
1:
≠≠≠≠
Teste Unilateral à Direita
H
0: =
H : >
H
1: >
Pontos à Direita
Slide Slide 35Teste Unilateral à Esquerda
H
0: =
H : <
H
1: <
Pontos à
Esquerda
P-Valor
O
P-valor
(ou
p-valor
ou
valor
de
probabilidade
) é a probabilidade de ter um
probabilidade
) é a probabilidade de ter um
valor da estatística de teste que está
pelo
menos
tão
extremo
como
a
estatística
calculada
para
a
amostra
em
questão,
assumindo que a hipótese nula é verdadeira.
A hipótese nula é rejeitado se o P-valor é
muito pequeno, tal como 0,05 ou menos.
Slide
Slide 37
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Conclusões em Testes de
Hipótese
Nós sempre testamos a hipótese
Nós sempre testamos a hipótese
nula;
A
conclusão
inicial
será
sempre uma das abaixo:
1. Rejeitar a hipótese nula.
Método Tradicional:
Rejeitamos H
se a estatística de
Regra de Decisão
Rejeitamos H
0se a estatística de
teste pertence à região crítica.
Falhamos em rejeitar H
0se a
estatística de teste não pertence à
Slide
Slide 39
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
estatística de teste não pertence à
região crítica.
Método do P-valor:
Regra de Decisão - cont
Rejeitamos H
0se o P-valor
≤≤≤≤
αααα
(onde
αααα
é o nível de significância, como
0,05, por exemplo.).
Falhamos em rejeitar H
0se o
Uma outra opção:
Regra de Decisão - cont
Ao
invés
de
usar
um
nível
de
significância (feito 0,05, por exemplo),
simplesmente identifique o P-valor e
deixe a decisão para o leitor.
Slide
Slide 41
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Regra de Decisão - cont
Intervalos de Confiança:
Devido ao IC para um parâmetro
populacional conter os valores mais
prováveis
para
este
parâmetro,
rejeitamos a afirmação de que o
parâmetro
não
é
igual
a
um
parâmetro
não
é
igual
a
um
Procedimento para Encontrar o P-Valor
Figura 8-6
Slide
Slide 43
Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou à
direita.
Em
seguida,
calcule
o
P-valor
e
formule sua conclusão a respeito da hipótese
nula.
nula.
a) Um nível de significância
αααα
=0.05 é usado para testar a afirmação de que p>0.25, e os dados amostrais resultaram em uma estatística de teste z=1.18.b) Um nível de significância
αααα
=0.05 é usado para testar a afirmação de que p≠≠≠≠ 0.25, e os dados amostrais a afirmação de que p≠≠≠≠ 0.25, e os dados amostrais resultaram em uma estatística de teste z = 2.34.Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou
à direita. Em seguida, calcule o P-valor e
formule sua conclusão a respeito da hipótese
nula.
nula.
a) Com a afirmação de que p>0.25, temos que o teste é unilateral à direita. Assim, de acordo com a Figura 8-6, temos que o P-valor é a área à direita da estatística do teste z=1.18. Usando a Tabela A-2 encontramos que a área à direita é 0.1190. Assim, temos que o P-valor=0.1190, sendo maior que o nível
Slide
Slide 45
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
temos que o P-valor=0.1190, sendo maior que o nível de significância, e não podemos rejeitar a hipótese nula. O P-valor é relativamente alto, o que indica que este resultado amostral pode ocorrer facilmente devido à aleatoriedade do processo.
Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou à
direita. Em seguida, calcule o P-valor
e
formule sua conclusão a respeito da hipótese
nula.
nula.
b) Com a afirmação de que p≠≠≠≠ 0.25, o teste é bilateral, e como a estatística do teste z=2.34 está à direita do centro da distribuição, de acordo com a Figura 8-6 temos que o P-valor é igual ao dobro da área à direita de z=2.34. Utilizando a Tabela A-2 nós vemos que a área à direita de z=2.34 é 0.0096, assim, temos que área à direita de z=2.34 é 0.0096, assim, temos que P-valor=2x0.0096=0.0192. O P-valor é menor que o nível de significância, assim rejeitamos a hipótese nula. O
Escrevendo as Conclusões Finais
Slide
Slide 47
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Aceitar Versus Não Rejeitar
Alguns autores usam “aceitar a
hipótese nula”.
hipótese nula”.
Nós não estamos provando a hipótese
nula.
A amostra evidencia que não temos
A amostra evidencia que não temos
força para rejeitar a hipótese nula
Erro Tipo I
Um
Erro Tipo I
é o erro cometido ao
rejeitarmos
H
0quando
ela
é
rejeitarmos
H
0quando
ela
é
verdadeira.
A
letra
grega
αααα
é
usada
para
representar a probabilidade de se
cometer o Erro Tipo I.
Slide
Slide 49
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Erro Tipo II
Um
Erro Tipo II
é o erro cometido
quando não rejeitamos H
0e ela é
quando não rejeitamos H
0e ela é
falsa.
A
letra
grega
ββββ
é
usada
para
representar a probabilidade de se
cometer o Erro Tipo II.
Exemplo
:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0:p=0.5, e H
1:p>0.5
a) Identifique um erro tipo I.
b) Identifique um erro tipo II.
Slide
Slide 51
Exemplo:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0:p=0.5, e H
1:p>0.5.
a) Um erro tipo I é o erro de se rejeitar uma
hipótese nula verdadeira, então neste caso, o
erro
tipo
I
ocorrerá
quando
tivermos
evidências de que p>0.5, quando na verdade
evidências de que p>0.5, quando na verdade
temos p=0.5.
Exemplo:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0:p=0.5, e H
1:p>0.5
b) Um erro tipo II é o erro de não rejeitarmos
uma hipótese nula falsa, ou seja, para este
exemplo seria não rejeitar p=0.5 (e por
conseqüência não aceitar que p>0.5) quando
na verdade temos p>0.5.
Slide
Slide 53
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
na verdade temos p>0.5.
Controlando os Erros Tipo I e
Tipo II
Para qualquer
αααα
fixado, um aumento no tamanho da amostra n causa uma diminuição emβ.
β.
β.
β.
amostra n causa uma diminuição em
β.
β.
β.
β.
Para qualquer tamanho de amostra n fixo, uma diminuição de
αααα
causará em aumento deββββ
. Inversamente, um acréscimo emαααα
causará uma dimnuição emββββ
.Slide
Slide 55
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Para diminuir tanto
αααα
quantoββββ
, temos que aumentar o tamanho da amostra.Definição
O
poder do teste de hipótese
é a probabilidade
(1 -
β
β
β
β
) de rejeitar uma hipótese nula falsa, que
(1 -
β
β
β
β
) de rejeitar uma hipótese nula falsa, que
é calculada usando um valor fixo para o nível
de significância
α
α
α
α
e um valor fixo para o
parâmetro populacional que é uma alternativa
ao
valor
assumido
como
verdadeiro
na
hipótese nula. Em outras palavras, o poder do
teste de hipótese é a probabilidade de aceitar
teste de hipótese é a probabilidade de aceitar
uma hipótese alternativa verdadeira.
Metodologia
Detalhada do
Teste de Hipótese
Teste de Hipótese
– Método do
P-valor
Slide Slide 57Metodologia
Detalhada do
Teste de Hipótese
Teste de Hipótese
– Método
Tradicional
Metodologia Detalhada do Teste
de Hipótese - cont
Um IC para um parâmetro populacional contém os valores mais verossímeis para este parâmetro. Nós valores mais verossímeis para este parâmetro. Nós podemos então rejeitar uma afirmação de que o parâmetro populacional não está incluído bo IC. Veja na Tabela 8-2 abaixo os níveis de confiança do IC para os níveis de significância de acordo com o tipo do teste (bilateral ou unilateral):
Slide
Slide 59
Metodologia Detalhada do Teste
de Hipótese - cont
Cuidado
:
Em alguns casos, a conclusão
baseada no IC pode diferir da conclusão do
teste
de
hipótese.
Veja
os
comentários
presentes em cada uma das seções seguinte.
Recapitulando
In this section we have discussed:
Hipótese Nula
Hipótese Nula
Hipótese Alternativa
Estatística do Teste
Região Crítica
Nível de Significância e P-valor
Slide
Slide 61
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Nível de Significância e P-valor
Valor Crítico
Erro Tipo I e II
Seção 8-3
Testando uma Afirmação
sobre uma Proporção
Pontos Chave
Esta
seção
apresenta
o
procedimento
Esta
seção
apresenta
o
procedimento
completo para testar a hipótese feita sobre
uma proporção populacional. Esta seção
utiliza
os
componentes
apresentados
na
seção anterior para os métodos do P-valor,
tradicional ou uso do I.C.
Slide
Slide 63
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
tradicional ou uso do I.C.
1) As observações devem vir de um plano de
Requisitos para Testar Afirmações
sobre uma Proporção Populacional p
1) As observações devem vir de um plano de amostra aleatória simples.
2) As condições para a distribuição binomial são satisfeitas (Seção 5-3).
3) As condições np ≥≥≥≥ 5 e nq ≥≥≥≥ 5 são satisfeitas, então a distribuição binomial pode ser aproximada pela a distribuição binomial pode ser aproximada pela distribuição normal com µ = np and
σσσσ
= npq .Notação
n
= número de tentativas
p
= proporção populacional (usada na
hipótese nula)
∧∧∧∧p
=
x
(proporção
amostral
)
n
Slide Slide 65Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Estatística de Teste para Testar
uma Afirmação sobre uma
Proporção
p – p
pq
n
z
=
∧∧∧∧
n
Método do P-Valor
Use a mesma metodologia descrita na
Use a mesma metodologia descrita na
Seção 8-2
e na
Figura 8-8
.
Use a distribuição normal padronizada
(Tabela A-2).
Slide
Slide 67
Método Tradicional
Use a mesma metodologia descrita
na
Seção 8-2
e na
Figura 8-9
.
Método do Intervalo de Confiança
Use a mesma metodologia descrita
na
Seção 8-2
e na
Tabela 8-2
.
Slide
Slide 69
Exemplo:
Um
artigo
distribuído
pela
Associated Press incluía estes resultados de
relativos a uma pesquisa nacional: De 880
motoristas selecionados aleatoriamente, 56%
deles admitiam que ultrapassavam o sinal
deles admitiam que ultrapassavam o sinal
vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou
seja, p>0.5. Os dados amostrais são n=880, e
p=0,56.
∧∧∧∧np = (880)(0,5) = 440 ≥≥≥≥ 5
np = (880)(0,5) = 440 ≥≥≥≥ 5
Exemplo:
Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos o∧∧∧∧ Método do P-valor.p – p
z = ∧∧∧∧ 0.56 – 0.5
De acordo com a Tabela A-2, observamos que para valores de z = 3.50 ou maiores , nós usamos 0.9999 para a área acumulada à
H0: p = 0.5 H1: p > 0.5
αααα
= 0.05 pq n p – p z = 0.56 – 0.5 (0.5)(0.5) 880 = = 3.56 Slide Slide 71Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
3.50 ou maiores , nós usamos 0.9999 para a área acumulada à esquerda da estatística do teste. O P-valor é 1 – 0.9999 = 0.0001. Como o P-valor é menor que αααα = 0.05, rejeitamos a hipótese nula. Não temos evidências suficientes para admitirmos a hipótese nula como válida.
Exemplo:
Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos∧∧∧∧
Os dados amostrais são n=880, e p=0,56. Nós usaremos o Método do P-valor.∧∧∧∧
H0: p = 0.5 H1: p > 0.5αααα
= 0.05 z = 3.56Exemplo
:
Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5.∧∧∧∧ americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos o Método Tradicional. ∧∧∧∧ H0: p = 0.5 H1: p > 0.5αααα
= 0.05 pq n p – p z = ∧∧∧∧ 0.56 – 0.5 (0.5)(0.5) 880 = = 3.56 Slide Slide 73Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
αααα
= 0.05 n880
Este é um teste bilateral à direita, então a região crítica é uma área de 0,05. Assim, temos que z=1,645 é o valor crítico da região crítica. Portanto, rejeitamos a hipótese nula. Não temos evidências suficientes para admitirmos a afirmação como válida.
Exemplo:
Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5.∧∧∧∧ americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nósusaremos o Método do IC.
∧∧∧∧
Para testar uma hipótese unilateral com nível de significância
αααα
, nós iremos construir um intervalo de confiança com 1 – 2αααα
de nível de confiança . Nós contruimos um IC com 90% de confiança.contruimos um IC com 90% de confiança.
CUIDADO
Quando testamos afirmações sobre proporção populacional, o método tradicional e o método do P-valor são equivalentes e terão os mesmos resultados valor são equivalentes e terão os mesmos resultados desde que usem o mesmo desvio padrão baseado na
proporção suposta p. Por outro lado, o IC usa um desvio padrão estimado baseado na proporção amostral p. Consequentimente, é possível que os métodos tradicional e P-valor tenham uma conclusão diferente do que o método do IC.
∧∧∧∧
Slide
Slide 75
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Uma boa tática é utilizar o IC para estimar a proporção populacional, mas utilizar os métodos tradicional ou P-valor para teste de hipótese.
∧∧∧∧
p algumas vezes é informado diretamente:
“
10% dos carros esportivos observados são
vermelho” é expresso como
p
∧∧∧∧
Obtendo P
∧∧∧∧
p
algumas vezes é calculado:
“96 residências pesquisadas têm TV a cabo e
54 não” é calculado usando
∧∧∧∧
p
∧∧∧∧
= 0.10
p
∧∧∧∧
= = = 0.64
x
96Exemplo:
Quando Gregory Mendel realizou
seu famoso experimento de hibridação com
ervilhas, um dos experimentos resultou em
uma geração constituída de 428 ervilhas com
vagens verdes e 152 com vagens amarelos.
Segundo a teoria de Mendel, 1/4 das ervilhas
Segundo a teoria de Mendel, 1/4 das ervilhas
desta geração teria bagos amarelos. Use 5% de
significância com o método do P-valor para
testar a afirmação de Mendel.
Nós notamos que n=428+152=580,
∧∧∧∧
Slide
Slide 77
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Nós notamos que n=428+152=580,
Exemplo:
Quando Gregory Mendel realizou seu famoso experimento de hibridação com ervilhas, um dos experimentos resultou em uma geração constituída de 428 ervilhas com vagens verdes e 152 com vagens amarelos. Segundo a teoria de Mendel, 1/4 das ervilhas desta geração teria bagos amarelos. Use 5% de desta geração teria bagos amarelos. Use 5% de significância com o método do P-valor para testar a afirmação de Mendel. H0: p = 0.25 H1: p ≠≠≠≠ 0.25 n = 580αααα
0.262 – 0.25 (0.25)(0.75) = = 0.67 z = p – p pq∧∧∧∧
αααα
= 0.05 p = 0.262∧∧∧∧
(0.25)(0.75) 580 pq nExemplo:
Quando Gregory Mendel realizou seu famoso experimento de hibridação com ervilhas, um dos experimentos resultou em uma geração constituída de 428 ervilhas com vagens verdes e 152 com vagens amarelos. Segundo a teoria de Mendel, 1/4 das ervilhas desta geração teria bagos amarelos. Use das ervilhas desta geração teria bagos amarelos. Use 5% de significância com o método do P-valor para testar a afirmação de Mendel.H0: p = 0.25 H1: p ≠≠≠≠ 0.25 n = 580
αααα
= 0.05 0.262 – 0.25 (0.25)(0.75) = = 0.67 z = p – p pq∧∧∧∧
Slide Slide 79Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
O P-valor é 2x0.2514=0.5028. Assim, não podemos rejeitar a hipótese nula, ou seja, não há evidência suficiente para refutar a afirmação de que ¼ das ervilhas desta geração tenham vagens amarelos.
αααα
= 0.05 p = 0.262 (0.25)(0.75) 580 pq n∧∧∧∧
Recapitulando
Nesta seção nós vimos:
Nesta seção nós vimos:
Teste estatístico para afirmações sobre uma
proporção.
Método do P-valor.
Método do IC.
Método do IC.
Seção 8-4
Testando Afirmações
sobre uma Média:
σσσσ
sobre uma Média:
σσσσ
Conhecido
Slide
Slide 81
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Created by Erin Hodgess, Houston, Texas
Pontos Chave
Esta seção apresenta os métodos para se
Esta seção apresenta os métodos para se
testar afirmações sobre a média de uma
população, dado que o desvio padrão desta
população é conhecido. Esta seção utiliza a
distribuição
normal
com
os
mesmos
componentes introduzidos na Seção 8-2.
componentes introduzidos na Seção 8-2.
Requisitos para Testar Afirmações sobre
uma Média Populacional (com
σσσσ
Conhecido)
1)
A amostra foi extraída segundo um
1)
A amostra foi extraída segundo um
plano de amostra aleatória simples.
2) O valor do desvio padrão populacional
σσσσ
é conhecido.
3) Pelo menos uma destas condições deve
Slide
Slide 83
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
3) Pelo menos uma destas condições deve
ser satisfeita: a população é normalmente
distribuída ou n>30.
Estatística do Teste para Testar
Afirmações sobre uma Média
(com
σσσσ
Conhecido)
n
x
– µ
x
z
=
σσσσ
Exemplo:
Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacionalσσσσ
é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura=
z =
x
σσσσ
– µ
x n 98.2 – 98.6 = − 6.64 0.62 106significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H0:
µµµµ
= 98.6 H1:µµµµ
≠≠≠≠ 98.6αααα
= 0.05 x = 98.2 Slide Slide 85Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
n 106
x = 98.2
σσσσ
= 0.62Este é um teste bilateral e a estatística do teste está à esquerda do centro da distribuição, logo o P-valor é igual ao dobro da área à esquerda de z= –6.64. Utilizando a Tabela A-2 calculamos que a área à esquerda de z= –6.64 é 0.0001, assim o P-valor é igual a 2x(0.0001) = 0.0002.
Exemplo:
Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacionalσσσσ
é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H0:µµµµ
= 98.6 H1:µµµµ
≠≠≠≠ 98.6αααα
= 0.05 x = 98.2 z = –6.64 x = 98.2σσσσ
= 0.62Exemplo:
Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacionalσσσσ
é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H0:µµµµ
= 98.6 H1:µµµµ
≠≠≠≠ 98.6αααα
= 0.05 x = 98.2σσσσ
= 0.62 z = –6.64 Slide Slide 87Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
σσσσ
= 0.62Como o P-valor é igual a 0.0002, e como este valor é menor que o nível de significância αααα=0.05, nós rejeitamos a hipótese nula. Assim, temos evidência suficiente para concluir que a temperatura corporal média de adultos saudáveis é diferente de 98.6°F.
Exemplo:
Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacionalσσσσ
é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método tradicional. H0:µµµµ
= 98.6 H1:µµµµ
≠≠≠≠ 98.6αααα
= 0.05 x = 98.2 z = –6.64Nós encontramos como valores críticos z= –1.96 e z=1.96. Nós rejeitamos a hipótese nula, pois a
x = 98.2
σσσσ
= 0.62e z=1.96. Nós rejeitamos a hipótese nula, pois a estatística do teste z= –6.64 pertence à região crítica.
Exemplo:
Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacionalσσσσ
é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do intervalo de confiança.Para um teste de hipótese bilateral com 5% de significância, construímos um IC com 95% de confiabilidade. Assim, temos:
98.08 < µµµµ < 98.32 H0:
µµµµ
= 98.6 H1:µµµµ
≠≠≠≠ 98.6αααα
= 0.05 x = 98.2σσσσ
= 0.62 Slide Slide 89Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Nós estamos 95% confiantes de que o intervalo de 98.08 a 98.32 contém o valor verdadeiro de µµµµ, assim, aparentemente 98.6 nãopode ser o valor verdadeiro de µµµµ.
Relações Subjacentes ao Teste
de Hipótese
Se, sob uma dada suposição, temos uma probabilidade extremamente pequena de obtermos probabilidade extremamente pequena de obtermos um resultado amostral tão extremo como o que observamos, podemos concluir que a suposição inicial provavelmente não é correta.
Quando testamos uma afirmação, fazemos uma suposição de igualdade (com a hipótese nula). A suposição de igualdade (com a hipótese nula). A seguir, comparamos esta suposição com o
Se o resultado amostral (ou resultado mais extremo)
Relações Subjacentes ao Teste
de Hipótese - cont
Se o resultado amostral (ou resultado mais extremo) pode ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, podemos atribuir a relativamente curta discrepância entre a suposição e o resultado amostral ter ocorrido devido a fatores aleatórios.
Se o resultado amostral não pode ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, nós
Slide
Slide 91
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
quando a suposição (hipótese nula) é verdadeira, nós explicamos a relativamente grande discrepância entre a suposição e o resultado amostral concluindo que a suposição inicial não é verdadeira, rejeitando, assim, esta suposição.
Recapitulando
Nesta seção nós apresentamos:
Requisitos para testar afirmações sobre médias populacionais, com σ conhecido.
Método do P-valor.
Método Tradicional.
Método do Intervalo de Confiança.
Método do Intervalo de Confiança.
Seção 8-5
Testando Afirmações
sobre uma Média :
σσσσ
sobre uma Média :
σσσσ
Desconhecido
Slide
Slide 93
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Created by Erin Hodgess, Houston, Texas
Pontos Chave
Esta seção apresenta a metodologia para
Esta seção apresenta a metodologia para
testar afirmações sobre a média populacional
quando não temos o valor de
σ
. Os métodos
desta seção utilizam a distribuição t de
Student vista anteriormente.
Requisitos para Testar
Afirmações sobre a Média com
σσσσ
Desconhecido
1) A amostra foi extraída segundo um plano de
amostra aleatória simples.
2) O valor do desvio padrão populacional
σσσσ
não
é conhecido.
3) Pelo menos uma destas condições deve ser
Slide
Slide 95
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
3) Pelo menos uma destas condições deve ser
satisfeita:
a
população
é
normalmente
distribuída ou n>30.
Estatística do Teste para Testar
Afirmações sobre uma Média (com
σσσσ
Desconhecido)
x
– µ
P-valor e Valores Críticos
x
– µ
x
t =
s
n
P-valor e Valores Críticos
Propriedades Importantes da
Distribuição t de Student
1. A distribuição t de Student t é diferente para cada tamanho de amostra (veja Figura 7-5 na Seção 7-4).
2. A distribuição t de Student t tem a mesma forma que a distribuição normal (forma de sino); Sua forma mais alongada reflete uma maior variabilidade que é esperada quando usamos s para estimar
σσσσ
.3. A distribuição t de Student tem média t=0 (identicamente à distribuição normal padronizada que tem média z=0).
4. TO desvio padrão da distribuição t de Student varia de acordo
Slide
Slide 97
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
4. TO desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior que 1 (ao contrário da distribuição normal padronizada onde temos
σσσσ
=1).5. Para tamanhos de amostra suficientemente grande, temos que a distribuição t de Student se aproxima da distribuição normal padronizada.