1
Slide
Slide
2
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Capítulo 8
Teste de Hipótese
8-1 Visão Geral
8-2 Fundamentos do Teste de Hipótese
8-3 Testando Afirmações sobre uma Proporção
8-4 Testando Afirmações sobre uma Média:
σ
Conhecido
8-5 Testando Afirmações sobre uma Média:
σ
Desconhecido
8-6 Testando Afirmações sobre o Desvio Padrão ou
Variância
Slide
Slide
3
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Seção 8-1
Visão Geral
Created by Erin Hodgess, Houston, Texas
Revised to accompany 10
thEdition, Tom Wegleitner, Centreville, VA
Slide
Slide
4
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Definições
Em estatística, uma
hipótese
é uma afirmação
ou setença sobre as propriedades de uma
população.
Um
Teste de hipótese
(ou
teste de significância
)
é um procedimento padronizado para testar
uma afirmação sobre as propriedades de uma
população.
2
Slide
Slide
5
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Regra do Evento Raro para a
Inferência Estatística
Se,
sob
uma
dada
suposição,
a
probabilidade de um evento particular
observado é excepcionalmente pequena,
nós
concluímos
que
a
suposição
provavelmente não é correta.
Slide
Slide
6
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
As Indústrias ProCare Ltda. forneceram, certa
vez, um produto chamado “Gender Choice” (Escolha o
Sexo) que, de acordo com a propaganda, permitia aos
casais “aumentar em até 80% as suas chances de ter uma
menina.” Suponha que façamos um experimento com 100
casais que querem ter meninas e que eles sigam o Gender
Choice, “um sistema fácil de usar em casa” descrito na
embalagem cor de rosa para meninas. Com o propósito de
testar a afirmação de que há um acréscimo na proporção
de meninas vamos assumir que o Gender Choice não tem
efeito. Usando o bom senso e nenhum método formal de
estatística, o que podemos concluir sobre a suposição de
nenhum efeito do Gender Choice se 100 casais usando
Gender Choice tiverem 100 bebês sendo:
a) 52 meninas?
b) 97 meninas?
Exemplo:
Indústrias ProCare Industries Ltda.:
Parte a)
a) Nós em geral esperamos cerca de 50 meninas
em 100 nascimentos. O resultado de 52 meninas
é bastante próximo de 50, então não podemos
concluir que o Gender Choice é realmente
eficaz. Se os 100 casais não usaram nenhum
método especial para seleção de gênero, o
resultado
de
52
meninas
pode
ocorrer
facilmente. A suposição de não efeito do Gender
Choice
aparenta
ser
correta.
Não
temos
evidência para afirmar que p Gender Choice é
3
Slide
Slide
8
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Indústrias ProCare Industries Ltda.:
Parte b)
b) O resultado de 97 meninas em 100 nascimentos
é
extremamente
improvável
de
acontecer.
Podemos explicar este fato por duas maneiras:
Um evento
extremamente
raro ocorreu devido a
fatores aleatórios, ou o Gender Choice é eficiente.
A probabilidade extremamente baixa em termos 97
meninas
em
100
nascimentos
é
uma
forte
evidência contra a suposição inicial de que o
Gender Choice não funciona.
Slide
Slide
9
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Seção 8-2
Fundamentos de Teste de
Hipótese
Created by Erin Hodgess, Houston, Texas
Revised to accompany 10
thEdition, Tom Wegleitner, Centreville, VA
Slide
Slide
10
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Pontos Chave
Esta seção apresenta os componentes individuais de um teste
de hipótese, e as seções seguintes usarão estes componentes
em um procedimento claro e objetivo.
A função de cada um deles deve ser bem compreendido:
Hipótese Nula
Hipótese Alternativa
Estatística do Teste
Região Crítica
Nível de Significância
Valor Crítico
P-valor
Erro Tipo I e II
4
Slide
Slide
11
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Dada
uma
afirmação,
identificar
as
hipóteses nula e alternativa, e expressá-las
em forma simbólica.
Dada
uma
afirmação
e
uma
amostra,
calcular o valor da estatística do teste.
Dado um nível de significância. Identificar
o(s) valor(es) crítico(s).
Dado o valor da estatística do teste,
identificar o P-valor.
Formar uma conclusão a respeito do teste
de hipótese em uma linguagem simples e
não técnica.
Seção 8-2 Objetivos
Slide
Slide
12
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Vamos usar novamente o exemplo do
Gender Choice que foi distribuido pelaws Indústrias
ProCare. As Indústrias ProCare afirmaram que os
casais que usarem a caixa rosa do Gender Choice
terão as chances de terem meninas maiores que 50%,
ou 0,5. Vamos novamente considerar o experimento
onde 100 casais usam o Gender Choice com a
intenção de terem uma menina. Vamos assumir que
nos 100 nascimentos temos exatamente 52 meninas, e
vamos formalizar algumas análises:
Sob circunstâncias normais a proporção de meninas é de 0,5,
então a afirmação de que o Gender Choice é funcional pode ser
expressa como p > 0,5.
Usando a distribuição normal como uma aproximação à
binomial nós achamos que P(52 ou mais meninas em 100
nascimentos) = 0,3821.
A Figura 8-1 a seguir mostra que com uma probabilidade de 0,5,
a ocorrência de 52 meninas em 100 nascimentos não é
incomum.
5
Slide
Slide
14
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Afirmação: Para casais que usam Gender Choice, a proporção
de meninas é p > 0.5.
Observações
Não há evidência suficiente para basear afirmação do Gender
Choice.
Há duas possíveis explicações para o resultado de 52 meninas
em 100 nascimentos: Ou uma variação aleatória ocorreu (com
probabilidade igual a 0.3821), ou a proporção de meninas
nascidas de casais que usaram Gender Choice é maior que 0.5.
Assumindo que p = 0.5, nós usamos a distribuição normal
como uma aproximação à distribuição binomial para achar que
P (Pelo menos 52 meninas em 100 nascimentos) = 0.3821.
ˆ
A amostra apresenta 52 meninas em 100 nascimentos, então a
proporção amostral é p = 52/100 = 0.52.
Suposição de trabalho: A proporção de meninas é p = 0.5
(com o Gender Choice sem surtir efeito).
Slide
Slide
15
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Componentes de um
Teste de Hipótese
Formal
Slide
Slide
16
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Hipótese Nula:
H
0
A
hipótese nula
(denotada por H
0
) é
uma suposição de que o valor de um
parâmetro populacional (tal como a
proporção, média ou desvio padrão) é
igual a
algum valor pré-fixado.
Nós testamos a hipótese nula
diretamente.
6
Slide
Slide
17
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Hipótese Alternativa:
H
1
A
hipótese alternativa
(denotada por
H
1
ou H
a
ou H
A
) é a suposição de que
o parâmetro populacional tem um
valor que difere do apresentado na
hipótese nula.
A forma simbólica para a hipótese
alternativa
deve
usar
um
destes
sinais:
≠≠≠≠
, <, >.
Slide
Slide
18
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Notas sobre Como Formar suas
Próprias Afirmações (Hipóteses)
Se você está executando um estudo e
quer usar um teste de hipótese para
basear
a sua afirmação, esta afirmação
dever ser escrita de tal forma que se
torne a hipótese alternativa.
Notas sobre Como Identificar
H
0
e H
1
7
Slide
Slide
20
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Identifique
as
hipóteses
nulas
e
alternativas. Use a Figura 8-2 e com base nas
afirmações
dadas
expresse
as
hipóteses
nula
e
alternativa correspondentes em forma simbólica.
a) A proporção de motoristas que admitem passar em
sinal vermelho é maior que 0,5.
b) A altura média dos jogadores de basquetes da liga
profissional é de no máximo 2,14m.
c) O desvio padrão do escore de QI dos atores é igual
a 15.
Slide
Slide
21
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Identifique
as
hipóteses
nulas
e
alternativas. Use a Figura 8-2 e com base nas
afirmações
dadas
expresse
as
hipóteses
nula
e
alternativa correspondentes em forma simbólica.
a)
A proporção de motoristas que admitem ultrapassar o sinal
vermelho é maior que 0,5. No passo 1 da Figura 8-2, nós
expressamos a afirmação dada como p > 0.5. No passo 2I,
nós vemos que se p > 0.5 é falso, então p
≤≤≤≤
0.5 deve ser
verdadeiro. No passo 3, observamos que a expressão p > 0.5
não contém a igualdade, então nós determinamos a hipótese
alternativa H
1como p > 0.5, e a hipótese nula H
0como p =
0.5.
Slide
Slide
22
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Identifique
as
hipóteses
nulas
e
alternativas. Use a Figura 8-2 e com base nas
afirmações
dadas
expresse
as
hipóteses
nula
e
alternativa correspondentes em forma simbólica.
b)
A altura média dos jogadores de basquetes da liga
profissional é de no máximo 2,14m. No passo 1 da
Figura 8-2 nós expressamos “a média é de no máximo
2,14m” simbolicamente como
µµµµ ≤≤≤≤
2,14. No passo 2, nós
vemos que se
µµµµ ≤≤≤≤
2,14 é falsam então
µ
> 2,14 deve ser
verdadeiro. No passo 3, nós vemos que se a expressão
µ
> 2,14 não contém a igualdade, então a hipótese
alternativa H
1será
µ
> 2,14, e H
0será
µ
= 2,14.
8
Slide
Slide
23
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Identifique
as
hipóteses
nulas
e
alternativas. Use a Figura 8-2 e com base nas
afirmações
dadas
expresse
as
hipóteses
nula
e
alternativa correspondentes em forma simbólica.
c)
O desvio padrão do escore de QI dos atores é igual a 15.
No passo 1 da Figura 8-2 nós representamos esta
afirmação como
σσσσ
= 15. No passo 2, vemos que se
σσσσ
= 15
é falso, então
σσσσ ≠
≠
≠
≠
15 deve ser verdadeiro. No passo 3,
temos que a hipótese alternativa H
1será
σσσσ ≠
≠
≠
≠
15, e que
H
0será
σσσσ
= 15.
Slide
Slide
24
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
A
estatística do teste
é um valor usado
para tomar a decisão sobre a hipótese nula,
e é calculada convertendo a estatística
amostral em um escore com a suposição
de que a hipótese nula é verdadeira.
Estatística de Teste
Estatística do Teste - Fórmulas
z
=
x - µ
x
σ
σ
σ
σ
n
Estatística do
teste para
média
z
=
p - p
/\pq
n
√√√√
Estatística do
teste para
proporções
χχχχ
(n – 1)s
2
Estatística do
teste para
9
Slide
Slide
26
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Uma pesquisa com uma amostra
aleatória de 880 motoristas adultos mostrou
que 56% (ou p = 0.56) destes respondentes
admitiram que ultrapassavam o sinal fechado.
Encontre o valor da estatística do teste para a
afirmação de que a maioria dos adultos
admitem ultrapassar o sinal fechado. (Na
Seção 8-3 nós veremos que há algumas
suposições a serem observadas. Para este
exemplo, admitamos que estas suposições
são obedecidas
e
vamos
nos
focar
em
encontrar a estatística do teste adequada.)
Slide
Slide
27
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Solução:
O exemplo anterior mostrou que a
afirmação
dada
resulta
nas
seguintes
hipóteses nula e alternativa: H
0
: p=0.5 e H
1
:
p>0.5. Devido a trabalharmos sob a suposição
de que a hipótese nula é verdadeira, ou seja,
p=0.5, nós temos a seguinte estatística do
teste:
n
pq
√√√√
z = p – p
/\=
0.56 - 0.5
(
0.5)(0.5)
√√√√
880
=
3.56
Slide
Slide
28
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Interpretação:
Nós
sabemos
dos
capítulos anteriores que o valor de
z=3,56 é excepcionalmente alto. Isto
indica que mais que ser maior que
50%, o resultado amostral de 56% é
significativamente
maior que 50%.
Veja figura abaixo:
10
Slide
Slide
29
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Região Crítica, Valor Crítico,
Estatística do Teste
Slide
Slide
30
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Região Crítica
A
região crítica
(ou
região de rejeição
) é o
conjunto de valores para a estatística do
teste que nos faz rejeitar a hipótese nula.
Por exemplo, veja a região sombreada em
vermelho na figura anterior.
Nível de Significância
O
nível de significância
(denotado por
αααα
)
é a
probabilidade de que a estatística do teste irá
pertencer à região crítica quando a hipótese
nula for verdadeira. Este é o mesmo
αααα
que
introduzimos na Seção 7-2. Valores comuns
para
αααα
são 0.05, 0.01, e 0.10.
11
Slide
Slide
32
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Valor Crítico
Um
valor crítico
é qualquer valor que separa a
região crítica (onde rejeitamos a hipótese
nula) dos valores da estatística do teste que
não nos faz rejeitar a H
0
. O valor crítico
depende da natureza da hipótese nula, da
distribuição amostral que é utilizada, e do
nível de significância
αααα
.
Veja na figura anterior
que o valor crítico de z=1.645 corresponde ao
nível de significância de
αααα
=0.05.
Slide
Slide
33
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Testes Bilateral, Unilateral à
Esquerda e Unilateral à Direita
As
caudas
em uma distribuição são
regiões
nos
extremos
das
mesmas
limitados por valores críticos.
Slide
Slide
34
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Teste Bilateral
H
0
: =
H
1
:
≠≠≠≠
αααα
é dividido igualmente entre as
duas caudas da região crítica
12
Slide
Slide
35
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Teste Unilateral à Direita
H
0
: =
H
1
: >
Pontos à Direita
Slide
Slide
36
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Teste Unilateral à Esquerda
H
0
: =
H
1
: <
Pontos à
Esquerda
P-Valor
O
P-valor
(ou
p-valor
ou
valor
de
probabilidade
) é a probabilidade de ter um
valor da estatística de teste que está
pelo
menos
tão
extremo
como
a
estatística
calculada
para
a
amostra
em
questão,
assumindo que a hipótese nula é verdadeira.
A hipótese nula é rejeitado se o P-valor é
muito pequeno, tal como 0,05 ou menos.
13
Slide
Slide
38
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Conclusões em Testes de
Hipótese
Nós sempre testamos a hipótese
nula;
A
conclusão
inicial
será
sempre uma das abaixo:
1. Rejeitar a hipótese nula.
2. Falhar em rejeitar a hipótese nula.
Slide
Slide
39
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Método Tradicional:
Rejeitamos H
0
se a estatística de
teste pertence à região crítica.
Falhamos em rejeitar H
0
se a
estatística de teste não pertence à
região crítica.
Regra de Decisão
Slide
Slide
40
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Método do P-valor:
Rejeitamos H
0
se o P-valor
≤≤≤≤
αααα
(onde
αααα
é o nível de significância, como
0,05, por exemplo.).
Falhamos em rejeitar H
0
se o
P-valor>
αααα
.
14
Slide
Slide
41
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Uma outra opção:
Ao
invés
de
usar
um
nível
de
significância (feito 0,05, por exemplo),
simplesmente identifique o P-valor e
deixe a decisão para o leitor.
Regra de Decisão - cont
Slide
Slide
42
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Regra de Decisão - cont
Intervalos de Confiança:
Devido ao IC para um parâmetro
populacional conter os valores mais
prováveis
para
este
parâmetro,
rejeitamos a afirmação de que o
parâmetro
não
é
igual
a
um
determinado valor se ele não estiver
contido no IC.
Procedimento para Encontrar o P-Valor
Figura 8-6
15
Slide
Slide
44
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou à
direita.
Em
seguida,
calcule
o
P-valor
e
formule sua conclusão a respeito da hipótese
nula.
a) Um nível de significância
αααα
=0.05 é usado para testar
a afirmação de que p>0.25
,
e os dados amostrais
resultaram em uma estatística de teste z=1.18
.
b) Um nível de significância
αααα
=0.05 é usado para testar
a afirmação de que p
≠≠≠≠
0.25
,
e os dados amostrais
resultaram em uma estatística de teste z = 2.34
.
Slide
Slide
45
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou
à direita. Em seguida, calcule o P-valor e
formule sua conclusão a respeito da hipótese
nula.
a)
Com a afirmação de que p>0.25, temos que o
teste é unilateral à direita. Assim, de acordo com a
Figura 8-6, temos que o P-valor é a área à direita da
estatística do teste z=1.18.
Usando a Tabela A-2
encontramos que a área
à direita
é 0.1190. Assim,
temos que o P-valor=0.1190, sendo maior que o nível
de significância, e não podemos rejeitar a hipótese
nula. O P-valor é relativamente alto, o que indica que
este resultado amostral pode ocorrer facilmente
devido à aleatoriedade do processo.
Slide
Slide
46
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Como calcular o P-valor: Primeiro,
verifique se as condições dadas resultam em
um teste bilateral ou unilateral à esquerda ou à
direita. Em seguida, calcule
o P-valor
e
formule sua conclusão a respeito da hipótese
nula.
b) Com a afirmação de que p
≠≠≠≠
0.25, o teste é bilateral, e
como a estatística do teste z=2.34 está à direita do
centro da distribuição, de acordo com a Figura 8-6
temos que o P-valor é igual ao
dobro
da área à direita
de z=2.34.
Utilizando a Tabela A-2 nós vemos que a
área à direita de z=2.34 é 0.0096, assim, temos que
P-valor=2x0.0096=0.0192. O P-valor é menor que o nível
de significância, assim rejeitamos a hipótese nula. O
valor pequeno do P-valor indica que este resultado
amostral é bastante raro, considerando H
0
válida.
16
Slide
Slide
47
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Escrevendo as Conclusões Finais
Figura 8-7
Slide
Slide
48
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Aceitar Versus Não Rejeitar
Alguns autores usam “aceitar a
hipótese nula”.
Nós não estamos provando a hipótese
nula.
A amostra evidencia que não temos
força para rejeitar a hipótese nula
(Assim como não temos evidência de
que a hipótese é verdadeira).
Erro Tipo I
Um
Erro Tipo I
é o erro cometido ao
rejeitarmos
H
0
quando
ela
é
verdadeira.
A
letra
grega
αααα
é
usada
para
representar a probabilidade de se
cometer o Erro Tipo I.
17
Slide
Slide
50
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Erro Tipo II
Um
Erro Tipo II
é o erro cometido
quando não rejeitamos H
0
e ela é
falsa.
A
letra
grega
ββββ
é
usada
para
representar a probabilidade de se
cometer o Erro Tipo II.
Slide
Slide
51
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo
:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0
:p=0.5, e H
1
:p>0.5
a) Identifique um erro tipo I.
b) Identifique um erro tipo II.
Slide
Slide
52
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0
:p=0.5, e H
1
:p>0.5.
a) Um erro tipo I é o erro de se rejeitar uma
hipótese nula verdadeira, então neste caso, o
erro
tipo
I
ocorrerá
quando
tivermos
evidências de que p>0.5, quando na verdade
temos p=0.5.
18
Slide
Slide
53
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Assuma
que
estamos
realizando um teste de hipótese para
p>0.5. Aqui, temos que as hipóteses nula
e alternativa são: H
0
:p=0.5, e H
1
:p>0.5
b) Um erro tipo II é o erro de não rejeitarmos
uma hipótese nula falsa, ou seja, para este
exemplo seria não rejeitar p=0.5 (e por
conseqüência não aceitar que p>0.5) quando
na verdade temos p>0.5.
Slide
Slide
54
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Erro Tipo I e Erro Tipo II
Controlando os Erros Tipo I e
Tipo II
Para qualquer
αααα
fixado, um aumento no tamanho da
amostra n causa uma diminuição em
β.
β.
β.
β.
Para qualquer tamanho de amostra n fixo, uma
diminuição de
αααα
causará em aumento de
ββββ
.
Inversamente, um acréscimo em
αααα
causará uma
dimnuição em
ββββ
.
Para diminuir tanto
αααα
quanto
ββββ
, temos que aumentar
o tamanho da amostra.
19
Slide
Slide
56
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Definição
O
poder do teste de hipótese
é a probabilidade
(1 -
β
β
β
β
) de rejeitar uma hipótese nula falsa, que
é calculada usando um valor fixo para o nível
de significância
α
α
α
α
e um valor fixo para o
parâmetro populacional que é uma alternativa
ao
valor
assumido
como
verdadeiro
na
hipótese nula. Em outras palavras, o poder do
teste de hipótese é a probabilidade de aceitar
uma hipótese alternativa verdadeira.
Slide
Slide
57
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Metodologia
Detalhada do
Teste de Hipótese
– Método do
P-valor
Slide
Slide
58
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Metodologia
Detalhada do
Teste de Hipótese
– Método
Tradicional
20
Slide
Slide
59
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Metodologia Detalhada do Teste
de Hipótese - cont
Um IC para um parâmetro populacional contém os
valores mais verossímeis para este parâmetro. Nós
podemos então rejeitar uma afirmação de que o
parâmetro populacional não está incluído bo IC. Veja na
Tabela 8-2 abaixo os níveis de confiança do IC para os
níveis de significância de acordo com o tipo do teste
(bilateral ou unilateral):
Slide
Slide
60
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Cuidado
:
Em alguns casos, a conclusão
baseada no IC pode diferir da conclusão do
teste
de
hipótese.
Veja
os
comentários
presentes em cada uma das seções seguinte.
Metodologia Detalhada do Teste
de Hipótese - cont
Recapitulando
In this section we have discussed:
Hipótese Nula
Hipótese Alternativa
Estatística do Teste
Região Crítica
Nível de Significância e P-valor
21
Slide
Slide
62
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Seção 8-3
Testando uma Afirmação
sobre uma Proporção
Created by Erin Hodgess, Houston, Texas
Revised to accompany 10
thEdition, Tom Wegleitner, Centreville, VA
Slide
Slide
63
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Pontos Chave
Esta
seção
apresenta
o
procedimento
completo para testar a hipótese feita sobre
uma
proporção populacional. Esta
seção
utiliza
os
componentes
apresentados
na
seção anterior para os métodos do P-valor,
tradicional ou uso do I.C.
Slide
Slide
64
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
1) As observações devem vir de um plano de
amostra aleatória simples.
2) As condições para a
distribuição binomial
são
satisfeitas (Seção 5-3).
3) As condições np
≥≥≥≥
5 e nq
≥≥≥≥
5 são satisfeitas,
então
a distribuição binomial pode ser aproximada pela
distribuição normal com
µ
= np and
σσσσ
= npq
.
Requisitos para Testar Afirmações
sobre uma Proporção Populacional p
22
Slide
Slide
65
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Notação
p
= proporção populacional (usada na
hipótese nula)
q
= 1 –
p
∧∧∧∧
n
= número de tentativas
p
=
x
(proporção
amostral
)
n
Slide
Slide
66
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
p – p
pq
n
z
=
∧∧∧∧
Estatística de Teste para Testar
uma Afirmação sobre uma
Proporção
Método do P-Valor
Use a mesma metodologia descrita na
Seção 8-2
e na
Figura 8-8
.
Use a distribuição normal padronizada
(Tabela A-2).
23
Slide
Slide
68
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Método Tradicional
Use a mesma metodologia descrita
na
Seção 8-2
e na
Figura 8-9
.
Slide
Slide
69
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Método do Intervalo de Confiança
Use a mesma metodologia descrita
na
Seção 8-2
e na
Tabela 8-2
.
Slide
Slide
70
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Um
artigo
distribuído
pela
Associated Press incluía estes resultados de
relativos a uma pesquisa nacional: De 880
motoristas selecionados aleatoriamente, 56%
deles admitiam que ultrapassavam o sinal
vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou
seja, p>0.5. Os dados amostrais são n=880, e
p=0,56.
∧∧∧∧
np = (880)(0,5) = 440
≥≥≥≥
5
24
Slide
Slide
71
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Um artigo distribuído pela Associated Press incluía
estes resultados de relativos a uma pesquisa nacional: De 880
motoristas selecionados aleatoriamente, 56% deles admitiam que
ultrapassavam o sinal vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou seja, p>0.5.
Os dados
amostrais são n=880, e p=0,56. Nós usaremos o
∧∧∧∧
Método do P-valor.
De acordo com a Tabela A-2, observamos que para valores de z =
3.50 ou maiores , nós usamos 0.9999 para a área acumulada à
esquerda da estatística do teste. O P-valor é 1 – 0.9999 = 0.0001.
Como o P-valor é menor que
αααα
= 0.05, rejeitamos a hipótese nula.
Não temos evidências suficientes para admitirmos a hipótese
nula como válida.
H
0
: p = 0.5
H
1
: p > 0.5
αααα
= 0.05
pq
n
p – p
z =
∧∧∧∧
0.56 – 0.5
(0.5)(0.5)
880
=
=
3.56
Slide
Slide
72
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Um artigo distribuído pela Associated Press
incluía estes resultados de relativos a uma pesquisa
nacional:
De
880
motoristas
selecionados
aleatoriamente, 56% deles admitiam que ultrapassavam o
sinal vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou seja, p>0.5.
Os dados amostrais são n=880, e p=0,56. Nós usaremos
o
Método do P-valor
.
∧∧∧∧
H
0
: p = 0.5
H
1
: p > 0.5
αααα
= 0.05
z = 3.56
Exemplo
:
Um artigo distribuído pela Associated Press
incluía estes resultados de relativos a uma pesquisa
nacional:
De
880
motoristas
selecionados
aleatoriamente, 56% deles admitiam que ultrapassavam o
sinal vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou seja, p>0.5.
Os dados amostrais são n=880, e p=0,56. Nós usaremos
o
Método Tradicional
.
∧∧∧∧
H
0
: p = 0.5
H
1
: p > 0.5
αααα
= 0.05
pq
n
p – p
z =
∧∧∧∧
0.56 – 0.5
(0.5)(0.5)
880
=
=
3.56
25
Slide
Slide
74
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Um artigo distribuído pela Associated Press
incluía estes resultados de relativos a uma pesquisa
nacional:
De
880
motoristas
selecionados
aleatoriamente, 56% deles admitiam que ultrapassavam
o sinal vermelho. A afirmação é que a maioria dos
americanos avançam no sinal fechado, ou seja, p>0.5.
Os dados amostrais são n=880, e
p=0,56. Nós
usaremos o
Método do IC
.
∧∧∧∧
Para testar uma hipótese unilateral com nível de
significância
αααα
, nós iremos construir um intervalo de
confiança com 1 – 2
αααα
de nível de confiança . Nós
contruimos um IC com 90% de confiança.
Nós obtemos 0.533 < p < 0.588. Estamos 90% confiantes
que o valor verdadeiro de p está contido no intervalo de
limites 0.533 e 0.588. Assim, não podemos afirmar que
p>0.5, já que esse valor não pertence ao IC.
Slide
Slide
75
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
CUIDADO
Quando
testamos
afirmações
sobre
proporção
populacional, o método tradicional e o método do
P-valor são equivalentes e terão os mesmos resultados
desde que usem o mesmo desvio padrão baseado na
proporção suposta p
. Por outro lado, o IC usa um desvio
padrão estimado baseado na
proporção amostral p
.
Consequentimente,
é
possível
que
os
métodos
tradicional e P-valor tenham uma conclusão diferente do
que o método do IC.
Uma boa tática é utilizar o IC para estimar a proporção
populacional, mas utilizar os métodos tradicional ou
P-valor para teste de hipótese.
∧∧∧∧
Slide
Slide
76
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
(determinando a proporção amostral de residências com TV a cabo)
p
= = = 0.64
n
x
96
(96+54)
∧∧∧∧
p
algumas vezes é calculado:
“96 residências pesquisadas têm TV a cabo e
54 não” é calculado usando
∧∧∧∧
∧∧∧∧
p algumas vezes é informado diretamente:
“
10% dos carros esportivos observados são
vermelho” é expresso como
p
∧∧∧∧
= 0.10
26
Slide
Slide
77
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Quando Gregory Mendel realizou
seu famoso experimento de hibridação com
ervilhas, um dos experimentos resultou em
uma geração constituída de 428 ervilhas com
vagens verdes e 152 com vagens amarelos.
Segundo a teoria de Mendel, 1/4 das ervilhas
desta geração teria bagos amarelos. Use 5% de
significância com o método do P-valor para
testar a afirmação de Mendel.
Nós notamos que n=428+152=580,
então p = 0.262, e p = 0.25.
∧∧∧∧
Slide
Slide
78
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Quando
Gregory
Mendel
realizou
seu
famoso experimento de hibridação com ervilhas, um
dos experimentos resultou em uma geração constituída
de 428 ervilhas com vagens verdes e 152 com vagens
amarelos. Segundo a teoria de Mendel, 1/4 das ervilhas
desta geração teria bagos amarelos. Use 5% de
significância com o método do P-valor para testar a
afirmação de Mendel.
H
0
: p = 0.25
H
1
: p
≠≠≠≠
0.25
n = 580
αααα
= 0.05
p = 0.262
∧∧∧∧
0.262 – 0.25
(0.25)(0.75)
580
=
=
0.67
z =
p – p
pq
n
∧∧∧∧
Já que este é um teste bilateral, o P-valor será o dobro da
área à direita da estatística do teste. Usando a Tabela A-2,
o P-valor para z = 0.67 é 1 – 0.7486 = 0.2514.
Exemplo:
Quando Gregory Mendel realizou seu
famoso experimento de hibridação com ervilhas, um
dos
experimentos
resultou
em
uma
geração
constituída de 428 ervilhas com vagens verdes e 152
com vagens amarelos. Segundo a teoria de Mendel, 1/4
das ervilhas desta geração teria bagos amarelos. Use
5% de significância com o método do P-valor para
testar a afirmação de Mendel.
H
0
: p = 0.25
H
1
: p
≠≠≠≠
0.25
n = 580
αααα
= 0.05
p = 0.262
0.262 – 0.25
(0.25)(0.75)
580
=
=
0.67
z =
p – p
pq
n
∧∧∧∧
∧∧∧∧
27
Slide
Slide
80
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Recapitulando
Nesta seção nós vimos:
Teste estatístico para afirmações sobre uma
proporção.
Método do P-valor.
Método do IC.
Obtendo p.
∧∧∧∧
Slide
Slide
81
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Seção 8-4
Testando Afirmações
sobre uma Média:
σσσσ
Conhecido
Created by Erin Hodgess, Houston, Texas
Revised to accompany 10
thEdition, Tom Wegleitner, Centreville, VA
Slide
Slide
82
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Pontos Chave
Esta seção apresenta os métodos para se
testar afirmações sobre a média de uma
população, dado que o desvio padrão desta
população é conhecido. Esta seção utiliza a
distribuição
normal
com
os
mesmos
componentes introduzidos na Seção 8-2.
28
Slide
Slide
83
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Requisitos para Testar Afirmações sobre
uma Média Populacional (com
σσσσ
Conhecido)
1)
A amostra foi extraída segundo um
plano de amostra aleatória simples.
2) O valor do desvio padrão populacional
σσσσ
é conhecido.
3) Pelo menos uma destas condições deve
ser satisfeita: a população é normalmente
distribuída ou n>30.
Slide
Slide
84
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Estatística do Teste para Testar
Afirmações sobre uma Média
(com
σσσσ
Conhecido)
n
x
– µ
x
z
=
σσσσ
=
z =
x
σσσσ
– µ
x
n
98.2 – 98.6
= −
6.64
0.62
106
Exemplo:
Temos
uma
amostra
da
temperatura
corporal
de
106
pessoas,
tendo
média
98.20°F.
Assuma que esta amostra veio de uma amostra
aleatória simples e que o desvio padrão populacional
σσσσ
é conhecido e igual a 0.62°F.
Teste com 5% de
significância a idéia popular de que a temperatura
corporal média de adultos sadios é igual a 98.6°F. Use
o método do P-valor.
H
0
:
µµµµ
= 98.6
H
1
:
µµµµ ≠≠≠≠
98.6
αααα
= 0.05
x = 98.2
σσσσ
= 0.62
29
Slide
Slide
86
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Temos
uma
amostra
da
temperatura
corporal de 106 pessoas, tendo média 98.20°F. Assuma
que esta amostra veio de uma amostra aleatória
simples e que o desvio padrão populacional
σσσσ
é
conhecido e igual a 0.62°F.
Teste com 5% de
significância a idéia popular de que a temperatura
corporal média de adultos sadios é igual a 98.6°F. Use
o método do P-valor.
H
0
:
µµµµ
= 98.6
H
1
:
µµµµ ≠≠≠≠
98.6
αααα
= 0.05
x = 98.2
σσσσ
= 0.62
z = –6.64
Slide
Slide
87
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Temos
uma
amostra
da
temperatura
corporal de 106 pessoas, tendo média 98.20°F. Assuma
que esta amostra veio de uma amostra aleatória
simples e que o desvio padrão populacional
σσσσ
é
conhecido e igual a 0.62°F.
Teste com 5% de
significância a idéia popular de que a temperatura
corporal média de adultos sadios é igual a 98.6°F. Use
o método do P-valor.
H
0
:
µµµµ
= 98.6
H
1
:
µµµµ ≠≠≠≠
98.6
αααα
= 0.05
x = 98.2
σσσσ
= 0.62
z = –6.64
Como o P-valor é igual a 0.0002, e como este valor é menor que o
nível de significância
αα
α
α
=0.05, nós rejeitamos a hipótese nula.
Assim,
temos
evidência
suficiente
para
concluir
que
a
temperatura corporal média de adultos saudáveis é diferente de
98.6°F.
Slide
Slide
88
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Temos
uma
amostra
da
temperatura
corporal de 106 pessoas, tendo média 98.20°F. Assuma
que esta amostra veio de uma amostra aleatória
simples e que o desvio padrão populacional
σσσσ
é
conhecido e igual a 0.62°F.
Teste com 5% de
significância a idéia popular de que a temperatura
corporal média de adultos sadios é igual a 98.6°F. Use
o método tradicional.
H
0
:
µµµµ
= 98.6
H
1
:
µµµµ ≠≠≠≠
98.6
αααα
= 0.05
x = 98.2
σσσσ
= 0.62
z = –6.64
Nós encontramos como valores críticos z= –1.96
e z=1.96. Nós rejeitamos a hipótese nula, pois a
estatística do teste z= –6.64 pertence à região
crítica.
Temos evidência suficiente para concluir que a temperatura
corporalmédia de adultos saudáveis é diferente de 98.6°F.
30
Slide
Slide
89
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Exemplo:
Temos
uma
amostra
da
temperatura
corporal de 106 pessoas, tendo média 98.20°F. Assuma
que esta amostra veio de uma amostra aleatória
simples e que o desvio padrão populacional
σσσσ
é
conhecido e igual a 0.62°F.
Teste com 5% de
significância a idéia popular de que a temperatura
corporal média de adultos sadios é igual a 98.6°F. Use
o método do intervalo de confiança.
Para um teste de hipótese bilateral com 5% de
significância, construímos um IC com 95% de
confiabilidade. Assim, temos:
98.08 <
µµµµ
< 98.32
Nós estamos 95% confiantes de que o intervalo de 98.08 a 98.32
contém o valor verdadeiro de
µµµµ
, assim, aparentemente 98.6
nãopode ser o valor verdadeiro de
µµµµ
.
H
0
:
µµµµ
= 98.6
H
1
:
µµµµ ≠≠≠≠
98.6
αααα
= 0.05
x = 98.2
σσσσ
= 0.62
Slide
Slide
90
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Relações Subjacentes ao Teste
de Hipótese
Se,
sob
uma
dada
suposição,
temos
uma
probabilidade extremamente pequena de obtermos
um resultado amostral tão extremo como o que
observamos, podemos concluir que a suposição
inicial provavelmente não é correta.
Quando testamos uma afirmação, fazemos uma
suposição de igualdade (com a hipótese nula). A
seguir,
comparamos
esta
suposição
com
o
resultado obtido com a amostra e tomamos uma
destas conclusões:
Se o resultado amostral (ou resultado mais extremo)
pode ocorrer facilmente quando a suposição (hipótese
nula) é verdadeira, podemos atribuir a relativamente
curta discrepância entre a suposição e o resultado
amostral ter ocorrido devido a fatores aleatórios.
Se o resultado amostral não pode ocorrer facilmente
quando a suposição (hipótese nula) é verdadeira, nós
explicamos a relativamente grande discrepância entre a
suposição e o resultado amostral concluindo que a
Relações Subjacentes ao Teste
de Hipótese - cont
31
Slide
Slide
92
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Recapitulando
Nesta seção nós apresentamos:
Requisitos para testar afirmações sobre médias
populacionais, com
σ
conhecido.
Método do P-valor.
Método Tradicional.
Método do Intervalo de Confiança.
Relações para os testes de hipótese.
Slide
Slide
93
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Seção 8-5
Testando Afirmações
sobre uma Média :
σσσσ
Desconhecido
Created by Erin Hodgess, Houston, Texas
Revised to accompany 10
thEdition, Tom Wegleitner, Centreville, VA
Slide
Slide
94
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.