Aula 5. Teste de Hipóteses II.
Capítulo 12, Bussab&Morettin “Estatística Básica” 7ª Edição
Procedimento teste de hipótese para proporção. Resumo.
(1) Estabelecer as hipóteses:
H: 𝑝 =
𝑝
0contra uma das alternativas A: 𝑝
𝑝
0 , A:𝑝
𝑝
0 ou A:𝑝
𝑝
0.
(2) Escolher um nível de significância 𝜶.
(3) Determinar a região crítica RC da forma
{ 𝑋 ≤ 𝑘
1 } ∪ { 𝑋 ≥ 𝑘2 }, { 𝑋 ≥ 𝑘 } ou { 𝑋 ≤ 𝑘 },respectivamente às hipóteses alternativas, onde 𝑋 é número de elementos na amostra com o atributo
desejado, 𝑋~𝐵(𝑛, 𝑝
0).(4) Selecionar uma amostra aleatória e determinar o número 𝑥 de elementos na amostra com o atributo desejado.
(5) Decidir, usando a evidência 𝑥 , ao nível de significância
𝜶, e concluir.𝑥
RC
rejeitamos H.
𝑥
RC
não rejeitamos H.
Procedimento teste de hipótese para
proporção. Resumo.
Procedimento teste de hipótese para proporção. Região crítica.
Estatística do teste é 𝑋 que é número de elementos na amostra com o atributo desejado, a distribuição de 𝑋 é a
distribuição binomial 𝐵(𝑛, 𝑝
0) . A região crítica é determinada
em forma { 𝑋 ≤ 𝑘
1} ∪ { 𝑋 ≥ 𝑘
2}, { 𝑋 ≤ 𝑘 } ou { 𝑋 ≥ 𝑘 },
respectivamente às hipóteses alternativas, que depende de
nível de significância do teste 𝛼 e da estatística do teste
Procedimento teste de hipótese para proporção. Região crítica.
Estatística do teste pode ser também a proporção 𝑝 = 𝑋 = 𝑋
𝑛
em que 𝑋 , como antes, é número de elementos na amostra com o atributo desejado. Neste caso a região crítica é
determinada em forma 𝑝 ≤ 𝑘
1𝑛 ∪ 𝑝 ≥ 𝑘
2𝑛 , 𝑝 ≥ 𝑘
𝑛 , 𝑝 ≤ 𝑘
𝑛
respectivamente às hipóteses alternativas
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
Estatística do teste pode ser também 𝑧-estatística 𝑍 = 𝑋 − 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0)
em que 𝑋 , como antes, é número de elementos na amostra com o atributo desejado. Neste caso a região crítica é
determinada em forma 𝑍 ≤ 𝑘
1− 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0) ∪ 𝑍 ≥ 𝑘
2− 𝑛𝑝
0𝑛𝑝
01 − 𝑝
0, 𝑍 ≥ 𝑘 − 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0) , 𝑍 ≤ 𝑘 − 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0)
(1) H: 𝑝 = 𝑝
0A:
𝑝
𝑝
0(2) Escolher um nível de significância
𝜶. 𝛼 = 0.05
(3) Determinar a região crítica RC da forma 𝑋 𝑘 ou 𝑍 =
𝑋−𝑛𝑝0𝑛𝑝0(1−𝑝0)
≥
𝑘−𝑛𝑝0𝑛𝑝0 1−𝑝0
= 𝑧
𝑐onde estatística do teste
𝑍 = 𝑋 − 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0) ≈ 𝑁(0,1)
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
(3) Determinar a região crítica RC da forma 𝑍 ≥ 𝑧
𝑐onde estatística do teste
𝑍 ~𝑁(0,1)
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
Achamos 𝑧
𝑐pela tabela da distribuição normal 𝑃 𝑍 ≥ 𝑧
𝑐= 𝛼
(4) Selecionar uma amostra aleatória e determinar o
número 𝑥
de elementos na amostra com o atributodesejado.
(5) Decidir, usando a evidência 𝑧
𝑜𝑏𝑠:
𝑧𝑜𝑏𝑠
> 𝑧
𝑐 rejeitamos H.
𝑧𝑜𝑏𝑠
< 𝑧
𝑐 não rejeitamos H.
(4) Calcular o valor observado da estatística do teste 𝑧
𝑜𝑏𝑠= 𝑥 − 𝑛𝑝
0𝑛𝑝
0(1 − 𝑝
0)
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
Procedimento teste de hipótese para proporção. Aproximação normal.
Exemplo: A proporção de analfabetos em um município
era de 15% na gestão anterior.
No início da sua gestão, o prefeito atual implantou um programa de alfabetização e após 2 anos afirma que
reduziu a proporção de analfabetos.Para verificar a afirmação do prefeito, n = 200 cidadãos foram entrevistados.
Seja 𝑋 o número de analfabetos entre os 200 cidadãos entrevistados e 𝑋~𝐵 200; 𝑝 , sendo 𝑝 a proporção atual de analfabetos no município (após o programa de alfabetização).
Procedimento teste de hipótese para proporção. Aproximação normal.
(1) Estabelecer as hipóteses:
H: 𝑝 = 0.15
contra alternativa A: 𝑝
0.15.
H: A proporção de analfabetos no município não se alterou
(a afirmação do prefeito está incorreta).
A: A proporção de analfabetos no município diminuiu
(a afirmação do prefeito está correta).
(2) Escolher um nível de significância 𝛼.
𝛼 = 0.05
Procedimento teste de hipótese para proporção. Aproximação normal.
(3) Determinar a região crítica RC da forma 𝑍 < 𝑧
𝑐onde achamos 𝑧
𝑐pela tabela da distribuição normal 𝑃 𝑍 < 𝑧
𝑐= 𝛼
1 − 𝐴 −𝑧
𝑐= 𝛼 ⇒ 𝐴 −𝑧
𝑐= 1 − 𝛼 = 0.95 𝑧
𝑐= −1.64
Então, a região crítica RC é
𝑍 < −1.64
(4) Buscar a evidência na amostra para concluir.
Se observamos 20 analfabetos entre os 200 entrevistados, qual a conclusão?
Procedimento teste de hipótese para proporção. Aproximação normal.
Calculemos a estatística do teste 𝑧
𝑜𝑏𝑠= 20 − 200 ∙ 0.15
200 ∙ 0.15 ∙ 0.85 ≅ −1.98
Procedimento teste de hipótese para proporção. Aproximação normal.
(5) Decisão e conclusão:
𝑧
𝑜𝑏𝑠= −1.98 < −1.64 = 𝑧
𝑐⇒ 𝑧
𝑜𝑏𝑠∈ 𝑅𝐶
decidimos por rejeitar a hipótese nula ao nível de significância de 5%.
Concluímos que temos evidência suficiente para afirmar
que a proporção de analfabetos (após o programa de
alfabetização) é inferior a 15%, isto é, há evidência
suficiente de que a afirmação do prefeito seja correta.
Procedimento teste de hipótese para média populacional.
amostra população
normal
𝑋
1, 𝑋
2, … , 𝑋
𝑛: são independentes e
𝑋
𝑖~𝑁(𝜇, 𝜎
2)
2 2
) (
2 )
(
2 2
x
x e f
𝑋
1, 𝑋
2, … , 𝑋
𝑛𝑋
𝑖~𝑁(𝜇, 𝜎
2)
Nosso objetivo agora é apresentar procedimentos estatísticos simples para verificar se um conjunto de dados amostrais dá ou não suporte à uma conjectura sobre o
valor médio𝜇 (desconhecido) de uma característica de interesse, observável em “indivíduos” de uma população (normal).
Procedimento teste de hipótese para média populacional.
Mais precisamente, procedimentos para
testar hipóteses sobre𝜇, tomando como base o valor médio 𝑋 dessa
característica, observado em uma amostra casual simples
de tamanho 𝑛 desses “indivíduos”.
Exemplo:
Em períodos de pico, os clientes de um banco são obrigados a enfrentar longas filas para sacar dinheiro nos caixas eletrônicos. Dados históricos de vários anos de operação indicam que o tempo de transação nesses caixas tem distribuição normal com média igual a 270 segundos.
Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das transações realizadas nesses caixas.
Procedimento teste de hipótese para média
populacional.
As etapas a serem cumpridas para este teste de hipóteses são as mesmas que vimos anteriormente.
(1) Formular as hipóteses nula H e a alternativa A
Hipótese Nula : afirmação ou conjectura sobre 𝜇 contra a qual estaremos buscando evidência nos dados amostrais.
Hipótese Alternativa : afirmação ou conjectura sobre 𝜇 que suspeitamos (ou esperamos) ser verdadeira.
H: 𝜇 = 𝜇0
contra uma das alternativas
A:𝜇 ≠
𝜇0, A: 𝜇 < 𝜇0 ou A: 𝜇 > 𝜇0Procedimento teste de hipótese para média populacional.
H: 𝜇 = 270 seg.
A: 𝜇 < 270 seg.
(2) Fixar o nível de significância
𝛼 do teste. Seja 𝛼 = 5%. Procedimento teste de hipótese para média
populacional.
(3) Determinar a região crítica RC da forma
𝑍 < −𝑧
𝑐∪ 𝑍 > 𝑧
𝑐, 𝑍 > 𝑧
𝑐ou 𝑍 < −𝑧
𝑐ou
𝑇 < −𝑡
𝑐∪ 𝑇 > 𝑡
𝑐, 𝑇 > 𝑡
𝑐 ou𝑇 < −𝑡
𝑐respectivamente às hipóteses alternativas
A estatística do teste 𝑍 ou 𝑇 vai ser definida dependendo do conhecimento de variância populacional 𝜎
2 como𝑍 = 𝑋 −𝜇0
𝜎
𝑛 ~ 𝑁 0,1 caso 𝜎
2é conhecida, e
𝑇 = 𝑋 −𝜇0𝑠
𝑛 ~ 𝑡
𝑛−1caso 𝜎
2é desconhecida Procedimento teste de hipótese para média
populacional.
Valores 𝑧𝑐 e 𝑡𝑐 são definidos pelas hipóteses e 𝛼: 𝑃 𝑍 < −𝑧𝑐 ∪ 𝑍 > 𝑧𝑐 = 𝑃 𝑍 > 𝑧𝑐 = 𝛼,
𝑃 𝑍 > 𝑧𝑐 = 𝛼 ou 𝑃 𝑍 < −𝑧𝑐 = 𝛼 usando tabela normal ou
𝑃 𝑇 < −𝑡𝑐 ∪ 𝑇 > 𝑡𝑐 = 𝑃 𝑇 > 𝑡𝑐 = 𝛼,
𝑃 𝑇 > 𝑡𝑐 = 𝛼 ou 𝑃 𝑇 < −𝑡𝑐 = 𝛼 usando tabela T-Student
Procedimento teste de hipótese para média populacional.
No exemplo supomos não que sabemos variância populacional 𝜎2 então usaremos a estatística do teste
𝑇 = 𝑋 − 𝜇0
𝑆 𝑛 ~ 𝑡𝑛−1
Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das 24 transações realizadas nesses caixas.
Achamos 𝑡𝑐 de condição 𝑃 𝑇 < −𝑡𝑐 = 0.05
𝑃 𝑇 < −1.714 = 0.05 RC= 𝑇 < −1.714
Procedimento teste de hipótese para média populacional.
(4) Buscar a evidência na amostra para concluir:
Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das 24 transações realizadas nesses caixas.
Amostra de 24 trasações oferece seguintes dados:
𝑥 = 262.3, 𝑠 = 21.4
Valor observado da estatística do teste é 𝑡𝑜𝑏𝑠 = 𝑥 − 𝜇0
𝑠 𝑛 = 262.3 − 270
21.4 24 ≅ −1.76
(5) Decisão e conclusão:
𝑡𝑜𝑏𝑠 = −1.76 < −1.71 = 𝑡𝑐 ⇒ 𝑧𝑜𝑏𝑠 ∈ 𝑅𝐶
decidimos por rejeitar a hipótese nula ao nível de significância de 5%.
Concluímos que temos evidência suficiente para afirmar que a média de transição diminuiu nas novos caixas eletrônicos
Procedimento teste de hipótese para média
populacional.
Ou seja, queremos testar
H: O processo está sob controle.
A: O processo não está sob controle.
Exemplo: Um industrial afirma que seu processo de fabricação produz 90% de peças dentro das especificações. O IPEM deseja investigar se esse processo de fabricação está sob controle.
Seja 𝑝 a proporção de peças produzidas dentro das especificações.
H: 𝑝 = 0.9 A: 𝑝 < 0.9
As hipóteses de interesse são:
Selecionamos uma amostra aleatória de 15 itens e observamos o número 𝑋 de itens satisfatórios.
Então: 𝑋~𝐵(15, 𝑝)
Região crítica: RC= {
𝑋 ≤ 𝑘
}Para 𝛼 = 6% temos 𝑘 = 11 e RC= 𝑋 ≤ 11
Para
𝛼 = 1%
temos𝑘 = 9
e RC= 𝑋 ≤ 9
Nível descritivo. Introdução.
Crítica: Arbitrariedade na escolha da região crítica (ou do nível de significância).
a) 𝛼 = 6% 10 RC
Rejeitamos H ao nível de significância de 6%.
Se observamos x = 10 peças satisfatórias, então:
Sugestão: Determinar o nível de significância associado à evidência experimental, que é denominado nível descritivo ou p-valor.
b) 𝛼 = 1% 10 RC
Não rejeitamos H ao nível de significância de 1%.
Nível descritivo. Introdução.
No exemplo, a região crítica é da forma RC = 𝑋 ≤ 𝑘 .
Para 𝑥𝑜𝑏𝑠 = 10,o nível descritivo ou valor 𝑃 é calculado por:
𝑝 = 𝑃 𝑋 ≤ 10 | 𝑝 = 0.9 = 0.0127
O valor 𝑃 é igual à probabilidade de ocorrerem valores de 𝑋 tão ou mais desfavoráveis para a hipótese nula 𝐻 do que o valor observado 𝑥𝑜𝑏𝑠 = 10.
Assim, se o processo estivesse sob controle, a probabilidade de encontrarmos uma amostra de 15 peças com 10 ou menos
peças satisfatórias é de apenas 1%.
Isso sugere que a hipótese nula 𝐻 deve ser rejeitada.
Nível descritivo. P-valor.
Se o valor 𝑃 é “pequeno”, então é pouco provável observarmos valores iguais ou mais extremos que o da amostra, supondo a hipótese nula 𝐻 verdadeira.
Assim, há indícios de que a hipótese nula não seja verdadeira e tendemos a rejeitá-la.
Assim,
P “pequeno” rejeitamos H
P “não pequeno” não rejeitamos H
Quão “pequeno” deve ser o valor de P para rejeitarmos H ?
Por outro lado, para valores “não tão pequenos” de 𝑃, não fica evidente que a hipótese nula 𝐻 seja falsa, portanto tendemos a não rejeitá-la.
Nível descritivo. P-valor.
𝑃 ≤ 𝛼 rejeitamos 𝐻
𝑃 > 𝛼 não rejeitamos 𝐻
Se 𝑃 ≤ 𝛼 , dizemos que a amostra forneceu evidência suficiente para rejeitar a hipótese nula 𝐻.
Lembrando que a ideia inicial de 𝑃 era considerar um nível de significância associado à evidência amostral, podemos compará-lo a um nível de significância 𝛼 fixado, de modo que:
P P
rejeitamos H não rejeitamos H
Nível descritivo. P-valor.
No exemplo: P-valor = 0,0127.
Adotando
= 0,05, temos que P < , portanto
rejeitamos 𝐻 ao nível de significância 5%.Assim, o processo não está sob controle.
31
Nível descritivo. P-valor.
Observações:
•
Quanto menor o
valor P, maior é a evidência contra ahipótese nula 𝐻 contida nos dados.
•
Quando a hipótese nula é rejeitada para um nível de
significância 𝛼 fixado, dizemos também que
a amostra é significante ao nível de significância
.(1) Formular as hipóteses nula 𝐻 e a alternativa 𝐴 (2) Fixar o nível de significância 𝛼 do teste.
(3) Coletar os dados e calcular as medidas necessárias. A média amostral 𝑥 𝑜𝑏𝑠 , e se necessário, o desvio padrão amostral 𝑠.
(4) Determinar o nível descritivo 𝑃.
(5) Tomar a decisão e concluir. Comparar o p-valor com o nível de significância 𝛼 adotado: se p-valor < 𝛼 , então reconhecemos na amostra evidência suficiente para rejeitar 𝐻, isto é, consideramos a amostra significante ao nível 𝛼.
Caso contrário, não rejeitamos 𝐻.
Procedimento teste de hipótese para média
populacional usando p-valor
(4) Cálculo do nível descritivo 𝑃. Como visto anteriormente o nível descritivo mede a probabilidade de se observar valores mais extremos do que o encontrado na amostra, supondo que a hipótese nula seja verdadeira, isto é,
𝑃 = 𝑃 𝑋 ≤ 𝑥 𝑜𝑏𝑠 | 𝜇 = 270
Procedimento teste de hipótese para média populacional usando p-valor
No caso do exemplo anterior com novos caixas eletrónicos, temos
Exemplo:
Um fabricante de cigarros afirma que seus cigarros contêm não mais que 30 mg de nicotina.
Uma ONG anti-tabagismo não concorda com essa afirmação, e colhe uma amostra aleatória de 52 cigarros dessa marca para contestar a afirmação.
Na amostra coletada, o conteúdo médio de nicotina foi 31,1 mg e desvio padrão de 3,4 mg.
Esses resultados são suficientes para contestar a afirmação do fabricante ?
(2) Nível de significância, por exemplo, 5%.
(3) Evidência amostral
(1) As hipóteses nula e alternativa são H: 30 mg
A: 30 mg
Tamanho da amostra n = 52 Média amostral = 31,1 mg
Desvio padrão amostral s = 3,4 mg obs
x
(4) Cálculo do nível descritivo P
Como P , decidimos por rejeitar H.
(5) Decisão e conclusão
P = P( 31,1
X
= 30 )Logo, ao nível de 5%, há evidências suficiente para concluir que a afirmação do fabricante está incorreta. A contestação da ONG procede.
= P 𝑇 ≥ 52 31,1−30
3,4
≅ P 𝑍 ≥ 52 31,1−30
3,4
= P 𝑍 ≥ 2,33 = 0,01
Hipóteses Alternativas Unilaterais e Bilaterais
Quando a hipótese alternativa é bilateral (A: 0), o nível descritivo mede o quanto o valor amostral pode se distanciar do valor esperado, sob a hipótese nula H, em ambas as direções.
Quando a hipótese alternativa é A: 0, consideramos, no cálculo de P, os valores maiores ou iguais a .
x
obsQuando a hipótese alternativa é A: 0 (como no Exemplo 1), no cálculo de P, valores iguais ou mais extremos do que representam os valores menores ou iguais a . obs
x
x
obsExemplo 3:
Uma empresa vende uma mistura de castanhas, em latinha, cuja embalagem afirma que, em média, 25 g do conteúdo total (em g) é de castanha de caju. Sabe-se que o conteúdo de castanha de caju tem distribuição normal com desvio padrão igual a 3,1 g.
Desconfiado de que o conteúdo médio esteja incorreto, o departamento de Garantia da Qualidade (GQ) resolve examinar o conteúdo de 12 latas, e medir a quantidade (em g) de castanha de caju em cada lata. A média amostral resultou em 26,3 g.
Este resultado constitui uma forte evidência em favor do GQ, ao nível de 5% ?
(1) As hipóteses nula e alternativa são H: 25 e A: 25 (2) Nível de significância
(3) Evidência amostral Pelo texto, 5%.
Não interessa à empresa que se tenha menos castanha de caju do que o especificado na embalagem, por uma questão de qualidade. Por outro lado, não se pode ter muito mais, por uma questão de custo.
Tamanho da amostra n = 12 Média amostral = 26,3 g
Desvio padrão (populacional) = 3,1 g
x
obs(4) Determinar o nível descritivo
Se a mistura está dentro dos padrões, o conteúdo médio de castanhas de caju seria 25 g.
Observamos um desvio de |26,3 – 25| = 1,3 g.
Logo,
P = P( |
– 25| 1,3)
X X
X
= P(
26,3 ouX
23,7
= 25) (por simetria) = 2 P(
26,3
= 25)(5) Decisão e conclusão
Como P > , decidimos por não rejeitar H.
Assim,
= 2 P( Z 1,45) = 2 (0,0735) = 0,1471
Concluímos, ao nível de significância de 5%, que não há evidências suficiente em favor do GQ.
P = 2 𝑃 𝑍 ≥ 12 26.3−25
3.1
RESUMO
Teste de hipóteses para a média populacional
(1) Estabelecer as hipóteses:
H: = 0 contra uma das alternativas A: 0 , A: 0 ou A: 0 . (2) Escolher um nível de significância
(0) Descrever o parâmetro de interesse .
(3) Selecionar uma amostra casual simples de tamanho n determinar a média amostral e o desvio padrão (populacional ou amostral s) .
xobs
(4) Determinar o nível descritivo P
Se A: 0 , 𝑃 = 𝑃 𝑋 ≥ 𝑥 𝑜𝑏𝑠 | 𝜇 = 𝜇0 Se A: 0 , 𝑃 = 𝑃 𝑋 ≤ 𝑥 𝑜𝑏𝑠 | 𝜇 = 𝜇0
Se A: 0 , 𝑃 = 2𝑃 𝑋 ≥ 𝑥 𝑜𝑏𝑠 | 𝜇 = 𝜇0 se 𝑥 𝑜𝑏𝑠 > 𝜇0 ou 𝑃 = 2𝑃 𝑋 ≤ 𝑥 𝑜𝑏𝑠 | 𝜇 = 𝜇0 se 𝑥 𝑜𝑏𝑠 < 𝜇0
Usando no cálculo uma das variáveis padronizadas
𝑍 = 𝑛 𝑋 − 𝜇
ou𝜎 𝑇 = 𝑛 𝑋 − 𝜇
𝑠
(5) Decidir, comparando P com o nível de significância , econcluir.
Se P rejeitamos H
Se P > não rejeitamos H e lembrando que,
Z N(0,1) e
T t de Student com n-1 graus de liberdade.
(Se n é grande, use a aproximação normal.)