Testes de Hipóteses II
Capítulo 12, Estatística Básica (Bussab&Morettin, 8a Edição)
6a AULA – 06/04/2015
MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues
1. Teste para a média de uma população com variância conhecida
Passo 1:H0:µ=µ0contra (i)H1:µ6=µ0;
(ii)H1:µ > µ0ouH1:µ=µ1(µ1> µ0);
(iii)H1:µ < µ0ouH1:µ=µ1(µ1< µ0).
Passo 2:A estatística a ser usada é X ∼N
µ,σ2
n
,
que sob a validade deH0é X ∼
H0
N
µ0,σ2 n
⇐⇒ Z =X−µ0 σ/√
n ∼
H0
N(0,1).
Passo 3:Dadoα
(i)RC={x :x ≤c∨x ≥d}, comc=µ0−z(1−α/2) qσ2
n e d =µ0+z(1−α/2)
qσ2 n; (ii)RC={x :x ≥d}, comd =µ0+z(1−α)
qσ2 n; (iii)RC={x :x ≤c}, comc =µ0−z(1−α)
qσ2 n,
comz(p)op-quantil da normal padrão.
2. Teste para a média de uma população com variância desconhecida e n pequeno
Passo 1:H0:µ=µ0contra (i)H1:µ6=µ0;
(ii)H1:µ > µ0ouH1:µ=µ1(µ1> µ0);
(iii)H1:µ < µ0ouH1:µ=µ1(µ1< µ0).
Passo 2:A estatística a ser usada é X −µ S/√
n ∼t(n−1), que sob a validade deH0é
T =X−µ0 S/√
n ∼
H0
t(n−1).
Passo 3:Dadoα
(i)RC={x :x ≤c∨x ≥d}, comc=µ0−t(1−α/2)√Sn e
d =µ0+t(1−α/2)√Sn; (ii)RC={x :x ≥d}, comd =µ0+t(1−α)√S
n; (iii)RC={x :x ≤c}, comc =µ0−t(1−α)√S
n,
comt(p)op-quantil da distribuição t-student com(n−1)-graus de liberdade.
3. Teste para a média de uma população com variância desconhecida e n grande
Passo 1:H0:µ=µ0contra (i)H1:µ6=µ0;
(ii)H1:µ > µ0ouH1:µ=µ1(µ1> µ0);
(iii)H1:µ < µ0ouH1:µ=µ1(µ1< µ0).
Passo 2:Neste caso, a estatística a ser usada é X−µ
S/√
n ∼N(0,1), que sob a validade deH0é
Z = X−µ0 S/√
n ∼
H0
N(0,1).
Passo 3:Dadoα
(i)RC={x :x ≤c∨x ≥d}, comc=µ0−z(1−α/2)√Sn e
d =µ0+z(1−α/2)√Sn; (ii)RC={x :x ≥d}, comd =µ0+z(1−α)√S
n; (iii)RC={x :x ≤c}, comc =µ0−z(1−α)√S
n, comz(p)op-quantil da distribuição normal padrão.
Exemplo 1:
Um fabricante afirma que seus cigarros contêm 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg.
No nível de 5%, os dados refutam ou não a afirmação do fabricante? Admita que a quantidade de nicotina por cigarro segue uma distribuição normal.
4. Teste para a variância de uma população normal
Neste caso, o parâmetro de interesse éσ2( ouσ) e vimos que S2= 1
n−1
n
X
i=1
(Xi−X)2
é um estimador não enviesado e consistente deσ2.
Para realizarmos inferências sobreσ2( ouσ), precisamos obter uma v.a. que seja função deS2e deσ2, mas cuja distribuição (amostral) não dependa de σ2.
Teorema
Seja(Z1, . . . ,Zn)uma AAS retirada de uma populaçãoN(0,1). Então:
1 Z tem distribuiçãoN(0,1/n);
2 As variáveisZ ePn
i=1(Zi−Z)2são independentes;
3 Pn
i=1(Zi−Z)2tem distribuiçãoχ2(n−1).
Corolário
A v.a. (n−1)Sσ2 2 tem distribuiçãoχ2(n−1).
De fato,
(n−1)S2
σ2 = n−1 σ2
1 n−1
n
X
i=1
(Xi −X)2=
n
X
i=1
Xi −X σ
!2
=
n
X
i=1
Xi−µ σ
− X−µ σ
!!2
=
n
X
i=1
(Zi−Z)2.
Passo 1:H0:σ2=σ02contra (i)H1:σ26=σ02;
(ii)H1:σ2> σ02ouH1:σ2=σ12(σ12> σ20);
(iii)H1:σ2< σ20ouH1:σ2=σ21(σ12< σ20).
Passo 2:A estatística a ser usada é (n−1)S2
σ2 ∼χ2(n−1), que sob a validade deH0é
χ2=(n−1)S2 σ02 ∼
H0
χ2(n−1).
Passo 3:Dadoα
(i)RC={χ2:0< χ2≤c∨χ2≥d}, comc =χ2(1−α/2)ed =χ2(α/2);
(ii)RC={χ2:χ2≥d}, comd =χ2(α);
(iii)RC={χ2:0< χ2≤c}, comc=χ2(1−α),
comχ2(p)op-quantil da distribuição Qui-quadrado.
Intervalo de confiança para σ
2A construção do IC(σ2;γ) é feita a partir da expressão P
χ21< (n−1)S2 σ2 < χ22
=γ,
que permite obter a desigualdade:
(n−1)S2
χ22 ≤σ2≤ (n−1)S2 χ21 ,
comχ21=χ2(1−α/2) =χ2((1+γ)/2)eχ22=χ2(α/2) =χ2((1−γ)/2).
NOTA:O IC(σ2;γ) corresponde à região de aceitação do teste bilateral.
Exemplo 2:
Uma das maneiras de manter sob controle a qualidade de um produto é controlar a sua variabilidade. Uma máquina de encher pacotes de café está regulada para enchê-los com média 500g e desvio padrão de 10g. O peso de cada pacoteXsegue uma distribuiçãoN(µ, σ2). Colheu-se uma amostra de 16 pacotes e observou-se uma variância des2=169g2. Com esse resultado, você diria que a máquina está desregulada com relação à variância?
(considereα=5%)
Valor-p ou nível descritivo
Ovalor-pounível descritivoouprobabilidade de significânciarepresenta uma forma alternativa de decisão que não exige a fixação do nível de significância αnem a determinação da região crítica.
O que se faz é calcular a probabilidade de ocorrer valores da estatística mais extremos do que o observado, sob a hipótese deH0ser verdadeira.
Valor-p=P(obter dados ainda mais desfavoráveis aH0|H0é verdadeira)
Assim,
Valor-p muito pequeno=⇒dados incoerentes comH0; Valor-p muito grande=⇒dados coerentes comH0.
Pelo que, se indicarmos porαˆo valor-p, a decisão num teste de hipóteses será a de:
rejeitaremosH0para n.s. α >αˆ
se o nível descritivo for muito pequeno, há evidências de que a hipótese não seja válida;
não rejeitaremosH0para n.s. α≤αˆ
se o nível descritivo for muito grande, há evidências de que a hipótese seja válida.
O Valor-p é o menor nível de significância que nos conduz à rejeição deH0
com a amostra observada.
Cálculo do Valor-p
Exemplo:
Uma estação de televisão afirma que 60%dos televisores estavam ligados no programa especial de domingo. Uma rede concorrente deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste. Destas, 104, confirmaram ter assistido a programa. Teste a veracidade da afirmação da estação, considerandoα=5%.
H0:p=0,6 versus H1:p<0,6.
Neste caso, a RC é uma cauda à esquerda, logo valor-p=P(ˆp<0,52|p=0,6) =P(Z <−2,30) =0,01
—–> os dados sugerem que a hipótese deve ser rejeitada
Exemplo:
Suponha que queiramos testarH0:µ=50 contraH1:µ >50, em queµé a média de uma normalN(µ,900). Extraída uma amostra den=36
elementos, obtemosx =52. Calcule o valor-p do teste.
Neste caso, a RC é uma cauda à direita, logo valor-p=P(X >52|µ=50) =P(Z >0,40) =0,345.
—–> os dados sugerem que a hipótese não deve ser rejeitada
Exemplo:
Uma companhia de ônibus intermunicipais planejou uma nova rota para servir vários locais situados entre duas cidades importantes. Um estudo preliminar afirma que a duração das viagens pode ser considerada uma v.a.
normal com média igual a 300 minutos e desvio padrão 30 minutos. As dez primeiras viagens realizadas nessa nova rota apresentaram média igual a 314 minutos. Esse resultado comprova ou não o tempo médio determinado nos estudos preliminares.
3. Caso:H0:µ=300 versus H1:µ6=300.
Neste caso, a RC é uma reunião de caudas, e comoxobs=314>300, então
valor-p=2P(X >314|µ=300) =2P(Z >1.48) =2×0,07=0,14
—–> não existe muita evidência para rejeitarH0
Cálculo do Valor-p
Depende do que significa obter dados ainda mais desfavoráveis aH0que os já obtidos, isto á, da forma da região crítica, RC.
Cauda à esquerda (H
1: θ < θ
0)
Valor-p=P(X <xobs|H0) =p−
Dados piores⇐⇒estar à esquerda dexobs, isto é, mais próximo da RC.
Cauda à direita (H
1: θ > θ
0)
Valor-p=P(X >xobs|H0) =p+
Dados piores⇐⇒estar à direita dexobs, isto é, mais próximo da RC.
Reunião de caudas (H
1: θ 6= θ
0)
Valor-p=2min(p−,p+) Se a f.d.p. é simétrica então
Valor-p=2P(X >xobs|H0), sexobs> θ0 Valor-p=2P(X <xobs|H0), sexobs< θ0 pois cada cauda tem pesoα/2.
Dados piores⇐⇒estar à esquerda dexobs, sexobsestá mais perto da cauda esquerda e estar à direita dexobssexobsestá mais perto da cauda direita.
Exemplo 3:
Calcule o valor-p associado aos testes de hipóteses realizados e com base nele, conclua ao nível de significância de 1%.