Testes de Hipóteses II

(1)

Testes de Hipóteses II

Capítulo 12, Estatística Básica (Bussab&Morettin, 8a Edição)

6a AULA – 06/04/2015

MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues

(2)

1. Teste para a média de uma população com variância conhecida

Passo 1:H₀:µ=µ₀contra (i)H1:µ6=µ₀;

(ii)H₁:µ > µ₀ouH₁:µ=µ₁(µ₁> µ₀);

(iii)H₁:µ < µ₀ouH₁:µ=µ₁(µ₁< µ₀).

Passo 2:A estatística a ser usada é X ∼N

µ,σ²

n

,

que sob a validade deH₀é X ∼

H0

N

µ₀,σ² n

⇐⇒ Z =X−µ₀ σ/√

n ∼

H0

N(0,1).

(3)

Passo 3:Dadoα

(i)RC={x :x ≤c∨x ≥d}, comc=µ₀−z(1−α/2) qσ²

n e d =µ₀+z(1−α/2)

qσ² n; (ii)RC={x :x ≥d}, comd =µ₀+z(1−α)

qσ² n; (iii)RC={x :x ≤c}, comc =µ₀−z(1−α)

qσ² n,

comz(p)op-quantil da normal padrão.

(4)

2. Teste para a média de uma população com variância desconhecida e n pequeno

Passo 1:H0:µ=µ₀contra (i)H₁:µ6=µ₀;

(ii)H1:µ > µ₀ouH1:µ=µ₁(µ₁> µ₀);

(iii)H1:µ < µ₀ouH1:µ=µ₁(µ₁< µ₀).

Passo 2:A estatística a ser usada é X −µ S/√

n ∼t(n−1), que sob a validade deH₀é

T =X−µ₀ S/√

n ∼

H0

t(n−1).

(5)

Passo 3:Dadoα

(i)RC={x :x ≤c∨x ≥d}, comc=µ₀−t(1−α/2)^√^S_n e

d =µ₀+t(1−α/2)^√^S_n; (ii)RC={x :x ≥d}, comd =µ₀+t(1−α)^√^S

n; (iii)RC={x :x ≤c}, comc =µ₀−t(1−α)^√^S

n,

comt(p)op-quantil da distribuição t-student com(n−1)-graus de liberdade.

(6)

3. Teste para a média de uma população com variância desconhecida e n grande

Passo 1:H0:µ=µ₀contra (i)H₁:µ6=µ₀;

(ii)H1:µ > µ₀ouH1:µ=µ₁(µ₁> µ₀);

(iii)H₁:µ < µ₀ouH₁:µ=µ₁(µ₁< µ₀).

Passo 2:Neste caso, a estatística a ser usada é X−µ

S/√

n ∼N(0,1), que sob a validade deH₀é

Z = X−µ₀ S/√

n ∼

H0

N(0,1).

(7)

Passo 3:Dadoα

(i)RC={x :x ≤c∨x ≥d}, comc=µ₀−z(1−α/2)^√^S_n e

d =µ₀+z(1−α/2)^√^S_n; (ii)RC={x :x ≥d}, comd =µ₀+z(1−α)^√^S

n; (iii)RC={x :x ≤c}, comc =µ₀−z(1−α)^√^S

n, comz(p)op-quantil da distribuição normal padrão.

(8)

Exemplo 1:

Um fabricante afirma que seus cigarros contêm 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg.

No nível de 5%, os dados refutam ou não a afirmação do fabricante? Admita que a quantidade de nicotina por cigarro segue uma distribuição normal.

(9)

4. Teste para a variância de uma população normal

Neste caso, o parâmetro de interesse éσ²( ouσ) e vimos que S²= 1

n−1

n

X

i=1

(Xi−X)²

é um estimador não enviesado e consistente deσ².

Para realizarmos inferências sobreσ²( ouσ), precisamos obter uma v.a. que seja função deS²e deσ², mas cuja distribuição (amostral) não dependa de σ².

Teorema

Seja(Z1, . . . ,Zn)uma AAS retirada de uma populaçãoN(0,1). Então:

1 Z tem distribuiçãoN(0,1/n);

2 As variáveisZ ePn

i=1(Zi−Z)²são independentes;

3 Pn

i=1(Zi−Z)²tem distribuiçãoχ²(n−1).

(10)

Corolário

A v.a. ^(n−1)S_σ2 ² tem distribuiçãoχ²(n−1).

De fato,

(n−1)S²

σ² = n−1 σ²

1 n−1

n

X

i=1

(Xi −X)²=

n

X

i=1

X_i −X σ

!2

=

n

X

i=1

X_i−µ σ

− X−µ σ

!!2

=

n

X

i=1

(Zi−Z)².

(11)

(12)

Passo 1:H₀:σ²=σ₀²contra (i)H1:σ²6=σ₀²;

(ii)H₁:σ²> σ₀²ouH₁:σ²=σ₁²(σ₁²> σ²₀);

(iii)H1:σ²< σ²₀ouH1:σ²=σ²₁(σ₁²< σ²₀).

Passo 2:A estatística a ser usada é (n−1)S²

σ² ∼χ²(n−1), que sob a validade deH₀é

χ²=(n−1)S² σ₀² ∼

H0

χ²(n−1).

(13)

Passo 3:Dadoα

(i)RC={χ²:0< χ²≤c∨χ²≥d}, comc =χ²(1−α/2)ed =χ²(α/2);

(ii)RC={χ²:χ²≥d}, comd =χ²(α);

(iii)RC={χ²:0< χ²≤c}, comc=χ²(1−α),

comχ²(p)op-quantil da distribuição Qui-quadrado.

(14)

Intervalo de confiança para σ

²

A construção do IC(σ²;γ) é feita a partir da expressão P

χ²₁< (n−1)S² σ² < χ²₂

=γ,

que permite obter a desigualdade:

(n−1)S²

χ²₂ ≤σ²≤ (n−1)S² χ²₁ ,

comχ²₁=χ²(1−α/2) =χ²((1+γ)/2)eχ²₂=χ²(α/2) =χ²((1−γ)/2).

NOTA:O IC(σ²;γ) corresponde à região de aceitação do teste bilateral.

(15)

Exemplo 2:

Uma das maneiras de manter sob controle a qualidade de um produto é controlar a sua variabilidade. Uma máquina de encher pacotes de café está regulada para enchê-los com média 500g e desvio padrão de 10g. O peso de cada pacoteXsegue uma distribuiçãoN(µ, σ²). Colheu-se uma amostra de 16 pacotes e observou-se uma variância des²=169g². Com esse resultado, você diria que a máquina está desregulada com relação à variância?

(considereα=5%)

(16)

Valor-p ou nível descritivo

Ovalor-pounível descritivoouprobabilidade de significânciarepresenta uma forma alternativa de decisão que não exige a fixação do nível de significância αnem a determinação da região crítica.

O que se faz é calcular a probabilidade de ocorrer valores da estatística mais extremos do que o observado, sob a hipótese deH0ser verdadeira.

Valor-p=P(obter dados ainda mais desfavoráveis aH₀|H₀é verdadeira)

Assim,

Valor-p muito pequeno=⇒dados incoerentes comH0; Valor-p muito grande=⇒dados coerentes comH₀.

(17)

Pelo que, se indicarmos porαˆo valor-p, a decisão num teste de hipóteses será a de:

rejeitaremosH₀para n.s. α >αˆ

se o nível descritivo for muito pequeno, há evidências de que a hipótese não seja válida;

não rejeitaremosH0para n.s. α≤αˆ

se o nível descritivo for muito grande, há evidências de que a hipótese seja válida.

O Valor-p é o menor nível de significância que nos conduz à rejeição deH0

com a amostra observada.

(18)

Cálculo do Valor-p

Exemplo:

Uma estação de televisão afirma que 60%dos televisores estavam ligados no programa especial de domingo. Uma rede concorrente deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste. Destas, 104, confirmaram ter assistido a programa. Teste a veracidade da afirmação da estação, considerandoα=5%.

H₀:p=0,6 versus H₁:p<0,6.

Neste caso, a RC é uma cauda à esquerda, logo valor-p=P(ˆp<0,52|p=0,6) =P(Z <−2,30) =0,01

—–> os dados sugerem que a hipótese deve ser rejeitada

(19)

Exemplo:

Suponha que queiramos testarH₀:µ=50 contraH₁:µ >50, em queµé a média de uma normalN(µ,900). Extraída uma amostra den=36

elementos, obtemosx =52. Calcule o valor-p do teste.

Neste caso, a RC é uma cauda à direita, logo valor-p=P(X >52|µ=50) =P(Z >0,40) =0,345.

—–> os dados sugerem que a hipótese não deve ser rejeitada

(20)

Exemplo:

Uma companhia de ônibus intermunicipais planejou uma nova rota para servir vários locais situados entre duas cidades importantes. Um estudo preliminar afirma que a duração das viagens pode ser considerada uma v.a.

normal com média igual a 300 minutos e desvio padrão 30 minutos. As dez primeiras viagens realizadas nessa nova rota apresentaram média igual a 314 minutos. Esse resultado comprova ou não o tempo médio determinado nos estudos preliminares.

3. Caso:H0:µ=300 versus H1:µ6=300.

Neste caso, a RC é uma reunião de caudas, e comoxobs=314>300, então

valor-p=2P(X >314|µ=300) =2P(Z >1.48) =2×0,07=0,14

—–> não existe muita evidência para rejeitarH0

(21)

Cálculo do Valor-p

Depende do que significa obter dados ainda mais desfavoráveis aH0que os já obtidos, isto á, da forma da região crítica, RC.

Cauda à esquerda (H

1

: θ < θ

0

)

Valor-p=P(X <xobs|H₀) =p⁻

Dados piores⇐⇒estar à esquerda dex_obs, isto é, mais próximo da RC.

Cauda à direita (H

1

: θ > θ

0

)

Valor-p=P(X >x_obs|H₀) =p⁺

Dados piores⇐⇒estar à direita dex_obs, isto é, mais próximo da RC.

(22)

Reunião de caudas (H

1

: θ 6= θ

0

)

Valor-p=2min(p⁻,p⁺) Se a f.d.p. é simétrica então

Valor-p=2P(X >xobs|H₀), sexobs> θ₀ Valor-p=2P(X <xobs|H₀), sexobs< θ₀ pois cada cauda tem pesoα/2.

Dados piores⇐⇒estar à esquerda dexobs, sexobsestá mais perto da cauda esquerda e estar à direita dexobssexobsestá mais perto da cauda direita.

(23)

Exemplo 3:

Calcule o valor-p associado aos testes de hipóteses realizados e com base nele, conclua ao nível de significância de 1%.