Cap´ıtulo 8 - Testes de Hip´
oteses
Concei¸c˜ao Amado, Ana M. Pires, M. Ros´ario Oliveira e Isabel M.
Nos cap´ıtulos anteriores vimos como estimar um parˆametro desconhecido a partir de uma amostra (obtendo estimativas pontuais e intervalos de
confian¸ca para o parˆametro).
Muitas situa¸c˜oes pr´aticas tˆem uma natureza diferente, requerendo que
em fun¸c˜ao dos valores observados se tomem decis˜oes acerca dos
parˆametros (ou de outros aspectos) da popula¸c˜ao.
Exemplo 8.1:
M´aquina de encher pacotes de a¸c´ucar. O peso de cada pacote deve ser
≈ 8 g (isto ´e, µ = 8).
Ser´a poss´ıvel concluir a partir da medi¸c˜ao do peso de um certo n´umero
8.1 (cont.)
Defini¸c˜ao: Uma hip´otese estat´ıstica ´e uma afirma¸c˜ao acerca de
parˆametros (testes param´etricos) ou acerca da distribui¸c˜ao (testes de
ajustamento) de uma ou mais popula¸c˜oes.
Vamos estudar em primeiro lugar os testes param´etricos.
Exemplo 8.1 (cont.):
Temos duas hip´oteses, a m´aquina funciona correctamente (µ = 8) ou a
m´aquina n˜ao funciona correctamente (µ6= 8), que se representam e
denominam assim
H0: µ = 8 versus H1: µ6= 8
Suponha que θ0´e um valor que se pretende testar para o parˆametro θ de uma determinada popula¸c˜ao FX(x ; θ), θ ∈ Θ as hip´oteses param´etricas s˜ao, genericamente:
H0: θ ∈ Θ0 versus H1: θ ∈ Θ1 (hip´otese nula) (hip´otese alternativa)
Temos que ter sempre:
H0∪ H1= Θ (todos os valores poss´ıveis do parˆametro Θ = Θ0∪ Θ1) H0∩ H1= ∅
As hip´oteses em teste podem ser:
Hip´otese simples: ´e especificado s´o um valor para o parˆametro. (Ex: θ = 8)
Hip´otese composta: ´e especificado mais de um valor para o parˆametro. (Ex: θ 6= 8; θ ≥ 8 )
8.1 (cont.)
Podemos estar interessados nos seguintes conjuntos de hip´oteses:
Quando H0: θ = θ0 (hip´otese nula simples)
a hip´otese alternativa (H1) pode ser uma de: H1: θ = θ1 hip´otese alternativa simples
H1: θ 6= θ0 hip´otese alternativa composta (teste bilateral) H1: θ > θ0 hip´otese alternativa composta (unilateral superior) H1: θ < θ0 hip´otese alternativa composta (unilateral inferior)
Quando H0: θ≤ θ0 hip´otese nula composta
a hip´otese alternativa dever´a ser:
H1: θ > θ0 hip´otese alternativa unilateral inferior
Quando H0: θ≥ θ0 hip´otese nula composta
a hip´otese alternativa deve ser:
H1: θ < θ0 hip´otese alternativa unilateral inferior
Defini¸c˜ao: Teste de hip´oteses´e um procedimento estat´ıstico que, baseado
8.1 (cont.)
Exemplo 8.1 (cont.): Defina-se a v.a. X que representa o peso do
pacote de a¸c´ucar, com E (X ) =µ e V (X ) = σ2. Pretende-se testar
H0: µ = 8 versus H1: µ6= 8
Para se testar as hip´oteses formuladas ´e necess´ario recorrer ao estimador
pontual deµ, constru´ıdo a partir de uma amostra aleat´oria na popula¸c˜ao
em estudo.
Vamos considerar, por exemplo, uma a.a. (X1, . . . , X10), e a amostra
concreta com 10 observa¸c˜oes, (x1, . . . , x10).
Comoµ ´e o valor m´edio da popula¸c˜ao faz sentido decidir com base na
Para definir a regra de decis˜ao, que consiste em rejeitar ou n˜ao
rejeitar a hip´otese nula, precisamos de encontrar um valor (ou
valores), o chamado ponto ou valor cr´ıtico, que nos auxilia nessa decis˜ao.
No Exemplo 8.1, dever-se rejeitar o valor 8 se a m´edia da amostra
(¯x ) estiver “longe” de 8 e n˜ao rejeitar H0se ¯x estiver “pr´oxima” de
8.
¯ x
8− c 8 8 + c
b
regi˜ao cr´ıtica regi˜ao cr´ıtica
“Aceitar” H1 “Aceitar” H1 Rejeitar H0 Rejeitar H0 regi˜ao de aceita¸c˜ao “Aceitar” H0 N˜ao rejeitar H0 Regi˜ao cr´ıtica (RC ): ¯x < 8− c ou ¯x > 8 + c (⇔ |¯x − 8| > c) Valores cr´ıticos: s˜ao os pontos de fronteira (8− c e 8 + c).
8.1 (cont.)
Mas quando se toma a decis˜ao podemos cometer dois tipos de erro: rejeitar uma hip´otese verdadeira (erro tipo I ou de 1.aesp´ecie) ou n˜ao rejeitar uma hip´otese falsa (erro tipo II ou de 2.aesp´ecie). A tabela seguinte resume as diferentes possibilidades associadas `a decis˜ao:
Tipos de erro:
Situa¸c˜ao real mas desconhecida: Decis˜ao: H0´e verdadeira H0´e falsa N˜ao Rejeitar H0 decis˜ao correcta erro do tipo II
Rejeitar H0 erro do tipo I decis˜ao correcta
Probabilidades dos erros:
α = P(erro do tipo I) = P(rejeitar H0|H0´e verdadeira) β = P(erro do tipo II) = P(N˜ao Rejeitar H0|H0´e falsa) = = P(N˜ao Rejeitar H0|H1´e verdadeira)
Voltando ao exemplo, vamos admitir que se fixava c = 0.5 e que σ = 1 e n = 10.
A regi˜ao cr´ıtica ´e|¯x − 8| > 0.5.
Supondo que X∼ N(µ, 1) ent˜ao ¯X ∼ N
µ, 1 10 , α = P | ¯X− 8| > 0.5|H0´e verd. = 1 − P | ¯X− 8| ≤ 0.5|µ = 8 = = 1− P 7.5 ≤ ¯X ≤ 8.5|µ = 8 = 1 − Φ 8.5√− 8 0.1 − Φ 7.5√− 8 0.1 = 0.1142
8.1 (cont.)
Representa¸c˜ao gr´afica de α (n = 10 e c = 0.5) ¯ x 8− c 8 8 + c b A1 A2regi˜ao cr´ıtica regi˜ao cr´ıtica
¯ X|µ = 8(n = 10)
A1= A2= A α = 2A = 0.1142
Regi˜ao Cr´ıtica (RC ) ou Regi˜ao de Rejei¸c˜ao (RR): Valores da estat´ıstica que conduzem `a rejei¸c˜ao de H0.
Quanto a β, n˜ao vamos ter um ´unico valor mas uma fun¸c˜ao, ou seja, para cada µ de H1podemos calcular um valor β(µ). Por exemplo, para µ = 9:
β(9) = P (N˜ao Rejeitar H0|µ = 9) = P 7.5 ≤ ¯X ≤ 8.5|µ = 9 = = Φ 8.5 − 9√ 0.1 − Φ 7.5 − 9√ 0.1 = Φ(−1.58) − Φ(−4.74) = 0.0571 ou para µ = 10 β(10) = P (N˜ao Rejeitar H0|µ = 10) = P 7.5 ≤ ¯X ≤ 8.5|µ = 10 = = Φ 8.5 − 10√ 0.1 − Φ 7.5 − 10√ 0.1 = Φ(−4.74) − Φ(−7.91) ' 10−6
8.1 (cont.)
´
E mais f´acil controlar α do que controlar β (que depende de µ em H1). Logo: rejeitar H0´e uma conclus˜ao “forte” (porque o erro que se pode cometer ao rejeitar H0est´a bem controlado).
n˜ao rejeitar H0´e uma conclus˜ao “fraca” (porque o erro que se pode cometer ao n˜ao rejeitar H0n˜ao est´a bem controlado). Em vez de dizer “n˜ao se rejeita H0” ´e prefer´ıvel dizer que “n˜ao h´a evidˆencia suficiente para rejeitar H0”.
Como decidir entre alternativa unilateral ou bilateral? I H0: µ = 8 versus H1: µ > 8
Regi˜ao cr´ıtica: ¯X > 8 + c
Ponto de vista do fabricante! (quando rejeitar H0p´ara a produ¸c˜ao para afinar a m´aquina)
II H0: µ = 8 versus H1: µ < 8 Regi˜ao cr´ıtica: ¯X < 8 − c
Ponto de vista do consumidor! (quando rejeitar H0n˜ao aceita a encomenda)
III H0: µ = 8 versus H1: µ 6= 8
Regi˜ao cr´ıtica: ¯X < 8 − c ou ¯X > 8 + c Compromisso entre os dois!
Procedimento geral dos testes de hip´
oteses (com α fixo)
1. Pelo contexto do problema identificar o parˆametro de interesse e formular as hip´oteses H0e H1;
2. N´ıvel de significˆancia fixo: α = P(rejectar H0|H0´e verd.), usualmente fixa-se α em 0.01, 0.05 ou 0.1;
2. Escolher uma vari´avel fulcral T (a mesma dos intervalos de confian¸ca) e avaliar a vari´avel fulcral sob H0 =⇒ Estat´ıstica de Teste: T |H0= T0; 4. Recolher uma amostra e calcular o valor observado da estat´ıstica de teste:
t0;
5. Decidir sobre a rejei¸c˜ao ou n˜ao de H0: se t0∈ RCα ent˜ao rejeita-se H0e se t0∈ RC/ αent˜ao n˜ao se rejeita H0.
Vamos prosseguir no mesmo contexto do Exemplo 8.1:
Exemplo: X ´e a v.a. que representa o peso de um pacote de a¸c´ucar. Vamos supor que X ∼ N(µ, 1). A m´aquina est´a afinada quando µ = 8. Numa amostra de 25 pacotes (recolhida ao acaso) observou-se ¯x = 8.5. Queremos avaliar, ao n´ıvel de significˆancia de 5%, se a m´aquina continua afinada. Hip´oteses: H0: µ = 8 versus H1: µ 6= 8
Vari´avel Fulcral T = Z = X − µ¯
1/√25 ∼ N(0, 1) Estat´ıstica de teste Z0 =
¯ X − 8
8.1 (cont.)
Exemplo (cont.):
Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α = 0.05: Rejeitamos H0se |Z0| > a e P(|Z0| > a) = α = 0.05
⇒ a = Φ−1(0.975) = 1.96. Assim, a regi˜ao cr´ıtica ´e: RC0.05= ]−∞, −1.96] ∪ [1.96, +∞[ (bilateral) Decis˜ao:
Com ¯x = 8.5 obt´em-se z0 = 8.5 − 8
1/√25 = 2.5. Como z0> 1.96 rejeita-se H0, ou seja, existe evidˆencia (ao n´ıvel de significˆancia considerado) de que a m´aquina est´a desafinada.
Alternativas unilaterais:
I Se fosse H0: µ = µ0versus H1: µ > µ0 Estat´ıstica de teste: a mesma
Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα= ¯ x : z0= ¯ x − 8 1/√25 > Φ −1 (1 − α) (unilateral superior) z0 a′ 1− α α
8.1 (cont.)
Alternativas unilaterais:
II Se fosse H0: µ = µ0versus H1: µ < µ0 Estat´ıstica de teste: a mesma
Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα= ¯ x : z0= ¯ x − 8 1/√25< Φ −1 (α) (unilateral inferior) z0 −a′ 1− α α
Outro m´etodo de decis˜ao: valor-p
Em vez de se fixar o n´ıvel de significˆancia, α, determinar a regi˜ao cr´ıtica e, em seguida, verificar se o valor observado pertence `a regi˜ao cr´ıtica, pode olhar-se directamente para o valor observado da estat´ıstica de teste e determinar para que n´ıvel de significˆancia a decis˜ao muda.
Defini¸c˜ao: Dado o valor observado da estat´ıstica de teste, o valor-p (p-value) ´e o menor n´ıvel de significˆancia que levaria `a rejei¸c˜ao da hip´otese nula H0. Calculo do valor − p do teste:
Teste unilateral `a direita: valor − p = P(T0> t0) Teste unilateral `a esquerda: valor − p = P(T0< t0) Teste bilateral: valor − p = 2 min{P(T0< t0), P(T0> t0)}
Decis˜ao: rejeitar H0para valores de α ≥ valor − p; n˜ao rejeitar H0para valores de α < valor − p.
8.1 (cont.)
Rela¸c˜ao entre intervalos de confian¸ca e testes de hip´oteses:
Dado um parˆametro desconhecido θ, um I.C. a 100 × (1 − α) para θ = [l , u], baseado numa dada amostra, (x1, . . . , xn), e obtido a partir de uma certa v.a. fulcral, ent˜ao a mesma amostra leva `a rejei¸c˜ao de
H0: θ = θ0 versus H1: θ 6= θ0
ao n´ıvel de significˆancia α se e s´o se θ0∈ [l , u] ou `/ a n˜ao rejei¸c˜ao de H0 se e s´o se θ0∈ [l , u].
Nota: ´e necess´ario que a v.a. fulcral e a estat´ıstica de teste sejam da mesma forma.
dessa estat´ıstica com base numa amostra, de dimens˜ao n, seleccionada ao acaso da popula¸c˜ao em estudo.
Trˆes m´etodos para a realiza¸c˜ao de testes hip´oteses param´etricos, ao n´ıvel de significˆancia α:
1. Baseando-se na constru¸c˜ao da regi˜ao cr´ıtica RCα: Rejeitar H0se o valor t0∈ RCα
N˜ao Rejeitar H0se o valor t0∈ RC/ α; 2. Determinando o valor − p:
Rejeitar H0se valor − p < α N˜ao Rejeitar H0se valor − p > α;
3. Atrav´es de intervalo de confian¸ca a (1 − α) × 100% (constru´ıdo com v.a. fulcral da mesma forma que a estat´ıstica de teste):
Rejeitar H0se o valor do parˆametro especificado em H0n˜ao pertencer ao intervalo de confian¸ca
8.2 Testes de hip´
oteses para a m´
edia de uma popula¸c˜
ao
normal
Tal como no cap´ıtulo 7 estuda-se primeiro o caso em que a variˆancia ´e conhecida. Assim, considere-se uma popula¸c˜ao X tal que:
E (X ) = µ (desconhecido) V (X ) = σ2 (conhecida)
Seja (X1, . . . , Xn) uma a.a. de X com dimens˜ao n e ˆµ = ¯X o estimador pontual de µ.
Admite-se que X ∼ N(µ, σ2) ou X tem outra distribui¸c˜ao qualquer mas n ´e elevado
Teste de H0: µ = µ0versus H1: µ 6= µ0 Sabemos j´a que, quando H0´e verdadeira
¯ X ∼ N µ0, σ2 n ou X¯∼ Na µ0, σ2 n
Em vez de trabalhar directamente com ¯X , ´e conveniente estandardizar e usar como estat´ıstica de teste:
Z0 = ¯ X − µ0
σ/√n
Quando H0´e verdadeira Z0∼ N(0, 1). Ent˜ao se a hip´otese alternativa for bilateral, a regi˜ao cr´ıtica deve ser |Z0| > a, pelo que α = P(|Z0| > a):
z0 −a a 1− α α 2 α 2 P(Z0> a) = α 2 ⇔ a = Φ −1 1 −α 2
8.2 (cont.)
Dada uma amostra concreta, calcula-se o o valor observado da estat´ıstica de teste z0 = ¯ x − µ0 σ/√n Ent˜ao rejeita-se H0se z0< −a ou z0> a e n˜ao se rejeita H0se −a ≤ z0≤ a
Notar que estas regras podem ser expressas em termos de ¯x : rejeita-se H0se ¯x < µ0− a σ √ n ou ¯x > µ0+ a σ √ n e n˜ao se rejeita H0se µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n
O exemplo que abordamos anteriormente, funcionamento da m´aquina de encher pacotes de a¸c´ucar, descreveu um teste de hip´oteses param´etrico para o valor m´edio de uma v.a. normal com variˆancia conhecida.
Para esse exemplo, qual ´e o valor-p do teste bilateral? Valor observado da estat´ıstica: z0= 2.5, logo
valor − p = 2 min(P(Z0< 2.5), P(Z0> 2.5) = 2P(Z0> 2.5) = 2(1 − Φ(2.5)) = 0.0124.
Rejeita-se H0para α > valor − p = 0.0124 N˜ao se rejeita-se H0para α < valor − p = 0.0124
z0 −2.5 2.5 1− valor-p valor-p 2 valor-p 2 .
8.2 (cont.)
Usando a rela¸c˜ao entre intervalos de confian¸ca e testes de hip´oteses: aplica¸c˜ao para o teste que estamos a estudar (teste para a m´edia com variˆancia conhecida, H0: µ = µ0versus H1: µ 6= µ0):
N˜ao se rejeita H0, ao n´ıvel de significˆancia α, se e s´o se |z0| ≤ a ⇔ ¯ x − µ0 σ/√n ≤ a ⇔ µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n ⇔ ⇔ x − a¯ √σ n ≤ µ0≤ ¯x + a σ √ n ⇔ µ0∈ IC100×(1−α)%(µ) Exemplo (cont.): n = 25, ¯x = 8.5, σ = 1, γ = (1 − α) = 95% (α = 5%) ⇒ a = 1.96 IC95%(µ) = h 8.5 − 1.96 ×√1 25; 8.5 + 1.96 × 1 √ 25 i = [8.108; 8.892]. como µ0= 8 n˜ao pertence ao I.C. a 95%, rejeita-se H0(contra H1: µ 6= 8) ao n´ıvel de significˆancia α = 5%.
Testes para a m´edia com variˆancia desconhecida:
O teste que acab´amos de estudar ´e aplic´avel com σ2desconhecida (substitu´ıda por S2) desde que a dimens˜ao da amostra seja grande (n ≥ 30).
Ou seja, usa-se a estat´ıstica Z0 =
¯ X − µ0
S /√n
a qual tem distribui¸c˜ao aproximadamente N(0, 1) sob H0, seja qual for a distribui¸c˜ao da popula¸c˜ao, desde que n seja elevado (a aproxima¸c˜ao ´e razo´avel para n ≥ 30).
8.2 (cont.)
Testes para a m´edia com variˆancia desconhecida (cont.):
Se n n˜ao for elevado (n < 30) mas X ∼ N(µ, σ2) ent˜ao a estat´ıstica anterior ainda pode ser utilizada, sabendo-se que a distribui¸c˜ao sob H0´e a distribui¸c˜ao t-Student com n − 1 graus de liberdade. Ou seja, a estat´ıstica do teste ´e T0 = ¯ X − µ0 S /√n e, quando H0´e verdadeira, T0∼ tn−1.
Trata-se ent˜ao de um teste em tudo semelhante ao caso com variˆancia conhecida que foi estudado, excepto que os pontos cr´ıticos s˜ao calculados com recurso a Ft−1n−1 (em vez de Φ
−1 ).
Nota: Para os testes em que a estat´ıstica de teste tem distribui¸c˜ao normal o valor − p ´e f´acil de determinar. Para as estat´ısticas com distribui¸c˜ao t ou qui-quadrado esse valor s´o pode ser obtido usando um programa de computador ou em certas calculadoras. Recorrendo `as tabelas o melhor que se consegue ´e obter um intervalo que cont´em (de certeza) o valor − p.
Exemplo: Determina¸c˜ao da constante de acidez do ´acido orto-hidroxibenz´ oi-co. O valor tabelado ´e 2.81. Queremos saber se os valores determinados experimentalmente (vari´aveis de experiˆencia para experiˆencia devido a facto-res n˜ao control´aveis/erro experimental) est˜ao ou n˜ao de acordo com o valor tabelado. Ou seja, em termos de testes de hip´oteses e sendo Y a v.a. que representa um valor da constante determinado experimentalmente, queremos testar, admitindo que Y ∼ N(µY, σ2Y), se
H0: µY = 2.81 versus H1: µY 6= 2.81
Temos as seguintes 5 observa¸c˜oes (que podem ser consideradas como obtidas por amostragem aleat´oria):
y1= 3.0935 y2= 3.0894 y3= 3.1111 y4= 3.1113 y5= 3.1262 para as quais se obt´em: n = 5, y = 3.1063,¯ sy = 0.014946
8.2 (cont.)
Estat´ıstica do teste: T0 = ¯ Y − 2.81
S /√5 (se H0 for verdadeira T0∼ t4) Valor observado da estat´ıstica de teste: t0 =
3.1063 − 2.81
0.014946/√5 = 44.33 Determina¸c˜ao do valor-p:
(Tabelas) o percentil mais elevado tabelado para a distribui¸c˜ao t4 ´e Ft−14 (0.9995) = 8.61, o que corresponderia a um n´ıvel de significˆancia de
α = 2 × (1 − 0.9995) = 0.001 = 0.1%. Como 44.33 8.61 conclui-se que valor-p 0.001. (Em R) 2*(1-pt(44.33,4)) → 1.548419e-06 t0 F−1(0.9995) = 8.61 0.9995 0.0005 b
Nesta situa¸c˜ao pretende-se comparar duas popula¸c˜oes (m´etodos, ex-periˆencias, materiais, etc.) atrav´es da realiza¸c˜ao de um teste de hip´oteses relativo `a igualdade entre os valores esperados das duas popula¸c˜oes, ou a um valor espec´ıfico da diferen¸ca entre esses valores esperados.
Nota¸c˜ao:
X1representa a popula¸c˜ao 1, com E (X1) = µ1e V (X1) = σ21 X2representa a popula¸c˜ao 2, com E (X2) = µ2e V (X2) = σ22 X1q X2
(X11, X12, . . . X1n1) ´e uma a.a. da pop. 1, com m´edia ¯X1e variˆancia S
2 1
(X21, X22, . . . X2n2) ´e uma a.a. da pop. 2, com m´edia ¯X2e variˆancia S
2 2
8.3 (cont.)
Pretende-se ent˜ao testarH0: µ1= µ2 versus uma das alternativas
H1: µ16= µ2 ou H1: µ1> µ2 ou H1: µ1< µ2 A partir da vari´avel fulcral:
Z = ( ¯X1− ¯qX2) − (µ1− µ2) σ2 1 n1 + σ2 2 n2
(ver explica¸c˜ao mais detalhada em 7.3) obt´em-se, sob H0: µ1= µ2, ⇔ µ1− µ2= 0, a estat´ıstica de teste
Z0= ¯ X1− ¯X2 q σ2 1 n1 + σ2 2 n2
Quando H0´e verdadeira: Z0 ∼ N(0, 1), se Xi ∼ N(µi, σ2i) a ∼ N(0, 1), se Xi qq e ni ≥ 30
Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α) depende de H1da seguinte forma:
1 H1: µ16= µ2 2 H1: µ1> µ2 3 H1: µ1< µ2 RCα: |Z0| > a, com a = Φ−1(1 − α/2). RCα: Z0> b, com b = Φ−1(1 − α). RCα: Z0< c, com c = Φ−1(α).
Nota: Qualquer que seja a distribui¸c˜ao das popula¸c˜oes X1e X2, se ni≥ 30 pode aplicar-se este teste com σ2
8.3 (cont.)
De igual modo se obt´em a estat´ıstica de teste para a diferen¸ca entre as m´edias de duas popula¸c˜oes normais com variˆancias desconhecidas mas supostamente iguais σ21= σ22: T0 = ¯ X1− ¯X2 Sp q 1 n1 + 1 n2 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 Quando H0´e verdadeira: T0∼ tn1+n2−2 (se Xi ∼ N(µi, σi2), σ 2 1= σ 2 2= σ 2 ) Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α) depende de H1da forma habitual:
1 H1: µ16= µ2 2 H1: µ1> µ2 3 H1: µ1< µ2 RCα: |T0| > a, com a = Ft−1(n1+n2−2)(1 − α/2). RCα: T0> b, com b = Ft−1(n1+n2−2)(1 − α). RC : T < c, com c = F−1 (α).
Exemplo: Pretende-se saber se o efeito m´edio de dois catalizadores em determi-nado processo qu´ımico pode ser considerado igual ou diferente.
Resultados das experiˆencias:
Catalizador 1: 91.50 94.18 92.18 95.39 91.79 89.07 94.72 89.21 n1= 8 Catalizador 2: 85.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75 n2= 8 Sejam X1– v.a. que representa o resultado da exp. com o cat. 1
X2– v.a. que representa o resultado da exp. com o cat. 2 Admitindo que (hip´oteses de trabalho):
• A 1.aamostra ´e uma concretiza¸c˜ao de uma a.a. de X
1∼ N(µ1, σ12); • A 2.aamostra ´e uma concretiza¸c˜ao de uma a.a. de X
2∼ N(µ2, σ22); • As duas amostras s˜ao independentes;
• σ2
8.3 (cont.)
Hip´oteses: H0: µ1= µ2 versus H1: µ16= µ2
supondo verificadas as condi¸c˜oes de utiliza¸c˜ao da estat´ıstica
T0 = ¯ X1− ¯X2 Sp q 1 n1+ 1 n2 ∼ t14 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 C´alculos: ¯x1= 92.255 x¯2= 92.733 s1= 2.39 s2= 2.98 V. obs. da estat´ıstica de teste: t0 =
92.255 − 92.733 q 7×2.392+7×2.982 14 q 1 8+ 1 8 = −0.35
Conclus˜ao: Para α = 5% vem a = Ft−114(0.975) = 2.145. Como
−2.145 < −0.35 < 2.145n˜ao se rejeitaH0ao n´ıvel de significˆancia de 5%. Tamb´em se poderia concluir que 0.6 < valor − p < 0.8, pelo que n˜ao faz sentido rejeitar H0 para nenhum dos n´ıveis de significˆancia usuais (1%,5% e 10%).
Considere-se X ∼ N(µ, σ2) popula¸c˜ao onde µ = E (X ) e σ2= Var (X ) s˜ao ambos desconhecidos. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X .
Hip´otese nula: H0: σ2= σ02.
Quando H0´e verdadeira a estat´ıstica de teste ´e: T0=
(n − 1) S2 σ2
0
∼ χ2(n−1)
Pretende-se testar H0: σ2= σ02contra uma das alternativas:
1 H1: σ26= σ2
0 (teste bilateral)
2 H1: σ2> σ02(teste unilateral superior) 3 H1: σ2< σ02(teste unilateral inferior)
Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):
1 RCα: T0< a ou T0> b, com a = F−1 χ2(n−1)(α/2) e b = F −1 χ2(n−1)(1 − α/2). 2 RCα: T0> c, com c = F−1 χ2 (n−1) (1 − α). 3 RCα: T0< d , com d = F−1 χ2 (α).
8.5 Testes de hip´
oteses para parˆ
ametros de popula¸c˜
oes n˜
ao
normais uniparam´
etricas
De forma idˆentica ao cap´ıtulo anterior (Intervalos de Confian¸ca) tamb´em aqui se vai recorrer ao Teorema do Limite Central para se efectuarem inferˆencias so-bre o parˆametro de uma popula¸c˜ao n˜ao normal. Consideram-se popula¸c˜oes cujo parˆametro pode ser estimado por uma soma (m´edia) de v.a. independentes.
Seja (X1, . . . , Xn) uma a.a. de dimens˜ao n (suficientemente grande)
proveniente da popula¸c˜ao fX(x ; θ). Se considerarmos a v.a. Sn=Pni =1Xi ent˜ao Z =Sn− E (Sn) pV (Sn) = ¯ X − E X¯ q V X¯ =X − E (X )¯q V (X ) n a ∼ N (0, 1) ,
Exemplos de aplica¸c˜ao:
Testes de hip´oteses para uma propor¸c˜ao (parˆametro p da distribui¸c˜ao de Bernoulli).
Testes de hip´oteses para o parˆametro da distribui¸c˜ao exponencial. Testes de hip´oteses para o parˆametro da distribui¸c˜ao Poisson. Outras situa¸c˜oes de distribui¸c˜oes uniparam´etricas nas quais se possa aplicar a v.a. fulcral anterior e estat´ıstica de teste associada.
De seguida exemplifica-se para as primeiras duas situa¸c˜oes (pop. Bernoulli e exponencial).
8.5 Caso I: testes de hip´
oteses para uma propor¸c˜
ao
Considere-se a popula¸c˜ao X ∼ Bernoulli (p) com p = E (X ), onde p representa a propor¸c˜ao populacional (desconhecida) de indiv´ıduos/objectos dessa popula¸c˜ao que pertencem a uma dada categoria de interesse. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X , com n grande (n ≥ 30). Recordar que o estimador pontual (de m´axima verosimilhan¸ca) de p ´e
¯ X = n P i =1 Xi n . Hip´otese nula: H0: p = p0.
Quando H0´e verdadeira a estat´ıstica de teste ´e: Z0= ¯ X − p0 q p0(1−p0) n a ∼ N(0, 1)
Pretende-se testar H0: p = p0contra uma das alternativas:
1 H1: p 6= p0 (teste bilateral)
2 H1: p > p0 (teste unilateral superior) 3 H1: p < p0 (teste unilateral inferior)
Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):
1 RCα: |Z0| > a, com a = Φ−1(1 − α/2). 2 RCα: Z0> b, com b = Φ−1(1 − α). 3 RCα: Z0< c, com c = Φ−1(α).
Decis˜ao usual.
Nota: Naturalmente que tamb´em se pode determinar o valor − p da forma usual e decidir com base no seu valor.
8.5 Caso I: testes de hip´
oteses para uma propor¸c˜
ao
Exemplo: Popula¸c˜ao de eleitores portugueses. Sondagem (aleat´oria) a 1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto o presidente do partido tinha afirmado “estou convencido que vamos obter mais de 50% dos votos”. Ser´a que, em face dos resultados da sondagem, a afirma¸c˜ao ´e razo´avel, ou n˜ao?
J´a sabemos que ˆp = 683/1200 = 0.569 (ver Cap´ıtulo 6)
Podemos testar H0: p = 0.5 contra H1: p > 0.5, e se rejeitarmos a hip´otese nula (conclus˜ao “forte”) ent˜ao a afirma¸c˜ao ´e corroborada pela sondagem.
z0= 0.569 − 0.5 r 0.5(1 − 0.5) 1200 = 4.79 valor-p = 1 − Φ(4.79) = 0.000001
Como o valor − p ´e muito baixo rejeita-se H0para os n´ıveis de significˆancia usuais, ou seja, a afirma¸c˜ao do presidente do partido ´e perfeitamente corroborada pela sondagem.
Vimos no Cap´ıtulo 7 que para uma popula¸c˜ao X ∼ Exp(λ) (E (X ) =µ = λ−1 e V (X ) =λ−2⇔ σ = λ−1) se tem Z = ¯ X− µ σ/√n = ¯ X− λ−1 λ−1/√n = √ n λ ¯X − 1 a ∼ N(0, 1)
Ent˜ao para testar H0:λ = λ0contra H1:λ6= λ0(ou H1:λ < λ0, ou
H1:λ > λ0), usa-se a estat´ıstica de teste
Z =√n λ0X¯− 1
Quando H0´e verdadeira, conclui-se que Z0
a
∼ N(0, 1). Para H1: λ6= λ0,
rejeita-se H0ao n´ıvel de significˆancia α se
z0=√n (λ0x¯− 1) < −a ou z0> a
8.6 Teste de ajustamento do qui-quadrado de Pearson
At´e agora os testes de hip´oteses estudados diziam respeito a parˆametros, mas, como foi referido no in´ıcio deste cap´ıtulo, tamb´em se podem efectuar testes a hip´oteses sobre a pr´opria forma da distribui¸c˜ao de uma dada popula¸c˜ao. Este teste ´e um exemplo disso.Este teste tem como objectivo verificar a hip´otese de que um conjunto de observa¸c˜oes segue uma determinada distribui¸c˜ao (discreta ou cont´ınua, com ou sem parˆametros desconhecidos).
Exemplo: O lan¸camento de um dado 1000 vezes conduziu `a seguinte tabela de frequˆencias observadas (oi)
i oi 1 174 2 174 3 154 4 179 5 154 6 165 Total 1000
Ser´a que os resultados obtidos sustentam a hip´otese de que “o dado ´e perfeito”?
Seja X a v.a. que representa o n´umero de pontos obtido num lan¸camento.
A hip´otese de interesse pode ser escrita como
H0: P(X = i ) = pi0= 1 6, i = 1, . . . , 6 ou H0: X ∼ Unif .Disc.(1, . . . , 6) contra H1: ∃i: P(X = i ) = p0i 6= 1 6 ou H1: X ∼/ Unif .Disc.(1, . . . , 6) Quando H0´e verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral), que designamos por pi0, e o valor esperado para o n´umero de observa¸c˜oes em cada classe (frequˆencias esperadas, sob H0),
Ei= n p0i
onde n ´e a dimens˜ao da amostra (neste caso n = 1000).
Note-se que a v.a. que indica o n´umero de observa¸c˜oes em n que pertencem a cada classe tem distribui¸c˜ao Bin(n, pi) e sob H0tem-se pi = pi0.
8.6 (cont.)
Vamos acrescentar essas duas colunas `a tabela anterior:
i oi pi0 Ei= n pi0= 1000× p 0 i 1 174 1/6 166.67 2 174 1/6 166.67 3 154 1/6 166.67 4 179 1/6 166.67 5 154 1/6 166.67 6 165 1/6 166.67 Total 1000 1 ≈ 1000.0
Mesmo quando H0 ´e verdadeira n˜ao estamos `a espera que as colunas
oi e Ei coincidam (mas os valores devem ser pr´oximos). Pode-se medir
o afastamento entre oi e Ei para saber at´e que ponto ´e razo´avel que
H0 seja verdadeira. Se o afastamento n˜ao for grande ´e razo´avel n˜ao
Pode mostrar-se que, quando H0´e verdadeira, a estat´ıtica que ´e usada
para medir o afastamento entre oi e Ei ´e (estat´ıstica de teste)
T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k−β−1)
onde k representa o n´umero de classes (no exemplo, 6) eβ o n´umero de
parˆametros estimados (no exemplo, 0).
Deve rejeitar-se H0se o valor observado de T0 for muito elevado, ou seja,
aregi˜ao cr´ıtica do teste, para o n´ıvel de significˆanciaα, ´e: RCα: T0> c, com c = Fχ−12
(k−β−1) (1− α)
8.6 Teste do qui-quadrado de ajustamento
Tabela incluindo os c´alculos para obter o valor observado de T0:
i oi pi0 Ei = n p0i (oi− Ei)2 Ei 1 174 1/6 166.67 0.322 2 174 1/6 166.67 0.322 3 154 1/6 166.67 0.963 4 179 1/6 166.67 0.912 5 154 1/6 166.67 0.963 6 165 1/6 166.67 0.017 Total 1000 1 1000.02 3.499 (= t0)
Se fixarmosα = 0.05, com k− β − 1 = 5, obt´em-se
c = Fχ−12
5 (0.95) = 11.07.
Uma vez que t0= 3.499 < 11.07, n˜ao h´a evidˆencia para rejeitar H0ao
n´ıvel de sig. de 5%.
valor-p = P(T0> 3.499) = 0.6235 (R); 0.6 < valor − p < 0.7
Vejamos como proceder num caso geral:
Considere-se X uma popula¸c˜ao com fun¸c˜ao de distribui¸c˜ao F desconhecida. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X , com n grande.
Hip´otese nula: H0: X tem distribui¸c˜ao F ;
Hip´otese alternativa: H1: X n˜ao tem distribui¸c˜ao F ;
A ideia que se utiliza para se desenvolver o teste de ajustamento ´e essencialmente a seguinte:
1. Considera-se uma parti¸c˜ao, C1, C2, · · · , Ck, do conjunto dos valores poss´ıveis de X , RX:
i) Ci∩ Cj= ∅, ∀i 6= j , i , j = 1, 2, · · · , k; ii) ∪k
i =1Ci = RX.
No caso de vari´aveis aleat´orias cont´ınuas ou discretas com muitos valores distintos pode-se usar as regras para a constru¸c˜ao de histogramas e, em geral, classes de amplitude constante.
8.6 Teste do qui-quadrado de ajustamento
2. Como vimos no exemplo anterior comparam-se as frequˆencias absolutas na amostra aleat´oria (Oi) com as frequˆencias absolutas esperadas quando H0´e verdadeira (Ei) e mede-se o afastamento entre Oi e Ei. Em seguida verifica-se se esse afastamento ´e razo´avel para H0verdadeira.
Objectivo: Testar se X ∼ F , isto ´e se as probabilidades desconhecidas:
pi= P(X ∈ Ci)
s˜ao iguais `as probabilidades
pi0= P(X ∈ Ci|H0) = P(X ∈ Ci|X ∼ F )
As hip´oteses anteriores podem agora reformular-se do seguinte modo: Hip´oteses: H0: pi = p0i, ∀i = 1, 2, · · · , k vs H1: ∃i : pi 6= p0i Quando H0´e verdadeira a estat´ıstica de teste ´e:
T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k−β−1), onde
Oi : frequˆencias absolutas na amostra aleat´oria
Ei : frequˆencias absolutas esperadas sob H0(ou estimador, quando FX(x ) depende de parˆametros desconhecidos), Ei = npi0(ou ˆEi = niPˆi0, com ˆPi0 estimador de p0i);
k: node classes;
β: node parˆametros a estimar. Observa¸c˜oes:
Oi ´e a v.a. que indica o n´umero de observa¸c˜oes (frequˆencia absoluta) na classe Ci em n observa¸c˜oes, logo Oi∼ Binomial (n, pi).
8.6 Teste do qui-quadrado de ajustamento
Decis˜ao:
Com base na regi˜ao cr´ıtica (ao n´ıvel de significˆanciaα):
RCα= [Fχ−12 (k−β−1)
(1 − α) , +∞[.
Decis˜ao: sendo t0=
k
P
i =1 (oi−Ei)2
Ei o valor observado da estat´ıstica de
teste ent˜ao h´a evidˆencia para rejeitar H0se t0∈ RCα ao n´ıvel de
significˆanciaα. Com base no valor-p:
valor− p = P(T0> t0) = 1− FT0(t0).
Rejeita-se H0 para n´ıveis de significˆancia> valor− p.
Aten¸c˜ao: Antes de se calcular o valor observado da estat´ıstica de teste
deve averiguar-se se todos os valores de Ei ≥ 1 e pelo menos 80% dos
Ei ≥ 5, se isto n˜ao ocorrer ´e necess´ario agrupar classes.
Exemplo: Pensa-se que o n´umero de defeitos por circuito, num certo tipo de circuitos, deve seguir uma distribui¸c˜ao de Poisson. De uma amostra (escolhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes
N.ode def. oi 0 32 1 15 2 9 3 4 Total 60
X - v.a. que representa o n.o de defeitos num circuito
8.6 (cont.)
O parˆametro λ ´e desconhecido pelo que deve ser estimado (pelo m´etodo da m´axima verosimilhan¸ca). Sabe-se que para a distribui¸c˜ao de Poisson
ˆ λ = ¯x = 0 × 32 + 1 × 15 + 2 × 9 + 3 × 4 60 = 0.75 donde ˆ p10= bP(X = 0|H0) = e−0.750.750 0! = 0.472 Eˆ1= 28.32 ˆ p20= bP(X = 1|H0) = e−0.750.751 1! = 0.354 ˆ E2= 21.24 ˆ p30= bP(X = 2|H0) = e−0.750.752 2! = 0.133 ˆ E3= 7.98 ˆ p40= bP(X = 3|H0) = 0.033 Eˆ4= 1.98 ˆ p50= bP(X ≥ 4|H0) = 1 − ( ˆp01+ ˆp 0 2+ ˆp 0 3+ ˆp 0 4) = 0.008 Eˆ5= 0.48 Deve verificar-se se todos os ˆEi ≥ 1 e pelo menos 80% dos ˆEi ≥ 5. Como n˜ao se verificam as condi¸c˜oes ´e necess´ario agrupar classes.
Obt´em-se ent˜ao a tabela final: Classes N.ode def. o i pˆ0i Eˆi = n ˆpi0 (oi− ˆEi)2 ˆ Ei C1 0 32 0.472 28.32 0.478 C2 1 15 0.354 21.24 1.833 C3 ≥2 13 0.174 10.44 0.628 3 ∪ i =1Ci = N0 60 1.000 60.00 2.939 (= t0) Temosk = 3eβ = 1(estimou-se o parˆametro λ).
Assim, os graus de liberdade da distribui¸c˜ao aproximada de T0´e: k − β − 1 = 3 − 1 − 1 = 1, e como α = 0.05 ⇒ c = F−1
χ2 1
(0.95) = 3.841. Portanto, RC0.05= [3.841, +∞[. Como 2.939 < 3.841, n˜ao se rejeita H0ao n´ıvel de significˆancia de 5%.