• Nenhum resultado encontrado

Conceição Amado, Ana M. Pires, M. Rosário Oliveira e Isabel M. Rodrigues

N/A
N/A
Protected

Academic year: 2021

Share "Conceição Amado, Ana M. Pires, M. Rosário Oliveira e Isabel M. Rodrigues"

Copied!
56
0
0

Texto

(1)

Cap´ıtulo 8 - Testes de Hip´

oteses

Concei¸c˜ao Amado, Ana M. Pires, M. Ros´ario Oliveira e Isabel M.

(2)

Nos cap´ıtulos anteriores vimos como estimar um parˆametro desconhecido a partir de uma amostra (obtendo estimativas pontuais e intervalos de

confian¸ca para o parˆametro).

Muitas situa¸c˜oes pr´aticas tˆem uma natureza diferente, requerendo que

em fun¸c˜ao dos valores observados se tomem decis˜oes acerca dos

parˆametros (ou de outros aspectos) da popula¸c˜ao.

Exemplo 8.1:

M´aquina de encher pacotes de a¸c´ucar. O peso de cada pacote deve ser

≈ 8 g (isto ´e, µ = 8).

Ser´a poss´ıvel concluir a partir da medi¸c˜ao do peso de um certo n´umero

(3)

8.1 (cont.)

Defini¸c˜ao: Uma hip´otese estat´ıstica ´e uma afirma¸c˜ao acerca de

parˆametros (testes param´etricos) ou acerca da distribui¸c˜ao (testes de

ajustamento) de uma ou mais popula¸c˜oes.

Vamos estudar em primeiro lugar os testes param´etricos.

Exemplo 8.1 (cont.):

Temos duas hip´oteses, a m´aquina funciona correctamente (µ = 8) ou a

m´aquina n˜ao funciona correctamente (µ6= 8), que se representam e

denominam assim

H0: µ = 8 versus H1: µ6= 8

(4)

Suponha que θ0´e um valor que se pretende testar para o parˆametro θ de uma determinada popula¸c˜ao FX(x ; θ), θ ∈ Θ as hip´oteses param´etricas s˜ao, genericamente:

H0: θ ∈ Θ0 versus H1: θ ∈ Θ1 (hip´otese nula) (hip´otese alternativa)

Temos que ter sempre:

H0∪ H1= Θ (todos os valores poss´ıveis do parˆametro Θ = Θ0∪ Θ1) H0∩ H1= ∅

As hip´oteses em teste podem ser:

Hip´otese simples: ´e especificado s´o um valor para o parˆametro. (Ex: θ = 8)

Hip´otese composta: ´e especificado mais de um valor para o parˆametro. (Ex: θ 6= 8; θ ≥ 8 )

(5)

8.1 (cont.)

Podemos estar interessados nos seguintes conjuntos de hip´oteses:

Quando H0: θ = θ0 (hip´otese nula simples)

a hip´otese alternativa (H1) pode ser uma de: H1: θ = θ1 hip´otese alternativa simples

H1: θ 6= θ0 hip´otese alternativa composta (teste bilateral) H1: θ > θ0 hip´otese alternativa composta (unilateral superior) H1: θ < θ0 hip´otese alternativa composta (unilateral inferior)

(6)

Quando H0: θ≤ θ0 hip´otese nula composta

a hip´otese alternativa dever´a ser:

H1: θ > θ0 hip´otese alternativa unilateral inferior

Quando H0: θ≥ θ0 hip´otese nula composta

a hip´otese alternativa deve ser:

H1: θ < θ0 hip´otese alternativa unilateral inferior

Defini¸c˜ao: Teste de hip´oteses´e um procedimento estat´ıstico que, baseado

(7)

8.1 (cont.)

Exemplo 8.1 (cont.): Defina-se a v.a. X que representa o peso do

pacote de a¸c´ucar, com E (X ) =µ e V (X ) = σ2. Pretende-se testar

H0: µ = 8 versus H1: µ6= 8

Para se testar as hip´oteses formuladas ´e necess´ario recorrer ao estimador

pontual deµ, constru´ıdo a partir de uma amostra aleat´oria na popula¸c˜ao

em estudo.

Vamos considerar, por exemplo, uma a.a. (X1, . . . , X10), e a amostra

concreta com 10 observa¸c˜oes, (x1, . . . , x10).

Comoµ ´e o valor m´edio da popula¸c˜ao faz sentido decidir com base na

(8)

Para definir a regra de decis˜ao, que consiste em rejeitar ou n˜ao

rejeitar a hip´otese nula, precisamos de encontrar um valor (ou

valores), o chamado ponto ou valor cr´ıtico, que nos auxilia nessa decis˜ao.

No Exemplo 8.1, dever-se rejeitar o valor 8 se a m´edia da amostra

(¯x ) estiver “longe” de 8 e n˜ao rejeitar H0se ¯x estiver “pr´oxima” de

8.

¯ x

8− c 8 8 + c

b

regi˜ao cr´ıtica regi˜ao cr´ıtica

“Aceitar” H1 “Aceitar” H1 Rejeitar H0 Rejeitar H0 regi˜ao de aceita¸c˜ao “Aceitar” H0 N˜ao rejeitar H0 Regi˜ao cr´ıtica (RC ): ¯x < 8− c ou ¯x > 8 + c (⇔ |¯x − 8| > c) Valores cr´ıticos: s˜ao os pontos de fronteira (8− c e 8 + c).

(9)

8.1 (cont.)

Mas quando se toma a decis˜ao podemos cometer dois tipos de erro: rejeitar uma hip´otese verdadeira (erro tipo I ou de 1.aesp´ecie) ou n˜ao rejeitar uma hip´otese falsa (erro tipo II ou de 2.aesp´ecie). A tabela seguinte resume as diferentes possibilidades associadas `a decis˜ao:

Tipos de erro:

Situa¸c˜ao real mas desconhecida: Decis˜ao: H0´e verdadeira H0´e falsa N˜ao Rejeitar H0 decis˜ao correcta erro do tipo II

Rejeitar H0 erro do tipo I decis˜ao correcta

Probabilidades dos erros:

α = P(erro do tipo I) = P(rejeitar H0|H0´e verdadeira) β = P(erro do tipo II) = P(N˜ao Rejeitar H0|H0´e falsa) = = P(N˜ao Rejeitar H0|H1´e verdadeira)

(10)

Voltando ao exemplo, vamos admitir que se fixava c = 0.5 e que σ = 1 e n = 10.

A regi˜ao cr´ıtica ´e|¯x − 8| > 0.5.

Supondo que X∼ N(µ, 1) ent˜ao ¯X ∼ N

 µ, 1 10  , α = P | ¯X− 8| > 0.5|H0´e verd. = 1 − P | ¯X− 8| ≤ 0.5|µ = 8 = = 1− P 7.5 ≤ ¯X ≤ 8.5|µ = 8 = 1 −  Φ 8.5− 8 0.1  − Φ 7.5√− 8 0.1  = 0.1142

(11)

8.1 (cont.)

Representa¸c˜ao gr´afica de α (n = 10 e c = 0.5) ¯ x 8− c 8 8 + c b A1 A2

regi˜ao cr´ıtica regi˜ao cr´ıtica

¯ X|µ = 8(n = 10)

A1= A2= A α = 2A = 0.1142

Regi˜ao Cr´ıtica (RC ) ou Regi˜ao de Rejei¸c˜ao (RR): Valores da estat´ıstica que conduzem `a rejei¸c˜ao de H0.

(12)

Quanto a β, n˜ao vamos ter um ´unico valor mas uma fun¸c˜ao, ou seja, para cada µ de H1podemos calcular um valor β(µ). Por exemplo, para µ = 9:

β(9) = P (N˜ao Rejeitar H0|µ = 9) = P 7.5 ≤ ¯X ≤ 8.5|µ = 9 = = Φ 8.5 − 9√ 0.1  − Φ 7.5 − 9√ 0.1  = Φ(−1.58) − Φ(−4.74) = 0.0571 ou para µ = 10 β(10) = P (N˜ao Rejeitar H0|µ = 10) = P 7.5 ≤ ¯X ≤ 8.5|µ = 10 = = Φ 8.5 − 10√ 0.1  − Φ 7.5 − 10√ 0.1  = Φ(−4.74) − Φ(−7.91) ' 10−6

(13)

8.1 (cont.)

´

E mais f´acil controlar α do que controlar β (que depende de µ em H1). Logo: rejeitar H0´e uma conclus˜ao “forte” (porque o erro que se pode cometer ao rejeitar H0est´a bem controlado).

n˜ao rejeitar H0´e uma conclus˜ao “fraca” (porque o erro que se pode cometer ao n˜ao rejeitar H0n˜ao est´a bem controlado). Em vez de dizer “n˜ao se rejeita H0” ´e prefer´ıvel dizer que “n˜ao h´a evidˆencia suficiente para rejeitar H0”.

(14)

Como decidir entre alternativa unilateral ou bilateral? I H0: µ = 8 versus H1: µ > 8

Regi˜ao cr´ıtica: ¯X > 8 + c

Ponto de vista do fabricante! (quando rejeitar H0p´ara a produ¸c˜ao para afinar a m´aquina)

II H0: µ = 8 versus H1: µ < 8 Regi˜ao cr´ıtica: ¯X < 8 − c

Ponto de vista do consumidor! (quando rejeitar H0n˜ao aceita a encomenda)

III H0: µ = 8 versus H1: µ 6= 8

Regi˜ao cr´ıtica: ¯X < 8 − c ou ¯X > 8 + c Compromisso entre os dois!

(15)

Procedimento geral dos testes de hip´

oteses (com α fixo)

1. Pelo contexto do problema identificar o parˆametro de interesse e formular as hip´oteses H0e H1;

2. N´ıvel de significˆancia fixo: α = P(rejectar H0|H0´e verd.), usualmente fixa-se α em 0.01, 0.05 ou 0.1;

2. Escolher uma vari´avel fulcral T (a mesma dos intervalos de confian¸ca) e avaliar a vari´avel fulcral sob H0 =⇒ Estat´ıstica de Teste: T |H0= T0; 4. Recolher uma amostra e calcular o valor observado da estat´ıstica de teste:

t0;

5. Decidir sobre a rejei¸c˜ao ou n˜ao de H0: se t0∈ RCα ent˜ao rejeita-se H0e se t0∈ RC/ αent˜ao n˜ao se rejeita H0.

(16)

Vamos prosseguir no mesmo contexto do Exemplo 8.1:

Exemplo: X ´e a v.a. que representa o peso de um pacote de a¸c´ucar. Vamos supor que X ∼ N(µ, 1). A m´aquina est´a afinada quando µ = 8. Numa amostra de 25 pacotes (recolhida ao acaso) observou-se ¯x = 8.5. Queremos avaliar, ao n´ıvel de significˆancia de 5%, se a m´aquina continua afinada. Hip´oteses: H0: µ = 8 versus H1: µ 6= 8

Vari´avel Fulcral T = Z = X − µ¯

1/√25 ∼ N(0, 1) Estat´ıstica de teste Z0 =

¯ X − 8

(17)

8.1 (cont.)

Exemplo (cont.):

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α = 0.05: Rejeitamos H0se |Z0| > a e P(|Z0| > a) = α = 0.05

⇒ a = Φ−1(0.975) = 1.96. Assim, a regi˜ao cr´ıtica ´e: RC0.05= ]−∞, −1.96] ∪ [1.96, +∞[ (bilateral) Decis˜ao:

Com ¯x = 8.5 obt´em-se z0 = 8.5 − 8

1/√25 = 2.5. Como z0> 1.96 rejeita-se H0, ou seja, existe evidˆencia (ao n´ıvel de significˆancia considerado) de que a m´aquina est´a desafinada.

(18)

Alternativas unilaterais:

I Se fosse H0: µ = µ0versus H1: µ > µ0 Estat´ıstica de teste: a mesma

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα=  ¯ x : z0= ¯ x − 8 1/√25 > Φ −1 (1 − α)  (unilateral superior) z0 a′ 1− α α

(19)

8.1 (cont.)

Alternativas unilaterais:

II Se fosse H0: µ = µ0versus H1: µ < µ0 Estat´ıstica de teste: a mesma

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα=  ¯ x : z0= ¯ x − 8 1/√25< Φ −1 (α)  (unilateral inferior) z0 −a′ 1− α α

(20)

Outro m´etodo de decis˜ao: valor-p

Em vez de se fixar o n´ıvel de significˆancia, α, determinar a regi˜ao cr´ıtica e, em seguida, verificar se o valor observado pertence `a regi˜ao cr´ıtica, pode olhar-se directamente para o valor observado da estat´ıstica de teste e determinar para que n´ıvel de significˆancia a decis˜ao muda.

Defini¸c˜ao: Dado o valor observado da estat´ıstica de teste, o valor-p (p-value) ´e o menor n´ıvel de significˆancia que levaria `a rejei¸c˜ao da hip´otese nula H0. Calculo do valor − p do teste:

Teste unilateral `a direita: valor − p = P(T0> t0) Teste unilateral `a esquerda: valor − p = P(T0< t0) Teste bilateral: valor − p = 2 min{P(T0< t0), P(T0> t0)}

Decis˜ao: rejeitar H0para valores de α ≥ valor − p; n˜ao rejeitar H0para valores de α < valor − p.

(21)

8.1 (cont.)

Rela¸c˜ao entre intervalos de confian¸ca e testes de hip´oteses:

Dado um parˆametro desconhecido θ, um I.C. a 100 × (1 − α) para θ = [l , u], baseado numa dada amostra, (x1, . . . , xn), e obtido a partir de uma certa v.a. fulcral, ent˜ao a mesma amostra leva `a rejei¸c˜ao de

H0: θ = θ0 versus H1: θ 6= θ0

ao n´ıvel de significˆancia α se e s´o se θ0∈ [l , u] ou `/ a n˜ao rejei¸c˜ao de H0 se e s´o se θ0∈ [l , u].

Nota: ´e necess´ario que a v.a. fulcral e a estat´ıstica de teste sejam da mesma forma.

(22)

dessa estat´ıstica com base numa amostra, de dimens˜ao n, seleccionada ao acaso da popula¸c˜ao em estudo.

Trˆes m´etodos para a realiza¸c˜ao de testes hip´oteses param´etricos, ao n´ıvel de significˆancia α:

1. Baseando-se na constru¸c˜ao da regi˜ao cr´ıtica RCα: Rejeitar H0se o valor t0∈ RCα

N˜ao Rejeitar H0se o valor t0∈ RC/ α; 2. Determinando o valor − p:

Rejeitar H0se valor − p < α N˜ao Rejeitar H0se valor − p > α;

3. Atrav´es de intervalo de confian¸ca a (1 − α) × 100% (constru´ıdo com v.a. fulcral da mesma forma que a estat´ıstica de teste):

Rejeitar H0se o valor do parˆametro especificado em H0n˜ao pertencer ao intervalo de confian¸ca

(23)

8.2 Testes de hip´

oteses para a m´

edia de uma popula¸c˜

ao

normal

Tal como no cap´ıtulo 7 estuda-se primeiro o caso em que a variˆancia ´e conhecida. Assim, considere-se uma popula¸c˜ao X tal que:

E (X ) = µ (desconhecido) V (X ) = σ2 (conhecida)

Seja (X1, . . . , Xn) uma a.a. de X com dimens˜ao n e ˆµ = ¯X o estimador pontual de µ.

Admite-se que X ∼ N(µ, σ2) ou X tem outra distribui¸c˜ao qualquer mas n ´e elevado

Teste de H0: µ = µ0versus H1: µ 6= µ0 Sabemos j´a que, quando H0´e verdadeira

¯ X ∼ N  µ0, σ2 n  ou X¯∼ Na  µ0, σ2 n 

(24)

Em vez de trabalhar directamente com ¯X , ´e conveniente estandardizar e usar como estat´ıstica de teste:

Z0 = ¯ X − µ0

σ/√n

Quando H0´e verdadeira Z0∼ N(0, 1). Ent˜ao se a hip´otese alternativa for bilateral, a regi˜ao cr´ıtica deve ser |Z0| > a, pelo que α = P(|Z0| > a):

z0 −a a 1− α α 2 α 2 P(Z0> a) = α 2 ⇔ a = Φ −1 1 −α 2 

(25)

8.2 (cont.)

Dada uma amostra concreta, calcula-se o o valor observado da estat´ıstica de teste z0 = ¯ x − µ0 σ/√n Ent˜ao rejeita-se H0se z0< −a ou z0> a e n˜ao se rejeita H0se −a ≤ z0≤ a

Notar que estas regras podem ser expressas em termos de ¯x : rejeita-se H0se ¯x < µ0− a σ √ n ou ¯x > µ0+ a σ √ n e n˜ao se rejeita H0se µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n

(26)

O exemplo que abordamos anteriormente, funcionamento da m´aquina de encher pacotes de a¸c´ucar, descreveu um teste de hip´oteses param´etrico para o valor m´edio de uma v.a. normal com variˆancia conhecida.

Para esse exemplo, qual ´e o valor-p do teste bilateral? Valor observado da estat´ıstica: z0= 2.5, logo

valor − p = 2 min(P(Z0< 2.5), P(Z0> 2.5) = 2P(Z0> 2.5) = 2(1 − Φ(2.5)) = 0.0124.

Rejeita-se H0para α > valor − p = 0.0124 N˜ao se rejeita-se H0para α < valor − p = 0.0124

z0 −2.5 2.5 1− valor-p valor-p 2 valor-p 2 .

(27)

8.2 (cont.)

Usando a rela¸c˜ao entre intervalos de confian¸ca e testes de hip´oteses: aplica¸c˜ao para o teste que estamos a estudar (teste para a m´edia com variˆancia conhecida, H0: µ = µ0versus H1: µ 6= µ0):

N˜ao se rejeita H0, ao n´ıvel de significˆancia α, se e s´o se |z0| ≤ a ⇔ ¯ x − µ0 σ/√n ≤ a ⇔ µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n ⇔ ⇔ x − a¯ √σ n ≤ µ0≤ ¯x + a σ √ n ⇔ µ0∈ IC100×(1−α)%(µ) Exemplo (cont.): n = 25, ¯x = 8.5, σ = 1, γ = (1 − α) = 95% (α = 5%) ⇒ a = 1.96 IC95%(µ) = h 8.5 − 1.96 ×1 25; 8.5 + 1.96 × 1 √ 25 i = [8.108; 8.892]. como µ0= 8 n˜ao pertence ao I.C. a 95%, rejeita-se H0(contra H1: µ 6= 8) ao n´ıvel de significˆancia α = 5%.

(28)

Testes para a m´edia com variˆancia desconhecida:

O teste que acab´amos de estudar ´e aplic´avel com σ2desconhecida (substitu´ıda por S2) desde que a dimens˜ao da amostra seja grande (n ≥ 30).

Ou seja, usa-se a estat´ıstica Z0 =

¯ X − µ0

S /√n

a qual tem distribui¸c˜ao aproximadamente N(0, 1) sob H0, seja qual for a distribui¸c˜ao da popula¸c˜ao, desde que n seja elevado (a aproxima¸c˜ao ´e razo´avel para n ≥ 30).

(29)

8.2 (cont.)

Testes para a m´edia com variˆancia desconhecida (cont.):

Se n n˜ao for elevado (n < 30) mas X ∼ N(µ, σ2) ent˜ao a estat´ıstica anterior ainda pode ser utilizada, sabendo-se que a distribui¸c˜ao sob H0´e a distribui¸c˜ao t-Student com n − 1 graus de liberdade. Ou seja, a estat´ıstica do teste ´e T0 = ¯ X − µ0 S /√n e, quando H0´e verdadeira, T0∼ tn−1.

Trata-se ent˜ao de um teste em tudo semelhante ao caso com variˆancia conhecida que foi estudado, excepto que os pontos cr´ıticos s˜ao calculados com recurso a Ft−1n−1 (em vez de Φ

−1 ).

Nota: Para os testes em que a estat´ıstica de teste tem distribui¸c˜ao normal o valor − p ´e f´acil de determinar. Para as estat´ısticas com distribui¸c˜ao t ou qui-quadrado esse valor s´o pode ser obtido usando um programa de computador ou em certas calculadoras. Recorrendo `as tabelas o melhor que se consegue ´e obter um intervalo que cont´em (de certeza) o valor − p.

(30)

Exemplo: Determina¸c˜ao da constante de acidez do ´acido orto-hidroxibenz´ oi-co. O valor tabelado ´e 2.81. Queremos saber se os valores determinados experimentalmente (vari´aveis de experiˆencia para experiˆencia devido a facto-res n˜ao control´aveis/erro experimental) est˜ao ou n˜ao de acordo com o valor tabelado. Ou seja, em termos de testes de hip´oteses e sendo Y a v.a. que representa um valor da constante determinado experimentalmente, queremos testar, admitindo que Y ∼ N(µY, σ2Y), se

H0: µY = 2.81 versus H1: µY 6= 2.81

Temos as seguintes 5 observa¸c˜oes (que podem ser consideradas como obtidas por amostragem aleat´oria):

y1= 3.0935 y2= 3.0894 y3= 3.1111 y4= 3.1113 y5= 3.1262 para as quais se obt´em: n = 5, y = 3.1063,¯ sy = 0.014946

(31)

8.2 (cont.)

Estat´ıstica do teste: T0 = ¯ Y − 2.81

S /√5 (se H0 for verdadeira T0∼ t4) Valor observado da estat´ıstica de teste: t0 =

3.1063 − 2.81

0.014946/√5 = 44.33 Determina¸c˜ao do valor-p:

(Tabelas) o percentil mais elevado tabelado para a distribui¸c˜ao t4 ´e Ft−14 (0.9995) = 8.61, o que corresponderia a um n´ıvel de significˆancia de

α = 2 × (1 − 0.9995) = 0.001 = 0.1%. Como 44.33  8.61 conclui-se que valor-p  0.001. (Em R) 2*(1-pt(44.33,4)) → 1.548419e-06 t0 F−1(0.9995) = 8.61 0.9995 0.0005 b

(32)

Nesta situa¸c˜ao pretende-se comparar duas popula¸c˜oes (m´etodos, ex-periˆencias, materiais, etc.) atrav´es da realiza¸c˜ao de um teste de hip´oteses relativo `a igualdade entre os valores esperados das duas popula¸c˜oes, ou a um valor espec´ıfico da diferen¸ca entre esses valores esperados.

Nota¸c˜ao:

X1representa a popula¸c˜ao 1, com E (X1) = µ1e V (X1) = σ21 X2representa a popula¸c˜ao 2, com E (X2) = µ2e V (X2) = σ22 X1q X2

(X11, X12, . . . X1n1) ´e uma a.a. da pop. 1, com m´edia ¯X1e variˆancia S

2 1

(X21, X22, . . . X2n2) ´e uma a.a. da pop. 2, com m´edia ¯X2e variˆancia S

2 2

(33)

8.3 (cont.)

Pretende-se ent˜ao testarH0: µ1= µ2 versus uma das alternativas

H1: µ16= µ2 ou H1: µ1> µ2 ou H1: µ1< µ2 A partir da vari´avel fulcral:

Z = ( ¯X1− ¯qX2) − (µ1− µ2) σ2 1 n1 + σ2 2 n2

(ver explica¸c˜ao mais detalhada em 7.3) obt´em-se, sob H0: µ1= µ2, ⇔ µ1− µ2= 0, a estat´ıstica de teste

Z0= ¯ X1− ¯X2 q σ2 1 n1 + σ2 2 n2

(34)

Quando H0´e verdadeira: Z0    ∼ N(0, 1), se Xi ∼ N(µi, σ2i) a ∼ N(0, 1), se Xi qq e ni ≥ 30

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α) depende de H1da seguinte forma:

1 H1: µ16= µ2 2 H1: µ1> µ2 3 H1: µ1< µ2 RCα: |Z0| > a, com a = Φ−1(1 − α/2). RCα: Z0> b, com b = Φ−1(1 − α). RCα: Z0< c, com c = Φ−1(α).

Nota: Qualquer que seja a distribui¸c˜ao das popula¸c˜oes X1e X2, se ni≥ 30 pode aplicar-se este teste com σ2

(35)

8.3 (cont.)

De igual modo se obt´em a estat´ıstica de teste para a diferen¸ca entre as m´edias de duas popula¸c˜oes normais com variˆancias desconhecidas mas supostamente iguais σ21= σ22: T0 = ¯ X1− ¯X2 Sp q 1 n1 + 1 n2 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 Quando H0´e verdadeira: T0∼ tn1+n2−2 (se Xi ∼ N(µi, σi2), σ 2 1= σ 2 2= σ 2 ) Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α) depende de H1da forma habitual:

1 H1: µ16= µ2 2 H1: µ1> µ2 3 H1: µ1< µ2 RCα: |T0| > a, com a = Ft−1(n1+n2−2)(1 − α/2). RCα: T0> b, com b = Ft−1(n1+n2−2)(1 − α). RC : T < c, com c = F−1 (α).

(36)

Exemplo: Pretende-se saber se o efeito m´edio de dois catalizadores em determi-nado processo qu´ımico pode ser considerado igual ou diferente.

Resultados das experiˆencias:

Catalizador 1: 91.50 94.18 92.18 95.39 91.79 89.07 94.72 89.21 n1= 8 Catalizador 2: 85.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75 n2= 8 Sejam X1– v.a. que representa o resultado da exp. com o cat. 1

X2– v.a. que representa o resultado da exp. com o cat. 2 Admitindo que (hip´oteses de trabalho):

• A 1.aamostra ´e uma concretiza¸ao de uma a.a. de X

1∼ N(µ1, σ12); • A 2.aamostra ´e uma concretiza¸ao de uma a.a. de X

2∼ N(µ2, σ22); • As duas amostras s˜ao independentes;

• σ2

(37)

8.3 (cont.)

Hip´oteses: H0: µ1= µ2 versus H1: µ16= µ2

supondo verificadas as condi¸c˜oes de utiliza¸c˜ao da estat´ıstica

T0 = ¯ X1− ¯X2 Sp q 1 n1+ 1 n2 ∼ t14 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 C´alculos: ¯x1= 92.255 x¯2= 92.733 s1= 2.39 s2= 2.98 V. obs. da estat´ıstica de teste: t0 =

92.255 − 92.733 q 7×2.392+7×2.982 14 q 1 8+ 1 8 = −0.35

Conclus˜ao: Para α = 5% vem a = Ft−114(0.975) = 2.145. Como

−2.145 < −0.35 < 2.145n˜ao se rejeitaH0ao n´ıvel de significˆancia de 5%. Tamb´em se poderia concluir que 0.6 < valor − p < 0.8, pelo que n˜ao faz sentido rejeitar H0 para nenhum dos n´ıveis de significˆancia usuais (1%,5% e 10%).

(38)

Considere-se X ∼ N(µ, σ2) popula¸c˜ao onde µ = E (X ) e σ2= Var (X ) s˜ao ambos desconhecidos. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X .

Hip´otese nula: H0: σ2= σ02.

Quando H0´e verdadeira a estat´ıstica de teste ´e: T0=

(n − 1) S2 σ2

0

∼ χ2(n−1)

Pretende-se testar H0: σ2= σ02contra uma das alternativas:

1 H1: σ26= σ2

0 (teste bilateral)

2 H1: σ2> σ02(teste unilateral superior) 3 H1: σ2< σ02(teste unilateral inferior)

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):

1 RCα: T0< a ou T0> b, com a = F−1 χ2(n−1)(α/2) e b = F −1 χ2(n−1)(1 − α/2). 2 RCα: T0> c, com c = F−1 χ2 (n−1) (1 − α). 3 RCα: T0< d , com d = F−1 χ2 (α).

(39)

8.5 Testes de hip´

oteses para parˆ

ametros de popula¸c˜

oes n˜

ao

normais uniparam´

etricas

De forma idˆentica ao cap´ıtulo anterior (Intervalos de Confian¸ca) tamb´em aqui se vai recorrer ao Teorema do Limite Central para se efectuarem inferˆencias so-bre o parˆametro de uma popula¸c˜ao n˜ao normal. Consideram-se popula¸c˜oes cujo parˆametro pode ser estimado por uma soma (m´edia) de v.a. independentes.

Seja (X1, . . . , Xn) uma a.a. de dimens˜ao n (suficientemente grande)

proveniente da popula¸c˜ao fX(x ; θ). Se considerarmos a v.a. Sn=Pni =1Xi ent˜ao Z =Sn− E (Sn) pV (Sn) = ¯ X − E X¯ q V X¯ =X − E (X )¯q V (X ) n a ∼ N (0, 1) ,

(40)

Exemplos de aplica¸c˜ao:

Testes de hip´oteses para uma propor¸c˜ao (parˆametro p da distribui¸c˜ao de Bernoulli).

Testes de hip´oteses para o parˆametro da distribui¸c˜ao exponencial. Testes de hip´oteses para o parˆametro da distribui¸c˜ao Poisson. Outras situa¸c˜oes de distribui¸c˜oes uniparam´etricas nas quais se possa aplicar a v.a. fulcral anterior e estat´ıstica de teste associada.

De seguida exemplifica-se para as primeiras duas situa¸c˜oes (pop. Bernoulli e exponencial).

(41)

8.5 Caso I: testes de hip´

oteses para uma propor¸c˜

ao

Considere-se a popula¸c˜ao X ∼ Bernoulli (p) com p = E (X ), onde p representa a propor¸c˜ao populacional (desconhecida) de indiv´ıduos/objectos dessa popula¸c˜ao que pertencem a uma dada categoria de interesse. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X , com n grande (n ≥ 30). Recordar que o estimador pontual (de m´axima verosimilhan¸ca) de p ´e

¯ X = n P i =1 Xi n . Hip´otese nula: H0: p = p0.

Quando H0´e verdadeira a estat´ıstica de teste ´e: Z0= ¯ X − p0 q p0(1−p0) n a ∼ N(0, 1)

(42)

Pretende-se testar H0: p = p0contra uma das alternativas:

1 H1: p 6= p0 (teste bilateral)

2 H1: p > p0 (teste unilateral superior) 3 H1: p < p0 (teste unilateral inferior)

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):

1 RCα: |Z0| > a, com a = Φ−1(1 − α/2). 2 RCα: Z0> b, com b = Φ−1(1 − α). 3 RCα: Z0< c, com c = Φ−1(α).

Decis˜ao usual.

Nota: Naturalmente que tamb´em se pode determinar o valor − p da forma usual e decidir com base no seu valor.

(43)

8.5 Caso I: testes de hip´

oteses para uma propor¸c˜

ao

Exemplo: Popula¸c˜ao de eleitores portugueses. Sondagem (aleat´oria) a 1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto o presidente do partido tinha afirmado “estou convencido que vamos obter mais de 50% dos votos”. Ser´a que, em face dos resultados da sondagem, a afirma¸c˜ao ´e razo´avel, ou n˜ao?

J´a sabemos que ˆp = 683/1200 = 0.569 (ver Cap´ıtulo 6)

Podemos testar H0: p = 0.5 contra H1: p > 0.5, e se rejeitarmos a hip´otese nula (conclus˜ao “forte”) ent˜ao a afirma¸c˜ao ´e corroborada pela sondagem.

z0= 0.569 − 0.5 r 0.5(1 − 0.5) 1200 = 4.79 valor-p = 1 − Φ(4.79) = 0.000001

Como o valor − p ´e muito baixo rejeita-se H0para os n´ıveis de significˆancia usuais, ou seja, a afirma¸c˜ao do presidente do partido ´e perfeitamente corroborada pela sondagem.

(44)

Vimos no Cap´ıtulo 7 que para uma popula¸c˜ao X ∼ Exp(λ) (E (X ) =µ = λ−1 e V (X ) =λ−2⇔ σ = λ−1) se tem Z = ¯ X− µ σ/√n = ¯ X− λ−1 λ−1/n = √ n λ ¯X − 1 a ∼ N(0, 1)

Ent˜ao para testar H0:λ = λ0contra H1:λ6= λ0(ou H1:λ < λ0, ou

H1:λ > λ0), usa-se a estat´ıstica de teste

Z =√n λ0X¯− 1

Quando H0´e verdadeira, conclui-se que Z0

a

∼ N(0, 1). Para H1: λ6= λ0,

rejeita-se H0ao n´ıvel de significˆancia α se

z0=√n (λ0x¯− 1) < −a ou z0> a

(45)

8.6 Teste de ajustamento do qui-quadrado de Pearson

At´e agora os testes de hip´oteses estudados diziam respeito a parˆametros, mas, como foi referido no in´ıcio deste cap´ıtulo, tamb´em se podem efectuar testes a hip´oteses sobre a pr´opria forma da distribui¸c˜ao de uma dada popula¸c˜ao. Este teste ´e um exemplo disso.

Este teste tem como objectivo verificar a hip´otese de que um conjunto de observa¸c˜oes segue uma determinada distribui¸c˜ao (discreta ou cont´ınua, com ou sem parˆametros desconhecidos).

Exemplo: O lan¸camento de um dado 1000 vezes conduziu `a seguinte tabela de frequˆencias observadas (oi)

i oi 1 174 2 174 3 154 4 179 5 154 6 165 Total 1000

(46)

Ser´a que os resultados obtidos sustentam a hip´otese de que “o dado ´e perfeito”?

Seja X a v.a. que representa o n´umero de pontos obtido num lan¸camento.

A hip´otese de interesse pode ser escrita como

H0: P(X = i ) = pi0= 1 6, i = 1, . . . , 6 ou H0: X ∼ Unif .Disc.(1, . . . , 6) contra H1: ∃i: P(X = i ) = p0i 6= 1 6 ou H1: X ∼/ Unif .Disc.(1, . . . , 6) Quando H0´e verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral), que designamos por pi0, e o valor esperado para o n´umero de observa¸c˜oes em cada classe (frequˆencias esperadas, sob H0),

Ei= n p0i

onde n ´e a dimens˜ao da amostra (neste caso n = 1000).

Note-se que a v.a. que indica o n´umero de observa¸c˜oes em n que pertencem a cada classe tem distribui¸c˜ao Bin(n, pi) e sob H0tem-se pi = pi0.

(47)

8.6 (cont.)

Vamos acrescentar essas duas colunas `a tabela anterior:

i oi pi0 Ei= n pi0= 1000× p 0 i 1 174 1/6 166.67 2 174 1/6 166.67 3 154 1/6 166.67 4 179 1/6 166.67 5 154 1/6 166.67 6 165 1/6 166.67 Total 1000 1 ≈ 1000.0

Mesmo quando H0 ´e verdadeira n˜ao estamos `a espera que as colunas

oi e Ei coincidam (mas os valores devem ser pr´oximos). Pode-se medir

o afastamento entre oi e Ei para saber at´e que ponto ´e razo´avel que

H0 seja verdadeira. Se o afastamento n˜ao for grande ´e razo´avel n˜ao

(48)

Pode mostrar-se que, quando H0´e verdadeira, a estat´ıtica que ´e usada

para medir o afastamento entre oi e Ei ´e (estat´ıstica de teste)

T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k−β−1)

onde k representa o n´umero de classes (no exemplo, 6) eβ o n´umero de

parˆametros estimados (no exemplo, 0).

Deve rejeitar-se H0se o valor observado de T0 for muito elevado, ou seja,

aregi˜ao cr´ıtica do teste, para o n´ıvel de significˆanciaα, ´e: RCα: T0> c, com c = Fχ−12

(k−β−1) (1− α)

(49)

8.6 Teste do qui-quadrado de ajustamento

Tabela incluindo os c´alculos para obter o valor observado de T0:

i oi pi0 Ei = n p0i (oi− Ei)2 Ei 1 174 1/6 166.67 0.322 2 174 1/6 166.67 0.322 3 154 1/6 166.67 0.963 4 179 1/6 166.67 0.912 5 154 1/6 166.67 0.963 6 165 1/6 166.67 0.017 Total 1000 1 1000.02 3.499 (= t0)

Se fixarmosα = 0.05, com k− β − 1 = 5, obt´em-se

c = Fχ−12

5 (0.95) = 11.07.

Uma vez que t0= 3.499 < 11.07, n˜ao h´a evidˆencia para rejeitar H0ao

n´ıvel de sig. de 5%.

valor-p = P(T0> 3.499) = 0.6235 (R); 0.6 < valor − p < 0.7

(50)

Vejamos como proceder num caso geral:

Considere-se X uma popula¸c˜ao com fun¸c˜ao de distribui¸c˜ao F desconhecida. Seja (X1, X2, · · · , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X , com n grande.

Hip´otese nula: H0: X tem distribui¸c˜ao F ;

Hip´otese alternativa: H1: X n˜ao tem distribui¸c˜ao F ;

A ideia que se utiliza para se desenvolver o teste de ajustamento ´e essencialmente a seguinte:

1. Considera-se uma parti¸c˜ao, C1, C2, · · · , Ck, do conjunto dos valores poss´ıveis de X , RX:

i) Ci∩ Cj= ∅, ∀i 6= j , i , j = 1, 2, · · · , k; ii) ∪k

i =1Ci = RX.

No caso de vari´aveis aleat´orias cont´ınuas ou discretas com muitos valores distintos pode-se usar as regras para a constru¸c˜ao de histogramas e, em geral, classes de amplitude constante.

(51)

8.6 Teste do qui-quadrado de ajustamento

2. Como vimos no exemplo anterior comparam-se as frequˆencias absolutas na amostra aleat´oria (Oi) com as frequˆencias absolutas esperadas quando H0´e verdadeira (Ei) e mede-se o afastamento entre Oi e Ei. Em seguida verifica-se se esse afastamento ´e razo´avel para H0verdadeira.

Objectivo: Testar se X ∼ F , isto ´e se as probabilidades desconhecidas:

pi= P(X ∈ Ci)

s˜ao iguais `as probabilidades

pi0= P(X ∈ Ci|H0) = P(X ∈ Ci|X ∼ F )

(52)

As hip´oteses anteriores podem agora reformular-se do seguinte modo: Hip´oteses: H0: pi = p0i, ∀i = 1, 2, · · · , k vs H1: ∃i : pi 6= p0i Quando H0´e verdadeira a estat´ıstica de teste ´e:

T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k−β−1), onde

Oi : frequˆencias absolutas na amostra aleat´oria

Ei : frequˆencias absolutas esperadas sob H0(ou estimador, quando FX(x ) depende de parˆametros desconhecidos), Ei = npi0(ou ˆEi = niPˆi0, com ˆPi0 estimador de p0i);

k: node classes;

β: node parˆametros a estimar. Observa¸c˜oes:

Oi ´e a v.a. que indica o n´umero de observa¸c˜oes (frequˆencia absoluta) na classe Ci em n observa¸c˜oes, logo Oi∼ Binomial (n, pi).

(53)

8.6 Teste do qui-quadrado de ajustamento

Decis˜ao:

Com base na regi˜ao cr´ıtica (ao n´ıvel de significˆanciaα):

RCα= [Fχ−12 (k−β−1)

(1 − α) , +∞[.

Decis˜ao: sendo t0=

k

P

i =1 (oi−Ei)2

Ei o valor observado da estat´ıstica de

teste ent˜ao h´a evidˆencia para rejeitar H0se t0∈ RCα ao n´ıvel de

significˆanciaα. Com base no valor-p:

valor− p = P(T0> t0) = 1− FT0(t0).

Rejeita-se H0 para n´ıveis de significˆancia> valor− p.

Aten¸c˜ao: Antes de se calcular o valor observado da estat´ıstica de teste

deve averiguar-se se todos os valores de Ei ≥ 1 e pelo menos 80% dos

Ei ≥ 5, se isto n˜ao ocorrer ´e necess´ario agrupar classes.

(54)

Exemplo: Pensa-se que o n´umero de defeitos por circuito, num certo tipo de circuitos, deve seguir uma distribui¸c˜ao de Poisson. De uma amostra (escolhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes

N.ode def. oi 0 32 1 15 2 9 3 4 Total 60

X - v.a. que representa o n.o de defeitos num circuito

(55)

8.6 (cont.)

O parˆametro λ ´e desconhecido pelo que deve ser estimado (pelo m´etodo da m´axima verosimilhan¸ca). Sabe-se que para a distribui¸c˜ao de Poisson

ˆ λ = ¯x = 0 × 32 + 1 × 15 + 2 × 9 + 3 × 4 60 = 0.75 donde ˆ p10= bP(X = 0|H0) = e−0.750.750 0! = 0.472 Eˆ1= 28.32 ˆ p20= bP(X = 1|H0) = e−0.750.751 1! = 0.354 ˆ E2= 21.24 ˆ p30= bP(X = 2|H0) = e−0.750.752 2! = 0.133 ˆ E3= 7.98 ˆ p40= bP(X = 3|H0) = 0.033 Eˆ4= 1.98 ˆ p50= bP(X ≥ 4|H0) = 1 − ( ˆp01+ ˆp 0 2+ ˆp 0 3+ ˆp 0 4) = 0.008 Eˆ5= 0.48 Deve verificar-se se todos os ˆEi ≥ 1 e pelo menos 80% dos ˆEi ≥ 5. Como n˜ao se verificam as condi¸c˜oes ´e necess´ario agrupar classes.

(56)

Obt´em-se ent˜ao a tabela final: Classes N.ode def. o i pˆ0i Eˆi = n ˆpi0 (oi− ˆEi)2 ˆ Ei C1 0 32 0.472 28.32 0.478 C2 1 15 0.354 21.24 1.833 C3 ≥2 13 0.174 10.44 0.628 3 ∪ i =1Ci = N0 60 1.000 60.00 2.939 (= t0) Temosk = 3eβ = 1(estimou-se o parˆametro λ).

Assim, os graus de liberdade da distribui¸c˜ao aproximada de T0´e: k − β − 1 = 3 − 1 − 1 = 1, e como α = 0.05 ⇒ c = F−1

χ2 1

(0.95) = 3.841. Portanto, RC0.05= [3.841, +∞[. Como 2.939 < 3.841, n˜ao se rejeita H0ao n´ıvel de significˆancia de 5%.

Referências

Documentos relacionados

• Uma alternativa para condições mutuamente exclusivas é mostrada a seguir.. 2) Elabore um algoritmo que dado um número inteiro qualquer, responda se ele é positivo, negativo

Vários são os fatores que podem interferir na eficiência da microencapsulção empregando a técnica de spray drying, dentre eles a temperatura do ar de secagem de entrada e da saída,

Em 1856, depois de passar dezesseis anos nas selvas da África, David Livingstone re- gressou à Inglaterra para uma breve visita.. Para sua surpresa, foi saudado como um herói

Foi observada durante o desenvolvimento da presente pesquisa a presença de latrinas (figura ?) localizadas a céu aberto e sem nenhum tipo de proteção ao solo, sendo todos os

Os ativos ou passivos financeiros são compensados e o valor líquido apresentado no balanço patrimonial quando, somente quando, a Companhia tenha o direito legal de compensar os

Segundo Éric Laurent, a psicose ordinária se caracteriza pela não resposta aos significantes-mestres tradicionais, manifestando o fim do poder do Nome-do-Pai como

Seja P a função que ao número de anos decorridos desde 2014, n, faz correspon- der o preço a pagar pelo bilhete de época do F.. Em que ano um bilhete de época no Estádio de

Pós-graduado em Engenharia de Sistemas, certificado como agile coach pela IBM Agile Academy, Scrum Alliance – certified scrum master (CSM), Scrum Institute –