Conceição Amado, Ana M. Pires, M. Rosário Oliveira e Isabel M. Rodrigues

(1)

Cap´ıtulo 8 - Testes de Hip´

oteses

Concei¸c˜ao Amado, Ana M. Pires, M. Ros´ario Oliveira e Isabel M.

(2)

Nos cap´ıtulos anteriores vimos como estimar um parˆametro desconhecido a partir de uma amostra (obtendo estimativas pontuais e intervalos de

confian¸ca para o parˆametro).

Muitas situa¸cões práticas têm uma natureza diferente, requerendo que

em fun¸c˜ao dos valores observados se tomem decis˜oes acerca dos

parˆametros (ou de outros aspectos) da popula¸c˜ao.

Exemplo 8.1:

M´aquina de encher pacotes de a¸c´ucar. O peso de cada pacote deve ser

≈ 8 g (isto ´e, µ = 8).

Será poss´ıvel concluir a partir da medi¸cão do peso de um certo número

(3)

8.1 (cont.)

Defini¸cão: Uma hipótese estat´ıstica é uma afirma¸cão acerca de

parâmetros (testes paramétricos) ou acerca da distribui¸cão (testes de

ajustamento) de uma ou mais popula¸c˜oes.

Vamos estudar em primeiro lugar os testes param´etricos.

Exemplo 8.1 (cont.):

Temos duas hip´oteses, a m´aquina funciona correctamente (µ = 8) ou a

m´aquina n˜ao funciona correctamente (µ_{6= 8), que se representam e}

denominam assim

H0: µ = 8 versus H1: µ6= 8

(4)

Suponha que θ0é um valor que se pretende testar para o parâmetro θ de uma determinada popula¸cão FX(x ; θ), θ ∈ Θ as hipóteses paramétricas são, genericamente:

H0: θ ∈ Θ0 versus H1: θ ∈ Θ1 (hip´otese nula) (hip´otese alternativa)

Temos que ter sempre:

H0∪ H1= Θ (todos os valores poss´ıveis do parˆametro Θ = Θ0∪ Θ1) H0∩ H1= ∅

As hip´oteses em teste podem ser:

Hipótese simples: é especificado só um valor para o parâmetro. (Ex: θ = 8)

Hipótese composta: é especificado mais de um valor para o parâmetro. (Ex: θ 6= 8; θ ≥ 8 )

(5)

8.1 (cont.)

Podemos estar interessados nos seguintes conjuntos de hip´oteses:

Quando H0: θ = θ0 (hip´otese nula simples)

a hip´otese alternativa (H1) pode ser uma de: H1: θ = θ1 hip´otese alternativa simples

H1: θ 6= θ0 hipótese alternativa composta (teste bilateral) H1: θ > θ0 hipótese alternativa composta (unilateral superior) H1: θ < θ0 hipótese alternativa composta (unilateral inferior)

(6)

Quando H0: θ≤ θ0 hip´otese nula composta

a hip´otese alternativa dever´a ser:

H1: θ > θ0 hip´otese alternativa unilateral inferior

Quando H0: θ≥ θ0 hip´otese nula composta

a hip´otese alternativa deve ser:

H1: θ < θ0 hip´otese alternativa unilateral inferior

Defini¸cão: Teste de hipótesesé um procedimento estat´ıstico que, baseado

(7)

8.1 (cont.)

Exemplo 8.1 (cont.): Defina-se a v.a. X que representa o peso do

pacote de a¸c´ucar, com E (X ) =µ e V (X ) = σ2_{. Pretende-se testar}

H0: µ = 8 versus H1: µ6= 8

Para se testar as hipóteses formuladas é necessário recorrer ao estimador

pontual deµ, constru´ıdo a partir de uma amostra aleat´oria na popula¸c˜ao

em estudo.

Vamos considerar, por exemplo, uma a.a. (X1, . . . , X10), e a amostra

concreta com 10 observa¸c˜oes, (x1, . . . , x10).

Comoµ é o valor médio da popula¸cão faz sentido decidir com base na

(8)

Para definir a regra de decis˜ao, que consiste em rejeitar ou n˜ao

rejeitar a hip´otese nula, precisamos de encontrar um valor (ou

valores), o chamado ponto ou valor cr´ıtico, que nos auxilia nessa decis˜ao.

No Exemplo 8.1, dever-se rejeitar o valor 8 se a m´edia da amostra

(¯x ) estiver “longe” de 8 e n˜ao rejeitar H0se ¯x estiver “pr´oxima” de

8.

¯ x

8_{− c} 8 8 + c

b

regi˜ao cr´ıtica regi˜ao cr´ıtica

“Aceitar” H1 “Aceitar” H1 Rejeitar H0 Rejeitar H0 região de aceita¸cão “Aceitar” H0 Não rejeitar H0 Região cr´ıtica (RC ): ¯x < 8_{− c ou ¯x > 8 + c (⇔ |¯x − 8| > c)} Valores cr´ıticos: são os pontos de fronteira (8_{− c e 8 + c).}

(9)

8.1 (cont.)

Mas quando se toma a decisão podemos cometer dois tipos de erro: rejeitar uma hipótese verdadeira (erro tipo I ou de 1.a_esp´_{ecie) ou n˜}_{ao rejeitar uma} hipótese falsa (erro tipo II ou de 2.aespécie). A tabela seguinte resume as diferentes possibilidades associadas à decisão:

Tipos de erro:

Situa¸cão real mas desconhecida: Decisão: H0é verdadeira H0é falsa Não Rejeitar H0 decisão correcta erro do tipo II

Rejeitar H0 erro do tipo I decis˜ao correcta

Probabilidades dos erros:

α = P(erro do tipo I) = P(rejeitar H0|H0é verdadeira) β = P(erro do tipo II) = P(Não Rejeitar H0|H0é falsa) = = P(Não Rejeitar H0|H1é verdadeira)

(10)

Voltando ao exemplo, vamos admitir que se fixava c = 0.5 e que σ = 1 e n = 10.

A regi˜ao cr´ıtica ´e_{|¯x − 8| > 0.5.}

Supondo que X_{∼ N(µ, 1) ent˜ao ¯}X _{∼ N}

µ, 1 10 , α = P _{| ¯}X_{− 8| > 0.5|H}0´e verd. = 1 − P | ¯X− 8| ≤ 0.5|µ = 8 = = 1_{− P 7.5 ≤ ¯}X _{≤ 8.5|µ = 8 = 1 −} Φ 8.5_√− 8 0.1 − Φ 7.5√− 8 0.1 = 0.1142

(11)

8.1 (cont.)

Representa¸c˜ao gr´afica de α (n = 10 e c = 0.5) ¯ x 8− c 8 8 + c b A1 A2

regi˜ao cr´ıtica regi˜ao cr´ıtica

¯ X|µ = 8(n = 10)

A1= A2= A α = 2A = 0.1142

Região Cr´ıtica (RC ) ou Região de Rejei¸cão (RR): Valores da estat´ıstica que conduzem à rejei¸cão de H0.

(12)

Quanto a β, não vamos ter um único valor mas uma fun¸cão, ou seja, para cada µ de H1podemos calcular um valor β(µ). Por exemplo, para µ = 9:

β(9) = P (N˜ao Rejeitar H0|µ = 9) = P 7.5 ≤ ¯X ≤ 8.5|µ = 9 = = Φ 8.5 − 9√ 0.1 − Φ 7.5 − 9√ 0.1 = Φ(−1.58) − Φ(−4.74) = 0.0571 ou para µ = 10 β(10) = P (N˜ao Rejeitar H0|µ = 10) = P 7.5 ≤ ¯X ≤ 8.5|µ = 10 = = Φ 8.5 − 10√ 0.1 − Φ 7.5 − 10√ 0.1 = Φ(−4.74) − Φ(−7.91) ' 10−6

(13)

8.1 (cont.)

´

E mais fácil controlar α do que controlar β (que depende de µ em H1). Logo: rejeitar H0é uma conclusão “forte” (porque o erro que se pode cometer ao rejeitar H0está bem controlado).

não rejeitar H0é uma conclusão “fraca” (porque o erro que se pode cometer ao não rejeitar H0não está bem controlado). Em vez de dizer “não se rejeita H0” é prefer´ıvel dizer que “não há evidência suficiente para rejeitar H0”.

(14)

Como decidir entre alternativa unilateral ou bilateral? I H0: µ = 8 versus H1: µ > 8

Regi˜ao cr´ıtica: ¯X > 8 + c

Ponto de vista do fabricante! (quando rejeitar H0pára a produ¸cão para afinar a máquina)

II H0: µ = 8 versus H1: µ < 8 Regi˜ao cr´ıtica: ¯X < 8 − c

Ponto de vista do consumidor! (quando rejeitar H0n˜ao aceita a encomenda)

III H0: µ = 8 versus H1: µ 6= 8

Regi˜ao cr´ıtica: ¯X < 8 − c ou ¯X > 8 + c Compromisso entre os dois!

(15)

Procedimento geral dos testes de hip´

oteses (com α fixo)

1. Pelo contexto do problema identificar o parˆametro de interesse e formular as hip´oteses H0e H1;

2. N´ıvel de significˆancia fixo: α = P(rejectar H0|H0´e verd.), usualmente fixa-se α em 0.01, 0.05 ou 0.1;

2. Escolher uma vari´avel fulcral T (a mesma dos intervalos de confian¸ca) e avaliar a vari´avel fulcral sob H0 =⇒ Estat´ıstica de Teste: T |H0= T0; 4. Recolher uma amostra e calcular o valor observado da estat´ıstica de teste:

t0;

5. Decidir sobre a rejei¸cão ou não de H0: se t0∈ RCα então rejeita-se H0e se t0∈ RC/ αentão não se rejeita H0.

(16)

Vamos prosseguir no mesmo contexto do Exemplo 8.1:

Exemplo: X é a v.a. que representa o peso de um pacote de a¸cúcar. Vamos supor que X ∼ N(µ, 1). A máquina está afinada quando µ = 8. Numa amostra de 25 pacotes (recolhida ao acaso) observou-se ¯x = 8.5. Queremos avaliar, ao n´ıvel de significância de 5%, se a máquina continua afinada. Hipóteses: H0: µ = 8 versus H1: µ 6= 8

Vari´avel Fulcral T = Z = X − µ¯

1/√25 ∼ N(0, 1) Estat´ıstica de teste Z0 =

¯ X − 8

(17)

8.1 (cont.)

Exemplo (cont.):

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α = 0.05: Rejeitamos H0se |Z0| > a e P(|Z0| > a) = α = 0.05

⇒ a = Φ−1(0.975) = 1.96. Assim, a região cr´ıtica é: RC0.05= ]−∞, −1.96] ∪ [1.96, +∞[ (bilateral) Decisão:

Com ¯x = 8.5 obt´em-se z0 = 8.5 − 8

1/√25 = 2.5. Como z0> 1.96 rejeita-se H0, ou seja, existe evidência (ao n´ıvel de significância considerado) de que a máquina está desafinada.

(18)

Alternativas unilaterais:

I Se fosse H0: µ = µ0versus H1: µ > µ0 Estat´ıstica de teste: a mesma

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα= ¯ x : z0= ¯ x − 8 1/√25 > Φ −1 (1 − α) (unilateral superior) z0 a′ 1− α α

(19)

8.1 (cont.)

Alternativas unilaterais:

II Se fosse H0: µ = µ0versus H1: µ < µ0 Estat´ıstica de teste: a mesma

Regi˜ao Cr´ıtica ao n´ıvel de significˆancia de α: RCα= ¯ x : z0= ¯ x − 8 1/√25< Φ −1 (α) (unilateral inferior) z0 −a′ 1− α α

(20)

Outro m´etodo de decis˜ao: valor-p

Em vez de se fixar o n´ıvel de significância, α, determinar a região cr´ıtica e, em seguida, verificar se o valor observado pertence à região cr´ıtica, pode olhar-se directamente para o valor observado da estat´ıstica de teste e determinar para que n´ıvel de significância a decisão muda.

Defini¸cão: Dado o valor observado da estat´ıstica de teste, o valor-p (p-value) é o menor n´ıvel de significância que levaria à rejei¸cão da hipótese nula H0. Calculo do valor − p do teste:

Teste unilateral `a direita: valor − p = P(T0> t0) Teste unilateral `a esquerda: valor − p = P(T0< t0) Teste bilateral: valor − p = 2 min{P(T0< t0), P(T0> t0)}

Decis˜ao: rejeitar H0para valores de α ≥ valor − p; n˜ao rejeitar H0para valores de α < valor − p.

(21)

8.1 (cont.)

Rela¸c˜ao entre intervalos de confian¸ca e testes de hip´oteses:

Dado um parâmetro desconhecido θ, um I.C. a 100 × (1 − α) para θ = [l , u], baseado numa dada amostra, (x1, . . . , xn), e obtido a partir de uma certa v.a. fulcral, então a mesma amostra leva à rejei¸cão de

H0: θ = θ0 versus H1: θ 6= θ0

ao n´ıvel de significância α se e só se θ0∈ [l , u] ou `/ a não rejei¸cão de H0 se e só se θ0∈ [l , u].

Nota: ´e necess´ario que a v.a. fulcral e a estat´ıstica de teste sejam da mesma forma.

(22)

dessa estat´ıstica com base numa amostra, de dimens˜ao n, seleccionada ao acaso da popula¸c˜ao em estudo.

Três métodos para a realiza¸cão de testes hipóteses paramétricos, ao n´ıvel de significância α:

1. Baseando-se na constru¸c˜ao da regi˜ao cr´ıtica RCα: Rejeitar H0se o valor t0∈ RCα

N˜ao Rejeitar H0se o valor t0∈ RC/ α; 2. Determinando o valor − p:

Rejeitar H0se valor − p < α N˜ao Rejeitar H0se valor − p > α;

3. Atrav´es de intervalo de confian¸ca a (1 − α) × 100% (constru´ıdo com v.a. fulcral da mesma forma que a estat´ıstica de teste):

Rejeitar H0se o valor do parˆametro especificado em H0n˜ao pertencer ao intervalo de confian¸ca

(23)

8.2 Testes de hip´

oteses para a m´

edia de uma popula¸c˜

ao

normal

Tal como no cap´ıtulo 7 estuda-se primeiro o caso em que a variância é conhecida. Assim, considere-se uma popula¸cão X tal que:

E (X ) = µ (desconhecido) V (X ) = σ2 _(conhecida)

Seja (X1, . . . , Xn) uma a.a. de X com dimens˜ao n e ˆµ = ¯X o estimador pontual de µ.

Admite-se que X ∼ N(µ, σ2) ou X tem outra distribui¸c˜ao qualquer mas n ´e elevado

Teste de H0: µ = µ0versus H1: µ 6= µ0 Sabemos j´a que, quando H0´e verdadeira

¯ X ∼ N µ0, σ2 n ou X¯∼ Na µ0, σ2 n

(24)

Em vez de trabalhar directamente com ¯X , ´e conveniente estandardizar e usar como estat´ıstica de teste:

Z0 = ¯ X − µ0

σ/√n

Quando H0é verdadeira Z0∼ N(0, 1). Então se a hipótese alternativa for bilateral, a região cr´ıtica deve ser |Z0| > a, pelo que α = P(|Z0| > a):

z0 −a a 1_{− α} α 2 α 2 P(Z0> a) = α 2 ⇔ a = Φ −1 1 −α 2

(25)

8.2 (cont.)

Dada uma amostra concreta, calcula-se o o valor observado da estat´ıstica de teste z0 = ¯ x − µ0 σ/√n Ent˜ao rejeita-se H0se z0< −a ou z0> a e n˜ao se rejeita H0se −a ≤ z0≤ a

Notar que estas regras podem ser expressas em termos de ¯x : rejeita-se H0se ¯x < µ0− a σ √ n ou ¯x > µ0+ a σ √ n e n˜ao se rejeita H0se µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n

(26)

O exemplo que abordamos anteriormente, funcionamento da máquina de encher pacotes de a¸cúcar, descreveu um teste de hipóteses paramétrico para o valor médio de uma v.a. normal com variância conhecida.

Para esse exemplo, qual ´e o valor-p do teste bilateral? Valor observado da estat´ıstica: z0= 2.5, logo

valor − p = 2 min(P(Z0< 2.5), P(Z0> 2.5) = 2P(Z0> 2.5) = 2(1 − Φ(2.5)) = 0.0124.

Rejeita-se H0para α > valor − p = 0.0124 N˜ao se rejeita-se H0para α < valor − p = 0.0124

z0 −2.5 2.5 1− valor-p valor-p 2 valor-p 2 .

(27)

8.2 (cont.)

Usando a rela¸cão entre intervalos de confian¸ca e testes de hipóteses: aplica¸cão para o teste que estamos a estudar (teste para a média com variância conhecida, H0: µ = µ0versus H1: µ 6= µ0):

Não se rejeita H0, ao n´ıvel de significância α, se e só se |z0| ≤ a ⇔ ¯ x − µ0 σ/√n ≤ a ⇔ µ0− a σ √ n ≤ ¯x ≤ µ0+ a σ √ n ⇔ ⇔ x − a¯ √σ n ≤ µ0≤ ¯x + a σ √ n ⇔ µ0∈ IC100×(1−α)%(µ) Exemplo (cont.): n = 25, ¯x = 8.5, σ = 1, γ = (1 − α) = 95% (α = 5%) ⇒ a = 1.96 IC95%(µ) = h 8.5 − 1.96 ×_√1 25; 8.5 + 1.96 × 1 √ 25 i = [8.108; 8.892]. como µ0= 8 não pertence ao I.C. a 95%, rejeita-se H0(contra H1: µ 6= 8) ao n´ıvel de significância α = 5%.

(28)

Testes para a m´edia com variˆancia desconhecida:

O teste que acabámos de estudar é aplicável com σ2_desconhecida (substitu´ıda por S2) desde que a dimensão da amostra seja grande (n ≥ 30).

Ou seja, usa-se a estat´ıstica Z0 =

¯ X − µ0

S /√n

a qual tem distribui¸cão aproximadamente N(0, 1) sob H0, seja qual for a distribui¸cão da popula¸cão, desde que n seja elevado (a aproxima¸cão é razoável para n ≥ 30).

(29)

8.2 (cont.)

Testes para a m´edia com variˆancia desconhecida (cont.):

Se n não for elevado (n < 30) mas X ∼ N(µ, σ2_{) ent˜}_{ao a estat´ıstica} anterior ainda pode ser utilizada, sabendo-se que a distribui¸cão sob H0é a distribui¸cão t-Student com n − 1 graus de liberdade. Ou seja, a estat´ıstica do teste é T0 = ¯ X − µ0 S /√n e, quando H0é verdadeira, T0∼ tn−1.

Trata-se então de um teste em tudo semelhante ao caso com variância conhecida que foi estudado, excepto que os pontos cr´ıticos são calculados com recurso a Ft−1n−1 (em vez de Φ

−1 ).

Nota: Para os testes em que a estat´ıstica de teste tem distribui¸cão normal o valor − p é fácil de determinar. Para as estat´ısticas com distribui¸cão t ou qui-quadrado esse valor só pode ser obtido usando um programa de computador ou em certas calculadoras. Recorrendo às tabelas o melhor que se consegue é obter um intervalo que contém (de certeza) o valor − p.

(30)

Exemplo: Determina¸cão da constante de acidez do ácido orto-hidroxibenz´ oi-co. O valor tabelado é 2.81. Queremos saber se os valores determinados experimentalmente (variáveis de experiência para experiência devido a facto-res não controláveis/erro experimental) estão ou não de acordo com o valor tabelado. Ou seja, em termos de testes de hipóteses e sendo Y a v.a. que representa um valor da constante determinado experimentalmente, queremos testar, admitindo que Y ∼ N(µY, σ2Y), se

H0: µY = 2.81 versus H1: µY 6= 2.81

Temos as seguintes 5 observa¸c˜oes (que podem ser consideradas como obtidas por amostragem aleat´oria):

y1= 3.0935 y2= 3.0894 y3= 3.1111 y4= 3.1113 y5= 3.1262 para as quais se obt´em: n = 5, y = 3.1063,¯ sy = 0.014946

(31)

8.2 (cont.)

Estat´ıstica do teste: T0 = ¯ Y − 2.81

S /√5 (se H0 for verdadeira T0∼ t4) Valor observado da estat´ıstica de teste: t0 =

3.1063 − 2.81

0.014946/√5 = 44.33 Determina¸c˜ao do valor-p:

(Tabelas) o percentil mais elevado tabelado para a distribui¸cão t4 é Ft−14 (0.9995) = 8.61, o que corresponderia a um n´ıvel de significância de

α = 2 × (1 − 0.9995) = 0.001 = 0.1%. Como 44.33 8.61 conclui-se que valor-p 0.001. (Em R) 2*(1-pt(44.33,4)) → 1.548419e-06 t0 F−1_{(0.9995) = 8.61} 0.9995 0.0005 b

(32)

Nesta situa¸cão pretende-se comparar duas popula¸cões (métodos, ex-periências, materiais, etc.) através da realiza¸cão de um teste de hipóteses relativo à igualdade entre os valores esperados das duas popula¸cões, ou a um valor espec´ıfico da diferen¸ca entre esses valores esperados.

Nota¸c˜ao:

X1representa a popula¸c˜ao 1, com E (X1) = µ1e V (X1) = σ21 X2representa a popula¸c˜ao 2, com E (X2) = µ2e V (X2) = σ22 X1q X2

(X11, X12, . . . X1n1) é uma a.a. da pop. 1, com média ¯X1e variância S

2 1

(X21, X22, . . . X2n2) é uma a.a. da pop. 2, com média ¯X2e variância S

2 2

(33)

8.3 (cont.)

Pretende-se ent˜ao testarH0: µ1= µ2 versus uma das alternativas

H1: µ16= µ2 ou H1: µ1> µ2 ou H1: µ1< µ2 A partir da vari´avel fulcral:

Z = ( ¯X1− ¯qX2) − (µ1− µ2) σ2 1 n1 + σ2 2 n2

(ver explica¸c˜ao mais detalhada em 7.3) obt´em-se, sob H0: µ1= µ2, ⇔ µ1− µ2= 0, a estat´ıstica de teste

Z0= ¯ X1− ¯X2 q σ2 1 n1 + σ2 2 n2

(34)

Quando H0´e verdadeira: Z0    ∼ N(0, 1), se Xi ∼ N(µi, σ2i) a ∼ N(0, 1), se Xi qq e ni ≥ 30

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α) depende de H1da seguinte forma:

1 H₁: µ₁6= µ₂ 2 _H₁_{: µ}₁_{> µ}₂ 3 _H₁_{: µ}₁_{< µ}₂ RCα: |Z0| > a, com a = Φ−1(1 − α/2). RCα: Z0> b, com b = Φ−1(1 − α). RCα: Z0< c, com c = Φ−1(α).

Nota: Qualquer que seja a distribui¸c˜ao das popula¸c˜oes X1e X2, se ni≥ 30 pode aplicar-se este teste com σ2

(35)

8.3 (cont.)

De igual modo se obtém a estat´ıstica de teste para a diferen¸ca entre as médias de duas popula¸cões normais com variâncias desconhecidas mas supostamente iguais σ21= σ22: T0 = ¯ X1− ¯X2 Sp q 1 n1 + 1 n2 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 Quando H0é verdadeira: T0∼ tn1+n2−2 (se Xi ∼ N(µi, σi2), σ 2 1= σ 2 2= σ 2 ) Região cr´ıtica (ao n´ıvel de significância α) depende de H1da forma habitual:

1 _H₁_{: µ}₁6= µ₂ 2 _H₁_{: µ}₁_{> µ}₂ 3 _H₁_{: µ}₁_{< µ}₂ RCα: |T0| > a, com a = Ft−1_(n1+n2−2)(1 − α/2). RCα: T0> b, com b = Ft−1_(n1+n2−2)(1 − α). RC : T < c, com c = F−1 (α).

(36)

Exemplo: Pretende-se saber se o efeito m´edio de dois catalizadores em determi-nado processo qu´ımico pode ser considerado igual ou diferente.

Resultados das experiˆencias:

Catalizador 1: 91.50 94.18 92.18 95.39 91.79 89.07 94.72 89.21 n1= 8 Catalizador 2: 85.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75 n2= 8 Sejam X1– v.a. que representa o resultado da exp. com o cat. 1

X2– v.a. que representa o resultado da exp. com o cat. 2 Admitindo que (hip´oteses de trabalho):

• A 1.a_{amostra ´}_{e uma concretiza¸}_c˜_{ao de uma a.a. de X}

1∼ N(µ1, σ12); • A 2.a_{amostra ´}_{e uma concretiza¸}_c˜_{ao de uma a.a. de X}

2∼ N(µ2, σ22); • As duas amostras s˜ao independentes;

• σ2

(37)

8.3 (cont.)

Hip´oteses: H0: µ1= µ2 versus H1: µ16= µ2

supondo verificadas as condi¸c˜oes de utiliza¸c˜ao da estat´ıstica

T0 = ¯ X1− ¯X2 Sp q 1 n1+ 1 n2 ∼ t14 com Sp= s (n1− 1) S12+ (n2− 1) S22 n1+ n2− 2 C´alculos: ¯x1= 92.255 x¯2= 92.733 s1= 2.39 s2= 2.98 V. obs. da estat´ıstica de teste: t0 =

92.255 − 92.733 q 7×2.392_+7×2.982 14 q 1 8+ 1 8 = −0.35

Conclus˜ao: Para α = 5% vem a = Ft−114(0.975) = 2.145. Como

−2.145 < −0.35 < 2.145não se rejeitaH0ao n´ıvel de significância de 5%. Também se poderia concluir que 0.6 < valor − p < 0.8, pelo que não faz sentido rejeitar H0 para nenhum dos n´ıveis de significância usuais (1%,5% e 10%).

(38)

Considere-se X ∼ N(µ, σ2) popula¸cão onde µ = E (X ) e σ2= Var (X ) são ambos desconhecidos. Seja (X1, X2, · · · , Xn) uma a.a. de dimensão n proveniente da popula¸cão X .

Hip´otese nula: H0: σ2= σ02.

Quando H0´e verdadeira a estat´ıstica de teste ´e: T0=

(n − 1) S2 σ2

0

∼ χ2(n−1)

Pretende-se testar H0: σ2= σ02contra uma das alternativas:

1 _H₁_{: σ}26= σ2

0 (teste bilateral)

2 H₁: σ2> σ₀2(teste unilateral superior) 3 _H₁_{: σ}2_{< σ}₀2_{(teste unilateral inferior)}

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):

1 _RC_α_{: T}₀_{< a ou T}₀_{> b, com a = F}−1 χ2_(n−1)(α/2) e b = F −1 χ2_(n−1)(1 − α/2). 2 _RC_α_{: T}₀_{> c, com c = F}−1 χ2 (n−1) (1 − α). 3 _RC_α_{: T}₀_{< d , com d = F}−1 χ2 (α).

(39)

8.5 Testes de hip´

oteses para parˆ

ametros de popula¸c˜

oes n˜

ao

normais uniparam´

etricas

De forma idêntica ao cap´ıtulo anterior (Intervalos de Confian¸ca) também aqui se vai recorrer ao Teorema do Limite Central para se efectuarem inferências so-bre o parâmetro de uma popula¸cão não normal. Consideram-se popula¸cões cujo parâmetro pode ser estimado por uma soma (média) de v.a. independentes.

Seja (X1, . . . , Xn) uma a.a. de dimens˜ao n (suficientemente grande)

proveniente da popula¸c˜ao fX(x ; θ). Se considerarmos a v.a. Sn=Pn_{i =1}Xi ent˜ao Z =Sn− E (Sn) pV (Sn) = ¯ X − E X¯ q V X¯ =X − E (X )¯_q V (X ) n a ∼ N (0, 1) ,

(40)

Exemplos de aplica¸c˜ao:

Testes de hipóteses para uma propor¸cão (parâmetro p da distribui¸cão de Bernoulli).

Testes de hipóteses para o parâmetro da distribui¸cão exponencial. Testes de hipóteses para o parâmetro da distribui¸cão Poisson. Outras situa¸cões de distribui¸cões uniparamétricas nas quais se possa aplicar a v.a. fulcral anterior e estat´ıstica de teste associada.

De seguida exemplifica-se para as primeiras duas situa¸c˜oes (pop. Bernoulli e exponencial).

(41)

8.5 Caso I: testes de hip´

oteses para uma propor¸c˜

ao

Considere-se a popula¸cão X ∼ Bernoulli (p) com p = E (X ), onde p representa a propor¸cão populacional (desconhecida) de indiv´ıduos/objectos dessa popula¸cão que pertencem a uma dada categoria de interesse. Seja (X1, X2, · · · , Xn) uma a.a. de dimensão n proveniente da popula¸cão X , com n grande (n ≥ 30). Recordar que o estimador pontual (de máxima verosimilhan¸ca) de p é

¯ X = n P i =1 Xi n . Hip´otese nula: H0: p = p0.

Quando H0´e verdadeira a estat´ıstica de teste ´e: Z0= ¯ X − p0 q p0(1−p0) n a ∼ N(0, 1)

(42)

Pretende-se testar H0: p = p0contra uma das alternativas:

1 _H₁_{: p 6= p}₀ _{(teste bilateral)}

2 _H₁_{: p > p}₀ _{(teste unilateral superior)} 3 _H₁_{: p < p}₀ _{(teste unilateral inferior)}

Regi˜ao cr´ıtica (ao n´ıvel de significˆancia α):

1 RC_α: |Z₀| > a, com a = Φ−1(1 − α/2). 2 _RC_α_{: Z}₀_{> b, com b = Φ}−1_{(1 − α).} 3 _RC_α_{: Z}₀_{< c, com c = Φ}−1_(α).

Decis˜ao usual.

Nota: Naturalmente que tamb´em se pode determinar o valor − p da forma usual e decidir com base no seu valor.

(43)

8.5 Caso I: testes de hip´

oteses para uma propor¸c˜

ao

Exemplo: Popula¸cão de eleitores portugueses. Sondagem (aleatória) a 1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto o presidente do partido tinha afirmado “estou convencido que vamos obter mais de 50% dos votos”. Será que, em face dos resultados da sondagem, a afirma¸cão é razoável, ou não?

J´a sabemos que ˆp = 683/1200 = 0.569 (ver Cap´ıtulo 6)

Podemos testar H0: p = 0.5 contra H1: p > 0.5, e se rejeitarmos a hipótese nula (conclusão “forte”) então a afirma¸cão é corroborada pela sondagem.

z0= 0.569 − 0.5 r 0.5(1 − 0.5) 1200 = 4.79 valor-p = 1 − Φ(4.79) = 0.000001

Como o valor − p é muito baixo rejeita-se H0para os n´ıveis de significância usuais, ou seja, a afirma¸cão do presidente do partido é perfeitamente corroborada pela sondagem.

(44)

Vimos no Cap´ıtulo 7 que para uma popula¸c˜ao X _{∼ Exp(λ)} (E (X ) =µ = λ−1 _{e V (X ) =}_λ−2_{⇔ σ = λ}−1_{) se tem} Z = ¯ X_{− µ} σ/√n = ¯ X_{− λ}−1 λ−1_/√_n = √ n λ ¯X _{− 1} a ∼ N(0, 1)

Ent˜ao para testar H0:λ = λ0contra H1:λ6= λ0(ou H1:λ < λ0, ou

H1:λ > λ0), usa-se a estat´ıstica de teste

Z =√n λ0X¯− 1

Quando H0´e verdadeira, conclui-se que Z0

a

∼ N(0, 1). Para H1: λ6= λ0,

rejeita-se H0ao n´ıvel de significˆancia α se

z0=√n (λ0x¯− 1) < −a ou z0> a

(45)

8.6 Teste de ajustamento do qui-quadrado de Pearson

Até agora os testes de hipóteses estudados diziam respeito a parâmetros, mas, como foi referido no in´ıcio deste cap´ıtulo, também se podem efectuar testes a hipóteses sobre a própria forma da distribui¸cão de uma dada popula¸cão. Este teste é um exemplo disso.

Este teste tem como objectivo verificar a hipótese de que um conjunto de observa¸cões segue uma determinada distribui¸cão (discreta ou cont´ınua, com ou sem parâmetros desconhecidos).

Exemplo: O lan¸camento de um dado 1000 vezes conduziu `a seguinte tabela de frequˆencias observadas (oi)

i oi 1 174 2 174 3 154 4 179 5 154 6 165 Total 1000

(46)

Será que os resultados obtidos sustentam a hipótese de que “o dado é perfeito”?

Seja X a v.a. que representa o n´umero de pontos obtido num lan¸camento.

A hip´otese de interesse pode ser escrita como

H0: P(X = i ) = pi0= 1 6, i = 1, . . . , 6 ou H0: X ∼ Unif .Disc.(1, . . . , 6) contra H1: ∃i: P(X = i ) = p0i 6= 1 6 ou H1: X ∼/ Unif .Disc.(1, . . . , 6) Quando H0é verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral), que designamos por pi0, e o valor esperado para o número de observa¸cões em cada classe (frequências esperadas, sob H0),

Ei= n p0i

onde n ´e a dimens˜ao da amostra (neste caso n = 1000).

Note-se que a v.a. que indica o número de observa¸cões em n que pertencem a cada classe tem distribui¸cão Bin(n, pi) e sob H0tem-se pi = pi0.

(47)

8.6 (cont.)

Vamos acrescentar essas duas colunas `a tabela anterior:

i oi pi0 Ei= n pi0= 1000× p 0 i 1 174 1/6 166.67 2 174 1/6 166.67 3 154 1/6 166.67 4 179 1/6 166.67 5 154 1/6 166.67 6 165 1/6 166.67 Total 1000 1 _{≈ 1000.0}

Mesmo quando H0 é verdadeira não estamos à espera que as colunas

oi e Ei coincidam (mas os valores devem ser pr´oximos). Pode-se medir

o afastamento entre oi e Ei para saber até que ponto é razoável que

H0 seja verdadeira. Se o afastamento não for grande é razoável não

(48)

Pode mostrar-se que, quando H0´e verdadeira, a estat´ıtica que ´e usada

para medir o afastamento entre oi e Ei ´e (estat´ıstica de teste)

T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k_−β−1)

onde k representa o n´umero de classes (no exemplo, 6) eβ o n´umero de

parˆametros estimados (no exemplo, 0).

Deve rejeitar-se H0se o valor observado de T0 for muito elevado, ou seja,

aregião cr´ıtica do teste, para o n´ıvel de significânciaα, é: RCα: T0> c, com c = F_χ−12

(k−β−1) (1_{− α)}

(49)

8.6 Teste do qui-quadrado de ajustamento

Tabela incluindo os c´alculos para obter o valor observado de T0:

i oi pi0 Ei = n p0i (oi− Ei)2 Ei 1 174 1/6 166.67 0.322 2 174 1/6 166.67 0.322 3 154 1/6 166.67 0.963 4 179 1/6 166.67 0.912 5 154 1/6 166.67 0.963 6 165 1/6 166.67 0.017 Total 1000 1 1000.02 3.499 (= t0)

Se fixarmosα = 0.05, com k_{− β − 1 = 5, obt´em-se}

c = F_χ−12

5 (0.95) = 11.07.

Uma vez que t0= 3.499 < 11.07, não há evidência para rejeitar H0ao

n´ıvel de sig. de 5%.

valor-p = P(T0> 3.499) = 0.6235 (R); 0.6 < valor − p < 0.7

(50)

Vejamos como proceder num caso geral:

Considere-se X uma popula¸cão com fun¸cão de distribui¸cão F desconhecida. Seja (X1, X2, · · · , Xn) uma a.a. de dimensão n proveniente da popula¸cão X , com n grande.

Hip´otese nula: H0: X tem distribui¸c˜ao F ;

Hipótese alternativa: H1: X não tem distribui¸cão F ;

A ideia que se utiliza para se desenvolver o teste de ajustamento ´e essencialmente a seguinte:

1. Considera-se uma parti¸c˜ao, C1, C2, · · · , Ck, do conjunto dos valores poss´ıveis de X , RX:

i) Ci∩ Cj= ∅, ∀i 6= j , i , j = 1, 2, · · · , k; ii) ∪k

i =1Ci = RX.

No caso de variáveis aleatórias cont´ınuas ou discretas com muitos valores distintos pode-se usar as regras para a constru¸cão de histogramas e, em geral, classes de amplitude constante.

(51)

8.6 Teste do qui-quadrado de ajustamento

2. Como vimos no exemplo anterior comparam-se as frequências absolutas na amostra aleatória (Oi) com as frequências absolutas esperadas quando H0é verdadeira (Ei) e mede-se o afastamento entre Oi e Ei. Em seguida verifica-se se esse afastamento é razoável para H0verdadeira.

Objectivo: Testar se X _{∼ F , isto ´e se as probabilidades desconhecidas:}

pi= P(X ∈ Ci)

s˜ao iguais `as probabilidades

p_i0= P(X _{∈ C}i|H0) = P(X ∈ Ci|X ∼ F )

(52)

As hipóteses anteriores podem agora reformular-se do seguinte modo: Hipóteses: H0: pi = p0i, ∀i = 1, 2, · · · , k vs H1: ∃i : pi 6= p0i Quando H0é verdadeira a estat´ıstica de teste é:

T0= k X i =1 (Oi− Ei)2 Ei a ∼ χ2 (k−β−1), onde

Oi : frequˆencias absolutas na amostra aleat´oria

Ei : frequências absolutas esperadas sob H0(ou estimador, quando FX(x ) depende de parâmetros desconhecidos), Ei = npi0(ou Êi = niPî0, com ˆPi0 estimador de p0i);

k: no_{de classes;}

β: node parˆametros a estimar. Observa¸c˜oes:

Oi é a v.a. que indica o número de observa¸cões (frequência absoluta) na classe Ci em n observa¸cões, logo Oi∼ Binomial (n, pi).

(53)

8.6 Teste do qui-quadrado de ajustamento

Decis˜ao:

Com base na regi˜ao cr´ıtica (ao n´ıvel de significˆanciaα):

RCα= [F_χ−12 (k−β−1)

(1 − α) , +∞[.

Decis˜ao: sendo t0=

k

P

i =1 (oi−Ei)2

Ei o valor observado da estat´ıstica de

teste então há evidência para rejeitar H0se t0∈ RCα ao n´ıvel de

significˆanciaα. Com base no valor-p:

valor_{− p = P(T}0> t0) = 1− FT0(t0).

Rejeita-se H0 para n´ıveis de significˆancia> valor− p.

Aten¸c˜ao: Antes de se calcular o valor observado da estat´ıstica de teste

deve averiguar-se se todos os valores de Ei ≥ 1 e pelo menos 80% dos

Ei ≥ 5, se isto não ocorrer é necessário agrupar classes.

(54)

Exemplo: Pensa-se que o n´umero de defeitos por circuito, num certo tipo de circuitos, deve seguir uma distribui¸c˜ao de Poisson. De uma amostra (escolhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes

N.ode def. oi 0 32 1 15 2 9 3 4 Total 60

X - v.a. que representa o n.o _{de defeitos num circuito}

(55)

8.6 (cont.)

O parâmetro λ é desconhecido pelo que deve ser estimado (pelo método da máxima verosimilhan¸ca). Sabe-se que para a distribui¸cão de Poisson

ˆ λ = ¯x = 0 × 32 + 1 × 15 + 2 × 9 + 3 × 4 60 = 0.75 donde ˆ p10= bP(X = 0|H0) = e−0.750.750 0! = 0.472 Eˆ1= 28.32 ˆ p20= bP(X = 1|H0) = e−0.750.751 1! = 0.354 ˆ E2= 21.24 ˆ p30= bP(X = 2|H0) = e−0.750.752 2! = 0.133 ˆ E3= 7.98 ˆ p40= bP(X = 3|H0) = 0.033 Eˆ4= 1.98 ˆ p50= bP(X ≥ 4|H0) = 1 − ( ˆp01+ ˆp 0 2+ ˆp 0 3+ ˆp 0 4) = 0.008 Eˆ5= 0.48 Deve verificar-se se todos os Êi ≥ 1 e pelo menos 80% dos Êi ≥ 5. Como não se verificam as condi¸cões é necessário agrupar classes.

(56)

Obtém-se então a tabela final: Classes N.o_{de def.} _o i pˆ0i Eî = n ˆpi0 (oi− Êi)2 ˆ Ei C1 0 32 0.472 28.32 0.478 C2 1 15 0.354 21.24 1.833 C3 ≥2 13 0.174 10.44 0.628 3 ∪ i =1Ci = N0 60 1.000 60.00 2.939 (= t0) Temosk = 3eβ = 1(estimou-se o parâmetro λ).

Assim, os graus de liberdade da distribui¸c˜ao aproximada de T0´e: k − β − 1 = 3 − 1 − 1 = 1, e como α = 0.05 ⇒ c = F−1

χ2 1

(0.95) = 3.841. Portanto, RC0.05= [3.841, +∞[. Como 2.939 < 3.841, n˜ao se rejeita H0ao n´ıvel de significˆancia de 5%.