Aula5-Testedehipóteses.pdf.1308495957892

(1)

Testes de hip

ó

teses

Gleice M S Conceição

Depto. de Ciências Biológicas - UNIFESP

Lembrando...

Segundo o TLC,

X

~

N

(

µ

,

σ

2

/

n

)

( )

0 ,

1 ~

/

n

N

X

Z

σ

µ

−

=

1

~

/

−

=

t

_n

n

S

X

T

µ

(2)

Testes de hipóteses

Ex. Suponha que entre pessoas sadias a

concentração de certa substância no sangue se comporta segundo um modelo Normal com média 14 unidades/ml e desvio padrão 6 unidades/ml. Pessoas sofrendo de uma doença específica têm a concentração média da substância alterada para 18 unidades/ml.

X~N(14,36) para indivíduos sadios X~N(18,36) para indivíduos doentes

Testes de hipóteses

Desejamos averiguar se um certo tratamento proposto para combater a doença é eficaz. Uma amostra aleatória de tamanho n=30 é selecionada entre os indivíduos doentes e eles são submetidos ao tratamento.

(3)

Testes de hipóteses

i=1, ... 30.

Para cada indivíduo, temos X_i~N(µ, 36), dependendo do tratamento ter sido eficiente ou não.

Como decidir se o tratamento é eficaz ou não? Caso a mostra de 30 valores forneça valor médio de

concentração alto e “próximo” de 18, teremos evidência de que o tratamento não é eficaz. Mas se o valor da média for baixo e “próximo” de 14, isto nos levaria a crer que o tratamento foi eficiente.

Testes de hipóteses

Precisamos definir um valor “limite” para

14 18

µ=18

µ=14

Para encontrar , vamos estudar probabilisticamente o problema! obs

X

c

x

X

c

x

(4)

Testes de hipóteses

Queremos testar se

H0: O tratamento não é eficaz (hipótese nula) Ha: O tratamento é eficaz (hipótese alternativa)

Essas hipóteses correspondem aos diferentes valores do parâmetro

µe, assim, podemos reescrevê-las como:

H₀: µ= 18 H_a: µ= 14 (hipóteses simples) H₀: µ= 18 H_a: µ< 18 (hipóteses compostas) H₀: µ= 18 H_a: µ ≠18 unilaterais bilaterais ou

Teste de hipóteses

H0verdadeira H0falsa

Não rejeitar H0 decisão

correta Erro tipo II Rejeitar H0 Erro tipo I decisão correta Situação real Decisão

Erros que podem ser cometidos:

α= P(erro tipo I) = P(rejeitar Ho | Ho é verdadeira)

(5)

Teste de hipóteses

α= P(concluir que o tratamento é eficaz quando na verdade ele não é)

β= P(concluir que o tratamento não é eficaz quando na verdade ele é)

A situação ideal é aquela em que ambas as probabilidades, αe β, são próximas de zero.

Entretanto, é fácil ver que, à medida que diminuímos α,

β tende a aumentar.

Devemos cuidar para que, ao definir as hipóteses, o erro mais importante a ser evitado seja o erro do tipo I.

Nas situações abaixo, escolha como

hipótese nula, H

₀

, aquela que para você

leva a um erro mais importante.

O trabalho de um operador de radar é detectar aeronaves inimigas. Quando surge alguma coisa estranha na tela, ele deve decidir entre as seguintes hipóteses:

está começando um ataque

tudo bem, apenas uma interferência

Num júri, o indivíduo está sendo julgado por uma crime. As hipóteses sujeitas ao júri são:

o acusado é inocente o acusado é culpado

Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele irá conduzir uma pesquisa de laboratório para verificar a

veracidade da afirmação. De acordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que pode testar são:

a vacina é boa a vacina não é boa

(6)

Teste de hipóteses

Fixando um valor para α, podemos calcular

(

) (

)

(

)

          − < − = = < = = = n x n X P x X P P P c c σ µ σ µ µ α 18 | a verdadeir H | H rejeitar I tipo do erro ₀ ₀ 05 . 0 30 6 18 ₌           − < xc Z P c x

Por exemplo, para α = 0.05:

? 30 6 18₌ − c x e, da tabela da N(0,1):

Teste de hipóteses

Acabamos de fazer um teste de

hipóteses para a média de uma

população com variância

(7)

Etapas para a realização de

um teste de hipóteses

1. Estabelecer as hipóteses nula e alternativa

2. Definir a forma da região crítica, com base na hipótese alternativa

3. Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida

4. Fixar α e obter a região crítica

5. Concluir o teste com base na estimativa e na região crítica

Nível descritivo de teste

Ao realizarmos um teste de hipótese, partimos de um dado valor de α, pré-fixado, para construir a regra de decisão.

Uma alternativa é calcular deixar a cargo de quem vai utilizar as conclusões do teste a escolha do valor de α, que não precisará ser fixado a priori.

A idéia consiste em calcular, supondo que a hipótese nula seja verdadeira, a probabilidade de se obter

estimativas mais desfavoráveis ou extremas do que a que está sendo fornecida pela amostra. Esta

probabilidade será o nível descritivo, conhecido por p-valor.

(8)

Nível descritivo de teste

p-valor= P(X < X_obs| H_o é verdadeira), para H_a: µ< µ₀ p-valor= P(X > X_obs| H_o é verdadeira), para H_a: µ> µ₀

Para o caso do teste de hipótese unilateral:

Para o caso do teste de hipótese bilateral:

Se X_obs < µ₀ , p-valor= 2 x P(X < X_obs| H_o é verdadeira) Se X_obs > µ₀, p-valor= 2 x P(X > X_obs | H_oé verdadeira)

II. Teste de hipóteses para a média de

uma população com variância desconhecida

Lembrando... ( )1 ~ − − = tn n S X T µ

( )

0,1 ~Ν − = n X Z σ µ _e

Então, para testar: H0: µ= µ0

H_a: µ ≠ µ₀

Podemos calcular a região crítica do seguinte modo:

(

errodo tipoI

) (

Prejeitar H₀|H₀ verdadeira

)

P = = α

(

1ou 2|µ µ0

)

α =P X <xc X >xc =           − > − < = n S x T n S x T P c1 µ0 _ou c2 µ0

(9)

Da tabela da t_(n-1)obtemos t_c1e t_c2tais que: P(T < tc1ou T < tc2) = α n S x t c c 0 1 1 µ − = n S x t c c 0 2 2 µ − = E fazemos e

Ou, alternativamente, calculamos o nível descritivo do teste.

II. Teste de hipóteses para a média de

uma população com variância desconhecida

Calculando o nível descritivo do teste (p-valor):

(

<

)

= = −valor P X X H éverdadeira p 2 _obs| ₀

(

X X éverdadeira

)

P valor p Xobs , 2 obs|H Se <µ0 − = < 0

(

X X éverdadeira

)

P valor p Xobs , 2 obs|H Se >µ0 − = > 0

Por exemplo, para X_obs <µ₀:

onde T ~ t(n-1)         ₋ < =         ₋ < − = n S X T P n S X n S X P 0 obs 0 ₂ obs 0 2 µ µ µ

II. Teste de hipóteses para a média de

uma população com variância desconhecida

(10)

Exercício 1

Uma balança para encher pacotes de sementes

automaticamente está programada para produzir pacotes com peso médio de 20 kg. Periodicamente é feita uma inspeção para verificar se o peso médio está sob controle. Para este fim, foi selecionada uma amostra de 30 pacotes de sementes, que apresentaram uma média de 17.7 kg e uma variância de 4.3. Teste a hipótese de que a balança se desregulou e está produzindo um peso médio inferior a 20 kg. Use nível de significância de 5%.

III. Teste de hipóteses para a proporção

Vamos utilizar os mesmos passos descritos anteriormente para construir um teste de hipóteses para a proporção:

Ho: p = p0

Ha: p ≠p0 ou

H_a: p > p₀ou H_a: p < p₀ou x

2.Escolher o estimador que será usado e definir a forma da região crítica, com base na hipótese alternativa, p.ex., para Ha: p > p0: } ˆ ˆ { RC= p≥ p_c

(11)

3.Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida

(

)

_      ₋ Ν n p p p pˆ ~ , 1

(

)

₍

₎

₍

₎

_       − − > − − = > = n p p p p n p p p p P verdadeira é H p p P c c / 1 ˆ / 1 ˆ | ˆ ˆ 0 0 0 0 0 0 0 α

4.Fixar αe obter a região crítica

(

1

)

/ ˆ ... ˆ 0 0 0 ⇒ =         − − > = c c _p n p p p p Z P

III. Teste de hipóteses para a proporção

5.Concluir o teste com base na estimativa e na região crítica

Como , vamos utilizar

(

1

)

/ ~

( )

0,1 ˆ ₀ Ν − − = n p p p p Z

III. Teste de hipóteses para a proporção

Ou, alternativamente... H_o: p = p₀ H_a: p ≠p₀ou Ha: p > p0 ou Ha: p < p0 ou x

2.Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida

3.Calcular o nível descritivo do teste

(

1

)

/ ~

( )

0,1 ˆ ₀ Ν − − = n p p p p Z

(12)

(

>

)

= = −valor P p p H éverdadeira p ˆ ˆ_obs| ₀

(

)

(

)

(

)

       − − > = =         − − > − − = n p p p p Z P n p p p p n p p p p P obs obs / 1 ˆ / 1 ˆ / 1 ˆ 0 0 0 0 0 0 0 0 0

Por exemplo, para H_a:p> p_o(nestecaso,esperamos ter pˆ_obs >p₀)

5.Concluir o teste com base no nível descritivo.

III. Teste de hipóteses para a proporção

Exercício 2

Um produtor precisa decidir pela compra ou não de sementes de milho fornecidas por um distribuidor que afirma que a proporção de germinação das sementes é 0.94. Para tanto ele observou a proporção de

germinação de uma amostra aleatória simples de 100 sementes e encontrou p=0.87. Com base nesse

resultado, o produtor deveria descordar do distribuidor?

(13)

IV. Teste de hipóteses para a variância

de uma população

x

1. Hipóteses nula e alternativa

2.Escolher o estimador que será usado e definir a forma da região crítica, com base na hipótese alternativa, p.ex., para

2 0 2 0:σ =σ H      ≠ < > 2 0 2 2 0 2 2 0 2 : σ σ σ σ σ σ a H 2 0 2 :σ >σ a H

a RC será algo do tipo:

} { 2 2 c S S RC= >

3.Identificar a estatística envolvendo o parâmetro e o seu estimador, e que tenha uma distribuição conhecida.

(

) (

2

)

0 2 2 2 0 2 2 | | σ σ α=PS >Sc H éverdadeira =PS >Sc =

4.Fixar αe obter a região crítica

( )

1 2 _... 2 0 2 = ⇒       ₋ > = c c _S S n V P σ

IV. Teste de hipóteses para a variância

de uma população

5.Concluir o teste com base na estimativa e na região crítica

(

)

( )2 1 2 2 ~ 1 − − = n S n V χ σ

(14)

IV. Teste de hipóteses para a variância

de uma população

Ou, em lugar de obter a RC, obter p-valor e concluir o teste com base no p-valor

Exercício 3

Sabe-se que em uma região do país a altura média é de 1.68 m, com variância 0.30 m2_{. Um pesquisador acredita}

que a alimentação rotineira em uma cidade litorânea, sendo diferente da região como um todo, contribui para que as pessoas apresentem alturas mais homogêneas, apesar de não alterar a altura média da população da cidade. Para verificar sua suspeita, ele coletou uma amostra de 31 pessoas e obteve como estimativa para a variância o valor S_obs2 _{= 0.25 m2. Faça um teste de}