Testes de hip
Testes de hip
ó
ó
teses
teses
Gleice M S Conceição
Depto. de Ciências Biológicas - UNIFESP
Lembrando...
Segundo o TLC,X
~
N
(
µ
,
σ
2/
n
)
( )
0
,
1
~
/
n
N
X
Z
σ
µ
−
=
1~
/
−−
=
t
nn
S
X
T
µ
Testes de hipóteses
Ex. Suponha que entre pessoas sadias a
concentração de certa substância no sangue se comporta segundo um modelo Normal com média 14 unidades/ml e desvio padrão 6 unidades/ml. Pessoas sofrendo de uma doença específica têm a concentração média da substância alterada para 18 unidades/ml.
X~N(14,36) para indivíduos sadios X~N(18,36) para indivíduos doentes
Testes de hipóteses
Desejamos averiguar se um certo tratamento proposto para combater a doença é eficaz. Uma amostra aleatória de tamanho n=30 é selecionada entre os indivíduos doentes e eles são submetidos ao tratamento.
Testes de hipóteses
i=1, ... 30.
Para cada indivíduo, temos Xi~N(µ, 36), dependendo do tratamento ter sido eficiente ou não.
Como decidir se o tratamento é eficaz ou não? Caso a mostra de 30 valores forneça valor médio de
concentração alto e “próximo” de 18, teremos evidência de que o tratamento não é eficaz. Mas se o valor da média for baixo e “próximo” de 14, isto nos levaria a crer que o tratamento foi eficiente.
Testes de hipóteses
Precisamos definir um valor “limite” para
14 18
µ=18
µ=14
Para encontrar , vamos estudar probabilisticamente o problema! obs
X
cx
X
cx
Testes de hipóteses
Queremos testar se
H0: O tratamento não é eficaz (hipótese nula) Ha: O tratamento é eficaz (hipótese alternativa)
Essas hipóteses correspondem aos diferentes valores do parâmetro
µe, assim, podemos reescrevê-las como:
H0: µ= 18 Ha: µ= 14 (hipóteses simples) H0: µ= 18 Ha: µ< 18 (hipóteses compostas) H0: µ= 18 Ha: µ ≠18 unilaterais bilaterais ou
Teste de hipóteses
H0verdadeira H0falsaNão rejeitar H0 decisão
correta Erro tipo II Rejeitar H0 Erro tipo I decisão correta Situação real Decisão
Erros que podem ser cometidos:
α= P(erro tipo I) = P(rejeitar Ho | Ho é verdadeira)
Teste de hipóteses
α= P(concluir que o tratamento é eficaz quando na verdade ele não é)
β= P(concluir que o tratamento não é eficaz quando na verdade ele é)
A situação ideal é aquela em que ambas as probabilidades, αe β, são próximas de zero.
Entretanto, é fácil ver que, à medida que diminuímos α,
β tende a aumentar.
Devemos cuidar para que, ao definir as hipóteses, o erro mais importante a ser evitado seja o erro do tipo I.
Nas situações abaixo, escolha como
hipótese nula, H
0, aquela que para você
leva a um erro mais importante.
O trabalho de um operador de radar é detectar aeronaves inimigas. Quando surge alguma coisa estranha na tela, ele deve decidir entre as seguintes hipóteses:
está começando um ataque
tudo bem, apenas uma interferência
Num júri, o indivíduo está sendo julgado por uma crime. As hipóteses sujeitas ao júri são:
o acusado é inocente o acusado é culpado
Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele irá conduzir uma pesquisa de laboratório para verificar a
veracidade da afirmação. De acordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que pode testar são:
a vacina é boa a vacina não é boa
Teste de hipóteses
Fixando um valor para α, podemos calcular
(
) (
)
(
)
− < − = = < = = = n x n X P x X P P P c c σ µ σ µ µ α 18 | a verdadeir H | H rejeitar I tipo do erro 0 0 05 . 0 30 6 18 = − < xc Z P c xPor exemplo, para α = 0.05:
? 30 6 18= − c x e, da tabela da N(0,1):
Teste de hipóteses
Acabamos de fazer um teste de
hipóteses para a média de uma
população com variância
Etapas para a realização de
um teste de hipóteses
1. Estabelecer as hipóteses nula e alternativa
2. Definir a forma da região crítica, com base na hipótese alternativa
3. Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida
4. Fixar α e obter a região crítica
5. Concluir o teste com base na estimativa e na região crítica
Nível descritivo de teste
Ao realizarmos um teste de hipótese, partimos de um dado valor de α, pré-fixado, para construir a regra de decisão.
Uma alternativa é calcular deixar a cargo de quem vai utilizar as conclusões do teste a escolha do valor de α, que não precisará ser fixado a priori.
A idéia consiste em calcular, supondo que a hipótese nula seja verdadeira, a probabilidade de se obter
estimativas mais desfavoráveis ou extremas do que a que está sendo fornecida pela amostra. Esta
probabilidade será o nível descritivo, conhecido por p-valor.
Nível descritivo de teste
p-valor= P(X < Xobs| Ho é verdadeira), para Ha: µ< µ0 p-valor= P(X > Xobs| Ho é verdadeira), para Ha: µ> µ0
Para o caso do teste de hipótese unilateral:
Para o caso do teste de hipótese bilateral:
Se Xobs < µ0 , p-valor= 2 x P(X < Xobs| Ho é verdadeira) Se Xobs > µ0, p-valor= 2 x P(X > Xobs | Hoé verdadeira)
II. Teste de hipóteses para a média de
uma população com variância desconhecida
Lembrando... ( )1 ~ − − = tn n S X T µ
( )
0,1 ~Ν − = n X Z σ µ eEntão, para testar: H0: µ= µ0
Ha: µ ≠ µ0
Podemos calcular a região crítica do seguinte modo:
(
errodo tipoI) (
Prejeitar H0|H0 verdadeira)
P = = α
(
1ou 2|µ µ0)
α =P X <xc X >xc = − > − < = n S x T n S x T P c1 µ0 ou c2 µ0Da tabela da t(n-1)obtemos tc1e tc2tais que: P(T < tc1ou T < tc2) = α n S x t c c 0 1 1 µ − = n S x t c c 0 2 2 µ − = E fazemos e
Ou, alternativamente, calculamos o nível descritivo do teste.
II. Teste de hipóteses para a média de
uma população com variância desconhecida
Calculando o nível descritivo do teste (p-valor):
(
<)
= = −valor P X X H éverdadeira p 2 obs| 0(
X X éverdadeira)
P valor p Xobs , 2 obs|H Se <µ0 − = < 0(
X X éverdadeira)
P valor p Xobs , 2 obs|H Se >µ0 − = > 0Por exemplo, para Xobs <µ0:
onde T ~ t(n-1) − < = − < − = n S X T P n S X n S X P 0 obs 0 2 obs 0 2 µ µ µ
II. Teste de hipóteses para a média de
uma população com variância desconhecida
Exercício 1
Uma balança para encher pacotes de sementes
automaticamente está programada para produzir pacotes com peso médio de 20 kg. Periodicamente é feita uma inspeção para verificar se o peso médio está sob controle. Para este fim, foi selecionada uma amostra de 30 pacotes de sementes, que apresentaram uma média de 17.7 kg e uma variância de 4.3. Teste a hipótese de que a balança se desregulou e está produzindo um peso médio inferior a 20 kg. Use nível de significância de 5%.
III. Teste de hipóteses para a proporção
Vamos utilizar os mesmos passos descritos anteriormente para construir um teste de hipóteses para a proporção:
Ho: p = p0
Ha: p ≠p0 ou
Ha: p > p0 ou Ha: p < p0 ou x
1. Estabelecer as hipóteses nula e alternativa
2.Escolher o estimador que será usado e definir a forma da região crítica, com base na hipótese alternativa, p.ex., para Ha: p > p0: } ˆ ˆ { RC= p≥ pc
3.Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida
(
)
− Ν n p p p pˆ ~ , 1(
)
(
)
(
)
− − > − − = > = n p p p p n p p p p P verdadeira é H p p P c c / 1 ˆ / 1 ˆ | ˆ ˆ 0 0 0 0 0 0 0 α4.Fixar αe obter a região crítica
(
1)
/ ˆ ... ˆ 0 0 0 ⇒ = − − > = c c p n p p p p Z PIII. Teste de hipóteses para a proporção
5.Concluir o teste com base na estimativa e na região crítica
Como , vamos utilizar
(
1)
/ ~( )
0,1 ˆ 0 Ν − − = n p p p p ZIII. Teste de hipóteses para a proporção
Ou, alternativamente... Ho: p = p0 Ha: p ≠p0 ou Ha: p > p0 ou Ha: p < p0 ou x
1. Estabelecer as hipóteses nula e alternativa
2.Identificar a estatística do teste, envolvendo o parâmetro e o seu estimador, que tenha uma distribuição conhecida
3.Calcular o nível descritivo do teste
(
1)
/ ~( )
0,1 ˆ 0 Ν − − = n p p p p Z(
>)
= = −valor P p p H éverdadeira p ˆ ˆobs| 0(
)
(
)
(
)
− − > = = − − > − − = n p p p p Z P n p p p p n p p p p P obs obs / 1 ˆ / 1 ˆ / 1 ˆ 0 0 0 0 0 0 0 0 0Por exemplo, para Ha:p> po(nestecaso,esperamos ter pˆobs >p0)
5.Concluir o teste com base no nível descritivo.
III. Teste de hipóteses para a proporção
Exercício 2
Um produtor precisa decidir pela compra ou não de sementes de milho fornecidas por um distribuidor que afirma que a proporção de germinação das sementes é 0.94. Para tanto ele observou a proporção de
germinação de uma amostra aleatória simples de 100 sementes e encontrou p=0.87. Com base nesse
resultado, o produtor deveria descordar do distribuidor?
IV. Teste de hipóteses para a variância
de uma população
x
1. Hipóteses nula e alternativa
2.Escolher o estimador que será usado e definir a forma da região crítica, com base na hipótese alternativa, p.ex., para
2 0 2 0:σ =σ H ≠ < > 2 0 2 2 0 2 2 0 2 : σ σ σ σ σ σ a H 2 0 2 :σ >σ a H
a RC será algo do tipo:
} { 2 2 c S S RC= >
3.Identificar a estatística envolvendo o parâmetro e o seu estimador, e que tenha uma distribuição conhecida.
(
) (
2)
0 2 2 2 0 2 2 | | σ σ α=PS >Sc H éverdadeira =PS >Sc =4.Fixar αe obter a região crítica
( )
1 2 ... 2 0 2 = ⇒ − > = c c S S n V P σIV. Teste de hipóteses para a variância
de uma população
5.Concluir o teste com base na estimativa e na região crítica
(
)
( )2 1 2 2 ~ 1 − − = n S n V χ σIV. Teste de hipóteses para a variância
de uma população
Ou, em lugar de obter a RC, obter p-valor e concluir o teste com base no p-valor
Exercício 3
Sabe-se que em uma região do país a altura média é de 1.68 m, com variância 0.30 m2. Um pesquisador acredita
que a alimentação rotineira em uma cidade litorânea, sendo diferente da região como um todo, contribui para que as pessoas apresentem alturas mais homogêneas, apesar de não alterar a altura média da população da cidade. Para verificar sua suspeita, ele coletou uma amostra de 31 pessoas e obteve como estimativa para a variância o valor Sobs2 = 0.25 m2. Faça um teste de
Alguns resultados
Seja Xuma variável aleatória e a, bconstantes. Então
(
)
) ( ) ( 2 X Var a b) Var(aX b X aE b aX E = + + = +Sejam Xe Yvariáveis aleatórias. Então:
(
X Y)
E(X) E(Y) E + = + ) ( ) (X Var Y Var Y) Var(X− = +Além disso, se Xe Yforem independentes:
(
X Y)
E(X) E(Y) E − = − ) ( ) (X Var Y Var Y) Var(X+ = +Comparando dois grupos