Bioestatística e Computação I
Testes de Hipótese para
Testes de Hipótese para
Comparação de 2 Médias
Comparação de 2 Médias
Maria Virginia P Dutra
Eloane G Ramos
Vania Matos Fonseca
Pós Graduação em Saúde da Mulher e da Criança IFF – FIOCRUZ
Comparação de duas populações
●
Invasão francesa na Itália - 1537
● Os ferimentos por armas de fogo eram
cauterizados com óleo de sabugueiro em ebulição.
● Numa ocasião o dito óleo faltou e o cirurgião do
exército Ambroise Pare passou a aplicar um
digestivo feito de gemas de ovos, óelo de rosas e terebentina.
● Surpreendentemente, no dia seguinte, os que
haviam sido tratados com o digestivo estavam com pouca dor, inflamação ou inchaço,
enquanto os que haviam sido tratados com o óleo quente estavam com febre e muita dor.
Comparação de duas populações
●
Bioimpedância como indicador de gravidade
● Os parâmetros da bioimpedância são medidos
em pacientes atendidos na puericultura (grupo controle) e em pacientes sépticos internados na UPG-IFF (grupo sepse).
● Deseja-se determinar se as médias dos
parâmetros da bioimpedância são
significativamente diferentes entre os dois grupos.
Comparação de duas populações
●
Dieta de farelo de aveia para baixar o LDL
● Deseja-se determinar se o farelo de aveia
auxilia a baixar os níveis séricos de colesterol.
● Alguns indivíduos foram aleatoriamente
colocados em uma dieta de farelo de aveia ou de flocos de milho. Após duas semanas seus níveis de LDL foram medidos.
● A dieta de cada um foi então invertida e, após
mais duas semanas, o nível de colesterol LDL foi novamente registrado.
● Um teste de hipótese será conduzido para
determinar se as médias de nível de colesterol LDL são signif. diferentes entre os dois grupos.
Comparação de duas populações
●
Efeito do ruído sonoro na FR de prematuros
● Deseja-se determinar se o ruído de alta
intensidade afeta a FR de prematuros internados em UTI neonatal.
● Para cada recém-nascido, registrou-se
simultaneamente a FR e o ruído sonoro no interior da incubadora.
● Dado que o limiar de ruído recomendado em
ambiente hospitalar é 65dBA, comparou-se a média de FR durante o tempo em que o ruído ficou abaixo do limiar com a respectiva média durante o tempo de ruído acima do limiar.
Comparação de duas populações
●
Ensaio clínico
● Divide-se um grupo homogêneo em dois e
aplica-se duas intervenções distintas
●
Estudo observacional
● Valores espontâneos da variável de interesse
em dois grupos ou momentos distintos
●
Amostras pareadas
● Cada indivíduo é medido duas vezes em
momentos ou situações distintas
Comparação de duas populações
●
Comparação de duas médias desconhecidas
● μ
1
● μ
2
●
Qual a diferença em relação ao teste de
uma média?
Teste t para duas médias
●
O teste é o mesmo para estudo de
intervenção ou observacional
●
Amostras pareadas
● Teste t pareado
●
Amostras independentes
Teste t pareado
●
Cada indivíduo tem duas medições.
● Uma antes e outra depois de uma intervenção
ou de uma evolução natural.
– auto-emparelhamento
● Cada indivíduo recebe um par que seja parecido
com ele em relação a variáveis de interesse (ex.: sexo, idade, ...).
Teste t pareado
●
Problema
● 63 indivíduos com DAC participaram de um
estudo para determinar se existe relação entre a exposição a monóxido de carbono e o
decréscimo de tempo para experimentar angina durante exercícios.
– Cada um dos indivíduos realizou 2 baterias de teste.
Na primeira, foram feitos 2 testes: um antes e outro após 1 hora descansando em ar ambiente. O
decréscimo de tempo para apresentar angina foi registrado.
– Na segunda bateria também realizaram 2 testes: um
antes e outro após 1 hora descansando em ar com monóxido de carbono. O decréscimo de tempo para apresentar angina foi novamente registrado.
Teste t pareado
Indivíduo Ar puro Ar poluído
1 2.6 13.2 2 -11.5 -3.9 3 31.0 33.5 4 25.2 35.7 5 16.7 22.7 6 -1.0 1.6 7 -0.4 29.7 8 -4.2 16.2 9 -13.1 -23.0 10 26.3 -5.7
●
Redução percentual do tempo para angina
após 1 hora respirando ar puro ou ar
poluído
● Primeiros
10
Teste t pareado
●
Queda do tempo (%) para angina após 1
hora respirando ar puro ou ar poluído
● Primeiros 10 indivíduos – Há evidência de que a redução de tempo seja diferente? Pe rc e n t d e cr e a se .5 1 2 2.5 -30 -20 -10 0 10 20 30 40 Ar puro Ar poluído
Teste t pareado
●
Queda do tempo (%) para angina após 1
hora respirando ar puro ou ar poluído
● Primeiros 10 indivíduos – Há evidência de que a redução de tempo seja diferente? – Variabilidade entre indivíduos P e rc e n t d e cr e a se .5 1 2 2.5 -30 -20 -10 0 10 20 30 40 Ar puro Ar poluído
Teste t pareado
●
Primeiro, defina as diferenças individuais d
iIndivíduo
i Ar puroRt1 Ar poluídoRt2 d = Rt1 - Rt2Diferença
1 2.6 13.2 -10.6 2 -11.5 -3.9 -7.6 3 31.0 33.5 -2.5 4 25.2 35.7 -10.5 5 16.7 22.7 -6.0 6 -1.0 1.6 -2.6 7 -0.4 29.7 -30.1 8 -4.2 16.2 -20.4 9 -13.1 -23.0 9.9 10 26.3 -5.7 32 d = i=1∑ n di n
Teste t pareado
●
Segundo, defina as hipóteses do teste
● H
0: μd = 0
● H
A: μd ≠ 0
● μ
d média populacional das diferenças →
● → média amostral das difrenças
● Reduz-se a um teste t de uma média com
μ0=0 e n-1 graus de liberdade d d = ∑ i=1 n di n
Teste t pareado
●
Terceiro, calcule a estatística de teste
● s
d desvio-padrão das diferenças →
● μ 0=0 sd=
∑
i=1 n di−d 2 n−1 tn−1= d − 0 sd /
nIndivíduo i Ar puro Rt1i Ar poluídoRt2i di = Rt1Diferençai - Rt2i 1 2.6 13.2 -10.6 2 -11.5 -3.9 -7.6 3 31.0 33.5 -2.5 4 25.2 35.7 -10.5 5 16.7 22.7 -6.0 6 -1.0 1.6 -2.6 7 -0.4 29.7 -30.1 8 -4.2 16.2 -20.4 9 -13.1 -23.0 9.9 10 26.3 -5.7 32 d i−d di−d 2 d =x1−x2 ● s
Teste t pareado
n=63 0=0 d =−6,63 sd=20,29●
Há evidência para rejeitar H
0?
Teste t pareado
n=63 0=0 d =−6,63 sd=20,29 t62= d − 0 sd /
n = −6,63 20,29/
63 =−2,59●
Pela tabela A.4
● P(t
60>2,59) < 0,01, logo
● P(t
62>2,59) < 0,01
●
Como o teste é bilateral
● p = P(t
62>2,59 ou t62<-2,59) < 2 x 0,01
● p < 0,02
Teste t pareado
n=63 0=0 d =−6,63 sd=20,29 t62= d − 0 sd /
n = −6,63 20,29/
63 =−2,59 ●p < 0,02
● Se α=0,05 ● Rejeita-se H 0: μd=0 ● Em favor de HA: μd≠0, ou seja: existe diferença
● Há evidência significativa (α=5%) de que a
exposição por 1 hora ao monóxido de carbono diminua o tempo para angina durante o teste de exercícios, mais do que a não exposição.
Teste t pareado
●
Qual a média dessa redução?
● Na média, a exposição ao monóx. carb. causa
uma redução estimada de 6,63 pp no tempo
para angina em relação a exposição ao ar puro.
●
Qual o intervalo de confiança de 95% para
essa média?
● Pela tab. A.4: P(t
60>tc)=0,025 t→ c=2,0
IC95 %=d±tc×sd
nIC95 %≈−6,63±2×20,29
Teste t pareado
●
Em que outras situações podemos usar o
teste t pareado?
Teste t para duas populações independentes
●População
● Grupo 1 – Controle – μ 1 e σ1 ● Grupo 2 – tratamento, doentes – μ 2 e σ2 ● Parâmetros desconhecidos ●Amostra
● Grupo 1 – n 1 – e s1 ● Grupo 2 – n 2 – e s 2 ● Estimadores x1 x2Teste t para duas populações independentes
●
Problema
● Deseja-se determinar se há evidências de que o
nível sérico de ferro seja diferente entre
crianças saudáveis e as que sofrem de fibrose cística.
● Para o grupo controle, são selecionadas
aleatoriamente crianças que são atendidas na puericultura do IFF.
● Para o grupo FC, são selecionados os pacientes
atendidos no Centro de Referência do mesmo hospital.
Teste t para duas populações independentes
●
Os dois grupos são independentes
● μ
1 e σ1: média e desvio-padrão populacional do
nível sérico de ferro no grupo controle.
● μ
2 e σ2: média e desvio-padrão populacional do
nível sérico de ferro no grupo com FC.
● Nas amostras
x1 e x2
Teste t para duas populações independentes
●Hipótese nula
● H 0: μ1 = μ2 ●Hipótese alternativa
● H A: μ1 ≠ μ2●
O que mudou em relação ao teste para uma
média?
Teste t para duas populações independentes
●
As hipóteses podem ser reescritas como
● H
0: μ1–μ2 = 0
● H
A: μ1–μ2 ≠ 0
● Selecionam-se as duas amostras e obtém-se
x1 e x2
Teste t para duas populações independentes
●
Pelo TCL:
●
Analogamente, se os grupos são
independentes
X ~N
,
n
⇒ z= x− /
n z=x1−x2−1−2
12/n122/n2 X 1− X 2 é aproximadamente normal com média 1−2 e variância igual a soma das duas variâncias.
Teste t para duas populações independentes
tgl=x1−x2−1−2
s12/n1s22/n2●
Como o desvio-padrão populacional é
(quase) sempre desconhecido
● O número exato de gl é difícil de calcular
● Utiliza-se uma aproximação
– Arredonda-se gl para o inteiro mais baixo
gl=
s1 2 /n1s22/n2
2
s12/n1
2 n1−1
s22/n2
2 n2−1
estatística de testeTeste t para duas populações independentes
●
Dados do problema
Há evidências a priori de que H
0seja falsa?
H 0:1−2=0 H A: 1−2≠0
Grupo controle: n1=9, x1=18,9 mol /l , s1=5,9 mol /l Grupo com FC: n2=13, x2=11,9 mol /l , s2=6,3 mol /l
8 12 16 20 24
FC
Controle
Nível sérico ferro (μmol/l) IC 95%
Teste t para duas populações independentes
tgl=x1−x2−1−2
s12/n1s22/n2 = x1−x2
s12/n1s22/n2= 18,9−11,9
5,92/96,32/13=2,66 ● Assumindo H 0 verdadeira gl=
s1 2 /n1s22/n2
2
s12/n1
2 n1−1
s22/n2
2 n2−1 =
5,9 2 /96,32/13
2
5,92/9
2 9−1
6,32/13
2 13−1 =18,14≈18 H 0:1−2=0 H A:1−2≠0 n1=9, x1=18,9 , s1=5,9 n2=13, x2=11,9 , s2=6,3Teste t para duas populações independentes
t18=2,66
●
Pela tabela A.4
● P(t
18>2,66) < 0,01
●
Como o teste é bilateral
● p = P(t
18>2,66 ou t18<-2,66) < 2 x 0,01
● p-valor < 0,02
Teste t para duas populações independentes
●p < 0,02
● Se α=0,05 ● Rejeita-se H 0: μ1=μ2 ● Em favor de H A: μ1≠μ2● Há evidência significativa (α=5%) de que o nível
sérico de ferro seja diferente entre crianças saudáveis e as que sofrem de fibrose cística.
Teste t para duas populações independentes
●
Qual a média dessa diferença?
● Uma estimativa da média da diferença do nível
sérico de ferro entre crianças normais e com FC é
●
●
Qual o intervalo de confiança de 95% para
essa diferença média?
● Pela tab. A.4: P(t
18 > tc) = 0,025 t→ c=2,101 IC95 %=x1−x2±tc×
s12 n1 s22 n2 IC95 %=7±2,101×2,63=7±5,53=1,47 a 12,53 x1−x2=18,9−11,9=7 mol /lTeste t para duas populações independentes
●
Cite mais alguns exemplos de estudos que
necessitarão do teste t para duas
Resumindo
H0 Estatística de
teste gl bilateralp-valor
=0 1=2 ou 1−2=0 d=0 z=x−0 /
n t=x−0 s/
n t= x1−x2
s12 n1 s22 n2 t= d sd /
n n−1-
s12 n1 s22 n2
2
s12 n1
2 n1−1
s22 n2
2 n2−1 2 p op u la çõ e s In de p en d en te s 2× P tglt 2× P tglt 2× P tglt n−1 P a re a -d a s 1 p op u la çã o 2× P Z zExercício
● Deseja-se investigar os efeitos de um
medicamento anti-hipertensivo em pessoas acima de 60 anos com hipertensão sistólica
isolada. Para tal, selecionou-se aleatoriamente uma amostra de 2308 indivíduos para tomarem o medicamento e outra de 2293 para tomarem placebo, durante 1 ano. A pressão sanguínea sistólica média populacional do grupo de
tratamento é μ1 e do grupo controle μ2.
● Nas amostras encontrou-se
– Conduza o teste de hipótese adequado com α=0,05.
x1=142,5 mmHg , s1=15,7 mmHg