Teste Qui-quadrado
Comparando proporções
Verificando a hipótese de
Exemplo Inicial: Igualdade de Proporções
A administração de um hospital deseja verificar se luvas de três marcas
(A, B e C) são homogêneas quanto à permeabilidade a vírus.
Para isto, realizou um experimento, no qual 240 luvas da marca A,
240 luvas da marca B e 300 luvas da marca C foram submetidas à
tensão.
Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B
(55.8%) e 177 luvas da marca C (40.0%) deixaram passar vírus quando
submetidas à tensão.
Os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as três marcas possuem a mesma permeabilidade?
H0: PA = PB = PC = P
Teste de Igualdade de Proporções
(mais de uma população)
Tabela de valores observados
780 318 462 Total 300 123 177 C 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando
submetida à tensão? Marca da
luva
Construção do Teste
780 318 462 Total 300 123 177 C 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando submetidaà tensão? Marca da
luva
H0: PA = PB = PC = P
Ha: ao menos uma das permeabilidades é diferente das outras
462
ˆ
780
Construção do Teste
780 318 462 Total 300 123... 177... C 240 106... 134... B 240 89... 151 ... A Não Sim Total Deixou passar vírus quando submetida à tensão?Marca da luva
Se H0 (PA = PB = PC = P) é verdadeira:
quantas luvas que deixam passar o vírus deveríamos esperar dentre as luvas da marca A ?
E dentre as luvas da marca B ?
E da marca C ?
462
ˆ
780
P =
(240x462/780=142.15) (240x462/780=142.15) (300x462/780=177.70) (240-142.15=97.85) (240-142.15=97.85) (300-177.70=122.30)Construção do Teste
Note que os valores esperados sob H0 são calculados como uma função simples dos totais de linha, coluna e do total geral
(240x462/780=142.15) (240x462/780=142.15) (300x462/780=177.70) (240x318/780=97.85) (240x318/780=97.85) (300x318/780=122.30)
(total de linha)
(total de coluna)
Valor Esperado da casela
(total geral)
×
=
780 318 462 Total 300 123... 177... C 240 106... 134... B 240 89... 151 ... A Não Sim Total Deixou passar vírus quando submetida à tensão?Marca da luva
Construção do Teste
780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida àtensão? Marca da
luva
Tabela de Valores Observados (esperados sob H0 entre parênteses)
Construção do Teste
Tabela de Valores Observados (esperados sob H0 entre parênteses)
Estatística de Teste = (151-142.15) (89-97.85)
(134-142.15) (106-97.85)
(177-177.70) (123-122.30)
2 2 2 2 2 2 780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida àtensão? Marca da
Construção do Teste
Tabela de Valores Observados (esperados sob H0 entre parênteses)
2 2 2 2 2 2
(151-142.15)
(89-97.85)
(134-142.15)
Estatística de Teste =
142.15
97.85
142.15
(106-97.85)
(177-177.70)
(123-122.30)
97.85
177.70
122.30
+
+
+
+
+
2X
=
2.50
780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida àtensão? Marca da
Valores críticos para X
2O valor de
X
2é “grande” ou “pequeno” ?
5 g.l.
10 g.l.
0
Valores de Referência para X2 Distribuição de Probabilidade de X2
Distribuição
Qui-quadrado
2
gl
Graus de Liberdade para o Teste Qui-Quadrado
No caso do teste Qui-quadrado, os
graus de liberdade
da
distribuição de referência equivalem ao
número de caselas livres na tabela
Exemplo: Tabela 2 x 2 480 195 285 Total 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando
submetida à tensão? Marca da
luva
Voltando ao exemplo inicial ….
Tabela 3 x 2 G.l. = (3-1) x (2-1) = 2 x 1 = 2
O valor da estatística
X
2 deve ser comparado aos valores de distribuição Qui-quadrado com 2 graus de liberdade.Se
α
= 0.05,RR :
X
2 >χ
20.05 ; 2Percentil que deixa uma área de
α=0.05
acima dele na distribuição Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)2 ;gl
α
χ
Voltando ao exemplo inicial ….
O valor da estatística observado de
X
2 foi 2.50.Como esse valor não pertence à região de valores críticos do teste qui-quadrado, a distância entre os valores observados e os valores esperados sob H0 foi considerada pequena.
Assim, o experimento não mostrou evidências estatísticas
suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais, a 5% de significância.
Se rejeitarmos a hipótese da homogeneidade das
permeabilidades usando os dados deste
experimento ….
Valor P = P[ obter um valor de
X
2 ainda “mais extremo” do que o valor observado ] X2 obs Valor P Valor P = P[χ
2gl> X
2 obs]Voltando ao exemplo inicial ….
Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50. Valor P = P[
χ
2gl> 2.50
]2.50
Valor P = P[
χ
2gl> 2.50
] > 0.10Conclusão: Os dados do experimento não mostraram evidências
estatísticas suficientes para a rejeição da hipótese de que as
Teste Qui-quadrado para homogeneidade de proporções
H0: As proporções de sucesso são homogêneas para todas as populações
Ha: Ao menos uma população tem proporção de sucesso diferente das demais
2 2 1
(
)
c N i i obs i iO
E
X
E
=−
=
∑
Onde :N
c é o número total de caselas da tabelaO
i é o valor observado na casela i, i=1,2,…,N
cE
i é o valor esperado na casela i.(total de linha)
(total de coluna)
(total geral)
i
E
=
×
Estatística X
2simplificada para o caso da Tabela 2x2
480N
195(b+d)
285(a+c)
Total 240(c+d)
106d
134c
B 240(a+b)
89b
151a
A Não Sim Total Deixou passar vírus quando submetidaà tensão? Marca da luva
X
N ad
bc
a
b a
c b
d c
d
2 2=
−
+
+
+
+
(
)
(
)(
)(
)(
)
Resolvendo o exemplo apenas com luvas A e B ….
480N
195(b+d)
285(a+c)
Total 240(c+d)
106d
134c
B 240(a+b)
89b
151a
A Não Sim Total Deixou passar vírus quando submetidaà tensão? Marca da luva 2 2
480(151 106 89 134)
2.49
(240)(285)(195)(240)
X
=
⋅
−
⋅
=
Teste Qui-quadrado de independência
N Total An A3 A2 A1 Bm .... B2 B1 Total Variável B Variável AUm número arbitrário N de indivíduos são classificados segundo
duas variáveis qualitativas (variável A e variável B)
Exemplo:
associação entre grupo sanguíneo e
presença de uma característica de interesse
200 144 56 Total 73 64 9 O 21 14 7 AB 27 19 8 B 79 47 32 A Ausente Presente Total Característica Grupo Sangüíneo
Tabela de Classificação Cruzada
H
0:
Variável A não está associada à Variável B
(A e B são independentes)
H
A:
Variável A está associada à Variável B
(A e B não são independentes)
2 2 1
(
)
c N i i obs i iO
E
X
E
=−
=
∑
Onde :N
c é o número total de caselas da tabelaO
i é o valor observado na casela i, i=1,2,…,N
cE
i é o valor esperado na casela i.(total de linha)
(total de coluna)
(total geral)
i
E
=
×
“Associação entre toxoplasmose e acidente de
trânsito em pessoas com sangue Rh negativo”
H
0:
acidente automobilístico NÃO está associado à
presença de toxoplasmose em pessoas com Rh negativo
H
A:
acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh negativo
721 25 696 Total 181 11 170 Sim 540 14 526 Não Sim Não Total Acidente ? Toxoplasma 2 2
721(526 11 14 170)
4.92
(181)(696)(25)(540)
X
=
⋅
−
⋅
=
Valor P = P[χ
21> 4.92
](0.025 < Valor P < 0.05)
4.92
Ao nível de 5% de significância, há evidências estatísticas
suficientes a favor da hipótese de associação entre acidente
automobilístico e presença de toxoplasmose em pessoas com
sangue Rh negativo (0.025 < Valor P < 0.05).
“Associação entre toxoplasmose e acidente de
trânsito em pessoas com sangue Rh positivo”
“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”
H
0:
acidente automobilístico NÃO está associado à
presença de toxoplasmose em pessoas com Rh positivo
H
A:
acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh positivo
3169 86 3083 Total 709 17 692 Sim 2460 69 2391 Não Sim Não Total Acidente ? Toxoplasma 2 2
3169(2391 17 69 692)
0.21
(2460)(709)(3083)(86)
X
=
⋅
−
⋅
=
Valor P = P[χ
21> 0.21]
(0.10 < Valor P < 0.90)
0.21Para pessoas com sangue Rh positivo, os dados amostrais não
fornecem evidências estatísticas suficientes contra a hipótese
de independência entre acidente automobilístico e presença de
toxoplasmose (Valor P > 0.10).
Associação entre variáveis qualitativas
Amostras Dependentes
Exemplo inicial
Em um estudo sobre tipos sanguíneos de casais, gostaria-se
de verificar se existe associação entre o fator Rh do sangue
das esposas e dos esposos.
Para isto, 100 casais foram classificados quanto ao fator Rh
dos esposos e das esposas.
100
r+b
a+s
Totals+b
b
s
Rh-a+r
r
a
Rh+ Rh -Rh+ Total Esposo EsposaTeste Qui-quadrado de McNemar
(
)
2 2|
| 1
(
)
McNemarr
s
X
r
s
−
−
=
+
100 r+b a+s Total s+b b s Rh-a+r r a Rh+ Rh -Rh+ Total Esposo EsposaNúmero de pares discordantes: r e s
Número de pares concordantes: a e b
H0: não há associação entre o fator Rh dos membros do casal Ha: não há associação entre o fator Rh dos membros do casal
tem distribuição 2
1
100 40 60 Total 40 40 0 Rh-60 0 60 Rh+ Rh -Rh+ Total Esposo Esposa
Associação Positiva Perfeita
(
)
2 2| 0
0 | 1
1
(0
0)
0
McNemarX
=
−
−
=
=→ ∞
+
Valor P = P[
χ
12>
∞
]
= 0
Conclusão: rejeitar a hipótese de independência entre o
fator Rh dos casais
Valor P = P[
χ
12>
0.0208
]
> 0.95
100 40 60 Total 40 16 24 Rh-60 24 36 Rh+ Rh -Rh+ Total Esposo EsposaNão Associação Perfeita
(
)
2 2| 24
24 | 1
1
0.0208
(24
24)
48
McNemarX
=
−
−
=
=
+
Conclusão: não rejeitar a hipótese de independência entre o
fator Rh dos casais
Amostras Dependentes
144 119 25 Total 98 82 16 Não-Diabético 46 37 9 Diabético Nao-Diabético Diabético Total Com Infarto Sem infartoUm estudo investiga a associação entre infarto do miocárdio e a
presença de diabetes entre os índios navajos americanos
(Coulehan et al, 1986)
Índios com episódios de infarto do miocárdio foram
emparelhados com índios sem a doença (144 pares). Cada
elemento do par foi investigado quanto à presença de diabetes.
[Coulehan et al,1986]
2
7.55 (valor-p < 0.01)
McNemar
Próxima aula
Como medir a associação entre duas
variáveis qualitativas
Exercícios da
Seção 12
Referências Bibliográficas
Coulehan et al (1986) “Acute Myocardial Infarction Among Navajo
Indians”, 1976-1983, American Journal of Public Health, pp 412-214
Flegr et al. (2009) “Increased incidence of traffic accidents in
Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”, BMC Infectious Diseases, vol. 9, n. 72.
Reis, E. A.; Reis, I.A. (2000) “Exercícios Resolvidos em Introdução
à Bioestatística”, Relatório Técnico do Departamento de