• Nenhum resultado encontrado

Teste Qui-quadrado. Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

N/A
N/A
Protected

Academic year: 2021

Share "Teste Qui-quadrado. Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas"

Copied!
37
0
0

Texto

(1)

Teste Qui-quadrado



Comparando proporções



Verificando a hipótese de

(2)

Exemplo Inicial: Igualdade de Proporções

A administração de um hospital deseja verificar se luvas de três marcas

(A, B e C) são homogêneas quanto à permeabilidade a vírus.

Para isto, realizou um experimento, no qual 240 luvas da marca A,

240 luvas da marca B e 300 luvas da marca C foram submetidas à

tensão.

Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B

(55.8%) e 177 luvas da marca C (40.0%) deixaram passar vírus quando

submetidas à tensão.

Os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as três marcas possuem a mesma permeabilidade?

H0: PA = PB = PC = P

(3)

Teste de Igualdade de Proporções

(mais de uma população)

Tabela de valores observados

780 318 462 Total 300 123 177 C 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando

submetida à tensão? Marca da

luva

(4)

Construção do Teste

780 318 462 Total 300 123 177 C 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando submetida

à tensão? Marca da

luva

H0: PA = PB = PC = P

Ha: ao menos uma das permeabilidades é diferente das outras

462

ˆ

780

(5)

Construção do Teste

780 318 462 Total 300 123... 177... C 240 106... 134... B 240 89... 151 ... A Não Sim Total Deixou passar vírus quando submetida à tensão?

Marca da luva

Se H0 (PA = PB = PC = P) é verdadeira:

quantas luvas que deixam passar o vírus deveríamos esperar dentre as luvas da marca A ?

E dentre as luvas da marca B ?

E da marca C ?

462

ˆ

780

P =

(240x462/780=142.15) (240x462/780=142.15) (300x462/780=177.70) (240-142.15=97.85) (240-142.15=97.85) (300-177.70=122.30)

(6)

Construção do Teste

Note que os valores esperados sob H0 são calculados como uma função simples dos totais de linha, coluna e do total geral

(240x462/780=142.15) (240x462/780=142.15) (300x462/780=177.70) (240x318/780=97.85) (240x318/780=97.85) (300x318/780=122.30)

(total de linha)

(total de coluna)

Valor Esperado da casela

(total geral)

×

=

780 318 462 Total 300 123... 177... C 240 106... 134... B 240 89... 151 ... A Não Sim Total Deixou passar vírus quando submetida à tensão?

Marca da luva

(7)

Construção do Teste

780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida à

tensão? Marca da

luva

Tabela de Valores Observados (esperados sob H0 entre parênteses)

(8)

Construção do Teste

Tabela de Valores Observados (esperados sob H0 entre parênteses)

Estatística de Teste = (151-142.15) (89-97.85)

(134-142.15) (106-97.85)

(177-177.70) (123-122.30)

2 2 2 2 2 2 780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida à

tensão? Marca da

(9)

Construção do Teste

Tabela de Valores Observados (esperados sob H0 entre parênteses)

2 2 2 2 2 2

(151-142.15)

(89-97.85)

(134-142.15)

Estatística de Teste =

142.15

97.85

142.15

(106-97.85)

(177-177.70)

(123-122.30)

97.85

177.70

122.30

+

+

+

+

+

2

X

=

2.50

780 318 462 Total 300 123 (122.30) 177 (177.70) C 240 106 (97.85) 134 (142.15) B 240 89 (97.85) 151 (142.15) A Não Sim Total Deixou passar vírus quando submetida à

tensão? Marca da

(10)

Valores críticos para X

2

O valor de

X

2

é “grande” ou “pequeno” ?

5 g.l.

10 g.l.

0

Valores de Referência para X2  Distribuição de Probabilidade de X2

Distribuição

Qui-quadrado

2

gl

(11)
(12)

Graus de Liberdade para o Teste Qui-Quadrado

No caso do teste Qui-quadrado, os

graus de liberdade

da

distribuição de referência equivalem ao

número de caselas livres na tabela

Exemplo: Tabela 2 x 2 480 195 285 Total 240 106 134 B 240 89 151 A Não Sim Total Deixou passar vírus quando

submetida à tensão? Marca da

luva

(13)

Voltando ao exemplo inicial ….

Tabela 3 x 2  G.l. = (3-1) x (2-1) = 2 x 1 = 2

O valor da estatística

X

2 deve ser comparado aos valores de distribuição Qui-quadrado com 2 graus de liberdade.

Se

α

= 0.05,

RR :

X

2 >

χ

20.05 ; 2

Percentil que deixa uma área de

α=0.05

acima dele na distribuição Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)

2 ;gl

α

χ

(14)
(15)

Voltando ao exemplo inicial ….

O valor da estatística observado de

X

2 foi 2.50.

Como esse valor não pertence à região de valores críticos do teste qui-quadrado, a distância entre os valores observados e os valores esperados sob H0 foi considerada pequena.

Assim, o experimento não mostrou evidências estatísticas

suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais, a 5% de significância.

(16)

Se rejeitarmos a hipótese da homogeneidade das

permeabilidades usando os dados deste

experimento ….

Valor P = P[ obter um valor de

X

2 ainda “mais extremo” do que o valor observado ] X2 obs Valor P Valor P = P[

χ

2gl

> X

2 obs]

(17)

Voltando ao exemplo inicial ….

Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50. Valor P = P[

χ

2gl

> 2.50

]

2.50

Valor P = P[

χ

2gl

> 2.50

] > 0.10

Conclusão: Os dados do experimento não mostraram evidências

estatísticas suficientes para a rejeição da hipótese de que as

(18)

Teste Qui-quadrado para homogeneidade de proporções

H0: As proporções de sucesso são homogêneas para todas as populações

Ha: Ao menos uma população tem proporção de sucesso diferente das demais

2 2 1

(

)

c N i i obs i i

O

E

X

E

=

=

Onde :

N

c é o número total de caselas da tabela

O

i é o valor observado na casela i, i=1,2,…,

N

c

E

i é o valor esperado na casela i.

(total de linha)

(total de coluna)

(total geral)

i

E

=

×

(19)

Estatística X

2

simplificada para o caso da Tabela 2x2

480

N

195

(b+d)

285

(a+c)

Total 240

(c+d)

106

d

134

c

B 240

(a+b)

89

b

151

a

A Não Sim Total Deixou passar vírus quando submetida

à tensão? Marca da luva

X

N ad

bc

a

b a

c b

d c

d

2 2

=

+

+

+

+

(

)

(

)(

)(

)(

)

(20)

Resolvendo o exemplo apenas com luvas A e B ….

480

N

195

(b+d)

285

(a+c)

Total 240

(c+d)

106

d

134

c

B 240

(a+b)

89

b

151

a

A Não Sim Total Deixou passar vírus quando submetida

à tensão? Marca da luva 2 2

480(151 106 89 134)

2.49

(240)(285)(195)(240)

X

=

=

(21)

Teste Qui-quadrado de independência

N Total An A3 A2 A1 Bm .... B2 B1 Total Variável B Variável A

Um número arbitrário N de indivíduos são classificados segundo

duas variáveis qualitativas (variável A e variável B)

(22)

Exemplo:

associação entre grupo sanguíneo e

presença de uma característica de interesse

200 144 56 Total 73 64 9 O 21 14 7 AB 27 19 8 B 79 47 32 A Ausente Presente Total Característica Grupo Sangüíneo

Tabela de Classificação Cruzada

(23)

H

0

:

Variável A não está associada à Variável B

(A e B são independentes)

H

A

:

Variável A está associada à Variável B

(A e B não são independentes)

2 2 1

(

)

c N i i obs i i

O

E

X

E

=

=

Onde :

N

c é o número total de caselas da tabela

O

i é o valor observado na casela i, i=1,2,…,

N

c

E

i é o valor esperado na casela i.

(total de linha)

(total de coluna)

(total geral)

i

E

=

×

(24)

“Associação entre toxoplasmose e acidente de

trânsito em pessoas com sangue Rh negativo”

(25)

H

0

:

acidente automobilístico NÃO está associado à

presença de toxoplasmose em pessoas com Rh negativo

H

A

:

acidente automobilístico está associado à

presença de toxoplasmose em pessoas com Rh negativo

721 25 696 Total 181 11 170 Sim 540 14 526 Não Sim Não Total Acidente ? Toxoplasma 2 2

721(526 11 14 170)

4.92

(181)(696)(25)(540)

X

=

=

Valor P = P[

χ

21

> 4.92

]

(26)

(0.025 < Valor P < 0.05)

4.92

Ao nível de 5% de significância, há evidências estatísticas

suficientes a favor da hipótese de associação entre acidente

automobilístico e presença de toxoplasmose em pessoas com

sangue Rh negativo (0.025 < Valor P < 0.05).

(27)

“Associação entre toxoplasmose e acidente de

trânsito em pessoas com sangue Rh positivo”

“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”

(28)

H

0

:

acidente automobilístico NÃO está associado à

presença de toxoplasmose em pessoas com Rh positivo

H

A

:

acidente automobilístico está associado à

presença de toxoplasmose em pessoas com Rh positivo

3169 86 3083 Total 709 17 692 Sim 2460 69 2391 Não Sim Não Total Acidente ? Toxoplasma 2 2

3169(2391 17 69 692)

0.21

(2460)(709)(3083)(86)

X

=

=

Valor P = P[

χ

21

> 0.21]

(29)

(0.10 < Valor P < 0.90)

0.21

Para pessoas com sangue Rh positivo, os dados amostrais não

fornecem evidências estatísticas suficientes contra a hipótese

de independência entre acidente automobilístico e presença de

toxoplasmose (Valor P > 0.10).

(30)

Associação entre variáveis qualitativas

Amostras Dependentes

Exemplo inicial

Em um estudo sobre tipos sanguíneos de casais, gostaria-se

de verificar se existe associação entre o fator Rh do sangue

das esposas e dos esposos.

Para isto, 100 casais foram classificados quanto ao fator Rh

dos esposos e das esposas.

100

r+b

a+s

Total

s+b

b

s

Rh-a+r

r

a

Rh+ Rh -Rh+ Total Esposo Esposa

(31)

Teste Qui-quadrado de McNemar

(

)

2 2

|

| 1

(

)

McNemar

r

s

X

r

s

=

+

100 r+b a+s Total s+b b s Rh-a+r r a Rh+ Rh -Rh+ Total Esposo Esposa

Número de pares discordantes: r e s

Número de pares concordantes: a e b

H0: não há associação entre o fator Rh dos membros do casal Ha: não há associação entre o fator Rh dos membros do casal

tem distribuição 2

1

(32)

100 40 60 Total 40 40 0 Rh-60 0 60 Rh+ Rh -Rh+ Total Esposo Esposa

Associação Positiva Perfeita

(

)

2 2

| 0

0 | 1

1

(0

0)

0

McNemar

X

=

=

 

=

→ ∞

+

Valor P = P[

χ

12

>

]

= 0

Conclusão: rejeitar a hipótese de independência entre o

fator Rh dos casais

(33)

Valor P = P[

χ

12

>

0.0208

]

> 0.95

100 40 60 Total 40 16 24 Rh-60 24 36 Rh+ Rh -Rh+ Total Esposo Esposa

Não Associação Perfeita

(

)

2 2

| 24

24 | 1

1

0.0208

(24

24)

48

McNemar

X

=

=

=

+

Conclusão: não rejeitar a hipótese de independência entre o

fator Rh dos casais

(34)

Amostras Dependentes

144 119 25 Total 98 82 16 Não-Diabético 46 37 9 Diabético Nao-Diabético Diabético Total Com Infarto Sem infarto

Um estudo investiga a associação entre infarto do miocárdio e a

presença de diabetes entre os índios navajos americanos

(Coulehan et al, 1986)

Índios com episódios de infarto do miocárdio foram

emparelhados com índios sem a doença (144 pares). Cada

elemento do par foi investigado quanto à presença de diabetes.

[Coulehan et al,1986]

2

7.55 (valor-p < 0.01)

McNemar

(35)

Próxima aula

Como medir a associação entre duas

variáveis qualitativas

(36)



Exercícios da

Seção 12

(37)

Referências Bibliográficas

 Coulehan et al (1986) “Acute Myocardial Infarction Among Navajo

Indians”, 1976-1983, American Journal of Public Health, pp 412-214

 Flegr et al. (2009) “Increased incidence of traffic accidents in

Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”, BMC Infectious Diseases, vol. 9, n. 72.

 Reis, E. A.; Reis, I.A. (2000) “Exercícios Resolvidos em Introdução

à Bioestatística”, Relatório Técnico do Departamento de

Referências

Documentos relacionados

Jonlui se a pessoa onseguiu apanar o autoarro' Apresenta todos os lulos Jonlui se a pessoa onseguiu apanar o autoarro' Apresenta todos os

a) A resolução da malha e escolha do modelo de turbulência RSM se mostrou fundamental na precisão dos resultados. b) A análise via CFD se mostrou capaz de capturar

Esta variação temporal verificada no local 2 deve-se à abundância de espécies de algas presentes neste local, enquanto nos restantes locais são superabundantes espécies

A) Universalidade e equidade, em que todos os trabalhadores, urbanos e rurais, com carteira assinada ou não, empregados, desempregados ou aposentados, trabalhadores em

Regra 1: Movimente os estoques para dentro... ou para fora. Neste caso não existe estoque. Assim como em outros casos, como os que trabalham com estoques digitais, pois a indústria

Seus resultados demonstraram que: quando as políticas e práticas da gestão estratégica de pessoas são integradas às estratégias organizacionais, há uma tendência da área de

18 Como se pode ver, os dois pilares escolhidos para a fundamentação teórica da tese são convergentes e, portanto, podem ser articulados rumo a uma arquitetura teórica que dê suporte

Sua última expe- riência foi como presidente da empresa Júnior da faculdade (sem fins lucrativos) por dois anos e oito meses, onde atuou no financeiro, estratégia,