• Nenhum resultado encontrado

M´etodos cl´assicos: tabelas 2 × k

No documento MODELOS DE REGRESSÃO com apoio computacional (páginas 104-108)

A dicotomiza¸c˜ao de um fator com mais de 2 n´ıveis, a fim de tornar mais simples o estudo da associa¸c˜ao entre esse fator e uma determinada doen¸ca, pode omitir informa¸c˜oes relevantes acerca da associa¸c˜ao de cada um dos n´ıveis agrupados e a doen¸ca em estudo. Assim, sempre que poss´ıvel, deve-se manter para as an´alises o maior n´umero poss´ıvel de n´ıveis do fator. Uma tabela resultante, nesse caso, ´e dada abaixo.

Fator

Doen¸ca N´ıvel 1 N´ıvel 2 · · · N´ıvel k Total D y11 y12 · · · n1−Pk−1i=1 y1i n1

¯

D y21 y22 · · · n2−Pk−1i=1 y2i n2

Analogamente ao caso de uma ´unica tabela 2 × 2, assumimos que s˜ao amostrados n1

distribui¸c˜ao multinomial de parˆametros (πi1, . . . , πik)T, com πik = 1 −Pk−1j=1πij, i = 1, 2.

Comumente, para analisar as associa¸c˜oes entre os n´ıveis do fator e a doen¸ca, define-se um n´ıvel do fator como referˆencia, o qual formar´a com os demais as raz˜oes de chances. Escolhendo o n´ıvel 1 como referˆencia, as raz˜oes de chances ficam dadas por

ψ1 = 1 e ψj =

π1jπ21

π2jπ11

, j = 2, . . . , k,

em que ψj ´e a raz˜ao de chances entre o n´ıvel j e o n´ıvel 1 do fator. As an´alises inferˆenciais

atrav´es do uso do modelo multinomial s˜ao tratadas em textos correntes de an´alise de dados categorizados (vide, por exemplo, Agresti, 1990). Aqui, nos concentraremos no estudo do modelo condicional, que ´e obtido ap´os o condicionamento de (Yi1, . . . , Yik)T,

i = 1, 2, nas estat´ısticas suficientes minimais Y1j + Y2j = mj, j = 1, · · · , k. O modelo

resultante ´e caracterizado pela distribui¸c˜ao hipergeom´etrica multivariada n˜ao-central que depende apenas dos parˆametros de interesse ψ1, . . . , ψk (vide McCullagh e Nelder, 1989,

p. 261). Em particular, a hip´otese de ausˆencia de associa¸c˜ao completa entre os n´ıveis do fator e a doen¸ca ´e definida por H0 : ψj = 1, ∀j, que ser´a avaliada atrav´es da distribui¸c˜ao

hipergeom´etrica central k-dimensional, cuja fun¸c˜ao de probabilidades ´e o produto de k distribui¸c˜oes hipergeom´etricas centrais

f (y1|m; ψ = 1) = k Y j=1 n 1j y1j  n 2j mj−y1j  n 1j+n2j mj  , (2.11)

em que y1 = (y11, . . . , y1k)T, m = (m1, . . . , mk)T e ψ = (ψ1, . . . , ψk)T. A m´edia, variˆancia

e covariˆancia correspondentes `a distribui¸c˜ao (2.11) s˜ao, respectivamente, dadas por Ej(1) = E(Y1j|mj; ψ = 1) = mjn1 n , Vj(1) = Var(Y1j|mj; ψ = 1) = n1n2(n − mj)mj n2(n − 1) e Cj` = Cov(Y1j, Y1`|mj, m`; ψ = 1) = − mjm`n1n2 n2(n − 1), j 6= `,

em que n = n1 + n2. Um teste estat´ıstico para H0, que tem sido largamente utilizado

para testar a homogeneidade de k propor¸c˜oes (Armitage, 1971), ´e dado por XA2 = (n − 1) n k X j=1 {y1j− Ej(1)}2 ( 1 Ej(1) + 1 mj− Ej(1) ) = (n − 1)  1 n1 + 1 n2  k X j=1 {y1j − Ej(1)}2 mj , (2.12)

que segue, sob H0e para valores grandes de n1, n2e mj, ∀j, uma distribui¸c˜ao qui-quadrado

com k − 1 graus de liberdade. Entretanto, quando os n´ıveis do fator s˜ao quantitativos ou qualitativos ordinais, pode ser mais informativo o uso de um teste para a tendˆencia do risco da doen¸ca com o aumento dos n´ıveis do fator. Para ilustrar, suponha que h´a k doses xj, j = 1, . . . , k associadas aos k n´ıveis do fator. Um teste apropriado ´e considerar a

regress˜ao dos desvios {y1j−Ej(1)} sobre xj (Armitage, 1955; Mantel, 1963). A estat´ıstica

correspondente fica dada por XHOM2 = n

2(n − 1)[Pk

j=1xj{y1j− Ej(1)}]2

n1n2{nPkj=1x2jmj − (Pkj=1xjmj)2}

, (2.13)

que segue, para grandes amostras e sob H0, uma distribui¸c˜ao qui-quadrado com k − 1

graus de liberdade.

Uma outra maneira de analisar a associa¸c˜ao entre o fator e a doen¸ca ´e atrav´es da amostragem nos k n´ıveis do fator de interesse. Nesse caso, a distribui¸c˜ao resultante ´e um produto de k binomiais independentes e a hip´otese de ausˆencia de associa¸c˜ao entre o fator e a doen¸ca pode ser avaliada atrav´es do ajuste de uma regress˜ao log´ıstica, que ser´a discutida na Se¸c˜ao 2.6. Por outro lado, se tamb´em forem fixados os totais n1 e n2,

a distribui¸c˜ao condicional resultante ´e uma hipergeom´etrica n˜ao-central k-dimensional que sob H0 reduz-se a (2.11). Logo, as estat´ısticas dadas em (2.12) e (2.13) podem ser

aplicadas, pelo menos numa an´alise preliminar dos dados, para avaliar a ausˆencia de associa¸c˜ao total entre o fator e a doen¸ca.

Generaliza¸c˜oes de (2.12) e (2.13) para o caso de h estratos s˜ao dadas em Breslow e Day (1980, pgs. 148-149).

2.5

Aplica¸c˜oes

2.5.1

Influˆencia do fungicida Avadex no desenvolvimento de tu-

mor em ratos

Como ilustra¸c˜ao, analisaremos o conjunto de dados apresentado em Innes et al. (1969), referente a um estudo para avaliar o poss´ıvel efeito cancer´ıgeno do fungicida Avadex. No estudo, 403 camundongos s˜ao observados. Desses, 65 receberam o fungicida e foram acompanhados durante 85 semanas, verificando-se o desenvolvimento ou n˜ao de tumor cancer´ıgeno. Os demais animais n˜ao receberam o fungicida (grupo controle) e tamb´em foram acompanhados pelo mesmo per´ıodo, verificando-se a ocorrˆencia ou n˜ao de tumor.

Dois fatores potenciais de confundimento, sexo e ra¸ca, foram considerados nas an´alises. Os dados do experimento s˜ao resumidos na Tabela 2.1.

Em virtude dos valores relativamente altos das marginais das quatro tabelas 2 × 2 formadas pela combina¸c˜ao dos fatores sexo e ra¸ca, procedemos inicialmente uma an´alise atrav´es do modelo n˜ao-condicional. Temos ent˜ao, na primeira coluna da Tabela 2.2, as estimativas pontuais das raz˜oes de chances de tumor maligno entre o grupo tratado e o grupo controle. Na segunda coluna apresentamos os intervalos assint´oticos de 95% para ψ. Nota-se que, embora todas as estimativas sinalizem para uma associa¸c˜ao positiva, apenas o primeiro intervalo de confian¸ca n˜ao cobre o valor ψ = 1, evidenciando associa¸c˜ao apenas no primeiro estrato, ao n´ıvel de 5%.

Tabela 2.1

Classifica¸c˜ao dos camundongos quanto a ra¸ca (R1 ou R2), sexo, grupo e ocorrˆencia ou n˜ao de tumor cancer´ıgeno. Estrato Grupo Com tumor Sem tumor Total

Tratado 4 12 16 R1-Macho Controle 5 74 79 Total 9 86 95 Tratado 2 14 16 R2-Macho Controle 3 84 87 Total 5 98 103 Tratado 4 14 18 R1-Fˆemea Controle 10 80 90 Total 14 94 108 Tratado 1 14 15 R2-Fˆemea Controle 3 79 82 Total 4 93 97

O teste de homogeneidade das raz˜oes de chances forneceu X2

BD = 0, 867 (3 g.l. e

P = 0, 833), indicando fortemente pela n˜ao rejei¸c˜ao da ausˆencia de intera¸c˜ao entre os estratos. J´a o teste de Mantel-Hanszel forneceu X2

M H = 8, 289 (1 g.l. e P = 0, 004),

indicando pela rejei¸c˜ao da hip´otese de raz˜ao de chances comum igual a um, isto ´e, de que h´a fortes ind´ıcios de associa¸c˜ao entre os grupos controle e tratado. As estimativas de ψ comum deram ˆψM H = 3, 079 e ˆψW = 3, 109, com intervalo assint´otico de confian¸ca de

Tabela 2.2

Estimativas das raz˜oes de chances nos estratos. Estrato Estimativa ˜ψ Intervalo assint´otico R1-Macho 4,93 [1,28 ; 18,97] R2-Macho 4,00 [0,69 ; 23,09] R1-Fˆemea 2,29 [0,64 ; 8,14] R2-Fˆemea 1,88 [0,19 ; 48,87]

2.5.2

Efeito de um tipo de extrato vegetal na morte de embri˜oes

Consideremos agora parte dos dados de um experimento (vide Paula, Sevanes e Ogando, 1988) conduzido para avaliar o efeito de diversos extratos vegetais na mortalidade de em- bri˜oes de Biomphalaria Glabrata (hospedeiro da equistossomose). Para o extrato vegetal aquoso frio de folhas de P. Hyrsiflora, foi considerado um total de k = 7 grupos sendo que os ni embri˜oes do i-´esimo grupo foram submetidos a uma dose xi (ppm) do extrato vege-

tal, observando-se ap´os o 20o dia o n´umero de embri˜oes mortos. Os dados s˜ao resumidos

na Tabela 2.3. Para aplicar o teste de tendˆencia dado em (2.13), devemos considerar que n = 50 + · · ·+50 = 350, n1 = y1+ · · ·+y7 = 178, n2 = n −n1 = 172 e mi = 50, ∀i. Assim,

obtemos Ei(1) = 25, 43 para i = 1, . . . , 7. A estat´ıstica forneceu o valor XHOM2 = 131, 82,

que ´e altamente significativo, indicando uma forte tendˆencia crescente para a propor¸c˜ao de mortes com o aumento da dose.

Tabela 2.3

Mortalidade para o extrato vegetal aquoso.

xi 0 15 20 25 30 35 40

mi 50 50 50 50 50 50 50

yi 4 5 14 29 38 41 47

No documento MODELOS DE REGRESSÃO com apoio computacional (páginas 104-108)

Documentos relacionados