4.1 Regress˜ ao Log´ıstica
4.1.4 Interpreta¸c˜ ao para β k (raz˜ ao de chance)
Vejamos agora como ´e a interpreta¸c˜ao dos parˆametros βk na Regress˜ao Log´ıstica. Antes
Defini¸c˜ao 4.1.6 A chance (odds) de ocorrˆencia de um evento ´e definida pela raz˜ao entre a probabilidade de ocorrˆencia e de n˜ao ocorrˆencia deste evento. Em outras palavras, se p ´
e a probabilidade de um evento ocorrer a chance de ocorrˆencia desse evento ´e odds = p
1 − p.
Por exemplo, se dizemos que a chance de ocorrˆencia de uma determinada doen¸ca ´e 1 significa que o evento “ter a doen¸ca” tem mesma probabilidade de ocorrer e de n˜ao ocorrer, isto ´e este evento tem probabilidade 1/2 de ocorrer. Por outro lado, se a chance de ocorrˆencia dessa determinada doen¸ca for 1/2 significa que a probabilidade do evento “ter a doen¸ca” n˜ao ocorrer ´e 2 vezes a probabilidade dele ocorrer, ou seja, a probabilidade de um indiv´ıduo ter a doen¸ca ´e 1/3. Para terminar, se a chance de ocorrˆencia dessa determinada doen¸ca for 2 significa que a probabilidade do evento “ter a doen¸ca” ocorrer ´
e 2 vezes a probabilidade dele n˜ao ocorrer, ou seja, a probabilidade de um indiv´ıduo ter a doen¸ca ´e 2/3.
Veja que quanto maior a probabilidade do evento ocorrer maior ser´a a chance de ocorrˆencia desse evento. Veja tamb´em que 0 ≤ p ≤ 1 e 0 ≤ odds ≤ ∞.
Defini¸c˜ao 4.1.7 A raz˜ao de chance (odds ration) entre dois grupos para um determinado evento ´e definida como a raz˜ao entre a chance de ocorrˆencia desse evento em um grupo e a chance de ocorrˆencia do mesmo evento no outro grupo.
OR = odds1 odds2
Por exemplo, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia de uma determinada doen¸ca (evento) for 1 (OR = 1) significa que a chance de ocorrˆencia dessa doen¸ca nas mulheres e nos homens ´e a mesma, ou seja, nos dois grupos a probabilidade de ocorrˆencia ´e a mesma. Por outro lado, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia dessa determinada doen¸ca for 1/2 (OR = 1/2) significa que a chance de ocorrˆencia dessa doen¸ca entre as mulheres ´e metade da chance de ocorrˆencia entre os homens, ou seja, a probabilidade de ocorrˆencia entre os homens ´e maior que a probabilidade da doen¸ca ocorrer entre as mulheres. Para terminar, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia dessa doen¸ca (evento) for 2 significa que a chance de ocorrˆencia dessa doen¸ca entre as mulheres ´e o dobro da chance de ocorrˆencia entre os homens, ou seja, a probabilidade de ocorrˆencia entre as mulheres ´e maior que a probabilidade da doen¸ca ocorrer entre os homens.
Modelo Simples
J´a vimos na Defini¸c˜ao 4.1.4 que E[yi] = πi = 1 1 + e−(β0+β1xi) ou ln πi 1 − πi = β0+ β1xi
onde πi = P (yi = 1), de acordo com o modelo. Ent˜ao a chance {yi = 1} supondo o n´ıvel
xi ´e πi/(1 − πi). Podemos tamb´em definir a chance de ocorrˆencia do evento {y = 1} para
um n´ıvel x qualquer como
odds(x) = π(x) 1 − π(x).
onde π(x) = 1/ 1 + e−(β0+β1x). Assim podemos expressar a raz˜ao de chance entre os
n´ıveis x + 1 e x para a ocorrˆencia do evento {y = 1} por: OR = odds(x + 1)
odds(x) =
π(x + 1)/(1 − π(x + 1)) π(x)/(1 − π(x)) . Veja como fica a express˜ao ln(OR):
ln(OR) = ln odds(x + 1) odds(x) = ln (odds(x + 1)) − ln (odds(x)) = ln π(x + 1) 1 − π(x + 1) − ln π(x) 1 − π(x) = β0+ β1(x + 1) − (β0+ β1x) = β1. Ent˜ao, β1 = ln odds(x + 1) odds(x) = OR ⇒ eβ1 = OR
onde OR ´e a raz˜ao de chance entre os n´ıveis x + 1 e x (qualquer que seja o x) para o evento {y = 1}. Logo, eβˆ1 ser´a uma estimativa para essa raz˜ao de chance e ser´a essa a
interpreta¸c˜ao que vamos usar para este parˆametro.
Exemplo 4.1.8 Suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples para os dados y = ter ou n˜ao ter diabetes tipo 2 e x = idade do paciente. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada
ˆ
π = 1
1 + e−(−4.5+0.1x)
ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −4.5
e ˆβ1 = 0.1. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ
β1 = e0.1 = 1.105171, ou
seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 1.105171. Isso significa que a cada ano de idade a chance do paciente ter diabetes tipo 2 aumenta em torno de 10%.
Exemplo 4.1.9 Suponha agora que ajustamos o modelo de Regress˜ao Log´ıstica Simples novamente para y = ter ou n˜ao ter diabetes tipo 2, mas agora x = ter ou n˜ao ter hist´oria familiar de diabetes tipo 2. Vamos codificar x = 1 quando h´a hist´orico familiar e x = 0 caso contr´ario. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada
ˆ
π = 1
1 + e−(−3.4+2.2x)
ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −3.4
e ˆβ1 = 2.2. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ
β1 = e2.2 = 9.025013, ou
seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 9.025013. Isso significa que quando x = 1 a chance de ter diabetes ´e 9 vezes maior do que quando x = 0, ou seja, a chance de pacientes com hist´orico familiar ter diabetes ´e 9 vezes maior que a chance de pacientes sem hist´orico familiar.
Exemplo 4.1.10 Para terminar essa sequencia de exemplo suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples mais uma vez para y = ter ou n˜ao ter diabetes tipo 2, mas agora x = praticar ou n˜ao atividades f´ısica regularmente. Vamos codificar x = 1 quando o paciente pratica atividades f´ısicas regularmente e x = 0 caso contr´ario. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada
ˆ
π = 1
1 + e−(−0.51−1.5x)
ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −0.51
e ˆβ1 = −1.5. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ
β1 = e−1.5 = 0.2231302,
ou seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 0.2231302. Aquando a raz˜ao de chance for menor que 1 fica mais f´acil fazer a sua interpreta¸c˜ao pelo inverso. Se a OR entre os n´ıveis x + 1 e x ´e 0.2231302 ent˜ao a raz˜ao de chance entre os n´ıveis x e x + 1 ´e 1/0.2231302 = 4.481688. Isso significa que quando x = 0 a chance de ter diabetes ´e 4 vezes maior do que quando x = 1, ou seja, a chance de pacientes que n˜ao praticam atividade f´ısica ter diabetes ´e 4 vezes maior do que a chance de pacientes que praticam atividade f´ısica.
Para terminar a interpreta¸c˜ao de β1 no Modelo Log´ıstico Simples, a raz˜ao de chance
entre os n´ıveis x + k e x ´e definida como ekβ1. Ou seja, para o Exemplo 4.1.8 uma
estimativa para a raz˜ao de chance entre os n´ıveis x + 10 e x ´e e10 ˆβ1 = e1 = 2.718282, o
que significa que a cada 10 anos de idade que o paciente ganha a chance de ter diabetes tipo 2 aumenta mais quase 3 vezes.
Modelo M´ultiplo
No modelo m´ultiplo a interpreta¸c˜ao de βk´e equivalente a do modelo simples. A raz˜ao de
chance entre os n´ıveis xk + 1 e xk ´e eβk. Mas aqui temos que tomar mais um cuidado,
pois essa raz˜ao de chance vale considerando que as demais vari´aveis preditivas n˜ao sejam alteradas.
Exemplo 4.1.11 Suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples para os dados y = ter ou n˜ao ter diabetes tipo 2, x1 = idade do paciente, x2 = ter ou n˜ao ter
hist´oria familiar de diabetes tipo 2 e x3 = praticar ou n˜ao atividades f´ısica regularmente.
Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada ˆ
π = 1
1 + e−(−5.6+0.12x1+1.99x2−1.3x3).
Nesse caso faremos uma interpreta¸c˜ao para cada vari´avel preditiva. Considerando x1, idade, temos OR = e0.12 = 1.127497, ou seja, a cada ano de vida a chance de um
paciente ter diabetes tipo 2 aumenta em 12%, considerando pacientes com mesmo hist´o- rico familiar e mesma pr´atica de exerc´ıcios f´ısicos. Se quisermos ver o quanto aumenta a chance de ter diabetes entre pacientes com diferen¸ca de 10 anos temos que calcular e10×0.12 = 3.320117, isso significa que a chance de ter diabetes tipo 2 triplica em 10 anos,
considerando pacientes com mesmo hist´orico familiar e mesma pr´atica de exerc´ıcios f´ısi- cos.
Agora vejamos a interpreta¸c˜ao para x2. Como OR = e1.99 = 7.315534 podemos con-
vezes maior que para aqueles que n˜ao tem hist´orico familiar, considerando pacientes da mesma idade e com a mesma pr´atica de exerc´ıcios f´ısicos.
Para terminar, considere x3. Como OR = e−1.3 = 0.2725318 podemos considerar a
raz˜ao de chance entre x e x + 1, que ser´a 1/0.2725318 = 3.669297. Ent˜ao a chance de ter diabetes tipo 2 entre os pacientes sem pr´atica de exerc´ıcios f´ısicos ´e 3 vezes maior do que a chance em pacientes com pr´atica de exerc´ıcios f´ısicos, considerando pacientes com mesma idade e mesmo hist´orico familiar de diabetes tipo 2.