• Nenhum resultado encontrado

Interpreta¸c˜ ao para β k (raz˜ ao de chance)

No documento Notas de Aula Modelos Lineares I - GET00138 (páginas 105-109)

4.1 Regress˜ ao Log´ıstica

4.1.4 Interpreta¸c˜ ao para β k (raz˜ ao de chance)

Vejamos agora como ´e a interpreta¸c˜ao dos parˆametros βk na Regress˜ao Log´ıstica. Antes

Defini¸c˜ao 4.1.6 A chance (odds) de ocorrˆencia de um evento ´e definida pela raz˜ao entre a probabilidade de ocorrˆencia e de n˜ao ocorrˆencia deste evento. Em outras palavras, se p ´

e a probabilidade de um evento ocorrer a chance de ocorrˆencia desse evento ´e odds = p

1 − p.

Por exemplo, se dizemos que a chance de ocorrˆencia de uma determinada doen¸ca ´e 1 significa que o evento “ter a doen¸ca” tem mesma probabilidade de ocorrer e de n˜ao ocorrer, isto ´e este evento tem probabilidade 1/2 de ocorrer. Por outro lado, se a chance de ocorrˆencia dessa determinada doen¸ca for 1/2 significa que a probabilidade do evento “ter a doen¸ca” n˜ao ocorrer ´e 2 vezes a probabilidade dele ocorrer, ou seja, a probabilidade de um indiv´ıduo ter a doen¸ca ´e 1/3. Para terminar, se a chance de ocorrˆencia dessa determinada doen¸ca for 2 significa que a probabilidade do evento “ter a doen¸ca” ocorrer ´

e 2 vezes a probabilidade dele n˜ao ocorrer, ou seja, a probabilidade de um indiv´ıduo ter a doen¸ca ´e 2/3.

Veja que quanto maior a probabilidade do evento ocorrer maior ser´a a chance de ocorrˆencia desse evento. Veja tamb´em que 0 ≤ p ≤ 1 e 0 ≤ odds ≤ ∞.

Defini¸c˜ao 4.1.7 A raz˜ao de chance (odds ration) entre dois grupos para um determinado evento ´e definida como a raz˜ao entre a chance de ocorrˆencia desse evento em um grupo e a chance de ocorrˆencia do mesmo evento no outro grupo.

OR = odds1 odds2

Por exemplo, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia de uma determinada doen¸ca (evento) for 1 (OR = 1) significa que a chance de ocorrˆencia dessa doen¸ca nas mulheres e nos homens ´e a mesma, ou seja, nos dois grupos a probabilidade de ocorrˆencia ´e a mesma. Por outro lado, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia dessa determinada doen¸ca for 1/2 (OR = 1/2) significa que a chance de ocorrˆencia dessa doen¸ca entre as mulheres ´e metade da chance de ocorrˆencia entre os homens, ou seja, a probabilidade de ocorrˆencia entre os homens ´e maior que a probabilidade da doen¸ca ocorrer entre as mulheres. Para terminar, se a raz˜ao de chance entre as mulheres (grupo 1) e os homens (grupo 2) para a ocorrˆencia dessa doen¸ca (evento) for 2 significa que a chance de ocorrˆencia dessa doen¸ca entre as mulheres ´e o dobro da chance de ocorrˆencia entre os homens, ou seja, a probabilidade de ocorrˆencia entre as mulheres ´e maior que a probabilidade da doen¸ca ocorrer entre os homens.

Modelo Simples

J´a vimos na Defini¸c˜ao 4.1.4 que E[yi] = πi = 1 1 + e−(β0+β1xi) ou ln  πi 1 − πi  = β0+ β1xi

onde πi = P (yi = 1), de acordo com o modelo. Ent˜ao a chance {yi = 1} supondo o n´ıvel

xi ´e πi/(1 − πi). Podemos tamb´em definir a chance de ocorrˆencia do evento {y = 1} para

um n´ıvel x qualquer como

odds(x) = π(x) 1 − π(x).

onde π(x) = 1/ 1 + e−(β0+β1x). Assim podemos expressar a raz˜ao de chance entre os

n´ıveis x + 1 e x para a ocorrˆencia do evento {y = 1} por: OR = odds(x + 1)

odds(x) =

π(x + 1)/(1 − π(x + 1)) π(x)/(1 − π(x)) . Veja como fica a express˜ao ln(OR):

ln(OR) = ln odds(x + 1) odds(x)  = ln (odds(x + 1)) − ln (odds(x)) = ln  π(x + 1) 1 − π(x + 1)  − ln  π(x) 1 − π(x)  = β0+ β1(x + 1) − (β0+ β1x) = β1. Ent˜ao, β1 = ln  odds(x + 1) odds(x)  = OR ⇒ eβ1 = OR

onde OR ´e a raz˜ao de chance entre os n´ıveis x + 1 e x (qualquer que seja o x) para o evento {y = 1}. Logo, eβˆ1 ser´a uma estimativa para essa raz˜ao de chance e ser´a essa a

interpreta¸c˜ao que vamos usar para este parˆametro.

Exemplo 4.1.8 Suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples para os dados y = ter ou n˜ao ter diabetes tipo 2 e x = idade do paciente. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada

ˆ

π = 1

1 + e−(−4.5+0.1x)

ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −4.5

e ˆβ1 = 0.1. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ

β1 = e0.1 = 1.105171, ou

seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 1.105171. Isso significa que a cada ano de idade a chance do paciente ter diabetes tipo 2 aumenta em torno de 10%.

Exemplo 4.1.9 Suponha agora que ajustamos o modelo de Regress˜ao Log´ıstica Simples novamente para y = ter ou n˜ao ter diabetes tipo 2, mas agora x = ter ou n˜ao ter hist´oria familiar de diabetes tipo 2. Vamos codificar x = 1 quando h´a hist´orico familiar e x = 0 caso contr´ario. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada

ˆ

π = 1

1 + e−(−3.4+2.2x)

ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −3.4

e ˆβ1 = 2.2. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ

β1 = e2.2 = 9.025013, ou

seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 9.025013. Isso significa que quando x = 1 a chance de ter diabetes ´e 9 vezes maior do que quando x = 0, ou seja, a chance de pacientes com hist´orico familiar ter diabetes ´e 9 vezes maior que a chance de pacientes sem hist´orico familiar.

Exemplo 4.1.10 Para terminar essa sequencia de exemplo suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples mais uma vez para y = ter ou n˜ao ter diabetes tipo 2, mas agora x = praticar ou n˜ao atividades f´ısica regularmente. Vamos codificar x = 1 quando o paciente pratica atividades f´ısicas regularmente e x = 0 caso contr´ario. Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada

ˆ

π = 1

1 + e−(−0.51−1.5x)

ou seja, as estimativas de m´axima verossimilhan¸ca para os parˆametros foram ˆβ0 = −0.51

e ˆβ1 = −1.5. Nesse caso a estimativa para a raz˜ao de chace ´e e ˆ

β1 = e−1.5 = 0.2231302,

ou seja, a raz˜ao de chance entre os n´ıveis x + 1 e x para o evento {y = 1} ´e 0.2231302. Aquando a raz˜ao de chance for menor que 1 fica mais f´acil fazer a sua interpreta¸c˜ao pelo inverso. Se a OR entre os n´ıveis x + 1 e x ´e 0.2231302 ent˜ao a raz˜ao de chance entre os n´ıveis x e x + 1 ´e 1/0.2231302 = 4.481688. Isso significa que quando x = 0 a chance de ter diabetes ´e 4 vezes maior do que quando x = 1, ou seja, a chance de pacientes que n˜ao praticam atividade f´ısica ter diabetes ´e 4 vezes maior do que a chance de pacientes que praticam atividade f´ısica.

Para terminar a interpreta¸c˜ao de β1 no Modelo Log´ıstico Simples, a raz˜ao de chance

entre os n´ıveis x + k e x ´e definida como ekβ1. Ou seja, para o Exemplo 4.1.8 uma

estimativa para a raz˜ao de chance entre os n´ıveis x + 10 e x ´e e10 ˆβ1 = e1 = 2.718282, o

que significa que a cada 10 anos de idade que o paciente ganha a chance de ter diabetes tipo 2 aumenta mais quase 3 vezes.

Modelo M´ultiplo

No modelo m´ultiplo a interpreta¸c˜ao de βk´e equivalente a do modelo simples. A raz˜ao de

chance entre os n´ıveis xk + 1 e xk ´e eβk. Mas aqui temos que tomar mais um cuidado,

pois essa raz˜ao de chance vale considerando que as demais vari´aveis preditivas n˜ao sejam alteradas.

Exemplo 4.1.11 Suponha que ajustamos o modelo de Regress˜ao Log´ıstica Simples para os dados y = ter ou n˜ao ter diabetes tipo 2, x1 = idade do paciente, x2 = ter ou n˜ao ter

hist´oria familiar de diabetes tipo 2 e x3 = praticar ou n˜ao atividades f´ısica regularmente.

Para esse modelo encontramos a seguinte fun¸c˜ao de regress˜ao estimada ˆ

π = 1

1 + e−(−5.6+0.12x1+1.99x2−1.3x3).

Nesse caso faremos uma interpreta¸c˜ao para cada vari´avel preditiva. Considerando x1, idade, temos OR = e0.12 = 1.127497, ou seja, a cada ano de vida a chance de um

paciente ter diabetes tipo 2 aumenta em 12%, considerando pacientes com mesmo hist´o- rico familiar e mesma pr´atica de exerc´ıcios f´ısicos. Se quisermos ver o quanto aumenta a chance de ter diabetes entre pacientes com diferen¸ca de 10 anos temos que calcular e10×0.12 = 3.320117, isso significa que a chance de ter diabetes tipo 2 triplica em 10 anos,

considerando pacientes com mesmo hist´orico familiar e mesma pr´atica de exerc´ıcios f´ısi- cos.

Agora vejamos a interpreta¸c˜ao para x2. Como OR = e1.99 = 7.315534 podemos con-

vezes maior que para aqueles que n˜ao tem hist´orico familiar, considerando pacientes da mesma idade e com a mesma pr´atica de exerc´ıcios f´ısicos.

Para terminar, considere x3. Como OR = e−1.3 = 0.2725318 podemos considerar a

raz˜ao de chance entre x e x + 1, que ser´a 1/0.2725318 = 3.669297. Ent˜ao a chance de ter diabetes tipo 2 entre os pacientes sem pr´atica de exerc´ıcios f´ısicos ´e 3 vezes maior do que a chance em pacientes com pr´atica de exerc´ıcios f´ısicos, considerando pacientes com mesma idade e mesmo hist´orico familiar de diabetes tipo 2.

No documento Notas de Aula Modelos Lineares I - GET00138 (páginas 105-109)