Modelos Lineares Generalizados
Análise de Regressão
Prof. MSc. Danilo Scorzoni Ré
FMU – Estatística Aplicada
Análise de Regressão
Data Tópico Teórico Tópico Prático
04/05/2015 Conceitos Introdutórios Revisão do R, Análises Univariadas, Análises Bivariadas
11/05/2015 Regressão Linear Simples Regressão Linear Simples e Gráficos
18/05/2015 Premissas do Modelo Linear Análise de Resíduos e Transformações nas Variáveis
25/05/2015 Regressão Linear Múltipla Análise de Regressão Linear Múltipla
01/06/2015 Análise de Variância Análise de Variância e Comparações Múltiplas
08/06/2015 Não Haverá Exercícios de Fixação
12/06/2015 ATIVIDADE EXTRA CLASSE
15/06/2015 Modelos Lineares Generalizados Regressão Logística, Regressão de Poisson e Regressão Gama
22/06/2015 Análise Preditiva Análise Preditiva
29/06/2015 AVALIAÇÃO FINAL
Introdução ao MLG
Análise de Regressão
Prof. MSc. Danilo Scorzoni Ré
FMU – Estatística Aplicada
Modelos Lineares Generalizados
Modelos Lineares Generalizados – Conceitos Gerais
• Diversos pesquisadores lançaram metodologias estatísticas para se realizar a modelagem de dados utilizando diferentes tipos de distribuição para as
variáveis respostas. Dentre as mais conhecidas, temos:
• Regressão Logística para dados com distribuição Bernoulli ou binomial • Regressão Log-Linear para dados com distribuição de Poisson
• Regressão Beta para dados com distribuição Beta
• Regressão Logarítmica para dados com distribuição Log-normal • Entre outras...
Modelos Lineares Generalizados
Modelos Lineares Generalizados – Conceitos Gerais
• Nelder e Wedderburn unificaram todas estas técnicas em uma só teoria, chamada de teoria dos Modelos Lineares Generalizados.
• Dentro desta teoria, encontram-se todas as distribuições de dados que façam parte da família Exponencial de distribuições: normal, Poisson, binomial,
Modelos Lineares Generalizados
Modelos Lineares Generalizados – Conceitos Gerais
• O cerne desta teoria é dividir o modelo de regressão em 3 componentes:
• A variável resposta, componente aleatório do modelo, deve possuir uma distribuição pertencente à família exponencial.
• Variáveis preditoras na forma de estrutura linear, constituindo o
componente sistemático do modelo.
• A ligação entre o componente aleatório e sistemático, feita através de uma função de ligação adequada para cada distribuição.
Modelos Lineares Generalizados
Modelos Lineares Generalizados – Conceitos Gerais
• Na especificação teórica, chamamos o componente sistemático de 𝝁, e a função de ligação de 𝜼:
Modelos Lineares Generalizados
Modelos Lineares Generalizados – Aplicação
• Ensaios de dose-resposta são aqueles em que determinada droga é ministrada em diferentes doses a diferentes indivíduos e o resultado esperado é a mudança de um estado (por exemplo, de doente para sadio).
• Ou quando um inseticida é aplicado em diferentes doses e espera-se que os insetos morram em um determinado período.
• Os objetivos destes ensaios é estimar a probabilidade de sucesso, como função de variáveis explanatórias e então estimar a probabilidade de doses efetivas.
Modelos Lineares Generalizados
Modelos Lineares Generalizados
Regressão Logística
Análise de Regressão
Prof. MSc. Danilo Scorzoni Ré
FMU – Estatística Aplicada
Regressão Logística
Regressão Logística – Conceitos
• A regressão logística é o caso particular quando a distribuição da variável resposta é
binária ou uma proporção.
Binária Proporção
• Reagiu ou não a um medicamento.
• Causou ou não a morte do inseto. • Entrou ou não em inadimplência. • % de sementes que germinaram. • % de pessoas que compraram o produto. • % de plantas que
Regressão Logística
Regressão Logística – Exemplo
• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:
Regressão Logística
Regressão Logística – Exemplo
ID 1 2 3 4 5 6 7 8 9 10 11 12 AGE 20 23 24 25 25 26 26 28 28 29 30 30 CHD 0 0 0 0 1 0 0 0 0 0 0 0 ID 13 14 15 16 17 18 19 20 21 22 23 24 AGE 30 30 30 30 32 32 33 33 34 34 34 34 CHD 0 0 0 1 0 0 0 0 0 0 1 0 ID 25 26 27 28 29 30 31 32 33 34 35 36 AGE 34 35 35 36 36 36 37 37 37 38 38 39 CHD 0 0 0 0 1 0 0 1 0 0 0 0 ID 37 38 39 40 41 42 43 44 45 46 47 48 AGE 39 40 40 41 41 42 42 42 42 43 43 43 CHD 1 0 1 0 0 0 0 0 1 0 0 1 ID 49 50 51 52 53 54 55 56 57 58 59 60 AGE 44 44 44 44 45 45 46 46 47 47 47 48 CHD 0 0 1 1 0 1 0 1 0 0 1 0 ID 61 62 63 64 65 66 67 68 69 70 71 72 AGE 48 48 49 49 49 50 50 51 52 52 53 53 CHD 1 1 0 0 1 0 1 0 0 1 1 1 ID 73 74 75 76 77 78 79 80 81 82 83 84 AGE 54 55 55 55 56 56 56 57 57 57 57 57 CHD 1 0 1 1 1 1 1 0 0 1 1 1
Regressão Logística
Regressão Logística – Exemplo
0 0,2 0,4 0,6 0,8 1 1,2 0 10 20 30 40 50 60 70 80 Pr es enç a/ Aus ênci a da Doe nç a Idade (anos)
Regressão Logística
Regressão Logística – Exemplo
• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:
Faixa de Idade Pessoas com a Doença Total de Pessoas p
20-29 1 10 10,0% 30-34 2 15 13,3% 35-39 3 12 25,0% 40-44 5 15 33,3% 45-49 6 13 46,2% 50-55 5 8 62,5% 55-59 13 17 76,5% 60-69 8 10 80,0%
Regressão Logística
Regressão Logística – Exemplo
• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:
0,0% 15,0% 30,0% 45,0% 60,0% 75,0% 90,0% 20 30 40 50 60 70 Pr opor ção de P es so as com a Doe nç a
Regressão Logística
Regressão Logística – Exemplo
• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:
0,0% 15,0% 30,0% 45,0% 60,0% 75,0% 90,0% 20 30 40 50 60 70 Pr opor ção de P es so as com a Doe nç a
Regressão Logística
Regressão Logística – Definição
• A função logística pode modelar bem esta relação e tem uma série de propriedades biológicas interessantes.
𝒇 𝒙 =
𝒆
𝒙
𝒆
𝒙
+ 𝟏
=
𝟏
Regressão Logística
Regressão Logística
Regressão Logística – Definição
• Poderíamos estimar nosso modelo a partir desta função:
𝒚 =
𝟏
𝟏 + 𝒆
− 𝜷
𝟎
+𝜷
𝟏
𝒙
• Os estimadores não possuem solução analítica como no caso dos mínimos quadrados da regressão linear simples.
Regressão Logística
Regressão Logística – Exemplo
• Usando o R, conseguimos estimar os valores dos parâmetros
𝒚 =
𝟏
𝟏 + 𝒆
− −𝟓,𝟑𝟎𝟗+𝟎,𝟏𝟏𝟏𝒙
Substituindo x pela idade, podemos estimar a probabilidade de
qualquer pessoa apresentar a doença.
Regressão Logística
Regressão Logística – Exemplo
0 0,15 0,3 0,45 0,6 0,75 0,9 1,05 20 30 40 50 60 70 Pr op or çã o d e P e sso as co m a Doenç a
Centro de Classe de Idade (anos)
Estimado Observado Idade Probabilidade 20 4,3% 30 12,1% 40 29,5% 50 55,9% 60 79,3%
Regressão Logística
Regressão Logística – Exemplo
Estimate Std, Error z value Pr(>|z|)
(Intercept) -5,309 1,134 -4,683 < 0,001 ***
Regressão Logística
Regressão Logística – Exemplo
Estimate Std, Error z value Pr(>|z|)
(Intercept) -5,309 1,134 -4,683 < 0,001 ***
AGE 0,111 0,024 4,610 < 0,001 ***
Null deviance: 136.66 on 99 degrees of freedom Residual deviance: 107.35 on 98 degrees of freedom
Regressão Logística
Regressão Logística – Exemplo
Estimate Std, Error z value Pr(>|z|)
(Intercept) -5,309 1,134 -4,683 < 0,001 ***
AGE 0,111 0,024 4,610 < 0,001 ***
Null deviance: 136.66 on 99 degrees of freedom Residual deviance: 107.35 on 98 degrees of freedom
AIC: 111.35
A relação entre a Deviance Residual e os Graus de Liberdade deve ser
menor que 2 para um bom ajuste do modelo.
Regressão de Poisson
Regressão de Poisson – Conceitos
• A regressão de Poisson é utilizada quando a distribuição resposta possui
distribuição de Poisson, ou seja, é oriunda de um processo de contagem cujo baseline é uma medida diferente.
• Exemplos:
• Número de carros que passam em determinada rodovia por hora. • Número de pacientes que deram entrada no hospital por dia. • Número de vezes que uma máquina industrial falhou por dia.
Regressão de Poisson
Regressão de Poisson – Definição
• Poderíamos estimar nosso modelo a partir desta função:
𝒚 = 𝒆
𝜷
𝟎
+𝜷
𝟏
𝒙
• Assim como no caso da regressão logística, os estimadores não possuem solução analítica.
Regressão de Poisson
Regressão de Poisson – Exemplo
• Este conjunto de dados mostra o números de prêmios ganhados por alunos ao fim do ensino médio americano em relação às notas de matemática (0-100).
Regressão de Poisson
Regressão de Poisson – Exemplo
0 1 2 3 4 5 6 7 30 40 50 60 70 80 Pr ê m ios a o Fi m d o En si n o M é d io Notas de Matemática
Regressão de Poisson
Regressão de Poisson – Exemplo
• Usando o R, conseguimos estimar os valores dos parâmetros:
𝒚 = 𝒆
−𝟓,𝟑𝟑𝟑𝟓+𝟎,𝟎𝟖𝟔𝟏𝟕𝒙
Substituindo x pela nota de matemática, podemos estimar a quantidade
de prêmios que a pessoa poderá ter ao fim do ensino médio
Regressão de Poisson
Regressão de Poisson – Exemplo
0 1 2 3 4 5 6 7 8 30 40 50 60 70 80 90 Pr ê m ios a o Fi m d o En si n o M é d io Notas de Matemática Predito Observados Notas Prêmios 30 0 40 0 50 0 60 1 70 2 80 5
Regressão de Poisson
Regressão de Poisson – Exemplo
Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***
Regressão de Poisson
Regressão de Poisson – Exemplo
Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***
math 0,086 0,010 8,902 < 0,001 ***
Null deviance: 287.67 on 199 degrees of freedom Residual deviance: 204.02 on 198 degrees of freedom
Regressão de Poisson
Regressão de Poisson – Exemplo
Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***
math 0,086 0,010 8,902 < 0,001 ***
Null deviance: 287.67 on 199 degrees of freedom Residual deviance: 204.02 on 198 degrees of freedom
AIC: 384.08