• Nenhum resultado encontrado

Aula 5 - Modelos Lineares Generalizados

N/A
N/A
Protected

Academic year: 2021

Share "Aula 5 - Modelos Lineares Generalizados"

Copied!
35
0
0

Texto

(1)

Modelos Lineares Generalizados

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(2)

Análise de Regressão

Data Tópico Teórico Tópico Prático

04/05/2015 Conceitos Introdutórios Revisão do R, Análises Univariadas, Análises Bivariadas

11/05/2015 Regressão Linear Simples Regressão Linear Simples e Gráficos

18/05/2015 Premissas do Modelo Linear Análise de Resíduos e Transformações nas Variáveis

25/05/2015 Regressão Linear Múltipla Análise de Regressão Linear Múltipla

01/06/2015 Análise de Variância Análise de Variância e Comparações Múltiplas

08/06/2015 Não Haverá Exercícios de Fixação

12/06/2015 ATIVIDADE EXTRA CLASSE

15/06/2015 Modelos Lineares Generalizados Regressão Logística, Regressão de Poisson e Regressão Gama

22/06/2015 Análise Preditiva Análise Preditiva

29/06/2015 AVALIAÇÃO FINAL

(3)

Introdução ao MLG

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(4)

Modelos Lineares Generalizados

Modelos Lineares Generalizados – Conceitos Gerais

• Diversos pesquisadores lançaram metodologias estatísticas para se realizar a modelagem de dados utilizando diferentes tipos de distribuição para as

variáveis respostas. Dentre as mais conhecidas, temos:

• Regressão Logística para dados com distribuição Bernoulli ou binomial • Regressão Log-Linear para dados com distribuição de Poisson

• Regressão Beta para dados com distribuição Beta

• Regressão Logarítmica para dados com distribuição Log-normal • Entre outras...

(5)

Modelos Lineares Generalizados

Modelos Lineares Generalizados – Conceitos Gerais

• Nelder e Wedderburn unificaram todas estas técnicas em uma só teoria, chamada de teoria dos Modelos Lineares Generalizados.

• Dentro desta teoria, encontram-se todas as distribuições de dados que façam parte da família Exponencial de distribuições: normal, Poisson, binomial,

(6)

Modelos Lineares Generalizados

Modelos Lineares Generalizados – Conceitos Gerais

• O cerne desta teoria é dividir o modelo de regressão em 3 componentes:

• A variável resposta, componente aleatório do modelo, deve possuir uma distribuição pertencente à família exponencial.

• Variáveis preditoras na forma de estrutura linear, constituindo o

componente sistemático do modelo.

• A ligação entre o componente aleatório e sistemático, feita através de uma função de ligação adequada para cada distribuição.

(7)

Modelos Lineares Generalizados

Modelos Lineares Generalizados – Conceitos Gerais

• Na especificação teórica, chamamos o componente sistemático de 𝝁, e a função de ligação de 𝜼:

(8)

Modelos Lineares Generalizados

Modelos Lineares Generalizados – Aplicação

• Ensaios de dose-resposta são aqueles em que determinada droga é ministrada em diferentes doses a diferentes indivíduos e o resultado esperado é a mudança de um estado (por exemplo, de doente para sadio).

• Ou quando um inseticida é aplicado em diferentes doses e espera-se que os insetos morram em um determinado período.

• Os objetivos destes ensaios é estimar a probabilidade de sucesso, como função de variáveis explanatórias e então estimar a probabilidade de doses efetivas.

(9)

Modelos Lineares Generalizados

(10)

Modelos Lineares Generalizados

(11)

Regressão Logística

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(12)

Regressão Logística

Regressão Logística – Conceitos

• A regressão logística é o caso particular quando a distribuição da variável resposta é

binária ou uma proporção.

Binária Proporção

• Reagiu ou não a um medicamento.

• Causou ou não a morte do inseto. • Entrou ou não em inadimplência. • % de sementes que germinaram. • % de pessoas que compraram o produto. • % de plantas que

(13)

Regressão Logística

Regressão Logística – Exemplo

• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:

(14)

Regressão Logística

Regressão Logística – Exemplo

ID 1 2 3 4 5 6 7 8 9 10 11 12 AGE 20 23 24 25 25 26 26 28 28 29 30 30 CHD 0 0 0 0 1 0 0 0 0 0 0 0 ID 13 14 15 16 17 18 19 20 21 22 23 24 AGE 30 30 30 30 32 32 33 33 34 34 34 34 CHD 0 0 0 1 0 0 0 0 0 0 1 0 ID 25 26 27 28 29 30 31 32 33 34 35 36 AGE 34 35 35 36 36 36 37 37 37 38 38 39 CHD 0 0 0 0 1 0 0 1 0 0 0 0 ID 37 38 39 40 41 42 43 44 45 46 47 48 AGE 39 40 40 41 41 42 42 42 42 43 43 43 CHD 1 0 1 0 0 0 0 0 1 0 0 1 ID 49 50 51 52 53 54 55 56 57 58 59 60 AGE 44 44 44 44 45 45 46 46 47 47 47 48 CHD 0 0 1 1 0 1 0 1 0 0 1 0 ID 61 62 63 64 65 66 67 68 69 70 71 72 AGE 48 48 49 49 49 50 50 51 52 52 53 53 CHD 1 1 0 0 1 0 1 0 0 1 1 1 ID 73 74 75 76 77 78 79 80 81 82 83 84 AGE 54 55 55 55 56 56 56 57 57 57 57 57 CHD 1 0 1 1 1 1 1 0 0 1 1 1

(15)

Regressão Logística

Regressão Logística – Exemplo

0 0,2 0,4 0,6 0,8 1 1,2 0 10 20 30 40 50 60 70 80 Pr es enç a/ Aus ênci a da Doe a Idade (anos)

(16)

Regressão Logística

Regressão Logística – Exemplo

• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:

Faixa de Idade Pessoas com a Doença Total de Pessoas p

20-29 1 10 10,0% 30-34 2 15 13,3% 35-39 3 12 25,0% 40-44 5 15 33,3% 45-49 6 13 46,2% 50-55 5 8 62,5% 55-59 13 17 76,5% 60-69 8 10 80,0%

(17)

Regressão Logística

Regressão Logística – Exemplo

• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:

0,0% 15,0% 30,0% 45,0% 60,0% 75,0% 90,0% 20 30 40 50 60 70 Pr opor ção de P es so as com a Doe a

(18)

Regressão Logística

Regressão Logística – Exemplo

• Relação entre a idade e a presença ou ausência de evidência significativa da doença coronariana em 100 indivíduos que participaram do estudo:

0,0% 15,0% 30,0% 45,0% 60,0% 75,0% 90,0% 20 30 40 50 60 70 Pr opor ção de P es so as com a Doe a

(19)

Regressão Logística

Regressão Logística – Definição

• A função logística pode modelar bem esta relação e tem uma série de propriedades biológicas interessantes.

𝒇 𝒙 =

𝒆

𝒙

𝒆

𝒙

+ 𝟏

=

𝟏

(20)

Regressão Logística

(21)

Regressão Logística

Regressão Logística – Definição

• Poderíamos estimar nosso modelo a partir desta função:

𝒚 =

𝟏

𝟏 + 𝒆

− 𝜷

𝟎

+𝜷

𝟏

𝒙

• Os estimadores não possuem solução analítica como no caso dos mínimos quadrados da regressão linear simples.

(22)

Regressão Logística

Regressão Logística – Exemplo

• Usando o R, conseguimos estimar os valores dos parâmetros

𝒚 =

𝟏

𝟏 + 𝒆

− −𝟓,𝟑𝟎𝟗+𝟎,𝟏𝟏𝟏𝒙

Substituindo x pela idade, podemos estimar a probabilidade de

qualquer pessoa apresentar a doença.

(23)

Regressão Logística

Regressão Logística – Exemplo

0 0,15 0,3 0,45 0,6 0,75 0,9 1,05 20 30 40 50 60 70 Pr op or çã o d e P e sso as co m a Doenç a

Centro de Classe de Idade (anos)

Estimado Observado Idade Probabilidade 20 4,3% 30 12,1% 40 29,5% 50 55,9% 60 79,3%

(24)

Regressão Logística

Regressão Logística – Exemplo

Estimate Std, Error z value Pr(>|z|)

(Intercept) -5,309 1,134 -4,683 < 0,001 ***

(25)

Regressão Logística

Regressão Logística – Exemplo

Estimate Std, Error z value Pr(>|z|)

(Intercept) -5,309 1,134 -4,683 < 0,001 ***

AGE 0,111 0,024 4,610 < 0,001 ***

Null deviance: 136.66 on 99 degrees of freedom Residual deviance: 107.35 on 98 degrees of freedom

(26)

Regressão Logística

Regressão Logística – Exemplo

Estimate Std, Error z value Pr(>|z|)

(Intercept) -5,309 1,134 -4,683 < 0,001 ***

AGE 0,111 0,024 4,610 < 0,001 ***

Null deviance: 136.66 on 99 degrees of freedom Residual deviance: 107.35 on 98 degrees of freedom

AIC: 111.35

A relação entre a Deviance Residual e os Graus de Liberdade deve ser

menor que 2 para um bom ajuste do modelo.

(27)

Regressão de Poisson

Regressão de Poisson – Conceitos

• A regressão de Poisson é utilizada quando a distribuição resposta possui

distribuição de Poisson, ou seja, é oriunda de um processo de contagem cujo baseline é uma medida diferente.

• Exemplos:

• Número de carros que passam em determinada rodovia por hora. • Número de pacientes que deram entrada no hospital por dia. • Número de vezes que uma máquina industrial falhou por dia.

(28)

Regressão de Poisson

Regressão de Poisson – Definição

• Poderíamos estimar nosso modelo a partir desta função:

𝒚 = 𝒆

𝜷

𝟎

+𝜷

𝟏

𝒙

• Assim como no caso da regressão logística, os estimadores não possuem solução analítica.

(29)

Regressão de Poisson

Regressão de Poisson – Exemplo

• Este conjunto de dados mostra o números de prêmios ganhados por alunos ao fim do ensino médio americano em relação às notas de matemática (0-100).

(30)

Regressão de Poisson

Regressão de Poisson – Exemplo

0 1 2 3 4 5 6 7 30 40 50 60 70 80 Pr ê m ios a o Fi m d o En si n o M é d io Notas de Matemática

(31)

Regressão de Poisson

Regressão de Poisson – Exemplo

• Usando o R, conseguimos estimar os valores dos parâmetros:

𝒚 = 𝒆

−𝟓,𝟑𝟑𝟑𝟓+𝟎,𝟎𝟖𝟔𝟏𝟕𝒙

Substituindo x pela nota de matemática, podemos estimar a quantidade

de prêmios que a pessoa poderá ter ao fim do ensino médio

(32)

Regressão de Poisson

Regressão de Poisson – Exemplo

0 1 2 3 4 5 6 7 8 30 40 50 60 70 80 90 Pr ê m ios a o Fi m d o En si n o M é d io Notas de Matemática Predito Observados Notas Prêmios 30 0 40 0 50 0 60 1 70 2 80 5

(33)

Regressão de Poisson

Regressão de Poisson – Exemplo

Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***

(34)

Regressão de Poisson

Regressão de Poisson – Exemplo

Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***

math 0,086 0,010 8,902 < 0,001 ***

Null deviance: 287.67 on 199 degrees of freedom Residual deviance: 204.02 on 198 degrees of freedom

(35)

Regressão de Poisson

Regressão de Poisson – Exemplo

Estimate Std, Error z value Pr(>|z|) (Intercept) -5,334 0,591 -9,021 < 0,001 ***

math 0,086 0,010 8,902 < 0,001 ***

Null deviance: 287.67 on 199 degrees of freedom Residual deviance: 204.02 on 198 degrees of freedom

AIC: 384.08

A relação entre a Deviance Residual e os Graus de Liberdade deve ser

menor que 2 para um bom ajuste do modelo.

Referências

Documentos relacionados

Eles empregaram a teologia como “um meio que pudesse fazer uma análise crítica da sociedade latino-americana e assim reestruturar a Igreja Católica a partir de uma práxis

Durante o Período de Discussão Pública foram recebidas 11 participações (ver anexo). Destas, algumas, têm conteúdo repetido e foram realizadas pelo mesmo requerente. Não obstante

O Projeto ecoValsassina insere-se num dos aspetos básicos da identidade do Colégio Valsassina que constam do seu projeto educativo: “O Colégio Valsassina assume

A Fundação do ABC – Complexo Hospitalar Municipal de São Bernardo do Campo (CHMSBC), nos termos do seu Regulamento Interno de Compras e Contratação de Serviços de Terceiros

Coração que é “raso” demais, ou sem terra boa, ou cercado pelos espinhos da preocupação exagerada e do egoísmo, não são bons solos para a boa nova do Evangelho.. As vezes

Com os precípuos objetivos de demonstrar o caráter escravista da produção de derivados da cana em Minas Gerais e, na seqüência, estimar o número de escravos empregados no

pela geração da representação digital. Sendo, portanto, o projetista responsável pela definição das regras que regem o mecanismo, assim como o desenvolvimento do

Segundo OCDE (2012), no programa PISA, não deve ser necessária outra leitura para compreender o texto utilizado na avaliação. Tabela I: O que é Situação ou Contexto na Prova