Exemplo Infecções de Ouvido
Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2oSemestre 2016Infecções de Ouvido Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Infecções de Ouvido
Descrição dos Dados
Considere os dados apresentados em Hand et al. (1994) em que o número de infecções de ouvido observadas em uma amostra aleatória
de n=287 recrutas norte-americanos em 1990 é relacionado com as
Infecções de Ouvido Infecções de Ouvido
Descrição dos Dados
Considere os dados apresentados em Hand et al. (1994) em que o número de infecções de ouvido observadas em uma amostra aleatória
de n=287 recrutas norte-americanos em 1990 é relacionado com as
seguintes variáveis explicativas:
Infecções de Ouvido
Descrição dos Dados
Considere os dados apresentados em Hand et al. (1994) em que o número de infecções de ouvido observadas em uma amostra aleatória
de n=287 recrutas norte-americanos em 1990 é relacionado com as
seguintes variáveis explicativas:
hábito de nadar (ocasional ou frequente), local de nadar (praia ou piscina),
Infecções de Ouvido Infecções de Ouvido
Descrição dos Dados
Considere os dados apresentados em Hand et al. (1994) em que o número de infecções de ouvido observadas em uma amostra aleatória
de n=287 recrutas norte-americanos em 1990 é relacionado com as
seguintes variáveis explicativas:
hábito de nadar (ocasional ou frequente), local de nadar (praia ou piscina),
Infecções de Ouvido
Descrição dos Dados
Considere os dados apresentados em Hand et al. (1994) em que o número de infecções de ouvido observadas em uma amostra aleatória
de n=287 recrutas norte-americanos em 1990 é relacionado com as
seguintes variáveis explicativas:
hábito de nadar (ocasional ou frequente), local de nadar (praia ou piscina),
faixa etária do recruta (15-19, 20-24, 25-29), gênero do recruta (feminino ou masculino).
Análise de Dados Preliminar Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Boxplot Casos por Hábito de Nadar 0 5 10 15 Número de Inf ecções 0 5 10 15 Número de Inf ecções
Análise de Dados Preliminar Boxplot Casos por Local de Nadar
Praia Piscina 0 5 10 15 Local de Nadar Número de Inf ecções Praia Piscina 0 5 10 15 Local de Nadar Número de Inf ecções
Boxplot Casos por Faixa Etária 0 5 10 15 Número de Inf ecções 0 5 10 15 Número de Inf ecções
Análise de Dados Preliminar Boxplot Casos por Gênero
Feminino Masculino 0 5 10 15 Gênero Número de Inf ecções Feminino Masculino 0 5 10 15 Gênero Número de Inf ecções
Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Ajuste Modelo de Poisson Modelo de Poisson
Descrição
Seja yi o número de infecções de ouvido observadas pelo i-ésimo
Modelo de Poisson
Descrição
Seja yi o número de infecções de ouvido observadas pelo i-ésimo
Ajuste Modelo de Poisson Modelo de Poisson
Descrição
Seja yi o número de infecções de ouvido observadas pelo i-ésimo
recruta no ano de 1990.Vamos supor inicialmente o seguinte modelo:
yi
ind ∼P(µi),
Modelo de Poisson
Descrição
Seja yi o número de infecções de ouvido observadas pelo i-ésimo
recruta no ano de 1990.Vamos supor inicialmente o seguinte modelo:
yi
ind ∼P(µi),
log(µi) = α + β1×hábitoi+ β2×locali+ β3×fetáriai+ β4×gêneroi
+γ1×hábitoi∗locali+ γ2×hábitoi∗fetáriai+ γ3×hábitoi∗gêneroi
Ajuste Modelo de Poisson Modelo de Poisson
Descrição
Seja yi o número de infecções de ouvido observadas pelo i-ésimo
recruta no ano de 1990.Vamos supor inicialmente o seguinte modelo:
yi
ind ∼P(µi),
log(µi) = α + β1×hábitoi+ β2×locali+ β3×fetáriai+ β4×gêneroi
+γ1×hábitoi∗locali+ γ2×hábitoi∗fetáriai+ γ3×hábitoi∗gêneroi
+γ4×locali∗fetáriai+ γ5×locali∗gêneroi+ γ6×fetáriai∗gêneroi,
para i =1, . . . ,287, em quehábito,local,fetáriaegênerosão variáveis binárias.
Estimativas Modelo Selecionado
Descrição
Efeito Estimativa E/E.Padrão
Intercepto 0,380 2,25 HábitoOcas 0,232 1,23 LocalPisc -0,380 -1,47 Fetária20-24 -0,880 -3,05 Fetária25-29 -0,698 -2,52 GêneroMasc -0,457 -2,81 HOcas*LPisc 0,367 1,66 HOcas*F20-24 0,091 0,35 HOcas*F25-30 0,706 2,41 LPisc*F20-24 0,741 2,52 LPisc*F25-29 0,156 0,59
Ajuste Modelo de Poisson Qualidade do Ajuste
Qualidade do Ajuste
Desvio
O desvio do modelo é dado porD(y; ˆµ) =732,16(275 g.l.)com
Ajuste Modelo de Poisson Resíduos Modelo de Poisson
−3 −2 −1 0 1 2 3 −2 0 2 4 6 Percentil da N(0,1) Componente do Desvio
Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Ajuste Modelo com Resposta Binomial Negativa Modelo Binomial Negativo
Descrição
A sobredispersão detectada sob o modelo de Poisson sugere o seguinte modelo com resposta binomial negativa:
Modelo Binomial Negativo
Descrição
A sobredispersão detectada sob o modelo de Poisson sugere o seguinte modelo com resposta binomial negativa:
yi
ind
Ajuste Modelo com Resposta Binomial Negativa Modelo Binomial Negativo
Descrição
A sobredispersão detectada sob o modelo de Poisson sugere o seguinte modelo com resposta binomial negativa:
yi
ind
∼B(µi, ν),
log(µi) = α + β1×hábitoi+ β2×locali+ β3×fetáriai+ β4×gêneroi
+γ1×hábitoi∗locali+ γ2×hábitoi∗fetáriai+ γ3×hábitoi∗gêneroi
Modelo Binomial Negativo
Descrição
A sobredispersão detectada sob o modelo de Poisson sugere o seguinte modelo com resposta binomial negativa:
yi
ind
∼B(µi, ν),
log(µi) = α + β1×hábitoi+ β2×locali+ β3×fetáriai+ β4×gêneroi
+γ1×hábitoi∗locali+ γ2×hábitoi∗fetáriai+ γ3×hábitoi∗gêneroi
+γ4×locali∗fetáriai+ γ5×locali∗gêneroi+ γ6×fetáriai∗gêneroi,
para i =1, . . . ,287, em quehábito,local,fetáriaegênerosão variáveis binárias.
Ajuste Modelo com Resposta Binomial Negativa Estimativas Modelo Selecionado
Descrição
Aplicando o método de Akaike incluímos apenas a interação entre local e gênero, além dos efeitos principais hábito, local e gênero.
Efeito Estimativa E/E.Padrão
Intercepto -0,064 -0,28 HábitoOcas 0,593 3,13 LocalPisc 0,007 0,02 GêneroMasc -0,407 -1,48 LPisc*GMasc 0,745 1,83 Dispersão (ν) 0,576 6,36
Estimativas Modelo Selecionado
Descrição
Aplicando o método de Akaike incluímos apenas a interação entre local e gênero, além dos efeitos principais hábito, local e gênero.
Efeito Estimativa E/E.Padrão
Intercepto -0,064 -0,28 HábitoOcas 0,593 3,13 LocalPisc 0,007 0,02 GêneroMasc -0,407 -1,48 LPisc*GMasc 0,745 1,83 Dispersão (ν) 0,576 6,36
Ajuste Modelo com Resposta Binomial Negativa Resíduos Modelo Binomial Negativo
−3 −2 −1 0 1 2 3 −1 0 1 2 3 Percentil da N(0,1) Componente do Desvio
Influência Modelo Binomial Negativo 0 50 100 150 200 250 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Distância de Cook 249
Ajuste Modelo com Resposta Binomial Negativa Estimativas Modelo Selecionado
Descrição
Estimativas eliminando a observação #249.
Efeito Estimativa E/E.Padrão
Intercepto -0,263 -1,13 HábitoOcas 0,669 3,55 LocalPisc 0,163 0,49 GêneroMasc -0,250 -0,91 LPisc*GMasc 0,591 1,46 Dispersão (ν) 0,606 6,19
Estimativas Modelo Selecionado
Descrição
Estimativas eliminando a observação #249.
Efeito Estimativa E/E.Padrão
Intercepto -0,263 -1,13 HábitoOcas 0,669 3,55 LocalPisc 0,163 0,49 GêneroMasc -0,250 -0,91 LPisc*GMasc 0,591 1,46 Dispersão (ν) 0,606 6,19
Portanto,há mudança inferencial, essa observação está induzindo a
Ajuste Modelo com Resposta Binomial Negativa Estimativas Modelo Selecionado
Descrição
Estimativas eliminando a observação #249.
Efeito Estimativa E/E.Padrão
Intercepto -0,263 -1,13 HábitoOcas 0,669 3,55 LocalPisc 0,163 0,49 GêneroMasc -0,250 -0,91 LPisc*GMasc 0,591 1,46 Dispersão (ν) 0,606 6,19
Portanto,há mudança inferencial, essa observação está induzindo a
interação entre local e gênero. A observação #249 tem um perfil atípico, refere-se a uma recruta que nada com frequência na praia e registrou 10 infecções no ano de 1990.
Estimativas Modelo Final
Descrição
O modelo final tem apenas os efeitos principais de hábito e local. As estimativas são apresentadas abaixo.
Efeito Estimativa E/E.Padrão
Intercepto -0,278 -1,59
HábitoOcas 0,590 3,10
LocalPisc 0,481 2,53
Ajuste Modelo com Resposta Binomial Negativa Estimativas Modelo Final
Descrição
O modelo final tem apenas os efeitos principais de hábito e local. As estimativas são apresentadas abaixo.
Efeito Estimativa E/E.Padrão
Intercepto -0,278 -1,59
HábitoOcas 0,590 3,10
LocalPisc 0,481 2,53
Dispersão (ν) 0,560 6,43
O desvio do modelo é dado porD(y; ˆµ) =269,10(284 g.l.)com
Resíduos Modelo Final −3 −2 −1 0 1 2 3 −1 0 1 2 3 Componente do Desvio
Ajuste Modelo com Resposta Binomial Negativa Influência Modelo Final
0 50 100 150 200 250 0.0 0.1 0.2 0.3 0.4 Índice Distância de Cook 249
Interpretações Modelo Final
Ajuste Modelo com Resposta Binomial Negativa Interpretações Modelo Final
Interpretações Modelo Final
Recrutas com hábito de nadar ocasional têm aproximadamente
80%(exp(0,59) =1,80) mais infecções de ouvido do que
Interpretações Modelo Final
Interpretações Modelo Final
Recrutas com hábito de nadar ocasional têm aproximadamente
80%(exp(0,59) =1,80) mais infecções de ouvido do que
recrutas com hábito de nadar frequente.
Recrutas que nadam em piscina têm aproximadamente62%
(exp(0,481) =1,62) mais infecções de ouvido do que recrutas que nadam na praia.
Ajuste Modelo com Resposta Binomial Negativa Interpretações Modelo Final
Interpretações Modelo Final
Recrutas com hábito de nadar ocasional têm aproximadamente
80%(exp(0,59) =1,80) mais infecções de ouvido do que
recrutas com hábito de nadar frequente.
Recrutas que nadam em piscina têm aproximadamente62%
(exp(0,481) =1,62) mais infecções de ouvido do que recrutas que nadam na praia.
Recrutas com hábito de nadar ocasional em piscina têm
aproximadamente192%(exp(0,590+0,481) =2,92) mais
infecções de ouvido do que recrutas com hábito de nadar frequente na praia.
Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Conclusões Conclusões Finais
Conclusões Finais
Conclusões Finais
Este é um exemplo com sobredispersão em que o modelo com respota binomial negativa ajusta melhor os dados do que o modelo de Poisson.
Conclusões Conclusões Finais
Conclusões Finais
Este é um exemplo com sobredispersão em que o modelo com respota binomial negativa ajusta melhor os dados do que o modelo de Poisson.
A observação discrepante #249 induz a interação entre hábito e gênero no modelo binomial negativo. Embora também seja
detectada no modelo final, essa observação não causa mudanças inferenciais nos resultados.
Sumário
1 Infecções de Ouvido
2 Análise de Dados Preliminar
3 Ajuste Modelo de Poisson
4 Ajuste Modelo com Resposta Binomial Negativa
5 Conclusões
Referências Referências
Referência
Hand, D. J., Daly, F., Lunn, A. D., McConway, K. J. e Ostrowski, E. (1994). A Handbook of Small Data Sets. Chapman and Hall, London.