• Nenhum resultado encontrado

GLM Aula4 2017

N/A
N/A
Protected

Academic year: 2021

Share "GLM Aula4 2017"

Copied!
20
0
0

Texto

(1)

GLM - aula 4

Paul G. Kinas

(2)

opicos

1 GLM para a distribui¸c˜ao Poisson

Riqueza de Plantas nas Gal´apagos (Faraway)

2 GLM para Binomial Negativa

a fun¸cao glm.nb() no pacote MASS deviˆancias: Poisson vs Binomial Negativa

3 Modelos para taxas (Rate Model)

contagem por n´umero de expostos o uso de offset()

exemplo 1: Lebres [poisson t-test] exemplo 2: Lib´elulas [poisson ancova]

(3)

1 Y ∼ Pois(µ)

2 N´umero de ocorrˆencias em cont´ınuo de tempo, ´area, volume

(Ex.: n´umero de atuns por hora de arrasto) {0, 1, 2, 3, ...}

3 Limite da distribui¸c˜ao Binomial para eventos raros

(Ex.: incidˆencia de uma rara forma de cˆancer numa regi˜ao geogr´afica)

Y ∼ Bin(n, θ) ≈ Pois(µ = nθ) quando n ↑ ∞ e nθ = µ (n > 30 e nθ < 5)

(4)

GLM - Modelo Poisson

1 A distribui¸c˜ao de probabilidade de Y ∼ Poisson(µ)

p(y |θ, φ) = e−µy !µy

p(y |θ, φ) = exp [y log(µ) − µ − log(y !)]

componentes

θ = log(µ), φ = 1, a(φ) = 1, b(θ) = µ, c(y , φ) = − log(y !)

2 m´edia e variˆancia

E (yi) = µi e V (yi) = µi

3 fun¸c˜ao de liga¸c˜ao logit

ηi = log(µi) ηi = xiTβ 4 deviˆancia D =Pn i =12 h yilog  yi ˆ µi  − (yi− ˆµi) i =Pn i =1di

(5)

(Sum´

arios)

'data.frame': 30 obs. of 7 variables:

$ Species : num 58 31 3 25 2 18 24 10 8 2 ... $ Endemics : num 23 21 3 9 1 11 0 7 4 2 ... $ Area : num 25.09 1.24 0.21 0.1 0.05 ... $ Elevation: num 346 109 114 46 77 119 93 168 71 112 ... $ Nearest : num 0.6 0.6 2.8 1.9 1.9 8 6 34.1 0.4 2.6 ... $ Scruz : num 0.6 26.3 58.7 47.4 1.9 ... $ Adjacent : num 1.84 572.33 0.78 0.18 903.82 ...

(6)

Exemplo: Gal´

apagos

(Padroniza¸c˜

ao das Covari´

aveis)

zij = xij− ¯xj

sj

> z.trans <- function(x){(x - mean(x))/sd(x)} > gala$z.Area <- z.trans(gala$Area)

> gala$z.Elevation <- z.trans(gala$Elevation) > gala$z.Nearest <- z.trans(gala$Nearest) > gala$z.Scruz <- z.trans(gala$Scruz)

(7)

(Dois modelos lineares)

1 y = zTβ +  2 √y = zTβ +  0 100 200 300 400 −100 −50 0 50 100 150 200 Fitted values Residuals Residuals vs Fitted SantaCruz Pinta SantaMaria 5 10 15 20 −4 −2 0 2 4 6 Fitted values Residuals Residuals vs Fitted SantaCruz Gardner1 Pinta

(8)

Exemplo: Gal´

apagos

(GLM-Poisson - sum´

arios)

Estimate Std. Error z value Pr(>|z|)

(Intercept) 3.89645 0.030268 128.7302 0.0000e+00 z.Area -0.50113 0.022703 -22.0737 5.6520e-108 z.Elevation 1.49273 0.036851 40.5070 0.0000e+00 z.Nearest 0.12598 0.025998 4.8459 1.2606e-06 z.Scruz -0.38843 0.042562 -9.1260 7.1062e-20 z.Adjacent -0.57320 0.025354 -22.6078 3.6322e-113 deviancia g.lib 716.85 24.00 AIC 889.68

(9)

(GLM Poisson - res´ıduos)

2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 −10 −5 0 5 10 Predicted values Residuals Residuals vs Fitted Espanola SantaMaria Pinta −2 −1 0 1 2 −10 0 5 10 Theoretical Quantiles Std. de viance resid. Normal Q−Q Pinta Espanola SanSalvador 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 0.0 1.0 2.0 3.0 Predicted values S td . d e v ia n c e r e s id . Scale−Location Pinta Espanola SanSalvador 0.0 0.2 0.4 0.6 0.8 1.0 −10 0 5 10 Leverage Std. P earson resid. Cook's distance 1 0.5 0.5 1 Residuals vs Leverage Isabela Fernandina SanCristobal

(10)

Distribui¸c˜

ao Binomial Negativa

1 A distribui¸c˜ao de probabilidade de Y ∼ NBin(a, θ)

p(y |a, θ) = y +a−1a−1 θa(1 − θ)y e y ∈ {0, 1, 2, ...}

E (Y ) = a(1−θ)θ = µ V (Y ) = a(1−θ)θ2 = µθ

−1

2 A distribui¸c˜ao Poisson estendida

Y |M ∼ Poi (M) e M ∼ Gama(α, β) com E (M) = αβ−1 Y ∼ NBin(a = α, θ = β(β + 1)−1)

3 m´edia e variˆancia de Y

E (Y ) = αβ−1= µ V (Y ) = µ +µα2

(11)

0 1 2 3 4 0 5 10 15 20 25 30 35

Blue (a=0.5) Red (a=1), Green (a=1.5)

E(Y) = mu

V(Y) = m

u + (m

(12)

Exemplo: Gal´

apagos

(GLM - Binomial Negativa - sum´

arios)

V (Yi) = µiφ para φ > 1 (sobre-dispers˜ao)

Estimate Std. Error z value Pr(>|z|)

(Intercept) 3.881274 0.14453 26.85450 7.4724e-159 z.Area -0.547493 0.24758 -2.21139 2.7009e-02 z.Elevation 1.625333 0.29159 5.57409 2.4883e-08 z.Nearest 0.040346 0.19502 0.20689 8.3610e-01 z.Scruz -0.129096 0.19114 -0.67539 4.9943e-01 z.Adjacent -0.657446 0.19693 -3.33850 8.4232e-04 deviance df 33.196 24.000 phi se.phi

(13)

(GLM Poisson - res´ıduos)

2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 −2 −1 0 1 2 Predicted values Residuals Residuals vs Fitted EnderbyOnslow Caldwell −2 −1 0 1 2 −2 −1 0 1 2 Theoretical Quantiles Std. de viance resid. Normal Q−Q Enderby OnslowCaldwell 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 0.0 0.5 1.0 1.5 Predicted values S td . d e v ia n c e r e s id . Scale−Location Enderby Onslow Caldwell 0.0 0.2 0.4 0.6 0.8 1.0 −1 0 1 2 3 Leverage Std. P earson resid. Cook's distance 1 0.5 0.5 1 Residuals vs Leverage Isabela Genovesa Gardner1

(14)

Distribui¸c˜

ao de Poisson para Taxas

1 Exemplos

Nro. de ocorrˆencias por hora de procura Nro. de ´obitos por 10 mil infectados

Nro. de multas por mil carros licenciados x 100km de rodovias

2 E (Yi) = µi = niθi

ηi = log µi = log (ni) + log (θi) = log (ni) + xTβ

(15)

(Sum´

arios)

densidade de lebres em fun¸c˜ao do tipo de uso do solo esfor¸co de coleta vari´avel

'data.frame': 20 obs. of 3 variables:

$ cap: num 9 10 18 25 22 18 25 17 20 18 ...

$ x : Factor w/ 2 levels "arable","grassland": 2 2 2 2 2 2 2 2 2 2 ...

(16)

Exemplo: Lebres

(GLM - Poisson [t-test])

1 Sem esfor¸co: ηi = β0+ β1xi

2 Com esforco (offset): ηi = β0+ β1xi+ log(ni) 3 Com esfor¸co (covari´avel): ηi = β0+ β1xi + β2log(ni)

(Intercept) xgrassland log(eff)

0.66453 0.96230 1.02372

2.5 % 97.5 % (Intercept) -0.22140 1.4962

xgrassland 0.69177 1.2401

(17)

(GLM - Poisson [t-test])

1 com ∆AIC

2 com Deviancias

[1] 13.0335 1.9937 0.0000

Analysis of Deviance Table Model 1: cap ~ x

Model 2: cap ~ x

Model 3: cap ~ x + log(eff)

Resid. Df Resid. Dev Df Deviance Pr(>Chi)

1 18 24.6

2 18 11.6 0 13.03

(18)

Exemplo: Lib´

elulas (K`

ery,M., 2010)

(GLM - Poisson [ancova])

Y = nro. de ectoparasitas por lib´elula (dragonfly)

covari´aveis: cadeias de montanhas (3) e comprimento das asas

'data.frame': 300 obs. of 3 variables:

$ y : num 0 0 0 0 0 2 6 0 0 0 ...

$ pop : Factor w/ 3 levels "Pyrenees","Massif Central",..: 1 1 1 1 1 1 1 1 1 1 ...

$ wing: num 0.356 -1.193 0.307 0.029 -0.111 ...

Dragonfly

50

100

(19)

(GLM - Poisson [ancova])

P P P P P P P P P P P P P P P P P P P P P P P P PP P P P P P P P P P P P P P P P PP P P P P P PPP P P P P P P P P P P P P P P P P P P PP P P P P P P P P P P P P P P PP P P P P P P P P P P P P P M M MMM M M MM M M M M M M MM M M M M M M MM M M M M M M M M M M M M M M MM M M M MM M M M M M M M M M M M MM M M M M M M M M M M M M MMMMM M M M M M M M M M M M M M M M M M M M M M M M M J J J J JJ J J J J J J JJ J J J J J J J J JJ J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J J JJ J J J J J J −1.0 −0.5 0.0 0.5 1.0 0 10 20 30 40 50 60 70 Wing length P ar asite load

(20)

FIM

OBRIGADO paulkinas@furg.br

Referências

Documentos relacionados

- Público-alvo: 1º, 2º, 3º Ciclo e Ensino secundário - Duração média: 90 minutos. -

Pretendo, a partir de agora, me focar detalhadamente nas Investigações Filosóficas e realizar uma leitura pormenorizada das §§65-88, com o fim de apresentar e

No primeiro, destacam-se as percepções que as cuidadoras possuem sobre o hospital psiquiátrico e os cuidados com seus familiares durante o internamento; no segundo, evidencia-se

III - Risco de Liquidez: consiste na possibilidade do FUNDO não possuir recursos necessários para o cumprimento de suas obrigações de pagamento de resgates de cotas, nos prazos

Em conjunto, os dados apresentados aqui revelam o uvaol como um promissor princípio ativo com potencial terapêutico para doenças inflamatórias alérgicas, apresentando uma

Nesse sentido, o grupo de trabalho composto por pesquisadores da Fundação Centro Tecnológico do Estado de Minas Gerais (CE- TEC), da Universidade Federal de Viçosa (UFV) e da Fundação

O VLC Media Player é um leitor multimédia para Windows realmente VLC Media Player é um player multimídia multi- plataforma altamente portátil Home Baixar Portable VLC Media Player

Lista revis˜ ao limites e derivadas de Fun¸ c˜ oes de uma Vari´ avel. Ad´