MLG. 23 de outubro de Curso de Modelos Lineares Generalizado - DEST/UFMG Marcos Oliveira Prates. Marcos Oliveira Prates

(1)

MLG

Curso de Modelos Lineares Generalizado - DEST/UFMG Marcos Oliveira Prates

23 de outubro de 2017

(2)

T ´ecnicas para Diagn ´osticos em GLM

Assim como para modelos lineares t ´ecnicas de diagn ´osticos foram desenvolvidas para GLM.

Um passo inicial ´e extender as analises feitas para modelos lineares e achar uma medida equivalente na classe de GLM.

Dessa forma, seria interessante que essas extens ões equivalentes tamb ém preservem a interpretaç ão anterior.

(3)

Pontos de alavanca

A matrizHpara modelos lineares ´e obtida por H

=

X

(

X⁰X

)

⁻¹X⁰,

e vimos que oshiipodem ser utilizados para detectar pontos de alavanca.

Por ´em pode se verificar quehii ´e dado por

∂ˆy_i

∂yi

Assim, Wei, Hu e Fung (1998) propuseram uma forma geral para obter a matriz

∂ˆy y⁰

(4)

Especificamente para GLM pode se mostrar que GL

ˆ =

∂ˆy

∂y⁰

=

D_β

(− ¨

_l_ββ

)

⁻¹

¨

_l_β_y|_ˆ

β

ondeD_β

=

^∂µ_∂β,

¨

_l

ββ

=

^∂_∂ββ²^l^(β)0 e

¨

_l

βy

=

^∂_∂β²^l^(β)_y0 . Em modelos GLM temos queD_β

=

^∂µ_∂β

=

NXe

¨

_l

βy

=

^∂_∂β²^l^(β)_y0

=

φ⁻¹X⁰W⁻¹N, onde N

=

diag

(

dµ₁/dη1, . . . ,dµ_n/dηn

)

. Substituindo

¨

_l

ββ

=

−φ⁻¹

(

X⁰WX

)

, seu valor esperado. Obtemos:

GL

ˆ = ˆ

NX

(

X⁰WX

)

⁻¹X⁰W⁻¹_N

ˆ

(5)

Selecionando a diagonal_GL

ˆ

_ii temos uma alternativa para representar pontos de alavanca no caso GLM.

Note que

GL

ˆ

_ii

= ˆ

ω_ix⁰_i

(

X⁰WX

)

⁻¹x_i, ondeωi

=

⁽^d^µⁱ^/_W^d^ηⁱ⁾²

i .

GL

ˆ

iiapesar de an áloga a definiç ão de obtida no casos de modelos lineares essa estimativa n ão é única.

(6)

Pontos de alavanca tamb ém podem ser obtidos fazendo uma analogia entre o estimador de de m áxima verosimilhança para

ˆ

β no MLG e a soluc¸ ˜ao de m´ınimos quadrados para modelos lineares ponderados.

Vimos que a estimativa para o

ˆ

βpara modelos GLM pode ser pensada como a soluc¸ ˜ao de um modelo linear ponderado com a seguinte forma:

β

ˆ

⁽^t⁺¹⁾

= (

X⁰W⁽^t⁾X

)

⁻¹X⁰W⁽^t⁾z⁽^t⁾,

onde

ˆ

z

=

Xβ⁽^t⁾

+

W⁻¹

(

Y−µ⁽^t⁾

)

Logo, ap ´os converg ˆenciaβ

ˆ

pode ser interpretado como a soluc¸ ˜ao de m´ınimos quadrados de_W

ˆ ˆ

z contra as colunas de_W

ˆ

¹^/²_X_.

(7)

No caso da soluç ão de modelos lineares com m´ınimos quadrados a matriz de projeç ão é dada por:

H

ˆ = ˆ

W¹^/²X

(

X⁰_W

ˆ

_X

)

⁻¹XW¹^/².

Assim, sugere a utilizac¸ ˜ao do

ˆ

_h_ii como a medida de ponto de alavanca (Pregbon, (1981)).

Para ligaç ões can ônicas temos que_GL

ˆ

_ii

= ˆ

hii.

Com ligaç ões n ão can ônicas pode se mostrar que_GL

ˆ

_ii

= ˆ

hiipara um tamanho de amostra grande.

Como

ˆ

_h_ii_{depende de}

ˆ

µ_i sugere para detectar pontos de alavanca fazer o gr ´afico

ˆ

_h_ii×

ˆ

µi.

(8)

Res´ıduos para GLM

Uma definiç ão an áloga aos res´ıduos studentizados para modelos lineares pode ser feitas para modelos GLM.

Todavia isso n ˜ao garante que as propriedades continuem valendo.

Assim pode se pensar em res´ıduos que preservem as propriedades desejadas.

(9)

Uma primeira proposta seria considerar os res´ıduos ordin ários da soluç ão de m´ınimos quadrados da regress ão de

ˆ

zemX, definido porr^?

= ˆ

W⁻¹^/²

(

y−

ˆ

µ)

Se assumirmos que a vari ˆancia dez

ˆ

≈W⁻¹φ, ent ˜ao Var

(

r^?

)

≈φ(I−_H

ˆ )

.

Logo, podemos pensar o res´ıduo padronizado como

tSi

= (

yi−

ˆ

µ_i

)

q

φ_W

ˆ

_i

(

1−

ˆ

_h_ii

)

(10)

Como na pr ´atica

ˆ

µn ˜ao ´e conhecido e nem

ˆ

z é normalmente distribu´ıdo, as propriedades deti n ão s ão verificadas paratSi. Williams (1984) mostra atrav és de simulaç ão que na pr ática a distribuiç ão det_S_i s ão assim étricas.

O res´ıduo mais utilizado em GLM ´e o seguinte:

tDi

=

pD^∗

(

yi

; ˆ

µ_i

)

p

1−

ˆ

_h_ii

=

pD

(

yi

; ˆ

µ_i

)

q

φ(1−

ˆ

_h_ii

)

.

Williams (1984) verificou atrav és de simulaç ões que a distribuiç ão detDi é mais pr óxima da normalidade.

(11)

Identificando Observac¸ ˜oes Influentes

Observac¸ ˜ao Influente

Como para modelos lineares, ap ós identificar observaç ões que s ão outliers com respeito aos valores deYe/ou valores deX, o pr óximo passo é determinar se essas observaç ões s ão ou n ão pontos influentes.

Continuamos a considerar uma observaç ão influente se a exclus ão dessa observaç ão causa uma grande mudança no ajuste da funç ão regress ão.

(12)

Cook’s Distance para GLM

Supondoφconhecido vamos definir a influ ˆenciaLDi como LDi

=

2

(

l

(ˆ

β)−l

(ˆ

β₍_i₎

))

onde

ˆ

β₍_i₎denota o valor estimado paraβ

ˆ

sem ai- ésima observaç ão nos dados.

O calculo deLDi n ˜ao possui forma anal´ıtica. Assim, utiliza-se uma expans ˜ao de Taylor de segunda ordem emLD_ipara se obter

LD_i≈φ⁻¹

(ˆ

β−

ˆ

β₍_i₎

)

⁰

(

X⁰WX

)(ˆ

β−

ˆ

β₍_i₎

)

ondeφ⁻¹X⁰WX ´e o valor esperado de−

¨

_l

(ˆ

β)_ββ.

(13)

De forma geral n ˜ao ´e poss´ıvel encontrar de forma fechada

ˆ

β₍_i₎. Portanto, a aproximaç ão (Pregbon, (1981)) é utilizada:

β

ˆ

¹₍_i₎

= ˆ

β

+ [− ¨

_l

(ˆ

β)_ββ

]

⁻¹l₍_i₎

(ˆ

β)

ondel₍_i₎

(ˆ

β) é a funç ão de log-verosimilhança sem ai- ésima observaç ão.

Substituindo,

¨

_l

(ˆ

β)_ββel₍_i₎

(ˆ

β)por seus valores esperados temos que

ˆ

β¹₍_i₎

= ˆ

β

+ ˆ

rPi

√ω

ˆ

i

φ¹^/²

(

1−

ˆ

_h_ii

) (

X⁰_W

ˆ

_X

)

⁻¹xi

(14)

Ao determinarβ

ˆ

¹₍_i₎podemos substituir na aproximac¸ ˜ao de segunda ordem e obtemos

LDi ≈

ˆ

_h_ii

1−

ˆ

_h_ii

t_S²_i

A validade dessa aproximaç ão ainda esta sendo investigada por pesquisadores. At é o momento acredita-se que a mesma subestima o verdadeiro valor deLDi, por ém é suficiente para chamar a atenç ão de pontos influentes.

(15)

Diagn ´osticos de Influ ˆencia Local

Diagn ósticos de influ ência local tamb ém podem ser feitos para GLM. Por ém, seus c álculos n ão s ão tao simples.

Influ ência local tem sido estudada por diversos pesquisadores. A ideia consiste basicamente em perturbar o vetor de covari áveis e verificar como essa perturbaç ão influencia as estimativas.

Para isso, Cook (1986) utilizou o conceito de curvatura normal Ca

(θ) =

2|a⁰

∆

⁰

(¨

lˆθˆθ

)

⁻¹

∆

a|

ondea é uma direç ão unit ária que se deseja analisar a influ ência.

(16)

Uma sugest ão é utilizarCamax, ou seja, a direç ãoade maior curvatura. Isso implica, que observaç ões sob pequena perturbaç ão exerce influ ência desproporcional emLD

Para GLM se consideramos a funç ão de perturbaç ão da forma

l

(β|δ) =

n

∑

i=1

δili

(β),

com 0≤δi ≤1, pode se mostrar que

∆ =

φ⁻¹^/²X⁰_W

ˆ

¹^/²_D

(ˆ

r_P

)

ondeD

(ˆ

rP

) =

diag

(ˆ

rP1, . . . ,ˆrPn

)

erPi

=

√φ(√yi−ˆµi) Wˆi

. Substituindo

¨

_l⁻¹

ˆθˆθ por seu valor esperado obtemos

(17)

Se escolhemosapara ser na direç ão dai- ésima observaç ãoX_i temos que

Ci

=

2

ˆ

_h_ii

ˆ

rPi

Uma sugest ão para detectar observaç ões influentes é verificar seCi>_C

¯

±2sd

(

C

)

Em particular, o vetoramax, ou seja, a direç ão de maior influ ência

´e dado pelo autovetor correspondente ao maior autovalor da matriz

B

=

D

(ˆ

rP

) ˆ

HD

(ˆ

rP

)

O gr áfico deamaxcontra a ordem das observaç ões pode ser usado para detectar observaç ões influentes.

(18)

Se desejamos detectar observaç ões influentes na estimativa de um coeficiente em particular, associado a vari ávelX_i, podemos reescrever o vetoramaxcomo

a⁰_max

=

ν1

ˆ

rP1

pCamax

, . . . νn

ˆ

rPn

pCamax

!

ondeν1, . . . ,νnsao obtidos da regressao linear deX_i nas colunas deX₋_i com pesos_W

ˆ

_{, ou seja,}

ν

= ˆ

W¹^/²Xi−W¹^/²X−i

(

X⁰₋_i_W

ˆ

_X₋_i

)

⁻¹X⁰₋_i_W

ˆ

_X_i_.

O gr áfico do novoamaxcontra a ordem das observaç ões pode ser usado para detectar observaç ões influentes.