Métodos de Diagnóstico para Modelos Lineares Mistos p.1/58

(1)

M ´etodos de Diagn ´

ostico para Modelos

Lineares Mistos

Aluno: Juv ˆencio Santos Nobre juvencio@ime.usp.br

Orientador: Prof. PhD J ´ulio da Motta Singer

jmsinger@ime.usp.br

(2)

Introdução

Experimentos com medidas repetidas referem-se a casos no qual

cada unidade experimental é observada pelo menos duas vezes.

Exemplo

Estudo realizado na FOUSP. Objetivo: comparar dois tipos de escova, monobloco e

convencional, quanto à manuntenção da capacidade de remoção da placa bacteriana (durabilidade) sob uso

(3)

Introdução

Experimentos com medidas repetidas referem-se a casos no qual

cada unidade experimental é observada pelo menos duas vezes.

Exemplo

Estudo realizado na FOUSP.

Objetivo: comparar dois tipos de escova, monobloco e convencional, quanto à manuntenção da capacidade de remoção da placa bacteriana (durabilidade) sob uso

(4)

Modelagem da Estrutura de Correlação

Espera-se uma dependência entre as observações referentes a uma mesma unidade experimental. Propostas para modelar a estrutura de correlação intra-unidade experimental:

Inclusão de variáveis latentes em modelos lineares (não

lineares), gerando assim os modelos lineares (não lineares) mistos e os modelos lineares generalizados mistos [Laird & Ware (1982), McCulloch & Searle (2001)];

Inclusão de uma matriz de correlação de trabalho (EEG)[Liang & Zeger (1986)].

(5)

Modelos Lineares Mistos

Um modelo linear misto pode ser escrito na forma

Y_i = X_iβ + Z_iγ_i + ε_i (i = 1, ..., c), (1)

Considerando Y = (Y₁>_{, · · · , Y}_c>)>, X = (X>₁ _{· · · X}>_c )>,

Z=diag(Z₁_{, · · · , Z}_c), γ = (γ₁>_{, · · · , γ}_c>)> e ε = (ε>₁ _{, · · · , ε}>_c )> temos:

Y_n×1 = X_n×pβ_p×1 + Z_n×cqγ_cq×1 + ε_n×1. (2)

Usualmente, assume-se que

" γ ε # ∼ Ncq+n " 0_cq 0_n # , " ∆ 0_cq×n 0_n×cq Σ #! , (3) com γ₁, ..., γ_c i.i.d._{∼ N}_q(0, G) [∆ = Ic N G].

(6)

Modelos Lineares Mistos

∆ e Σ são funções de poucos parâmetros (desconhecidos) θ que

independem dos parâmetros de localização β, ou seja, ∆ = σ2D(θ)

e Σ = σ2R(θ). Fazendo ξ = Zγ + ε, obtém-se

Y = Xβ + ξ, (4)

com _{ξ ∼ N}_n(0_n, V), em que

V = σ2 ZDZ> + R . (5)

Se R = In ⇒ modelo de independência condicional

(7)

BLUE e BLUP

Seja γ ( ˆˆ β) o BLUP (BLUE) de γ (β) então:

ˆ

γ e βˆ são funções lineares de Y;

IE[ˆ_{γ − γ] = 0} (IE[ ˆ_{β − β] = 0}), ou seja, γ ( ˆˆ β) é não viesado para

γ (β);

ˆ

γ ( ˆβ) é o melhor preditor (estimador) de γ (β) dentro da classe

dos preditores (estimadores) lineares, no sentido, de que o mesmo minimiza o erro quadrático médio de previsão

(estimação).

Supondo V conhecida, mostra-se que

ˆ

β = X>MX−1 X>MY = X>V−1X−1 X>V−1Y e

ˆ

(8)

BLUE e BLUP

com M = σ2V−1 e Q _{= M − MX X}>MX−1 X>M uma matriz

simétrica semi-definida positiva de ordem n (posto(Q)=n − p), com

QM−1Q = Q e QX = 0. Pode-se mostrar que

Cov " ˆ β − β ˆ γ − γ # = σ2 " X>R−1X X>R−1Z Z>R−1X Z>R−1Z + D−1 #₋₁ . (6)

(9)

BLUE e BLUP

com M = σ2V−1 e Q _{= M − MX X}>MX−1 X>M uma matriz

simétrica semi-definida positiva de ordem n (posto(Q)=n − p), com

QM−1Q = Q e QX = 0. Pode-se mostrar que

Cov " ˆ β − β ˆ γ − γ # = σ2 " X>R−1X X>R−1Z Z>R−1X Z>R−1Z + D−1 #₋₁ . (7) EBLUE e EBLUP

Como D (V) depende de um vetor de componentes de

covariância θ∗ desconhecido, calculamos o BLUE e BLUP

com base no estimador θb∗; nesse caso eles são

denominados como BLUE e BLUP empíricos (EBLUE e

(10)

Testes de hipóteses e critérios de informação

Teste da Razão de Verossimilhanças;

Teste de Wald/Score [Verbeke & Molenberghs (2003)].

Problemas quando a hipótese de interesse situa-se na borda do espaço paramétrico [Self & Liang (1987)].

(11)

Testes de hipóteses e critérios de informação

Teste da Razão de Verossimilhanças;

Teste de Wald/Score [Verbeke & Molenberghs (2003)].

Problemas quando a hipótese de interesse situa-se na borda do espaço paramétrico [Self & Liang (1987)].

É comum utilizar alguns critérios de informação como o AIC, o BIC definidos como

AIC = −2l + 2d, (8)

BIC = −2l + d ln n, (9)

com l representando o máximo da log-verossimilhança (completa ou

restrita), d o número de parâmetros do modelo e n o número de

(12)

Aplicação

Singer & Andrade (1997) apontam as seguintes características que o modelo adotado para representar dados deste tipo deve apresentar:

(i) Um índice pré-tratamento nulo implica um índice pós-tratamento também nulo;

(ii) Os índices pré-tratamento e pós-tratamento são não-negativos; (iii) Os dados são possivelmente heterocedásticos (pois são

não-negativos e satisfazem a desigualdade _{y ≤ x});

(iv) A relação entre os índices pré-tratamento e pós-tratamento é possivelmente não-linear;

(v) As observações realizadas numa mesma unidade experimental são possivelmente correlacionadas.

(13)

Modelo

Singer et al. (2004) sugerem o seguinte modelo

yijd = βjdxγ_ijdjdξijd, (10)

com β_jd > 0, i = 1, 2, ..., 32, j = 0, 1, d = 1, 2, 3, 4.

yijd (xijd) é o índice de placa bacteriana pós-tratamento

(pré-tratamento) relativo a i- ´esima criança com a j- ´esima escova

na d- ´esima sessão de avaliação;

β_jd é um coeficiente de placa bacteriana residual relativo à

j- ´esima escova e à d- ´esima sessão de avaliação;

γ_jd é um coeficiente de uniformidade da taxa de placa residual

esperada relativo à j- ´esima escova e a d- ´esima sessão de

(14)

Modelo

Considerando a seguinte transformação

ln y_ijd = ln β_jd + γ_jd ln x_ijd + ln ξ_ijd

y_ijd∗ = λ_jd + γ_jdx∗_ijd + ξ_ijd∗ , (11)

ξ_ijd∗ = ln ξ_ijd _{∼ N(0, σ}_i2). Para satisfazer a característica (v),

consideramos que o logaritmo do erro é decomposto da seguinte forma:

ξ_ijd∗ = ψi + εijd, (12)

com ψ_i _{∼ N(0, τ}2) e ε_ijd _{∼ N(0, σ}2), denotando respectivamente, o

(15)

Modelo adotado

ln Yi = Xiβ + Ziψi + εi, (13) em que β = (λ₀₁, λ₀₂_{, · · · , λ}₁₃, λ₁₄, γ₀₁, γ₀₂_{, · · · , γ}₁₃, γ₁₄)> e Z_i = 1₄. A priori, consideramos Σ_i = Var[ε_i] = σ2      1 ρ ρ2 ρ3 ρ 1 ρ ρ2 ρ2 ρ 1 ρ ρ3 ρ2 ρ 1      . (14)

(16)

Estratégia de análise

(i) Simplificação da estrutura de covariâncias (ρ = 0), ou seja,

Σ_i = σ2I₄;

(ii) Testar a homogeneidade entre os coeficientes de uniformidade para as duas escovas nas quatro sessões de avaliação, ou

seja, testar se γ_jd = γ (j = 0, 1, d = 1, ..., 4);

(iii) Testar a significância do efeito de interação e dos efeitos

principais dos tipos de escova com relação aos coeficientes de placa bacteriana residual, ou seja,

λ01 − λ11 = λ02 − λ12 = λ03 − λ13 = λ04 − λ14 e λjd = λj;

(iv) Ajustar o modelo que incorpora as conclusões obtidas em (i), (ii) e (iii), ou seja, reduzir o modelo (10) para

(17)

Ajuste do modelo final

Figura 1: Ajuste do modelo final._∗

Indice de placa bacteriana pre-tratamento

Indice de placa bacteriana pos-tratamento

1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 Convencional Monobloco

As observações representadas por _• referem-se as crianças que

(18)

Objetivos da análise de diagnóstico

Verificar as suposições do modelo;

Identificar observações/unidades experimentais que exercem influência desproporcional no modelo ajustado;

Avaliar a robustez do modelo quando ele está sujeito a algum tipo de perturbação (qualquer mudança nas suposições ou nos dados).

(19)

Análise de Resíduos

No modelo (2), podemos definir três tipos de erro:

Erro condicional: ε = Y − IE[Y|γ] = Y − Xβ − Zγ; Efeitos aleat ´orios: Zγ = IE[Y|γ] − IE[Y];

Erro marginal: ξ = Y − IE[Y] = Y − Xβ = Zγ + ε.

Os respectivos resíduos (e matrizes de covariâncias ) são dados por

Res´ıduo condicional: ε = Y − X ˆˆ β − Zˆγ (Var[ˆε] = σ2Q); EBLUP: Zˆγ (Var[Zˆγ] = σ2ZDZ>QZDZ>);

(20)

Resíduo marginal e resíduo condicional

Resíduo marginal

Avaliar a suposição de linearidade entre IE[Y] e as

covariáveis X [Hilden-Minton (1995)];(ξˆ vs. x)

Avaliar o ajuste da estrutura de covariâncias [Weiss

(1995)], uma vez que Var[ξ] = V.

Resíduo condicional

Avaliar a hipótese de homocedasticidade do erro condicional;

Verificar a existência de observações discrepantes [Weiss &

Lazaro (1992), Weiss (1995), Oman (1995) e Pinheiro & Bates (2000, p.175)];

Gráfico dos elementos do resíduo condicional padronizado

vs. índices [R = I_n] εˆ∗_i = εˆi

ˆ

(21)

Resíduo com confundimento mínimo

Sob a validade do modelo (2) temos

ˆ

ε = Qε + QZγ, (16)

implicando que εˆ é confundido pela presença de γ. Hilden-Minton

(1995) define a fração de confundimento para εˆi

0 ≤ CFi = Var[U>_i ZγU_i] Var[ˆε_i] = U>_i QZDZ>QU_i U>_i QU_i = 1 − U>i QQUi U>_i QU_i ≤ 1. (17)

Para minimizar o efeito de confundimento, Hilden-Minton (1995)

su-gere utilizar uma tranformação linear de εˆ, L>εˆ, que minimize o

(22)

Resíduo com confundimento mínimo

Denotando as colunas de L por l_i, uma sugestão é minimizar o

confundimento de l>_i εˆ, ou seja maximizar

λi =

l>_i QQl_i

l>_i Ql_i , (18)

sujeito a restrição Var[l>_i ε] ∝ lˆ >_i Ql_i > 0. Desta forma, mostra-se que

o vetor l_i que minimiza o confundimento é dado por l_i = π_i−1/2K_i(i =

1, ..., n − p), com K_i representando a i- ´esima coluna de K, em que

Q = KΠK>, com K_n×(n−p); K>K = I_n−p e Π=diag(π1, ..., π_n−p)

(23)

EBLUP

Encontrar possíveis unidades experimentais discrepantes

[Waternaux et al. (1989), Verbeke (1995), Verbeke & Lesaffre

(1996a), Pinheiro & Bates (2000) e Longford (2001)]

Z_iγˆi reflete a diferença entre o valor predito e o valor médio

populacional para a i- ´esima unidade experimental, desta

forma podemos utilizar o EBLUP para encontrar unidades

experimentais discrepantes através de

ζ_i = ˆγ_i>Varc[ˆγ_i − γ_i]ˆγ_i ≈ χ2_n

i.

Avaliar a hipótese de normalidade de γ [Lange & Ryan (1989) e

Jiang (2001)].

Estimativas consistentes mesmo quando γ não segue

(24)

EBLUP

i.

Jiang (2001)].

(25)

EBLUP

i.

Jiang (2001)].

(26)

EBLUP

i.

Jiang (2001)].

(27)

Figura 2: Resíduo Marginal e EBLUP do modelo final .

Logaritmo do indice de placa bacteriana pre-escovacao

Residuo Marginal -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 -1.0 -0.5 0.0 0.5 1.0 (a) 12.2 29.3 29.4 Unidade Experimental EBLUP 0 5 10 15 20 25 30 -0.4 -0.2 0.0 0.2 0.4 (b) 29

(28)

Figura 3: Resíduo condicional padronizado e envelope simulado

com 95% para o resíduo com confundimento mínimo.

Unidade Experimental

Residuo Condicional Padronizado

0 5 10 15 20 25 30 -4 -2 0 2 4 (a) 12.2 29.4 Quantis da N(0,1)

Residuo com confundimento minimo

-2 -1 0 1 2 -2 0 2 4 (b)

(29)

Análise de Sensibilidade

Identificar observações/unidades experimentais que exercem influência desproporcional no modelo ajustado;

Avaliar a robustez do modelo quando está sujeito a algum tipo de perturbação (qualquer mudança nas suposições ou nos dados).

(30)

Pontos/Observações Alavanca

Observações que exercem uma forte influência no respectivo valor predito; destacam-se observações com valores atípicos

das variáveis explicativas [Cook & Weisberg (1982) e Wei et al.

(1998)].

Considerando um modelo estatístico em que Yb = \IE[Y] = µ( ˆβ),

Wei et al. (1998) definem a matriz de alavancagem generalizada

GL( ˆβ) = ∂ bY ∂Y> = ∂ ˆy_i ∂y_j n×n , (19)

que reflete a taxa de mudança instantânea no respectivo valor pre-dito quando a variável resposta é acrescida por um infinitésimo. A

(31)

Observações alavanca para os efeitos fixos

Considerando γ como um parâmetro de pertubação no modelo,

uma vez que IE[Y] não depende do mesmo, e lembrando

ˆ

β = X>V−1X−1 X>V−1Y, tem-se que a matriz (19) fica

GL( ˆβ) = X X>V−1X−1 X>V−1. (20)

Definindo h∗_ii = GL( ˆβ)_ii, consideraremos o i- ´esimo ponto como

“ala-vanca" se h∗_ii _{≥ 2p/n}. Usando a abordagem de Banerjee & Frees

(1997) podemos definir uma unidade experimental como alavanca

se tr(Hi)

ni ≥ 2p/n, em que Hi = Xi(X

>_V−1_X₎−1_X>

(32)

Alavancagem nos efeitos fixos e aleatórios

Uma observação pode influenciar tanto as estimativas dos efeitos fixos como as predições dos efeitos aleatórios;

Aconselhável medir esta influência de forma conjunta.

Uma proposta para incorporar informações a respeito dos efeitos

aleatórios, é considerar Yb ∗ = \_{IE[Y|γ] = X ˆ}β + Zˆγ. Derivando Yb ∗

com relação a Y> GL( ˆβ, ˆγ) = ∂ bY∗ ∂Y> = b Y ∂Y> + ∂Zˆγ ∂Y> = GL( ˆβ) + ZDZ>Q. (21)

(33)

Figura 4: Alavancagem generalizada. Unidade Experimental Alavanca Generalizada 0 5 10 15 20 25 30 0.02 0.04 0.06 0.08 0.10

(a) Efeitos fixos por observacao 3.1 6.3 11.2 12.1 19.1 31.1 31.4 Unidade Experimental Alavanca Generalizada 0 5 10 15 20 25 30 0.020 0.025 0.030 0.035 0.040 0.045 (b) Efeitos fixos por UE 11 12 Unidade Experimental Alavanca Generalizada 0 5 10 15 20 25 30 0.16 0.18 0.20

(c) Efeitos fixos e aleatorios por observacao 3.1 6.3 11.2 12.1 31.1 Unidade Experimental Alavanca Generalizada 0 5 10 15 20 25 30 0.145 0.150 0.155 0.160 0.165

(d) Efeitos fixos e aleatorios por UE 1112

(34)

Eliminação de observações

Avaliar a influência de um conjunto de observações I através

da sua eliminação;

Importância de obter a relação entre θˆ e θˆ_(I), evitando assim

reajustar o modelo; Incoveniente:

Estimativas dos parâmetros de covariâncias são obtidas iterativamente (processo computacionalmente intensivo); Propostas:

Considerar a estrutura de covariância conhecida, encontrar a relação e avaliar sobre a estrutura de covariância estimada [Hilden-Minton (1995), Haslett

(1999) e Fung et al. (2002)];

(35)

Fórmulas de atualização do BLUE e BLUP

Considerando V conhecida e que _{I = {i}₁, i₂, ..., i_k_} mostra-se

ˆ β − ˆβ_(I) = X>MX−1 X>MU_Iφˆ_I (22) e ˆ γ − ˆγ(I) = DZ>QUIφˆI, (23) com ˆ φ_I = U>_I QU_I−1 U>_I QY (24) U_I = (u_ij)_n×k = (U_i1, Ui2, ..., Uik), (25)

(36)

Medidas baseadas na eliminação de observações

Uma das medidas mais utilizadas para avaliar a influência de um conjunto de observações, via eliminação, é a distância de Cook

[Cook (1977)] DI = b θ − bθ_(I)> U_{θ − b}b θ_(I) c , (26)

sendo U uma matriz positiva definida e c um parâmetro de escala.

D_I mede a influência das observações do conjunto I na estimativa

do vetor de parâmetros θ, segundo a métrica definida por U e c. No

(37)

Generalizações da distância de Cook

Algumas “generalizações" de (26) são propostas dentro do

contexto de modelos lineares mistos. Uma proposta [Christensen et

al. (1992), Banerjee & Frees (1997) e Fung et al. (2002) ] é utilizar

D_I = ( ˆβ − ˆβ(I)) >_(X>_Vb −1_{X)( ˆ}_{β − ˆ}_β (I)) ˆ σ2 = ( bY − bY(I)) >_Vb −1_{( b}_Y _{− b}_Y (I)) ˆ σ2 , (27)

para medir a influência das observações do conjunto I nas

(38)

Desvantagem de

D

_I

Pode não detectar observações influentes nas estimativas dos

parâmetros de covariância [Banerjee (1998) e Tan et al. (2001)];

Dado que o efeito causado pela eliminação de uma observação na estrutura de covariância é equivalente ao efeito causado no

BLUP γˆ, então Tan et al. (2001) sugerem a utilização da medida de

Cook condicional nos efeitos aleatórios (i = 1, ..., n)

D_icond =

c

X

j=1

P>_j(i)Varc[Y|γ]−1P_j(i)

(n − 1)c + p = c X j=1 P>_j(i)P_j(i) k , (28)

com P_j(i) = bY_j _{− b}Y_j(i) = (X_j + Z_jγˆ_j_{) − (X}_{j (i)} + Z_jγˆ_j(i)) e k = ˆσ2_{([n −}

(39)

Decomposição de

D

_i

cond

Podemos decompor (28) da seguinte forma

D_icond = D_1icond + Dcond_2i + D_3icond, (29)

em que D_1icond = ( ˆβ − ˆβ(i)) >_(X>_X_{)( ˆ}_{β − ˆ}_β (i)) k = ( bY _{− b}Y_(i))>( bY _{− b}Y_(i)) k , D_2icond = (ˆγ − ˆγ(i)) >_Z>_Z_(ˆ_{γ − ˆγ} (i)) k , e D_3icond = 2( ˆβ − ˆβ(i)) >_X>_Z_(ˆ_{γ − ˆγ} (i)) k .

(40)

Influência de uma unidade experimental

Ao eliminar todas as observações de uma unidade

experimental não podemos prever o correspondente efeito aleatório.

Proposta: Avaliar a influência da i- ´esima unidade

experimental utilizando a média das distâncias (28) referentes a todas as observações da unidade

experimental, ou seja,

Dcond_i. = (n_i)−1 X

j∈I

D_jcond, (30)

com I representando o conjunto das n_i observações da

(41)

Figura 5: Distância de Cook condicional por observação. Unidade Experimental Di 0 5 10 15 20 25 30 0.0 0.01 0.02 0.03 0.04 0.05

(a) Distancia de Cook condicional 12.2 29.4 Unidade Experimental Di1 0 5 10 15 20 25 30 0.0 0.01 0.02 0.03 0.04 0.05 (b) D1i 12.1 12.2 _29.4 Unidade Experimental D2i 0 5 10 15 20 25 30 0.0 0.01 0.02 0.03 0.04 0.05 (c) D2i 12.2 29.4 Unidade Experimental D3i 0 5 10 15 20 25 30 -0.001 0.0 0.001 (d) D3i 12.1 12.2 12.4

(42)

Figura 6: Distância de Cook condicional por unidade experimental. Unidade Experimental Di 0 5 10 15 20 25 30 0.0 0.005 0.010 0.015 0.020

(a) Distancia de Cook condicional 12 29 Unidade Experimental D1i 0 5 10 15 20 25 30 0.0 0.005 0.010 0.015 0.020 (b) D1i 12 29 D2i 0.010 0.015 0.020 (c) D2i 12 29 D3i 0.0 0.0002 0.0004 0.0006 (d) D3i

(43)

Influência Local

Proposto por Cook (1986) com o objetivo de avaliar a mudança nos resultados da análise quando incorporamos “pequenas

perturbações" ao modelo. A abordagem original baseia-se na análise do afastamento da verossimilhança (“likelihood

displacement")

LD(w) = 2nL(b_{θ) − L(b}θw)

o

, (31)

em que:

L(·) é a log-verossimilhança do modelo postulado;

θ é um vetor _{p × 1} de parâmetros ;

L(·|w) é a log-verossimilhança do modelo “perturbado";

w representa um vetor _{q × 1} de perturbações relevantes,

(44)

Influência Local

b

θ e θbw são, respectivamente, os EMV baseados em L(·) e

L(·|w);

w₀ _{∈ Ω} é o vetor que representa a ausência de perturbação, ou

seja, _L(θ|w₀) = L(θ), _{∀θ ∈ Θ}.

Quanto maior for LD(w) maior é a sensibilidade com relação ao

esquema de perturbação proposto. Nesse contexto LD(w) é

uti-lizada para comparar θb e θbw com respeito aos contornos da

(45)

Influência Local

Cook (1986) considerou o gráfico de influência (LD(w) vs. w)

como uma superfície em IRq+1 formada pelos valores do vetor

α(w) = w>, LD(w)> , (32)

com w variando em Ω. Para medir a sensibilidade do afastamento

da verossimilhança, Cook (1986) utilizou a curvatura normal de (32)

ao redor de w₀ na direção de um vetor d (_{q × 1}) de norma unitária,

(46)

Curvatura Normal

A curvatura normal de α(w) é dada por [Cook (1986, eq.16)]

Cd = −2d>H>L¨−1Hd, (33)

com L¨ = ∂2L(θ)/∂θ>∂θ _|_θ=_θ_b e H = ∂2_{L(θ|w)/∂θ}>∂w _|_w_=w

0;θ=θb.

A curvatura normal (33) assume seu valor máximo quando

d = d_max, com d_max representando o autovetor normalizado

associado ao maior autovalor de _−H>L¨−1H.

d_max indica qual o tipo de perturbação que produz a maior

mudança em LD(w);

O gráfico de _{| d}_max _| pode revelar qual o tipo de perturbação

que possue a maior influência em LD(w) na “vizinhança" de

(47)

Influência Local em Modelos Lineares mistos

Beckman et al. (1987) e Lesaffre & Verbeke (1998) utilizaram o

conceito de influência local em modelos lineares mistos;

Ambos basearam-se na verossimilhança marginal de Y

L(ψ) = −(1/2) ln |V| + (Y − Xβ)>V−1_{(Y − Xβ)} , (34)

(48)

Tipos de perturbação

Perturbação na matriz de covariâncias de ε.

Identificar observações sensíveis a suposição de

(49)

Tipos de perturbação

Identificar observações sensíveis a suposição de

(50)

Tipos de perturbação

Identificar observações sensíveis a suposição de homocedasticidade.

Perturbação na variável resposta. Identificar observações sensíveis a pequenas perturbações

na variável resposta; No caso linear normal destacam-se

as observações com alto erro de predição _|y_i _{− ˆy}_i_|

(51)

Tipos de perturbação

Perturbação na variável resposta.

Identificar observações sensíveis a pequenas perturbações na variável resposta; No caso linear normal destacam-se

(52)

Tipos de perturbação

Perturbação na matriz de covariâncias de ε

Perturbação na variável resposta

[Schwarzmann (1991)].

Perturbação na matriz de covariâncias de γi.

Identificar unidades experimentais sensíveis a suposição de homogeneidade entre as matrizes de covariâncias dos

(53)

Tipos de perturbação

Perturbação na matriz de covariâncias de ε

Perturbação na variável resposta

[Schwarzmann (1991)].

Perturbação na matriz de covariâncias de γi.

Identificar unidades experimentais sensíveis a suposição de homogeneidade entre as matrizes de covariâncias dos

(54)

Figura 7: Perturbação na matriz de covariâncias de ε. _∗ |dmax| 0.2 0.4 0.6 0.8 1.0 1.2 12.2 29.4

(55)

Figura 8: Perturbação na variável resposta. _∗ Observacao |dmax| 0 5 10 15 20 25 30 0.0 0.2 0.4 0.6 0.8 1.0 1.2 12.2 29.4

(56)

Figura 9: Perturbação na matriz de covariâncias de γ_i. _∗ |dmax| 0.2 0.4 0.6 0.8 1.0 29

(57)

Caso ponderado

Lesaffre & Verbeke (1998) consideraram o modelo linear misto,

com a respectiva matriz de covariâncias Var[γ_i] = G não

estruturada. Nesse caso, a log-verossimilhança pode ser reescrita da seguinte forma L(ψ) = c X i=1 L_i(ψ) = c X i=1 (−1/2)ln |Vi| + r>_i V−1_i ri , (35) com r_i = ξ_i = Y_i _{− X}_iβ e L_i(ψ) representando a

log-verossimilhança referente a i- ´esima U.E., respectivamente. Eles

surgeriram perturbar o modelo da seguinte forma

L_i_{(ψ|w) =}

c

X

i=1

w_iL_i(ψ), (36)

(58)

Influência local referente ao

i- ´esimo

indivíduo

Lesaffre & Verbeke (1998) definiram a influência local referente ao i-ésimo indíviduo como sendo a curvatura normal (33) calculada

na direção do vetor d_i, com d_i representando um vetor de

dimensão _{c × 1} com valor 1 na i- ´esima posição e zero nas demais.

Nesse caso a curvatura normal é dada por

C_i = 2_d>_i H>L¨−1Hd_i = 2 H>i L¨−1Hi , (37)

(59)

Propriedades de

C

_i

C_i converge para 2ρ_i, com ρ_i representando a proposta de

Pregibon (1981) para medir a influência da i- ´esima unidade

experimental, via aproximação por 1 passo de ψb_(i) [Verbeke

(1995)];

Pode-se mostrar que

C_i = 2

c

X

j=1

λ_jv_ji2 , (38)

com λ₁ _{≥ λ}₂ _{≥ · · · ≥ λ}_c denotando os c autovalores de

−H>L¨−1H e d_max _{≡ v}₁_{, · · · , v}_c os autovetores ortogonais

normalizados correspondentes, com v_ji representando o

(60)

Figura 10: Caso ponderado_∗ Unidade Experimental Ci 0 5 10 15 20 25 30 0 2 4 6 12 29 Unidade Experimental |dmax| 0 5 10 15 20 25 30 0.0 0.2 0.4 0.6 0.8 12 29

(61)

Decomposição de

C

_i

Podemos reescrever Ci como

C_i _{= 2||¨}L−1_{|| cos φ}_i_||H_i_||2, (39)

com φ_i representando o ângulo entre vec(−¨L−1) e vec(H_iH>_i ), com

||A|| = |vec(A)| denotando a norma de Frobenius da matriz A. A

idéia de Lesaffre & Verbeke (1998) foi decompor _||H_i_||2 como a soma

dos quadrados das normas da contribuição do i- ´esimo indivíduo para

(62)

Decomposição de

C

_i

||Hi||2 = ||X>_i Vb_i−1ˆri||2 + 1 2||Z > i Vb−1i Zi − Z>i Vbi−1ˆriˆr>i Vb−1i Zi||2 + 1 4||tr{ bV −1 i } − ˆr>i Vb−1i Vbi−1ˆri||2. (40)

Desta forma, pode-se mostrar que Ci = ai + bi + di com

a_i = 2 ncos φ_i cos ψ_i_||¨L−1_|| o ||XiX_i>|| 2 ||Ri|| 2 , (41) bi = n cos φi cos κi||¨L−1|| o ||ZiZ_i>|| 2 ||In_i − RiR>_i || 2 , (42) di = 1 2 n cos φi cos2 νi||¨L−1|| o || bV_i−1_||2_||I_n_i _{− R}iR>_i || 2 . (43)

(63)

Decomposição de

C

_i

em que ψ_i, κ_i e υ_i representam ângulos similares a φ_i e

Ri = bV_i−1/2ˆri, Xi = bV−1/2_i Xi e Zi = bV_i−1/2Zi.

||¨L−1_|| é a parte comum a todas as componentes;

ψi, κi e υi representam as partes não interpretáveis de ai, bi e

d_i, respectivamente; Partes interpretáveis: ||XiX_i>|| 2 (a_i); ||Ri|| 2 (a_i); ||ZiZ_i>||2 (b_i); ||Ini − RiR>i || 2 (b_i e d_i); || bV−1_i _||2 (d_i).

(64)

Decomposição de

C

_i

Um alto valor de a_i pode ser causado por uma unidade

experimental que tem muitas observações ou que não é bem predita pelo modelo;

b_i tende a assumir um valor alto, para uma unidade

experimental com muitas observações com a respectiva matriz de covariâncias mal ajustada;

d_i tende a assumir um grande valor, para uma unidade

experimental com pequena variabilidade e com respectiva matriz de covariâncias mal ajustada;

Em um estudo desbalanceado as partes interpretáveis a

podem sofrer uma alta influência do número de observações de cada unidade experimental;

(65)

Figura 11: Quantidades interpretáveis de C_i Unidade Experimental norx 0 5 10 15 20 25 30 70 75 80 85 90 95

(f) Norma de Frobenius da Matriz de planejamento dos efeitos fixos padronizada

Unidade Experimental |ri|^2 0 5 10 15 20 25 30 1 2 3 4 5

(g) Norma de Frobenius dos residuos marginais padronizados

12 29 Unidade Experimental noresi 0 5 10 15 20 25 30 5 10 15 20 25

Residuos para a estrutura da matriz de covariancias

12

(66)

Unidades experimentais “atípicas".

# 11: Essa criança utilizou a escova convencional e apresentou

o menor índice de placa bacteriana pré-escovação (0.60);

# 12: Essa criança utilizou a escova convencional e apresentou

o segundo menor índice de placa bacteriana pré-escovação (0.71) na segunda sessão; apresenta também um alto índice, entre as 25% maiores, de placa bacteriana pós-escovação (1.31) na quarta sessão;

# 29: Essa criança apesar de ter utilizado a escova monobloco,

apresentou todos seus índices de placa bacteriana

pós-escovação entre os 25% menores índices, inclusive o menor (0.37) obtido na quarta sessão.

(67)

Pesquisas futuras

Estender o gráfico da variável adicionada para efeitos aleatórios;

Utilizar o EBLUP com confundimento mínimo, como ferramenta para avaliar a suposição de normalidade dos efeitos aleatórios; Estender as técnicas de diagnóstico aqui apresentadas para os modelos lineares mistos sem se restringir ao modelo de

independência condicional, modelos não-lineares mistos e para os modelos lineares generalizados mistos;

Estudar a sensibilidade das medidas de diagnóstico

apresentadas, devido a má especificação das matrizes R e D;