Modelos mistos lineares t de Student - Modelo misto linear el´ıptico

3.2 Modelo misto linear el´ıptico

3.7.1 Modelos mistos lineares t de Student

Em MMLs é comum assumir que os efeitos aleatórios e os erros intraindiv´ıduos seguem distribui¸cões normais multivariadas. Assim, a inferência por máxima verossimilhan¸ca para MMLs é sens´ıvel a pontos aberrantes. Em inferência robusta, Wu (2010) apresenta uma abordagem que consiste em substituir as distribui¸cões normais multivariadas pelas corresponden- tes distribui¸cões t de Student com as mesmas médias e matrizes de variâncias-covariâncias. Uma vez que as distribui¸cões t de Student têm caudas mais pesadas do que a normal, é esperado que essas distribui¸cões acomodem melhor pontos aberrantes.

A seguir, apresentamos uma abordagem em MMLs em que é assumida a distribui¸cão t de Student tanto para os efeitos aleatórios quanto para os erros intraindiv´ıduos.

Seja y_i = (yi1, ..., yimi)

T _{as m}

i respostas medidas no indiv´ıduo i, i = 1, ..., n. Um MML

usual ´e dado por

3.7. Distribui¸c˜ao t de Student 49 bi iid ∼ Nq(0, D), ǫi ind ∼ Nmi(0, Ri), (3.17)

em que β = (β1, ..., βp)T são efeitos fixos, bi = (bi1, ..., biq)T são efeitos aleatórios, Xi e

Zi s˜ao matrizes de planejamento conhecidas, ǫi = (ǫi1, ..., ǫimi)

T _{s˜ao erros intraindiv´ıduos,}

Ri é a matriz de variâncias-covariâncias para os erros intraindiv´ıduos e D é a matriz de

variâncias-covariâncias dos efeitos aleatórios.

A vers˜ao do modelo (3.16)-(3.17) sob erros t de Student (Wu, 2010) ´e dada por

y_i = Xiβ+ Zibi+ ǫi, (3.18) bi iid ∼ tq(0, D, νi), ǫi ind ∼ tmi(0, Ri, νi), (3.19)

em que νi denota os graus de liberdade.

Em estudos longitudinais, dados at´ıpicos podem ocorrer no n´ıvel da popula¸cão, o que su- gere uma distribui¸cão t de Student para os efeitos aleatórios para acomodar estes dados, e/ou podem ocorrem no n´ıvel do indiv´ıduo, podendo ser sugerida uma distribui¸cão t de Student para os erros intraindiv´ıduos para acomodar valores discrepantes. Em outras palavras, em modelos lineares de efeitos mistos robustos, podemos considerar distribui¸cões t de Student tanto para os efeitos aleatórios quanto para os erros de cada indiv´ıduo.

3.7.2 Verifica¸c˜ao da qualidade do ajuste

Em modelos com erros de medi¸cão, a qualidade do ajuste tem recebido muito menos aten¸cão na literatura do que a inferência. Como em de Castro e Galea (2010), e similarmente ao caso normal, podemos utilizar a distância de Mahalanobis transformada para avaliar a adequa¸cão do modelo t de Student multivariado ajustado. Temos que a quantidade ϑi =

δi/2mi, sendo δi a distância de Mahalanobis, segue distribui¸cão F(2mi,ν). Além disso, ˆϑi = ˆ

δi/2mi tem a mesma distribui¸c˜ao assint´otica de ϑi (Box e Tiao, 1973).

De forma análoga ao caso normal, após a aplica¸cão da transforma¸cão de Wilson-Hilferty (Johnson et al., 1994) obtemos

d[t]_i = 1 − 2 9ν ϑ1/3_i ₋_{1 −} _9m1 i 2 9νϑ 2/3 i +9m1i 1/2 ,

que tem, aproximadamente, distribui¸cão normal padrão, d[t]_i iid_{∼ N(0, 1), i = 1, ..., n. Gráficos} normais de probabilidade das distâncias transformadas d[t]_i podem ser utilizados para avaliar a qualidade do ajuste do modelo t de Student multivariado.

Cap´ıtulo 4

Diagn´ostico de influˆencia

4.1 Introdu¸c˜ao

A deteçcão de dados at´ıpicos (aberrantes, alavanca ou influentes) e a verifica¸cão de poss´ıveis afastamentos das suposi¸cões estabelecidas sobre o modelo são etapas importantes em qualquer análise estat´ıstica. Isto é essencial para avaliar a sensibilidade dos resultados obtidos com o conjunto de dados dispon´ıvel, já que observa¸cões at´ıpicas podem distorcer as estimativas dos parâmetros, conduzindo em alguns casos a decisões errôneas.

Existem várias alternativas para avaliar a influência de perturba¸cões nos dados e/ou nos pressupostos do modelo sobre as estimativas dos parâmetros de interesse (vide, por exemplo, Cook e Weisberg (1982) e Galea et al. (2000)). A elimina¸cão de casos é uma técnica de diagnóstico comum para avaliar o efeito de uma observa¸cão sobre o processo de estima¸cão e teste de hipóteses. Esta é uma análise de influência global, já que o efeito da observa¸cão é quantificado eliminando-a do conjunto de dados (Cook, 1977).

Alternativamente, Cook (1986) propôs um interessante método, denominado influência local, para avaliar o efeito de pequenas perturba¸cões nos dados e/ou nos pressupostos do modelo estat´ıstico, sobre as estimativas de máxima verossimilhan¸ca, sem eliminar observa¸cões. Cook propôs usar a curvatura normal da superf´ıcie do afastamento pela verossimilhan¸ca que é essencialmente equivalente a usar a segunda derivada do afastamento pela verossimilhan¸ca. O método foi aplicado por Galea et al. (1997) em modelos lineares el´ıpticos. Resultados adicionais sobre influência local e aplica¸cões podem ser encontrados em Escobar e Meeker (1992), Zhao e Lee (1998), Lesaffre e Verbeke (1998), Osorio et al. (2007) e Ibacache-Pulgar

et al. (2012), entre outros.

O desenvolvimento do m´etodo de influˆencia local no contexto de modelos com efeitos mistos e dados com estrutura longitudinal pode ser encontrado nos trabalhos de Osorio

(2006), que estudou o modelo linear com efeito misto el´ıptico, e Osorio et al. (2007) que estudaram modelos lineares el´ıpticos com estrutura longitudinal, entre outros.

Já no contexto de modelos com erros nas variáveis o método de influência local tem sido estudado por diversos autores, entre eles Zhao e Lee (1995), que derivaram fun¸cões de influência para modelos lineares e não lineares generalizados com erros de medi¸cão; e Zhong

et al. (2000), que desenvolveram diagn´osticos de influˆencia local e global para modelos

lineares com erros nas vari´aveis baseados na fun¸c˜ao de verossimilhan¸ca corrigida proposta por Nakamura (1990).

No estudo de diagnósticos de influência, um enfoque corresponde à acomoda¸cão das observa¸cões discrepantes ou influentes utilizando distribui¸cões simétricas com caudas mais pesadas do que a distribui¸cão normal. Neste sentido, uma escolha interesante corresponde à classe de distribui¸cões de contornos el´ıpticos. O principal atrativo desta classe é que permite estender os modelos desenvolvidos sob suposi¸cão de erro normal considerando distribui¸cões simétricas com caudas mais leves ou mais pesadas do que a normal (Osorio, 2006).

4.2 Influˆencia local

Vamos considerar o logaritmo da fun¸c˜ao de verossimilhan¸ca de um modelo el´ıptico, dado por L(θ) = n X i=1 Li(θ), (4.1)

em que Li(θ) = −1₂log|Σi| + log g(δi) é a contribui¸cão da i-ésima observa¸cão.

Suponhamos que Li(θ|ω) seja o logaritmo da fun¸c˜ao de verossimilhan¸ca perturbada,

que depende do vetor de perturba¸c˜oes ω = (ω1, ..., ωn)T, restrito ao subconjunto euclidiano

aberto Ω ∈ ℜn_{, e assumimos que exista um vetor ω}

0 de n˜ao perturba¸c˜ao que satisfa¸ca

L(θ|ω0) = L(θ). Vamos supor tamb´em que bθ seja a estimativa de m´axima verossimilhan¸ca

obtida ao maximizar L(θ) e bθω a estimativa de máxima verossimilhan¸ca obtida ao maximizar L(θ|ω). Como alternativa para comparar bθ e bθω, Cook (1986) propõe medir a distância entre as estimativas, relativas aos contornos do logaritmo da fun¸cão de verossimilhan¸ca não perturbada L(θ), por meio da fun¸cão de afastamento da verossimilhan¸ca, definida como

LD(ω) = 2hL(bθ_{) − L(bθ|ω)}i _{≥ 0.}

A ideia da influˆencia local ´e estudar o comportamento de LD(ω) em torno de ω0. Deve-

4.2. Influˆencia local 53

No documento Modelos mistos lineares elípticos com erros de medição (páginas 64-69)