An ´alise de Dados Longitudinais
Aula 13.08.2018
Jos ´e Luiz Padilha da Silva - UFPR www.docs.ufpr.br/∼jlpadilha
Sum ´ario
1 Modelos Marginais
Modelos Marginais
Modelos Marginais para Dados Longitudinais
1 Modelar a resposta m ´edia E (Y
i).
2 Modelar a estrutura de Vari ˆancia-Covari ˆancia
Var (Yi), i = 1, . . . N.
Modelos Marginais
Modelos Lineares para Dados Longitudinais
Dois caminhos:
1 Assumir resposta normal: usar MQG ou MV (usual ou restrita).
2 N ˜ao assumir distribuic¸ ˜ao para a resposta: usar GEE:
Modelos Marginais
Modelos Lineares para Dados Longitudinais
Modelo Linear Geral p-covari ´aveis
Yij = β1Xij1+ β2Xij2+ · · · + βpXijp+ εij; i = 1, . . . , N; j = 1, . . . , n,
em que Xij1 =1. Escrevendo em forma matricial:
Yi = Yi1 Yi2 .. . Yin =Xiβ + εi
Modelos Marginais
Modelos para a Estrutura de Covari ˆancia
1 N ˜ao Estruturado: somente ´e adequada para desenhos
balanceados com poucos tempos. No caso heteroced ´astico, para n medidas repetidas por unidade, h ´a n(n + 1)/2 par ˆametros.
2 Estruturando a Covari ˆancia: simetria composta, AR(1), etc.
Usualmente adequada para desenhos balanceados com poucos tempos.
Modelos para a Estrutura de Covari ˆancia
Modelos para a Estrutura de Covari ˆancia
Nenhuma estrutura imposta: pode haver muitos par ˆametros
para uma quantidade limitada de dados. Isso afeta a precis ˜ao com que β ´e estimado.
Estrutura imposta: ´e poss´ıvel melhorar a precis ˜ao com que β ´e
estimado! Contudo, se muita restric¸ ˜ao ´e imposta, h ´a um risco potencial de m ´a especificac¸ ˜ao que pode resultar em infer ˆencia enganosas sobre β.
Temos o cl ´assico problema de trade-off entre vi ´es e precis ˜ao. Deve-se buscar equil´ıbrio entre essas duas forc¸as.
Modelos para a Estrutura de Covari ˆancia
Estrutura de Vari ˆancia-Covari ˆancia
Var (Yi) = σ2V0 (supondo homocedasticiadade)
e desta forma V0 ´e a matriz de correlac¸ ˜ao de Yi.
Como as unidades formam uma amostra aleat ´oria da populac¸ ˜ao, temos que: V = V0 0 · · · 0 0 V0 · · · 0 .. . ... . .. ... 0 0 · · · V0
Modelos para a Estrutura de Covari ˆancia
1. Simetria Composta
Possui apenas um par ˆametro de correlac¸ ˜ao, independente do n ´umero de medidas: Corr (Yij,Yik) = ρ, ∀j, k .
V0= [(1 − ρ)In+ ρ1n10n]
em que In ´e a matriz identidade e 1n ´e um vetor de 1’s, ambos de
dimens ˜ao n. Assim: V0= 1 ρ · · · ρ ρ 1 · · · ρ .. . ... . .. ... ρ ρ · · · 1 n×n
Modelos para a Estrutura de Covari ˆancia
1. Simetria Composta
Tem justificativa te ´orica quando a m ´edia depende de uma combinac¸ ˜ao de par ˆametros populacionais β, e um ´unico efeito aleat ´orio referente ao indiv´ıduo.
´
E parcimonioso: s ˜ao dois par ˆametros (uma vari ˆancia e uma correlac¸ ˜ao).
Restric¸ ˜ao: ρ ≥ 0. A suposic¸ ˜ao de que ρ ´e o mesmo pode n ˜ao ser real´ıstico pois se espera um decaimento com o tempo.
Modelos para a Estrutura de Covari ˆancia
Justificativa
Considere o modelo de efeitos aleat ´orios: Yij =Xij0β +Ui+ εij
O intercepto ´e o ´unico termo com variac¸ ˜ao aleat ´oria.
A diferenc¸a entre os indiv´ıduos est ´a explicada pelo intercepto aleat ´orio:
Ui ∼ N(0, σ2u)
εij ∼ N(0, σ2),
Modelos para a Estrutura de Covari ˆancia
2. Correlac¸ ˜ao AR(1)
Temos Corr (Yij,Yi,j+k) = ρk, ∀j, k .
V0= 1 ρ ρ2 · · · ρn−1 ρ 1 ρ · · · ρn−2 .. . ... ... . .. ... ρn−1 ρn−2 ρn−3 · · · 1 n×n ´ E muito parcimonioso.
Apropriado para intervalos de tempo igualmente espac¸ados. Correlac¸ ˜oes decaem para zero, mas em muitos estudos o decaimento ocorre em ritmo menor que o previsto por tal estrutura.
Modelos para a Estrutura de Covari ˆancia
Justificativa
Quando os erros surgem de um processo autorregressivo: εij = ρεij−1+ ωij
ωij ∼ N(0, σ2(1 − ρ2)), em que εij e ωij s ˜ao independentes.
Ent ˜ao
Var (εij) = ρ2σ2+ σ2(1 − ρ2) = σ2
Cov (εij, εij−1) =Cov (ρεij−1+ ωij, εij−1) = ρσ2 e para lags maiores que 1,
Modelos para a Estrutura de Covari ˆancia
3. Correlac¸ ˜ao Exponencial
Temos Corr (Yij,Yik) = ρ|tij−tik|, ∀j, k . V0= 1 ρ|ti1−ti2| ρ|ti1−ti3| · · · ρ|ti1−tin| ρ|ti2−ti1| 1 ρ|ti2−ti3| · · · ρ|ti2−tin| .. . ... ... . .. ... ρ|tin−ti1| ρ|tin−ti2| ρ|tin−ti3| · · · 1 n×n
Assume que a correlac¸ ˜ao ´e um se as medidas s ˜ao tomadas repetidamente na mesma ocasi ˜ao; corresponde `a situac¸ ˜ao que as respostas s ˜ao medidas sem erro.
Modelos para a Estrutura de Covari ˆancia
Decaimento Exponencial
O decaimento para zero ocorre de maneira bem r ´apida: Dist ˆancia
ρ 1 2 3 4 5
0,9 0,90 0,81 0,73 0,66 0,59
0,7 0,70 0,49 0,34 0,24 0,17
0,5 0,50 0,25 0,13 0,06 0,03
Modelos para a Estrutura de Covari ˆancia
4. Toeplitz
Assume que qualquer par de respostas igualmente espac¸adas no tempo tem a mesmo correlac¸ ˜ao. Corr (Yij,Yi,j+k) = ρk, ∀j, k .
V0= 1 ρ1 ρ2 · · · ρn−1 ρ1 1 ρ1 · · · ρn−2 .. . ... ... . .. ... ρn−1 ρn−2 ρn−3 · · · 1 n×n ´
E uma extens ˜ao da estrutura AR(1), com n − 1 par ˆametros de correlac¸ ˜ao.
Como assume que a correlac¸ ˜ao entre ocasi ˜oes adjacentes no
tempo ´e constante ρ1, ´e apropriada para intervalos de tempo
Modelos para a Estrutura de Covari ˆancia
5. Banded
A correlac¸ ˜ao ´e zero al ´em de um per´ıodo especificado de tempo. Pode ser aplicado a qualquer estrutura vista anteriormente. Por exemplo, um padr ˜ao banded de tamanho 2 assume
Corr (Yij,Yi,j+k) =0, ∀k > 2. Neste caso, para uma estrutura Toeplitz,
temos: V0= 1 ρ1 0 · · · 0 ρ1 1 ρ1 · · · 0 .. . ... ... . .. ... 0 0 0 · · · 1 n×n
Modelos para a Estrutura de Covari ˆancia
6. Modelos H´ıbridos
Temos:
Cov (Yi) = σ21V1+ σ22V2.
Considere V1como simetria composta e V2como autorregressivo
(exponencial).
Para este modelo h´ıbrido, tempos:
Var (Yij) =σ12+ σ22 Cov (Yij,Yik) =ρ1σ12+ ρ |tij−tik| 2 σ 2 2 Corr (Yij,Yik) = ρ1σ12+ ρ |tij−tik| 2 σ22 σ12+ σ22
Modelos para a Estrutura de Covari ˆancia
6. Modelos H´ıbridos
A correlac¸ ˜ao entre r ´eplicas no mesmo indiv´ıduo na mesma ocasi ˜ao ´e
ρ1σ12+ σ22 σ2
1+ σ22
<1, quando ρ1<1 `
A medida que a separac¸ ˜ao no tempo aumenta, a correlac¸ ˜ao n ˜ao decai para zero, mas tem um m´ınimo em
ρ1σ21
Modelos para a Estrutura de Covari ˆancia
6. Modelos H´ıbridos
Simetria composta ´e tamb ´em um modelo de efeitos aleat ´orios, assim
σ12= σu2+ σ2 e ρ1= σu2 σ2u+ σ2
.
Ou seja, podemos pensar na vari ˆancia total como a soma da vari ˆancia autorregressiva, σ22, a variabilidade entre indiv´ıduos σu2,