2.2 Modelos multiníveis
2.2.1 Modelos multiníveis com 2 níveis
O MMLG assume que existe um conjunto de dados hierárquicos com uma única variável resposta, medida no nível mais baixo da hierarquia, e as variáveis explicativas que podem ser observadas em todos os níveis existentes. Conceitualmente, o modelo pode ser visto como um sistema hierárquico de equações de regressão.
Na abordagem dos modelos lineares hierárquicos ou MMLG com 2 níveis, refere-se as unidades de nível 2 como observações no grupo e as unidades de nivel 1 como grupo. A quantidade de grupos é denotada por I e o número de observações no grupo, que pode variar de grupo para grupo, é denotado por ni para cada grupo i(i= 1,2, . . . , I). Neste caso, os dados não precisam ser balanceados, uma vez que o número de observações pode variar de grupo para grupo.
Suponha um modelo linear de 2 níveis, dado por
Yij =aj+bjXij +εij, (2.6) onde aj, bj são efeitos aleatórios, εij são os erros da j-ésima observação no nível 2 do i-ésimo grupo do nível 1.
Na Figura 2.1, (a) ilustra o modelo e regressão usual; em (b), os interceptosai’s variam, mas os coeficientes de regressão bi’s são considerados constantes e em (c), os interceptos ai’s e os coeficientes de regressão bi’s variam de grupo para grupo.
Figura 2.1: Comparativo entre o modelo de regressão usual e o modelo com efeito aleatório.
Suponha queY é uma variável resposta eXé uma única variável explicativa. O modelo para a análise no nível 2 é definido da seguinte forma:
Yij =β0i+β1iXij+εij, (2.7) com j=1,2,. . . ,ni ei=1,2,. . . ,I em que:
• Yij é a variável resposta da j-ésima observação do nível 2 para o i-ésimo grupo do nível 1;
• Xij é a variável explicativa em sua medida original, ou centrada na média geralX.., ou centrada na média de um grupo Xi., ou centrada em outro valor, medida no j-ésima observação e agrupado noi-ésimo grupo;
• β0i é o intercepto aleatório para oi-ésimo grupo;
• β1i é o coeficiente de regressão usual para oi-ésimo grupo, em que sua interpretação é dada pela mudança esperada na variável resposta quando Xij aumenta em uma unidade;
• εij é o erro aleatório usual associado àj-ésima observação agrupada noi-ésimo grupo em que os erros são independentes e normalmente distribuídos N(0, σ2).
A diferença com o modelo de regressão usual é que neste caso assume-se que cada
grupo é caracterizado por um diferente intercepto e também por um diferente coeficiente de regressão.
A interpretação dos parâmetros do modelo, particularmente os interceptosβ0ipara todo i, depende da forma como as variáveis explicativas são consideradas no nível 2. Pode-se afirmar que:
• Quando a variável explicativa é considerada em sua medida original (Xij), o inter-cepto β0i é o valor esperado da variável respostaYij quandoXij for igual a zero;
• Quando a variável explicativa é considerada centrada na média geral (X..), o inter-cepto β0i é o valor esperado da variável respostaYij quandoX.. for igual a zero;
• Quando a variável explicativa é considerada na média de um grupo (Xi.), o intercepto β0i é o valor esperado da variável respostaYij quando Xi. for igual a zero;
• Quando a variável explicativa estiver centrada em qualquer outro valor específico, o interceptoβ0i é interpretado como o valor esperado da variável respostaYij para esse valor específico.
Considerando a variável resposta Yij e a variável explicativa Xij, no modelo para o grupo, têm-se diferentes coeficientes de interceptos para β0i’s e inclinações β1i’s com i=1,2,. . . ,I, iguais aos da equação (2.7). Portanto, os coeficientes para o modelo do nível 1 (grupo) podem ser escritos como
β0i =γ00+u0i, (2.8)
β1i =γ10+u1i, (2.9)
em que u0i ’s eu1i’s são os erros aleatórios independentes com as seguintes suposições:
u0i ∼N(0, σu02 ), u1i ∼N(0, σu12 ), Cov(u0i, u1i) =σu01. (2.10) em que:
(i) u0i ’s eu1i’s são independentes deεij’s;
(ii) u0i é o efeito aleatórioi-ésimo grupo no interceptoβ0i;
(iii) u1i é o efeito aleatório associado aoi-ésimo grupo no coeficiente angular ou inclina-ção β1i;
(iv) γ00 é o valor esperado dos interceptos nos grupos;
(v) γ10 é o valor esperado das inclinações nos grupos;
(vi) σ2u0 é a variância populacional dos interceptos;
(vii) σ2u1 é a variância populacional das inclinações;
(viii) σu01 é a covariância entreβ0i e β1i.
Portanto, a partir de (2.8) a (2.10) tem-se que
• β0i∼N(γ00, σ2u0),
• β1i∼N(γ10, σ2u1),
• Cov(β0i, β1i) =σu01.
Das equações de (2.8) e (2.9), nota-se que os interceptos e as inclinações variam de grupo para grupo para ajudar a levar em conta essas possíveis diferenças, mas os coeficientesγ00
e γ10 são constantes para todos os grupos.
Pode-se supor que a variação entre as unidades do nível 1 são devidas às variáveis explicativas Zi, assim, o modelo no nível 1 fica da seguinte forma:
β0i=γ00+γ01Zi+u0i, (2.11) β1i=γ10+γ11Zi+u1i, (2.12) em que
• γ00 é o valor esperado dos interceptos quandoZi=0;
• γ10 é o valor esperado das inclinações quandoZi=0;
• γ01é o coeficiente de regressão associado à variável explicativa do nível 1 relativo ao intercepto;
• γ10 é o coeficiente de regressão associado à variável explicativa do nível 1 relativo à inclinação;
• u0i e u1i são variáveis aleatórias com as mesmas suposições de (i) a (viii) feitas anteriormente;
• σ2u0 é a variância populacional dos interceptos encontrada após a predição do coefi-ciente β0i na presença da variável do nível 1,Zi;
• σ2u0 é a variância populacional das inclinações encontrada após a estimação do coe-ficiente β0i na presença da variável do nível 1,Zi;
• σu01 é a covariância entreβ0i e β1i.
No modelo para o nível 1, os β’s são tratados como variáveis respostas latentes em modelos de regressão com variável explicativa Zi para a população de grupos. Pode-se considerar também Zi em sua medida original, ou centrada na média geral, (Z..) ou centrada na média de cada grupo (Zi.), da mesma forma como visto anteriormente para a variável explicativa no nível 1 da equação(2.7). Substituindo as equações (2.11) e (2.12) em (2.7), tem-se o modelo combinado
Yij =γ00+γ01Zi+γ10Xij+γ11ZiXij+u0i+u1i+εij. (2.13) O modelo combinado (2.13) tem parte fixa ou determinística γ00+γ01Zi +γ10Xij + γ11ZiXij, por conter todos os coeficientes fixos, e a parte aleatória ou estocástica é dada por u0i+u1i+εij. Note queXij eZisão variáveis explicativas dos níveis 2 e 1, respectivamente,
eZiXij é o termo de interação entre os níveis que aparecem no modelo como consequência de modelar a variação do coeficiente de inclinação β1i da variável Xij do nível 2 com a variável Z do nível 1. Então, o efeito de Z na relação entre X e Y é expressado como interação de nível cruzado.
Ainda, tem-se que os erros nas unidades de nível 2 (observações) não são independentes, ou seja, há uma dependência entre as observações agrupadas dentro de cada um dos grupos em termos deu0i e u1i. Além disso, as variâncias dos erros podem ser heterogêneas seu0i e u1i assumirem diferentes valores dentro do grupo.
O grau de dependência dentro dos grupos é medido pelo coeficiente de correlação intra-classe, ρ(Yij;Yij0). O coeficiente de correlação intra-classe pode ser estimado por meio dos modelos lineares multiníveis a partir do chamado modelo intercepto ou modelo nulo, ou seja, por um modelo que não inclui variáveis explicativas. Este modelo é obtido removendo-se todos os termos que contém as variáveisX ou Z no modelo (2.13). O modelo nulo é da forma
Yij =γ00+u0i+εij. (2.14)
A partir do modelo (2.14), pode-se obter a partição básica da variabilidade nos dados entre os dois níveis. A variância total deY pode ser decomposta como a soma das variâncias dos níveis 1 e 2,
V ar(Yij) =V ar(u0i) +V ar(εij) =σu02 +σ2.
A covariância entre 2 observações diferentesj6=j0 no mesmo grupoié igual a variância da contribuição deu0i que é compartilhada por estas observações, isto é,
cov(Yij;Yij0) =var(u0i) =σ2u0 (2.15) e sua correlação intra-classe é dada por
ρ(Yij, Yij0) = σ2u0
σu02 +σ2. (2.16)
A correlação intra-classe é uma estimativa da proporção da variância populacional explicada pela estrutura do agrupamento. Assim, o modelo nulo (2.14) estabelece simples-mente que a correlação intra-classe estimada é igual a proporção estimada da variância no nível grupo, quando comparada com a variância total estimada.