• Nenhum resultado encontrado

2.2 Modelos multiníveis

2.2.1 Modelos multiníveis com 2 níveis

O MMLG assume que existe um conjunto de dados hierárquicos com uma única variável resposta, medida no nível mais baixo da hierarquia, e as variáveis explicativas que podem ser observadas em todos os níveis existentes. Conceitualmente, o modelo pode ser visto como um sistema hierárquico de equações de regressão.

Na abordagem dos modelos lineares hierárquicos ou MMLG com 2 níveis, refere-se as unidades de nível 2 como observações no grupo e as unidades de nivel 1 como grupo. A quantidade de grupos é denotada por I e o número de observações no grupo, que pode variar de grupo para grupo, é denotado por ni para cada grupo i(i= 1,2, . . . , I). Neste caso, os dados não precisam ser balanceados, uma vez que o número de observações pode variar de grupo para grupo.

Suponha um modelo linear de 2 níveis, dado por

Yij =aj+bjXijij, (2.6) onde aj, bj são efeitos aleatórios, εij são os erros da j-ésima observação no nível 2 do i-ésimo grupo do nível 1.

Na Figura 2.1, (a) ilustra o modelo e regressão usual; em (b), os interceptosai’s variam, mas os coeficientes de regressão bi’s são considerados constantes e em (c), os interceptos ai’s e os coeficientes de regressão bi’s variam de grupo para grupo.

Figura 2.1: Comparativo entre o modelo de regressão usual e o modelo com efeito aleatório.

Suponha queY é uma variável resposta eXé uma única variável explicativa. O modelo para a análise no nível 2 é definido da seguinte forma:

Yij0i1iXijij, (2.7) com j=1,2,. . . ,ni ei=1,2,. . . ,I em que:

• Yij é a variável resposta da j-ésima observação do nível 2 para o i-ésimo grupo do nível 1;

• Xij é a variável explicativa em sua medida original, ou centrada na média geralX.., ou centrada na média de um grupo Xi., ou centrada em outro valor, medida no j-ésima observação e agrupado noi-ésimo grupo;

• β0i é o intercepto aleatório para oi-ésimo grupo;

• β1i é o coeficiente de regressão usual para oi-ésimo grupo, em que sua interpretação é dada pela mudança esperada na variável resposta quando Xij aumenta em uma unidade;

• εij é o erro aleatório usual associado àj-ésima observação agrupada noi-ésimo grupo em que os erros são independentes e normalmente distribuídos N(0, σ2).

A diferença com o modelo de regressão usual é que neste caso assume-se que cada

grupo é caracterizado por um diferente intercepto e também por um diferente coeficiente de regressão.

A interpretação dos parâmetros do modelo, particularmente os interceptosβ0ipara todo i, depende da forma como as variáveis explicativas são consideradas no nível 2. Pode-se afirmar que:

• Quando a variável explicativa é considerada em sua medida original (Xij), o inter-cepto β0i é o valor esperado da variável respostaYij quandoXij for igual a zero;

• Quando a variável explicativa é considerada centrada na média geral (X..), o inter-cepto β0i é o valor esperado da variável respostaYij quandoX.. for igual a zero;

• Quando a variável explicativa é considerada na média de um grupo (Xi.), o intercepto β0i é o valor esperado da variável respostaYij quando Xi. for igual a zero;

• Quando a variável explicativa estiver centrada em qualquer outro valor específico, o interceptoβ0i é interpretado como o valor esperado da variável respostaYij para esse valor específico.

Considerando a variável resposta Yij e a variável explicativa Xij, no modelo para o grupo, têm-se diferentes coeficientes de interceptos para β0i’s e inclinações β1i’s com i=1,2,. . . ,I, iguais aos da equação (2.7). Portanto, os coeficientes para o modelo do nível 1 (grupo) podem ser escritos como

β0i00+u0i, (2.8)

β1i10+u1i, (2.9)

em que u0i ’s eu1i’s são os erros aleatórios independentes com as seguintes suposições:

u0i ∼N(0, σu02 ), u1i ∼N(0, σu12 ), Cov(u0i, u1i) =σu01. (2.10) em que:

(i) u0i ’s eu1i’s são independentes deεij’s;

(ii) u0i é o efeito aleatórioi-ésimo grupo no interceptoβ0i;

(iii) u1i é o efeito aleatório associado aoi-ésimo grupo no coeficiente angular ou inclina-ção β1i;

(iv) γ00 é o valor esperado dos interceptos nos grupos;

(v) γ10 é o valor esperado das inclinações nos grupos;

(vi) σ2u0 é a variância populacional dos interceptos;

(vii) σ2u1 é a variância populacional das inclinações;

(viii) σu01 é a covariância entreβ0i e β1i.

Portanto, a partir de (2.8) a (2.10) tem-se que

• β0i∼N(γ00, σ2u0),

• β1i∼N(γ10, σ2u1),

• Cov(β0i, β1i) =σu01.

Das equações de (2.8) e (2.9), nota-se que os interceptos e as inclinações variam de grupo para grupo para ajudar a levar em conta essas possíveis diferenças, mas os coeficientesγ00

e γ10 são constantes para todos os grupos.

Pode-se supor que a variação entre as unidades do nível 1 são devidas às variáveis explicativas Zi, assim, o modelo no nível 1 fica da seguinte forma:

β0i0001Zi+u0i, (2.11) β1i1011Zi+u1i, (2.12) em que

• γ00 é o valor esperado dos interceptos quandoZi=0;

• γ10 é o valor esperado das inclinações quandoZi=0;

• γ01é o coeficiente de regressão associado à variável explicativa do nível 1 relativo ao intercepto;

• γ10 é o coeficiente de regressão associado à variável explicativa do nível 1 relativo à inclinação;

• u0i e u1i são variáveis aleatórias com as mesmas suposições de (i) a (viii) feitas anteriormente;

• σ2u0 é a variância populacional dos interceptos encontrada após a predição do coefi-ciente β0i na presença da variável do nível 1,Zi;

• σ2u0 é a variância populacional das inclinações encontrada após a estimação do coe-ficiente β0i na presença da variável do nível 1,Zi;

• σu01 é a covariância entreβ0i e β1i.

No modelo para o nível 1, os β’s são tratados como variáveis respostas latentes em modelos de regressão com variável explicativa Zi para a população de grupos. Pode-se considerar também Zi em sua medida original, ou centrada na média geral, (Z..) ou centrada na média de cada grupo (Zi.), da mesma forma como visto anteriormente para a variável explicativa no nível 1 da equação(2.7). Substituindo as equações (2.11) e (2.12) em (2.7), tem-se o modelo combinado

Yij0001Zi10Xij11ZiXij+u0i+u1iij. (2.13) O modelo combinado (2.13) tem parte fixa ou determinística γ0001Zi10Xij + γ11ZiXij, por conter todos os coeficientes fixos, e a parte aleatória ou estocástica é dada por u0i+u1iij. Note queXij eZisão variáveis explicativas dos níveis 2 e 1, respectivamente,

eZiXij é o termo de interação entre os níveis que aparecem no modelo como consequência de modelar a variação do coeficiente de inclinação β1i da variável Xij do nível 2 com a variável Z do nível 1. Então, o efeito de Z na relação entre X e Y é expressado como interação de nível cruzado.

Ainda, tem-se que os erros nas unidades de nível 2 (observações) não são independentes, ou seja, há uma dependência entre as observações agrupadas dentro de cada um dos grupos em termos deu0i e u1i. Além disso, as variâncias dos erros podem ser heterogêneas seu0i e u1i assumirem diferentes valores dentro do grupo.

O grau de dependência dentro dos grupos é medido pelo coeficiente de correlação intra-classe, ρ(Yij;Yij0). O coeficiente de correlação intra-classe pode ser estimado por meio dos modelos lineares multiníveis a partir do chamado modelo intercepto ou modelo nulo, ou seja, por um modelo que não inclui variáveis explicativas. Este modelo é obtido removendo-se todos os termos que contém as variáveisX ou Z no modelo (2.13). O modelo nulo é da forma

Yij00+u0iij. (2.14)

A partir do modelo (2.14), pode-se obter a partição básica da variabilidade nos dados entre os dois níveis. A variância total deY pode ser decomposta como a soma das variâncias dos níveis 1 e 2,

V ar(Yij) =V ar(u0i) +V ar(εij) =σu022.

A covariância entre 2 observações diferentesj6=j0 no mesmo grupoié igual a variância da contribuição deu0i que é compartilhada por estas observações, isto é,

cov(Yij;Yij0) =var(u0i) =σ2u0 (2.15) e sua correlação intra-classe é dada por

ρ(Yij, Yij0) = σ2u0

σu022. (2.16)

A correlação intra-classe é uma estimativa da proporção da variância populacional explicada pela estrutura do agrupamento. Assim, o modelo nulo (2.14) estabelece simples-mente que a correlação intra-classe estimada é igual a proporção estimada da variância no nível grupo, quando comparada com a variância total estimada.

Documentos relacionados