• Nenhum resultado encontrado

Capítulo 2 – Enquadramento Teórico

2.3 Métodos de estimação para o modelo linear hierárquico

2.4.2 Testes de Hipóteses

Vários testes de hipóteses são geralmente de interesse nos modelos hierárquicos – para testar parâmetros e modelos, para verificar quais são as partes do modelo que são estatisticamente importantes. As hipóteses de teste estão prontamente disponíveis a menos que haja alguma discordância sobre quais as estatísticas de teste. Os testes são implementados de maneiras diferentes no MLwiN 2.02.

Os processos de teste gerais para os efeitos fixos, componentes de variância e efeitos aleatórios. Em geral, as estatísticas – t são produzidas para os efeitos fixos e aleatórios, enquanto que as estatísticas Wald Z e Qui-Quadrado são produzidas para as componentes de variância. Estes testes, particularmente, os testes para as componentes de variância só são válidos

73

assimptoticamente e, por conseguinte, devem ser interpretados com precaução, especialmente quando o número de unidades de nível 2, J, é pequeno, Sullivan et al (1999).

Para testar modelos, o MLwiN 2.02 também produz um valor deviance81 (-2 log-

likelihood) que pode ser usado para avaliar a adaptação dum novo modelo em relação a outro anterior mais pequeno.

2.4.2.1 Testes de Hipóteses para Efeitos Fixos (γ )

A hipótese de interesse é da forma

0 :

0 k =

H γ . (76)

A estatística do teste é calculada tomando a razão entre o estimador MV (ou MVR) e o seu erro-padrão estimado, como se segue:

{

vaˆr(ˆ )

}

ˆ k k z γ γ = . (77)

Como, formalmente, (isto é, sob H0) a estatística z tem distribuição normal unitária assimptótica é, por vezes, mais adequado considerá-la como uma estatística t , com J − k−1

graus de liberdade, onde J é o número de unidades do nível 2 e k é o número total de variáveis explicativas no modelo82. Tem-se, então:

{

vaˆr(ˆ )

}

ˆ k k t γ γ = . (78) 81 Na bibliografia anglo-saxónica

82 Enquanto o teste-z assume uma distribuição normal, este não é apropriado para as variâncias porque a distribuição

74

A equação acima (78) segue uma distribuição t para dados equilibrados e para algumas situações de dados não equilibrados.

Para testar mais do que um efeito fixo simultaneamente, é necessário usar contrastes. Para mais detalhes e exemplos, ver Bryk e Raudenbush, (1992); Natis, L. (2000); Pinheiro (2005).

2.4.2.2 Testes de Hipóteses para Efeitos Aleatórios (u)

Por vezes há interesse em investigar se um determinado coeficiente de regressão numa escola em particular é nulo, ou se é maior do que quando comparado com o correspondente coeficiente de outra qualquer escola. Estes são os casos de testes de hipóteses: de parâmetros isolados, no primeiro caso; e, de parâmetros múltiplos no segundo caso. Neste último compara-se dois ou mais parâmetros dum vector de coeficientes aleatórios.

A hipótese nula de interesse é da forma

0 :

0 uk =

H . (79)

A estatística do teste é calculada tomando a razão entre o efeito aleatório estimado k e os seus erros-padrão, como se segue:

{

vaˆr(ˆ )

}

ˆ k k u u t = . (80)

A equação acima segue uma distribuição – t para dados equilibrados e para algumas situações de dados não equilibrados. Segundo Sullivan et al. (1999) o erro-padrão estimado

{

vaˆr(uˆk)

}

, é maior sob MVR do que sob MV, especialmente, se o número de unidades de nível

2 , J, é pequena. Contudo, o teste pode ser liberal se J é pequeno mesmo usando os estimadores MVR. Ou seja, os valores actuais podem exceder significativamente os valores nominais.

Também, agora, para testar mais do que um efeito aleatório simultaneamente, é necessário usar contrastes. Ver mais detalhes em Bryk e Raudenbush (1992) ou Pinheiro (2005).

75 2.4.2.3 Testes de Hipóteses para Variância e Componentes de Variância ( R e G )

Também, como anteriormente, a variância e os componentes de variância podem ser testados isolada ou simultaneamente. Poderá haver a necessidade de averiguar se os coeficientes de nível 1 têm de ser especificados como fixos, aleatórios ou variando não aleatoriamente, como vimos nos sub-modelos da Tabela 1.

Para verificar a existência de variação aleatória, a hipótese nula de interesse é da forma

0 :

0 kl =

H τ . (81)

onde, τkl é um elemento de G. Se esta hipótese for rejeitada pode concluir-se que haverá

variação aleatória nos β . qj

Para testar esta hipótese tem-se duas vias:

- Se todos ou pelo menos a maioria dos grupos tiver dados suficientes para calcular as estimativas de MQO dos coeficientes β , representados por qj βˆ , Bryk e qj

Raudenbush (1992) e Natis, L.( 2000); ou,

- A estatística do teste é calculada tomando a razão entre o estimador e o seu erro- padrão83 assimptótico, como se segue:

{

vaˆr(ˆ )

}

ˆ kl kl z τ τ = . (82)

Segundo Sullivan et al (1999), os erros-padrão assimptóticos são calculados da segunda derivada da verosimilhança com respeito às componentes de variância através de uma:

- Estatística Wald (82) que é válida para grandes amostras; ou, - Estatística Qui-Quadrado como se segue:

83 Segundo Bryk e Raudenbush, (1992: 55) «calculado através da inversa da matriz de informação (Longford,

76

(

)

= − − = J j j j J V 1 2 00 0 2 1 ˆ ˆ ˆ γ β χ (83) onde j j n V 2 ˆ =σ . (84)

A forma mais geral de teste de hipótese para variâncias e covariâncias é baseada no teste da razão de variâncias que pode ser analisado, em detalhe, em Bryk e Raudenbush (1992) ou Pinheiro (2005).

Para testar um ou mais componentes de variância e covariância simultaneamente, pode usar-se o teste da razão de verosimilhanças. Assim, na hipótese nula tem-se todos os componentes que se deseja testar considerados nulos.

A estatística do teste de verosimilhanças é dada por:

1

0 D

D

HRV = − . (85)

onde D0 e D1 são as “deviances” associadas a cada um dos modelos a testar84. D0é calculado segundo:

( )

0

0 2log L

D =− (86)

onde L0 é o valor da verosimilhança associado com a estimativa de máxima verosimilhança do modelo “base” (começa-se com o modelo nulo), e, identicamente, D1 é a deviance associada com a estimativa de máxima verosimilhança calculada sob o modelo alternativo:

( )

1

1 2log L

D =− . (87)

84Deviance” corresponde a -2 vezes o “log” da sua função de verosimilhança avaliada no seu máximo. Pode ser

77

Esta estatística tem distribuição Qui-Quadrado com m graus de liberdade, onde m corresponde à diferença no número de parâmetros dos dois modelos, Bryk e Raudenbush (1992). E quanto menor for o seu valor melhor será o ajuste do modelo.