• Nenhum resultado encontrado

Capítulo 2 – Enquadramento Teórico

2 Enquadramento Teórico

2.1 Modelação de dados com estrutura hierárquica (tipos de aninhamento ou hierarquia)

2.1.6 Razões estatísticas para os modelos lineares hierárquicos

Uma vez recolhidos os dados nos vários níveis, temos que decidir a que nível analisá- -los.

Por exemplo, no meio escolar, podemos agregar variáveis dos alunos no nível da escola ou desagregar variáveis da escola para o nível dos alunos15.

13 Na verdade, «uma vez que sabemos existirem hierarquias, vê-mo-las por toda a parte» (Kreft & de Leeuw,

1998).

14 “clusters” na bibliografia anglo-saxónica.

20

Analisar os dados de diferentes níveis num único nível não é adequado e acarreta problemas bem distintos16.

No primeiro caso, perdemos potencialmente grandes quantidades de informação útil, porque a informação acerca dos alunos desaparece da análise (de Leeuw, 2005; Hox, 2002) pelo que esta perde força. Este caso pode ser considerado grave porque as relações entre variáveis agregadas podem ser muito mais fortes e diferentes do que as relações entre as variáveis não agregadas (Fox e Glas, 2002). Mas uma vantagem é que agregando variáveis se pode examinar como as relações num nível de análise varia através doutro nível (Nezlek, 2001: 773).

No segundo caso, criamos artificialmente dependências nos dados, porque, por definição, os alunos da mesma escola, obtém o mesmo resultado numa variável da escola desagregada (de Leeuw, 2005; Hox, 2002). Uma das maiores omissões desta abordagem é que ela não permite examinar como podem variar as relações entre variáveis através dos alunos (Nezlek, 2001: 773)17. Ora, como se assume que os dados desagregados são independentes entre si18, isto sendo uma má especificação pode provocar ameaças na validade das inferências (Fox e Glas, 2002; Hox, 2002), ou seja, ao não se reconhecer a natureza da dependência nos dados, pode levar a supor relações significativas, onde elas não existam. Para Fox e Glas (2002) quando se ignora a estrutura aninhada dos dados multinível, os erros padrão são estimados com enviesamento.

Outra alternativa é fazer uma análise para cada unidade da ordem mais elevada, separadamente. Por exemplo, fazemos uma análise de regressão no nível do aluno, para cada escola, separadamente. Isto, contudo, tende a introduzir um número muito elevado de parâmetros. Também ignora o facto que faz sentido assumir que análises diferentes estejam relacionadas porque as escolas estão a funcionar no mesmo sistema educacional (de Leeuw, 2005).

Torna-se claro que é necessário tratar os dados de cada nível e as respectivas interacções de uma maneira mais apropriada levando em conta todas estas questões. Verifica- se, assim, que «uma perspectiva estatística e metodológica multinível fornece uma base de trabalho compreensiva para descrever estes assuntos (Subramanian et al, 2003)».

16 Como já foi mencionado no ponto 2.1.3.2.

17 Ou dito de outra forma, as características ou processos que ocorrem num nível mais elevado de análise têm

influência nas características ou processos num nível mais baixo (Luke, 2004).

21

Os modelos que são mais adequados ao tipo de análise que temos vindo a descrever, em que os dados têm uma estrutura aninhada/hierárquica, são os modelos estatísticos designados por modelos de regressão linear hierárquicos, ou multinível.

2.1.7 Síntese

Os modelos lineares hierárquicos, são aplicados para lidarem com dados onde se reconhece explicitamente níveis múltiplos, principalmente, para deslindar as diferentes origens das variações nos resultados quando há correlação nos dados. Isto é, quando o problema em estudo:

- tem uma estrutura multinível;

- e/ou quando um processo é pensado para operar com mais do que um nível (Subramanian et al, 2003: 69)19;

- ou quando se está interessado em descrever a variabilidade e heterogeneidade na população em estudo, mais do que os valores médios (Subramanian, 2004: 602), é pertinente o uso de modelos multinível porque estes:

- «Combinam a informação de variáveis de diferentes níveis num modelo simples, sem agregação ou desagregação (Aguerre, 2003; de Leeuw, 2005; Kreft e de Leeuw, 1998: 27)».

- São uma classe de modelos que leva em consideração a estrutura multinível – como uma característica dos dados com relevante importância – e que torna possível incorporar variáveis de diferentes níveis de agregação, «isto é, acomoda mais do que uma variável independente em qualquer nível de análise» (Nezlek, 2001: 777).

- Permitem a análise de variáveis de diferentes níveis simultaneamente levando em linha de conta as diversas e múltiplas dependências (ou correlações20) existentes nos, e entre, os diferentes níveis.

Sendo assim, estes modelos, permitem que não haja desperdício de informação e que os dados tenham, por sua vez, um tratamento estatístico onde as várias dependências sejam tratadas com mais realidade, contrariamente aos modelos estatísticos clássicos que não podem lidar com estes requisitos porque:

19 Por razões económicas, de eficiência, ou outras, por vezes é conveniente adoptar planos de amostragem em

estádios múltiplos, o que ocorre muito frequentemente quando a amostra é em larga escala.

20 A análise dos MLH, tal como muitos outros procedimentos de análise de coeficientes aleatórios, confia mais

22

1- Operam a um único nível.

2- Dão ênfase à modelação das relações médias e não à heterogeneidade subjacente existente nos dados.

3- Tendem «a minimizar e/ou ajustar/corrigir o “ruído” devido ao agrupamento (em cachos) dos dados correlacionados (Subramanian et al, 2003: 70)».

4- Não têm em consideração a dependência dos dados. Espera-se que os dados (dos alunos) dentro de um grupo (turma ou curso) que estão próximas no tempo (na turma) ou no espaço (escola), sejam mais parecidos que os dados de grupos diferentes.

5- Não consideram os efeitos aleatórios – enquanto que os modelos lineares hierárquicos possibilitam amostras aleatórias de alunos em contextos também aleatórios.

6- Não consideram as interacções entre os diferentes níveis, isto é, entre variáveis definidas em diferentes níveis de hierarquia. Frequentemente, isto leva a inferências inadequadas (Ruiz de Miguel e Castro Morera, 2006).