• Nenhum resultado encontrado

Neste capítulo abordaremos os modelos mistos com efeitos fixos e aleatórios. Utilizaremos os efeitos aleatórios para elaboração de um modelo linear de efeitos mistos confiável que, aliado a um sistema computacional, fará a leitura dos índices educacionais obtidos pelas escolas analisadas do município de Pouso Alegre – MG. Veremos que este modelo parte da premissa que diante de um efeito aleatório que pode apresentar muitos resultados, analisaremos apenas uma parcela desses resultados.

Segundo [11], observamos que, por definição, efeitos fixos e aleatórios são fatores. Efeitos fixos têm um número finito (e fixo) de níveis. Em contraste, efeitos aleatórios têm infinitos níveis dos quais medimos uma amostra aleatória. Por exemplo, no nosso caso, as escolas analisadas são consideradas como um efeito aleatório, e é este efeito que é estimado. Observemos que temos um número específico de escolas, que em teoria deveriam representar um grupo maior de escolas, porém analisamos somente as escolas estaduais do município, então esta característica será considerada como efeito aleatório. Em contrapartida, temos também os efeitos fixos, por exemplo, os anos nos quais determinado indicador educacional é registrado. Normalmente, os efeitos fixos têm um baixo número de níveis, enquanto os efeitos aleatórios têm um grande número de níveis. Para efeitos fixos, estamos interessados nas diferenças específicas entre níveis, enquanto que para efeitos aleatórios, interessa apenas o nível médio e a variação, em vez de diferenças entre os níveis específicos.

Em um modelo com fatores fixos, as diferenças dos grupos são estimadas separadamente como parâmetros do modelo. Por outro lado, para um fator aleatório, apenas um parâmetro é calculado.

Tratar um fator como um fator aleatório é equivalente ao agrupamento parcial dos dados. Existem três maneiras diferentes de agrupar dados. Primeiro, a estrutura de agrupamento dos dados pode ser ignorada. Isso é chamado de pool completo. Segundo, as médias de grupo podem ser estimadas separadamente para cada grupo. Nenhum pool ocorre neste caso. Terceiro, os dados dos diferentes grupos podem ser parcialmente agrupados (isto é, tratados como um efeito aleatório).

pool completo pool parcial sem pool

𝑦𝑖 = 𝛽0+ 𝑒𝑟𝑟𝑜𝑖 𝑦𝑖 = 𝛽0+ 𝑏𝑔𝑖+ 𝑒𝑟𝑟𝑜𝑖 𝑦𝑖 = 𝛽𝑔𝑖+ 𝑒𝑟𝑟𝑜𝑖

𝑒𝑟𝑟𝑜𝑖 ~ 𝑁𝑜𝑟𝑚(0, 𝜎²) 𝑏𝑔𝑖 ~ 𝑁𝑜𝑟𝑚 (0, 𝜎𝑏2) 𝑒𝑟𝑟𝑜𝑖 ~ 𝑁𝑜𝑟𝑚 (0, 𝜎²) 𝑒𝑟𝑟𝑜𝑖 ~ 𝑁𝑜𝑟𝑚 (0, 𝜎²) 𝛽𝑔𝑖~ 𝑁𝑜𝑟𝑚 (0, 𝜎𝑔𝑖

2)

Qual é a vantagem de análises usando pool parcial em comparação com o conjunto completo ou sem agrupamento? O pool completo ignora a estrutura de agrupamento dos dados. Confiamos demais no resultado, porque assumimos que todas as observações são independentes quando não são. Este é um caso típico de pseudo-replicação. Por outro lado, o método sem agrupamento (que é equivalente a tratar o fator como fixo) tem o risco de superestimar a variação entre os grupos porque as médias do grupo são estimadas independentemente uma da outra. O perigo de superestimar a variação entre grupos é particularmente grande quando o tamanho da amostra por grupo é baixo e a variação dentro do grupo é grande.

4.1. Modelo Linear de Efeitos Mistos em R, Estimação e Diagnóstico Para introduzir o modelo linear de efeitos mistos (MLEM) no Rstudio, o objetivo se prende a quantificar os resultados obtidos das escolas analisadas. Tendo em vista que as medições são independentes escola a escola, usaremos um modelo misto para analisar estes dados. Devemos observar que o modelo misto permitirá, em nosso caso, uma previsão de avanço ou deterioração, de uma escola com resultados dentro da média, enquanto o modelo de efeitos fixos permitirá uma previsão do nível de desempenho de todas as escolas em razão dos dados informados do PROEB ou IDEB, das 9 escolas analisadas.

O modelo linear de efeitos mistos ajustado abaixo [11], permitirá a quantificação das informações lançadas no programa R, em seu auxiliar Rstudio, criando variáveis indicadoras para todos os níveis de análise esperados:

(𝐼𝐼) 𝑦𝑖 = 𝛽0+ 𝑏𝑖 + 𝛽1𝐼𝐴2 + 𝛽2𝐼𝐴3 + 𝛽3𝐼𝐴4 + ... + 𝑒𝑟𝑟𝑜𝑖 , em que

𝑦𝑖 = valor observado 𝛽0 = efeito fixo (intercepto)

𝑏𝑖 = efeito aleatório 𝛽1, 𝛽2, … efeitos fixos 𝐼𝐴𝑗(𝑖) = { 1, 𝑠𝑒 𝐴𝑗 𝑜𝑐𝑜𝑟𝑟𝑒

0, 𝑠𝑒 𝐴𝑗 𝑛ã𝑜 𝑜𝑐𝑜𝑟𝑟𝑒

𝑒𝑟𝑟𝑜𝑖 ~ N (0, 𝜎² ), onde 𝑒𝑟𝑟𝑜𝑖 segue uma distribuição normal com média 0 e variância 𝜎²

𝑏𝑖 ~ N ( 0, 𝜎𝑏2 ), onde 𝑏𝑖 segue uma distribuição normal com média 0 e variância 𝜎𝑏2

Nota: 𝐴 representa o ano da observação, assim 𝐼𝐴 = 1 quando a observação é do ano 𝐴.

Várias funções diferentes para ajustar um modelo misto são desenvolvidas em R: lme, lmer, gls, gee. Primeiramente utilizamos o lmer do pacote lme4, porque seu uso é intuitivo e a função sim foi desenvolvida para

lmer. A função sim será usada mais adiante para o desenvolvimento da

abordagem Bayesiana do modelo anteriormente apresentado.

Para um modelo misto, a estimativa de máxima verossimilhança restrita (EMVR), é o método usado por padrão, em vez do método de máxima verossimilhança (MV). Para nossos propósitos, a diferença relevante entre os dois métodos, é que as estimativas de MV são imparciais para os efeitos fixos, mas tendenciosos para os efeitos aleatórios, enquanto o EMVR estima eficientemente os efeitos fixos e também os efeitos aleatórios. Contudo, quando o tamanho da amostra é grande comparado ao número de parâmetros do modelo, as diferenças entre as estimativas MV e EMVR tornam-se insignificantes. Como orientação, a literatura indica o uso de EMVR se o interesse estiver nos efeitos aleatórios (parâmetros de variação) e MV se o interessado estiver nos efeitos fixos.

Como em um modelo linear simples, as premissas são cuidadosamente verificadas antes da inferência ser extraída de um modelo misto. As premissas são que os resíduos são independentes e identicamente distribuídos. Em

princípio, os mesmos métodos são usados para avaliar a violação de suposições do modelo em casos mistos.

Os códigos produzem gráficos nos quais observaremos que os resíduos se espalham em torno de zero com algumas possíveis exceções. Uma correlação positiva entre os resíduos e os valores ajustados não incomoda estatisticamente, mas pode ter significado na análise.

Poucas medidas pequenas que não se encaixem bem no modelo, também podem ser reconhecidas no gráfico dos resíduos, QQ-plot e também ao plotar a raiz quadrada dos valores absolutos dos resíduos contra os valores ajustados. As observações devem cumprir bem as suposições do modelo, aceitando-se uma leve falta nos ajustes.

Documentos relacionados