CAPÍTULO 3 – O PROCESSO DE QUEDA DA MORTALIDADE INFANTIL NO
3.5 Discussão
4.2.4 Especificação e adequabilidade dos modelos
A análise da adequabilidade dos modelos estimados é realizada a partir da sua especificação, na qual avalia-se se a parametrização escolhida é adequada. Conforme realizado no processo de estimação do modelo de dados em painel não espaciais é necessário inicialmente definir qual parametrização é mais adequada, efeitos fixos ou efeitos aleatórios. Como partimos diretamente para o modelo de efeitos aleatórios, conforme especificado anteriormente, é necessário identificar se devem ser incluídos efeitos não observáveis na regressão, que permitem captar a heterogeneidade espacial não observada (ALMEIDA, 2012). Conforme mencionado, deve-se identificar qual parametrização espacial é mais adequada para descrever o fenômeno estudado.
Almeida (2012) indica que se pode priorizar a escolha de modelos que atinjam o menor critério de informação, por exemplo, através do Critério de Akaike (AIC). Os critérios de informação auxiliam na eleição de qual modelo é mais adequado, sobretudo para escolher modelos que não apresentem a mesma parametrização ou ainda, aqueles que não possuam as mesmas variáveis independentes. Estas medidas permitem mensurar a adequabilidade dos modelos e eleger aqueles que melhor explicam a relação entre a variável dependente, neste
caso a TMI e as independentes, os serviços básicos de infraestrutura urbana e demais variáveis. A duas medidas mais comuns são o coeficiente de múltipla correlação ajustado (R2ajust) e o Akaike Information Criterion (AIC). O R2ajust será suprimido, pois é pouco
explicativo para o caso de modelos em dados em painel e o AIC será utilizado, por ser indicado no processo de especificação de dados em painel espaciais, conforme ressalta Almeida (2012).
O AIC é uma medida de qualidade de ajuste, muito utilizada em modelos espaciais que pode ser definido da seguinte forma (ALMEIDA, 2012, p. 209):
𝐴𝐼𝐶 = −2𝐿𝐼𝐾 + 2𝑘 (17)
Onde:
𝐿𝐼𝐾 corresponde ao valor da função de log verossimilhança; e
𝐾 número de regressores, incluindo os coeficientes espaciais estimados.
Para contribuir na justificação da especificação escolhida nos modelos de dados em painéis espaciais, pode-se utilizar testes baseados em multiplicadores de Lagrange (BALTAGI; LIU, 2008; BALTAGI; SONG; KOH, 2003; GIOVANNI; GIANFRANCO, 2012). Para o caso específicos de efeitos aleatórios, Baltagi e Liu (2008) derivam testes de multiplicadores de Lagrange para o caso de dependência espacial. Neste caso tem-se o interesse em testar a hipótese nula de 𝐻0: 𝜌 = 𝜎𝛼2 = 0 e a hipótese alternativa que pelo menos
um dos componentes não é igual a zero. Os autores realizam uma generalização de testes de multiplicadores de Lagrange propostos inicialmente por Luc Anselin em 1988 (ANSELIN, 1988b), para a abstenção de efeitos espaciais 𝐻0𝑎: 𝜌 = 0, assumindo que existem efeitos aleatórios, ou seja, refutando que 𝜎𝛼2 = 0 (BALTAGI; LIU, 2008). Os autores fazem duas extensões do teste, a primeira com o objetivo de avaliar 𝐻0𝑏: 𝜌 = 0, assumindo a existência de
efeitos aleatórios, ou seja, 𝜎𝛼2 ≥ 0 e a segunda, com o objetivo de avaliar 𝐻
0𝑐: 𝜎𝛼2 = 0 e que 𝜌
talvez não seja zero (BALTAGI; LIU, 2008). Como este estudo utiliza o modelo de efeitos aleatórios, estes testes contribuem para justificar a parametrização de efeitos aleatórios e existência de dependência espacial, no processo de queda da mortalidade infantil.
Almeida (2012) ressalta que o modelo eleito deve atender a dois critérios, ordenados por importância: 1) os resíduos do modelo não apresentam autocorrelação espacial e; 2) o modelo apresenta menor critério de informação, dentre aqueles modelos que não apresentam autocorrelação espacial nos resíduos (ALMEIDA, 2012, p. 431). Contudo, a
análise de resíduos não é mencionada e nem realizada, em nenhum dos estudos metodológicos sobre dados em painel espaciais (BALTAGI; LIU, 2008; BALTAGI; SONG; KOH, 2003; GIOVANNI; GIANFRANCO, 2012). Para o caso de dados em painel, não espaciais, a análise dos resíduos também não foi realizada em nenhum dos estudos apresentados na revisão da literatura. Desta forma, no teste optou-se por eleger o modelo final que obtém melhor desempenho, dentre os critérios de AIC e testes baseados em multiplicadores de Lagrange, verificando também o problema de multicolinearidade.
A multicolinearidade pode influenciar na estimação e significância dos coeficientes do modelo de regressão (GUJARATIN, 2006), sobretudo na estimação do erro padrão. A multicolinearidade ocorre quando uma ou mais variáveis corresponde ao mesmo fenômeno e em geral, são combinação linear entre si (GUJARATIN, 2006). Cabe ressaltar, que o modelo de dados em painel, em relação ao modelo Mínimos Quadrados Ordinários, apresenta a vantagem de utilizar mais informações no processo de estimação, aumentando os graus de liberdade e diminuindo a colinearidade entre as variáveis explicativas (HSIAO, 2003). Conforme já mencionado, a abordagem em painel, contribui ainda mais para reduzir a colinearidade entre as variáveis. A forma mais comum de detecção da multicolinearidade é através do VIF, Variance Inflation Fator, contudo esta medida se baseia no coeficiente de múltipla determinação, obtido através de regressões parciais, o que se torna não adequado nos modelos de dados em painel. Um jeito informal, mas amplamente utilizado em diversos estudos, é analisar a matriz de correlação das variáveis independentes, em que correlações altas (ex.: acima de 0,8), seriam indicativos de colinearidade entre o par de variáveis (GUJARATIN, 2006). Neste caso, o recomendado é retirada de uma das variáveis da análise, priorizando aquelas que forem não significativas si, buscando um modelo parcimonioso, que combata a presença de colinearidade entre as variáveis regressoras (GUJARATIN, 2006).
Para compreender melhor o ajuste do modelo, foi realizada a análise de resíduos, de forma regional, através da estratificação por Grandes Regiões e por mapas temáticos de microrregiões. Isto possibilita verificar as localidades em que os serviços básicos de infraestrutura urbana e demais fatores estudados, apresentam melhor desempenho para estudar o processo de queda da mortalidade infantil e em quais regiões isto não ocorre, demonstrando a existência de fatores não observáveis. Para isto os resíduos foram padronizados, ou seja, subtraídos pela sua média e divididos pelo desvio padrão. Isto permitiu identificar valores de resíduos altos, ou seja, aqueles abaixo que -2 e maiores que 2.