Análise espacial da mortalidade infantil em dois momentos políticos do Brasil

(1)

Camila Mattos dos Santos

An´

alise espacial da mortalidade infantil em

dois momentos pol´ıticos do Brasil.

Niter´oi - RJ, Brasil 23 de mar¸co de 2016

(2)

Universidade Federal Fluminense

Camila Mattos dos Santos

An´

alise espacial da mortalidade

infantil em dois momentos pol´ıticos

do Brasil.

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientadora: Profa. Ludmilla da Silva Viana Jacobson

Niter´oi - RJ, Brasil 23 de mar¸co de 2016

(3)

Universidade Federal Fluminense

Camila Mattos dos Santos

An´

alise espacial da mortalidade infantil em

dois momentos pol´ıticos do Brasil.

Monografia de Projeto Final de Gradua¸cão sob o t´ıtulo “Análise espacial da mortalidade infantil em dois momentos pol´ıticos do Brasil.”, defendida por Camila Mattos dos San-tos e aprovada em 23 de mar¸co de 2016, na cidade de Niterói, no Estado do Rio de Janeiro, pela banca examinadora cons-titu´ıda pelos professores:

Profa. Dra. Ludmilla da Silva Viana Jacobson Orientadora Departamento de Estat´ıstica – UFF

Prof. Dr. Luis Guillermo Coca Velarde Departamento de Estat´ıstica – UFF

Profa. Dra. Ana Beatriz Monteiro Fonseca Departamento de Estat´ıstica – UFF

(4)

S161

Santos, Camila Mattos dos

Análise espacial da mortalidade infantil em dois momentos políticos do Brasil / Camila Mattos dos Santos. – Niterói, RJ : [s.n.], 2016.

77 f. : il.

Orientador: Prof. Dra. Ludmilla da Silva Viana Jacobson. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Universidade Federal Fluminense, 2016.

1. Mortalidade infantil. 2. Análise espacial. 3. Regressão espacial. I. Título.

CDD 519.535 (18 ed.)

(5)

Resumo

Ao longo do tempo o Brasil sofreu diversas mudan¸cas em seus indicadores sociais, que, consequentemente, interferiram no coeficiente de mortalidade infantil (CMI), que é um indicador tanto socioeconômico como de saúde. O objetivo geral do trabalho é avaliar espacialmente a mortalidade infantil e variáveis associadas, em dois per´ıodos distintos: ao fim do governo do ex-presidente Fernando Henrique Cardoso (FHC) e ao fim do governo do ex-presidente Luiz Inácio Lula da Silva (Lula). Os objetivos espec´ıficos são: classifi-car os munic´ıpios quanto à qualidade dos dados dos sistemas de informa¸cão; analisar a dependência espacial do CMI em diferentes n´ıveis de agrega¸cão; ajustar um modelo de regressão espacial múltipla para 2002 e 2010; ajustar um modelo de regressão espacial múltipla para a diferen¸ca do CMI entre 2002 e 2010.

Através das análises exploratórias espaciais pôde-se perceber que a qualidade dos dados municipais é ruim, sendo a maior parte dos munic´ıpios considerados parcialmente adequados: em 2002, foram 76,4% e, em 2010, 74%. Foi observado através do I de Moran que os munic´ıpios são espacialmente correlacionados de maneira fraca. Por isso, fez-se necessário repensar o n´ıvel de agrega¸cão a utilizar. Pôde-se perceber que houve redu¸cão no CMI de 2002 para 2010, onde a maior parte dos munic´ıpios tinha CMI acima de 17,8 crian¸cas mortas por mil nascidos vivos em 2002 e em 2010 grande parte dos munic´ıpios possu´ıam CMI abaixo de 17,8 óbitos por mil nascidos vivos. Analisando os estados, pˆ ode-se obode-servar o mesmo resultado.

Considerando o n´ıvel de agrega¸cão por microrregiões, foi confirmada a correla¸cão espacial, tanto através da matriz de proximidade por contiguidade quanto por vizinhos mais próximos. Os modelos espaciais de 2002 e 2010 inclu´ıram as seguintes variáveis: taxa de desemprego, taxa de analfabetismo, PIB per capita e ´ındice de Gini. Pôde-se verificar menor influência das variáveis taxa de desemprego e taxa de analfabetismo no ano de 2010. Para a diferen¸ca entre as variáveis de 2002 e 2010, também foi observada correla¸cão espacial, de maneira mais fraca. As variáveis explicativas do modelo espacial para esta diferen¸ca foram taxa de analfabetismo, taxa de natalidade e propor¸cão de domic´ılios com coleta de lixo inadequada.

Foi poss´ıvel observar que, no per´ıodo de 2002 a 2010, houve mudan¸ca no CMI e nas variáveis que a influenciaram, além de mudan¸cas na disposi¸cão de correla¸cão espacial entre as microrregiões, munic´ıpios e estados. Portanto, os resultados deste trabalho ajudaram na identifica¸cão espacial das piores condi¸cões de mortalidade infantil, apontando os grupos de microrregiões que sofrem influências de seus vizinhos. Desta forma, áreas prioritárias para investimento foram identificadas.

(6)

Dedicat´

oria

Dedico meu trabalho aos meus pais que sempre me apoiaram, a minha avó Marieta que não me viu entrar na universidade, mas que de algum lugar especial está torcendo por mim e ao meu padrinho Luiz Carlos, que acompanhou a minha luta e agora está em um lugar melhor.

(7)

Agradecimentos

Agrade¸co a Deus por me dar for¸ca suficiente para chegar onde cheguei, pois foi uma longa jornada at´e aqui. Agrade¸co aos meus pais que sempre fizeram de tudo para me dar a melhor educa¸c˜ao, me apoiaram em todos os momentos e escolhas.

Agrade¸co as minhas amigas Carol, Ol´ıvia e Yasmin que entenderam as minhas ausˆencias devido aos estudos e torceram por mim a cada momento.

Agrade¸co a UFF, que me proporcionou um crescimento pessoal e a cria¸cão de uma fam´ılia, sendo os integrantes dela Vanessa, Amanda, Larissa e principalmente Julio, que sempre me apoiaram. Convivemos ótimos momentos de brincadeiras e risadas, mas também viramos noites estudando e nos desesperando com a Universidade.

Agrade¸co os meus colegas de trabalho do Centro de Hidrografia da Marinha (divisão CHM-34), CF Paulo, CC Caúla, Tenente Valéria, SO Gonzaga, SO Marinho, SO Ivan, SO Andrade, SO Jerri, SG Jáder, CB Kléber, CB Luciano, CB Priscila e SC Celso, que contribuiram bastante para meu crescimento pessoal e profissional, sendo um estágio onde me fez muito feliz e foi um sonho realizado.

Agrade¸co as minhas colegas de rep´ublica, que me fizeram rir nos melhores e piores momentos. Transformaram- se em uma outra fam´ılia para mim.

Agrade¸co ao meu orientador da inicia¸cão cient´ıfica André Brandão com quem trabalhei por quase dois anos. Foi um aprendizado enorme para mim.

E para finalizar, agrade¸co aos professores, que sempre foram atenciosos e dedicados. E principalmente a minha orientadora, professora Ludmilla, que me ajudou bastante neste trabalho, sempre presente para o que eu precisasse.

(8)

Sum´

ario

Lista de Figuras

Lista de Tabelas

1 Introdu¸c˜ao p. 14

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil . . . p. 16

2 Objetivos p. 18

3 Material e M´etodos p. 19

3.1 Mortalidade Infantil . . . p. 19 3.2 Análise de Regressão . . . p. 22 3.2.1 Estimadores por M´ınimos Quadrados . . . p. 24 3.2.2 Estimadores por Máxima Verossimilhan¸ca . . . p. 25 3.2.3 Método de quebra de requisitos . . . p. 25 3.2.3.1 Multicolinearidade . . . p. 25 3.2.4 Sele¸cão do modelo . . . p. 26 3.2.4.1 Método de sele¸cão passo-a-passo . . . p. 26 3.2.5 Res´ıduos do modelo de regressão . . . p. 27 3.3 Modelo Teórico . . . p. 28 3.4 Análise Espacial . . . p. 30 3.4.1 Análise Exploratória . . . p. 30 3.4.1.1 Matriz de proximidade espacial ou matriz de vizinhan¸ca p. 30

(9)

3.4.1.2 Índice de Moran . . . p. 31 3.4.1.3 Indicadores Locais de Associa¸cão Espacial - LISA . . . p. 33 3.4.1.4 Diagrama de espalhamento de Moran . . . p. 33 3.4.1.5 Box Map, Lisa Map e Moran Map . . . p. 34 3.4.2 Modelo SAR . . . p. 35 3.4.3 Modelo CAR . . . p. 36 3.4.4 Diagnóstico de modelos com efeitos espaciais . . . p. 36 3.5 Limita¸cões do trabalho . . . p. 38

4 Resultados p. 39

4.1 Análise dos munic´ıpios e estados . . . p. 39 4.2 Análise das microrregiões . . . p. 50 4.2.1 Microrregiões em 2002 e 2010 . . . p. 50 4.2.1.1 Modelo de regressão linear . . . p. 50 4.2.1.2 Análise espacial . . . p. 58

4.2.1.2.1 Matriz de vizinhan¸ca por contiguidade

. . . p. 58 4.2.1.2.2 Matriz de vizinhan¸ca por 6 vizinhos mais pr´oximos

. . . p. 64 4.2.2 Análise da diferen¸ca entre 2002 e 2010 das microrregiões . . . . p. 67 4.2.2.1 Análise de regressão . . . p. 67 4.2.2.2 Análise espacial . . . p. 72

4.2.2.2.1 Matriz de vizinhan¸ca por contiguidade

. . . p. 72 4.2.2.2.2 Matriz de vizinhan¸ca por 6 vizinhos mais pr´oximos

. . . p. 73

(10)

Referˆencias p. 79

(11)

Lista de Figuras

1 Evolu¸cão do CMI no Brasil segundo Grande Regiões - 1930/2000 . . . . p. 17 2 Diagrama com as variáveis que influenciam no CMI . . . p. 28 3 Matriz de proximidade espacial . . . p. 31 4 Diagrama de espalhamento de Moran . . . p. 35 5 Mapa da classifica¸cão dos munic´ıpios em 2002 e 2010 . . . p. 40 6 Mapa do CMI em 2002 e 2010 por munic´ıpio . . . p. 41 7 Mapa do CMI em 2002 e 2010 por estado . . . p. 42 8 Diagrama de espalhamento de 2002 e 2010 por 1 vizinhos . . . p. 44 9 Diagrama de espalhamento de 2002 e 2010 por 6 vizinhos . . . p. 45 10 Diagrama de espalhamento de 2002 e 2010 por 23 vizinhos . . . p. 46 11 Diagrama de espalhamento de 2002 e 2010 por estados . . . p. 48 12 Moran Map de 2002 e 2010 por estados . . . p. 49 13 CMI de 2002 e 2010 por microrregião . . . p. 51 14 Box Map do CMI em 2002 e 2010 por microrregião - matriz de contiguidade p. 60 15 Moran Map do CMI em 2002 e 2010 por microrregião - matriz de

conti-guidade . . . p. 61 16 Diferen¸ca do CMI . . . p. 68 17 Moran Map da diferen¸ca do CMI - matriz de contiguidade . . . p. 73 A.1 Box Map dos erros do modelo em 2002 e 2010 por microrregi˜ao . . . . p. 82 A.2 Moran Map dos erros do modelo em 2002 e 2010 por microrregi˜ao . . . p. 83 A.3 Box Map dos erros studentizados do modelo em 2002 e 2010 por

(12)

A.4 Moran Map dos erros studentizados do modelo em 2002 e 2010 por

mi-crorregi˜ao . . . p. 85 A.5 Moran Map dos erros do modelo da diferen¸ca . . . p. 86 A.6 Moran Map dos erros studentizados do modelo da diferen¸ca . . . p. 86

(13)

Lista de Tabelas

1 Distribui¸cão do gasto social do governo federal por área de atua¸cão em

2002 . . . p. 16 2 Classifica¸cão dos munic´ıpios quanto à qualidade dos dados . . . p. 39 3 Teste I de Moran de acordo com o número de vizinhos . . . p. 43 4 Resumo descritivo das variáveis do modelo teórico de 2002 e 2010 . . . p. 52 5 VIF das variáveis eliminadas de 2002 . . . p. 53 6 VIF das variáveis eliminadas de 2010 . . . p. 54 7 Etapas do ajuste do modelo de regressão linear para o ano de 2002 . . p. 55 8 Etapas do ajuste do modelo de regressão linear para o ano de 2010 . . p. 57 9 Teste I de Moran da microrregião - matriz de contiguidade . . . p. 58 10 Coeficientes estimados e respectivos valores de p dos modelos estimados

- CAR e SAR - matriz de contiguidade . . . p. 63 11 BIC e AIC dos modelos espaciais por ano - matriz de contiguidade . . . p. 64 12 Teste I de Moran - 6 vizinhos mais pr´oximos . . . p. 65 13 Coeficientes estimados e respectivos valores de p dos modelos estimados

- CAR e SAR - 6 vizinhos mais próximos . . . p. 66 14 BIC e AIC dos modelos espaciais por ano - 6 vizinhos mais próximos . p. 67 15 Resumo descritivo da diferen¸ca das variáveis do modelo teórico . . . p. 69 16 VIF da diferen¸ca entre variáveis . . . p. 70 17 Etapas do ajuste do modelo de regressão linear para diferen¸ca entre 2002

e 2010 . . . p. 71 18 I de Moran da diferen¸ca - matriz de contiguidade . . . p. 72 19 Modelo CAR e SAR da diferen¸ca entre 2002 e 2010 . . . p. 73

(14)

20 AIC e BIC do modelo da diferen¸ca - matriz de contiguidade . . . p. 73 21 I de Moran da diferen¸ca - 6 vizinhos mais pr´oximos . . . p. 74 22 Modelo CAR e SAR da diferen¸ca entre 2002 e 2010 - 6 vizinhos mais

pr´oximos . . . p. 74 23 AIC e BIC do modelo da diferen¸ca - 6 vizinhos mais pr´oximos . . . p. 74

(15)

14

1 Introdu¸

c˜

ao

Ao longo do tempo o Brasil sofreu diversas mudan¸cas em seus indicadores sociais que, consequentemente, interferiram no coeficiente de mortalidade infantil (CMI), que consiste no número de óbitos de menores de um ano, por mil nascidos vivos. Através do CMI estima-se o risco de morte de crian¸cas com até um ano de idade. Este é um indicador tanto socioeconômico como de saúde.[1]

Sempre se procurou melhorar a qualidade de vida da popula¸cão e aumentar o desen-volvimento do pa´ıs, sendo isto diretamente ligado à mortalidade infantil, pois, quando há boas condi¸cões de saneamento básico, por exemplo, a chance do óbito de uma crian¸ca é mais baixa do que se não houvesse saneamento básico. Quanto mais desenvolvido é o pa´ıs, espera-se que menor seja a taxa de mortalidade infantil. O CMI é um indicador sens´ıvel a mudan¸cas, pois crian¸cas com menos de um ano são extremamente sens´ıveis à varia¸cões ambientais e socioeconômicos.[1]

Há uma preocupa¸cão mundial para que haja a redu¸cão desta taxa, tanto que na Ci-meira do Milénio, promovida pela Organiza¸cão das Na¸cões Unidas (ONU) e realizada de 6 a 8 de setembro de 2000, em Nova Iorque, foi aprovado o documento Declara¸cão do Milénio, onde foram definidas metas do milênio, conhecidas como Objetivos de Desen-volvimento do Milênio (ODM), a serem alcan¸cadas até 2015. Foram estabelecidas oito metas, sendo uma delas reduzir em dois ter¸cos a mortalidade na infância, que é a mor-talidade de crian¸cas menores de 5 anos. Foi dada como sugestão fazer campanhas para conscientizar as pessoas, para mostrar como as vacinas podem ser benéficas para os bebês, como doen¸cas podem ser evitados através da higiene, a nutri¸cão adequada para o bebê e a importância do aleitamento materno. [2]

Algumas das variáveis que influenciam nesta taxa são a falta de estudo dos pais, ou seja, quanto maior a taxa de analfabetismo, maior a taxa de mortalidade; renda per capita; acesso a saneamento básico como água e esgoto; gastos com saúde e com saneamento.[3]

(16)

1 Introdu¸c˜ao 15

O interesse desta monografia é analisar e comparar a taxa de mortalidade em dois momentos diferentes, a saber, ao fim do governo do ex-presidente Fernando Henrique Cardoso (FHC) e ao fim do governo do ex-presidente Luiz Inácio Lula da Silva (Lula). O intuito não é focar em qual governo foi melhor e sim nas diferen¸cas do CMI observadas nos dois momentos.

Fernando Henrique Cardoso assumiu a presidˆencia da rep´ublica no dia 1o. _{de Janeiro}

de 1995 e ficou at´e 1o. de Janeiro de 2003, cumprindo dois mandatos. J´a o Lula presidiu de 1o. _{de Janeiro de 2003 a 1}o. _{de Janeiro de 2011, tamb´}_{em tendo dois mandatos. Ser´}_a

avaliado o conjunto dos 2 mandatos de cada presidente.

De acordo com dados divulgados pela Organiza¸c˜ao das Na¸c˜oes Unidas(ONU), no in´ıcio do Governo de FHC o CMI do Brasil era de 40,3 por mil nascidos vivos; ao final foi de 25,1 por mil nascidos vivos. Enquanto que no governo Lula, o CMI em 2003 era de 23,5 por mil nascidos vivos e, em 2010, passou para 14,6 por mil nascidos vivos.

Nesses dois per´ıodos existiram pol´ıticas para melhorar os indicadores sociais, porém essas mudan¸cas se deram de maneira e intensidade diferentes. Neste sentido, seria inte-ressante avaliar a mortalidade infantil e os indicadores relacionados em diferentes n´ıveis de agrega¸cão territorial, a fim de verificar a semelhan¸ca entre as regiões do Brasil e se as pol´ıticas, em cada governo, privilegiaram algumas regiões em detrimento de outras. Com isso pode-se sugerir locais onde, na devida época, seria necessário investir para que o CMI diminua.

O SUS (Sistema Único de Saúde), um dos maiores sistemas de saúde pública do mundo, foi criado em 1988 pela Constitui¸cão Federal Brasileira e teve um importante papel nos mandatos do FHC e Lula. Na década de 1990 houve a implementa¸cão deste sistema, que encontrou algumas dificuldades, como a abrangência do território brasileiro e a heterogeneidade social e regional no pa´ıs.[4]

Alguns programas implementados durante o governo FHC para a melhoria das condi¸cões populacionais foram: Bolsa-Alimenta¸cão para fam´ılias com risco nutricional; Programa Saúde da Fam´ılia - Agentes Comunitários da Saúde; Piso de Aten¸cão Básica; Piso de Assistência Básica, entre outros. Os programas prioritários deste governo eram: Combate `

a Mortalidade Infantil e Sa´ude da Mulher. [4]

Na tabela 1 pode-se ver os gastos do governo em áreas sociais. Gastou-se mais dinheiro com a previdência social e saúde, com 65,8% e 12,8% dos gastos, respectivamente.[5]

(17)

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil 16

Tabela 1: Distribui¸cão do gasto social do governo federal por área de atua¸cão em 2002 ´

Area de atua¸c˜ao % Previdˆencia Social 65,8

Sa´ude 12,8

Assistˆencia Social 5,5 Educa¸c˜ao e cultura 5,3

Trabalho 5,1

Organiza¸cão agrária 2,0 Habilita¸cão e saneamento 0,6

Outros gastos 2,9

Fonte: Minist´erio da Fazenda

No governo Lula, um dos primeiros programas a serem implementados foi o Programa Fome Zero, cujo objetivo era de combater os problemas da fome. A inten¸cão era a for-mula¸cão de uma pol´ıtica de seguran¸ca alimentar e nutricional para a popula¸cão.[5] Outras propostas de programas sociais seriam relativas a uma pol´ıtica de saúde bucal e acesso a medicamentos (ideia da farmácia popular). [6] O Programa Bolsa-Fam´ılia, a principal caracter´ıstica do governo, foi um ajuste dos programas de transferência de renda que existiam no governo FHC.[5] Em rela¸cão ao SUS, o governo Lula foi responsável pela abrangência do sistema, ou seja, pela cobertura do SUS na grande parte do território brasileiro.

1.1 Evolu¸

c˜

ao da mortalidade infantil no Brasil

At´e meados da d´ecada 1940, a taxa de mortalidade era alta em todo o mundo, devido `

a guerra, à fome e a doen¸cas existentes. No entanto, após a Segunda Guerra Mundial, houve uma revolu¸cão na saúde pública, com a implementa¸cão de avan¸cos médicos, como o antibiótico.[7] Com isso, as taxas de mortalidade come¸caram a declinar de forma rápida, inclusive a taxa de mortalidade infantil, havendo uma diminui¸cão no ritmo da queda da taxa de mortalidade nos anos 60.

A partir de meados dos anos 70, o governo brasileiro passou a implementar algu-mas medidas, como saneamento básico, programas de saúde materno-infantil, imuniza¸cão e amplia¸cão da oferta de servi¸cos médico-hospitalares descentralizados, que levaram o aumento da sobrevida da popula¸cão como um todo. Já década de 80 houve uma inten-sifica¸cão na redu¸cão da mortalidade infantil com a jun¸cão dos resultados dos programas implementados na década anterior com a mudan¸ca nos padrões reprodutivos, e a conse-quente redu¸cão na taxa de fecundidade.[7]

(18)

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil 17

Segundo a Organiza¸cão Mundial da Saúde (OMS), a taxa aceitável para o CMI é de 10 óbitos por mil nascidos vivos. Atualmente a taxa de mortalidade infantil no Brasil ainda não chegou ao n´ıvel ideal, no entanto, continua em constante queda.[8]

Na figura 1 pode-se ver a evolu¸cão do CMI entre os anos de 1930 e 2000, no Brasil e nas Regiões Geográficas brasileiras. Houve uma grande redu¸cão do CMI, passando de 162,4 óbitos, em 1930, para 29,6 óbitos por mil nascidos vivos em 2000.

Em 1930 o CMI da região Norte e Nordeste eram bem próximos, 193,3 e 193,2 óbitos por mil nascidos vivos, respectivamente. No entanto, no ano 2000, pode-se perceber grande diferen¸ca entre as duas regiões, sendo 28,6 óbitos por mil nascidos vivos na região Norte e 43,0 óbitos por mil nascidos vivos na região Nordeste. No mesmo ano a região Sudeste e Centro-Oeste possu´ıam CMI próximos.

Figura 1: Evolu¸c˜ao do CMI no Brasil segundo Grande Regi˜oes - 1930/2000

Fonte: Evolu¸c˜ao e Perspectivas da Mortalidade Infantil no Brasil, IBGE

O trabalho está disposto com a seguinte estrutura: no cap´ıtulo 2 serão apresentados os objetivos desta monografia; no cap´ıtulo 3 a metodologia adotada para as análises; no cap´ıtulo 4 os resultados; no cap´ıtulo 5 a conclusão. Ao final estão colocadas as referências bibliográficas e, por fim, os anexos.

(19)

18

2 Objetivos

O objetivo geral do trabalho é avaliar espacialmente a mortalidade infantil e variáveis associadas, em dois per´ıodos distintos, ou seja: verificar se a taxa de mortalidade infantil de uma determinada área é influenciada por seus vizinhos e identificar quais caracter´ısticas estão relacionadas e afetam diretamente a varia¸cão da taxa no tempo.

Os objetivos espec´ıficos s˜ao:

• Classificar os munic´ıpios quanto à qualidade dos dados dos sistemas de informa¸cão, ou seja: verificar se os dados condizem com a realidade ou se estão super ou subes-timados;

• Analisar a dependência espacial do CMI em diferentes n´ıveis de agrega¸cão dos dados, a saber: munic´ıpio, Unidade da Federa¸cão e Microrregiões definidas pelo IBGE; • Ajustar um modelo de regressão espacial múltipla para 2002 e, depois, 2010, para

que possa fornecer as melhores estimativas do CMI atrav´es do uso de vari´aveis explicativas associadas ao contexto do problema;

• Ajustar um modelo de regressão espacial múltipla para a diferen¸ca do CMI, entre os anos de 2002 e 2010 (CMI em 2002 menos CMI em 2010), utilizando também a diferen¸ca entre as variáveis explicativas.

(20)

19

3 Material e M´

etodos

3.1 Mortalidade Infantil

Existem alguns órgãos do governo responsáveis pela coleta, apura¸cão e divulga¸cão dos dados sobre a mortalidade infantil no Brasil. Um deles é o IBGE (Instituto Brasileiro de Geografia e Estat´ıstica), que divulga tais informa¸cões, anualmente, através da publica¸cão “Estat´ısticas do Registro Civil”, desde 1974, e tendo como principal objetivo a contagem de registros de nascimentos e óbitos.[9] Outro é a Secretaria de Vigilância em Saúde, do Ministério da Saúde, que gerencia o SIM (Sistema de Informa¸cão sobre Mortalidade) e o SINASC (Sistema de Informa¸cão sobre Nascidos Vivos).[10]

O SIM, criado em 1976, tem como principal objetivo divulgar informa¸cões para tra¸car um perfil sobre a mortalidade. Seus dados são obtidos através da Declara¸cão de Óbito. O SINASC, implantado em 1992, coleta informa¸cões sobre as condi¸cões de nascimentos no pa´ıs. Seus dados são obtidos através da Declara¸cão de Nascidos Vivos. Através dele pode-se obter informa¸cões sobre natalidade, morbidade, mortalidade infantil e da mãe, e caracter´ısticas do parto.[11]

Dados do SIM e do SINASC podem ser obtidos através do DATASUS, que é o depar-tamento de informática do SUS (Sistema Único de Saúde). Ele faz parte da Secretaria de Gestão Estratégica e Participativa e tem como responsabilidade coletar, processar e divulgar informa¸cões sobre a Saúde.[12]

Os indicadores de saúde expressam o n´ıvel de bem-estar de um determinado grupo. São úteis para identificar problemas de saúde pública, falhas e elabora¸cão de pol´ıticas voltadas para a área em estudo. O CMI pode ser considerado tanto um indicador de saúde como um indicador demográfico, sendo sens´ıvel a varia¸cões das condi¸cões de vida e saúde da popula¸cão. Através dele é poss´ıvel avaliar o crescimento populacional, a desigualdade e a saúde de determinada região.

(21)

3.1 Mortalidade Infantil 20

O CMI estima o risco de crian¸cas até 1 ano morrerem. É calculado com base no número de óbitos de crian¸cas com até 1 ano de idade. Através dele, pode-se avaliar as condi¸cões socioeconômicas, ambientais e n´ıveis de saúde da mãe e da crian¸ca. Também é utilizado para analisar varia¸cões populacionais e geográficas.

Além de calcular o CMI para o grupo geral de crian¸cas até 1 ano de idade, pode-se avaliá-lo em subgrupos de idade como: neonatal e pós-neonatal. A mortalidade neonatal compreende crian¸cas com até 28 dias e a pós-neonatal entre o 28o dia e 1 ano de vida. A mortalidade pós-neonatal se dá geralmente por fatores socioambientais enquanto a neonatal por questões médicas e gestacionais.

Existem duas formas para o cálculo do CMI: a forma direta e a indireta. A forma direta é dada pela seguinte expressão:

CM I = n´umero de ´obitos de residentes com menos de um ano de vida

número de nascidos vivos de mãe residente ∗ 1000 (3.1) Devido aos casos de subnotifica¸cão, não recomenda-se a utiliza¸cão do método direto para o cálculo, pois o resultado não estará de acordo com a realidade. Para verificar qual o método mais adequado para o cálculo da CMI, avalia-se os seguintes indicadores[9]:

• Coeficiente Geral de Mortalidade Padronizado por Idade (CGMPI): número total de óbitos por mil habitantes da popula¸cão em estudo, em um determinado per´ıodo, entendendo o conceito do Coeficiente Geral de Mortalidade (CGM) que pode ser afetado pela estrutura etária da popula¸cão em estudo. Através deste indicador pode-se identificar falhas em informa¸cões de registros de óbitos. Se apresentar um valor abaixo de 4, pode-se deduzir que há precariedade na cobertura das informa¸cões de mortalidade. Esta padroniza¸cão foi feita tomando como base a popula¸cão do ano 2002. Ou seja, padronizou-se o CMI de 2010 considerando como padrão o ano de 2002. Para a padroniza¸cão ver o livro Epidemiologia, do Medronho.[13]

• Desvio médio relativo do Coeficiente Geral de Mortalidade (DMCGM): média aritmética dos valores absolutos dos desvios do CGM, em rela¸cão ao CGM médio ao longo dos anos.

(22)

3.1 Mortalidade Infantil 21

Onde:

CGM M ED = CGMt0+ CGMt1+ ... + CGMtn

n (3.3)

Valores acima de 10% s˜ao considerados cr´ıticos, ou seja, fora do padr˜ao.

• Taxa de natalidade (TN): razão entre o número de nascidos vivos e a popula¸cão total em estudo.

T N = n´umero de nascidos vivos

total da popula¸c˜ao (3.4)

• Desvio médio relativo da taxa de natalidade (DMTN): média aritmética dos valores absolutos dos desvios médios das taxas de natalidade em rela¸cão à taxa média de natalidade no per´ıodo estudado.

(3.5) Onde:

T N M ED = T Nt0+ T Nt1+ ... + T Ntn

n (3.6)

Valores acima de 10% s˜ao considerados cr´ıticos.

• Propor¸cão de óbitos em menores de um ano sem defini¸cão da causa básica: propor¸cão de óbitos classificados em “sintomas, sinais e achados anormais de exames cl´ınicos e de laboratórios não classificados em outra parte”. Esse indicador foi utilizado por expressar as irregularidades nas informa¸cões de óbito. Valores acima de 20% são considerados excessivos.

Com esses indicadores calculados classificam-se os munic´ıpios nas seguintes catego-rias:

• Adequado nas informa¸cões de nascimentos e óbitos: quando o coeficiente geral de mortalidade padronizado por idade é maior que 6,75 por 1000 habitantes, a taxa de natalidade é maior que 16 por 1000 habitantes, desvio médio relativo do CGM menor do que 10%, desvio médio relativo da taxa de natalidade menor que 10% e propor¸cão de óbitos mal definidos menor que 20%;

(23)

3.2 An´alise de Regress˜ao 22

• Parcialmente adequado: não satisfaz algum dos critérios, ou seja, pelo menos um dos indicadores está na faixa cr´ıtica e o CGM padronizado por idade é maior a 4 por 1000 habitantes;

• Inadequado (grande deficiência nas informa¸cões de óbitos): quando o CGM padro-nizado por idade é menor que 4 por mil habitantes, ou seja, não há informa¸cão sobre ´

obito para a maior parte da popula¸c˜ao.

Para os munic´ıpios considerados adequados, pode-se calcular de forma direta o CMI. Para o restante, calcula-se pelo m´etodo indireto, que consiste em multiplicar-se o CMI, achado pela forma direta, pela taxa estimada pelo IBGE.

Neste estudo o interesse é analisar todos os mun´ıcipios brasileiros em dois anos: 2002 e 2010. Atualmente o Brasil é constitu´ıdo de 5570 munic´ıpios, no entanto, em 2002 eram 5560 e em 2010 eram 5565, então, as análises são baseadas nos 5565 munic´ıpios de 2010. Para os munic´ıpios Aroeiras do Itaim, Nazária, Figueirão, Ipiranga do Norte e Itanhangá que não existiam em 2002 foi considerado o CMI dos munic´ıpios aos quais eles pertenciam originalmente.

Para calcular os indicadores citados acima, foi necessário obter a quantidade de nas-cidos vivos (2002 e 2010), óbitos infantis e gerais (2002 e 2010), óbitos por faixa etária (2010), popula¸cão residente por faixa etária (2002 e 2010), popula¸cão residente (2002 e 2010), óbitos sem defini¸cão da causa básica (2002 e 2010). Todos esses dados foram obtidos através do DATASUS. Os óbitos sem defini¸cão da causa básica foram definidos através da CID-101.

3.2 An´

alise de Regress˜

ao

Uma ferramenta utilizada para descrever matematicamente as rela¸cões entre variáveis é o modelo de regressão. Através da análise de regressão pode-se estimar o melhor modelo que se ajuste aos dados, ou seja, uma rela¸cão entre as variáveis independentes e a variável dependente. Neste trabalho a variável dependente é o CMI. O desafio é descobrir quais variáveis independentes são significativas para explicar a varia¸cão do CMI. Neste caso, será utilizado o modelo de regressão linear múltipla. A suposi¸cão básica do modelo de regressão linear é que a média da distribui¸cão de y varia de forma linear com x.[14]

1_{”A CID-10 foi conceituada para padronizar e catalogar as doen¸}_{cas e problemas relacionados `}_{a sa´}_ude,

tendo como referência a Nomenclatura Internacional de Doen¸cas, estabelecida pela Organiza¸cão Mundial de Saúde.”(Fonte:DATASUS)

(24)

O modelo de regressão linear múltipla é o modelo que define uma rela¸cão estat´ıstica2 linear entre a variável dependente y e as p-1 variáveis independentes: x1,x2,...,xp−1. A

associa¸cão entre as variáveis independentes e a variável dependente é dada pela seguinte equa¸cão[15]:

yi = β0+ β1x1,i+ β2x2,i+ ... + βp−1xp−1,i+ εi, i = 1, 2, ..., n (3.7)

Onde:

• yi é a variável dependente na i-ésima observa¸cão;

• β0_{s s˜}_{ao os coeficientes do modelo de regress˜}_ao;

• x0_{s s˜}_{ao as vari´}_{aveis independentes;}

• p − 1 é o número de variáveis independentes; • n é a quantidade de observa¸cões;

• εi ´e o erro do modelo, e sup˜oe-se que εi ∼ N (0, σ2) e COV (εi, εj) = 0, para i 6= j.

Supondo que os erros são normais, pode-se mostrar que a variável dependente/resposta Y também segue distribui¸cão normal e pode ser descrita da seguinte forma matricial[14]:

y = βX + ε (3.8)

Onde ε = σ2Z, sendo Z um vetor de n variáveis aleatórias independentes e iden-ticamente distribu´ıdas com distribui¸cão N (0, 1). Ou seja, ε é um vetor aleatório com distribui¸cão normal n-variada com vetor de médias 0 e matriz de covariância σ2_{I, isto ´}_e,

ε ∼ Nn(µ = 0, Σ = σ2I).[14]

Na equa¸c˜ao 3.8 tem-se:

• n é o número de observa¸cões; • p é o número de parâmetros;

• X ´e matriz nxp com os valores das vari´aveis independentes;

2_H´_{a rela¸}_c˜_{ao estat´ıstica entre duas vari´}_{aveis x e y se para um determinado valor de x existir mais de}

um valor de y, ou seja, dado um valor de x definimos a probabilidade de y assumir determinados valores. Esta rela¸cão não é perfeita, mesmo conhecendo o valor de x não sabe-se o valor exato de y.

(25)

• β é o vetor de dimensão p de parâmetros; • y é vetor da variável dependente de tamanho n; • ε é vetor aleatório de tamanho n.

A estima¸cão dos coeficientes β’s no modelo múltiplo pode ser realizado de duas ma-neiras: por m´ınimos quadrados ou por máxima verossimilhan¸ca.

3.2.1 Estimadores por M´ınimos Quadrados

O estimador para β por m´ınimos quadrados ´e aquele que minimiza a soma dos qua-drados dos erros εi.[16]

A soma dos quadrados dos erros pode ser definida por:

Q = εTε = n X i=1 ε2_i = n X i=1

(yi− β0− β1xi,1− β2xi,2− ... − βp−1xi,p−1)2 (3.9)

Escrevendo Q em nota¸c˜ao matricial, tem-se: Q = εTε =

n

X

i=1

ε2_i = (y − Xβ)T(y − Xβ) = yTy − yTXβ − βTXTy + βTXTXβ (3.10)

Como βTXTy é um escalar, ou seja, tem dimensão 1x1, é igual ao seu transposto. Logo, tem-se a expressão 3.11:

Q(β) = yTy− 2βTXTy + βTXTXβ (3.11)

Para achar o estimador de β por m´ınimos quadrados precisa-se encontrar os pontos β que minimizam Q e, para isso, deriva-se Q em rela¸c˜ao a β e iguala este resultado a zero obtendo a seguinte express˜ao:

ˆ

(26)

3.2.2 Estimadores por M´

axima Verossimilhan¸

ca

Neste trabalho assumiu-se que o CMI tem distribui¸cão Normal, então, para achar o estimador por máxima verossimilhan¸ca, é necessário maximizar a fun¸cão de verossimi-lhan¸ca, definida pela expressão:

L(β, σ2) = n Y i=1 fyi(yi|β0, β1, σ 2_{) =} _√ 1 2πσ2e − 1 2σ2 n P i=1 (yi−β0−β1xi,1+...+βp−1xi,p−1) = √ 1 2πσ2e − 1 2σ2ε T_ε (3.13) Pensando em L somente como fun¸c˜ao de β verifica-se que maximizar L ´e o mesmo que minimizar εT_{ε, logo, tem-se a mesma situa¸c˜}_{ao que o problema de m´ınimos quadrados.}

Com isso, os estimadores encontrados pelos dois m´etodos coincidem.

3.2.3 M´

etodo de quebra de requisitos

Antes de realizar a sele¸cão do modelo que melhor se ajusta aos dados, é necessário realizar a análise de multicolinearidade.

3.2.3.1 Multicolinearidade

Pode-se dizer que há existência de multicolinearidade quando uma ou mais variáveis explicativas estão bem correlacionadas entre si. Isto pode ocasionar estimadores pouco precisos e incertezas nas inferências, pois pequenas mudan¸cas observadas na variável res-posta influenciariam muito as estimativas dos coeficientes do modelo. Uma das maneiras poss´ıveis de identificar a presen¸ca de multicolinearidade é através do Fator de Infla¸cão de Variância (VIF - Variance Inflaction Factor ) da variável resposta. O VIF pode ser defi-nido pelos elementos da diagonal principal de C∗ = (X∗TX∗)−1, onde X∗ é uma matriz do modelo cujas variáveis independentes e variável resposta são definidas por[14]:

x∗_i,k = _r xi,k− xk n P i=1 (xi,k − xk)2 e y∗_i = _r y − y n P i=1 (yi− y)2 (3.14) Onde:

• i ´e quantidade de observa¸c˜oes

(27)

Se uma variável for bem correlacionada com as demais, o valor do VIF será alto. No caso deste trabalho, valores considerados alto serão VIFs maiores que 5.[17] Para solucionar a multicolinearidade uma op¸cão é remover a variável que possui o maior valor do VIF (se acima de 5) e refazer o cálculo do VIF com as variáveis restantes. Faz-se este processo até que não haja nenhuma variável com VIF maior que 5.

3.2.4 Sele¸

c˜

ao do modelo

Após corrigida a multicolinearidade do modelo, pode-se ajustar o modelo de regressão. Para isto é necessário verificar quais variáveis independentes influenciam na variável res-posta. Um método muito utilizado para conjunto de dados com muitas variáveis é o método de sele¸cão passo-a-passo. Dentro deste método há duas vertentes, o método da inclusão progressiva e o método da elimina¸cão progressiva.[14]

Define-se alfa (α) como o n´ıvel de significância de um teste de hipótese, sendo o erro do tipo I, ou seja, probabilidade de rejeitar a hipótese nula do teste (H0), dado que H0 é

verdadeira.

Para que seja feito um modelo de regressão linear, é necessário que os dados sigam a distribui¸cão normal. No caso dos dados a serem utilizados, como há uma grande quanti-dade de observa¸cões, pode-se dizer que os dados possuem aproximadamente distribui¸cão normal.

Neste trabalho será aplicado o método da elimina¸cão progressiva, cujo o processo está descrito abaixo.

3.2.4.1 M´etodo de sele¸c˜ao passo-a-passo

Passo 1) Ajustar o modelo linear completo com todas as vari´aveis respostas e deter-minar o valor p do teste t para todas as vari´aveis independentes;

Passo 2) Se todos os valores de p forem menores que α, não retira-se nenhuma variável e o processo é finalizado. Caso contrário, elimina-se a variável com o maior valor p;

Passo 3) Ajustar um novo modelo sem a vari´avel eliminada no passo anterior e deter-minar o valor p do teste t para cada vari´avel independente;

Passo 4) Se todos os valores de p forem menores que α, não retira-se nenhuma variável e o processo é finalizado. Caso contrário, elimina-se a variável com o maior valor p.

(28)

Este processo continua at´e que todos os valores de p do teste t sejam menores ou iguais a α.

3.2.5 Res´ıduos do modelo de regress˜

ao

Depois de ajustado o modelo linear múltiplo deve-se verificar a correla¸cão espacial dos res´ıduos, sendo este definido através da seguinte expressão:

ei = yi− ˆyi (3.15)

´

E mais comum trabalhar com uma padroniza¸cão dos res´ıduos ao invés dos próprios res´ıduos. Essa padroniza¸cão leva ao res´ıduo padronizado e é definida por:

e∗_i = e√i− E[ei] M SE = yi− ˆyi √ M SE (3.16) Onde: M SE = n P i=1 (yi− ˆyi)2 n − 1 (3.17) Na nota¸c˜ao matricial: e∗ = √ e M SE = y − ˆy √ M SE (3.18)

Outra forma comum de utilizar os erros é através dos erros studentizados e é definido da seguinte forma: r∗_i = ei− E[ei] pMSE(1 − hi,i) = yi− ˆyi pMSE(1 − hi,i) (3.19) Onde:

• hi,i ´e o i-´esimo elemento da diagonal principal da matriz H

A matriz H ´e definida da seguinte forma:

(29)

3.3 Modelo Te´orico 28

Os res´ıduos studentizados tem variˆancias constantes, V ar(ri) = 1, o que torna muito

prática a procura por outliers, que são observa¸cões distantes das demais, por isso é bas-tante utilizado.

3.3 Modelo Te´

orico

Segundo a literatura, alguns dos fatores que influenciam na mortalidade infantil são: a existência ou não de servi¸cos de saúde, como hospitais e saneamento básico próximo aos domic´ılios. Espera-se que, quanto maior renda per capita e n´ıvel de educa¸cão da popula¸cão, menor seja o CMI e quanto maior a taxa de desemprego maior seja o CMI.

Na figura 2 são apresentadas poss´ıveis variáveis que influenciam diretamente no CMI e que podem ser incorporadas ao modelo de regressão. [18] [3] [19] [20]

(30)

3.3 Modelo Te´orico 29

Estas vari´aveis foram obtidas da seguinte forma:

• CMI foi obtido através do cálculo pela forma direta entre o número de nascidos vivos e óbitos por mil nascidos vivos;

• Propor¸c˜ao de partos domiciliares foi obtido pela raz˜ao entre a quantidade de partos domiciliares e o total de partos, por mil habitantes;

• Taxa de desemprego é a propor¸cão de indiv´ıduos capazes de exercer um profissão porém não estão no mercado de trabalho. Neste caso não tem-se os dados de 2002, então utilizou-se os dados de 2000, do censo;

• Taxa de analfabetismo é a propor¸cão de pessoas que não sabem ler e escrever em uma faixa etária com rela¸cão ao total de pessoas da mesma faixa etária. Neste caso não tem-se os dados de 2002, então utilizou-se os dados de 2000, do censo;

• Renda domiciliar per capita é a soma dos rendimentos mensais dos moradores do domic´ılio dividido pela quantidade de moradores. Neste caso não tem-se os dados de 2002, então utilizou-se os dados de 2000, do censo;

• PIB (Produto Interno Bruto) ´e a soma de todos os bens e servi¸cos finais produzidos, em valores monet´arios;

• PIB per capita ´e o PIB dividido pela quantidade de habitantes. Mede quanto do total conv´em a cada habitante, se fosse dividido em partes iguais;

• Propor¸cão de domic´ılios que o lixo era tratado da seguinte forma: queimado (na propriedade), enterrado (na propriedade), jogado em terreno baldio ou logradouro, jogado em rio, lago ou mar e outro destino, que foi obtido pela razão entre esses domic´ılios e o total de domic´ılios, por mil domic´ılios. Neste caso não tem-se os dados de 2002, então pegou-se os dados de 2000, do censo;

• Propor¸cão de domic´ılios que possu´ıam as seguintes instala¸cões sanitárias: fossa séptica, fossa rudimentar, vala, rio, lago ou mar, outro escoadouro, não sabe o tipo de escoadouro e não tem instala¸cão sanitária, obtido através da razão da quantidade desses domic´ılios e o total domic´ılios, por mil domic´ılios. Neste caso não tem-se os dados de 2002, então pegou-se os dados de 2000, do censo;

• Taxa de fecundidade é a estimativa do número médio de filhos que uma mulher teria em todo seu per´ıodo reprodutivo;

(31)

3.4 An´alise Espacial 30

• Taxa de natalidade ´e o n´umero de nascidos vivos a cada mil habitantes;

• Índice Gini é uma medida de desigualdade social, que varia entre zero e um, onde zero representa a completa igualdade e um representa completa desigualdade. Neste trabalho, este ´ındice foi obtido através da mediana do ´ındice de Gini dos munic´ıpios pertencentes a cada microrregião. Neste caso não tem-se os dados de 2002, então pegou-se os dados de 2000, do censo.

Não foi poss´ıvel obter a variável sobre o acesso de água. Todos esses dados foram encontrados no site do DATASUS.

3.4 An´

alise Espacial

3.4.1 An´

alise Explorat´

oria

Análise espacial é o estudo quantitativo de fenômenos alocados no espa¸co. Através dela pode-se verificar se determinada caracter´ıstica de interesse é influenciada pela sua vizinhan¸ca, ou seja, se existe dependência espacial. A análise de dados espaciais é aplicada em situa¸cões onde se dispõem de dados observados a partir de algum sistema que opera no espa¸co.[21] Podem ser encontrados três tipos de dados: dados de padrão de pontos, dados espacialmente cont´ınuos e dados de área.

Neste trabalho foi realizada a análise de dados espaciais de área. Estes são dados rela-cionados com unidades delimitadas, ou seja, dados relarela-cionados com um mapa geográfico, por exemplo, dados do censo. Neste caso não é de interesse o local exato da ocorrência e sim os dados agregado por área.

Para verificar se existe uma dependência espacial entre os dados, calcula-se a auto-correla¸cão espacial, onde a correla¸cão é medida para a mesma variável, mas de lugares diferentes. Existem alguns métodos para verificar a existência desta autocorrela¸cão, e todos eles utilizam um fator em comum, que é a matriz de vizinhan¸ca ou proximidade espacial.

3.4.1.1 Matriz de proximidade espacial ou matriz de vizinhan¸ca

A matriz de proximidade espacial é uma ferramenta básica na avalia¸cão da autocor-rela¸cão espacial. Esta matriz é definida como W (nxn), onde n é a quantidade de áreas e cada elemento wij representa uma medida de distância entre a área i e a área j. Esta

(32)

medida pode ser calculada através da distância entre os centroides, da existência de fron-teiras ou comprimento das fronfron-teiras[22]. Os elementos da diagonal wij são zero, enquanto

os elementos wij apontam a forma qua a área i está relacionada espacialmente com a área

j. Alguns dos crit´erios utilizados na matriz W s˜ao[23] :

• wij=1, se o centro da área i está a uma determinada distância da área j, 0 caso

contr´ario;

• wij=1, se a área i faz fronteira com a região j, 0 caso contrário;

• wij=1/d, em que d é a distância entre os centros da área i e j.

´

E poss´ıvel atribuir peso `as proximidades encontradas. As possibilidades s˜ao:

• Sem peso: todos os objetos estão próximos com o mesmo peso; • Distância inversa;

• Distˆancia inversa ao quadrado.

Muitas vezes se usa a matriz de vizinhan¸ca normalizada pelo n´umero de vizinhos por linha, como na figura 3, onde tem-se um exemplo de uma matriz de proximidade espacial normalizada para cinco ´areas, sendo considerados vizinhos por contiguidade. [23]

Figura 3: Matriz de proximidade espacial

Neste trabalho foi considerado na matriz de proximidade espacial os vizinhos por contiguidade, ou seja, que compartilham fronteira, e por vizinhos mais pr´oximos.

3.4.1.2 ´Indice de Moran

O Índice de Moran, também conhecido como I de Moran, é a medida mais utilizada para verificar a dependência espacial, através do produto dos desvios em rela¸cão a média.

(33)

Na equa¸cão 3.21, o cálculo do I de Moran leva em considera¸cão apenas o primeiro vi-zinho, ou seja, o vizinho de primeira ordem. Neste caso, utiliza-se os vizinhos diretamente ligados a área em estudo. [24]

I = n P i=1 n P j=1 wij(zi− z)(zj − z) n P i=1 (zi− z)2 , para i 6= j (3.21) Onde:

• n ´e a quantidade de observa¸c˜oes;

• zi e zj é o valor do CMI da área i e na área i, respectivamente;

• z é o valor médio do CMI na região de estudo;

• wij ´e o elemento da matriz normalizada de proximidade espacial para o par i e j.

A equa¸cão 3.22 é uma generaliza¸cão da equa¸cão 3.21, onde k é a ordem da vizinhan¸ca. Quando k=2,considera-se na matriz de vizinhan¸ca o vizinho do vizinho, sendo matriz de segunda ordem. I(k)= n ∗ n P i=1 n P j=1 w_ij(k)(zi− z)(zj − z) n P i=1 (zi− z)2 , para i 6= j (3.22)

O I de Moran varia de -1 a 1. Quanto mais próximo de 0, indica a independência espacial. Se for próximo de 1 existe correla¸cão positiva e se for próximo de -1 existe correla¸cão negativa. O teste realizado para verificar a correla¸cão entre as áreas é o teste de Moran, onde as hipóteses são:

(

H0 : I = 0, ou seja, não existe autocorrela¸cão espacial entre as áreas;

H1 : I 6= 0, ou seja, existe autocorrela¸c˜ao espacial entre pelo menos 2 das ´areas.

Para a valida¸cão estat´ıstica do teste é necessário associar o ´ındice a uma distribui¸cão, sendo mais frequente a distribui¸cão normal. Baseado na distribui¸cão assintótica do I de Moran, no entanto o mais usual é fazer o teste de pseudo-significância, onde são geradas diferentes permuta¸cões dos valores de atributos associados às regiões. Cada permuta¸cão produz um novo arranjo espacial, onde os valores estão redistribu´ıdos entre as áreas. Se

(34)

o valor observado corresponder a um ”extremo”da distribui¸cão simulada, então trata-se de valor com significância estat´ıstica[24].

Outras formas de identificar a dependência espacial são a Estat´ıstica Espacial Local ou Indicadores Locais de Associa¸cão Espacial (LISA), Moran Map, Box Map e o Lisa Map.

3.4.1.3 Indicadores Locais de Associa¸c˜ao Espacial - LISA

O I de Moran é um ´ındice global, onde obtém-se um único valor para todo o conjunto de munic´ıpios. No caso do LISA, tem um valor espec´ıfico para cada munic´ıpio, permitindo identificar as áreas semelhantes e a existência de locais considerados outliers. Este ´ındice é calculado da seguinte forma[25]:

Ii = zi∗

W zi

σ2 (3.23)

Onde:

• zi = valor do desvio do CMI da i -´esima ´area;

• W zi = valor m´edio dos desvios do CMI dos vizinhos da ´area i ;

• σ2 _{= variˆ}_{ancia da distribui¸c˜}_{ao dos valores dos desvios do CMI.}

O Lisa é um indicador que necessita atender as seguintes caracter´ısticas[26]: 1. Permitir a identifica¸cão de padrões de associa¸cão espacial significativa; 2. Ser uma decomposi¸cão do ´ındice global de associa¸cão.

Quando calculado o ´ındice local, pode-se calcular o I de Moran através de sua média aritmética.

O Moran Map, Box Map e o Lisa Map são gráficos que obtém-se a partir do diagrama de espalhamento de Moran e Lisa.

3.4.1.4 Diagrama de espalhamento de Moran

O diagrama de espalhamento de Moran é uma forma de observar a dependência es-pacial nos dados. Ele é dividido em quatro quadrantes, onde cada quadrante demonstra

(35)

um tipo de associa¸cão diferente entre o valor de um determinado lugar com o valor médio de sua vizinhan¸ca. Este diagrama utiliza os valores normalizados, ou seja, valores do CMI subtra´ıdos de sua média e divididos pelo desvio padrão[27]. Através deste gráfico, constru´ıdo através do valor do CMI normalizado pela média dos vizinhos, pretende-se comparar o CMI normalizado de uma determinada área com a média dos seus vizinhos. Os quadrantes são definido como[28]:

• Os quadrantes superior direito e inferior esquerdo – indicam associa¸cão espacial positiva, isto é, a área para o valor do atributo considerado, está cercada por áreas que tem comportamento similar. O quadrante superior direito (High-High = Alto-Alto) indica que tanto o valor do atributo, quanto o valor médio para seus vizinhos, estão acima da média do conjunto. No quadrante inferior esquerdo (Low-Low = Baixo-Baixo) tanto o atributo quanto a média dos vizinhos, estão abaixo da média; • Valores baixos estão cercados por valores altos (quadrante superior esquerdo: Baixo-Alto (Low-High), representando valor negativo e média dos vizinhos positiva) e valores altos são rodeados por valores baixos (quadrante inferior direito: Alto- Baixo (High-Low ), representando valor positivo e média dos vizinhos negativa)

Na figura 4 tem-se um exemplo de um diagrama de espalhamento de Moran, onde Q1 ´e o quadrante High-High, Q2 o quadrante Low-Low, Q3 o quadrante High-Low e Q4 o quadrante Low-High.

3.4.1.5 Box Map, Lisa Map e Moran Map

O diagrama de espalhamento de Moran pode ser representado por um mapa, que ´e o Box Map, onde cada cor do mapa significa um dos quadrantes do diagrama. [28]:

Para o Lisa Map é analisada a significância dos valores do ´ındice de Moran local em cada munic´ıpio, cujas hipóteses são iguais ao do ´ındice global de Moran. As áreas são distribu´ıdas em quatro grupos: não significantes, significantes à 95%, significantes à 99% e significantes à 99,9%.

O Moran Map é uma jun¸cão do Lisa Map com o Box Map. Para a confeçcão deste mapa, utiliza-se somente as áreas consideradas significativas do Lisa(no caso deste tra-balho com valor-p<0,05). Depois de identificadas essas regiões, separa-se nos quatro quadrantes definidos no diagrama de espalhamento de Moran e visualizados no Box Map. As demais são consideradas não significantes.[25]

(36)

Figura 4: Diagrama de espalhamento de Moran

Fonte:Análise Espacial de Áreas. In: Análise Espacial de Dados de Área.

Quando a correla¸cão espacial é verificada, procura-se incorporar esta informa¸cão ao modelo de regressão. Há diversas maneiras para inserir o efeito espacial no modelo de regressão, no entanto, o mais utilizado é o modelo com efeitos espaciais globais, que busca sintetizar a estrutura de correla¸cão espacial em apenas um parâmetro e introduzi-lo no modelo de regressão. Há duas maneiras de se fazer isto, através do modelo espacial auto-regressivo misto (Spatial Auto Regressive - SAR ou Spatial Lag Model) e o modelo do erro espacial (Conditional Auto Regressive - CAR ou Spatial Error Model) que estão descritos abaixo.[29]

3.4.2 Modelo SAR

Neste modelo a autocorrela¸cão espacial ignorada é atribu´ıda à variável dependente Y, como representada na equa¸cão do modelo abaixo.

y = Xβ + ρWY + ε (3.24)

Onde:

• y = vetor da vari´avel dependente • X = matriz de vari´aveis independentes

(37)

• β = vetor de coeficientes de regress˜ao

• ε = vetor com erro aleat´orio do modelo, ε ∼ N (0, σ2)

• W = matriz de vizinhan¸ca espacial ou matriz de pondera¸c˜ao espacial • ρ = coeficiente espacial autoregressivo

W Y expressa a dependˆencia espacial em Y .

A hipótese nula para a não existência de correla¸cão espacial é de ρ = 0.

3.4.3 Modelo CAR

Este modelo de regressão trata os efeitos espaciais como ru´ıdo, ou seja, uma per-turba¸cão que necessita ser removida. Neste caso, a autocorrela¸cão está associada ao erro, como descrito abaixo.

y = βX + ε, (3.25)

ε = λWε+ ξ (3.26)

Onde:

• Wε = componente do erro com efeitos espaciais

• λ = coeficiente auto-regressivo

• ξ = erros aleatórios com média zero e variância σ2

A hipótese nula para a não existência de correla¸cão espacial é de λ = 0.

3.4.4 Diagn´

ostico de modelos com efeitos espaciais

Para a avalia¸cão da qualidade do ajuste do modelo, primeiro deve-se fazer uma análise gráfica dos res´ıduos, pois através desta análise pode-se verificar se houve ruptura no pressuposto de independência. Uma presen¸ca elevada de res´ıduos positivos ou negativos em uma parte do mapa indica existência de correla¸cão espacial. Para um teste quantitativo o mais utilizado é o I de Moran dos res´ıduos.[30]

(38)

Nos modelos de regressão espacial são utilizados critérios de informa¸cão onde a ava-lia¸cão do ajuste é penalizada por uma fun¸cão do número de parâmetros.[29] Também é necessário considerar o número de parâmetros independentes ao se incluir fun¸cões espa-ciais nos modelos. Para cada nova variável em modelo de regressão, acrescenta-se um parâmetro.

Normalmente a compara¸cão entre modelos é feita considerando o logaritmo da máxima verossimilhan¸ca e o número de coeficientes de regressão, pois é o que possui melhor ajuste para os dados. Dentre os critérios, os mais utilizados são[30]:

• Crit´erio de Informa¸c˜ao de Akaike (AIC)

AIC = −2 ∗ LM V + 2k (3.27)

Onde:

LMV: logaritmo da m´axima verossimilhan¸ca k: quantidade de coeficientes de regress˜ao

Neste caso avalia-se o grau de informa¸cão que se perde ao escolher determinado modelo. Penaliza-se a quantidade de parâmetros no modelo, através do termo 2K. • Critério Bayesiano de Informa¸cão (BIC) ou Critério Bayesiano de Schwarz (SBC)

BIC = −2 ∗ LM V + k ∗ ln(N ) (3.28)

Onde:

LMV: logaritmo da máxima verossimilhan¸ca k: quantidade de coeficientes de regressão N: quantidade de observa¸cões

O BIC determina entre todos os poss´ıveis modelos aquele em que se perde menos in-forma¸cão. Penaliza-se o modelo pela quantidade de observa¸cões, através do termo ln(N ). Nos dois critérios acima é considerado o melhor modelo aquele que possui o menor valor.

(39)

3.5 Limita¸c˜oes do trabalho 38

3.5 Limita¸

c˜

oes do trabalho

O intuito deste trabalho era avaliar espacialmente o CMI entre os munic´ıpios, no entanto verificou-se que a qualidade dos dados não era boa (ver resultados no próximo cap´ıtulo), portanto decidiu-se fazer por microrregiões do Brasil definidas pelo IBGE, com base em similaridades sociais e econômicas, dividindo os estados em microrregiões.

(40)

39

4 Resultados

Neste trabalho todas as an´alises foram realizadas nos programas Excel, TerraView, GeoDa e R. Adotou-se o n´ıvel de significˆancia de 5%.

4.1 An´

alise dos munic´ıpios e estados

Com base na literatura, verificou-se a necessidade de explorar a qualidade dos dados de saúde dispon´ıveis, para decidir como seriam calculados os CMI. A tabela 2 apresenta a classifica¸cão dos munic´ıpios quanto a qualidade dos dados, subdivididos em adequados, inadequados e parcialmente adequados, e as frequências absoluta e percentual. Na figura 5 apresenta-se esta classifica¸cão dos munic´ıpios no mapa. Pode-se perceber que uma pequena parcela dos munic´ıpios são adequados e poderiam ter seu CMI calculado pela forma direta. No per´ıodo de 2002 à 2010 houve uma redu¸cão de 0,5% na quantidade de munic´ıpios considerados adequados.

Tabela 2: Classifica¸cão dos munic´ıpios quanto à qualidade dos dados Classifica¸cão Ano 2002 2010 n % n % Adequado 32 0,6 6 0,1 Parcialmene adequado 4249 76,4 4119 74,0 Inadequada 1284 23,1 1440 25,9 Total 5565 100,0 5565 100,0

(41)

4.1 An´alise dos munic´ıpios e estados 40

(a)

(b)

(42)

Pelo pequeno percentual de munic´ıpios considerados adequados e pela dificuldade de achar dados do IBGE para o c´alculo da forma indireta, foi calculado para todos os munic´ıpios a forma direta do CMI, que est´a representado na figura 6, onde as categorias da legenda foram definidas de acordo com os quartis do CMI de 2002.

(a)

(b)

(43)

Na figura 7 tem-se o CMI calculado pelo IBGE por estado, divididas por quatro categorias definidas pelos quartis do CMI de 2010. Pode-se perceber que houve uma diminui¸c˜ao do CMI, principalmente na regi˜ao Norte.

(a)

(b)

(44)

Para verificar a dependência espacial entre os munic´ıpios foi realizado o teste I de Moran e o resultado é dado na tabela 3. Foram realizados três testes para cada ano, considerando número de vizinhos diferentes no cálculo da matriz de vizinhan¸ca W . Foi feito para um vizinho mais próximo, que foi o valor m´ınimo encontrado, para 6 vizinhos, que é a média de vizinhos dos munic´ıpios brasileiros e para 23 vizinhos, que foi o valor máximo de vizinhos observado. Através dele pode-se observar que os valores do I de Moran em todos os casos foram próximos à zero, no entanto, apenas para 1 vizinho mais próximo em 2010 o valor p foi maior que 5%, ou seja, não rejeita-se H0, indicando a

inexistência de dependência espacial entre os munic´ıpios. Nos outros casos verificou-se uma fraca autocorrela¸cão entre os munic´ıpios.

Tabela 3: Teste I de Moran de acordo com o n´umero de vizinhos Vizinhos

Ano

2002 2010

I de Moran valor p I de Moran valor p

1 0,056 <0,001 0,031 0,055

6 0,046 <0,001 0,020 0,006

23 0,034 <0,001 0,017 <0,001

Pode-se ver nas figuras 8, 9 e 10 o diagrama de espalhamamento de I Moran do CMI para os anos de 2002 e 2010, com 1, 6 e 23 vizinhos mais próximos. Para ser constatada a autocorrela¸cão espacial seria necessário que os valores seguissem em torno da reta cujo ˆ

(45)

(a) 2002 para k=1

(b) 2010 para k=1

(46)

(a) 2002 para k=6

(b) 2010 para k=6

(47)

(a) 2002 para k=23

(b) 2010 para k=23

(48)

Como nos gráficos acima não foi poss´ıvel visualizar com clareza a autocorrela¸cão espacial, foi feito o diagrama de espalhamento para o CMI dos estados brasileiros, para melhor visualiza¸cão dos dados. Na figura 11 tem-se o diagrama de espalhamento de Moran para o CMI de 2002 e 2010 por estado, onde pode ser visto o I de Moran, que, para 2002, foi igual a 0,667741, e, para 2010, foi 0,593682, concluindo-se que há autocorrela¸cão espacial do CMI entre os estados. Na figura 12 tem-se o Moran Map para os anos de 2002 e 2010.

Em 2002 os estados em vermelho estão no quadrante High-High, ou seja, Piau´ı, Ceará, Para´ıba, Pernambuco, Alagoas e Sergipe são influenciados positivamente por seus vizinhos e que tanto o CMI deles quanto a média dos seus vizinhos estão acima da média nacional. Os estados de Santa Catarina, Paraná, Mato Grosso do Sul, São Paulo, Rio de Janeiro e Minas Gerais, em azul, estão no quadrante Low-Low, ou seja, esses munic´ıpios são influenciados pelos vizinhos e o valor de seu CMI e a média dos seus vizinhos estão abaixo da média do pa´ıs. Em cinza são os estados não significantes.

Em 2010 houve uma mudan¸ca no cenário. De todos os munic´ıpios que pertenciam ao quadrante High-High, somente Sergipe continuou a pertencer a este quadrante. Per-nambuco passou a pertencer ao quadrante Low-High, ou seja, ele possui CMI abaixo da média no entanto seus vizinhos possuem CMI acima da média. Minas Gerais deixou de ser significativo, ou seja, não sofria mais a influencia de seus vizinhos.

(49)

(a) 2002

(b) 2010

(50)

(a) 2002

(b) 2010

(51)

4.2 An´alise das microrregi˜oes 50

Devido aos resultados insatisfatórios dos munic´ıpios e pelo fato da divisão territorial por estado abrangerem situa¸cões socioeconômica diversas, optou-se por fazer a análise espacial por microrregião do IBGE. São 558 microrregiões, sendo 64 na Região Norte, 188 na Região Nordeste, 160 na Região Sudeste, 94 na Região Sul e 52 na Região Centro-Oeste.

4.2 An´

alise das microrregi˜

oes

4.2.1 Microrregi˜

oes em 2002 e 2010

4.2.1.1 Modelo de regress˜ao linear

Na figura 13 tem-se o CMI das microrregiões. Os CMI para 2002 e 2010 foram categorizados segundo os quartis do CMI de 2002. Pode-se observar que houve uma redu¸cão no CMI, principalmente na região nordeste e centro-oeste.

Para realizar as análises espaciais, primeiramente foram coletados as variáveis que fazem parte do modelo teórico para verificar quais realmente influenciam no CMI, para assim realizar as análises dos erros do modelo selecionado. Na tabela 4 tem-se as medidas resumos das variáveis nos anos de 2002 e 2010. Observando-se as médias das variáveis pode-se dizer que houve uma melhora entre os anos, como, por exemplo, a taxa de desem-prego caiu de 11,82 para 6,93 e a renda domiciliar per capita aumentou de R$ 394,27 para R$ 542,20. O ´ındice de Gini sofreu uma ligeira queda de 0,56 em média no ano de 2002 para 0,51 em média no ano de 2010, indicando uma melhora na desigualdade do Brasil.

(52)

(a) 2002

(b) 2010

(53)

4.2 Análise das microrregiões 52 T ab ela 4: Resumo descritiv o das v ari´ av eis do mo delo te órico de 2 002 e 2010 Resumo das v ari´ av eis de 2002 CMI P artos domic. T axa desem. T axa analf. Renda domic. p er capita PIB PIB p er capita T axa fecun. T axa natal. Gini Prop. lixo Prop. inst. sanit´ aria M ´ınimo 6,10 0, 00 1,50 3,20 94,26 16919 1199 1,10 9,60 0,4073 2,1 53,7 1 o quartil 15,43 1,40 9,04 9,13 192,50 331215 2505 1,80 15,30 0,5328 184,4 521,9 Mediana 19,20 4,90 11,48 15,10 388,21 684842 5279 2,00 17,60 0,5611 368,6 834,6 M édia 20,32 21,76 11,82 19,33 394,27 2648426 5842 2,097 17,85 0,5621 380,9 716,7 3 o quartil 24,10 19,32 14,10 29,60 541,97 1675558 7655 2,30 19,90 0,5915 549,4 961,4 M´ aximo 46,40 443,60 27,17 50,70 1192,92 222780757 30106 3,90 31,40 0,7117 952,2 999,6 Resumo das v ari´ av eis de 2010 CMI P artos domic. T axa desem. T axa analf. Renda domic. p er capita PIB PIB p er capita T axa fecun. T axa natal. Gini Prop. lixo Prop. inst. sanit´ aria M ´ınimo 3,90 0, 00 1,10 2,30 162,2 33632 3077 1,00 8,70 0,3736 0,00 33,93 1 o quartil 11,80 0,80 5,15 6,43 302,1 864447 6216 1,60 13,00 0,4758 95,53 409,61 Mediana 13,95 2,10 6,74 11,25 541,8 1780287 12343 1,70 14,40 0,5087 214,65 700,39 M édia 14,47 12,96 6,93 14,43 542,2 6756425 13970 1,75 14,91 0,5117 241,94 640,87 3 o quartil 16,80 6,46 8,37 22,48 728,6 4249122 18155 1,90 16,38 0,5432 365,40 904,79 M´ aximo 43,50 328,80 20,47 42,40 1665,4 528429303 70290 4,00 32,20 0,7399 822,60 998,27

(54)

As tabelas 5 e 6 apresentam os VIFs das vari´aveis do modelo te´orico, para os anos de 2002 e 2010 respectivamente. Portanto, tem-se os VIFs de cada passo, ou seja, na coluna ”1o. _{ajuste”est˜}_{ao os VIFs de todas as vari´}_{aveis do modelo te´}_{orico. Em negrito}

tem-se o valor mais alto do VIF que indica que a variável é muito correlacionada com as demais, tendo que ser eliminada. Foram eliminadas as variáveis até que só restasse variáveis com valores de VIF menores que 5. Tanto em 2002 como em 2010 a primeira variável a ser eliminada foi a renda domiciliar per capita, que é bem correlacionada com as demais variáveis nos dois momentos. Além desta, em 2002 também foram eliminadas as variáveis taxa de fecundidade e propor¸cão de lixo e em 2010, taxa de natalidade.

Tabela 5: VIF das vari´aveis eliminadas de 2002

Vari´aveis 1o. ajuste 2o. ajuste 3o. ajuste 4o. ajuste Propor¸c˜ao de partos domiciliares 1,739032 1,672481 1,548437 1,263293 Taxa de desemprego 1,975486 1,585370 1,495952 1,240405 Taxa de analfabetismo 4,542235 3,211798 3,058893 2,413447

Renda domiciliar per capita 10,483907 – – –

PIB 1,401489 1,166298 1,164092 1,159858

PIB per capita 2,803614 2,348317 2,347154 2,076585

Taxa de fecundidade 10,451788 10,234034 – –

Taxa de natalidade 8,589256 8,526664 2,007657 1,989221

Gini 1,802105 1,762952 1,756514 1,619078

Propor¸c˜ao lixo 7,756350 6,003192 5,854077 –

Propor¸cão instala¸cão sanitária 2,371457 2,290433 2,224885 1,735711

Logo, na sele¸cão do melhor modelo que se ajusta aos dados de 2002, as variáveis utilizadas foram: propor¸cão de partos domiciliares, taxa de desemprego, taxa de analfa-betismo, PIB, PIB per capita, taxa de natalidade, ´ındice de Gini e propor¸cão de domic´ılios com instala¸cão sanitária inadequada.

Para a sele¸cão do melhor modelo que se ajusta aos dados de 2010 foram utilizadas as seguintes variáveis: propor¸cão de partos domiciliares, taxa de desemprego, taxa de analfabetismo, PIB, PIB per capita, taxa de fecundidade, ´ındice de Gini, propor¸cão de domic´ılios com coleta inadequada de lixo e propor¸cão de domic´ılios com instala¸cão sa-nitária inadequada.

(55)

Tabela 6: VIF das vari´aveis eliminadas de 2010

Vari´aveis 1o. _ajuste ₂o. _ajuste ₃o. _ajuste

Propor¸c˜ao de partos domiciliares 1,808004 1,803001 1,791464 Taxa de desemprego 2,307545 1,685317 1,489052 Taxa de analfabetismo 4,678122 3,524840 3,524782

Renda domiciliar per capita 10,259460 – –

PIB 1,444171 1,173322 1,159728

PIB per capita 2,349070 2,101939 2,97591

Taxa de fecundidade 10,176283 9,900987 2,469117

Taxa de natalidade 10,152868 10,032749 –

Gini 3,087856 3,068384 2,980054

Propor¸cão lixo 6,309180 4,864970 4,740176 Propor¸cão instala¸cão sanitária 2,144902 2,125421 2,012171

Com as variáveis restantes, aplicou-se o método de sele¸cão de elimina¸cão progressiva. Na tabela 7 tem-se o valor p do teste t de cada etapa do método para o ano de 2002. Pode-se observar que no primeiro modelo, onde todas as variáveis estão inclu´ıdas no ajuste, a que possui maior valor p no teste t é o PIB, logo, de acordo com o método, ela foi eliminada do modelo. Ajustando um novo modelo sem esta variável, observou-se que a variável propor¸cão de partos domiciliares possui o valor p igual a 0,6064, sendo assim, foi retirada do modelo. Realizando este processo até que se obtenha variáveis com valor p abaixo de 5%, chegamos ao modelo final da equa¸cão (4.1):

ˆ

yi = 3, 998 + 0, 1724x1,i+ 0, 2119x2,i− 0, 0001647x3,i+ 19, 84x4,i (4.1)

Onde:

• ˆyi é o CMI estimado da i-ésima microrregião em 2002;

• x1,i é a taxa de desemprego da i-ésima microrregião em 2002;

• x2,i é a taxa de analfabetismo da i-ésima microrregião em 2002;

• x3,i é o PIB per capita da i-ésima microrregião em 2002;

(56)

4.2 Análise das microrregiões 55 T ab ela 7: Etapas do a juste do mo delo de regress˜ ao linear para o ano de 2002 V ari´ av ei s Mo delo 1 Mo delo 2 Mo delo 3 Mo delo 4 Mo delo 5 In tercepto 0,25124 0,2527 0,21534 0, 18135 0,22530 Prop or¸ cão de partos domiciliares 0,51293 0,5064 – – – T axa de desemprego 0,03361 0,0360 0,03230 0, 00959 0,00404 T axa de analfab etismo 5 ,39 ∗ 10 − 11 5 ,51 ∗ 10 − 11 6 ,64 ∗ 10 − 11 1 ,32 ∗ 10 − 10 2 ,89 ∗ 10 − 12 PIB 0,71053 – – – – PIB p er capita 0,04408 0,0318 0,03474 0, 04359 0,04273 T axa de natalidade 0,12712 0,1317 0,16189 0,26425 – Gini 0,00927 0,0085 0,00911 0, 01511 0,00108 Prop or¸ cão instala¸ cão sanit´ aria 0,23184 0,2437 0,23313 – –

(57)

Aplicando o método de sele¸cão de elimina¸cão progressiva para o ano de 2010 cujos resultados podem ser vistos na tabela 8, obtém-se o modelo final da equa¸cão (4.2):

ˆ

yi = 1, 332 − 8, 359 ∗ 10−05x1,i+ 27, 96x2,i (4.2)

Onde:

• ˆyi é o CMI estimado da i-ésima microrregião em 2010;

• x1,i é o PIB per capita da i-ésima microrregião em 2010;