• Nenhum resultado encontrado

Análise espacial da mortalidade infantil em dois momentos políticos do Brasil

N/A
N/A
Protected

Academic year: 2021

Share "Análise espacial da mortalidade infantil em dois momentos políticos do Brasil"

Copied!
87
0
0

Texto

(1)

Camila Mattos dos Santos

An´

alise espacial da mortalidade infantil em

dois momentos pol´ıticos do Brasil.

Niter´oi - RJ, Brasil 23 de mar¸co de 2016

(2)

Universidade Federal Fluminense

Camila Mattos dos Santos

An´

alise espacial da mortalidade

infantil em dois momentos pol´ıticos

do Brasil.

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientadora: Profa. Ludmilla da Silva Viana Jacobson

Niter´oi - RJ, Brasil 23 de mar¸co de 2016

(3)

Universidade Federal Fluminense

Camila Mattos dos Santos

An´

alise espacial da mortalidade infantil em

dois momentos pol´ıticos do Brasil.

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “An´alise espacial da mortalidade infantil em dois momentos pol´ıticos do Brasil.”, defendida por Camila Mattos dos San-tos e aprovada em 23 de mar¸co de 2016, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora cons-titu´ıda pelos professores:

Profa. Dra. Ludmilla da Silva Viana Jacobson Orientadora Departamento de Estat´ıstica – UFF

Prof. Dr. Luis Guillermo Coca Velarde Departamento de Estat´ıstica – UFF

Profa. Dra. Ana Beatriz Monteiro Fonseca Departamento de Estat´ıstica – UFF

(4)

S161

Santos, Camila Mattos dos

Análise espacial da mortalidade infantil em dois momentos políticos do Brasil / Camila Mattos dos Santos. – Niterói, RJ : [s.n.], 2016.

77 f. : il.

Orientador: Prof. Dra. Ludmilla da Silva Viana Jacobson. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Universidade Federal Fluminense, 2016.

1. Mortalidade infantil. 2. Análise espacial. 3. Regressão espacial. I. Título.

CDD 519.535 (18 ed.)

(5)

Resumo

Ao longo do tempo o Brasil sofreu diversas mudan¸cas em seus indicadores sociais, que, consequentemente, interferiram no coeficiente de mortalidade infantil (CMI), que ´e um indicador tanto socioeconˆomico como de sa´ude. O objetivo geral do trabalho ´e avaliar espacialmente a mortalidade infantil e vari´aveis associadas, em dois per´ıodos distintos: ao fim do governo do ex-presidente Fernando Henrique Cardoso (FHC) e ao fim do governo do ex-presidente Luiz In´acio Lula da Silva (Lula). Os objetivos espec´ıficos s˜ao: classifi-car os munic´ıpios quanto `a qualidade dos dados dos sistemas de informa¸c˜ao; analisar a dependˆencia espacial do CMI em diferentes n´ıveis de agrega¸c˜ao; ajustar um modelo de regress˜ao espacial m´ultipla para 2002 e 2010; ajustar um modelo de regress˜ao espacial m´ultipla para a diferen¸ca do CMI entre 2002 e 2010.

Atrav´es das an´alises explorat´orias espaciais pˆode-se perceber que a qualidade dos dados municipais ´e ruim, sendo a maior parte dos munic´ıpios considerados parcialmente adequados: em 2002, foram 76,4% e, em 2010, 74%. Foi observado atrav´es do I de Moran que os munic´ıpios s˜ao espacialmente correlacionados de maneira fraca. Por isso, fez-se necess´ario repensar o n´ıvel de agrega¸c˜ao a utilizar. Pˆode-se perceber que houve redu¸c˜ao no CMI de 2002 para 2010, onde a maior parte dos munic´ıpios tinha CMI acima de 17,8 crian¸cas mortas por mil nascidos vivos em 2002 e em 2010 grande parte dos munic´ıpios possu´ıam CMI abaixo de 17,8 ´obitos por mil nascidos vivos. Analisando os estados, pˆ ode-se obode-servar o mesmo resultado.

Considerando o n´ıvel de agrega¸c˜ao por microrregi˜oes, foi confirmada a correla¸c˜ao espacial, tanto atrav´es da matriz de proximidade por contiguidade quanto por vizinhos mais pr´oximos. Os modelos espaciais de 2002 e 2010 inclu´ıram as seguintes vari´aveis: taxa de desemprego, taxa de analfabetismo, PIB per capita e ´ındice de Gini. Pˆode-se verificar menor influˆencia das vari´aveis taxa de desemprego e taxa de analfabetismo no ano de 2010. Para a diferen¸ca entre as vari´aveis de 2002 e 2010, tamb´em foi observada correla¸c˜ao espacial, de maneira mais fraca. As vari´aveis explicativas do modelo espacial para esta diferen¸ca foram taxa de analfabetismo, taxa de natalidade e propor¸c˜ao de domic´ılios com coleta de lixo inadequada.

Foi poss´ıvel observar que, no per´ıodo de 2002 a 2010, houve mudan¸ca no CMI e nas vari´aveis que a influenciaram, al´em de mudan¸cas na disposi¸c˜ao de correla¸c˜ao espacial entre as microrregi˜oes, munic´ıpios e estados. Portanto, os resultados deste trabalho ajudaram na identifica¸c˜ao espacial das piores condi¸c˜oes de mortalidade infantil, apontando os grupos de microrregi˜oes que sofrem influˆencias de seus vizinhos. Desta forma, ´areas priorit´arias para investimento foram identificadas.

(6)

Dedicat´

oria

Dedico meu trabalho aos meus pais que sempre me apoiaram, a minha av´o Marieta que n˜ao me viu entrar na universidade, mas que de algum lugar especial est´a torcendo por mim e ao meu padrinho Luiz Carlos, que acompanhou a minha luta e agora est´a em um lugar melhor.

(7)

Agradecimentos

Agrade¸co a Deus por me dar for¸ca suficiente para chegar onde cheguei, pois foi uma longa jornada at´e aqui. Agrade¸co aos meus pais que sempre fizeram de tudo para me dar a melhor educa¸c˜ao, me apoiaram em todos os momentos e escolhas.

Agrade¸co as minhas amigas Carol, Ol´ıvia e Yasmin que entenderam as minhas ausˆencias devido aos estudos e torceram por mim a cada momento.

Agrade¸co a UFF, que me proporcionou um crescimento pessoal e a cria¸c˜ao de uma fam´ılia, sendo os integrantes dela Vanessa, Amanda, Larissa e principalmente Julio, que sempre me apoiaram. Convivemos ´otimos momentos de brincadeiras e risadas, mas tamb´em viramos noites estudando e nos desesperando com a Universidade.

Agrade¸co os meus colegas de trabalho do Centro de Hidrografia da Marinha (divis˜ao CHM-34), CF Paulo, CC Ca´ula, Tenente Val´eria, SO Gonzaga, SO Marinho, SO Ivan, SO Andrade, SO Jerri, SG J´ader, CB Kl´eber, CB Luciano, CB Priscila e SC Celso, que contribuiram bastante para meu crescimento pessoal e profissional, sendo um est´agio onde me fez muito feliz e foi um sonho realizado.

Agrade¸co as minhas colegas de rep´ublica, que me fizeram rir nos melhores e piores momentos. Transformaram- se em uma outra fam´ılia para mim.

Agrade¸co ao meu orientador da inicia¸c˜ao cient´ıfica Andr´e Brand˜ao com quem trabalhei por quase dois anos. Foi um aprendizado enorme para mim.

E para finalizar, agrade¸co aos professores, que sempre foram atenciosos e dedicados. E principalmente a minha orientadora, professora Ludmilla, que me ajudou bastante neste trabalho, sempre presente para o que eu precisasse.

(8)

Sum´

ario

Lista de Figuras

Lista de Tabelas

1 Introdu¸c˜ao p. 14

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil . . . p. 16

2 Objetivos p. 18

3 Material e M´etodos p. 19

3.1 Mortalidade Infantil . . . p. 19 3.2 An´alise de Regress˜ao . . . p. 22 3.2.1 Estimadores por M´ınimos Quadrados . . . p. 24 3.2.2 Estimadores por M´axima Verossimilhan¸ca . . . p. 25 3.2.3 M´etodo de quebra de requisitos . . . p. 25 3.2.3.1 Multicolinearidade . . . p. 25 3.2.4 Sele¸c˜ao do modelo . . . p. 26 3.2.4.1 M´etodo de sele¸c˜ao passo-a-passo . . . p. 26 3.2.5 Res´ıduos do modelo de regress˜ao . . . p. 27 3.3 Modelo Te´orico . . . p. 28 3.4 An´alise Espacial . . . p. 30 3.4.1 An´alise Explorat´oria . . . p. 30 3.4.1.1 Matriz de proximidade espacial ou matriz de vizinhan¸ca p. 30

(9)

3.4.1.2 ´Indice de Moran . . . p. 31 3.4.1.3 Indicadores Locais de Associa¸c˜ao Espacial - LISA . . . p. 33 3.4.1.4 Diagrama de espalhamento de Moran . . . p. 33 3.4.1.5 Box Map, Lisa Map e Moran Map . . . p. 34 3.4.2 Modelo SAR . . . p. 35 3.4.3 Modelo CAR . . . p. 36 3.4.4 Diagn´ostico de modelos com efeitos espaciais . . . p. 36 3.5 Limita¸c˜oes do trabalho . . . p. 38

4 Resultados p. 39

4.1 An´alise dos munic´ıpios e estados . . . p. 39 4.2 An´alise das microrregi˜oes . . . p. 50 4.2.1 Microrregi˜oes em 2002 e 2010 . . . p. 50 4.2.1.1 Modelo de regress˜ao linear . . . p. 50 4.2.1.2 An´alise espacial . . . p. 58

4.2.1.2.1 Matriz de vizinhan¸ca por contiguidade

. . . p. 58 4.2.1.2.2 Matriz de vizinhan¸ca por 6 vizinhos mais pr´oximos

. . . p. 64 4.2.2 An´alise da diferen¸ca entre 2002 e 2010 das microrregi˜oes . . . . p. 67 4.2.2.1 An´alise de regress˜ao . . . p. 67 4.2.2.2 An´alise espacial . . . p. 72

4.2.2.2.1 Matriz de vizinhan¸ca por contiguidade

. . . p. 72 4.2.2.2.2 Matriz de vizinhan¸ca por 6 vizinhos mais pr´oximos

. . . p. 73

(10)

Referˆencias p. 79

(11)

Lista de Figuras

1 Evolu¸c˜ao do CMI no Brasil segundo Grande Regi˜oes - 1930/2000 . . . . p. 17 2 Diagrama com as vari´aveis que influenciam no CMI . . . p. 28 3 Matriz de proximidade espacial . . . p. 31 4 Diagrama de espalhamento de Moran . . . p. 35 5 Mapa da classifica¸c˜ao dos munic´ıpios em 2002 e 2010 . . . p. 40 6 Mapa do CMI em 2002 e 2010 por munic´ıpio . . . p. 41 7 Mapa do CMI em 2002 e 2010 por estado . . . p. 42 8 Diagrama de espalhamento de 2002 e 2010 por 1 vizinhos . . . p. 44 9 Diagrama de espalhamento de 2002 e 2010 por 6 vizinhos . . . p. 45 10 Diagrama de espalhamento de 2002 e 2010 por 23 vizinhos . . . p. 46 11 Diagrama de espalhamento de 2002 e 2010 por estados . . . p. 48 12 Moran Map de 2002 e 2010 por estados . . . p. 49 13 CMI de 2002 e 2010 por microrregi˜ao . . . p. 51 14 Box Map do CMI em 2002 e 2010 por microrregi˜ao - matriz de contiguidade p. 60 15 Moran Map do CMI em 2002 e 2010 por microrregi˜ao - matriz de

conti-guidade . . . p. 61 16 Diferen¸ca do CMI . . . p. 68 17 Moran Map da diferen¸ca do CMI - matriz de contiguidade . . . p. 73 A.1 Box Map dos erros do modelo em 2002 e 2010 por microrregi˜ao . . . . p. 82 A.2 Moran Map dos erros do modelo em 2002 e 2010 por microrregi˜ao . . . p. 83 A.3 Box Map dos erros studentizados do modelo em 2002 e 2010 por

(12)

A.4 Moran Map dos erros studentizados do modelo em 2002 e 2010 por

mi-crorregi˜ao . . . p. 85 A.5 Moran Map dos erros do modelo da diferen¸ca . . . p. 86 A.6 Moran Map dos erros studentizados do modelo da diferen¸ca . . . p. 86

(13)

Lista de Tabelas

1 Distribui¸c˜ao do gasto social do governo federal por ´area de atua¸c˜ao em

2002 . . . p. 16 2 Classifica¸c˜ao dos munic´ıpios quanto `a qualidade dos dados . . . p. 39 3 Teste I de Moran de acordo com o n´umero de vizinhos . . . p. 43 4 Resumo descritivo das vari´aveis do modelo te´orico de 2002 e 2010 . . . p. 52 5 VIF das vari´aveis eliminadas de 2002 . . . p. 53 6 VIF das vari´aveis eliminadas de 2010 . . . p. 54 7 Etapas do ajuste do modelo de regress˜ao linear para o ano de 2002 . . p. 55 8 Etapas do ajuste do modelo de regress˜ao linear para o ano de 2010 . . p. 57 9 Teste I de Moran da microrregi˜ao - matriz de contiguidade . . . p. 58 10 Coeficientes estimados e respectivos valores de p dos modelos estimados

- CAR e SAR - matriz de contiguidade . . . p. 63 11 BIC e AIC dos modelos espaciais por ano - matriz de contiguidade . . . p. 64 12 Teste I de Moran - 6 vizinhos mais pr´oximos . . . p. 65 13 Coeficientes estimados e respectivos valores de p dos modelos estimados

- CAR e SAR - 6 vizinhos mais pr´oximos . . . p. 66 14 BIC e AIC dos modelos espaciais por ano - 6 vizinhos mais pr´oximos . p. 67 15 Resumo descritivo da diferen¸ca das vari´aveis do modelo te´orico . . . p. 69 16 VIF da diferen¸ca entre vari´aveis . . . p. 70 17 Etapas do ajuste do modelo de regress˜ao linear para diferen¸ca entre 2002

e 2010 . . . p. 71 18 I de Moran da diferen¸ca - matriz de contiguidade . . . p. 72 19 Modelo CAR e SAR da diferen¸ca entre 2002 e 2010 . . . p. 73

(14)

20 AIC e BIC do modelo da diferen¸ca - matriz de contiguidade . . . p. 73 21 I de Moran da diferen¸ca - 6 vizinhos mais pr´oximos . . . p. 74 22 Modelo CAR e SAR da diferen¸ca entre 2002 e 2010 - 6 vizinhos mais

pr´oximos . . . p. 74 23 AIC e BIC do modelo da diferen¸ca - 6 vizinhos mais pr´oximos . . . p. 74

(15)

14

1

Introdu¸

ao

Ao longo do tempo o Brasil sofreu diversas mudan¸cas em seus indicadores sociais que, consequentemente, interferiram no coeficiente de mortalidade infantil (CMI), que consiste no n´umero de ´obitos de menores de um ano, por mil nascidos vivos. Atrav´es do CMI estima-se o risco de morte de crian¸cas com at´e um ano de idade. Este ´e um indicador tanto socioeconˆomico como de sa´ude.[1]

Sempre se procurou melhorar a qualidade de vida da popula¸c˜ao e aumentar o desen-volvimento do pa´ıs, sendo isto diretamente ligado `a mortalidade infantil, pois, quando h´a boas condi¸c˜oes de saneamento b´asico, por exemplo, a chance do ´obito de uma crian¸ca ´e mais baixa do que se n˜ao houvesse saneamento b´asico. Quanto mais desenvolvido ´e o pa´ıs, espera-se que menor seja a taxa de mortalidade infantil. O CMI ´e um indicador sens´ıvel a mudan¸cas, pois crian¸cas com menos de um ano s˜ao extremamente sens´ıveis `a varia¸c˜oes ambientais e socioeconˆomicos.[1]

H´a uma preocupa¸c˜ao mundial para que haja a redu¸c˜ao desta taxa, tanto que na Ci-meira do Mil´enio, promovida pela Organiza¸c˜ao das Na¸c˜oes Unidas (ONU) e realizada de 6 a 8 de setembro de 2000, em Nova Iorque, foi aprovado o documento Declara¸c˜ao do Mil´enio, onde foram definidas metas do milˆenio, conhecidas como Objetivos de Desen-volvimento do Milˆenio (ODM), a serem alcan¸cadas at´e 2015. Foram estabelecidas oito metas, sendo uma delas reduzir em dois ter¸cos a mortalidade na infˆancia, que ´e a mor-talidade de crian¸cas menores de 5 anos. Foi dada como sugest˜ao fazer campanhas para conscientizar as pessoas, para mostrar como as vacinas podem ser ben´eficas para os bebˆes, como doen¸cas podem ser evitados atrav´es da higiene, a nutri¸c˜ao adequada para o bebˆe e a importˆancia do aleitamento materno. [2]

Algumas das vari´aveis que influenciam nesta taxa s˜ao a falta de estudo dos pais, ou seja, quanto maior a taxa de analfabetismo, maior a taxa de mortalidade; renda per capita; acesso a saneamento b´asico como ´agua e esgoto; gastos com sa´ude e com saneamento.[3]

(16)

1 Introdu¸c˜ao 15

O interesse desta monografia ´e analisar e comparar a taxa de mortalidade em dois momentos diferentes, a saber, ao fim do governo do ex-presidente Fernando Henrique Cardoso (FHC) e ao fim do governo do ex-presidente Luiz In´acio Lula da Silva (Lula). O intuito n˜ao ´e focar em qual governo foi melhor e sim nas diferen¸cas do CMI observadas nos dois momentos.

Fernando Henrique Cardoso assumiu a presidˆencia da rep´ublica no dia 1o. de Janeiro

de 1995 e ficou at´e 1o. de Janeiro de 2003, cumprindo dois mandatos. J´a o Lula presidiu de 1o. de Janeiro de 2003 a 1o. de Janeiro de 2011, tamb´em tendo dois mandatos. Ser´a

avaliado o conjunto dos 2 mandatos de cada presidente.

De acordo com dados divulgados pela Organiza¸c˜ao das Na¸c˜oes Unidas(ONU), no in´ıcio do Governo de FHC o CMI do Brasil era de 40,3 por mil nascidos vivos; ao final foi de 25,1 por mil nascidos vivos. Enquanto que no governo Lula, o CMI em 2003 era de 23,5 por mil nascidos vivos e, em 2010, passou para 14,6 por mil nascidos vivos.

Nesses dois per´ıodos existiram pol´ıticas para melhorar os indicadores sociais, por´em essas mudan¸cas se deram de maneira e intensidade diferentes. Neste sentido, seria inte-ressante avaliar a mortalidade infantil e os indicadores relacionados em diferentes n´ıveis de agrega¸c˜ao territorial, a fim de verificar a semelhan¸ca entre as regi˜oes do Brasil e se as pol´ıticas, em cada governo, privilegiaram algumas regi˜oes em detrimento de outras. Com isso pode-se sugerir locais onde, na devida ´epoca, seria necess´ario investir para que o CMI diminua.

O SUS (Sistema ´Unico de Sa´ude), um dos maiores sistemas de sa´ude p´ublica do mundo, foi criado em 1988 pela Constitui¸c˜ao Federal Brasileira e teve um importante papel nos mandatos do FHC e Lula. Na d´ecada de 1990 houve a implementa¸c˜ao deste sistema, que encontrou algumas dificuldades, como a abrangˆencia do territ´orio brasileiro e a heterogeneidade social e regional no pa´ıs.[4]

Alguns programas implementados durante o governo FHC para a melhoria das condi¸c˜oes populacionais foram: Bolsa-Alimenta¸c˜ao para fam´ılias com risco nutricional; Programa Sa´ude da Fam´ılia - Agentes Comunit´arios da Sa´ude; Piso de Aten¸c˜ao B´asica; Piso de Assistˆencia B´asica, entre outros. Os programas priorit´arios deste governo eram: Combate `

a Mortalidade Infantil e Sa´ude da Mulher. [4]

Na tabela 1 pode-se ver os gastos do governo em ´areas sociais. Gastou-se mais dinheiro com a previdˆencia social e sa´ude, com 65,8% e 12,8% dos gastos, respectivamente.[5]

(17)

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil 16

Tabela 1: Distribui¸c˜ao do gasto social do governo federal por ´area de atua¸c˜ao em 2002 ´

Area de atua¸c˜ao % Previdˆencia Social 65,8

Sa´ude 12,8

Assistˆencia Social 5,5 Educa¸c˜ao e cultura 5,3

Trabalho 5,1

Organiza¸c˜ao agr´aria 2,0 Habilita¸c˜ao e saneamento 0,6

Outros gastos 2,9

Fonte: Minist´erio da Fazenda

No governo Lula, um dos primeiros programas a serem implementados foi o Programa Fome Zero, cujo objetivo era de combater os problemas da fome. A inten¸c˜ao era a for-mula¸c˜ao de uma pol´ıtica de seguran¸ca alimentar e nutricional para a popula¸c˜ao.[5] Outras propostas de programas sociais seriam relativas a uma pol´ıtica de sa´ude bucal e acesso a medicamentos (ideia da farm´acia popular). [6] O Programa Bolsa-Fam´ılia, a principal caracter´ıstica do governo, foi um ajuste dos programas de transferˆencia de renda que existiam no governo FHC.[5] Em rela¸c˜ao ao SUS, o governo Lula foi respons´avel pela abrangˆencia do sistema, ou seja, pela cobertura do SUS na grande parte do territ´orio brasileiro.

1.1

Evolu¸

ao da mortalidade infantil no Brasil

At´e meados da d´ecada 1940, a taxa de mortalidade era alta em todo o mundo, devido `

a guerra, `a fome e a doen¸cas existentes. No entanto, ap´os a Segunda Guerra Mundial, houve uma revolu¸c˜ao na sa´ude p´ublica, com a implementa¸c˜ao de avan¸cos m´edicos, como o antibi´otico.[7] Com isso, as taxas de mortalidade come¸caram a declinar de forma r´apida, inclusive a taxa de mortalidade infantil, havendo uma diminui¸c˜ao no ritmo da queda da taxa de mortalidade nos anos 60.

A partir de meados dos anos 70, o governo brasileiro passou a implementar algu-mas medidas, como saneamento b´asico, programas de sa´ude materno-infantil, imuniza¸c˜ao e amplia¸c˜ao da oferta de servi¸cos m´edico-hospitalares descentralizados, que levaram o aumento da sobrevida da popula¸c˜ao como um todo. J´a d´ecada de 80 houve uma inten-sifica¸c˜ao na redu¸c˜ao da mortalidade infantil com a jun¸c˜ao dos resultados dos programas implementados na d´ecada anterior com a mudan¸ca nos padr˜oes reprodutivos, e a conse-quente redu¸c˜ao na taxa de fecundidade.[7]

(18)

1.1 Evolu¸c˜ao da mortalidade infantil no Brasil 17

Segundo a Organiza¸c˜ao Mundial da Sa´ude (OMS), a taxa aceit´avel para o CMI ´e de 10 ´obitos por mil nascidos vivos. Atualmente a taxa de mortalidade infantil no Brasil ainda n˜ao chegou ao n´ıvel ideal, no entanto, continua em constante queda.[8]

Na figura 1 pode-se ver a evolu¸c˜ao do CMI entre os anos de 1930 e 2000, no Brasil e nas Regi˜oes Geogr´aficas brasileiras. Houve uma grande redu¸c˜ao do CMI, passando de 162,4 ´obitos, em 1930, para 29,6 ´obitos por mil nascidos vivos em 2000.

Em 1930 o CMI da regi˜ao Norte e Nordeste eram bem pr´oximos, 193,3 e 193,2 ´obitos por mil nascidos vivos, respectivamente. No entanto, no ano 2000, pode-se perceber grande diferen¸ca entre as duas regi˜oes, sendo 28,6 ´obitos por mil nascidos vivos na regi˜ao Norte e 43,0 ´obitos por mil nascidos vivos na regi˜ao Nordeste. No mesmo ano a regi˜ao Sudeste e Centro-Oeste possu´ıam CMI pr´oximos.

Figura 1: Evolu¸c˜ao do CMI no Brasil segundo Grande Regi˜oes - 1930/2000

Fonte: Evolu¸c˜ao e Perspectivas da Mortalidade Infantil no Brasil, IBGE

O trabalho est´a disposto com a seguinte estrutura: no cap´ıtulo 2 ser˜ao apresentados os objetivos desta monografia; no cap´ıtulo 3 a metodologia adotada para as an´alises; no cap´ıtulo 4 os resultados; no cap´ıtulo 5 a conclus˜ao. Ao final est˜ao colocadas as referˆencias bibliogr´aficas e, por fim, os anexos.

(19)

18

2

Objetivos

O objetivo geral do trabalho ´e avaliar espacialmente a mortalidade infantil e vari´aveis associadas, em dois per´ıodos distintos, ou seja: verificar se a taxa de mortalidade infantil de uma determinada ´area ´e influenciada por seus vizinhos e identificar quais caracter´ısticas est˜ao relacionadas e afetam diretamente a varia¸c˜ao da taxa no tempo.

Os objetivos espec´ıficos s˜ao:

• Classificar os munic´ıpios quanto `a qualidade dos dados dos sistemas de informa¸c˜ao, ou seja: verificar se os dados condizem com a realidade ou se est˜ao super ou subes-timados;

• Analisar a dependˆencia espacial do CMI em diferentes n´ıveis de agrega¸c˜ao dos dados, a saber: munic´ıpio, Unidade da Federa¸c˜ao e Microrregi˜oes definidas pelo IBGE; • Ajustar um modelo de regress˜ao espacial m´ultipla para 2002 e, depois, 2010, para

que possa fornecer as melhores estimativas do CMI atrav´es do uso de vari´aveis explicativas associadas ao contexto do problema;

• Ajustar um modelo de regress˜ao espacial m´ultipla para a diferen¸ca do CMI, entre os anos de 2002 e 2010 (CMI em 2002 menos CMI em 2010), utilizando tamb´em a diferen¸ca entre as vari´aveis explicativas.

(20)

19

3

Material e M´

etodos

3.1

Mortalidade Infantil

Existem alguns ´org˜aos do governo respons´aveis pela coleta, apura¸c˜ao e divulga¸c˜ao dos dados sobre a mortalidade infantil no Brasil. Um deles ´e o IBGE (Instituto Brasileiro de Geografia e Estat´ıstica), que divulga tais informa¸c˜oes, anualmente, atrav´es da publica¸c˜ao “Estat´ısticas do Registro Civil”, desde 1974, e tendo como principal objetivo a contagem de registros de nascimentos e ´obitos.[9] Outro ´e a Secretaria de Vigilˆancia em Sa´ude, do Minist´erio da Sa´ude, que gerencia o SIM (Sistema de Informa¸c˜ao sobre Mortalidade) e o SINASC (Sistema de Informa¸c˜ao sobre Nascidos Vivos).[10]

O SIM, criado em 1976, tem como principal objetivo divulgar informa¸c˜oes para tra¸car um perfil sobre a mortalidade. Seus dados s˜ao obtidos atrav´es da Declara¸c˜ao de ´Obito. O SINASC, implantado em 1992, coleta informa¸c˜oes sobre as condi¸c˜oes de nascimentos no pa´ıs. Seus dados s˜ao obtidos atrav´es da Declara¸c˜ao de Nascidos Vivos. Atrav´es dele pode-se obter informa¸c˜oes sobre natalidade, morbidade, mortalidade infantil e da m˜ae, e caracter´ısticas do parto.[11]

Dados do SIM e do SINASC podem ser obtidos atrav´es do DATASUS, que ´e o depar-tamento de inform´atica do SUS (Sistema ´Unico de Sa´ude). Ele faz parte da Secretaria de Gest˜ao Estrat´egica e Participativa e tem como responsabilidade coletar, processar e divulgar informa¸c˜oes sobre a Sa´ude.[12]

Os indicadores de sa´ude expressam o n´ıvel de bem-estar de um determinado grupo. S˜ao ´uteis para identificar problemas de sa´ude p´ublica, falhas e elabora¸c˜ao de pol´ıticas voltadas para a ´area em estudo. O CMI pode ser considerado tanto um indicador de sa´ude como um indicador demogr´afico, sendo sens´ıvel a varia¸c˜oes das condi¸c˜oes de vida e sa´ude da popula¸c˜ao. Atrav´es dele ´e poss´ıvel avaliar o crescimento populacional, a desigualdade e a sa´ude de determinada regi˜ao.

(21)

3.1 Mortalidade Infantil 20

O CMI estima o risco de crian¸cas at´e 1 ano morrerem. ´E calculado com base no n´umero de ´obitos de crian¸cas com at´e 1 ano de idade. Atrav´es dele, pode-se avaliar as condi¸c˜oes socioeconˆomicas, ambientais e n´ıveis de sa´ude da m˜ae e da crian¸ca. Tamb´em ´e utilizado para analisar varia¸c˜oes populacionais e geogr´aficas.

Al´em de calcular o CMI para o grupo geral de crian¸cas at´e 1 ano de idade, pode-se avali´a-lo em subgrupos de idade como: neonatal e p´os-neonatal. A mortalidade neonatal compreende crian¸cas com at´e 28 dias e a p´os-neonatal entre o 28o dia e 1 ano de vida. A mortalidade p´os-neonatal se d´a geralmente por fatores socioambientais enquanto a neonatal por quest˜oes m´edicas e gestacionais.

Existem duas formas para o c´alculo do CMI: a forma direta e a indireta. A forma direta ´e dada pela seguinte express˜ao:

CM I = n´umero de ´obitos de residentes com menos de um ano de vida

n´umero de nascidos vivos de m˜ae residente ∗ 1000 (3.1) Devido aos casos de subnotifica¸c˜ao, n˜ao recomenda-se a utiliza¸c˜ao do m´etodo direto para o c´alculo, pois o resultado n˜ao estar´a de acordo com a realidade. Para verificar qual o m´etodo mais adequado para o c´alculo da CMI, avalia-se os seguintes indicadores[9]:

• Coeficiente Geral de Mortalidade Padronizado por Idade (CGMPI): n´umero total de ´obitos por mil habitantes da popula¸c˜ao em estudo, em um determinado per´ıodo, entendendo o conceito do Coeficiente Geral de Mortalidade (CGM) que pode ser afetado pela estrutura et´aria da popula¸c˜ao em estudo. Atrav´es deste indicador pode-se identificar falhas em informa¸c˜oes de registros de ´obitos. Se apresentar um valor abaixo de 4, pode-se deduzir que h´a precariedade na cobertura das informa¸c˜oes de mortalidade. Esta padroniza¸c˜ao foi feita tomando como base a popula¸c˜ao do ano 2002. Ou seja, padronizou-se o CMI de 2010 considerando como padr˜ao o ano de 2002. Para a padroniza¸c˜ao ver o livro Epidemiologia, do Medronho.[13]

• Desvio m´edio relativo do Coeficiente Geral de Mortalidade (DMCGM): m´edia aritm´etica dos valores absolutos dos desvios do CGM, em rela¸c˜ao ao CGM m´edio ao longo dos anos.

DM CGM = |CGMt0− CGM M ED| + |CGMt1− CGM M ED| + ... + |CGMtn− CGM M ED| n ∗ CGM M ED

(22)

3.1 Mortalidade Infantil 21

Onde:

CGM M ED = CGMt0+ CGMt1+ ... + CGMtn

n (3.3)

Valores acima de 10% s˜ao considerados cr´ıticos, ou seja, fora do padr˜ao.

• Taxa de natalidade (TN): raz˜ao entre o n´umero de nascidos vivos e a popula¸c˜ao total em estudo.

T N = n´umero de nascidos vivos

total da popula¸c˜ao (3.4)

• Desvio m´edio relativo da taxa de natalidade (DMTN): m´edia aritm´etica dos valores absolutos dos desvios m´edios das taxas de natalidade em rela¸c˜ao `a taxa m´edia de natalidade no per´ıodo estudado.

DM T N = |T Nt0− T N M ED| + |T Nt1− T N M ED| + ... + |T Ntn− T N M ED| n ∗ T N M ED

(3.5) Onde:

T N M ED = T Nt0+ T Nt1+ ... + T Ntn

n (3.6)

Valores acima de 10% s˜ao considerados cr´ıticos.

• Propor¸c˜ao de ´obitos em menores de um ano sem defini¸c˜ao da causa b´asica: propor¸c˜ao de ´obitos classificados em “sintomas, sinais e achados anormais de exames cl´ınicos e de laborat´orios n˜ao classificados em outra parte”. Esse indicador foi utilizado por expressar as irregularidades nas informa¸c˜oes de ´obito. Valores acima de 20% s˜ao considerados excessivos.

Com esses indicadores calculados classificam-se os munic´ıpios nas seguintes catego-rias:

• Adequado nas informa¸c˜oes de nascimentos e ´obitos: quando o coeficiente geral de mortalidade padronizado por idade ´e maior que 6,75 por 1000 habitantes, a taxa de natalidade ´e maior que 16 por 1000 habitantes, desvio m´edio relativo do CGM menor do que 10%, desvio m´edio relativo da taxa de natalidade menor que 10% e propor¸c˜ao de ´obitos mal definidos menor que 20%;

(23)

3.2 An´alise de Regress˜ao 22

• Parcialmente adequado: n˜ao satisfaz algum dos crit´erios, ou seja, pelo menos um dos indicadores est´a na faixa cr´ıtica e o CGM padronizado por idade ´e maior a 4 por 1000 habitantes;

• Inadequado (grande deficiˆencia nas informa¸c˜oes de ´obitos): quando o CGM padro-nizado por idade ´e menor que 4 por mil habitantes, ou seja, n˜ao h´a informa¸c˜ao sobre ´

obito para a maior parte da popula¸c˜ao.

Para os munic´ıpios considerados adequados, pode-se calcular de forma direta o CMI. Para o restante, calcula-se pelo m´etodo indireto, que consiste em multiplicar-se o CMI, achado pela forma direta, pela taxa estimada pelo IBGE.

Neste estudo o interesse ´e analisar todos os mun´ıcipios brasileiros em dois anos: 2002 e 2010. Atualmente o Brasil ´e constitu´ıdo de 5570 munic´ıpios, no entanto, em 2002 eram 5560 e em 2010 eram 5565, ent˜ao, as an´alises s˜ao baseadas nos 5565 munic´ıpios de 2010. Para os munic´ıpios Aroeiras do Itaim, Naz´aria, Figueir˜ao, Ipiranga do Norte e Itanhang´a que n˜ao existiam em 2002 foi considerado o CMI dos munic´ıpios aos quais eles pertenciam originalmente.

Para calcular os indicadores citados acima, foi necess´ario obter a quantidade de nas-cidos vivos (2002 e 2010), ´obitos infantis e gerais (2002 e 2010), ´obitos por faixa et´aria (2010), popula¸c˜ao residente por faixa et´aria (2002 e 2010), popula¸c˜ao residente (2002 e 2010), ´obitos sem defini¸c˜ao da causa b´asica (2002 e 2010). Todos esses dados foram obtidos atrav´es do DATASUS. Os ´obitos sem defini¸c˜ao da causa b´asica foram definidos atrav´es da CID-101.

3.2

An´

alise de Regress˜

ao

Uma ferramenta utilizada para descrever matematicamente as rela¸c˜oes entre vari´aveis ´e o modelo de regress˜ao. Atrav´es da an´alise de regress˜ao pode-se estimar o melhor modelo que se ajuste aos dados, ou seja, uma rela¸c˜ao entre as vari´aveis independentes e a vari´avel dependente. Neste trabalho a vari´avel dependente ´e o CMI. O desafio ´e descobrir quais vari´aveis independentes s˜ao significativas para explicar a varia¸c˜ao do CMI. Neste caso, ser´a utilizado o modelo de regress˜ao linear m´ultipla. A suposi¸c˜ao b´asica do modelo de regress˜ao linear ´e que a m´edia da distribui¸c˜ao de y varia de forma linear com x.[14]

1”A CID-10 foi conceituada para padronizar e catalogar as doen¸cas e problemas relacionados `a sa´ude,

tendo como referˆencia a Nomenclatura Internacional de Doen¸cas, estabelecida pela Organiza¸c˜ao Mundial de Sa´ude.”(Fonte:DATASUS)

(24)

3.2 An´alise de Regress˜ao 23

O modelo de regress˜ao linear m´ultipla ´e o modelo que define uma rela¸c˜ao estat´ıstica2 linear entre a vari´avel dependente y e as p-1 vari´aveis independentes: x1,x2,...,xp−1. A

associa¸c˜ao entre as vari´aveis independentes e a vari´avel dependente ´e dada pela seguinte equa¸c˜ao[15]:

yi = β0+ β1x1,i+ β2x2,i+ ... + βp−1xp−1,i+ εi, i = 1, 2, ..., n (3.7)

Onde:

• yi ´e a vari´avel dependente na i-´esima observa¸c˜ao;

• β0s s˜ao os coeficientes do modelo de regress˜ao;

• x0s s˜ao as vari´aveis independentes;

• p − 1 ´e o n´umero de vari´aveis independentes; • n ´e a quantidade de observa¸c˜oes;

• εi ´e o erro do modelo, e sup˜oe-se que εi ∼ N (0, σ2) e COV (εi, εj) = 0, para i 6= j.

Supondo que os erros s˜ao normais, pode-se mostrar que a vari´avel dependente/resposta Y tamb´em segue distribui¸c˜ao normal e pode ser descrita da seguinte forma matricial[14]:

y = βX + ε (3.8)

Onde ε = σ2Z, sendo Z um vetor de n vari´aveis aleat´orias independentes e iden-ticamente distribu´ıdas com distribui¸c˜ao N (0, 1). Ou seja, ε ´e um vetor aleat´orio com distribui¸c˜ao normal n-variada com vetor de m´edias 0 e matriz de covariˆancia σ2I, isto ´e,

ε ∼ Nn(µ = 0, Σ = σ2I).[14]

Na equa¸c˜ao 3.8 tem-se:

• n ´e o n´umero de observa¸c˜oes; • p ´e o n´umero de parˆametros;

• X ´e matriz nxp com os valores das vari´aveis independentes;

2a rela¸ao estat´ıstica entre duas vari´aveis x e y se para um determinado valor de x existir mais de

um valor de y, ou seja, dado um valor de x definimos a probabilidade de y assumir determinados valores. Esta rela¸c˜ao n˜ao ´e perfeita, mesmo conhecendo o valor de x n˜ao sabe-se o valor exato de y.

(25)

3.2 An´alise de Regress˜ao 24

• β ´e o vetor de dimens˜ao p de parˆametros; • y ´e vetor da vari´avel dependente de tamanho n; • ε ´e vetor aleat´orio de tamanho n.

A estima¸c˜ao dos coeficientes β’s no modelo m´ultiplo pode ser realizado de duas ma-neiras: por m´ınimos quadrados ou por m´axima verossimilhan¸ca.

3.2.1

Estimadores por M´ınimos Quadrados

O estimador para β por m´ınimos quadrados ´e aquele que minimiza a soma dos qua-drados dos erros εi.[16]

A soma dos quadrados dos erros pode ser definida por:

Q = εTε = n X i=1 ε2i = n X i=1

(yi− β0− β1xi,1− β2xi,2− ... − βp−1xi,p−1)2 (3.9)

Escrevendo Q em nota¸c˜ao matricial, tem-se: Q = εTε =

n

X

i=1

ε2i = (y − Xβ)T(y − Xβ) = yTy − yTXβ − βTXTy + βTXTXβ (3.10)

Como βTXTy ´e um escalar, ou seja, tem dimens˜ao 1x1, ´e igual ao seu transposto. Logo, tem-se a express˜ao 3.11:

Q(β) = yTy− 2βTXTy + βTXTXβ (3.11)

Para achar o estimador de β por m´ınimos quadrados precisa-se encontrar os pontos β que minimizam Q e, para isso, deriva-se Q em rela¸c˜ao a β e iguala este resultado a zero obtendo a seguinte express˜ao:

ˆ

(26)

3.2 An´alise de Regress˜ao 25

3.2.2

Estimadores por M´

axima Verossimilhan¸

ca

Neste trabalho assumiu-se que o CMI tem distribui¸c˜ao Normal, ent˜ao, para achar o estimador por m´axima verossimilhan¸ca, ´e necess´ario maximizar a fun¸c˜ao de verossimi-lhan¸ca, definida pela express˜ao:

L(β, σ2) = n Y i=1 fyi(yi|β0, β1, σ 2) = 1 2πσ2e − 1 2σ2 n P i=1 (yi−β0−β1xi,1+...+βp−1xi,p−1) = √ 1 2πσ2e − 1 2σ2ε Tε (3.13) Pensando em L somente como fun¸c˜ao de β verifica-se que maximizar L ´e o mesmo que minimizar εTε, logo, tem-se a mesma situa¸c˜ao que o problema de m´ınimos quadrados.

Com isso, os estimadores encontrados pelos dois m´etodos coincidem.

3.2.3

etodo de quebra de requisitos

Antes de realizar a sele¸c˜ao do modelo que melhor se ajusta aos dados, ´e necess´ario realizar a an´alise de multicolinearidade.

3.2.3.1 Multicolinearidade

Pode-se dizer que h´a existˆencia de multicolinearidade quando uma ou mais vari´aveis explicativas est˜ao bem correlacionadas entre si. Isto pode ocasionar estimadores pouco precisos e incertezas nas inferˆencias, pois pequenas mudan¸cas observadas na vari´avel res-posta influenciariam muito as estimativas dos coeficientes do modelo. Uma das maneiras poss´ıveis de identificar a presen¸ca de multicolinearidade ´e atrav´es do Fator de Infla¸c˜ao de Variˆancia (VIF - Variance Inflaction Factor ) da vari´avel resposta. O VIF pode ser defi-nido pelos elementos da diagonal principal de C∗ = (X∗TX∗)−1, onde X∗ ´e uma matriz do modelo cujas vari´aveis independentes e vari´avel resposta s˜ao definidas por[14]:

x∗i,k = r xi,k− xk n P i=1 (xi,k − xk)2 e y∗i = r y − y n P i=1 (yi− y)2 (3.14) Onde:

• i ´e quantidade de observa¸c˜oes

(27)

3.2 An´alise de Regress˜ao 26

Se uma vari´avel for bem correlacionada com as demais, o valor do VIF ser´a alto. No caso deste trabalho, valores considerados alto ser˜ao VIFs maiores que 5.[17] Para solucionar a multicolinearidade uma op¸c˜ao ´e remover a vari´avel que possui o maior valor do VIF (se acima de 5) e refazer o c´alculo do VIF com as vari´aveis restantes. Faz-se este processo at´e que n˜ao haja nenhuma vari´avel com VIF maior que 5.

3.2.4

Sele¸

ao do modelo

Ap´os corrigida a multicolinearidade do modelo, pode-se ajustar o modelo de regress˜ao. Para isto ´e necess´ario verificar quais vari´aveis independentes influenciam na vari´avel res-posta. Um m´etodo muito utilizado para conjunto de dados com muitas vari´aveis ´e o m´etodo de sele¸c˜ao passo-a-passo. Dentro deste m´etodo h´a duas vertentes, o m´etodo da inclus˜ao progressiva e o m´etodo da elimina¸c˜ao progressiva.[14]

Define-se alfa (α) como o n´ıvel de significˆancia de um teste de hip´otese, sendo o erro do tipo I, ou seja, probabilidade de rejeitar a hip´otese nula do teste (H0), dado que H0 ´e

verdadeira.

Para que seja feito um modelo de regress˜ao linear, ´e necess´ario que os dados sigam a distribui¸c˜ao normal. No caso dos dados a serem utilizados, como h´a uma grande quanti-dade de observa¸c˜oes, pode-se dizer que os dados possuem aproximadamente distribui¸c˜ao normal.

Neste trabalho ser´a aplicado o m´etodo da elimina¸c˜ao progressiva, cujo o processo est´a descrito abaixo.

3.2.4.1 M´etodo de sele¸c˜ao passo-a-passo

Passo 1) Ajustar o modelo linear completo com todas as vari´aveis respostas e deter-minar o valor p do teste t para todas as vari´aveis independentes;

Passo 2) Se todos os valores de p forem menores que α, n˜ao retira-se nenhuma vari´avel e o processo ´e finalizado. Caso contr´ario, elimina-se a vari´avel com o maior valor p;

Passo 3) Ajustar um novo modelo sem a vari´avel eliminada no passo anterior e deter-minar o valor p do teste t para cada vari´avel independente;

Passo 4) Se todos os valores de p forem menores que α, n˜ao retira-se nenhuma vari´avel e o processo ´e finalizado. Caso contr´ario, elimina-se a vari´avel com o maior valor p.

(28)

3.2 An´alise de Regress˜ao 27

Este processo continua at´e que todos os valores de p do teste t sejam menores ou iguais a α.

3.2.5

Res´ıduos do modelo de regress˜

ao

Depois de ajustado o modelo linear m´ultiplo deve-se verificar a correla¸c˜ao espacial dos res´ıduos, sendo este definido atrav´es da seguinte express˜ao:

ei = yi− ˆyi (3.15)

´

E mais comum trabalhar com uma padroniza¸c˜ao dos res´ıduos ao inv´es dos pr´oprios res´ıduos. Essa padroniza¸c˜ao leva ao res´ıduo padronizado e ´e definida por:

e∗i = e√i− E[ei] M SE = yi− ˆyi √ M SE (3.16) Onde: M SE = n P i=1 (yi− ˆyi)2 n − 1 (3.17) Na nota¸c˜ao matricial: e∗ = √ e M SE = y − ˆy √ M SE (3.18)

Outra forma comum de utilizar os erros ´e atrav´es dos erros studentizados e ´e definido da seguinte forma: r∗i = ei− E[ei] pMSE(1 − hi,i) = yi− ˆyi pMSE(1 − hi,i) (3.19) Onde:

• hi,i ´e o i-´esimo elemento da diagonal principal da matriz H

A matriz H ´e definida da seguinte forma:

(29)

3.3 Modelo Te´orico 28

Os res´ıduos studentizados tem variˆancias constantes, V ar(ri) = 1, o que torna muito

pr´atica a procura por outliers, que s˜ao observa¸c˜oes distantes das demais, por isso ´e bas-tante utilizado.

3.3

Modelo Te´

orico

Segundo a literatura, alguns dos fatores que influenciam na mortalidade infantil s˜ao: a existˆencia ou n˜ao de servi¸cos de sa´ude, como hospitais e saneamento b´asico pr´oximo aos domic´ılios. Espera-se que, quanto maior renda per capita e n´ıvel de educa¸c˜ao da popula¸c˜ao, menor seja o CMI e quanto maior a taxa de desemprego maior seja o CMI.

Na figura 2 s˜ao apresentadas poss´ıveis vari´aveis que influenciam diretamente no CMI e que podem ser incorporadas ao modelo de regress˜ao. [18] [3] [19] [20]

(30)

3.3 Modelo Te´orico 29

Estas vari´aveis foram obtidas da seguinte forma:

• CMI foi obtido atrav´es do c´alculo pela forma direta entre o n´umero de nascidos vivos e ´obitos por mil nascidos vivos;

• Propor¸c˜ao de partos domiciliares foi obtido pela raz˜ao entre a quantidade de partos domiciliares e o total de partos, por mil habitantes;

• Taxa de desemprego ´e a propor¸c˜ao de indiv´ıduos capazes de exercer um profiss˜ao por´em n˜ao est˜ao no mercado de trabalho. Neste caso n˜ao tem-se os dados de 2002, ent˜ao utilizou-se os dados de 2000, do censo;

• Taxa de analfabetismo ´e a propor¸c˜ao de pessoas que n˜ao sabem ler e escrever em uma faixa et´aria com rela¸c˜ao ao total de pessoas da mesma faixa et´aria. Neste caso n˜ao tem-se os dados de 2002, ent˜ao utilizou-se os dados de 2000, do censo;

• Renda domiciliar per capita ´e a soma dos rendimentos mensais dos moradores do domic´ılio dividido pela quantidade de moradores. Neste caso n˜ao tem-se os dados de 2002, ent˜ao utilizou-se os dados de 2000, do censo;

• PIB (Produto Interno Bruto) ´e a soma de todos os bens e servi¸cos finais produzidos, em valores monet´arios;

• PIB per capita ´e o PIB dividido pela quantidade de habitantes. Mede quanto do total conv´em a cada habitante, se fosse dividido em partes iguais;

• Propor¸c˜ao de domic´ılios que o lixo era tratado da seguinte forma: queimado (na propriedade), enterrado (na propriedade), jogado em terreno baldio ou logradouro, jogado em rio, lago ou mar e outro destino, que foi obtido pela raz˜ao entre esses domic´ılios e o total de domic´ılios, por mil domic´ılios. Neste caso n˜ao tem-se os dados de 2002, ent˜ao pegou-se os dados de 2000, do censo;

• Propor¸c˜ao de domic´ılios que possu´ıam as seguintes instala¸c˜oes sanit´arias: fossa s´eptica, fossa rudimentar, vala, rio, lago ou mar, outro escoadouro, n˜ao sabe o tipo de escoadouro e n˜ao tem instala¸c˜ao sanit´aria, obtido atrav´es da raz˜ao da quantidade desses domic´ılios e o total domic´ılios, por mil domic´ılios. Neste caso n˜ao tem-se os dados de 2002, ent˜ao pegou-se os dados de 2000, do censo;

• Taxa de fecundidade ´e a estimativa do n´umero m´edio de filhos que uma mulher teria em todo seu per´ıodo reprodutivo;

(31)

3.4 An´alise Espacial 30

• Taxa de natalidade ´e o n´umero de nascidos vivos a cada mil habitantes;

• ´Indice Gini ´e uma medida de desigualdade social, que varia entre zero e um, onde zero representa a completa igualdade e um representa completa desigualdade. Neste trabalho, este ´ındice foi obtido atrav´es da mediana do ´ındice de Gini dos munic´ıpios pertencentes a cada microrregi˜ao. Neste caso n˜ao tem-se os dados de 2002, ent˜ao pegou-se os dados de 2000, do censo.

N˜ao foi poss´ıvel obter a vari´avel sobre o acesso de ´agua. Todos esses dados foram encontrados no site do DATASUS.

3.4

An´

alise Espacial

3.4.1

An´

alise Explorat´

oria

An´alise espacial ´e o estudo quantitativo de fenˆomenos alocados no espa¸co. Atrav´es dela pode-se verificar se determinada caracter´ıstica de interesse ´e influenciada pela sua vizinhan¸ca, ou seja, se existe dependˆencia espacial. A an´alise de dados espaciais ´e aplicada em situa¸c˜oes onde se disp˜oem de dados observados a partir de algum sistema que opera no espa¸co.[21] Podem ser encontrados trˆes tipos de dados: dados de padr˜ao de pontos, dados espacialmente cont´ınuos e dados de ´area.

Neste trabalho foi realizada a an´alise de dados espaciais de ´area. Estes s˜ao dados rela-cionados com unidades delimitadas, ou seja, dados relarela-cionados com um mapa geogr´afico, por exemplo, dados do censo. Neste caso n˜ao ´e de interesse o local exato da ocorrˆencia e sim os dados agregado por ´area.

Para verificar se existe uma dependˆencia espacial entre os dados, calcula-se a auto-correla¸c˜ao espacial, onde a correla¸c˜ao ´e medida para a mesma vari´avel, mas de lugares diferentes. Existem alguns m´etodos para verificar a existˆencia desta autocorrela¸c˜ao, e todos eles utilizam um fator em comum, que ´e a matriz de vizinhan¸ca ou proximidade espacial.

3.4.1.1 Matriz de proximidade espacial ou matriz de vizinhan¸ca

A matriz de proximidade espacial ´e uma ferramenta b´asica na avalia¸c˜ao da autocor-rela¸c˜ao espacial. Esta matriz ´e definida como W (nxn), onde n ´e a quantidade de ´areas e cada elemento wij representa uma medida de distˆancia entre a ´area i e a ´area j. Esta

(32)

3.4 An´alise Espacial 31

medida pode ser calculada atrav´es da distˆancia entre os centroides, da existˆencia de fron-teiras ou comprimento das fronfron-teiras[22]. Os elementos da diagonal wij s˜ao zero, enquanto

os elementos wij apontam a forma qua a ´area i est´a relacionada espacialmente com a ´area

j. Alguns dos crit´erios utilizados na matriz W s˜ao[23] :

• wij=1, se o centro da ´area i est´a a uma determinada distˆancia da ´area j, 0 caso

contr´ario;

• wij=1, se a ´area i faz fronteira com a regi˜ao j, 0 caso contr´ario;

• wij=1/d, em que d ´e a distˆancia entre os centros da ´area i e j.

´

E poss´ıvel atribuir peso `as proximidades encontradas. As possibilidades s˜ao:

• Sem peso: todos os objetos est˜ao pr´oximos com o mesmo peso; • Distˆancia inversa;

• Distˆancia inversa ao quadrado.

Muitas vezes se usa a matriz de vizinhan¸ca normalizada pelo n´umero de vizinhos por linha, como na figura 3, onde tem-se um exemplo de uma matriz de proximidade espacial normalizada para cinco ´areas, sendo considerados vizinhos por contiguidade. [23]

Figura 3: Matriz de proximidade espacial

Neste trabalho foi considerado na matriz de proximidade espacial os vizinhos por contiguidade, ou seja, que compartilham fronteira, e por vizinhos mais pr´oximos.

3.4.1.2 ´Indice de Moran

O ´Indice de Moran, tamb´em conhecido como I de Moran, ´e a medida mais utilizada para verificar a dependˆencia espacial, atrav´es do produto dos desvios em rela¸c˜ao a m´edia.

(33)

3.4 An´alise Espacial 32

Na equa¸c˜ao 3.21, o c´alculo do I de Moran leva em considera¸c˜ao apenas o primeiro vi-zinho, ou seja, o vizinho de primeira ordem. Neste caso, utiliza-se os vizinhos diretamente ligados a ´area em estudo. [24]

I = n P i=1 n P j=1 wij(zi− z)(zj − z) n P i=1 (zi− z)2 , para i 6= j (3.21) Onde:

• n ´e a quantidade de observa¸c˜oes;

• zi e zj ´e o valor do CMI da ´area i e na ´area i, respectivamente;

• z ´e o valor m´edio do CMI na regi˜ao de estudo;

• wij ´e o elemento da matriz normalizada de proximidade espacial para o par i e j.

A equa¸c˜ao 3.22 ´e uma generaliza¸c˜ao da equa¸c˜ao 3.21, onde k ´e a ordem da vizinhan¸ca. Quando k=2,considera-se na matriz de vizinhan¸ca o vizinho do vizinho, sendo matriz de segunda ordem. I(k)= n ∗ n P i=1 n P j=1 wij(k)(zi− z)(zj − z) n P i=1 (zi− z)2 , para i 6= j (3.22)

O I de Moran varia de -1 a 1. Quanto mais pr´oximo de 0, indica a independˆencia espacial. Se for pr´oximo de 1 existe correla¸c˜ao positiva e se for pr´oximo de -1 existe correla¸c˜ao negativa. O teste realizado para verificar a correla¸c˜ao entre as ´areas ´e o teste de Moran, onde as hip´oteses s˜ao:

(

H0 : I = 0, ou seja, n˜ao existe autocorrela¸c˜ao espacial entre as ´areas;

H1 : I 6= 0, ou seja, existe autocorrela¸c˜ao espacial entre pelo menos 2 das ´areas.

Para a valida¸c˜ao estat´ıstica do teste ´e necess´ario associar o ´ındice a uma distribui¸c˜ao, sendo mais frequente a distribui¸c˜ao normal. Baseado na distribui¸c˜ao assint´otica do I de Moran, no entanto o mais usual ´e fazer o teste de pseudo-significˆancia, onde s˜ao geradas diferentes permuta¸c˜oes dos valores de atributos associados `as regi˜oes. Cada permuta¸c˜ao produz um novo arranjo espacial, onde os valores est˜ao redistribu´ıdos entre as ´areas. Se

(34)

3.4 An´alise Espacial 33

o valor observado corresponder a um ”extremo”da distribui¸c˜ao simulada, ent˜ao trata-se de valor com significˆancia estat´ıstica[24].

Outras formas de identificar a dependˆencia espacial s˜ao a Estat´ıstica Espacial Local ou Indicadores Locais de Associa¸c˜ao Espacial (LISA), Moran Map, Box Map e o Lisa Map.

3.4.1.3 Indicadores Locais de Associa¸c˜ao Espacial - LISA

O I de Moran ´e um ´ındice global, onde obt´em-se um ´unico valor para todo o conjunto de munic´ıpios. No caso do LISA, tem um valor espec´ıfico para cada munic´ıpio, permitindo identificar as ´areas semelhantes e a existˆencia de locais considerados outliers. Este ´ındice ´e calculado da seguinte forma[25]:

Ii = zi∗

W zi

σ2 (3.23)

Onde:

• zi = valor do desvio do CMI da i -´esima ´area;

• W zi = valor m´edio dos desvios do CMI dos vizinhos da ´area i ;

• σ2 = variˆancia da distribui¸c˜ao dos valores dos desvios do CMI.

O Lisa ´e um indicador que necessita atender as seguintes caracter´ısticas[26]: 1. Permitir a identifica¸c˜ao de padr˜oes de associa¸c˜ao espacial significativa; 2. Ser uma decomposi¸c˜ao do ´ındice global de associa¸c˜ao.

Quando calculado o ´ındice local, pode-se calcular o I de Moran atrav´es de sua m´edia aritm´etica.

O Moran Map, Box Map e o Lisa Map s˜ao gr´aficos que obt´em-se a partir do diagrama de espalhamento de Moran e Lisa.

3.4.1.4 Diagrama de espalhamento de Moran

O diagrama de espalhamento de Moran ´e uma forma de observar a dependˆencia es-pacial nos dados. Ele ´e dividido em quatro quadrantes, onde cada quadrante demonstra

(35)

3.4 An´alise Espacial 34

um tipo de associa¸c˜ao diferente entre o valor de um determinado lugar com o valor m´edio de sua vizinhan¸ca. Este diagrama utiliza os valores normalizados, ou seja, valores do CMI subtra´ıdos de sua m´edia e divididos pelo desvio padr˜ao[27]. Atrav´es deste gr´afico, constru´ıdo atrav´es do valor do CMI normalizado pela m´edia dos vizinhos, pretende-se comparar o CMI normalizado de uma determinada ´area com a m´edia dos seus vizinhos. Os quadrantes s˜ao definido como[28]:

• Os quadrantes superior direito e inferior esquerdo – indicam associa¸c˜ao espacial positiva, isto ´e, a ´area para o valor do atributo considerado, est´a cercada por ´areas que tem comportamento similar. O quadrante superior direito (High-High = Alto-Alto) indica que tanto o valor do atributo, quanto o valor m´edio para seus vizinhos, est˜ao acima da m´edia do conjunto. No quadrante inferior esquerdo (Low-Low = Baixo-Baixo) tanto o atributo quanto a m´edia dos vizinhos, est˜ao abaixo da m´edia; • Valores baixos est˜ao cercados por valores altos (quadrante superior esquerdo: Baixo-Alto (Low-High), representando valor negativo e m´edia dos vizinhos positiva) e valores altos s˜ao rodeados por valores baixos (quadrante inferior direito: Alto- Baixo (High-Low ), representando valor positivo e m´edia dos vizinhos negativa)

Na figura 4 tem-se um exemplo de um diagrama de espalhamento de Moran, onde Q1 ´e o quadrante High-High, Q2 o quadrante Low-Low, Q3 o quadrante High-Low e Q4 o quadrante Low-High.

3.4.1.5 Box Map, Lisa Map e Moran Map

O diagrama de espalhamento de Moran pode ser representado por um mapa, que ´e o Box Map, onde cada cor do mapa significa um dos quadrantes do diagrama. [28]:

Para o Lisa Map ´e analisada a significˆancia dos valores do ´ındice de Moran local em cada munic´ıpio, cujas hip´oteses s˜ao iguais ao do ´ındice global de Moran. As ´areas s˜ao distribu´ıdas em quatro grupos: n˜ao significantes, significantes `a 95%, significantes `a 99% e significantes `a 99,9%.

O Moran Map ´e uma jun¸c˜ao do Lisa Map com o Box Map. Para a confec¸c˜ao deste mapa, utiliza-se somente as ´areas consideradas significativas do Lisa(no caso deste tra-balho com valor-p<0,05). Depois de identificadas essas regi˜oes, separa-se nos quatro quadrantes definidos no diagrama de espalhamento de Moran e visualizados no Box Map. As demais s˜ao consideradas n˜ao significantes.[25]

(36)

3.4 An´alise Espacial 35

Figura 4: Diagrama de espalhamento de Moran

Fonte:An´alise Espacial de ´Areas. In: An´alise Espacial de Dados de ´Area.

Quando a correla¸c˜ao espacial ´e verificada, procura-se incorporar esta informa¸c˜ao ao modelo de regress˜ao. H´a diversas maneiras para inserir o efeito espacial no modelo de regress˜ao, no entanto, o mais utilizado ´e o modelo com efeitos espaciais globais, que busca sintetizar a estrutura de correla¸c˜ao espacial em apenas um parˆametro e introduzi-lo no modelo de regress˜ao. H´a duas maneiras de se fazer isto, atrav´es do modelo espacial auto-regressivo misto (Spatial Auto Regressive - SAR ou Spatial Lag Model) e o modelo do erro espacial (Conditional Auto Regressive - CAR ou Spatial Error Model) que est˜ao descritos abaixo.[29]

3.4.2

Modelo SAR

Neste modelo a autocorrela¸c˜ao espacial ignorada ´e atribu´ıda `a vari´avel dependente Y, como representada na equa¸c˜ao do modelo abaixo.

y = Xβ + ρWY + ε (3.24)

Onde:

• y = vetor da vari´avel dependente • X = matriz de vari´aveis independentes

(37)

3.4 An´alise Espacial 36

• β = vetor de coeficientes de regress˜ao

• ε = vetor com erro aleat´orio do modelo, ε ∼ N (0, σ2)

• W = matriz de vizinhan¸ca espacial ou matriz de pondera¸c˜ao espacial • ρ = coeficiente espacial autoregressivo

W Y expressa a dependˆencia espacial em Y .

A hip´otese nula para a n˜ao existˆencia de correla¸c˜ao espacial ´e de ρ = 0.

3.4.3

Modelo CAR

Este modelo de regress˜ao trata os efeitos espaciais como ru´ıdo, ou seja, uma per-turba¸c˜ao que necessita ser removida. Neste caso, a autocorrela¸c˜ao est´a associada ao erro, como descrito abaixo.

y = βX + ε, (3.25)

ε = λWε+ ξ (3.26)

Onde:

• Wε = componente do erro com efeitos espaciais

• λ = coeficiente auto-regressivo

• ξ = erros aleat´orios com m´edia zero e variˆancia σ2

A hip´otese nula para a n˜ao existˆencia de correla¸c˜ao espacial ´e de λ = 0.

3.4.4

Diagn´

ostico de modelos com efeitos espaciais

Para a avalia¸c˜ao da qualidade do ajuste do modelo, primeiro deve-se fazer uma an´alise gr´afica dos res´ıduos, pois atrav´es desta an´alise pode-se verificar se houve ruptura no pressuposto de independˆencia. Uma presen¸ca elevada de res´ıduos positivos ou negativos em uma parte do mapa indica existˆencia de correla¸c˜ao espacial. Para um teste quantitativo o mais utilizado ´e o I de Moran dos res´ıduos.[30]

(38)

3.4 An´alise Espacial 37

Nos modelos de regress˜ao espacial s˜ao utilizados crit´erios de informa¸c˜ao onde a ava-lia¸c˜ao do ajuste ´e penalizada por uma fun¸c˜ao do n´umero de parˆametros.[29] Tamb´em ´e necess´ario considerar o n´umero de parˆametros independentes ao se incluir fun¸c˜oes espa-ciais nos modelos. Para cada nova vari´avel em modelo de regress˜ao, acrescenta-se um parˆametro.

Normalmente a compara¸c˜ao entre modelos ´e feita considerando o logaritmo da m´axima verossimilhan¸ca e o n´umero de coeficientes de regress˜ao, pois ´e o que possui melhor ajuste para os dados. Dentre os crit´erios, os mais utilizados s˜ao[30]:

• Crit´erio de Informa¸c˜ao de Akaike (AIC)

AIC = −2 ∗ LM V + 2k (3.27)

Onde:

LMV: logaritmo da m´axima verossimilhan¸ca k: quantidade de coeficientes de regress˜ao

Neste caso avalia-se o grau de informa¸c˜ao que se perde ao escolher determinado modelo. Penaliza-se a quantidade de parˆametros no modelo, atrav´es do termo 2K. • Crit´erio Bayesiano de Informa¸c˜ao (BIC) ou Crit´erio Bayesiano de Schwarz (SBC)

BIC = −2 ∗ LM V + k ∗ ln(N ) (3.28)

Onde:

LMV: logaritmo da m´axima verossimilhan¸ca k: quantidade de coeficientes de regress˜ao N: quantidade de observa¸c˜oes

O BIC determina entre todos os poss´ıveis modelos aquele em que se perde menos in-forma¸c˜ao. Penaliza-se o modelo pela quantidade de observa¸c˜oes, atrav´es do termo ln(N ). Nos dois crit´erios acima ´e considerado o melhor modelo aquele que possui o menor valor.

(39)

3.5 Limita¸c˜oes do trabalho 38

3.5

Limita¸

oes do trabalho

O intuito deste trabalho era avaliar espacialmente o CMI entre os munic´ıpios, no entanto verificou-se que a qualidade dos dados n˜ao era boa (ver resultados no pr´oximo cap´ıtulo), portanto decidiu-se fazer por microrregi˜oes do Brasil definidas pelo IBGE, com base em similaridades sociais e econˆomicas, dividindo os estados em microrregi˜oes.

(40)

39

4

Resultados

Neste trabalho todas as an´alises foram realizadas nos programas Excel, TerraView, GeoDa e R. Adotou-se o n´ıvel de significˆancia de 5%.

4.1

An´

alise dos munic´ıpios e estados

Com base na literatura, verificou-se a necessidade de explorar a qualidade dos dados de sa´ude dispon´ıveis, para decidir como seriam calculados os CMI. A tabela 2 apresenta a classifica¸c˜ao dos munic´ıpios quanto a qualidade dos dados, subdivididos em adequados, inadequados e parcialmente adequados, e as frequˆencias absoluta e percentual. Na figura 5 apresenta-se esta classifica¸c˜ao dos munic´ıpios no mapa. Pode-se perceber que uma pequena parcela dos munic´ıpios s˜ao adequados e poderiam ter seu CMI calculado pela forma direta. No per´ıodo de 2002 `a 2010 houve uma redu¸c˜ao de 0,5% na quantidade de munic´ıpios considerados adequados.

Tabela 2: Classifica¸c˜ao dos munic´ıpios quanto `a qualidade dos dados Classifica¸c˜ao Ano 2002 2010 n % n % Adequado 32 0,6 6 0,1 Parcialmene adequado 4249 76,4 4119 74,0 Inadequada 1284 23,1 1440 25,9 Total 5565 100,0 5565 100,0

(41)

4.1 An´alise dos munic´ıpios e estados 40

(a)

(b)

(42)

4.1 An´alise dos munic´ıpios e estados 41

Pelo pequeno percentual de munic´ıpios considerados adequados e pela dificuldade de achar dados do IBGE para o c´alculo da forma indireta, foi calculado para todos os munic´ıpios a forma direta do CMI, que est´a representado na figura 6, onde as categorias da legenda foram definidas de acordo com os quartis do CMI de 2002.

(a)

(b)

(43)

4.1 An´alise dos munic´ıpios e estados 42

Na figura 7 tem-se o CMI calculado pelo IBGE por estado, divididas por quatro categorias definidas pelos quartis do CMI de 2010. Pode-se perceber que houve uma diminui¸c˜ao do CMI, principalmente na regi˜ao Norte.

(a)

(b)

(44)

4.1 An´alise dos munic´ıpios e estados 43

Para verificar a dependˆencia espacial entre os munic´ıpios foi realizado o teste I de Moran e o resultado ´e dado na tabela 3. Foram realizados trˆes testes para cada ano, considerando n´umero de vizinhos diferentes no c´alculo da matriz de vizinhan¸ca W . Foi feito para um vizinho mais pr´oximo, que foi o valor m´ınimo encontrado, para 6 vizinhos, que ´e a m´edia de vizinhos dos munic´ıpios brasileiros e para 23 vizinhos, que foi o valor m´aximo de vizinhos observado. Atrav´es dele pode-se observar que os valores do I de Moran em todos os casos foram pr´oximos `a zero, no entanto, apenas para 1 vizinho mais pr´oximo em 2010 o valor p foi maior que 5%, ou seja, n˜ao rejeita-se H0, indicando a

inexistˆencia de dependˆencia espacial entre os munic´ıpios. Nos outros casos verificou-se uma fraca autocorrela¸c˜ao entre os munic´ıpios.

Tabela 3: Teste I de Moran de acordo com o n´umero de vizinhos Vizinhos

Ano

2002 2010

I de Moran valor p I de Moran valor p

1 0,056 <0,001 0,031 0,055

6 0,046 <0,001 0,020 0,006

23 0,034 <0,001 0,017 <0,001

Pode-se ver nas figuras 8, 9 e 10 o diagrama de espalhamamento de I Moran do CMI para os anos de 2002 e 2010, com 1, 6 e 23 vizinhos mais pr´oximos. Para ser constatada a autocorrela¸c˜ao espacial seria necess´ario que os valores seguissem em torno da reta cujo ˆ

(45)

4.1 An´alise dos munic´ıpios e estados 44

(a) 2002 para k=1

(b) 2010 para k=1

(46)

4.1 An´alise dos munic´ıpios e estados 45

(a) 2002 para k=6

(b) 2010 para k=6

(47)

4.1 An´alise dos munic´ıpios e estados 46

(a) 2002 para k=23

(b) 2010 para k=23

(48)

4.1 An´alise dos munic´ıpios e estados 47

Como nos gr´aficos acima n˜ao foi poss´ıvel visualizar com clareza a autocorrela¸c˜ao espacial, foi feito o diagrama de espalhamento para o CMI dos estados brasileiros, para melhor visualiza¸c˜ao dos dados. Na figura 11 tem-se o diagrama de espalhamento de Moran para o CMI de 2002 e 2010 por estado, onde pode ser visto o I de Moran, que, para 2002, foi igual a 0,667741, e, para 2010, foi 0,593682, concluindo-se que h´a autocorrela¸c˜ao espacial do CMI entre os estados. Na figura 12 tem-se o Moran Map para os anos de 2002 e 2010.

Em 2002 os estados em vermelho est˜ao no quadrante High-High, ou seja, Piau´ı, Cear´a, Para´ıba, Pernambuco, Alagoas e Sergipe s˜ao influenciados positivamente por seus vizinhos e que tanto o CMI deles quanto a m´edia dos seus vizinhos est˜ao acima da m´edia nacional. Os estados de Santa Catarina, Paran´a, Mato Grosso do Sul, S˜ao Paulo, Rio de Janeiro e Minas Gerais, em azul, est˜ao no quadrante Low-Low, ou seja, esses munic´ıpios s˜ao influenciados pelos vizinhos e o valor de seu CMI e a m´edia dos seus vizinhos est˜ao abaixo da m´edia do pa´ıs. Em cinza s˜ao os estados n˜ao significantes.

Em 2010 houve uma mudan¸ca no cen´ario. De todos os munic´ıpios que pertenciam ao quadrante High-High, somente Sergipe continuou a pertencer a este quadrante. Per-nambuco passou a pertencer ao quadrante Low-High, ou seja, ele possui CMI abaixo da m´edia no entanto seus vizinhos possuem CMI acima da m´edia. Minas Gerais deixou de ser significativo, ou seja, n˜ao sofria mais a influencia de seus vizinhos.

(49)

4.1 An´alise dos munic´ıpios e estados 48

(a) 2002

(b) 2010

(50)

4.1 An´alise dos munic´ıpios e estados 49

(a) 2002

(b) 2010

(51)

4.2 An´alise das microrregi˜oes 50

Devido aos resultados insatisfat´orios dos munic´ıpios e pelo fato da divis˜ao territorial por estado abrangerem situa¸c˜oes socioeconˆomica diversas, optou-se por fazer a an´alise espacial por microrregi˜ao do IBGE. S˜ao 558 microrregi˜oes, sendo 64 na Regi˜ao Norte, 188 na Regi˜ao Nordeste, 160 na Regi˜ao Sudeste, 94 na Regi˜ao Sul e 52 na Regi˜ao Centro-Oeste.

4.2

An´

alise das microrregi˜

oes

4.2.1

Microrregi˜

oes em 2002 e 2010

4.2.1.1 Modelo de regress˜ao linear

Na figura 13 tem-se o CMI das microrregi˜oes. Os CMI para 2002 e 2010 foram categorizados segundo os quartis do CMI de 2002. Pode-se observar que houve uma redu¸c˜ao no CMI, principalmente na regi˜ao nordeste e centro-oeste.

Para realizar as an´alises espaciais, primeiramente foram coletados as vari´aveis que fazem parte do modelo te´orico para verificar quais realmente influenciam no CMI, para assim realizar as an´alises dos erros do modelo selecionado. Na tabela 4 tem-se as medidas resumos das vari´aveis nos anos de 2002 e 2010. Observando-se as m´edias das vari´aveis pode-se dizer que houve uma melhora entre os anos, como, por exemplo, a taxa de desem-prego caiu de 11,82 para 6,93 e a renda domiciliar per capita aumentou de R$ 394,27 para R$ 542,20. O ´ındice de Gini sofreu uma ligeira queda de 0,56 em m´edia no ano de 2002 para 0,51 em m´edia no ano de 2010, indicando uma melhora na desigualdade do Brasil.

(52)

4.2 An´alise das microrregi˜oes 51

(a) 2002

(b) 2010

(53)

4.2 An´alise das microrregi˜oes 52 T ab ela 4: Resumo descritiv o das v ari´ av eis do mo delo te ´orico de 2 002 e 2010 Resumo das v ari´ av eis de 2002 CMI P artos domic. T axa desem. T axa analf. Renda domic. p er capita PIB PIB p er capita T axa fecun. T axa natal. Gini Prop. lixo Prop. inst. sanit´ aria M ´ınimo 6,10 0, 00 1,50 3,20 94,26 16919 1199 1,10 9,60 0,4073 2,1 53,7 1 o quartil 15,43 1,40 9,04 9,13 192,50 331215 2505 1,80 15,30 0,5328 184,4 521,9 Mediana 19,20 4,90 11,48 15,10 388,21 684842 5279 2,00 17,60 0,5611 368,6 834,6 M ´edia 20,32 21,76 11,82 19,33 394,27 2648426 5842 2,097 17,85 0,5621 380,9 716,7 3 o quartil 24,10 19,32 14,10 29,60 541,97 1675558 7655 2,30 19,90 0,5915 549,4 961,4 M´ aximo 46,40 443,60 27,17 50,70 1192,92 222780757 30106 3,90 31,40 0,7117 952,2 999,6 Resumo das v ari´ av eis de 2010 CMI P artos domic. T axa desem. T axa analf. Renda domic. p er capita PIB PIB p er capita T axa fecun. T axa natal. Gini Prop. lixo Prop. inst. sanit´ aria M ´ınimo 3,90 0, 00 1,10 2,30 162,2 33632 3077 1,00 8,70 0,3736 0,00 33,93 1 o quartil 11,80 0,80 5,15 6,43 302,1 864447 6216 1,60 13,00 0,4758 95,53 409,61 Mediana 13,95 2,10 6,74 11,25 541,8 1780287 12343 1,70 14,40 0,5087 214,65 700,39 M ´edia 14,47 12,96 6,93 14,43 542,2 6756425 13970 1,75 14,91 0,5117 241,94 640,87 3 o quartil 16,80 6,46 8,37 22,48 728,6 4249122 18155 1,90 16,38 0,5432 365,40 904,79 M´ aximo 43,50 328,80 20,47 42,40 1665,4 528429303 70290 4,00 32,20 0,7399 822,60 998,27

(54)

4.2 An´alise das microrregi˜oes 53

As tabelas 5 e 6 apresentam os VIFs das vari´aveis do modelo te´orico, para os anos de 2002 e 2010 respectivamente. Portanto, tem-se os VIFs de cada passo, ou seja, na coluna ”1o. ajuste”est˜ao os VIFs de todas as vari´aveis do modelo te´orico. Em negrito

tem-se o valor mais alto do VIF que indica que a vari´avel ´e muito correlacionada com as demais, tendo que ser eliminada. Foram eliminadas as vari´aveis at´e que s´o restasse vari´aveis com valores de VIF menores que 5. Tanto em 2002 como em 2010 a primeira vari´avel a ser eliminada foi a renda domiciliar per capita, que ´e bem correlacionada com as demais vari´aveis nos dois momentos. Al´em desta, em 2002 tamb´em foram eliminadas as vari´aveis taxa de fecundidade e propor¸c˜ao de lixo e em 2010, taxa de natalidade.

Tabela 5: VIF das vari´aveis eliminadas de 2002

Vari´aveis 1o. ajuste 2o. ajuste 3o. ajuste 4o. ajuste Propor¸c˜ao de partos domiciliares 1,739032 1,672481 1,548437 1,263293 Taxa de desemprego 1,975486 1,585370 1,495952 1,240405 Taxa de analfabetismo 4,542235 3,211798 3,058893 2,413447

Renda domiciliar per capita 10,483907 – – –

PIB 1,401489 1,166298 1,164092 1,159858

PIB per capita 2,803614 2,348317 2,347154 2,076585

Taxa de fecundidade 10,451788 10,234034 – –

Taxa de natalidade 8,589256 8,526664 2,007657 1,989221

Gini 1,802105 1,762952 1,756514 1,619078

Propor¸c˜ao lixo 7,756350 6,003192 5,854077 –

Propor¸c˜ao instala¸c˜ao sanit´aria 2,371457 2,290433 2,224885 1,735711

Logo, na sele¸c˜ao do melhor modelo que se ajusta aos dados de 2002, as vari´aveis utilizadas foram: propor¸c˜ao de partos domiciliares, taxa de desemprego, taxa de analfa-betismo, PIB, PIB per capita, taxa de natalidade, ´ındice de Gini e propor¸c˜ao de domic´ılios com instala¸c˜ao sanit´aria inadequada.

Para a sele¸c˜ao do melhor modelo que se ajusta aos dados de 2010 foram utilizadas as seguintes vari´aveis: propor¸c˜ao de partos domiciliares, taxa de desemprego, taxa de analfabetismo, PIB, PIB per capita, taxa de fecundidade, ´ındice de Gini, propor¸c˜ao de domic´ılios com coleta inadequada de lixo e propor¸c˜ao de domic´ılios com instala¸c˜ao sa-nit´aria inadequada.

(55)

4.2 An´alise das microrregi˜oes 54

Tabela 6: VIF das vari´aveis eliminadas de 2010

Vari´aveis 1o. ajuste 2o. ajuste 3o. ajuste

Propor¸c˜ao de partos domiciliares 1,808004 1,803001 1,791464 Taxa de desemprego 2,307545 1,685317 1,489052 Taxa de analfabetismo 4,678122 3,524840 3,524782

Renda domiciliar per capita 10,259460 – –

PIB 1,444171 1,173322 1,159728

PIB per capita 2,349070 2,101939 2,97591

Taxa de fecundidade 10,176283 9,900987 2,469117

Taxa de natalidade 10,152868 10,032749 –

Gini 3,087856 3,068384 2,980054

Propor¸c˜ao lixo 6,309180 4,864970 4,740176 Propor¸c˜ao instala¸c˜ao sanit´aria 2,144902 2,125421 2,012171

Com as vari´aveis restantes, aplicou-se o m´etodo de sele¸c˜ao de elimina¸c˜ao progressiva. Na tabela 7 tem-se o valor p do teste t de cada etapa do m´etodo para o ano de 2002. Pode-se observar que no primeiro modelo, onde todas as vari´aveis est˜ao inclu´ıdas no ajuste, a que possui maior valor p no teste t ´e o PIB, logo, de acordo com o m´etodo, ela foi eliminada do modelo. Ajustando um novo modelo sem esta vari´avel, observou-se que a vari´avel propor¸c˜ao de partos domiciliares possui o valor p igual a 0,6064, sendo assim, foi retirada do modelo. Realizando este processo at´e que se obtenha vari´aveis com valor p abaixo de 5%, chegamos ao modelo final da equa¸c˜ao (4.1):

ˆ

yi = 3, 998 + 0, 1724x1,i+ 0, 2119x2,i− 0, 0001647x3,i+ 19, 84x4,i (4.1)

Onde:

• ˆyi ´e o CMI estimado da i-´esima microrregi˜ao em 2002;

• x1,i ´e a taxa de desemprego da i-´esima microrregi˜ao em 2002;

• x2,i ´e a taxa de analfabetismo da i-´esima microrregi˜ao em 2002;

• x3,i ´e o PIB per capita da i-´esima microrregi˜ao em 2002;

(56)

4.2 An´alise das microrregi˜oes 55 T ab ela 7: Etapas do a juste do mo delo de regress˜ ao linear para o ano de 2002 V ari´ av ei s Mo delo 1 Mo delo 2 Mo delo 3 Mo delo 4 Mo delo 5 In tercepto 0,25124 0,2527 0,21534 0, 18135 0,22530 Prop or¸ c˜ao de partos domiciliares 0,51293 0,5064 – – – T axa de desemprego 0,03361 0,0360 0,03230 0, 00959 0,00404 T axa de analfab etismo 5 ,39 ∗ 10 − 11 5 ,51 ∗ 10 − 11 6 ,64 ∗ 10 − 11 1 ,32 ∗ 10 − 10 2 ,89 ∗ 10 − 12 PIB 0,71053 – – – – PIB p er capita 0,04408 0,0318 0,03474 0, 04359 0,04273 T axa de natalidade 0,12712 0,1317 0,16189 0,26425 – Gini 0,00927 0,0085 0,00911 0, 01511 0,00108 Prop or¸ c˜ao instala¸ c˜ao sanit´ aria 0,23184 0,2437 0,23313 – –

(57)

4.2 An´alise das microrregi˜oes 56

Aplicando o m´etodo de sele¸c˜ao de elimina¸c˜ao progressiva para o ano de 2010 cujos resultados podem ser vistos na tabela 8, obt´em-se o modelo final da equa¸c˜ao (4.2):

ˆ

yi = 1, 332 − 8, 359 ∗ 10−05x1,i+ 27, 96x2,i (4.2)

Onde:

• ˆyi ´e o CMI estimado da i-´esima microrregi˜ao em 2010;

• x1,i ´e o PIB per capita da i-´esima microrregi˜ao em 2010;

Referências

Documentos relacionados

A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se baseia no fato de que uma

A Psicologia, por sua vez, seguiu sua trajetória também modificando sua visão de homem e fugindo do paradigma da ciência clássica. Ampliou sua atuação para além da

Equipamentos de emergência imediatamente acessíveis, com instruções de utilização. Assegurar-se que os lava- olhos e os chuveiros de segurança estejam próximos ao local de

Tal será possível através do fornecimento de evidências de que a relação entre educação inclusiva e inclusão social é pertinente para a qualidade dos recursos de

(grifos nossos). b) Em observância ao princípio da impessoalidade, a Administração não pode atuar com vistas a prejudicar ou beneficiar pessoas determinadas, vez que é

A prova do ENADE/2011, aplicada aos estudantes da Área de Tecnologia em Redes de Computadores, com duração total de 4 horas, apresentou questões discursivas e de múltipla

17 CORTE IDH. Caso Castañeda Gutman vs.. restrição ao lançamento de uma candidatura a cargo político pode demandar o enfrentamento de temas de ordem histórica, social e política

O objetivo do curso é promover conhecimentos sobre as técnicas de gerenciamento de projetos, melhorando assim a qualidade do planejamento e controle de obras, visando proporcionar