• Nenhum resultado encontrado

Projeção Populacional com Estimadores Bayesianos Espaciais

N/A
N/A
Protected

Academic year: 2021

Share "Projeção Populacional com Estimadores Bayesianos Espaciais"

Copied!
24
0
0

Texto

(1)

Projeção Populacional com Estimadores Bayesianos Espaciais

Flávio Henrique Miranda de Araújo Freire

UFRN

Renato Martins Assunção

UFMG/Depto. de Estatística

Palavra-chave: projeção populacional, estatística espacial.

I Introdução

As estimativas e projeções de população têm sido, cada vez mais, demandadas por diversos setores governamentais como, por exemplo, Secretarias de Saúde que utilizam a população como denominador no cálculo de diversos índices de prevalência de morbidade, bem como taxas de mortalidade.

Nesse contexto, em que é imprescindível conhecer o contingente populacional, a importância de estimativas de população para níveis geográfico-administrativos mais desagregados aumenta consideravelmente.

É nesse contexto que inserimos esse trabalho com o objetivo de obter metodologias de projeção populacional robustas para pequenas áreas. Para isso, utilizamos ferramentas metodológicas da estatística bayesiana espacial1 para diminuir a variabilidade das taxas que mensuram os eventos demográficos.

Aplicamos os métodos de estimação bayesiana sob o arcabouço teórico do método de projeção populacional denominado método das componentes demográficas proporcionais, que é uma adaptação do método das componentes para aplicação em pequenas áreas (WALDVOGEL, B. 1997). Com isso, tentamos diminuir a variabilidade da taxa de fecundidade total, da taxa de mortalidade infantil e da taxa

Trabalho apresentado no XIII Encontro da Associação Brasileira de Estudos Populacionais, realizado

em Ouro Preto, Minas Gerais, Brasil de 4 a 8 de novembro de 2002.

1 A estatística bayesiana é uma linha alternativa à estatística clássica. Os métodos de suavização espacial

(2)

líquida de migração das pequenas áreas, e incorporamos essas medidas suavizadas no método das componentes demográficas para cada área pequena.

O trabalho de Waldvogel (1997) é tomado como parâmetro porque, após testar empiricamente uma variedade de métodos de projeção populacional, concluiu que o método das componentes demográficas proporcionais é o que apresenta os menores erros na população projetada. Diante disso, estaremos tentando suavizar as componentes demográficas proporcionais (de fecundidade, mortalidade e migração) e testando se há uma melhora nos erros com relação ao método das componentes demográficas usado no trabalho citado acima.

Realizamos os exercícios empíricos com os mesmos dados e na mesma região em que Waldvogel (1997) realizou seu trabalho, ou seja, municípios de três regiões administrativas do Estado de São Paulo na década de 70: Presidente Prudente, Vale do Paraíba e Bauru.

Justificativa

Em muitas regiões do País sabemos que os registros de eventos demográficos que servem de subsídios para os estudos de projeção populacional, principalmente quando utilizamos o método das componentes demográficas, não são de boa qualidade e precisam de correções mesmo quando trabalhamos em áreas maiores, como um estado da federação.

Quando aumentamos o nível de desagregação e passamos a trabalhar com municípios, esta dificuldade na qualidade dos dados aumenta consideravelmente, inclusive porque passamos a ter níveis de cobertura diferenciados entre os municípios.

Uma outra dificuldade no que diz respeito à utilização de eventos demográficos com o método das componentes para pequenas áreas, é que nestes casos estamos falando de baixo contingente populacional. Deste modo, quando pretendemos medir algum índice ou taxa populacional, trabalhamos com esta pequena população no denominador. Neste sentido, numa área muito pequena, com pouca população, qualquer taxa que utilize o número de habitantes no denominador, tenderá a ter uma grande variação, pois bastaria uma pequena subtração ou adição nos eventos contados no numerador para que a taxa diminuísse ou aumentasse de forma considerável. É o que se chama na literatura de flutuações aleatórias.

(3)

Neste sentido, o objetivo deste trabalho é exatamente utilizar e criar metodologias que sejam capazes de melhorar as estimativas de taxas populacionais de pequenas áreas de forma a suavizar as flutuações aleatórias. Para tal, pretendemos utilizar uma abordagem bayesiana que leve em consideração a configuração espacial e/ou demográfica da taxa mensurada.

Conforme argumento anterior, os procedimentos metodológicos são implementados nos municípios estudados por Waldvogel (1997).

II Objetivos

Objetivo geral

Desenvolver novas metodologias, baseadas nos métodos da Estatística Bayesiana Espacial, que propiciem um avanço nas técnicas de estimativa e projeção populacional para pequenas áreas.

Objetivos específicos

• Desenvolver metodologias, que suavizem as flutuações das taxas que envolvem a dinâmica da população: taxas líquidas de migração, taxas de mortalidade e taxas de fecundidade, calculadas para as pequenas áreas;

• Projetar a população com as variáveis demográficas suavizadas utilizando o método das componentes demográficas proporcionais;

• Calcular o erro produzido pelas novas metodologias;

• Comparar os erros encontrados nos novos procedimentos com aqueles gerados pelo método original; e

• Construir mapas capazes de delinear a configuração espacial das taxas e da população, obtidas tanto através do método original quanto pela utilização dos métodos propostos.

III Método dos parâmetros demográficos proporcionais (WALDVOGEL, 1997)

O método dos parâmetros demográficos proporcionais foi usado por Waldvogel (1997) como uma alternativa ao método das componentes para pequenas áreas. A

(4)

questão central é que, ao invés de usar os registros dos nascimentos e óbitos diretamente para inferir sobre os padrões de fecundidade e mortalidade em cada área pequena, devemos utilizar alguma medida que relacione a ordem de grandeza desses eventos de cada área com o padrão verificado na área maior de referência. Para isso, a autora utilizou os fatores K que, no caso da fecundidade, relacionam os nascidos vivos observados na pequena área com os nascidos vivos esperados desta mesma área, sob a hipótese de que o padrão de fecundidade2 da pequena área em questão é o mesmo da área maior. Nesse caso da fecundidade o fator K passa a se chamar KF.

Para a mortalidade o raciocínio é análogo, ou seja, o fator K relaciona os óbitos observados na pequena área com aqueles óbitos esperados sob a hipótese de que o risco de mortalidade na área em questão (dado pela Taxa de Mortalidade Infantil – TMIi) é o

mesmo que o verificado na área maior. Nesse caso da mortalidade, chamamos o fator de proporcionalidade de KM.

Os fatores KF e KM são estimados a partir de:

i i i ESP NV = KF e i i i ESP Obt = KM .

Onde, para a fecundidade ESPi é dado por: ESP 5 j,i com n 45 15 j j 5 i

TEF. n = = ij sendo o

número de mulheres da área i no grupo etário j. Para a mortalidade ESPi é obtido da

seguinte forma: ESPi =TMI.ni, Neste caso, ni é o número de nascidos vivos da área i.

Quando calculamos os fatores KF e KM para um determinado ano, intrinsecamente temos os valores da Taxa de Fecundidade Total (TFT) e da Taxa de Mortalidade Infantil (TMI) para a pequena área, a partir da TFT e TMI da região como um todo. (1) t i t i KF*TFT TFT = (2) t i t i KM *TMI TMI =

onde, t é a taxa de fecundidade total da pequena área i no instante t, KF

i

TFT i é o fator

KF para a área i, é a taxa de fecundidade total da área maior no instante t, é a taxa de mortalidade infantil da pequena área i no tempo t, KM

t

TFT t

i

TMI

i é o fator KM da área i,

é a taxa de mortalidade infantil da região como um todo em t.

t

TMI

2 O padrão de fecundidade é dado pelas Taxas Específicas de Fecundidade por grupo etário da mulher

(5)

Neste contexto, se KF e KM são constantes no tempo, podemos usar as expressões anteriores para estimar os níveis de fecundidade e mortalidade para uma subárea num período futuro, desde que a TFT e a TMI da área maior sejam conhecidas.

Até aqui, esboçamos os procedimentos adotados por Waldvogel (1997) para projetar os níveis de fecundidade e mortalidade das pequenas áreas. Contudo, para que o método das componentes demográficas seja implementado necessitamos do padrão dessas duas variáveis. Waldvogel (1997) usou vários estudos que relacionavam nível e padrão destas duas componentes demográficas. Assim, para a fecundidade, utilizou-se uma tabela com nove faixas de níveis de fecundidade cada uma com um conjunto de taxas específicas por idade da mulher (veja Waldvogel, B. 1997). Da mesma forma, no caso da mortalidade Waldvogel (1997) usa tabelas padrão de mortalidade para São Paulo que relaciona nível com estrutura etária de óbitos.

O tratamento dado por Waldvogel (1997) para a migração não é igual ao utilizado nos casos da fecundidade e mortalidade. Neste caso, a autora estima as Taxas Líquidas de Migração para cada pequena área (TLMi) através do crescimento

vegetativo. A relação dessas TLMi com a área maior de referência fica por conta das

hipóteses sobre a tendência do comportamento futuro.

Para viabilizar a hipótese de que a tendência do comportamento futuro da migração nas pequenas áreas será compatível com a da área maior Waldvogel (1997) utiliza modelos de regressão simples do tipo: , onde TLM é a taxa líquida de migração da pequena área i no instante t+5; é a taxa líquida de migração da pequena área i no instante t; β é o parâmetro referente a inclinação da reta de regressão; t . TLM TLM t i t i+5 = +β∆ t i TLM 5 + t i

No que diz respeito ao padrão das taxas líquidas de migração por grupo etário, o procedimento é análogo ao realizado para a fecundidade e mortalidade.

IV Estimadores bayesianos espaciais para projeção de população pelo método das

componentes demográficas com parâmetros proporcionais

As metodologias bayesianas utilizadas e testadas nessa seção para projetar população em pequenas áreas estarão sempre sendo aplicadas segundo o arcabouço

(6)

teórico do trabalho “Técnicas de projeção populacional para o planejamento regional” (WALDVOGEL, B, 1997) constantemente citado nesse texto.

Nesse sentido, estaremos testando estimadores bayesianos a fim de suavizar as flutuações aleatórias dos fatores K3 das componentes de mortalidade e fecundidade e das taxas líquidas de migração de cada área pequena.

O objetivo do trabalho é produzir projeções finais mais precisas. Muitas vezes um tipo de estimador produz boa estimativa para uma componente demográfica, mas não para outra e assim, ao projetar a população, os erros podem não ser satisfatórios.

O estimador bayesiano empírico para a fecundidade e a mortalidade

Nesse trabalho o objeto de estimação, para a fecundidade e a mortalidade, é a já mencionada razão dada pelo que Waldvolgel (1997) chamou de fator K. Na fecundidade, K será designado KF e é dado pela razão:

i i i ESP NV KF = , onde NVi são os

nascidos vivos observados na área i, e ESPi4 são os nascidos vivos esperados se o risco

de uma mulher em período reprodutivo na área i ter um filho for o mesmo que o risco observado na área maior que agrega essa pequena área. Nesse sentido, como NVi é uma

contagem podemos tratá-lo, estocasticamente, como uma variável aleatória com distribuição de Poisson. ) i θ . i P poisson(ES ~ i NV (3)

onde θi é o risco de um mulher escolhida ao acaso da área i ter mais ou menos filhos do

que o esperado sob a hipótese de que a área i possui o mesmo risco que a região como um todo. Com isso, temos que a média condicional de NVi é: E

(

NVi θi

)

=ESPi .θi.

O estimador de máxima-verossimilhança para θi é exatamente

i i i ESP NV = KF .

3 Conforme explicado anteriormente, o fator K mede a relação entre as componentes demográficas da

área pequena e a área total que as abrange. Na mortalidade, relaciona-se o número de óbitos observado entre os menores de 1 ano da pequena área com os óbitos dos menores de 1 ano esperados segundo uma taxa de mortalidade infantil constante para todas as áreas e igual a TMI da área maior. Para o caso da fecundidade, o raciocínio é análogo utilizando o número de filhos observados e esperados utilizando-se taxas de fecundidade específicas constantes e iguais a da área total.

4 ESPi para a fecundidade é dado por: ESP

i j, 5 45 15 j 5 j i ∑ TEF. n = =

5nj,i é o número de mulheres na área i no grupo etário j até j+5;

(7)

θi tem uma distribuição a priori não especificada cuja média E(θi) = mi e variância V(θi)

= Ai são estimadas a partir dos dados (MARSHALL, 1991). Vamos agora calcular os

momentos (esperança e variância) do estimador de θi,dado por KFi.

Esperança:

( )

KFi E

[

E

(

KFi θi E =

)

]

(4) mas

(

)

(

)

i i i i i i i i i i i i .ESP.θ θ ESP 1 θ NV E ESP 1 θ ESP NV E θ KF E = = =      = . Então,

( ) ( )

KFi Eθi mi E = = (5) Variância:

( )

KFi V

[

E

(

KFi θi

)

]

E

[

V

(

KFi θi V = +

)

]

(6)

Já vimos que E

(

KFi θi

)

i. Falta saber quem é v

(

KFi θi

)

.

(

)

2

(

i i i i i i i i .VNV θ ESP 1 θ ESP NV V θ KF V =     

=

)

. Mas, numa distribuição de poisson a

média é igual a variância. Então,

(

)

2 i i i i i .ESP.θ ESP 1 θ KF V =

(

)

i i i i ESP θ θ KF V = ⇒ (7)

Com isso, temos:

( )

( )

⇒      + = i i i i ESP θ E θ V KF V

( )

i i i i

ESP

m

A

KF

V

=

+

(8)

MARSHALL (1991) sugere uma simplificação onde o valor esperado e a variância de θ passam a ter valor constante para todas as áreas [E e ]. Desta forma, seguindo a lógica desenvolvida por esse autor, o estimador com menor erro quadrático médio para KF

i

( )

θi =m

( )

θ A V i =

i é o estimador bayesiano empírico dado por:

(9)

(

KF mˆ . cˆ mˆ θˆi = + i i

)

onde,

(8)

= = = N 1 i i N 1 i i ESP NV mˆ ; (10)

N é o número total de áreas pequenas;

i j, 5 45 15 j 5 j i TEF. n ESP

= = ; (11)

5nj,i é o número de mulheres na área i no grupo etário j até j+5;

5TEFj é a Taxa Específica de Fecundidade na área total para o grupo etário j até j+5;

( )

( )

( )

i

[

( )

(

i i

)

]

i i i i θ KF V E V V KF V V c + θ θ = θ = (11.1)

O estimador de ci, dado por c , é calculado com a expressão abaixo. ˆi

( )

( )

i ^ ^ i ESP mˆ Aˆ Aˆ cˆ i i KF V θ V + = = . (11.2)

O estimador  é dado por:

= − = N 1 i i i 2 ESP n n . mˆ s Aˆ , onde:

(

)

n mˆ KF . n N 1 i 2 i i 2

= − = s

Então, o termo c fica da seguinte forma: ˆi

i N 1 j j j 2 N 1 j j j 2 i ESP mˆ ESP n n . mˆ s ESP n n . mˆ s cˆ +                 −                 − = ∑ ∑ = = (12)

Uma análise do ponto de vista prático do multiplicador ci pode ser feita com a

expressão (12). Com essa fórmula, notamos que se a pequena área i possui um alto contingente populacional, então o valor esperado de nascidos vivos (ESPi) também será

alto fazendo com que ci tenda para 1. Uma conseqüência direta desse resultado é que

quanto mais ci aproxima-se de 1 menor será a contração de KFi para o fator KF médio

da região como um todo ( m ). Neste caso, o fator KFˆ i suavizado ( θ ) terá pouca ou

nenhuma suavização.

i

ˆ

Por outro lado, se a área possui uma população muito pequena o valor esperado de nascidos vivos (ESPi) será baixo fazendo com que ci aproxime-se de zero. Assim,

(9)

concluimos que quanto menor for a população da pequena área i, maior será a contração do fator KFi da área i para o valor médio.

É preciso fazer uma analogia para a mortalidade. Neste caso, ao invés dos nascidos vivos, trabalhamos com os óbitos até o primeiro ano de vida. O fator de proporcionalidade K é definido por KM com o índice i para designar a pequena área i. Portanto, KMi mede a razão entre os óbitos observados de crianças com menos de 1 ano

de vida na área i e os óbitos de menos de 1 ano esperados se o risco de morte no primeiro ano de vida nessa pequena área é igual ao da região como um todo

      = i i i ESP Obt

KM . Com isso, de forma análoga à fecundidade, o estimador bayesiano empírico para a mortalidade é:

(13)

(

KM mˆ . cˆ mˆ θˆi = + i i

)

onde,

= = = N 1 i i N 1 i i ESP Obt mˆ i i i TMI.n

ESP = , para TMIi igual a taxa de mortalidade infantil na área i e ni equivalente

ao número de nascidos vivos da área i;

i N 1 i i i 2 N 1 i i i 2 i ESP mˆ ESP n n . mˆ s ESP n n . mˆ s cˆ + − − =

= = ;com

(

)

n mˆ KM . n N 1 i 2 i i 2

= − = s e

= = N 1 i i n n .

Estimador bayesiano hierárquico para a migração

O procedimento para estimar a TLM não usa os dados para calcular os momentos da distribuição a priori do parâmetro em estudo, como é feito com o método de bayes empírico. Com o estimador bayesiano “puro” a estimativa do parâmetro ocorre através de uma combinação da distribuição a priori com a distribuição dos dados que estão disponíveis. Este procedimento é operacionalizado segundo o teorema de

(10)

Bayes e a distribuição de probabilidade resultante, com a qual se fará inferência, é conhecida como distribuição a posteriori do parâmetro5.

(

θ /X

)

P

( ) (

θ P XP

)

)

)

)

(14) onde:

( )

θ

P é a distribuição de probabilidade a priori do parâmetro θ;

(

XP

(

θ / X

)

l =

é a distribuição de probabilidade dos dados, dado um valor de θ. Esta probabilidade pode ser expressada sob a forma de verossimilhança -

; e

(

)

(

)

1 X P x P n i i =

=

(

X

P /θ é a distribuição de probabilidade a posteriori do parâmetro θ.

Um desmembramento desse modelo foi o surgimento dos modelos bayesianos hierárquicos, onde o parâmetro θ precisa de conhecimentos a priori de outro parâmetro φ, conhecido como hiperparâmetro, para poder ser estimado (LEE, P.M., 1997).

Para o caso específico da taxa líquida de migração utilizamos o modelo . Portanto, a taxa líquida de migração do município

(

µ ,τ N ~

TLMi i i comporta-se

segundo uma distribuição normal com média µi e precisão τ6. Em outras palavras, a

taxa líquida de migração em cada município segue uma distribuição normal centrada numa média própria, mas com a mesma variância em todos as áreas.

Para obtermos estimativas de TLMi precisamos conhecer o formato da

distribuição normal a qual ela pertence, dado pelos parâmetros µi e τ. Nesse caso, o

problema agora é descobrir quem são esses parâmetros.

No que tange a média de TLMi, podemos assumir que µi tem distribuição

normal7 com os hiperparâmetros: média α e precisão τ

α. Além disso, vamos assumir

que α tem distribuição normal “vaga”8 centrada no zero. Para τ

α, assumiremos uma

distribuição gama com ambos os parâmetros iguais a 10 . −3

5 Para maiores detalhes sobre a teoria bayesiana veja LEE, P.M (1997).

6 A precisão é o inverso da variância. Definimos as distribuições em função da precisão, pois dessa forma

os cálculos matemáticos são mais simples.

7 Resultado do Teorema do Limite Central que diz que a distribuição da média populacional é

assintoticamente normal (HOEL, P.G.;PORT,S.C. & STONE, C.J. 1978)

8 O termo “vaga” é usado para denotar uma distribuição de probabilidade com baixa precisão. Esse é um

(11)

Quanto ao parâmetro τ, da mesma forma que foi feito com τα, utilizamos uma

distribuição gama com parâmetros iguais a 10 . Essas distribuições que modelam os hiperparâmetros são chamadas de hiperpriori, e estão definidas a seguir, com a notação apropriada:µ ; 3 −

(

α,τα

)

N ~ i

(

)

3 10− 3 10− Γ τ~ , ; α~N

(

0,τα

)

; e

(

10−310−3

)

α Γ τ ~ ,

O procedimento para a obtenção da posteriori simplificou muito com o advento dos algoritmos de Monte Carlo via Cadeias de Markov (MCMC), principalmente depois do desenvolvimento do software WinBUGS – Bayesian analysis using Gibbs Sampler9. (SPIEGELHALTER et al., 1996). Esse software foi, portanto, a nossa ferramenta para implementar esse modelo bayesiano hierárquico para a taxa líquida de migração.

V Resultados e avaliação das projeções pelo método das componentes com

parâmetros demográficos proporcionais usando estimadores bayesianos espaciais

A avaliação da eficácia da metodologia bayesiana aplicada ao método das componentes demográficas proporcionais para projeção de população em pequenas áreas será feita através de exercícios empíricos. Conforme já dissemos anteriormente, projetamos a população para cada município das três regiões estudadas do Estado de São Paulo na década de 70, e comparamos a população final com a população censitária de 1980.

As projeções foram realizadas pelo método das componentes demográficas proporcionais na forma original e na versão com estimativa bayesiana dos parâmetros.

Para analisar qual método de projeção produz estimativas mais precisas, usamos duas medidas de erro para nortear as análises. Nos resultados da população total de cada sexo utilizamos o erro relativo absoluto:

          = i i i ^ i pop pop pop * 100 e (15)

onde, pop^ i é a população projetada para o município i, e popi é a população enumerada

no censo demográfico de 1980 para o município i.

9 O programa WinBUGS pode ser encontrado gratuitamente no endereço

(12)

Contudo, além de avaliar a projeção da população total, é preciso checar como os diferentes métodos utilizados projetam a estrutura etária da população. Para isso, utilizamos uma medida de erro sintética que é o erro relativo absoluto médio da estrutura etária da população do município i.

16 100 16 1

=                               −           = j i ij i ij i ^ ij ^ Et . Est i pop pop pop pop pop pop * e (16)

onde, é a população projetada para o grupo etário j do município i, pop é a população total projetada do município i, pop

ij ^

pop ^ i

ij é a população censitária de 1980 do

grupo etário j no município i, e popi é a população censitária total do município i em

1980. O índice j, que indica a faixa etária da população, varia de 1 para o grupo etário 0 a 4 anos, até 16 para o grupo aberto de 75 anos e mais.

As medidas de erro são avaliadas no âmbito das populações compatibilizadas. Esse é o procedimento amplamente adotado na literatura e utilizado com o objetivo de ajustar, principalmente, a estrutura etária das populações projetadas para as pequenas áreas.

Nesse trabalho, como o objetivo é medir os erros de projeção proveniente das metodologias empregadas, a compatibilização é feita com a população recenseada em 1980 da área maior (regiões administrativas de Presidente Prudente, Vale do Paraíba e Bauru). Com isso, eliminamos o efeito das hipóteses sobre o futuro da população destas regiões e asseguramos que os erros mensurados são devido aos métodos de projeção utilizados.

Resultados e avaliação da população projetada total por sexo

Com as figuras V.1 e V.2 podemos perceber qual método de projeção foi mais preciso nas regiões do estudo. Os gráficos indicam a diferença entre o erro cometido na projeção original com relação ao erro da projeção bayesiana. Desta forma, quando os pontos estiverem abaixo da linha y=0 (eixo x), significa que a projeção populacional

(13)

pelo método das componentes demográficas proporcionais original foi melhor que o método bayesiano.

Neste sentido, observando os diagramas das figuras V.1 e V.2 verificamos que a disposição dos pontos é a mesma em ambos os sexos, para cada região. No que se refere à precisão das projeções, novamente teremos que avaliar os resultados por região.

Em Presidente Prudente os gráficos das diferenças nos erros das duas projeções indicam que a projeção bayesiana é um pouco melhor que a projeção original. Na população feminina praticamente não há primazia de um método sobre o outro. A projeção bayesiana é melhor em 52% dos municípios. No que tange a população masculina, as estimativas bayesianas operam uma melhora nas projeções finais em 60% dos municípios dessa região.

Em Bauru observamos os melhores resultados das projeções bayesianas comparadas às projeções originais. Nesta região, a própria configuração dos pontos nos gráficos das figuras V.1 e V.2 já indica que a suavização das componentes demográficas resultou num ganho de precisão na projeção populacional.

Com efeito, em 66% dos municípios da região de Bauru a população feminina projetada da forma bayesiana foi mais próxima da população censitária do que a população projetada com o método original. Já na população masculina, a projeção bayesiana melhorou as estimativas populacionais em 68% dos municípios.

Por fim, a região do Vale do Paraíba onde definitivamente o método bayesiano não surtiu o efeito esperado. Observe nos gráficos das figuras V.1 e V.2 referentes a essa região que, a maioria dos pontos estão abaixo do eixo x. Isto significa que apenas em um pequeno número de municípios a projeção bayesiana foi melhor que a projeção original (28% na população feminina e 31% na população masculina).

(14)

Figura V-1. Diferença entre os erros relativos absolutos da população FEMININA total projetada pelo “método das componentes demográficas proporcionais” original com relação aos erros obtidos na projeção bayesiana geral

7 8 9 10 11 -2 0 0 20 40

Região de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 12 -3 0 -2 0 -1 0 0 10

Região do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 -1 0 0 10 20 Região de Bauru

Fonte: Dados de Waldvogel,B.(1997)log da população

di

fe

re

a

Figura V-2. Diferença entre os erros relativos absolutos da população MASCULINA total projetada pelo “método das componentes demográficas

proporcionais” original com relação aos erros obtidos na projeção bayesiana geral

7 8 9 10 11 -2 0 0 20 40 60

Região de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 8 9 10 11 12 -2 0 -1 0 0 10

Região do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 -5 0 5 10 15 Região de Bauru

Fonte: Dados de Waldvogel,B.(1997)log da população

di

fe

re

a

Esse resultado encontrado nos municípios do Vale do Paraíba é intrigante, pois vai de encontro aos resultados das outras duas regiões estudadas. Para tentar entender, fizemos um exercício exploratório que foi realizar uma projeção onde a suavização bayesiana foi operada apenas nas componentes de mortalidade e fecundidade, deixando as taxas líquidas de migração na forma original. A tabela abaixo resume os resultados deste exercício. Observe pelo sumário estatístico da tabela que as diferenças são mínimas.

(15)

Tabela V-1. Sumário estatístico dos erros de projeção populacional segundo o método utilizado nos municípios do Vale do Paraíba

Projeção original

Projeção c/ KF e KM bayesianos

Sumário estatístico

Feminia Masculina Feminina Masculina

Média 17,88 16,94 17,53 16,73

Mediana 15,87 15,30 15,38 15,42

Desvio Padrão 13,83 12,93 13,49 12,76

Fonte: Dados originais para os cálculos foram extraídos de Waldvogel, B (1997).

Com isso, uma hipótese para explicar porque o método bayesiano não obteve bons resultados no Vale do Paraíba estaria nas taxas líquidas de migração. De fato, esta é a região com os movimentos migratórios mais intensos, caracterizada por uma atividade industrial marcante e interligada com o parque industrial da cidade de São Paulo. Nessa região encontramos o maior número de municípios com taxas líquidas de migração positivas ou próximas de zero, revelando a maior propensão dessa área em atrair população dentre as três regiões estudadas.

Ainda no que se refere à região do Vale do Paraíba, é importante destacar que essa piora nos resultados da população projetada com as estimativas bayesianas ocorrem após a compatibilização das populações municipais com a população da área maior de referência. De posse dos gráficos das figuras V.3 e V.4 observamos que a relação entre os erros das projeções originais e os erros das projeções bayesianas, antes da compatibilização, indica não haver diferença significativa entre os dois métodos, pois as retas “preta” e “vermelha” são praticamente coincidentes.

Desta forma, os resultados na região do Vale do Paraíba estão mais ligados ao processo de ajuste das populações municipais projetadas através da compatibilização do que a problemas conceituais da metodologia bayesiana.

Cabe esclarecer que, a reta preta é a reta de regressão entre as duas variáveis do gráfico, sendo o eixo y a variável resposta. Já a reta vermelha é a reta bissetriz. Portanto, nos casos de Presidente Prudente e Bauru observamos, com base no deslocamento da reta preta com relação à reta vermelha, que os municípios que tiveram os maiores erros com a projeção original obtém erros bem menores quando a projeção é realizada a partir de estimadores bayesianos.

(16)

Figura V-3. Diagrama de dispersão entre os erros relativos absolutos da população total FEMININA projetada pelo “método das componentes demográficas

proporcionais” original contra os erros observados na projeção pelo método

bayesiano geral (Populações não compatibilizadas)

0 50 100 150 05 0 10 0 15 0

Reg. de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a 0 20 40 60 02 0 40 60

Reg. do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a 0 10 20 30 40 01 0 20 30 40 Reg. de Bauru

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a

Figura V-4. Diagrama de dispersão entre os erros relativos absolutos da população total MASCULINA projetada pelo “método das componentes demográficas

proporcionais” original contra os erros observados na projeção pelo método

bayesiano geral (Populações não compatibilizadas)

0 50 100 150 05 0 10 0 15 0

Reg. de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a 0 20 40 60 80 0 20 406 08 0

Reg. do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a 0 10 20 30 40 0 102 0 304 0 Reg. de Bauru

Fonte: Dados de Waldvogel,B.(1997)erro da proj original

er ro da p roj b ay e si an a

Resultados e avaliação da estrutura etária da população projetada por sexo

Além da avaliação da população total é importante verificar a qualidade da distribuição etária da população projetada. Vamos usar a mesma lógica de análise utilizada para os erros relativos absolutos da população total. Nesse sentido, as figuras

V.5 e V.6 se referem à diferença do erro relativo absoluto médio da estrutura etária da

população projetada pelo método original com relação ao erro relativo absoluto médio da estrutura etária obtido a partir da projeção bayesiana. Com isso, os pontos que estão dispostos abaixo do eixo x indicam que a estrutura etária da população projetada pelo método bayesiano foi, em média, pior que a estrutura etária da população projetada pelo método original.

(17)

Neste sentido, com estes gráficos observamos que em geral a estrutura etária da população projetada pelo método bayesiano é melhor que a estrutura etária da projeção original.

No que tange à população feminina, figura V.5, notamos que nas três regiões estudadas a estrutura etária da população final obtida com a projeção bayesiana é, em média, melhor do que a estrutura etária gerada pela projeção original.

Entre os municípios da região de Presidente Prudente, a estrutura etária da população feminina obtida com a projeção bayesiana é melhor em 80,4% dos municípios. Na região do Vale do Paraíba, o erro relativo absoluto médio da estrutura etária é menor em 62,5% dos municípios quando usamos a projeção bayesiana. Já nos municípios da região de Bauru, a estimação das componentes demográficas proporcionais pelo método bayesiano melhora a estrutura etária da população projetada em 83% dos municípios.

Com relação à população masculina, nas regiões de Presidente Prudente e Bauru também observamos uma melhora considerável na estrutura etária da população projetada pelo método bayesiano. No que se refere aos municípios de Presidente Prudente, em 71,7% deles a metodologia bayesiana melhora a estrutura etária da população projetada. Na região de Bauru, o erro relativo absoluto médio da estrutura etária é menor em 78,9% dos municípios quando usamos a projeção bayesiana. No Vale do Paraíba, não observamos primazia de uma metodologia com relação à outra. Nesta região, a projeção bayesiana melhora a estrutura etária da população com relação à projeção original em 15 dos 32 municípios (47%).

(18)

Figura V-5. Diagrama de dispersão entre os erros relativos absolutos médios da estrutura etária da população FEMININA projetada pelo “método das

componentes demográficas proporcionais” original contra os erros relativos

absolutos médios da estrutura etária observados na projeção pelo método bayesiano geral 7 8 9 10 11 -4 -2 02 468 10

Região de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 12 -6 -4 -2 0 2 4 6

Região do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 01 0 20 30 Região de Bauru

Fonte: Dados de Waldvogel,B.(1997)log da população

di

fe

re

a

Figura V-6. Diagrama de dispersão entre os erros relativos absolutos médios da estrutura etária da população MASCULINA projetada pelo “método das

componentes demográficas proporcionais” original contra os erros relativos

absolutos médios da estrutura etária observados na projeção pelo método bayesiano geral 7 8 9 10 11 -5 0 5 10

Região de Presidente Prudente

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 8 9 10 11 12 -4 -2 0 2 4

Região do Vale do Paraíba

Fonte: Dados de Waldvogel,B.(1997)log da população

di fe re nç a 7 8 9 10 11 0 102 0 304 0 Região de Bauru

Fonte: Dados de Waldvogel,B.(1997)log da população

di

fe

re

a

Para finalizar, apresentamos os mapas com a configuração espacial dos erros médios da estrutura etária da população projetada pelo método das componentes demográficas proporcionais na sua forma original e da população projetada com as estimativas bayesianas das componentes demográficas proporcionais.

Os mapas V.1 e V.2, são relativos à estrutura etária da população feminina. Ao compararmos esses dois mapas observamos a diminuição dos erros quando usamos a projeção bayesiana.

(19)

Mapa V-1. Configuração espacial dos erros da estrutura etária da projeção ORIGINAL das populações FEMININAS municipais das três regiões do estudo

0

150

kilometres

300

Erros da est etária 16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8 0

150 kilometres 300

Erros da est etária 16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8 Erros da est etária

16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8

Mapa V-2. Configuração espacial dos erros da estrutura etária da projeção BAYESIANA das populações FEMININAS municipais das três regiões do estudo

0

150

kilometres

300

Erros da est etária 16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8 0

150 kilometres 300

Erros da est etária 16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8 Erros da est etária

16,9 e mais 13,2 a 16,9 10,8 a 13,2 8,8 a 10,8 6,8 a 8,8 2,4 a 6,8

Para a população masculina temos os mapas V.3 e V.4 que apresentam padrão semelhante ao verificado na população feminina. A exceção fica na região do Vale do Paraíba, pois como vimos na análise dos gráficos, nesta área os dois métodos de projeção praticamente se equivalem no que se refere à estrutura etária da população projetada.

(20)

Mapa V-3. Configuração espacial dos erros da estrutura etária da projeção ORIGINAL das populações MASCULINAS municipais das três regiões do estudo

0

150

kilometres

300

Erros da est etária 15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4 0

150 kilometres 300

Erros da est etária 15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4 Erros da est etária

15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4

Mapa V-4. Configuração espacial dos erros da estrutura etária da projeção BAYESIANA das populações MASCULINAS municipais das três regiões do estudo 0

150 kilometres 300

Erros da est etária 15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4 0

150 kilometres 300

Erros da est etária 15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4 Erros da est etária

15,6 e mais 12,8 a 15,6 10,6 a 12,8 9 a 10,6 7,4 a 9 3 a 7,4 VI Considerações finais

Dentre as várias áreas de atuação dos demógrafos, a projeção de população é, talvez, a mais susceptível a erros e avaliações. Num exercício de projeção populacional o objeto de estudo é extremamente volátil e seu comportamento futuro é regido por uma quantidade muito grande de variáveis que o pesquisador deve levar em consideração na hora de formular suas hipóteses sobre a tendência do crescimento populacional.

(21)

A atenção dos demógrafos deve ser redobrada quando os estudos são focados em áreas menores, pois a variabilidade das variáveis que regem a dinâmica demográfica é ainda maior e, acrescido o problema da falta de qualidade nos registros dos eventos populacionais de algumas regiões, aumenta sobremaneira a dificuldade de obter precisão nas projeções realizadas.

Conceitualmente o método das componentes demográficas é, sem dúvida alguma, a melhor metodologia para projeção populacional, pois é o único procedimento que considera as três componentes básicas que regem a dinâmica demográfica: fecundidade, mortalidade e migração.

Neste sentido, partindo do pressuposto bastante razoável de que os serviços de registros de informações estarão constantemente em evolução, é imperativo que o método das “componentes”, passe a ser adotado em larga escala nos exercícios de projeção, não só para áreas maiores, mas também em pequenas áreas, servindo inclusive de instrumento de avaliação dos registros dos eventos demográficos como: óbitos, nascimentos e número de migrantes.

Diante disso, aproveitamos o trabalho de Waldvogel (1997) com a conclusão de que o método das componentes demográficas, adaptado para pequenas áreas com o nome de componentes demográficas proporcionais é o que produz os menores erros de projeção. Com isso, estimamos as componentes proporcionais através de metodologia bayesiana com o objetivo principal de diminuir a variabilidade dos estimadores e, assim, obter maior precisão no resultado da projeção.

Os exercícios empíricos foram realizados em 116 municípios de três regiões administrativas do Estado de São Paulo, caracterizadas por três cenários distintos. Entretanto, não temos a pretensão de esgotar as questões sobre projeção populacional. É evidente, por exemplo, a necessidade de verificar a eficácia do método das componentes demográficas proporcionais, seja com o procedimento usual, seja com a utilização de estimadores bayesianos, em áreas onde a qualidade dos registros não é tão boa como em São Paulo. Apesar disso, o uso de 116 municípios em três cenários demográficos distintos referencia os resultados como um bom indicativo da qualidade dos métodos empregados.

Passando a abordar diretamente os métodos utilizados, os resultados apresentados das populações totais projetadas e compatibilizadas com a população da

(22)

área maior de referência revelam que, nas regiões de Presidente Prudente e Bauru a projeção com os estimadores bayesianos para a população feminina foi melhor em 58,3% dos municípios. Para os homens, o método bayesiano foi melhor em 64,3% dos municípios. Quando incorporamos os resultados da região do Vale do Paraíba, onde o procedimento bayesiano não obteve resultados satisfatórios, os números gerais são 50% para mulheres e 56% para os homens.

Esses números são animadores, principalmente nas regiões de Presidente Prudente e Bauru, uma vez que os dados que utilizamos já haviam passado por uma suavização realizada no trabalho inicial de Waldvogel (1997). Para os dados de nascidos vivos e óbitos no ano base da projeção (1970) foi usada a média dos registros do triênio 1969, 70 e 71. Diante disso, podemos supor que o método bayesiano não tenha tido uma boa performance entre os municípios do Vale do Paraíba por que esta região abriga os municípios mais populosos do período e, talvez, a média do triênio 1969-71 tenha sido suficiente para amenizar os efeitos das flutuações aleatórias.

Com os resultados apresentados no capítulo anterior, ficou evidente que a grande vantagem de estimar os parâmetros demográficos proporcionais através da metodologia bayesiana foi observada na qualidade da estrutura etária da população projetada.

No que se refere à população feminina, a estrutura etária resultante da projeção bayesiana foi melhor em 80,4% dos municípios da região de Presidente Prudente, em 83% das pequenas áreas estudadas na região de Bauru, e em 62,5% dos municípios do Vale do Paraíba. Com isso, no total das três regiões estudadas, a projeção bayesiana foi melhor do que a projeção original em 75% dos municípios.

Com relação à população masculina, a estrutura etária foi mais bem projetada pelo método bayesiano em 71,7% dos municípios de Presidente Prudente, em 79% na região de Bauru, e em 47% dos municípios do Vale do Paraíba. Desta forma, cotejando a projeção original com a bayesiana no total das três regiões, a estrutura etária da população masculina projetada pelo método bayesiano ficou mais próxima da estrutura etária da população censitária em 67% dos municípios.

Por fim, é importante esclarecer que o conceito de vizinhança espacial utilizado nesse trabalho, onde consideramos como vizinhos os municípios pertencentes a uma mesma região administrativa, pode ser pensado no âmbito de similaridades demográficas. Desta forma, estaríamos estimando os parâmetros demográficos

(23)

proporcionais a partir das informações de municípios similares segundo alguma característica demográfica.

VII Referências bibliográficas

ASSUNÇÃO, R.M. Estatística espacial com aplicações em epidemiologia, economia, sociologia. 7a Escola de Modelos de Regressão. São Carlos. ABE, 2001.

ASSUNÇÃO, R.M., BARRETO, S.M., GUERRA, H.L. & SAKURAI, E. Mapas de taxas epidemiológicas: uma abordagem bayesiana. Cadernos de Saúde Pública, Rio de Janeiro, v 14, n.4, 1998.

ASSUNÇÃO, R.M., POTTER, J.E.; CAVENAGHI, S. Estimação de curvas de fecundidade para pequenas áreas com modelos bayesianos espaciais. In: ENCONTRO NACIONAL DE ESTUDOS POPULACIONAIS, 11, 1998, Caxambu. Anais ...:Belo Horizonte: ABEP, 1998. (CD-ROM)

BERNARDINELLI, L.; MONTOMOLI, C. Empirical Bayes versus fully Bayesian analysis of geographical variation in disease risk. Statistics in Medicine, v.11, n.8, p.:983-1007, 1992

CLIFF, A .D.; ORD, J.K. Model building and the analysis of spatial pattern in human geography (with dicussion). J.R. Statistical Society, B 37, p. 297-328, 1975.

DIGGLE, P.J. Appoint process modelling approach to raised incidence of a rare phenomenon in the vicinity of a prespecified point. Royal statistical society, A, 153, p. 349-362, 1990.

DRAPER, N.; SMITH, H. Applied regression analysis. 2. ed. New York : John Wiley & Sons, 1981..

FONSECA, J.S, MARTINS, G.A. Curso de estatística. 3. ed. São Paulo : Atlas, 1982. FREIRE, F.H.; ASSUNÇÃO, R.M. Intervalo de confiança para a taxa de fecundidade

total de pequenas áreas. In: ENCONTRO NACIONAL DE ESTUDOS POPULACIONAIS, 11, 1998, Caxambu. Anais... Belo Horizonte: ABEP, 1998. (CD-ROM)

(24)

HOEL, P.G.; PORT, S.C.; STONE,C.J. Introdução à teoria da probabilidade. Rio de Janeiro : Interciência, 1978.

GHOSH, M.; RAO, J.N.K. Small area estimation: an appraisal. Statistical science, v.9, n.1, p. 55-93, 1994.

GIRALDELLI, B .W. Parâmetros demográficos proporcionais: uma alternativa para aplicar o “método dos componentes” para projetar a população de áreas pequenas.

Informe Demográfico, São Paulo, n.22, p. 1-27, 1989.

GOLDBERG, D., RAO, V.R.; NAMBOODIRI, N.K. A test of the accuracy of ratio - correlation population estimates. Land Economics, v.40, n.1, p. 100-102, 1964. LEE, P.M. Bayesian statistics: an introduction. New York: John Wiley & Sons, 1997. MARSHALL, R. Mapping disease and mortality rates using empirical bayes

estimators. Statistics in Medicine. v.40, n.2, p.283-294, 1991

WALDVOGEL, B. Técnicas de projeção populacional para o planejamento

Referências

Documentos relacionados

Os dados deste trabalho permitem concluir que a fenologia é uma ferramenta que pode vir a ser utilizada na determinação da zona ripária.. salientar que esta área de

A combinação dessas dimensões resulta em quatro classes de abordagem comunicativa, que podem ser exemplificadas da seguinte forma: interativo/dialógico: professor e

II – quatro servidores da Justiça Eleitoral, sendo pelo menos um da Corregedoria Regional Eleitoral, um da Secretaria Judiciária e um da Secretaria de Tecnologia da Informação.

Esta chave possui travamento de fonte de energia para isto foi desenvolvida com duas posições de cadeado, pode ser travada no ligado para evitar desligamentos desautorizados

Com o intuito de contribuir para o melhor desempenho do Projeto Agente Jovem, são formuladas algumas recomendações, entre as quais destacam-se as que propõe ao MAS que:

Avaliada pela banca como uma questão de nível médio, obteve grau de dificuldade “difícil” para os candidatos inscritos. A proposição de número 01 (la canción trata de

Os Sistemas de Informação Geográfica foram utilizados para a integração de dados espaciais e dados do meio físico, permitindo o cruzamento dos condicionantes dos

O COPOM encerrou o ciclo de aperto monetário em grande estilo: fez o aumento de 0,50 ponto percentual que era esperado pelo mercado depois da revisão da meta de superávit primário,