• Nenhum resultado encontrado

Método Bayesiano de Relação de Coortes para Projeções de Pequenas Áreas

N/A
N/A
Protected

Academic year: 2021

Share "Método Bayesiano de Relação de Coortes para Projeções de Pequenas Áreas"

Copied!
24
0
0

Texto

(1)

Método Bayesiano de Relação de Coortes

para Projeções de Pequenas Áreas

Renato M. Assunção UFMG /Depto. de Estatística

Palavras-Chave: Projeções populacionais, modelos hierárquicos, modelos estatísticos de projeção.

1. Introdução

O método de projeções municipais atualmente em uso no IBGE é o chamado método Apportionment proposto por Pickard (1959) e introduzido no Brasil por Madeira

e Simões(1972) com o nome de método dos coeficientes ou método Ai Bi. Este método

possui algumas limitações, como apontado por Waldvogel (1998), sendo uma delas a má qualidade das projeções nos casos em que há uma diferença grande entre a tendência de crescimento na área maior e no município. Ele não é um método adequado para projetar populações de regiões com áreas muito heterogêneas e com forte inversão de tendência de crescimento entre elas.

O desejo de melhorar o procedimento de projeção demográfica do IBGE levou o Departamento de População e Indicadores Sociais (DEPIS) da Diretoria de Pesquisas (DEP) a uma série de estudos e análises, com o apoio do Projeto FNUAP/Brasil (BRA94/PO8), Monitoramento da Evolução da População. Estes estudos consideraram

a possibilidade de substituir o método Ai Bi atualmente em uso, sendo que o método

escolhido para uma análise mais aprofundada e para uma série de experimentações foi aquele de relação de coortes proposto por Duchesne (1987).

O método de relação de coortes de Duchesne utiliza um fator de crescimento de uma coorte da área menor relativamente à mesma coorte da área maior em que ela está inserida. Este fator de crescimento diferencial é chamado de fator K e é o elemento crucial neste método. Basicamente, Duchesne (1987) propõe projetar a população, por idade e sexo, de cada área menor através da aplicação das taxas de crescimento das

Trabalho apresentado no XIII Encontro da Associação Brasileira de Estudos Populacionais, realizado

(2)

coortes da área maior, no período de projeção, modificadas pelo fator de crescimento diferencial K. As taxas de crescimento da área maior são obtidas por um método de componentes e supostamente estão levando em conta os padrões de mudança na fecundidade, mortalidade e migração da área maior. O fator K é o único elemento na metodologia que é específico da área menor.

O presente trabalho é um desenvolvimento adicional deste esforço institucional do IBGE para fornecer à sociedade as melhores projeções populacionais possíveis para os municípios brasileiros. Nós utilizamos uma metodologia bayesiana hierárquica para obter melhores estimativas para os fatores de crescimento diferenciado K da metodologia de relação de coortes proposta por Duchesne. Nós adotamos um modelo estocástico para representar a variabilidade dos fatores K entre as áreas e as faixas etárias. Nós fazemos uma decomposição da variabilidade dos fatores K como sendo a soma de parcelas associadas às faixas etárias, às pequenas áreas e mais um erro aleatório não associado com os demais fatores, mas com variância dependente do tamanho populacional da pequena área.

O uso mais intenso de métodos bayesianos modernos em estatística foi explosivo na década de 90 e, como seria de se esperar, isto vem se refletindo num número crescente de publicações em demografia utilizando esta metodologia de análise de dados. No caso específico de projeções populacionais com métodos bayesianos, Daponte, Kadane e Wolfson (1997) projetaram a população iraquiana usando um método de componentes demográficos. You e Rao (2000) usaram modelos bayesianos hierárquicos para fazer estimação de proporções em pequenas áreas. Murphy e Wang (2000) analisaram a influência que a educação materna e o intervalo entre nascimentos tinham na mortalidade infantil, mostrando que a capacidade preditiva de um modelo bayesiano era muito maior que a de modelos usuais de história de eventos (ou análise de sobrevivência) e, mais surpreendentemente, levavam a conclusões diferentes sobre estes efeitos. Lewis e Raftery (1999) fizeram uma melhoria nos métodos de história de eventos introduzindo métodos bayesianos utilizando Monte Carlo via cadeias de Markov, como faremos também neste trabalho, para analisar o declínio da fecundidadde no Irã. Dunson e Zhou (2000) propuseram um novo modelo para analisar fertilidade e esterilidade que, para ser estimada adequadamente, precisa fazer uso de métodos bayesianos. Watier, Richardson, e Hemon (1997) também usaram métodos bayesianos

(3)

para modelar a dependência de respostas reprodutivas em características da gravidez. Bolstad e Manda (2001) decompuseram a variabilidade da probabilidade de mortalidade infantil em fatores devido à família e à comunidade em que mora a mãe e, para estimar o modelo, tiveram de fazer uso de técnicas de estatística bayesiana modernas. No Brasil, Assunção, Potter e Cavenaghi (1998) obtiveram melhores estimativas usando métodos bayesianos espaciais do que as obtidas pelos métodos usuais para os parâmetros do modelo de fecundidade de Coale-Trussell para pequenas áreas. Uma versão mais extensa deste trabalho foi publicada recentemente (Assunção, Potter e Cavenaghi, 2002). Isto mostra que existem vários artigos aparecendo recentemente utilizando técnicas bayesianas modernas para modelar e analisar dados demográficos. Esta tendência vai se acentuar à medida em que estas técnicas estão começando a ficar disponíveis para um público maior de usuários através de softwares e publicações didáticas (ver Assunção, 2000).

2. O método de relação de coortes

Como vários dos métodos de projeção de pequenas áreas existentes, o de relação de coortes procura projetar a área menor supondo que exista uma projeção para a área maior que seja razoavelmente confiável e precisa. Imagina-se então que o comportamento médio das pequenas áreas é o da área maior, modificado por um fator que leva em conta a discrepância entre a área menor e a maior. Os métodos diferem bastante em como levam a cabo este procedimento geral.

O método de relação de coortes começa considerando o crescimento temporal das coortes quinqüenais da área maior. Assuma que a região de interesse possua n áreas rotuladas pelo índice i com i=1,...,n. Além disto, existe um conhecimento completo da estrutura populacional por idade e sexo da área maior e de cada área menor em dois anos específicos. Geralmente, este conhecimento é obtido dos dois Censos Demográficos mais recentes, sendo que neste artigo vamos trabalhar com o Censo Demográfico de 1991 e com a Contagem Populacional de 1996. Os anos de 1991 e 1996 serão denotados por t=-5 e t=0, respectivamente. A projeção das áreas menores é feita separadamente para cada sexo. A seguir, sempre que nos referirmos a uma população estaremos considerando uma população de um sexo específico, a menos que o contrário seja dito explicitamente.

(4)

Na área maior, supomos que um método de projeção demográfica confiável, geralmente baseado num método de componentes, é aplicado gerando a estrutura populacional da área maior para todos os anos t de interesse na projeção. No ano t, a

população do grupo de (sexo e) idade quinquenal [x,x+5] é representada por e a

população com idade no intervalo [x+5,x+10] no ano t+5 é dada por . A razão

entre estes dois números fornece um coeficiente de crescimento projetado CR de cada coorte (e sexo): t x R 5 5 5 5 + + t x R t x t x t t x R R CR 5 5 5 5 5 , 5 + + + = (1)

Na área i e ano t, a população do grupo de idade quinqüenal [x,x+5] é

representada por 5 . Se supomos que o crescimento por coorte é idêntico para todas

as áreas, a projeção populacional na área i é muito simples. Exceto pelo grupo de 0 a 5 anos, partindo da população inicial na pequena área i, a projeção nesta hipótese pouco verossímil de homogeneidade espacial do crescimento seria dada recursivamente por

) (i Rt x ) ( ) ( , 55 5 5 5 5N i CR N i t x t t x t x + + + = (2)

Isto garantiria que a soma sobre todas as pequenas áreas de uma dada coorte seria igual ao valor populacional projetado para a área maior.

No entanto, é claro que a hipótese de homogeneidade espacial no fator de crescimento não é realista. As pequenas áreas diferem entre si, algumas variando mais ou menos que as outras em cada coorte. Assim, a essência do método proposto por Duchesne é aplicar um fator multiplicativo de correção ou ajuste à equação (2) que leve em conta a discrepância entre a área pequena e a área maior. Isto é, ele propõe projetar as coortes da área i de acordo com a seguinte equação

) ( ) ( ) ( , 55 5 5 5 5 5N i K i CR N i t x t t x x t x + + + = (3)

onde é o fator de ajuste da pequena área i. Este fator de ajuste é obtido comparando-se a variação temporal de uma coorte na área menor com a variação dessa coorte considerando a área maior. Ele é definido a partir das populações obtidas nos dois Censos Demográficos:

) ( 5Kx i 5 5 0 5 5 5 5 0 5 5 5 ) ( ) ( ) ( + − + ÷ = x x x x x R R i N i N i K (4)

(5)

O valor deste fator K vai girar em torno de 1 sendo que um valor menor que 1 é indicativo de crescimento menor do que na área maior, enquanto que um valor maior que 1 indica que a pequena área estaria com crescimento mais acelerado que aquele da

área maior. Assim, o coeficiente de crescimento projetado CR da área maior é

modificado de acordo com este fator de crescimento local relativo, baseado nos dois Censos disponíveis.

5 ,t+

t x

Observe que este fator de crescimento de uma coorte da área menor relativamente à da área maior é um valor calculado usando as duas estruturas populacionais existentes nos Censos e que ele não varia ao longo do processo de projeção populacional. É por este motivo que usamos uma notação um pouco diferente daquela usada em IPARDES (2000) ao omitirmos o índice t na definição do fator K em (4). Assunção (2001) mostrou matematicamente que as projeções ficam invariantes se o fator K variar ao longo das projeções (omitido por falta de espaço neste texto). Além disso, ele depende da definição do que constitui a área maior contendo a área menor.

Isto é, para uma área menor i, o fator depende de qual área maior está sendo

considerada (o estado todo, uma subregião do estado, uma mesoregião, etc). )

(

5Kx i

Na fórmula do fator K em (4), as faixas etárias para as quais são feitas as projeções devem ter um número de anos igual ao número de anos que separa as estruturas populacionais conhecidas. Quando o interesse reside em grupos quinqüenais, como na fórmula acima, os anos com as estruturas conhecidas devem ter uma distância temporal de cindo anos, t e t+5. No entanto, na maioria das situações, as estruturas populacionais conhecidas disponíveis para as pequenas área são aquelas obtidas pelos Censos Demográficos, os quais são separados, em geral, por 10 anos. Neste caso, modificações simples devem ser feitas nas fórmulas acima.

Nas projeções consideradas pelo IBGE, utilizando o método de relação de coortes, o fator K foi considerado constante dentro de cada faixa etária quinqüenal. Isto é, ele foi obtido a partir dos grupos etários quinqüenais e atribuído igualmente a cada idade simples componente do grupo. Assim, para efeito das várias análises efetuadas neste trabalho, vamos sempre trabalhar com apenas um valor do fator K para cada grupo etário, ao invés de trabalharmos com os valores das idades simples.

(6)

Ignoramos até agora os ajustamentos necessários para projetar as populações extremas. Os métodos para tal são semelhantes aqueles descritos acima mas, por falta de espaço, remetemos o leitor ao trabalho original de Duchesne ou a Assunção (2001) para detalhes. Após estimar as populações das pequenas áreas, faz-se um pró-rateio para que a soma das populações projetadas coincida com as populações projetadas na área maior.

3. Dificuldades com os fatores K

O elemento chave na metodologia proposta por Duchesne é o fator K. Ao término do cálculo destes fatores K, usando as fórmulas apresentadas anteriormente, uma série de modificações são necessárias para fazer frente aos valores extremos e inverossímeis que costumam ocorrer em vários municípios. De acordo com IPARDES (2000, página 13), ''nessa heterogeneidade se distinguem extremos, quer por crescimento quer por perdas muito elevadas que não podem ser perpetuadas. Como toda projeção tem por base o ritmo de crescimento anterior, nesses casos extremos é necessário relativizar essa tendência. No Paraná isso fica muito claro em municípios que elevaram bruscamente sua população, assim como em outros que, mantendo o ritmo, tenderiam a uma população zero. Nesses casos foi necessário um ajuste que implicou a aplicação de um redutor ou multiplicador no fator K, para que esse crescimento ou redução exagerada não fosse incorporado na projeção.''

Mais especificamente, no caso da população masculina do Paraná, aqueles municípios que possuiam algum fator K > 1.075 ou K < 0.875 foram considerados extremos e tiveram estes fatores K reduzidos através da extração de raiz quadrada ou raiz com outra potência. Esta operação tem o efeito de contrair os valores extremos em direção a 1 pois, se 1 < x então 1 < x < x e, se x < 1 então x < x < 1. Usar a raiz cúbica ou de potência mais elevada acentua este efeito de contração em direção a 1 pois,

no caso em que x < 1, por exemplo, temos x < x < a x se a > 2.

No gráfico da esquerda da Figura 1, mostramos no eixo horizontal os fatores K para diferentes faixas etárias da população masculina dos 399 municípios do estado do Paraná usando o Censo Demográfico de 1991 e a Contagem Populacional de 1996. No eixo vertical, estão os valores dos fatores K após reduções sucessivas obtidas através da aplicação da raiz quadrada, raiz cúbica, raiz quártica e com potência 3/2. O gráfico da direita da Figura 1 reproduz o gráfico anterior superimpondo as curvas matemáticas em

(7)

que estão baseadas as reduções, além da linha reta y = x que possui a maior derivada no ponto 1. Observa-se que existe um pequeno número de pontos que não se ajustam a nenhuma das linhas traçadas e que estão acima da reta y = x, indicando que, ao invés de sofrerem uma contração em direção a 1, eles foram transformados gerando fatores K que estão mais afastados de 1 que os seus fatores K originais.

fatores K originais fatores K reduzidos 0.8 0.9 1.0 1.1 1.2 0.8 0.9 1.0 1.1 1.2 fatores K originais fatores K reduzidos 0.8 0.9 1.0 1.1 1.2 0.8 0.9 1.0 1.1 1.2

Figura 1: Gráfico mostrando os fatores K originais e os fatores

K reduzidos através de operações matemáticas.

Do ponto de vista técnico, existe uma dificuldade em justificar teoricamente e de forma objetiva a escolha destas funções e os pontos de corte utilizados. Por um lado, é necessário reconhecer que certos valores do fator K, da forma originalmente calculada, não são possíveis. Por outro lado, a arbitrariedade da escolha dos pontos de corte na decisão de quais são os fatores K a serem modificados e das funções a serem aplicadas nestes casos abrem campo para que o método possa sofrer interferências subjetivas indesejáveis. Quanto mais sujeita a decisões subjetivas, mais questionável e criticável poderá ser a projeção. Estas decisões subjetivas de quais e como os fatores K deverão ser modificados devem ser tomadas localmente, provavelmente no nível estadual com consultas diretas ao nível municipal, e estas decisões poderão sofrer influências não técnicas e de interesse político ou econômico. Embora o conhecimento local seja imprescindível e não deva ser ignorado, um peso excessivo dado a ele pode tornar todo o processo de projeção do IBGE vulnerável a pressões políticas. O ideal é que

(8)

pudéssemos obter um método que, de forma automática, com boa justificativa teórica, e com um mínimo de interferências subjetivas, permitisse identificar e corrigir os valores extremos dos fatores K.

De acordo com comunicação pessoal com técnicos do IBGE, o trabalho envolvido neste processo de ajuste ou redução, como é chamado na instituição, envolve um alto custo em homem/hora e exige um trabalho qualificado de coleta de informações detalhadas sobre os municípios julgados como extremos. Com base nestas informações, é preciso tomar uma decisão subjetiva e, portanto, dependente dos técnicos envolvidos na análise, sobre a necessidade de contrair o fator K, bem como sobre o grau desta contração.

Considerando que os fatores K extremos realmente precisam ser modificados, sob pena de gerarmos projeções absurdas, vamos imaginar que o valor modificado será representado pela função M(K)=K. Observe que, no caso do Paraná, o IBGE junto com

o IPARDES, utilizou a seguinte transformação: M(K) = K se k1 < K < k2 e M(K) = K1/a

caso contrário, onde a depende do município e será, em geral, igual a 2 ou 3, conforme vimos acima.

É possível identificar algumas propriedades que a transformação M(K) deveria possuir: 1) Ela deveria ser capaz de reconhecer os valores extremos dos fatores K de forma automática. 2) Identificado um valor extremo, ela deveria ser capaz de corrigi-lo de forma automática, tornando-o mais realista para as projeções. 3) critério de identificação e correção deveria ter bases científicas e deveria ser justificado de forma teórica. 4) Todo este processo deveria ser objetivo, ou seja, os fatores K obtidos deveriam ser os mesmos se a análise fosse feita por um outro grupo de técnicos. Estes critérios nortearam a proposta que nós estamos fazendo neste trabalho. Ela possui as quatro características citadas acima e pode ser vista como uma tentativa de automatizar o processo de correção dos fatores K do método de Duchesne.

(9)

4. Um Modelo Estatístico para os fatores K

Como vimos, o elemento chave na metodologia proposta por Duchesne é o fator

K. Ele varia de acordo com a área e a classe de idade considerada. Assim, é possível

imaginar um modelo onde parte da variação destes fatores pode ser decomposta em parcelas que correspondem a diferenças de crescimento relativo entre as classes de idade e a diferenças de crescimento relativo entre as áreas.

Numa análise estatística, a abordagem mais tradicional para modelar uma quantidade aleatória K é encontrar os fatores que afetam mais fortemente esta quantidade aleatória K e descrever o impacto destes fatores através de uma combinação linear que é então relacionada com o valor esperado de K. Adotamos esta metodologia neste trabalho decompondo a variabilidade de K em duas parcelas. A primeira parcela está associada com um efeito da classe de idade considerada e a segunda parcela é intrínseca à área em questão e reflete uma flutuação aleatória causal.

Para simplificar a notação nesta seção do nosso trabalho, vamos adotar a

seguinte convenção. Seja Kij o fator K calculado na pequena área i e classe de idade j.

Vamos supor que, condicionado aos valores de parâmetros a serem especificados, o

valor esperado de Kij pode ser escrito da seguinte forma:

E(Kij) = µij = α + θi + βj

onde α representa um nível global para os fatores K, com valor aproximadamente igual

a 1. Os valores θ1 ,..., θn representam valores específicos das pequenas áreas, não

associados com idade e com a restrição de que Σi θi = 0. Já os valores β1,..., βA

representam as diferenças típicas entre valores de K de diferentes classes de idade de

uma mesma área e com a restrição de que Σj βj = 0.

Para finalizar nosso modelo, adotamos a seguinte distribuição estatística: Kij ~

Normal com valor esperado µij = α + θi + βj e variância σi2 onde a média µij é igual a α

+ θi + βj, uma combinação aditiva de duas parcelas, uma devido à idade j e outra devido

à área i. A variância depende da área i e é igual a σi2 = σ2/Ni onde σ2 é uma constante

desconhecida e é o tamanho total da população da área i no último censo disponível. Uma justificativa teórica e rigorosa para este modelo estocástico pode ser encontrada em Assunção (2001).

(10)

A dependência da variância no tamanho da população é intuitivamente simples de entender. Quando uma população numa dada área i é pequena, a razão de crescimento de uma coorte entre dois momentos do tempo é bastante influenciada por pequenas diferenças nos valores absolutos das contagens. Eventos aleatórios casuais e raros afetam ligeiramente a contagem da coorte entre os dois momentos do tempo. Se estes eventos não estão associados com processos demográficos sistemáticos e duradouros na área em questão, as contagens realizadas vão ser ligeiramente diferentes das contagens esperadas levando-se em conta apenas os processos demográficos subjacentes. Se a população da área i é grande, estas pequenas diferenças em relação ao valor esperado não afetam significativamente o valor da razão das contagens entre dois momentos do tempo. No entanto, se os tamanhos das coortes na área i são pequenos, o impacto na razão pode ser significativo.

Para completar a abordagem bayesiana e permitir a estimação dos fatores K, nós adotamos distribuições a priori convenientes para os parâmetros desconhecidos do modelo acima e, utilizando métodos de cadeia de Markov via Monte Carlo, obtemos a distribuição a posterior. Utilizamos a média a posteriori destas distribuições como estimador pontual dos parâmetros. O detalhamento destas implementações pode ser encontrado em Assunção (2001).

5. Avaliação dos métodos nos municípios do Paraná

Para avaliar nosso método e compará-lo com o de Duchesne, vamos utilizar o estado do Paraná para a análise. A razão principal para esta escolha é o fato de que o IBGE e o IPARDES já fizeram um minucioso trabalho de projeção demográfica para este estado utilizando a metodologia de Duchesne. IPARDES (2000) utiliza a metodologia de Duchesne, modificando os fatores K de acordo com o que foi apresentado na seção 3. Estas modificações envolveram grande discussão entre técnicos do IBGE e do IPARDES e foram feitas com bastante critério e conhecimento específico dos municípios. Assim, elas representam alguns dos melhores resultados que a técnica de Duchesne pode apresentar e servem como um bom teste para verificar se nossa metodologia automática consegue obter resultados similares a estas projeções feitas com grande custo para ambas as instituições.

(11)

A disponibilidade de dados do Censo 2000 de total populacional para os municípios do Paraná ajudou a criar uma forma simples de avaliar o desempenho dos métodos de projeção. Baseados apenas nos dados do Censo de 1991 e da Contagem populacional de 1996, nós projetamos as populações dos 399 municípios do Paraná até o ano de 2000 através de vários métodos: 1) Relação de coortes sem modificação dos fatores K. 2) Relação de coortes com a modificação dos fatores K realizada pelo IPARDES/IBGE e publicada em IPARDES (2000). 3) Relação de coortes com a modificação dos fatores K pelo método bayesiano.

Todas as populações envolvidas neste trabalho, tanto as projetadas quanto as do Censo de 2000, estão com data de referência na metade do ano, ou seja Primeiro de Julho de 2000. As projeções dos diversos métodos foram comparadas com a contagem realizada pelo Censo 2000 e a diferença foi considerada como o erro de projeção efetuado pelo método. Os erros de projeção foram então analisados estatísticamente para avaliar os métodos acima. Nós não consideramos neste trabalho o problema de erros nas contagens censitárias. Este é um assunto complexo e além dos objetivos deste trabalho.

Uma análise exploratória simples mostra que há fortes evidências de efeitos de área e efeitos menos acentuados de idade nos fatores K. Nós utilizamos os valores dos fatores K das 17 faixas etárias quinqüenais não modificados e obtidos através da fórmula (4). Todos os dados abaixo referem-se apenas aos valores K da população masculina sendo que as conclusões e resultados são idênticos para o caso da população feminina.

A variabilidade dos fatores Kij depende fortemente da área i e boa parte de sua

variação está associada com as diferenças entre os municípios. O gráfico da Figura 2 ilustra isto de forma bastante nítida. No eixo horizontal, temos o índice i do município variando de 1 a 399, sendo que os municípios foram rotulados em ordem crescente de

acordo com a média sobre as classes de idade dos seus 17 valores Kij. No eixo vertical,

o gráfico mostra os 17 fatores Kij de cada um dos 399 municípios do Paraná de modo

(12)

1 111 1 1111111 11 1 1 1 11 11 1 1 11 11111111111111 1 1 111 1 111111111111111111111 1 1111 1 11111111111111 1 11 11111111 1 111111111 111 11 1 1 111111111111 1 1111 1 1 11111111 1111 1 1 1 111 1111111 1 111111 111111 1 1111111 1 1 1 111111 1 111111111111111111 1 1 111111 1 1111111 1 111 1 1 1 1111 11 1 111 1 1 1 1 1 111 11 1111 1111111111111111111 1 11111111111111 1 111111111111111 1 1111111111111111111 1 1111 1 111 1 11111111111111111 1 1111111111111111111 11111111 11 1 1 1111 1 1 1 1 1 1 1 111 1 1 22 22 22222222222 2 22 2 22222222222222222 2 22222222222222222222222222 2 2222222222222222 2 2222222222222222 2 222222222222 22 2 2 22222222222222222 2 2 2 22222222222 2 2222222222222222222 2 222222222222222 2 2222222222222222222222222222222222222222222222222222222222222 2 22222 2 2222 22222222222 22222 2 22 2222222222222222222222222222222 2 2222222222 2222222222222222222222 2 22222222222222222222222222 2 222 2 2222222222 2222 2222 222 2 2 2 22222 2 333 3 33333333333333 3 3 3 3333333 3 33 3 33 33 3 33333333333333333333333333 3 3 333333 3 333 3 3333 3 3333333 3 33333333333 33 3333333 3 3333333333333333333333333333333333333333333333333333333 33 3333333 3 333333333333333333333333333333333 3 33333333333333 3 33333333333333333 3 3333333333333333333 333333 3 3 3 33333333333333333333333333333333333333333 3 333333333333 3 3333 3 333333333333333333333333333333333333 33 3333333 333 3333333333333 3 333333 3 4 4 4 4 4 4 4444444 4 4 4 444444 4 4444 444 4 4 444 4 4 4 4 4444444 444 4444 4 444444444 4 444444 44 4444444 4 4 44 444 444444 4 4 4 44 4 4 4 4444444444 4 4 4 4 444444 44 44 44 4 44 4 44444444 4 4444 4444 4 4 4 4 4 4444 44 444 4 4 4 4 44 4 444 4 44 4 44444 4 44444444 4 4 4 4444444 4 4 44444 44444444 44444444 4 4 444444 4 4 4 4 44444 4444 4 44 44 4 44 4 4444 4 444 4 4 4 4 4444444444444444444 4 4444444444444444 4 4444 4 4 4 44 4444 4 444444444 4 4444 4 4444 4 4 44 4 4 44444 4 4 44444 4 44 4 4 4 4 4 4 4 4 4 44 444 44 44 4 444 44 4 4 4 4 4 4 4444 4 4 4 4 44 4 4 44 5 5 5 5 5 55555 5 55 5 55 5 5 55 5 5 5 55 5 5 555 5 5 5 5 5 55 5 555555 5 555 5 5555 5 55555 5 5 5 5 5 55 5 555 5 5 5555555 5 5 55 5 5 5 55 5 5 55 5 5555555555 5 5 55555 555 5 555555555555 5 55 5 55555555 5 555 5 555555 5 5 5 5 5 555 5 5555 55 55555 5 5 5 5 5 5 5 5 5555 555555 5 555 5 5555555 5555555 5 5 55 555555555555 5 5 555555 5 5 5555 5 5555 55 5 5 5 55 5 5555 55 555555 5 5 5 555 5 5 5 5 55 55555 555555555 5 5 55555555 5 555555555 5 555 55 5 5 5555 55 5 5 5 5 5555 5 5555 5 5 55 5 5 55555 5 5 5555 5 5 55 5 5 5 5 5 5 5 5 5 55555 5 5555 5 55 5 55 5 5 5 5 555 555 5 55 55 5 5 5 5 66 6 6 6 66666 6 66 6 66 6 666 6 666 6 66 666 6 6 6 6 66 6 6 6 66 666666666 6 6666666 6 6666666 6 6666 6 6 666666 66 6666666 6 6 6 6 6 6666666666 6 6 666 6666666 6 6666 66 6 666666666666666 6 666666 6 666666666666 6 666 6 666666 6 6 6 6 6 66 6 6666666 666 6 666 6 6666666666 6 6 666666666666 6666666 6 6666666 6666 6 6 666666666666 6 6 66 6 66666666 6 66666666 66 6 666 6666666666 66 666666666666666 6666666 66 6 66666666 6 6 6 6666 666666 6 66666 6666666666666666666 666 6 6 6 6 6666666 6 6666 6 66 6 6666 666 6 66 6 66666 7 7 777 777777 77777 7 77777777 7777 77 7 77 777777777777 7 777 7 777 7 7 7 7 7 777777777777 7 7 7 7 7777777777 7 777777777777777777777777 7 7777777777777777777777777777777777 7 7777 7 77 77777 7 77777777777 7 7777777 77777777 777 77777777777777 7 77777777 7 7777 7 777777777777777777777777777777777 7 77777777777 7777777777 7777777777777777 77777 7777 7 777777 7 7 7777777777777777777 77777777777777777777777777777 7 777777 77 7 7 7 7 7 7777777777 7 7 7777777 77 7 7 7 7 77 7 7 7 8 8 88 8 888888 8 8888 8 88888888888888 8 88 88 8 888888888888888888888888888 8888888888888888 8 8888 8 888888888888888888888888888888888888888888888888888888888888888888888888 8 888 8 8888888888 8 8 88888888888888888888888 8 8888 8 88888888 8 8 888 8 888888 8 8888888888888888 8 88 8 8888888888888888888888888 8 888888888888888888 8 88888888 8 8888888 8 888888888888888888888888888888888888888 8888 8888888888888888888 88888 8 8888 8 8 88888888 88888 88 8 8 8 9 9 9 9 9 9 99999 9 9999 9 999999999999 9 99 9999 9 9 999999 9 999999999999 9 9 9 9 99 9 9999999 9 999 9 9999 9 9 9 99 9 999999999999999999999 9 99999999999999999 999999 9 999999999999999999 9 9999999999999999999 9 999 9 999999999 9 999999 9 9999999 9 99999 99999999999 9 9 999999 9 9999999999999999 9 999 999 9 99 9 9 999 9 99999 9 9 999999999999999999999999 9 9 99999999999999 9 9 9 9999999999999999999 99 99999 9 9 9999999999999 99 9 9 999999999999 99999 99999 99999 9 9 9999999999 999 9 9 9 9 9 0 0 00 00 0 00 0 0 00000 0 0 0 00 0 0000000 0 00 0000 00 0 0 00000000000000 0 0 0 00 0 00 0 00000 0000000 0 0000 0 0000000 0 00000 0000 000 0 000 0 0000 00 00 0000 000000000 000 00 000000000000000000 0 00 0 00000000 0 0000000000 0 00000000000000000 0 0000 0 00000000 0 0000000000000000000000000000 0 000000000 0 00000 0 0 000000000000000000000 0 00000000000000 0 00000000000000000000000000000000000000000000000000000000000000 0 00000000 000 00000 0 0 00 0 0000000 0 0000000000 000 0000 0 a a aaaa a a a a aaaaaaaa a aaaaaaaaaa aaaaaaa aa aa aaa aaaaaaa a aaaa aaaaaaaaa a aaa a aaaaaa a aaaa a aaaaaaaaaaaaaaaaaa aa a aaa a aaaaaa a aa a aaaaaaa aa a a a a a a a aa a a aaaaaaa aaaaaaa a aaaaaaaaa a a a aaaaaaaaaaaaaa

a aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

a aaaa a a a aaaa a aaaaaaaaaaaa a aaaaaaaaaaaaaa a aaaaaa a a a aaa a aaaa a aaaaaaaaaaaaaaaaaaa aaaaa a aaaaaa a aa aaa a aaaa a aaaaaaaaaaaaaaaaaaa a aaaaaaaaaaaaaaaaaaaaaaa

a aaaa aaaa a aa a aaaaaaa a aaaaaaa a a a a a a aaaa a bbb b b b b b bbb b bbbbbb b bbbbbbbbbbbbbb b b b b bbb b bbb b bbbbbbbbbbbbbbbb bbbbbbbbb b bb bbb bbbbbbbbbbbbbbbbbbbbbb b bbbbbbbbbbbbb b bb b b bbbbbb b b b b bbbb bb b bb bb b bb bbbbbb b bb b bbbbb b bbbbb b bbb b bbbbbbbbb b bbbbbb bbbbbbbb b bbbbbbb bbb b b bbbb bbbb b bbbbbbbbbbbbbbbbb bbbb bb bbbb bb b bbbbbbbbbbbb b b bbbbb b bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb b bbbbbbbbbb b bb b bb b bbbbbbbbbb bb b bbbbbb b bbbbbbbbbb b b bb b b b b bbbbb b b b b bb bbbb b bbbb b bbbb b b b bbbbbbbb bbbb bbbb c ccc c ccccc c cc c c c c c c c c c c cccccccc c ccc c cc c cccccccccccccc c c cccccccc c cc cc cc ccccc c ccc cc c cccccc c c cc c cc cccccccccccccccccccccccccccccccc c cccccccccc c cccccc c c c cc c ccccccc ccccc cccccccc c cc c c ccccccc ccc ccccccccc c ccc c ccc ccccccc c ccccccccccccccccccc c cc ccc cccccccccccc c cc c c cccccccc c c c c ccccc c cc c ccccccccccccccccccccccc c c c cccccccccccccc c cccc ccccc c cccc c c ccccc c cccc cc cc ccccc c c c ccccccccc c c c cccc cccccccccc cc c ccccccccccc c cc cc c d ddd d ddddd d dd d d d d d d d d d ddddddddd d ddd d dd d dddddddddddddd d d dddddddd d dd dd d d ddddd d ddd dd d dddddd d d dd d dd dddddddddddddddddddddddddddddddd d dddddddddd d dddddd d dd dd d ddddddd ddddd dddddddd d dd d d ddddddd ddd ddddddddd d ddd d ddd d dddddddddddddddddddddddddd d dd ddd dddddddddddd d dd d d dddddddd d d dddddddd dd d ddddddddddddddddddddddd d d d dddddddddddddd d dddd ddddd d dddd d d ddddd d dddd dd dd d ddddd d d ddddddddd d d ddddd dddddddddd dd dddddddddd dd d dd dd d e eee e eeeee e ee e e e e e e e e e eeeeeeeee e eee e ee e eeeeeeeeeeeeee e e eeeeeeee e ee ee e e eeeee e eee ee e eeeeee e e ee e ee

eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee e eeeeeeeeee e eeeeee e ee ee e eeeeeee eeeee eeeeeeee e ee e e eeeeeee eee eeeeeeeee e eee e eee e eeeeeeeeeeeeeeeeeeeeeeeeee

e ee eee eeeeeeeeeeee e ee e e eeeeeeee e e eeeeeeee ee e eeeeeeeeeeeeeeeeeeeeeee

e e e eeeeeeeeeeeeee e eeee eeeee e eeee e e eeeee e eeee ee ee e eeeee e e eeeeeeeee e e eeeee eeeeeeeeee ee eeeeeeeeee ee e ee ee e f fff f fffff f ff f f f f f f f f f fffffffff f fff f ff f ffffffffffffff f f ffffffff f ff ff f f fffff f fff ff f ffffff f f ff f ff ffffffffffffffffffffffffffffffff f ffffffffff f ffffff f ff ff f fffffff fffff ffffffff f ff f f fffffff fff fffffffff f fff f fff fffffff f fffffffffffffffffff f ff fff ffffffffffff f ff f f ffffffff f f f f fffff f ff f fffffffffffffffffffffff f f f ffffffffffffff f ffff fffff f ffff f f fffff f ffff ff ff f fffff f f fffffffff f f fffff f f ffffffff ff ffffffffffff f ff ff f g ggg g ggggg g gg g g g g g g g g g ggggggggg g ggg g gg g gggggggggggggg g g gggggggg g gg gg g g ggggg g ggg gg g gggggg g g gg g gg gggggggggggggggggggggggggggggggg g gggggggggg g gggggg g gg gg g ggggggg ggggg gggggggg g gg g g ggggggg ggg ggggggggg g ggg g ggg g gggggggggggggggggggggggggg g gg ggg gggggggggggg g gg g g gggggggg g g gggggggg gg g ggggggggggggggggggggggg g g g gggggggggggggg g gggg ggggg g gggg g g ggggg g gggg gg gg g ggggg g g ggggggggg g g ggggg gggggggggg gg gggggggggg gg g gg gg g municipio fatores K 0 100 200 300 400 0.8 0.9 1.0 1.1 1.2

Figura 2: Gráfico do índice i do município (eixo horizontal)

versus seus fatores Kij (eixo vertical) dos 399 municípios do

Paraná.

Os municípios nas duas extremidades do eixo horizontal mostram fatores K bastante distintos e observamos que eles tendem a aumentar suavemente à medida que o índice i aumenta. Assim, é bem forte a associação entre os fatores K de uma mesma área. Quando observamos este mesmo tipo de gráfico separadamente por classe etária podemos constatar este mesmo efeito de área bem forte (não mostrado). Assunção (2001) apresenta várias outras evidências da presença deste efeito de área.

Existe também um efeito de idade nos fatores K, embora ele não seja tão

consistente quanto o efeito de área. Considere o valor KijKi onde K é a média dos i

fatores K do município i. Este valor reflete grosseiramente o fator Kij com o efeito de

área eliminado e através dele podemos apreciar melhor os possíveis efeitos das

diferentes classes de idade na variabilidade dos fatores Kij. A Figura 3 mostra diagramas

de caixa dos 399 valores de KijKipara cada uma das 17 classes de idade j no eixo

horizontal, ordenadas da menor para a maior no sentido da esquerda para a direita. Nota-se que o efeito das idades [15,19) e [20,24) é mais marcante que as demais com

um impacto médio negativo no fator K pronunciado. Isto é, os fatores Kij destas classes

(13)

-0.05

0.0

0.05

0.10

Figura 3: Efeito de idade

Nós utilizamos o programa WinBUGS, disponível gratuitamente no endereço

http://www.mrc-bsu.cam.ac.uk/bugs/, para implementar nosso modelo. Nós utilizamos

MCMC com um período de ''burn-in'' de 5000 iterações. A partir da iteração 5001, nós selecionamos 1000 valores coletados a cada 100 iterações para diminuir a autocorrelação entre os valores simulados. Testes de convergência de Gelman e Rubin foram aplicados em duas cadeias geradas com valores iniciais bem distintos, com o resultado de que podemos supor que as distribuições estacionárias foram atingidas.

6. Projeções do Modelo Estatístico

Apresentamos nesta seção os resultados das projeções de total populacional em Primeiro de Julho de 2000 com o método descrito anteriormente e comparamos com os valores coletados pelo Censo Demográfico de 2000 ajustado para esta mesma data de referência.

Para cada município i, definimos Dei = Di - Ti como sendo o erro de projetar o

total populacional Ti de 2000 usando o valor Di obtido através do método de Duchesne

modificado. Definimos também o erro análogo para o método bayesiano: Bei =Bi -Ti. O

gráfico da Figura 4 mostra uma estimativa da densidade de probabilidade usando um método de kernel. A linha sólida representa a distribuição dos 399 erros de projeção cometidos utilizando o método de Duchesne com fatores K reduzidos utilizados pelo IBGE enquanto que a linha tracejada mostra a distribuição dos erros de projeção do método bayesiano. Vemos que estas duas densidades são muito similares. Usualmente

(14)

não é fácil diferenciar distribuições de variáveis aleatórias baseadas nas suas densidades estimadas, sendo mais recomendável considerar estatísticas baseadas nas distribuições acumuladas.

Erro de Projecao IBGE e Bayesiano

densidade -4000 -2000 0 2000 4000 0.0 0.0001 0.0002 0.0003 0.0004 0.0005

Figura 4: Estimativa de densidade de probabilidade dos erros de projeção do método Duchesne reduzido publicado pelo IBGE (linha sólida) e pelo método bayesiano (linha tracejada).

Este gráfico diz respeito à distribuição marginal dos erros de projeção. Não existe uma clara vantagem de um método em relação ao outro considerando estas distribuições dos erros. Vamos verificar agora o que ocorre com a distribuição conjunta destes erros de projeção. Isto é, para um dado município, é importante acompanhar simultaneamente os erros de projeção cometidos por cada um dos dois métodos. Assim, seria possível verificar se um erro elevado num dado método está associado com um erro elevado no outro método. A Figura 5 mostra esta associação ao considerar os pares

de valores (Dei,Bei). O coeficiente de correlação linear é 0.603 mostrando assim um

grau moderado de associação entre os erros. Dois valores localizados no canto inferior direito do gráfico são bastante discrepantes dos demais pois apresentam um erro de projeção bastante grande pelo método de Duchesne mas um erro apenas moderado pelo método bayesiano. Eliminar estes dois valores eleva o coeficiente de correlação para 0.897, um valor bastante alto. Assim, os dois métodos tendem a ter erros correlacionados.

(15)

Erro de Projecao IBGE

Erro Projecao Bayesiana

-10000 0 10000 20000

-10000

0

10000

20000

Figura 5: Gráfico do erro de projeção Dei pelo método de Duchesne no

eixo horizontal e do erro de projeção Bei do método bayesiano no eixo

vertical.

Assim, podemos concluir que os dois métodos produzem distribuições dos erros de projeção aproximadamente iguais e além disto que estes dois erros são bastante correlacionados. Como os erros estão bastante concentrados em torno de zero com alguns poucos valores mais extremos dificultando a visualização da relação entre os erros dos dois métodos, nós também consideramos os logaritmos dos valores absolutos dos erros. A Figura 6 mostra estes valores indicando novamente uma forte associação entre os erros. Ao mesmo tempo, este gráfico indica que a variação relativa dos menores erros é maior que aquela dos maiores erros.

Uma outra forma de comparar os erros de projeção pelos dois métodos é mostrada na Figura 7. No eixo horizontal temos o índice i do município e no eixo

vertical temos, no gráfico da esquerda, a diferença entre os erros absolutos |Dei|-|Bei|.

Assim, valores acima de zero no eixo vertical indicam que o erro de projeção pelo método de Duchesne modificado foi menor que o erro do método bayesiano. Por causa da grande distorção visual causada por alguns valores muito extremos, nós fizemos o gráfico da direita onde, no eixo vertical temos a diferença logaritimada e sinalizada. Este segundo gráfico permite perceber que existe um acúmulo de pontos acima do nível vertical 0 indicando que existem mais erros cometidos pelo método de Duchesne. De fato, 61% dos pontos caem acima da reta horizontal no nível 0 indicando que, em 61% dos municípios o erro de projeção bayesiano é menor que aquele cometido pelo método de Duchesne.

(16)

Log |Erro de Projecao| IBGE

Log |Erro de Projecao| Bayesiano

2 4 6 8 10

024

68

10

Figura 6: Logaritmo do erro absoluto

O gráfico da Figura 8 mostra a distribuição de probabilidade acumulada

empírica da diferença de erros absolutos |Dei|-|Bei|. Fica clara a concentração dos

valores acima de zero,indicando mais erros pelo método de Duchesne.

É curioso que a maior proporção de erros maiores por parte do método de Duchesne modificado não tenha gerado diferenças mais significativas nos gráficos das

distribuições marginais dos erros Dei e Bei. Uma possível explicação poderia ser uma

associação entre o sinal da diferença |Dei|-|Bei| e o tamanho do erro medido, por

exemplo, por |Dei| (devido a alta correlação entre |Dei| e |Bei|, não importa muito qual

dos dois nós considerarmos). Assim, |Dei|-|Bei|>0 poderia ocorrer associado a valores

pequenos de |Dei| e com isto gerar um efeito de compensação. Entretanto, isto não

ocorre , como observado em Assunção (2001). Estes resultados são omitidos aqui por falta de espaço.

(17)

indice do municipio

|Erro Duchesne| - |Erro Bayes|

0 100 200 300 400 -5000 0 5000 10000 15000 20000 indice do municipio

log(||Erro Duchesne| - |Erro Bayes||) sinalizado

0 100 200 300 400

-5

0

5

10

Figura 7: Diferença entre os erros absolutos de projeção dos dois métodos.

|Erro Duchesne| - |Erro Bayes|

Distribuição acumulada -2000 0 2000 4000 0.0 0.2 0.4 0.6 0.8 1.0

Figura 8: Distribuição de probabilidade acumulada empírica da

diferença de erros absolutos |Dei|-|Bei|.

Além de comparar os erros absolutos, é importante considerar também os erros relativos de projeção. Isto é, vamos considerar os erros relativamente à população

realmente existente cometidos pelo método de Duchesne, Dri = (Di-Ti)/Ti e pelo método

bayesiano, Bri=(Bi-Ti)/Ti. O gráfico da Figura 9 mostra uma estimativa da densidade de

(18)

apresenta o método de Duchesne reduzido e a linha tracejada apresenta os erros de projeção do método bayesiano. Como no caso dos erros absolutos, vemos que estas duas densidades são muito similares.

Como vimos no casos dos erros absolutos, um critério de comparação baseado em distribuições marginais não é muito sensível para discriminar entre os dois métodos.

A Figura 10 mostra as diferenças |Dri|-|Bri| versus o índice do município. É nítida a

maior proporção de diferenças de erros relativos acima de zero, significando um desempenho pior do método de Duchesne. De fato, em 61% dos casos o método Bayesiano produz erros relativos de projeção menores do que o método de Duchesne.

Erro Relativo de Projecao

densidade

-0.4 -0.2 0.0 0.2 0.4 0.6 0.8

02

4

6

Figura 9: Estimativa de densidade dos erros relativos de projeção pelo método de Duchesne (linha sólida) e pelo método bayesiano (linha tracejada).

A proporção idêntica de 61% para as diferenças de erros absolutos e erros relativos não é mera coincidência, pois existe uma forte associação entre as diferenças dos erros absolutos e as diferenças dos erros relativos (não mostrado). Um gráfico (não

exibido) das diferenças |Dei|-|Bei| versus as diferenças |Dri|-|Bri| mostra que o sinal

destas diferenças é o mesmo em quase todos os municípios, sendo que apenas 2 apresentam sinais discordantes. Isto significa que, quando o erro de Duchesne é maior em termos absolutos, ele é também maior em termos relativos.

(19)

indice do municipio

|Erro Relativo Duchesne| - |Erro Relativo Bayes|

0 100 200 300 400

-0.2

-0.1

0.0

0.1

Figura 10: Gráfico das diferenças |Dri|-|Bri| versus o índice do

município

A associação dos erros absolutos e relativos com o tamanho da população a ser projetada segue o padrão que se poderia esperar. Isto é, os erros absolutos tendem a ser maiores nos casos de maiores populações enquanto que os erros relativos tendem a diminuir ao aumentar o tamanho da população a ser projetada.

Nós também fizemos projeções populacionais utilizando os fatores K não modificados, aqueles que são o produto da aplicação direta das equação definidora (4). Espera-se que estes fatores K não levem a bons resultados, já que vários deles possuem valores muito extremos e incompatíveis com um crescimento populacional de médio ou longo prazo. De fato, as projeções com os fatores K não modificados são piores que aquelas obtidas com qualquer dos dois métodos, Duchesne modificado ou o método bayesiano.

7. Discussão e Conclusões

Nosso método de projeção, como todas as projeções demográficas, envolve o uso de certas suposições sobre processos demográficos atuais, as quais podem ou não ser verdadeiras, e sobre eventos futuros, os quais podem ou não se concretizar. Usuários e analistas deste método devem estar cientes de que embora ele tenha sido elaborado utilizando teorias estatísticas e demográficas complexas e atualizadas, o método pode não projetar acuradamente as populações futuras dos municípios. Este método deve ser utilizado somente com o pleno conhecimento das limitações inerentes às projeções

(20)

populacionais em geral e com conhecimento detalhado dos procedimentos e suposições delineados neste relatório.

É claro que não estamos propondo a substituição ou eliminação completa do uso do conhecimento específico que técnicos e pesquisadores tenham da dinâmica demográfica localizada. Nossa proposta deve ser vista como um passo na direção de complementar o trabalho requerido destes técnicos.

Um aspecto importante a ser considerado é a possibilidade de estudos adicionais levarem a estimativas de variabilidade dos erros de projeção através da distribuição a posteriori dos fatores K. Esta é uma possibilidade promissora que não é explorada neste trabalho mas que não deveria passar despercebida. A falta de estimativas para os erros de projeção, especialmente quando tratamos de pequenas áreas, é um problema sério que foi bastante discutido por vários autores tais como Keyfitz (1981) e Lee(1992, 1994). Cabe notar que, usando um método de componentes e uma abordagem bayesiana diferente da nossa para uma população nacional, Daponte, Kadane, e Wolfson (1997) procuraram atingir exatamente o objetivo de fornecer intervalos de predição para projeções populacionais.

Erros de projeção dependem de vários fatores mas é claro que o horizonte de projeção é um dos aspectos mais relevantes. É bastante conhecido o fato de que o valor esperado do tamanho do erro de projeção aumenta à medida que passamos de projeções de curto prazo para projeções de longo prazo. No nosso estudo, o horizonte foi bastante curto. Projetamos a população do ano 2000 utilizando dados históricos de 1991 e 1996. Assim, o horizonte é de apenas 4 anos após o último Censo, o que é um tempo curto para que mudanças populacionais significativas tenham ocorrido, principalmente levando-se em conta que o Paraná é um estado onde a transição demográfica já completou boa parte de seu ciclo.

Outro aspecto pouco usual de nosso estudo é o fato de termos usado duas contagens censitárias muito próximas no tempo, aquelas de 1991 e de 1996, distando assim apenas 5 anos uma da outra. Esta situação é rara e não deverá se repetir facilmente no futuro. Ao se utilizar duas estruturas etárias próximas no tempo, com uma dinâmica demográfica pouco acelerada entre elas, temos pouca oportunidade de diferenciar métodos de projeção. Intuitivamente, o problema reside em querer inferir o padrão da dinâmica demográfica de longo prazo olhando apenas uma pequena janela

(21)

temporal: as diferenças de longo prazo não tiveram tempo de se expressar nos dados de uma pequena janela de tempo, tal como \ intervalo de 5 anos entre 1991 e 1996. Num caso como este, boa parte das diferenças entre os fatores K das pequenas áreas pode ser devido apenas a flutuações casuais que não refletem um processo subjacente duradouro de mudança demográfica. Isto implica que, sem grandes mudanças de tamanho populacional (a não ser aquelas incidentais), os processos de longo prazo não podem ser medidos acuradamente e os erros de projeção podem ser dominados pelos erros aleatórios incidentais nas pequenas áreas.

Os resultados deste estudo apontam para a superioridade do método bayesiano sobre o método de Duchesne modificado. Este fato, aliado ao alto custo do segundo método, coloca o método bayesiano como uma alternativa promissora que deve ser considerada com atenção. Esta conclusão foi baseada no estudo empírico realizado com os dados do Paraná e, embora o método bayesiano tenha uma sólida base científica neste e em outros problemas estatísticos, nós devemos olhar esta conclusão com cautela. De fato, o estudo apresentado aqui é de cunho empírico e portanto não demonstrou formalmente e matematicamente uma propriedade de otimalidade do método bayesiano sobre o método de Duchesne modificado. Isto não é possível por duas razões. A primeira é a impossibilidade de formalizar matematicamente todo o processo envolvido no método de Duchesne modificado. Como vimos, este método depende de ajustes no fator K que são feitos de forma subjetiva e baseados em considerações multidisciplinares envolvendo a economia, sociologia, etc., de cada pequena área. A segunda razão é que, mesmo que pudéssemos operacionalizar de forma automática o método de Duchesne modificado, a superioridade empírica de um método de projeção depende do caso específico que está sendo considerado, os municípios do Paraná entre 1991 e 2000 neste estudo. Ronald Lee (1980) apresentou uma analogia para explicar este ponto quando imaginou que projeções seriam tiros dados em alvos que movem-se erraticamente. Alguns atiradores (ou métodos de projeção) podem ser melhores que outros porque os alvos em que eles miraram eram mais adaptados a suas hipóteses e qualidades. Mesmo que dois atiradores (ou métodos) sempre atirem nos mesmos alvos, ainda assim, poderia ser inconclusiva a superioridade observada de um deles caso os alvos sejam restritos e não representem toda a variedade de alvos possíveis. Por outro lado, é claro que neste tipo de alvo testado simultaneamente pelos dois métodos de projeção, um deles acaba sendo melhor que o outro. Assim, uma comparação empírica

(22)

definitiva entre métodos deve ser sistemática e ampla, no sentido de cobrir cenários de dinâmica demográfica bastante diversos e que cubram um amplo espectro das possibilidades reais de crescimento populacional. Nosso estudo usa vários municípios com razoável heterogenidade entre eles mas ainda assim é necessário um estudo mais amplo envolvendo outras regiões do Brasil com características bastante diversas antes que conclusões definitivas sejam tiradas. A superioridade do método bayesiano neste trabalho deverá servir como estímulo para que outros estudos sejam feitos e aumentem o espectro de comparações e testes levando a conclusões mais definitivas no futuro.

Agradecimentos

Quero agradecer comentários e sugestões que recebi dos seguintes pesquisadores: Juarez de Castro Oliveira, Antônio Tadeu Ribeiro de Oliveira, Dênis P. Santos, Lúcia Maria Pereira da Cunha, José Maria de Lima, Kaizô Beltrão e Pedro Nascimento e Silva e Mônica Monteiro de Castro. Cabe um agradecimento especial a Bernadete Waldvogel que fez vários comentários e sugestões, a maioria infelizmente ainda não incorporados no método aqui apresentado.

Referências Bibliográficas

Assunção, R. M. (2000) Estatística Espacial com Aplicações em Epidemiologia,

Economia e Sociologia. São Carlos: Associação Brasileira de Estatística.

Assunção, R. M. (2001) Método Espacial de Relação de Coortes para Projeções de Pequenas Áreas. Relatório Final, Programa de Professor Visitante, ENCE-IBGE. Assunção, R. M., Potter, J., Cavenaghi, S. (1998) Estimação de curvas de

fecundidade para pequenas áreas com modelos bayesianos espaciais. Anais do XI

Encontro Nacional de Estudos Populacionais, 1998, vol. 1, 2.851- 2.865.

Assunção, R. and Reis, I. (2001) Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brazil with a Bayesian Space-Time Model. Statistics in

(23)

Assunção, R. M., Potter, J., Cavenaghi, S. (2002) A Bayesian space varying parameter model applied to estimating fertility schedules. Statistics in Medicine, vol. 21, 2057-2075.

Bolstad W.M., Manda S.O. (2001) Investigating child mortality in Malawi using family and community random effects: A Bayesian analysis. Journal of the

American Statistical Association, 96, 12-19.

Daponte B.O., Kadane J.B., e Wolfson L.J. (1997) Bayesian demography: Projecting the Iraqi Kurdish population, 1977-1990. Journal of the American

Statistical Association, 92, 1256-1267.

Duchesne, L. (1987) Proyeciones de poblacion por sexo y edad para areas

intermedias y menores. Santiago: Centro Latinoamericano de Demografia.

Dunson D.B., Zhou H.B. (2000) A Bayesian model for fecundability and sterility.

Journal of the American Statistical Association, 95, 1054-1062.

Keyfitz, N. (1981) The limits of population forecasting. Population and

Development Review, 7, 579-593.

Lee, Ronald D. (1980) Aiming a moving target: period fertility and changing reproductive goals. Population Studies, 34, 206-226.

Lee, R.D., Carter, L.R. (1992) Modeling and forecasting United States mortality.

Journal of the American Statistical Association, 87, 659-671.

Lee, R.D., Tuljapurkar, S. (1994) Stochastic population forecasts for the United States - beyond high, medium, and low. Journal of the American Statistical

Association, 89, 1175-1189.

Lewis S.M., Raftery A.E. (1999) Bayesian analysis of event history models with unobserved heterogeneity via markov chain Monte Carlo - Application to the explanation of fertility decline. Sociological Methodology and Research, 28, 35-60. Madeira, J. L. e Simões, C. C. S. (1972) Estimativas preliminares da população

urbana e rural segundo as unidades da Federação, 1960/1980: por uma nova metodologia. Revista Brasileira de Estatística, 33 (129), 3-11.

(24)

Murphy M., Wang D. (2001) Do previous birth interval and mother's education influence infant survival? A Bayesian model averaging analysis of Chinese data.

Population Studies, 55, 37-47.

Pickard, J. (1959) Metropolization of the United States. Washington, DC: Urban Land Institute (Land Institute Research Monograph).

Waldvogel, B. C. (1998) Técnicas de Projeção Populacional para o Planejamento

Regional. Belo Horizonte: UFMG/CEDEPLAR (Estudos Cedeplar 01).

Watier L., Richardson S., Hemon, D. (1997) Accounting for pregnancy dependence in epidemiologic studies of reproductive outcomes. Epidemiology, 8, 629-636. You, Y. e Rao, J. N. K. (2000) Hierarchical Bayes estimation of small area using

Referências

Documentos relacionados

6 Consideraremos que a narrativa de Lewis Carroll oscila ficcionalmente entre o maravilhoso e o fantástico, chegando mesmo a sugerir-se com aspectos do estranho,

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

O canabidiol é um composto presente na planta Cannabis sativa, que promove diversos benefícios à saúde humana, como por exemplo sobre as doenças neurológicas como epilepsia,

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Fugiu – forma verbal do verbo “fugir”, no Pretérito Perfeito do Indicativo, na 3.ª pessoa do singular. Forma afirmativa: Eu

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Combinaram encontrar-se às 21h