• Nenhum resultado encontrado

ESTIMAÇÃO DE CURVAS DE FECUNDIDADE PARA PEQUENAS ÁREAS COM MODELOS BAYESIANOS ESPACIAIS

N/A
N/A
Protected

Academic year: 2021

Share "ESTIMAÇÃO DE CURVAS DE FECUNDIDADE PARA PEQUENAS ÁREAS COM MODELOS BAYESIANOS ESPACIAIS"

Copied!
12
0
0

Texto

(1)

ESTIMAÇÃO DE CURVAS DE FECUNDIDADE

PARA PEQUENAS ÁREAS

COM MODELOS BAYESIANOS ESPACIAIS

Renato Martins Assunção1 Joseph E. Potter2 Suzana Cavenaghi3

1 INTRODUÇÃO

Uma área geográfica de interesse num estudo é chamada de pequena área quando a variabilidade de estimativas utilizando dados apenas desta área produz desvios padrão inaceitáveis pelo seu enorme tamanho. Isso é devido ao pequeno número de pessoas em risco na área relativamente à raridade dos eventos do fenômeno sendo estudado. Deste modo, com uma mesma base de dados, uma área pode ser considerada pequena em certos casos e não, em outros. Por exemplo, com uma amostra de 1000 habitantes, a razão de sexo populacional será estimada com bastante precisão mas este não será o caso da Taxa de Fecundidade Total.

Ao trabalhar com pequenas áreas, é necessário buscar informações em áreas relacionadas para obter estimadores indiretos que aumentam o tamanho efetivo da amostra e assim decrescem a variância. Estimadores indiretos propostos na literatura incluem:

• estimadores sintéticos;

• estimadores dependentes de tamanho de amostra;

• estimadores compostos;

• estimadores baseados em predição não-viciada linear ótima empírica (blup empírico);

1 Departamento de Estatística e CEDEPLAR/UFMG. 2 Population Research Center – University of Texas.

(2)

• estimadores Bayesianos empíricos;

• estimadores Bayesianos hierárquicos.

Neste artigo, nós estamos interessados em estimar a curva de fecundidade em pequenas áreas. As pequenas áreas são constituí-das pelos municípios mineiros em 1991 e o objetivo final, ainda sendo pesquisado, é derivar medidas para estudar os determinantes do declínio da fecundidade no espaço e no tempo. Nós nos concentramos na subpopulação de mulheres casadas e adotamos o modelo de fecun-didade marital de Coale (1971) devido à sua popularidade e qualidade de ajuste à dados empíricos. Os parâmetros M e m do modelo são particularmanete interessantes para o estudo de declínio de fecundi-dade ao longo do tempo, como observado por vários autores (Knodel, 1977; Easterlin, Pollak, Wachter, 1980). Nós propomos um modelo Bayesiano hierárquico espacial para levar em conta a correlação entre áreas vizinhas e idades vizinhas. Os resultados para o Estado de Minas Gerais são apresentados.

2 MODELO DE FECUNDIDADE MARITAL DE COALE-TRUSSELL

Um modelo amplamente usado de curvas de fecundidade foi sugerido por Coale (1971) e tratado com mais detalhes por Coale, Trussell (1974). Para descrever o modelo, seja Wia o número de

mu-lheres casadas na categoria a de idade e na área i, onde a = 1, ..., A e i = 1, ..., N. Seja também Bia o número total de suas crianças nascidas

no último ano e

λ

ia a taxa de fecundidade marital subjacente, suposta

constante dentro dos intervalos de idade. Dado o conjunto de valores de Wia e λia , nós supomos que os nascimentos são variáveis aleatórias

independentes com distribuição de Poisson com valor esperado igual a Wiaλia . Esta é uma hipótese feita usualmente para os eventos vitais

(Brillinger, 1986; Bröstrom, 1985).

O estimador de máxima verossimilhança de λia é dado

pelas taxas observadas ria=BiaWia . Se as áreas no estudo possuem

populações pequenas, o estimador de máxima verossimilhança é muito pobre devido à sua alta instabilidade (Manton et al., 1989).

(3)

O modelo de fecundidade marital proposto por Coale, Trussell (1974) impôs uma forma às taxas subjacentes que depende de dois parâmetros M e m. Como existe um par de parâmetros para cada área i, os parâmetros são indexados: Mi e mi . O modelo proposto

supõe que

λ

ia

=

Na Mi exp(mi Va)

onde N1 , …

,

N

A são constantes conhecidas obtidas através das esti-mativas do padrão de fecundidade natural por Henry (1961) e V1 , ..., VA são constantes empiricamente derivadas indicando um

padrão típico de afastamento da fecundidade natural. O parâmetro Mi é indicativo do nível de fecundidade natural que a população da área i teria se não houvesse controle voluntário da fecundidade. Já o parâmetro mi mede o grau de controle deliberado de fecundidade na área i. São estas interpretações, além da qualidade de seu ajuste, que faz o modelo de Coale tão popular.

Bröstrom (1985) e Trussell (1985) foram os primeiros a adotar uma abordagem estocástica e reconhecer que a expressão para as taxas propostas por Coale colocavam o modelo como um membro da classe dos modelos lineares generalizados introduzida por Nelder, Wedderburn (1972). Sua estimação exige uma pequena reparametri-zação da taxa subjacente:

λ

ia =

N

aexp(ki +

m

i

V

a)

onde ki= log(Mi) e Na é o offset de um modelo de regressão com dados distribuídos como uma Poisson. A estimação é feita independente-mente em cada área e está disponível em virtualindependente-mente qualquer pacote estatístico.

3 FECUNDIDADE EM MINAS GERAIS

Em 1991, Minas Gerais possuía 723 municípios e exibia uma enorme diversidade sócio econômica entre si. As Regiões Norte e Nordeste são menos desenvolvidas com um gradiente de industriali-zação e moderniindustriali-zação cortando o estado na direção

(4)

Nordeste-Sudoes-te. A parte central do estado, entretanto, possui uma indústria meta-lúrgica pesada e é densamente povoada.

Utilizando os dados da amostra do Censo Demográfico de 1991, foram estimados os valores dos parâmetros Mi e mi de cada área i. O número médio de mulheres casadas por municipalidade é igual a 2980 com primeiro e terceiro quartis iguais a 594 e 2.440 e máximo e mínimo iguais a 125 e 273.600.

Um dos problemas estatísticos com a estimação desses parâmetros é sua grande variabilidade quando o tamanho da popula-ção de risco é pequena. De fato, a Figura 1 abaixo mostra os valores de mi versus o logaritmo da população feminina total. É evidente a presença de um efeito funil: quando a população é pequena, as esti-mativas variam amplamente para estabilizar-se numa faixa de varia-ção menos acentuada quando essa populavaria-ção aumenta. Sem des-considerar a presença de alguma tendência ou relação entre os valores de mi e o tamanho da população, fica evidente que a principal carac-terística da figura é a enorme variação das taxas se a população é pequena. Este comportamento é típico de taxas calculadas em peque-nas áreas (Assunção, 1996; Assunção et al., 1998).

Figura 1: Estimativas de máxima verossimilhança dos m’s pequenos do Modelo de Fecundidade Marital de Coale

para os 723 municípios mineiros existentes em 1991 baseados em dados do Censo Demográfico de 1991.

(5)

Além da variância depender da população, existe também um forte componente espacial nas taxas. Esta correlação espacial fica evidenciada em medidas simples tais como a correlação entre mi e o valor médio dos mis de seus vizinhos espaciais. Mais especificamente, para cada área i, definiu-se um subconjunto das demais áreas como vizinhas de i. Este subconjunto é composto pela adição sucessiva da área mais próxima de i até que a população feminina acumulada de todas as idades atinja 10.000 indivíduos.

A correlação usual atinge o valor de 0,29 para o conjunto dos municípios. Considerando que as taxas dos municípios pequenos possuem grande variabilidade, calculamos esta correlação consideran-do subgrupos de municípios maiores. Mantenconsideran-do a média móvel espa-cial calculada com a totalidade dos os municípios, a correlação dos mis dos 25% maiores municípios com a média dos seus vizinhos é igual a 0,35. Este valor aumenta para 0,40 se considerarmos apenas os 50% maiores municípios e para 0,43 quando apenas os 25% maiores são levados em conta. Assim, é claro que os parâmetros mis tendem a ser similares se os municípios estão geograficamente próximos.

A Figura 2 mostra diagramas de dispersão dos valores dos mis versus a média dos mis dos vizinhos. A linha sólida é a reta de regressão de mínimos quadrados ordinários. Note que a escala nos dois eixos de todas as quatro figuras é a mesma.

Figura 2: Diagramas de dispersão de mi’s versus a média dos mi’s dos vizinhos.

(6)

Resultados análogos são encontrados para os parâmetros Mis . A variação com a população de risco está na Figura 3 e mostra a mesma figura tipo funil apresentado na Figura 1. A correlação entre os valores estimados dos Mis e aqueles das médias de seus vizinhos é positiva mas praticamente constante e igual a 0,23 à medida que é feita uma restrição no tamanho dos municípios.

Figura 3: Dispersão dos parâmetros Mi’s versus o logaritmo da população

femi-nina. O formato é o mesmo da Figura 1.

4 MODELANDO A CORRELAÇÃO ESPACIAL DA FECUNDIDADE

Nesta seção, apresentamos de forma concisa o modelo Bayesiano hierárquico para fazer inferências sobre os parâmetros do modelo de Coale. Revisões detalhadas foram apresentadas em Berna-dinelli, Montonolli (1992) e por Mollié (1996). Um uso recente da abordagem bayesiana em projeções demográficas é apresentada em Daponte et al. (1997).

A abordagem Bayesiana adota uma estrutura hierárquica definindo a distribuição de probabilidade dos parâmetros condiciona-da em níveis prévios e nos condiciona-dados. Os parâmetros mis possui uma estrutura espacial induzida por um grafo de vizinhança onde cada nó

(7)

possui um conjunto de vizinhos denotado por

i . A distribuição

con-junta é um campo de Markov com distribuição condicionada dada por

(

mi |mj ≠ i ,τ) ~ N [ m

__

i ,1⁄(τ ni) ]

onde ni é o número de vizinhos de i e m __

i é a média do conjunto

dos mis . A distribuição dos Mis é inteiramente análoga com um

parâmetro

ζ

no papel ocupado por

τ

na equação acima. Os hiper-parâ-metros

τ

e

ζ

são medidas da autocorrelação entre valores vizinhos dos parâmetros correspondentes. A distribuição desses hiper-parâmetros é independentemente distribuída de acordo com uma gama com hiper-parâmetros A e B iguais a 0,0001 de modo que é uma distribuição bastante vaga neste último nível da hierarquia.

A estimativa bayesiana pontual adotada é escolher o valor esperado da posteriori obtida através de um método de Monte Carlo via Cadeia de Markov (MCMC, em inglês) apresentado em detalhes em Assunção (1996) e Assunção et al. (1998).

Nós escrevemos um programa C, disponível se solicitado, para implementar a metodologia MCMC neste caso particular já que o programa existente (BUGS) era extremamente ineficiente e lento requerendo uma quantidade imensa de memória que inviabilizou os cálculos.

5 RESULTADOS

O mapa da Figura 4 mostra as estimativas bayesianas dos mis . A estrutura espacial dos mis cria padrões facilmente

identificá-veis. A Região do Triângulo Mineiro possui o mais alto controle de fecundidade. Esta é uma região de agricultura altamente mecanizada e relativamente rica. Ela também apresenta altos níveis de cuidados médicos durante a gravidez e de cesarianas. O gradiente NE-SW segue o padrão espacial da industrialização em Minas Gerais.

A Figura 5 mostra os valores das estimativas de máxima verossimilhança versus as estimativas bayesianas ao redor da linha reta y = x. Apesar da maioria das estimativas não sofrer grandes mudanças, observa-se que alguns municípios tiveram suas estimativas muito diferentes dependendo do método adotado para estimar os parâmetros.

(8)

Bayesian Estimates of little m Minas Gerais, 1991

Figura 4: Mapa das estimativas bayesianas dos mi s dos municípios de Minas

(9)

Figura 5: Gráfico das estimativas de máxima verossimilhança versus

as estimativas bayesianas dos mi’s . A escala é a mesma nos dois eixos

e a linha sólida é a reta y = x.

Na Figura 6 abaixo mostramos como a variabilidade das estimativas bayesianas foi reduzida substancialmente. A aparência de funil é agora bastante atenuada. Observe que para facilitar a compa-ração, a escala nas duas figuras é idêntica.

Figura 6: Gráfico de dispersão das estimativas bayesianas (à esquerda) e das estimativas de máxima verossimilhança (à direita) versus o logaritmo da população feminina.

(10)

Uma questão imediata então é perguntar qual desses métodos de estimação é melhor? Simulações e resultados teóricos em diversos problemas têm demonstrado que o método bayesiano é supe-rior ao de máxima verossimilhança na situação de estimar vários parâmetros simultaneamente (Assunção, 1996; Assunção et al., 1998). No entanto, simulações são sempre definidas em função de modelos estocásticos que, muitas vezes, são os mesmos considerados na criação dos métodos. Assim, é possível que os resultados favoráveis aos méto-dos bayesianos nestas situações sejam deviméto-dos à limitação das situa-ções consideradas nas simulasitua-ções.

Diante disso, adotamos uma abordagem diferente. Nós tomamos a Cidade de São Paulo e seus 60 municípios contíguos mais próximos e, em cada município, extraímos uma amostra dos dados do Censo com tamanhos variando entre 60 a 500 mulheres. Assim, todos os municípios foram representados por estas pequenas amostras. Baseadas nelas, calculamos os valores dos parâmetros do modelo de Coale pelos dois métodos, EMV e Bayes, em cada município e compa-ramos com os valores obtidos pelo ajuste (por EMV) com todos os dados do Censo nestes municípios. Isto criou um método intrínseco de comparação entre os métodos.

Para resumir os resultados em todos os 60 municípios, usamos a média dos desvios absolutos e a média dos desvios relativos em relação aos valores “populacionais” (isto é, os valores obtidos com todos os dados disponíveis do Censo).

A tabela abaixo mostra que o método bayesiano é muito melhor que o método de máxima verossimilhança. Em termos das diferenças absolutas o erro médio do método EMV é de 0,846 enquanto o do método bayesiano é de 0,320. Quando a comparação entre a estimativa da amostra e o valor com todo o Censo é baseada no valor relativo do erro, o método bayesiano é melhor novamente. Enquanto o EMV erra, em média, 73,2% do valor “real”, o método bayesiano erra em 34,2%, em média.

Tipo de diferença Máxima Verossimilhança Bayes

Absoluta 0,846 0,320

(11)

6 CONCLUSÕES

Existem várias maneiras de estender estes métodos baye-sianos. A principal é pela introdução de co-variáveis. O método pode ser facilmente adaptado para esta situação embora o custo computa-cional neste momento vai ser considerável já que não existem progra-mas prontos para serem utilizados.

É claro que testes mais rigorosos para comparação entre os métodos são necessários. No entanto, o método simples que apre-sentamos aqui tem o mérito de respeitar e replicar as variações naturais que ocorrem na prática ao invés de apoiar-se na simulação de situações totalmente artificiais. Em especial, comparações com métodos mais tradicionais em demografia são necessários.

Em conclusão, o método bayesiano apresenta vantagens em relação ao método de máxima verossimilhança na estimação de parâmetros do modelo demográfico de Coale para fecundidade marital. O método leva em conta a correlação espacial entre as contagens e as diferentes variâncias devido aos diferentes tamanhos populacionais.

7 REFERÊNCIAS BIBLIOGRÁFICAS

ASSUNÇÃO, R. M. Mapas de mortalidade. In: ENCONTRO NACIO-NAL DE ESTUDOS POPULACIONAIS, 10, 1996, Caxambu. Anais... Belo Horizonte: ABEP, 1996. v. 4, p. 2443-2457.

---, BARRETO, S., GUERRA, L. H., SAKURAI, E. Mapas de taxas epidemiológicas: métodos estatísticos. Cadernos de Saúde Pública, 1998. (no prelo).

BERNADINELLI, L., MONTONOLLI, C. Empirical bayes versus fully bayesian analysis of geographical variation in disease risk. Statistics in Medicine, v. 11, p. 983-1007, 1992.

BRILLINGER, D. The natural variability of vital rates and associated statistics. Biometrics, v. 42, p. 693-734, 1986.

BRÖSTROM, G. Practical aspects on the estimation of the parameters in Coale’s model for marital fertility. Demography, v. 22, p. 625-631, 1985.

(12)

DAPONTE, B. O., KADANE, J. B., WOLFSON, L. J. Bayesian demo-graphy: projecting the Iraqi kurdish population, 1977-1990. Jour-nal of the American Statistical Association, v. 92, p. 1256-1267, 1997.

EASTERLIN, R., POLLAK, R., WACHTER, M. Toward a more gene-ral economic model of fertility determination: endogenous prefe-rences and natural fertility. In: EASTRELIN, R. (Ed.). Population and Economic Change in Developing Countries. Chicago: Univer-sity of Chicago Press, 1980.

GHOSH, M., RAO, J. N. K. Small area estimation: na appraisal. Statistical Science, v. 9, p. 55-93, 1994.

KNODEL, J. Family limitation and the fertility transition: evidence from the age patterns of fertility in Europe and Asia. Population Studies, v. 31, p. 219-249, 1977.

MOLLIÉ, A. Bayesian mapping of disease. In: WILKS, W., RICHARD-SON, S., SPIEGELHALTER, D. (Eds.). Markov Chain in Practice. London: Chapman & Hall, p. 359-379. 1996.

NELDER, J. A., WEDDERBURN, R. W. M. Generalized linear mo-dels. Journal of the Royal Statistical Society, v. 135, p. 370-384, 1972.

RAO, J. N. K., CHOUDHRY, G. H. Small area estimation: overview and empirical study. In: COX, BINDER, CHRISTIANSON, COL-LEDGE, KOTT (Eds.). Business survey methods. New York: John Wiley and Sons, p. 527-542, 1995.

TRUSSELL, J. M m (computer program). Princeton: Princeton Uni-versity Office of Population Research, 1985.

Referências

Documentos relacionados

Corporate Control and Policies Page 12 UNIVERSIDAD DE PIURA UNIVERSIDAD DEL PACÍFICO UNIVERSIDAD ESAN UNIVERSIDAD NACIONAL AGRARIA LA MOLINA UNIVERSIDAD NACIONAL

Para o ferro puro foi utilizado uma camada de entrada com 4 neurônios (um para cada classe de dados de entrada – temperatura, tempo, diâmetro inicial de grão e

Aristides Cimadon, no uso de suas atribuições, torna público o presente Edital destinado a inscrições para o Curso de Pós- graduação stricto sensu, Mestrado Acadêmico em Sanidade

Este trabalho é resultado de uma pesquisa quantitativa sobre a audiência realizada em 1999 envolvendo professores e alunos do Núcleo de Pesquisa de Comunicação da Universidade

Neste sentido consideramos importante refletir, no INCTE 2018, sobre o desenvolvimento da lite- racia emocional dos professores e no modo como as emoções interferem na ação educativa

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Fases de execução Plano de Projeto Síntese das entrevistas Estratégias para Evolução da Arquitetura Tecnológica Relatório Final Fase 01 Fase 02 Fase 03 Fase 04 Fase 05 Fase

O regime tributário das fundações à luz da proposta de Estatuto da Fundação Europeia (breves notas) .... O relatório das