• Nenhum resultado encontrado

1 - Introdução. Antonio Guedes Corrêa Gondim Filho 1 Everlane Suane de Araújo 2 Jozemar Pereira dos Santos 2 Neir Antunes Paes 2

N/A
N/A
Protected

Academic year: 2021

Share "1 - Introdução. Antonio Guedes Corrêa Gondim Filho 1 Everlane Suane de Araújo 2 Jozemar Pereira dos Santos 2 Neir Antunes Paes 2"

Copied!
17
0
0

Texto

(1)

Relação entre as Condições de Vida e a Mortalidade dos Idosos por Doenças Cardiovasculares no Nordeste Brasileiro: Uma aplicação do Modelo de Regressão Beta .

Antonio Guedes Corrêa Gondim Filho1 Everlane Suane de Araújo2 Jozemar Pereira dos Santos2 Neir Antunes Paes2

1 - Introdução

. A mortalidade se constitui em um dos principais componentes da demografia e da epidemiologia utilizados no planejamento e na administração de saúde para avaliação do nível de saúde, da definição de prioridades e alocação de recursos, além da vigilância de problemas específicos. Em muitas situações, os registros de óbitos representam as únicas estatísticas para medir o nível de saúde de uma população.

Para monitorar o efeito e a qualidade dos serviços de saúde, é cada vez mais crescente o uso de indicadores que possam avaliar as causas mortes com o objetivo de reduzir ou postergar tais mortes [13].

Em consequência do envelhecimento populacional desencadeado em todas as regiões brasileiras nas últimas décadas, devido ao rápido declínio da fecundidade e do aumento da expectativa de vida, o panorama da mortalidade também se alterou, uma vez que as doenças que incidem especialmente nas idades avançadas passaram a contribuir com um maior número de mortes. Dentre essas doenças destaca-se o grupo das causas Crônico-degenerativas constituídas majoritariamente pela Neoplasia e pelas Doenças do Aparelho Circulatório. O avanço do crescimento da população idosa trouxe consequências não só do ponto de vista da mortalidade, mas também do ponto de vista econômico, social, assistencial, resultando em investigações na busca de contribuir para uma melhor compreensão e, consequentemente, melhor forma de intervenção junto a essa camada populacional.

É necessário estudar o efeito e a importância das mortes por Doenças Cardiovasculares em idosos, devido à grande importância e impacto que causam nesse grupo etário.

Desde a década de 60, entre as principais causas de morte nos idosos as Doenças Cardiovasculares lideram as causas de óbitos no país, são responsáveis por impacto expressivo na mortalidade da população brasileira e corresponderam no Nordeste em 2010 a 38% e 37,5% de mortes entre os idosos para o sexo masculino e feminino respectivamente [7].

Monitorar e medir periodicamente o desenvolvimento humano, econômico e social de uma região levando em consideração que as realidades são diferentes também é de importância relevante para

1 DEINFO-UFRPE. e-mail: guedinho999@hotmail.com

(2)

orientação de políticas públicas voltadas às especificades regionais da população. Daí, a importância de estudar a mortalidade do Nordeste em seus estratos geográficos, como o das microrregiões.

Tendo-se em conta, o crescimento do número de pessoas acima de 60 anos, o impacto significativo das Doenças Cardiovasculares nessa faixa etária e a carência na literatura desse tipo de informação para o Nordeste brasileiro, justifica-se a formulação dessa proposta, a qual tem como objetivo principal analisar as relações entre indicadores das condições de vida e de mortalidade dos Idosos por Doenças Cardiovasculares no Nordeste brasileiro em 2010, através do modelo de regressão beta.

2 - Material e métodos

O Brasil possui duas fontes oficiais responsáveis pela produção contínua das estatísticas vitais de óbitos. A Fundação Instituto Brasileiro de Geografia e Estatística (Fundação IBGE), através das Estatísticas do Registro Civil e o Ministério da Saúde (MS), por meio do Sistema de Informação sobre Mortalidade (SIM), com disponibilidade anual para todos os municípios brasileiros.

Neste trabalho foram utilizados dados referentes à população de 2010 dos Estados do Nordeste Brasileiro e suas respectivas microrregiões, desagregados por sexo e faixa etária, disponibilizados no site do IBGE (www.ibge.gov.br). Os dados de óbitos registrados pelo SIM se encontram categorizados segundo a décima revisão da Classificação Internacional de Doenças (CID-10), que vigora desde 1996, disponibilizado no site do MS (www.datasus.gov.br).

O SIM é a única fonte que divulga os resultados por causa básica de morte no Brasil, justificando assim, o seu uso.

Após a construção da base de dados, (população e óbitos), determinou-se fazer um recorte selecionando as causas consideradas como evitáveis das doenças cardiovasculares. A classificação dessas causas foi baseada em estudos realizados por Malta, Ortiz e a classificação de Taucher [8]; [5], sendo esta, uma classificação que especifica as causas evitáveis dentre as causas básicas de óbitos. As causas evitáveis de óbito, por sua vez, são classificadas em quatro grupos: reduzíveis por ações de imunoprevenção; reduzíveis por adequada atenção à mulher na gestação e parto e ao recém-nascido; reduzíveis por ações adequadas de diagnóstico e tratamento; e reduzíveis por ações adequadas de promoção à saúde, vinculadas às ações adequadas de atenção à saúde.

A Fundação FIRJAN foi utilizada como uma das fontes de dados deste estudo, a qual disponibiliza dados relativos às três principais áreas de desenvolvimento: Emprego e Renda, Educação e Saúde (www.firjan.org.br). Estes dados estão disponíveis anualmente, a partir de 2000 nos níveis municipais bem como para o ano 2010. Os dados foram agregados para as 187 microrregiões do Nordeste brasileiro, necessários para esse estudo e foi utilizada a mediana dos indicadores dos municípios pertencentes a cada microrregião para representá-las. Os pacotes computacionais usados para se obter os resultados deste trabalho foram o Statistical Package for the Social Sciences (SPSS) versão 18, R versão 2.14.1, com o auxilio do pacote betareg e Microsoft Office Excel 2007.

(3)

Descrição das variáveis utilizadas nesse estudo. 1. X1 “Área de desenvolvimento do FIRJAN: Emprego e Renda” 2. X2 “Área de desenvolvimento do FIRJAN: Educação”

3. X3 “Área de desenvolvimento do FIRJAN: Saúde”

4. X4 “Percentual de causas mal definidas de óbitos dos idosos” 5. X5 “Percentual de causas desconhecidas de óbitos dos idosos” 6. X6 “Probabilidade de sobrevivência dos idosos”

7. X7 “Expectativa de vida dos idosos”

8. X8 “Percentual de analfabetismo dos idosos”

9. X9 “Percentual dos idosos que sabem Ler e Escrever” 10. X10 “Renda mensal média dos idosos”

11. X11 “Percentual de casas que possuem Banheiro e Água”

2.1 Organização da base de dados

Os dados de óbitos para o ano de 2010 da Classificação (referente à 10a Revisão da Classificação Internacional das Doenças - CID-10) apresentam-se distribuídos em grupos de causa, causas e sub-causas específicas de óbitos. E estes, juntamente com os das populações, foram desagregados por sexo e faixa etária para as 187 microrregiões do Nordeste Brasileiro. É importante salientar que os dados de óbitos foram extraídos das fontes de dados obtendo-se os valores do biênio (2009 e 2010), calculando-se a média aritmética simples, para evitar a flutuação dos dados brutos.

Quanto à população, para o ano em estudo, foi retro-projetada para 1º de Julho. Para o cálculo dessas projeções utilizou-se o método geométrico de crescimento [12]. Com o método geométrico Equação (1), a população retro-projetada (Pn) é calculada através da seguinte expressão:

PnP x r0 ( 1)n, em que 0 1 n Pn r P      (1) assim, tem-se a taxa de crescimento (r), o intervalo de tempo (n) e a população base (P0).

Para a montagem desse banco de dados referente aos óbitos de todas as microrregiões do Nordeste brasileiro foram realizadas as seguintes etapas:

Etapa 1: Devido ao grande percentual de óbitos classificados como causas mal definidas, fez-se necessário redistribuir esses óbitos para os demais grupos de causas e causas específicas de óbitos. Neste caso, o interesse foi o de averiguar qual seria o montante dessas causas mal definidas que seriam atribuídas às doenças cardiovasculares. Para tanto, foi utilizado o método de Ledermann para estimar o fator de redistribuição das causas de óbitos mal definidas. Após a estimação desses fatores as causas de óbitos mal definidas foram redistribuídas de forma proporcional para os demais grupos de causas e as principais causas especificas de óbitos. O detalhamento do emprego do Método de Ledermann para as mesorregiões do Nordeste pode ser encontrado em [9].

(4)

Etapa 2: A seguir, foram estimadas as coberturas dos óbitos para as microrregiões do Nordeste brasileiro, utilizando o método do balanço de crescimento proposto por [1].

2.2 Modelo de regressão beta

A distribuição de probabilidade beta é muito utilizada para modelar dados restritos a algum intervalo aberto, o que a torna muito flexível. Quando esse intervalo é o unitário padrão (0, 1), os dados podem ser interpretados como taxas ou proporções. O modelo de regressão utilizando essa distribuição foi proposto por vários autores, entre eles [2], [4], [10], [15], [14] e [11].

O modelo proposto por [2] é bastante usual, pois é construído de uma maneira similar aos modelos lineares generalizados [6], que são bem conhecidos na literatura. O modelo é útil para modelar dados em que a variável de interesse é contínua e restrita no intervalo unitário padrão e está relacionada com as outras variáveis (independentes) através de uma estrutura de regressão. Uma das suposições do modelo é que a variável resposta deve pertencer à distribuição beta e que os parâmetros de regressão devem ser funções da média dessa variável.

A função densidade da distribuição beta é dada por:

   

1 1 ; , p q p 1 q , 0 1 y p q y y y p q            (2) em que p > 0 , q> 0 e (.) é a função Gama.

A média e a variância de y são respectivamente,

 

 

 

2

e var 1 p pq E y y p q p q p q      (3) Porém, para análise de regressão, normalmente é mais útil modelar a média da variável resposta e também é típico definir o modelo de tal modo que ele tenha um parâmetro de dispersão (ou precisão). Para obter uma estrutura de regressão para a média da variável resposta com um parâmetro de dispersão [2] utiliza uma reparametrização da densidade que já era conhecida anteriormente na literatura, por exemplo, [3]. Fazendo  = p /(p + q) e  = p + q, ou seja, p =  e q = (1 -), temos que:

 

var

 

 

1 V E yy      (4) em que V () = .(1 - ), de modo que  é a média da variável resposta e  pode ser interpretado como o parâmetro de dispersão no sentido que para  fixo, quanto maior o valor de , menor a variância de y.

Utilizando essa reparametrização a densidade da distribuição beta é dada por

 

  

1

1  1 ; , 1 , 0 1, 1 f y    y y   y                (5) em que 0 <  < 1 e  > 0

(5)

Dados y1, y2, ..., yn variáveis aleatórias independentes, em que cada yt , t = 1, ..., n, segue a densidade da

Equação(5) com média t e parâmetro de precisão desconhecido . No modelo de regressão beta é assumido que a média satisfaz a seguinte relação funcional:

 

1 , i k t t i t i gx    

 (6) em que β = (β1, β2, ..., βk)T é um vetor de parâmetros de regressão desconhecidos (β k), xt1, ..., xtk são

observações com k covariáveis (k < n), ni é o preditor linear e g(.) é uma função estritamente monótona

e duas vezes diferenciável em , na qual é chamada de função de ligação. Várias funções de ligação podem ser utilizadas, como por exemplo a logit g() = log( / 1 - ), probit g() = -1, em que (.) é a função acumulada da distribuição normal, complemento log-log g() = log(-log(1 - )), log-log g() = -log(-log()), entre outras.

As estimativas dos parâmetros são obtidas através do método de máxima verossimilhança, assim o log da densidade da Equação (5) é dado por:

og( ; , ) og ( ) og ( ) og ((1 ) ) ( ) og( ) [(1 ) 1] og(1 ) l y l l l l y l y                      (7)

e a função de log-verossimilahnça é da forma:

1 ( , ) ( , ) n i i i      

(8) em que ( , ) og ( ) og ( ) og ((1 ) ) ( ) og( ) [(1 ) 1] og(1 ) i i i i i i i i l l l l y l y                        (9)

Fazendo yt* = og[l yt/1yt] e     t* ( t ) ((1 t) ), a função escore, obtida através da diferenciação da função log-verossimilhança com respeito aos parâmetros é dada por

(U( , ) ,  T U( , ))  T, onde:

(U( , )  TT y( t*t*) (10) Com X sendo uma matriz n x k cuja t-ésima linha é x ttT, 1,... ,n Tdiag[1/g´(t)] e

* * 1 ( , ) [ ( ) og(1 ) ((1 ) ) ( )] n t t t t t t U    yl y       

      (11)

(6)

Seja  ( t, )t, os estimadores de máxima verossimilhança de  e  onde são obtidos como solução do sistema de equações não-lineares U( ) 0. Como esses estimadores não possuem forma fechada, eles precisam ser obtidos numericamente maximizando a função log-verossimilhança através de um algoritmo de otimização não-linear como por exemplo, BFGS. Agora seja c( ,...,c1 cn)t com

´ ´

[ ( ) ((1 ) )(1 )]

t t t t t

c          , onde ´(.)é a função trigama. Temos Ddiag d[ ,.... ]1 dn , com

´ 2 ´ 2 ´

( ) ((1 ) )(1 ) ( )

t t t t t

d           . A matriz informação de Fisher é dada por:

( , ) K K K K K K              (12) em que KX WX KT , KX TT C, e Ktr D( ).

Sob as condições usuais de regularidade para os estimadores de máxima verossimilhança, quando a amostra é grande temos,

1 1 ˆ , ˆ Nk K                       (13)

em que ˆ e ˆ são estimadores de máxima verossimilhança de  e , respectivamente. 1

K é da forma: K 1 K 1( , ) K K K K                (14) em que: 1 1 1 ( ) ( ) T T T T T k X Tcc T X X WX K X WX I          (15) com  tr D( )1c T X X WXT T ( T )1X TcT , K (K)T 1 (X WXT ) 1X TcT ,      K 1

Após o ajuste do modelo é importante ser feito uma análise de diagnóstico afim de verificar a qualidade do ajuste do modelo estimado. Uma medida global de qualidade do ajuste pode ser obtida

(7)

calculando o pseudo-2

definido como o quadrado do coeficiente de correlação entre ˆ e g(μ). Quanto maior o pseudo-2

, melhor a qualidade do ajuste.

A discrepância do ajuste pode ser medida como duas vezes a diferença entre a máxima verossimilhança alcançada pelo modelo saturado e a alcançada pelo modelo em investigação. Essa medida é o desvio, e

r

td

sin (

al y

t

ˆ

t

)[2( ( , )

t

 

ˆ

t

( , ))]

 

ˆ

ˆ

1/2 (16) em que é a média estimada no modelo saturado.

Podemos notar que a t-ésima observação contribui com uma quantidade ao desvio, logo, uma observação com um valor absoluto grande de pode ser vista como discrepante.

Também é possível definir os resíduos padronizados

ˆ

ˆ ( )

t t t t

y

r

var y

(17)

Pode-se fazer um gráfico desses resíduos padronizados com envelope simulado afim de verificar a qualidade do ajuste. Se os pontos estiverem dentro do envelope, significa que a qualidade do ajuste é bom e ao contrário, se várias observações ficarem fora do envelope, então o modelo ajustado não esta adequado. Um gráfico de rt contra ˆ pode-se verificar se a função de ligação está adequada, o mesmo não apresentara nenhuma tendência se isso acontecer.

Em [14], é feito uma extensão do artigo de [2] onde é introduzido uma estrutura de regressão para o parâmetro de precisão e essa estrutura tanto da média da variável resposta quanto do parâmetro de precisão podem ser ou não lineares, tornando o modelo mais geral. Assim, os modelos são definidos como segue:

g1

 

i 1ixiTe g2

 

i 2iziT (18)

em que β= (β1, β2, ..., βk)T e  = (1, 2, ..., k)T são vetores de regressores que são assumidos serem funcionalmente independentes, β k e   h , com k + h < n. 1i e 2i são preditores lineares, e xi1

, .., xik , zi1 , ...,zih são observações em que k e h são conhecidas, que não precisam ser mutuamente excludentes. Mas ainda, nós assumimos que as funções de ligação g1 : (0, 1)   e g2 : (0, )   são

estritamente monótonas e duas vezes continuamente diferenciáveis.

As estimativas dos parâmetros são feitas através do método da máxima verossimilhança, porém, esses estimadores em modelos de regressão que utilizam funções de ligação são geralmente viesados. Esse viés não é um problema quando o tamanho da amostra é grande, pois em geral é de ordem O(n-1) enquanto que o erro-padrão é de ordem O(n-1/2), mas se o tamanho da amostra for pequeno, esse viés pode ser grande quando comparado com o erro-padrão do estimador. Dessa forma os cálculos dos vieses de

(8)

segunda ordem dos estimadores de máxima verossimilhança são de tamanha importância, especialmente quando a amostra é reduzida.

O modelo de regressão beta se tornou mais conhecido após ser implementado por Alexandre B. Simas e Andréa V. Rocha a função betareg no software R, pois através dele é possível modelar dados através do modelo citado acima.

3 - Resultados e discussões

Para verificar a relação entre as Doenças Cardiovasculares e as variáveis definidas anteriormente foi utilizado o modelo de regressão beta, uma vez que a variável resposta taxa de mortalidade dos idosos por doenças cardiovasculares assume valores no intervalo padrão (0,1). Em análise de regressão as variáveis associadas à variável resposta não devem ter uma associação muito forte entre si (multicolinearidade), pois isto pode provocar efeitos nas estimativas dos parâmetros e na aplicabilidade geral do modelo estimado.

Com isso, para verificar as correlações existentes entre as variáveis independentes do modelo e evitar possíveis interpretações equivocadas nas análises foi necessário calcular a matriz de correlação de Pearson. Na Tabela 1 são encontrados os resultados desses coeficientes para ambos os sexos. Observar-se que para o sexo masculino o maior coeficiente de correlação foi encontrado quando relacionamos a variável Percentual dos idosos que sabem ler e escrever com Renda mensal média dos idosos, onde apresentou um coeficiente de correlação de 0,829 ao nível de significância de 0,01, indicando uma associação muito forte entre essas variáveis. Por isso essas variáveis não podem estar juntas no modelo. Desse modo, para verificar a influência de cada uma dessas variáveis separadamente, dois novos modelos foram ajustados, considerando apenas uma delas em cada modelo estimado. Após as análises desses modelos verificamos que o melhor ajuste foi aquele contendo a variável Percentual dos idosos que sabem ler e escrever.

Em relação ao sexo feminino, o maior coeficiente de correlação foi encontrado quando relacionamos a variável Percentual de analfabetismo dos idosos com o Percentual dos idosos que sabem ler e escrever, em que foi encontrado um coeficiente de correlação de -0,852 ao nível de significância de 0,01, o que indica uma associação muito forte entre essas variáveis, com isso essas variáveis não devem estar juntas na construção do modelo, por esse motivo foi feito um ajuste sem a variável Percentual de analfabetismo e outro ajuste sem a variável Percentual dos idosos que sabem lê e escrever. Após as análises o modelo que melhor se ajustou foi o que contém a variável Percentual de analfabetismo dos idosos e com isso a variável Percentual dos idosos que sabem ler e escrever foi excluída do modelo de regressão.

Após as análises dos coeficientes de correlação entre as variáveis independentes, foram realizados vários ajustes com combinações de funções de ligação como podemos observar na Tabela 2 e 3. Observa-se que não houve uma grande variação no pObserva-seudo-R2 dos modelos ajustados com suas respectivas funções de ligação. Para o sexo masculino o modelo de regressão beta com função de ligação log foi o que

(9)

apresentou o maior pseudo-R2 (0,777). Por outro lado o modelo com função de ligação log-log apresentou um pseudo-R2 de (0,769). Já para o sexo feminino, o modelo de regressão beta com função de ligação cloglog, logit e probit apresentou o mesmo valor no pseudo-R2 (0,667).

(10)

Tabela 1: Matriz de coeficientes de correlação de Pearson e significância das variáveis independentes, ambos os sexos, das microrregiões do Nordeste - 2010.

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 MASCULINO X1 Correlação FEMININO 1 ,147* ,159* -0,121 -,235** -,331** -,418** -,479** ,564** ,580** ,426** Significância 0,044 0,030 0,099 0,001 0,000 0,000 0,000 0,000 0,000 0,000 X2 Correlação ,147 * 1 ,647** -,552** -,542** 0,026 -0,126 -,308** -0,007 0,074 ,149* Significância 0,044 0,000 0,000 0,000 0,720 0,085 0,000 0,927 0,313 0,041 X3 Correlação ,159* ,647** 1 -,578** -,654** -0,078 -,241** -,260** -0,047 0,108 ,257** Significância 0,030 0,000 0,00 0,00 0,29 0,00 0,00 0,53 0,14 0,00 X4 Correlação -0,136 -,576** -,588** 1 ,655** 0,129 ,237** ,264** -0,017 -,170* -0,114 Significância 0,064 0,000 0,000 0,000 0,079 0,001 0,000 0,817 0,020 0,121 X5 Correlação -,281** -,523** -,632** ,640** 1 ,326** ,506** ,342** 0 -,176* -,263** Significância 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,997 0,016 0,000 X6 Correlação -,279** 0,037 -0,008 0,077 ,225** 1 ,786** ,334** -,331** -,394** -,425** Significância 0,000 0,613 0,914 0,295 0,002 0,000 0,000 0,000 0,000 0,000 X7 Correlação -,319** -,169* -,287** ,215** ,503** ,596** 1 ,451** -,368** -,461** -,548** Significância 0,000 0,021 0,000 0,003 0,000 0,000 0,000 0,000 0,000 0,000 X8 Correlação -,344** -,542** -,438** ,384** ,427** 0,074 ,233** 1 -,736** -,697** -,530** Significância 0,000 0,000 0,000 0,000 0,000 0,314 0,001 0,000 0,000 0,000 X9 Correlação ,487** ,400** ,281** -,289** -,299** -0,129 -,226** -,852** 1 ,829** ,508** Significância 0,000 0,000 0,000 0,000 0,000 0,078 0,002 0,000 0,000 0,000 X10 Correlação ,508** 0,133 ,158* -,204** -,218** -0,059 -,220** -,571** ,704** 1 ,540** Significância 0,000 0,069 0,03 0,005 0,003 0,426 0,003 0,000 0,000 0,000 X11 Correlação ,426** ,149* ,257** -0,141 -,252** -,274** -,525** -,438** ,494** ,456** 1 Significância 0,000 0,041 0,000 0,055 0,001 0,000 0,000 0,000 0,000 0,000

(11)

Tabela 2. Funções de ligação e estimativas dos parâmetros das variáveis significativas ao nível de 5% do modelo de regressão beta, sexo masculino, microrregiões do Nordeste, 2010.

VARIÁVEIS CAUCHIT CLOGLOG LOG LOGIT LOGLOG PROBIT

Intercepto 2,267 0,265 * 0,525 0,366 0,196 X2 -0,856 -0,464 -0,411 -0,509 -0,238 -0,284 X4 -3,871 -1,812 -1,668 -1,959 -0,860 -1,062 X5 3,100 1,512 1,390 1,641 0,738 0,896 X7 -0,168 -0,081 -0,074 -0,088 -0,039 -0,048 X9 -0,683 -0,295 -0,272 -0,316 -0,132 -0,168 X11 -0,604 -0,304 -0,276 -0,331 -0,147 -0,180 PSEUDO-R² 0,773 0,776 0,777 0,775 0,769 0,773

Tabela 3. Funções de ligação e estimativas dos parâmetros das variáveis significativas ao nível de 5% do modelo de regressão beta, sexo feminino, microrregiões do Nordeste, 2010.

VARIÁVEIS CAUCHIT CLOGLOG LOG LOGIT LOGLOG PROBIT

Intercepto 1,147 -0,614 -0,769 -0,454 * -0,364 X3 -0,923 -0,397 -0,370 -0,425 -0,261 -0,225 X4 -3,200 -1,271 -1,189 -1,356 -0,579 -0,716 X5 2,674 1,079 1,008 1,153 0,475 0,610 X7 -0,144 -0,056 -0,052 -0,059 -0,025 -0,031 X8 1,195 0,524 0,487 0,562 0,206 0,301 X11 -0,549 -0,225 -0,210 -0,241 -0,123 -0,128 PSEUDO-R² 0,651 0,667 0,666 0,667 0,663 0,667

Para validar os modelos estimados, realizou-se uma análise de resíduo e diagnostico, a fim de verificar possíveis afastamentos das suposições do modelo.

Em relação ao sexo masculino o melhor ajuste encontrado foi o modelo de regressão beta com a função de ligação log-log para a estrutura de regressão da média. As variáveis significativas para modelar a taxa de mortalidade padronizada dos idosos por doenças cardiovasculares foram: Área de desenvolvimento do FIRJAN “Educação”, Percentual de causas mal definidas de óbitos, Percentual de causas desconhecidas de óbitos, Expectativa de vida, Percentual de idosos que sabem ler e escrever e Percentual de casas que possuem banheiro e água. O pseudo – R2 foi de 0.769 o que significa que aproximadamente 77% da variabilidade da variável resposta é explicada por essas variáveis.

A Tabela 4 mostra as estimativas dos parâmetros da estrutura de regressão para a média. Através das estimativas desses parâmetros é possível verificar a contribuição de cada uma das variáveis na taxa de mortalidade dos idosos por Doenças Cardiovasculares, além de evidenciar qual variável aumenta ou diminui essas taxas de mortalidade. Quanto aos sinais das estimativas, observa-se que estão coerentes, visto que as variáveis: Área de desenvolvimento do FIRJAN “Educação”, Percentual de causas mal definidas de óbitos, Expectativa de vida, Percentual de idosos que sabem ler e escrever e Percentual de casas que possuem banheiro e água apresentaram sinal negativo nas estimativas dos seus parâmetros, indicando assim que existe uma relação inversa com a taxa de mortalidade dos idosos por Doenças Cardiovasculares, com isso quanto menor forem os índices dessas variáveis mais elevada será a taxa de

(12)

mortalidade dos idosos por Doenças Cardiovasculares. Podemos observar que para a variável percentual de causa mal definidas de óbitos obteve um valor na estimativa do seu parâmetro de -0,860.

A única variável que apresentou sinal positivo na estimativa do parâmetro foi o Percentual de causas desconhecidas de óbitos (0,732), indicando que quanto maior o índice dessa variável maior será a taxa de mortalidade dos idosos por doenças cardiovasculares. Esta relação é discutível, já que este tipo de mortalidade estaria relacionado com a qualidade de vida da população, em que quanto maior o percentual de causa desconhecida pior seria a qualidade de vida da população.

Tabela 4. Estimativas dos parâmetros para o valor esperado da variável resposta, sexo masculino.

Variáveis Estimativa Erro-Padrão P-valor

Intercepto 0,366 0,063 0,000

Área de desenvolvimento do FIRJAN “Educação” -0,238 0,072 0,000

Percentual de causas mal definidas de óbitos -0,860 0,058 0,001

Percentual de causas desconhecidas de óbitos 0,738 0,054 0,000

Expectativa de vida -0,039 0,001 0,000

Percentual de idosos que sabem ler e escrever -0,132 0,040 0,000

Percentual de casas que possuem banheiro e água -0,147 0,032 0,000

Após as estimativas dos parâmetros, temos que a equação de regressão para estimar a taxa de mortalidade dos idosos por doenças cardiovasculares fica especificada da seguinte forma:

 

ˆ

2 4 5 7 9 11

og og 0,366 0,238 0,860 0,732 0,039 0,132 0,147

l lx x x x x x

        

Através do gráfico dos resíduos versus valores observados, Figura 1, verifica-se que os pontos estão dispersos de forma aleatória, indicando o bom ajuste da função de variância.

Figura 1. Gráfico de resíduos versus valores observados, sexo masculino.

Para verificar o ajuste do modelo da distribuição beta aos dados e consequentemente o ajuste do modelo, foi construído o gráfico dos resíduos com envelope simulado Figura 2. Podemos observar que a

(13)

maioria dos pontos está dentro do intervalo de confiança, através desse gráfico verifica-se que não há evidencias para rejeição da hipótese de adequação do modelo, embora alguns pontos estejam fora do intervalo de confiança.

Figura 2. Gráfico dos resíduos com envelope simulado, sexo masculino.

A Figura 3 mostra o gráfico dos resíduos versus o preditor linear, útil para verificar a adequabilidade da função de ligação. Observou-se um padrão aleatório dos pontos comprovando assim a adequação da função log-log.

Figura 3. Gráfico dos resíduos versus preditor linear, sexo masculino.

Para o sexo feminino o melhor ajuste encontrado foi o modelo de regressão beta com a função de ligação log-log para a estrutura de regressão da média. As variáveis significativas para modelar a taxa de mortalidade padronizada dos idosos por Doenças Cardiovasculares foram: Área de desenvolvimento do FIRJAN “Saúde”, Percentual de causas mal definidas de óbitos, Percentual de causas desconhecidas de óbitos, Expectativa de vida, Percentual de analfabetismo dos idosos, Percentual de casas que possuem banheiro e água. O pseudo – R2 foi de 0.663 o que significa que aproximadamente 66% da variabilidade da variável resposta é explicada por essas variáveis.

(14)

A Tabela 5 mostra as estimativas dos parâmetros da estrutura de regressão para a média. Podemos observar que as variáveis x3, x4, x7 e x11 apresentaram sinal negativo nas estimativas dos parâmetros, indicando que existe uma relação inversa com a taxa de mortalidade dos idosos por Doenças Cardiovasculares, assim, quanto menor forem os índices dessas variáveis mais elevada será a taxa de mortalidade. Já as variáveis x5 e x8 apresentaram sinal positivo na estimativa do parâmetro, indicando assim que quanto maior o índice dessas variáveis maior será a taxa de mortalidade dos idosos por Doenças Cardiovasculares.

Tabela 5. Estimativas dos parâmetros para o valor esperado da variável resposta, sexo feminino.

Variáveis Estimativa Erro-Padrão P-valor

Área de desenvolvimento do FIRJAN “Sáude” -0,261 0,051 0,000

Percentual de causas mal definidas de óbitos -0,579 0,055 0,000

Percentual de causas desconhecidas de óbitos 0,475 0,049 0,000

Expectativa de vida -0,025 0,001 0,000

Percentual de analfabetismo dos idosos 0,206 0,047 0,000

Percentual de casas que possuem banheiro e água -0,123 0,029 0,000

Após as estimativas dos parâmetros, temos que a equação de regressão para estimar a taxa de mortalidade dos idosos por doenças cardiovasculares fica especificada da seguinte forma:

 

ˆ

3 4 5 7 8 11

og og 0,261 0,579 0,475 0,025 0,206 0,123

l lx x x x x x

        

Podemos observar através gráfico dos resíduos versus valores observados, Figura 4, que os pontos estão dispostos de forma aleatoriedade, indicando o bom ajuste da função da variância.

Figura 4. Gráfico de resíduos versus valores observados, sexo feminino.

Para verificar o ajuste do modelo foi construído o gráfico dos resíduos com envelope simulado, Figura 5. Podemos observar que a maioria dos pontos está dentro do intervalo de confiança, com isso não

(15)

há evidências para rejeição da hipótese de adequação do modelo, indicando assim um bom ajuste do modelo, embora alguns pontos estejam fora do intervalo de confiança.

Figura 5. Gráfico dos resíduos com envelope simulado, sexo feminino.

A Figura 6 mostra o gráfico dos resíduos versus o preditor linear, podemos observar um padrão aleatório dos pontos comprovando assim a adequação da função log-log.

Figura 6. Gráfico dos resíduos versus preditor linear, sexo feminino. 4 - Conclusões

O modelo de regressão beta possibilitou identificar variáveis que contribuíram de modo significativo para o aumento da mortalidade dos idosos por Doenças Cardiovasculares.

Para o sexo masculino, o modelo de regressão beta com função de ligação log-log foi o que melhor se ajustou. As variáveis significativas para modelar a taxa de mortalidade dos idosos por doenças cardiovasculares foram: Área de desenvolvimento do FIRJAN “Educação”, Percentual de causas mal definidas de óbitos, Percentual de causas desconhecidas de óbitos, Expectativa de vida, Percentual de idosos que sabem ler e escrever e Percentual de casas que possuem banheiro e água. O pseudo – R2 foi de 0.769 o que significa que aproximadamente 77% da variabilidade da variável resposta é explicada por essas variáveis. Já para o sexo feminino, a função de ligação log-log também foi a que melhor se ajustou e

(16)

as variáveis significativas para modelar a taxa de mortalidade dos idosos foram: Área de desenvolvimento do FIRJAN “Saúde”, Percentual de causas mal definidas de óbitos, Percentual de causas desconhecidas de óbitos, Expectativa de vida, Percentual de analfabetismo dos idosos, Percentual de casas que possuem banheiro e água. O pseudo – R2 foi de 0.663 o que significa que aproximadamente 66% da variabilidade da variável resposta é explicada por essas variáveis.

O modelo proposto neste trabalho possibilitou investigar fatores importantes para entender melhor os condicionantes da mortalidade dos idosos por Doenças Cardiovasculares. Espera-se com esta análise poder auxiliar na definição de políticas de atenção primária à saúde do idoso, nordestino e nortear políticas de prevenção no que se diz respeito à mortalidade por doenças cardiovasculares.

5 – Bibliografia

[1] BRASS, W. (1975). Methods for Estimating Fertility and Mortalily from Limitid and Defective Data, Oceasional Publication. International Program of Laboratories for Population Stastistios, Chapel Hill.

[2] FERRARI, S.L.P.; CRIBARI NETO, F. (2004). Beta regression for modeling rates and proportions. J. Appl. Statist. 31, 799-815.

[3] JORGERSEN, B., (1979). The theory of dispersion models. Chapman Hall, London.

[4] KIESCHNICK, R.; McCULLOUGH, B. (2003). Regression analysis of variates observed on (0,1): percentagens, proportions, and fractions. Model. 3, 193-213.

[5] MALTA, D. C.; DUARTE, E. C. (2007). Causas de mortes evitáveis por ações efetivas dos serviços de saúde: uma revisão da literatura. Ciência e Saúde Coletiva, Vol. 12, nº3, pp. 765-776. [6] McCULLAGH, P.; NELDER, J., (1989). Gerenalized linear models. Second ed. Chapman Hall, London.

[7] MINISTÉRIO DA SAÚDE – Sistema de Informação de Mortalidade – SIM , 2010. Disponível em: <http://tabnet.datasus.gov.br/cgi/tabcgi.exe?sim/cnv/obt10uf.def>. Acesso em 15/02/2013.

[8] ORTIZ, L. P. (1996). Utilização das causas evitáveis na mortalidade infantil como instrumento avaliação das ações de saúde. In: X Encontro Nacional de Estudos Populacionais, 1996, Caxambu. (Anais) Belo Horizonte: ABEP

[9] PAES, N. A. (2007). Qualidade das estatísticas de óbitos por causas desconhecidas dos Estados brasileiros. Revista de Saúde Pública, Vol. 41, nº3, pp. 436-445.

[10] PAOLINO, P., (2001). Maximum likelihood estimation of models with beta-disributed dependent variables. Political Anal. 9, 325-346.

[11] ROCHA, A.V.; SIMAS, A.B., (2010). Influence diagnostics in a general class of beta regression models. Test. A. aparecer.

[12] SANTOS, J. L. F. (1980). Dinâmica da população: teoria, métodos e técnicas de análise. São Paulo: T.A. Queiroz.

(17)

[13] SILVA, R. C.; SILVA, M. G. C. (2003) Anos potenciais de vida perdidos por causas evitáveis, segundo sexo, em Fortaleza, em 1996-1998. Epidemiologia e Serviços de Saúde, Vol. 12, nº2, pp. 99-110.

[14] SIMAS, A.B., BARRETO-SOUZA, W., ROCHA, A.V., (2010). Improved estimators for a general class of beta regression models. Comput. Statist. Data Anal. 54, 348-366.

[15]VASCONCELLOS, K.L.P. & CRIBARI-NETO, F. (2005). Improved maximum likelihood

Referências

Documentos relacionados

As informações constantes deste Boletim deverão ser confirmadas nos respectivos órgãos licitantes. Site do

Outro ponto crítico para o fechamento controlado de disjuntores de transformadores de potência sem carga é que o fluxo prospectivo criado pela tensão no instante do fechamento

Entrega da Declaração Recapitulativa mensal referente a dezembro de 2016, por transmissão eletrónica de dados, pelos sujeitos passivos enquadrados no regime normal de tributação

No direito constitucional, referida teoria dita que a forma de aplicação dos direitos fundamentais (subsunção, sopesamento, concretização) depende da extensão do suporte

Filosofia e da Medicina, demitiram-se de seus cargos.” “Durante o segundo semestre, (o Prof. Ernesto de Souza Campos, novo diretor da FFCL) realizou gestões junto ao governo

No entanto, não há garantia de que este tratamento tributário será sempre aplicável ao FUNDO devido a possibilidade de ser reduzido o prazo médio de sua carteira, em razão,

Na categoria feminina os dados apontam que o fator que mais motivou o ingresso na modalidade foi o interesse próprio, ou seja, os participantes sabiam da existência da equipe e

Engenharia de Estrutura e Prática Estrutural - (T)* (Enzio S. Júnior) 503 21:15 Optativa – Planejamento, Construção e Gestão de Infraestrutura Rodoviária (Paulo José