• Nenhum resultado encontrado

ANÁLISE DOS DADOS

No documento Análise Temporal Linear 2008 a 2015 (páginas 97-107)

ANEXO 6 - PARECER CONSUBSTANCIADO DO CEP (COMISSÃO DE

3. MATERIAL E MÉTODO

3.6. ANÁLISE DOS DADOS

Os dados foram analisados em dois momentos distintos. O primeiro momento sob abordagem de estatística descritiva. Esta foi desenvolvida para que se pudesse produzir uma análise temporal representativa e contemplativa à amplitude das variáveis e dados, de uma pesquisa censitária, na qual somente foram desenvolvidos cálculos de percentuais, proporção, média, mediana e desvio padrão. Assim, analisaram-se dados do SINASC, de todos os nascimentos vivos com ou sem anomalias congênitas registradas.

Os dados foram trabalhados em subcapítulos incluindo as variáveis maternas, do recém-nascido e assistenciais, no período de 2008 a 2015, organizado nos dois Quadriênios e segundo as faixas etárias das mães. Esta análise descritiva apresentou as variáveis independentes e dependentes, em seu número absoluto e proporcional, organizadas em Tabelas, Gráficos e Quadros. Também foram feitos os cálculos de médias, medianas e desvio padrão.

Os nascidos vivos, com ou sem AC, foram filtrados do SINASC do DATASUS, para os anos estudados. Para seleção e análise dos natimortos/óbitos fetais, com e sem causa básica registrada de Anomalia Congênita, no período em estudo, foi utilizado o banco de dados do Sistema de Informação sobre Mortalidade (SIM) que apresenta um segmento de Óbitos Fetais. Foi utilizado filtro de seleção disponível, a Classificação Internacional de Doenças da 10ª Revisão (CID 10ª), para o Capítulo XVII –

‘Malformações Congênitas, Deformidades e anomalias cromossômicas’.

(BRASIL/DATASUS, 2018).

Para o segundo momento, o de análise da distribuição espacial das AC no estado do Paraná, se traçou a Taxa de Prevalência dos Nascimentos com AC, utilizando-se dados referentes aos nascimentos com e sem AC, quer tenham sido vivos (SINASC) ou mortos (natimorto/óbitos fetais do SIM), de acordo com o Birth Prevalence Congenital Anomalies. (OMS, 2014):

ۼ܄܋ܗܕۯ۱ ൅ ۻܗܚܜ܍ܛ܎܍ܜ܉ܑܛ܋ܗܕۯ۱

܂ܗܜ܉ܔ܌܍ۼ܄ ൅ ܂ܗܜ܉ܔ܌܍ۻܗܚܜ܍ܛ۴܍ܜ܉ܑܛܠ૚૙Ǥ ૙૙૙

A Taxa de Prevalência dos Nascimentos com AC, segundo município de residência da mãe, foi analisada estatisticamente com os fatores socioeconômicos e agropecuários, com foco no uso de agrotóxicos. E os resultados das análises em modelos

100

específicos multivariados foram aplicados para a análise da distribuição espacial, que igualmente foi organizada nos dois Quadriênios (1º Qd - 2008 a 2011 e 2º Qd - 2012 a 2015).

Na análise da distribuição espacial, para minimizar as variações nas Taxas de Prevalência de AC por município, bem como, as possíveis flutuações aleatórias derivadas da análise de populações pequenas, foi utilizado o Estimador Bayesiano Empírico para o cálculo das Taxas. Este teve como matriz de pesos rainha para verificar a taxa média dos eventos das cidades vizinhas, como de primeira ordem no software GeoDatm, o qual considera todos os municípios vizinhos que possuam uma fronteira em comum.

(ANSELIN; SYABRI; KHO, 2005).

Este estimador calcula uma taxa de notificação ponderada, considerando variâncias regionais e, portanto, permite comparações entre diferentes populações. No estado do Paraná, foi observada uma exacerbada discrepância no contingente populacional. Há cidades bastante populosas como a capital Curitiba com quase 2.000.000 de habitantes, porém também 364 municípios (91,2%) com menos de 20.000 habitantes. Assim, afirma-se que a distribuição populacional e do fenômeno estudado possui características heterogêneas. (IPARDES, 2018; FONTES, et al, 2018).

Portanto, houve neste segundo momento o desenvolvimento de uma análise estatística inferencial dos dados, com a análise espacial, a qual, segundo Bailey e Gatrel (1995), consiste em três etapas básica: a visualização espacial; a análise exploratória; e a modelagem dos dados.

Para Yi et al (2000) a visualização espacial é considerada como a essência da manipulação de um banco de dados geográficos. Há exploração visual do objeto de estudo no interior do espaço geográfico. Em contrapartida, a análise exploratória, compreende na descrição da distribuição espacial e dos padrões espaciais das associações dos dados (padrões de agrupamento). Por fim, a modelagem inclui procedimentos de validação estatística e modelos de estimação de dados. (ANDRADE, 2009).

Na sequência, foram destacados aspectos das Análises Descritiva e Inferencial para melhor explanação teórico-descritiva.

3.6.1 Análise Descritiva

Para esta análise foi utilizado como apoio para a organização das variáveis independentes e dependentes o Microsoft Office Excel® 2016. Foi feito o cálculo de

101

percentuais, taxas, média e mediana e desvio padrão das variáveis filtradas do SINASC mediante a ferramenta Tabwin®. (BRASIL/DATASUS, 2017).

O programa Tabwin® – Tab para Windows foi desenvolvido pelo DATASUS com a finalidade de permitir aos profissionais de saúde as tabulações, utilizando-se de arquivos em DBF, os quais constituem os componentes dos sistemas de informação do SUS. Já o Tabnet® – Tab para Internet, é uma ferramenta de tabulação disponível na internet de acesso livre, tanto para profissionais, como para toda a população.

(BRASIL/DATASUS, 2018).

O estabelecimento dos parâmetros das variáveis independentes e dependentes, foi realizado com base na Linha Guia Mãe Paranaense. Esta como protocolo estadual no qual é orientado o processo de classificação de risco da gestante e da criança, como: Risco Habitual, Intermediário e Alto Risco. Esta classificação é recomendada e fundamentada par todo o Estado. Além desta classificação, são fornecidos dados sobre a Rede Assistencial, com a relação dos hospitais de referência nas Regionais de Saúde. São também apresentadas informações concernentes à adequada assistência ao pré-natal, como o protocolo de exames, número de consultas, indicadores, dentre outras informações. (PARANÁ, 2012)

Para esta análise se identificaram 8.963 casos de AC, variável independente, no período de 2008 a 2015. Além da análise descritiva comparando-se os nascidos vivos com e sem AC, foram organizados em uma tabela os tipos de AC registadas no SINASC, de acordo com a faixa etária materna. Reitera-se que, em 2011, houve uma mudança importante na DNV, com acréscimo de algumas variáveis

A análise das variáveis dependentes (qualitativas e quantitativas) foi organizada em subcapítulos, como último os tipos de AC registrados no período do estudo, também de acordo com a faixa etária. Para finalizar esta abordagem foi realizada análise estatística descritiva dos dados quantitativos apresentando os valores de média, mediana e desvio padrão dos dois quadriênios disponível no Apêndice 3.

3.6.2 Análise Inferencial

Para esta análise, foi organizado um sólido banco de dados com as Taxas de Nascimentos com AC para os 399 municípios do estado, ou seja, nas Regiões Administrativas e nas Regionais de Saúde consideradas variáveis independentes/desfecho. Neste banco foram inclusas as variáveis socioeconômicas

102

importadas do IPARDES e IBGE, dispostas no BDEweb, além das agrícolas, disponibilizadas pelo ADAPAR, as quais foram a base da análise inferencial e geoespacial, consideradas variáveis dependentes ou preditoras. (IPARDES, 2017).

Reitera-se que esta prevalência é calculada na presente pesquisa com base na orientação da WHO (2014), incluindo-se além dos nascidos vivos com e sem AC os nascidos mortos/natimortos com e sem AC. (BRASIL/DATASUS, 2018).

Para a Análise Espacial se utilizam dados geográficos para avaliar as propriedades de um determinado fenômeno em relação à sua localização. A mesma incorpora o espaço à análise que se deseja fazer, e este espaço está determinado por áreas delimitadas por polígonos. Busca-se entender a interferência das propriedades locais, ambientais e socioeconômicas sobre o fenômeno, bem como, a existência de similaridade entre o polígono analisado em relação à sua vizinhança. Na presente pesquisa, desenvolveu-se uma análise de dados espaciais por áreas de Contagens e Taxas Agregadas, que são dados associados aos levantamentos populacionais, a partir de um indivíduo localizado em um espaço, respeitando sua confidencialidade. (CÂMARA, et al; 2004a).

A Análise Exploratória de Dados Espaciais (AEDE) permitiu mensurar as propriedades e o relacionamento do fenômeno, além de sua relação com seus vizinhos dentro do espaço geográfico. Foram elaborados mapas coropléticos divididos por quartis14, os quais dividem a frequência das Taxas de uma amostra, em partes iguais.

(ANSELIN, 1998; ANDRADE, 2009)

Para a elaboração dos mapas foram utilizadas as taxas de prevalência do agravo na perspectiva de visualizar a sua distribuição em áreas delimitadas por polígonos, entendidos como os municípios do estado do Paraná. Deste modo, nas regiões com maior intensidade, dado um gradiente de cor, evidenciou-se a situação/problema em estudo: os municípios com maior prevalência de AC relacionado a exposição as variáveis socioeconômicas e ao uso dos agrotóxicos na regressão espacial. (CÂMARA, et al., 2004b).

_______________

14Quartis (Q1, Q2 e Q3): São valores dados a partir do conjunto de observações ordenado em ordem crescente, que dividem a distribuição em quatro partes iguais. O primeiro quartil, Q1, é o número que Q1 Q1 deixa 25% das observações abaixo e 75% acima, enquanto que o terceiro quartil, Q3, deixa 75% das observações abaixo e 25% acima. Já Q2 é a mediana, deixa 50% das observações abaixo e 50% das observações acima. (UFPR, 2018).

103

A autocorrelação espacial refere-se a localizações próximas geograficamente ou vizinhas que apresentam valores similares ou não (correlação). Sendo assim, é considerada uma autocorrelação positiva quando valores altos ou baixos de uma variável aleatória específica formarem clusters espaciais; e autocorrelação espacial negativa quando os vizinhos de uma determinada área geográfica apresentarem valores diferentes.

(PEROBELLI e HADDAD, 2006).

Foi utilizado para a Análise Global de Autocorrelação Espacial, o Índice Global de Moran, que fornece um único valor como medida de associação espacial ponderada por uma matriz de vizinhança. Podendo ser expressa na fórmula a seguir: (PEROBELLI, et al., 2008).

– ൌ ቀ

‘ቁ ൅ ൬ –

œ–൅–

–൰ – ൌ ͳǡ ǥ 

Nesta fórmula, o valor de Zt é o vetor de n que compreende o número de observações, referente ao ano, representado por t (tempo), com desvio em relação à média. A matriz de pesos espaciais é representada pelo W, indicando a forma como o polígono (Município) está espacialmente conectado com as demais regiões vizinhas, e o So é a soma de todos os elementos de W. (PEROBELLI, et al., 2008).

Quando apresenta resultado positivo (0 a +1) indica correlação positiva ou direta, sinalizando similaridade entre os vizinhos quanto ao evento estudado. No entanto, se negativo (0 a -1), indica correlação inversa, e neste sentido, tem-se o entendimento de que há diferença entre os municípios. E nesta leitura, os resultados de valor zero representam a ausência de autocorrelação entre os municípios vizinhos. (CÂMARA, et al., 2004b).

Na análise univariada foi avaliada a prevalência de nascimentos com AC autocorrelacionada considerada variável independente, a sua relação de vizinhança; e na bivariada se analisou a prevalência do 2º Qd de cada município, com variáveis socioeconômicas e relativas ao consumo de agrotóxicos, consideradas as variáveis dependentes ou preditoras do estudo.

O Diagrama de Disperssão compreende um gráfico bidimensional de valores normalizados pela média dos vizinhos, dividida por quatro quadrantes, que indicam situação de autocorrelação entre a prevalência, e as variáveis socioeconômicas e agropecuárias dos municípios, dado um espaço geográfico. (CÂMARA, et al., 2004b).

104

Devido ao Índice Global de Moran não apresentar particularidades locais de associação, foi aplicada para a análise local de autocorrelação espacial, o Indicador Espacial de Associação Local/ Local Indications of Spacial Association (LISA). Este permite maior nível de detalhamento, além de identificar padrões de associação espacial, ou seja, o agrupamento de municípios descrevendo o grau de semelhança ou diferença entre os eventos relacionados ao espaço. Esses conglomerados espaciais são chamados de clusters. Permitiu o agrupamento de municípios com valores de prevalência semelhantes, e os dados serão apresentados em mapas coropléticos, organizado em Quadriênios. (CÂMARA; et al., 2004b).

FIGURA 8– DIAGRAMA DE DISPERSÃO DE MORAN.

FONTE: Câmara, et al., (2004) b.

Legenda: Q1 (valores positivos e médias positivas); Q2 (valores negativos e médias negativas): indicam pontos de associação espacial positiva, no sentido que uma localização possui vizinhos com valores semelhantes. Q3 (valores positivos e médias negativas) e Q4 (valores negativos e médias positivas):

indicam pontos de associação espacial negativa, no sentido que uma localização possui vizinhos com valores distintos.

No Diagrama de Dispersão (Figura 8) os valores são apresentados em quadrantes, que contemplam pontos de associação espacial positiva ou direta o Q1-AA (alto-alto) e o Q2-BB (baixo-baixo), isto é, em sua localização há vizinhos com valores semelhantes. Já os quadrantes Q3-BA (baixo-alto) e o Q4-AB (alto-baixo), indicam associação negativa ou inversa, ou seja, vizinhos com valores diferentes, indicando diferentes padrões espaciais. São denominados de outliers os valores discrepantes dentro dos diferentes padrões espaciais. Os dados foram processados utilizando-se da integração entre dois softwares, o GeoDa na versão 0.9.5-i, e o QGIS na versão 2.8. Ambos os softwares são de acesso livre e de código aberto. (CÂMARA et al., 2004b).

Apesar do Índice Global de Moran e a análise univariada do LISA serem importantes medidas estatísticas de dependência espacial, que têm como foco inquirir padrões espaciais de lugares e valores, e identificar a associação espacial existente entre

105

eles, bem como, a variação sistemática do fenômeno por localização (ANSELIN, 1995), as mesmas são univariadas e não consideram efeitos multivariados das outras variáveis dependentes.

De modo que para a análise das variáveis dependentes desta pesquisa que podem ser também denominadas de preditoras ou explicativas, adotaram-se modelos para evidenciar a correlação multivariada, ou seja, o desenvolvimento de análises com mais de duas variáveis, sempre com a presença da variável independente, no caso a TPNAC no Paraná. A opção foi pela utilização de modelos de Regressão por Mínimos Quadrados Ordinários (Ordinary List Squares - OLS) e de Regressão Ponderada Geograficamente (Geographically Weighted Regression - GWR) que foram utilizados para explorar as relações entre as Taxas de Nascidos com AC no 2º Qd com algumas das variáveis sociodemográficas, com e sem controle para dependência espacial. Esse modelo foi aplicado apenas para o período do 2o Qd com vistas à relevância dos dados secundários mais recentes ou atuais.

Portanto, os modelos de regressão espacial por mínimos quadrados ordinários (Ordinary List Squares - OLS) e de regressão ponderada geograficamente (Geographically Weighted Regression - GWR) foram utilizados para explorar as relações entre as Taxas de Nascidos com AC no 2º Qd com algumas das variáveis sociodemográficas descritas na Tabela 16.

Para a análise de regressão OLS foram incluídos, no banco de dados secundário em utilização, todos os preditores apontados na Tabela 1 por serem supostos de manter alguma associação com a TPNAC. E mediante aplicação do modelo de regressão foram selecionadas as variáveis que apresentaram significância estatística, e que agregariam valor à esta pesquisa.

Mas, para reduzir a multicolinearidade15 e favorecer o desempenho do modelo de análise multivariada, foi conduzida iterativamente uma análise de sensibilidade e assim escolhido o modelo com o melhor Critério de Informação de Akaike (AIC) – este devido ser um método clássico de seleção de variáveis dependentes no Modelo de Regressão Multivariada (FONTES et al., 2018). Por fim, foram incluídas no modelo os preditores _______________

15 Multicolinearidade em regressão é uma condição que ocorre quando algumas das variáveis preditoras no modelo estão correlacionadas a outras variáveis preditoras. É o alto grau de correlação entre as variáveis independentes. De maneira que quando a multicolinearidade é forte torna-se problemática por aumentar a variância dos coeficientes de regressão, tornado-os instáveis.

(LEVINE, 2008).

106

com potencial para trazer mais explicações ao problema dos nascimentos com AC nos municípios, a saber: emprego formal feminino; escolaridade em anos; percentual de cobertura do ESF; gestantes de 10 a 19 anos cadastradas; gestantes acima de 20 anos cadastradas; consumo de álcool de pessoas acima de 15 anos; e consumo de agrotóxicos.

TABELA 1 – VARIÁVEIS DEPENDENTES UTILIZADAS PARA REGRESSÃO ESPACIAL SEGUNDO SUA REPRESENTAÇÃO, ANO/PERÍODO DE REFERÊNCIA E BANCO DE DADOS DE ACESSO, ESTADO DO PARANÁ, BRASIL, 2008 – 2015.

Variável Representação Ano/período Banco

Consumo abusivo 15 anos ou +

cadastrados atenção primária Quantidade em números (n) 2008-2014 SINASC Gestantes cadastradas na atenção

primária 20 ou +/10 a 19 anos Quantidade em números (n) 2008-2014 SINASC 2008-2014 SINASC Pop. total estimada Somatória masculino (+)

feminino

2015 IBGE

Grau de urbanização Pop. Rural (-) pop urbana 2010 IBGE

Densidade demográfica Hab. por km2 2015 IBGE

IPDHM Renda, emprego e

Pop. urbana feminina Quantidade em números 2010 IBGE

Pop. rural feminina Quantidade em números 2010 IBGE

Saldo emprego formal feminino Admitidos (-) desligado=saldo 2015 CAGED Saldo emprego formal masculino Admitidos (-) desligado=saldo 2015 CAGED Saldo emprego formal total Admitidos (-) desligado=saldo 2015 CAGED Consumo agrotóxico Percentual (%) 2013/2014/2015 ADAPAR Taxa de atividade acima de 10 anos Percentual (%) 2010 IBGE População feminina em idade fértil

10 a 49 anos

Quantidade em números (n) 2012-2015 IBGE Pop. Fem. sem estudo Quantidade em números (n) 2010 IBGE Pop. Fem. com menos de 8 anos de

estudo

Quantidade em números (n) 2010 IBGE Pop. Fem. com mais de 8 anos de

estudo Quantidade em números (n) 2010 IBGE

Pop. Fem. anos de estudo indeterminado

Quantidade em números (n) 2010 IBGE Média cobertura ESF 1º QD Percentual (%) 2008-2011 SIAB

Média cobertura ESF 2º QD Percentual (%) 2012-2015 SI

AB FONTE: SINASC, IBGE, CAGED, ADAPAR, SIAB E IPARDES. Organizado pela autora. Curitiba, 2018

3.6.2 Regressão ponderada geograficamente

107

Para a regressão dos preditores, ou seja, das variáveis dependentes, os resíduos do modelo OLS global16 foram analisados para autocorrelação espacial usando o Índice de Moran, com o objetivo de avaliar a extensão do resultado que poderia ser explicado pelo componente espacial, após a modelagem para preditores. Percebeu-se que o aumento não foi significativo quando comparados os modelos OLS e spatial lag17.

Assim, optou-se por manter a regressão clássica suavizada utilizando-se a GWR (Regressão Geográfica Ponderada / Geographically Weighted Regression), e pelo método dos mínimos quadrados ordinários OLS, objetivando identificar possíveis associações locais e consequentemente demonstrar o efeito espacial do modelo multivariado. Assim, os coeficientes de cada preditor que foram significativos no modelo geral, foram plotados para determinar o impacto do espaço no resultado. (OLIVEIRA; PEREIRA; SAN-MIGUEL-AYANZ, 2014; FONTES et al., 2018).

O modelo OLS apresenta coeficientes de regressão em relação ao espaço geográfico (correlação) e o GWR tem seus coeficientes estimados localmente a partir da variabilidade espacial dos resultados em cada área, o que permite a análise da não correlação espacial, ou seja, se as relações entre as variáveis de regressão variam em relação ao espaço geográfico. (OLIVEIRA; PEREIRA; SAN-MIGUEL-AYANZ, 2014;

FONTES et al., 2018).

Neste contexto, verifica-se que o GWR proporciona um conjunto de modelos de regressão linear local ao invés de um modelo global com estimativas para cada amostra no espaço. O desempenho do modelo GWR foi avaliado evidenciando indicadores R2 aj18, como observado no Figura 9, e de AIC19 e de Moran ajustados, para melhoria da análise dos dados, assim como dos resíduos de ambos os modelos. (NDIATH et al., 2015;

FONTES et al., 2018).

_______________

16 Modelo de Regressão Linear Tradicional (modelo global), com a seguinte fórmula: ݕ ൌ ߚܺ ൅ ߝ.

(FRANCISCO, 2010).

17 Neste modelo autocorrelação espacial ignorada é atribuída à variável dependente Y. Considera-se a dependência espacial através da adição, ao modelo de regressão, de um novo termo na forma de uma relação espacial para a variável dependente. (LOPES; BRONDINO; SILVA, 2006).

18 Coeficiente de determinação ajustado. (LOPES; BRONDINO; SILVA, 2006).

19 Critério de Informação de AKAIKE. (LOPES; BRONDINO; SILVA, 2006).

108

FIGURA 9– REGRESSÃO ESPACIAL SUAVIZADA DO R2 aj, PARANÁ 2012 A 2015.

FONTE: BRASIL/DATASUS; SIM; SINASC. Adaptado pela autora. Curitiba, 2018.

A autocorrelação espacial e o modelo OLS foram processados usando o software V.1.10.0.8 GeoDa (Spatial Análise Laboratory, University of Illinois at Urbana-Champaign, Urbana, Illinois, EUA). O modelo GWR foi implementado por GWR V .4.0. (ANSELIN; SYABRI; KHO, 2006; OLIVEIRA; PEREIRA; SAN-MIGUEL-AYANZ, 2014; FONTES et al, 2018). Os mapas coropléticos foram gerados usando o software QGIS V.2.14.

3.6 ASPECTOS ÉTICOS

Esta dissertação compõe uma pesquisa temática intitulada “Mortalidade Infantil:

perfil epidemiológico como subsídio para gestão e assistência neonatal e pediátrica no estado do Paraná”. Esta foi aprovada pelo Comitê de Ética em Pesquisa, do Setor de Ciências da Saúde, da Universidade Federal do Paraná sob o parecer n° 362.767, CAAE 10201413.5.0000.0102, em 14 de agosto de 2013; bem como, obteve parecer favorável da 2a Regional de Saúde, e do Comitê de Ética da Secretaria Estadual de Saúde do Paraná (Anexos 6 e 7).

A pesquisa atendeu às recomendações éticas da Resolução do Conselho Nacional n° 466, de 2012. (BRASIL, 2012). Como se trata de um estudo com dados secundários, foi dispensado o uso do Termo de Consentimento Livre e Esclarecido, entretanto, respeitado o sigilo para resguardar a identidade e informações confidenciais registradas no SINASC. Assim, evitar situações de constrangimento político-administrativo loco-regional.

109

4. RESULTADOS

No documento Análise Temporal Linear 2008 a 2015 (páginas 97-107)