• Nenhum resultado encontrado

UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA"

Copied!
38
0
0

Texto

(1)

INSTITUTO DE MATEMÁTICA

DEPARTAMENTO DE ESTATÍSTICA

SAMILA OLIVEIRA LIMA SENA

DISTRIBUIÇÃO ESPACIAL DOS PACIENTES DE

ANEMIA APLÁSTICA ATENDIDOS PELO

HEMOBA ENTRE 2002 E 2012

Salvador 2014

(2)

SAMILA OLIVEIRA LIMA SENA

DISTRIBUIÇÃO ESPACIAL DOS PACIENTES DE

ANEMIA APLÁSTICA ATENDIDOS PELO

HEMOBA ENTRE 2002 E 2012

Trabalho monográco apresentado ao Curso de Ba-charelado em Estatística, Departamento de Estatís-tica, Instituto de MatemáEstatís-tica, Universidade Federal da Bahia, como requisito para aprovação na disci-plina de Trabalho de Conclusão de Curso II para obtenção do grau de Bacharel em Estatística. Orientador(a): Prof(a). Dr(a). Denise Nunes Vi-ola

Salvador 2014

(3)

Dedico esse trabalho aos meus pais e irmãs, pelo amor e grande incentivo dados.

(4)

AGRADECIMENTOS

A Deus, por estar sempre presente na minha vida, iluminando os meus caminhos, mostrando a cada dia Sua delidade e amor.

Aos meus pais, José e Maria Dilma, por sempre acreditarem em mim. Às minhas irmãs, Samanta e Sara, pelo apoio e compreensão.

À minha orientadora, Denise Nunes Viola, pelo ensinamento, dedicação e comprome-timento.

Aos meus professores, em especial a Verônica Maria Cadena Lima, pela ajuda ofere-cida.

Aos colegas, pela companhia e momentos descontraídos.

(5)

Aquele que leva a preciosa semente, andando e chorando, voltará, sem dúvida, com alegria, trazendo consigo os seus molhos. Salmos 126:6

(6)

RESUMO

A Anemia Aplástica (AA) é uma doença rara e, quando não tratada, torna-se fatal, que acomete a medula óssea e o sangue do paciente e é caracterizada pela redução na produção dos constituintes sanguíneos. Geralmente, sua origem tem causa desconhecida, mas pode ser hereditária (como a anemia de Faconi) ou pode ser adquirida ao longo do tempo de vida do indivíduo. Torna-se necessário conhecer a distribuição espacial dos portadores de AA nos municípios da Bahia e, assim, contribuir para tomadas de decisões dos órgãos de saúde do Estado no que diz respeito, por exemplo, às instalações de postos de atendimentos especializados nos interiores baianos para o tratamento desta patologia, uma vez que o Estado possui apenas uma unidade de referência para o tratamento da doença. Este trabalho tem como objetivo vericar se existe diferença entre os métodos mais utilizados para identicar a existência de padrão espacial para os casos de AA nos municípios baianos para eventos raros. Neste estudo, a variável resposta diz respeito a uma taxa dada pela razão entre o número de casos de AA e a população de cada município. A taxa de AA foi calculada considerando à naturalidade do paciente e sua procedência. Para detectar a presença de padrão espacial foi utilizado o teste de aleatorização de Mantel, que mostrou existência de padrão espacial tendo como resposta o município de procedência dos pacientes. Porém, o teste de aleatorização com base no Índice de Moran não detectou padrão espacial para essa mesma resposta. Uma vez detectado o padrão espacial para a taxa de procedência por município, o passo seguinte foi a utilização do método de interpolação de Krigagem. O teste de aleatorização de Mantel, considerando o coeciente de correlação de Spearman, apresentou bons resultados para identicar a existência de padrão espacial, e a construção do semivariograma foi importante para denir os parâmetros para a construção do mapa.

Palavras-chave: Anemia Aplástica; Estatística Espacial; Teste de Aleatorização; Índice de Moran; Semivariograma; Krigagem.

(7)

ABSTRACT

Aplastic Anemia (AA) is a rare disease, if untreated, fatal, aecting the bone marrow and blood of patients and is characterized by reduced production of blood constituents. Generally, the origin is unknown cause, but may be inherited (such as anemia Faconi) or may be acquired during the lifetime of the individual. It is necessary to know the spatial distribution of patients with AA in the municipalities of Bahia and thus contribute to decision making of State health agencies, in respect , for example, station installations of specialized care in interior of Bahia for the treatment of this disease once the state has only one unit for the treatment of disease. This study aims to verify whether there are dierences between the methods used to identify the existence of spatial pattern for cases of AA in municipalities in Bahia for rare events. In this study, the response variable relates to a rate given by the ratio between the number of cases of AA and the population of each municipality. Rate of AA was calculated considering the naturalness of the patient and their origin. To detect the presence of spatial pattern was used the Mantel randomization test, which showed the existence of spatial pattern to municipality of origin of patients. However, the randomization test based on Moran index does not detect the spatial pattern for that response. Once detected the spatial pattern, the next step was the use of Kriging interpolation method. Mantel randomization test, whereas the Spearman correlation coecient showed good results to identify the existence of spatial pattern, and the construction of the semivariogram was important to set the parameters for the construction of the map.

Keywords: Aplastic Anemia; Spatial Statistics; Randomization Test; Index Moran; Se-mivariogram; Kriging.

(8)

SUMÁRIO LISTA DE FIGURAS . . . 9 LISTA DE TABELAS . . . 10 1 INTRODUÇÃO . . . 11 1.1 JUSTIFICATIVA . . . 11 2 REFERENCIAL TEÓRICO . . . 13 2.1 Eventos pontuais . . . 14 2.2 Dados de áreas . . . 14 2.3 Superfícies contínuas . . . 14 3 MATERIAIS E MÉTODOS . . . 16 3.1 MATERIAIS . . . 16 3.2 MÉTODOS . . . 16 3.2.1 Estatística Espacial . . . 16 3.2.1.1 Semivariograma . . . 16 3.2.1.2 Teste de Aleatorização . . . 19 3.2.1.2.1 Teste de Mantel . . . 20

3.2.1.3 Índice I Global de Moran . . . 22

3.2.1.4 Krigagem . . . 23

4 RESULTADOS . . . 24

5 CONCLUSÕES . . . 29

Referências . . . 30

(9)

LISTA DE FIGURAS

Figura 1 - Representação de um semivariograma com seus parâmetros . . . 17 Figura 2 - Diagrama resumo para taxa de naturalidade de AA por município . . . 25 Figura 3 - Diagrama resumo para taxa de procedência de AA por município . . . . 26 Figura 4 - Gráco de envelopes simulados para as taxas de AA . . . 27 Figura 5 - Semivariogramas experimetais ajustados pelos modelos teóricos usuais . 27 Figura 6 - Modelagem da procedência de casos atendidos de AA no HEMOBA . . 28

(10)

LISTA DE TABELAS

Tabela 1 - Análise Descritiva referente a naturalidade dos pacientes. Bahia, 2002-2012. 24 Tabela 2 - Análise Descritiva referente a procedência dos pacientes. Bahia, 2002-2012. 24

(11)

1 INTRODUÇÃO

A Anemia Aplástica (AA) é uma doença rara e, quando não tratada, torna-se fatal, que acomete a medula óssea e o sangue do paciente, e é caracterizada pela redução na produção dos constituintes sanguíneos. Geralmente, sua origem tem causa desconhecida, mas pode ser hereditária (como a anemia de Faconi) ou adquirida ao longo do tempo de vida do indivíduo (HEMORIO, 2004). De acordo com a portaria n0 490 do Ministério da

Saúde, de 23 de setembro de 2010, o uso de medicamentos, infecções ativas, neoplasias hematológicas, invasão medular por neoplasias não hematológicas, e exposição à radiação e à agentes químicos encontram-se entre as principais causas adquiridas. A forma mais comum de desenvolver a doença é de origem adquirida. Estudos populacionais mostram que a doença é mais frequente no Oriente do que no Ocidente (FONSECA e PAQUINI, 2002). Estima-se que a incidência de AA adquirida seja de 2-4 pessoas por 1.000.000 ao ano, com dois picos de incidência: o primeiro para os indivíduos com idades entre 10 e 25 anos e o segundo com idade superior a 60 anos, não existindo predominância entre os sexos (BRASIL, 2010).

O diagnóstico da AA se dá através do Mielograma (punção óssea) e da Biopsia de Medula Óssea (BMO). É feito, então, um tratamento de suporte subdividido em dois grupos. O primeiro para pacientes com idade inferior a 40 anos, onde é realizado um transplante de um doador aparentado (100%) compatível. No Brasil, entre 60% e 70% dos quadros têm resposta favorável, conseguindo-se reverter a doença com o transplante. O segundo grupo é para pacientes a partir de 40 anos cujo tratamento se dá com a terapia imunosupressora (tratamento que abranda a resposta imunológica natural do organismo), tendo entre 60% e 80% de resposta favorável (SALVINO, 2011).

Este trabalho tem como objetivo vericar se existe diferença entre os métodos mais uti-lizados para identicar a existência de padrão espacial para os casos de AA nos municípios baianos para eventos raros.

O restante deste trabalho está organizado como se segue. Na Seção 1.1 é apresentada a justicativa do trabalho, enquanto que a Seção 2 traz um referencial teórico sobre os assuntos abordados nesse estudo. Na Seção 3 estão apresentadas a descrição dos dados e os métodos para análise estatística que serão utilizados, enquanto que a Seção 4 mostra os resultados encontrados. Finalmente, a Seção 5 apresenta o conclusão desta monograa. 1.1 JUSTIFICATIVA

A Fundação de Hematologia e Hemoterapia da Bahia (HEMOBA) é uma fundação pública, criada pela Lei Estadual 5.183 de 1989, está vinculada à Secretaria da Saúde-SESAB, e é responsável pela aplicação da Política Nacional do Sangue no Estado da

(12)

Bahia. A Fundação HEMOBA é composta por uma rede de 24 Unidades Hemoterápicas de coleta e processamento de sangue, entre Hemocentros e Bancos de Sangue públicos em todas as regiões do Estado. A Fundação HEMOBA é o centro de referência para atendimento especializado em doenças hematológicas benignas (Anemia Aplástica, por exemplo), disponibilizando tratamento médico, odontológico, sioterápico e acompanha-mento psicológico (BRASIL, 2013).

Por ser considerada referência para tratamento da AA na Bahia, a fundação HEMOBA atende uma quantidade signicativa de pacientes oriundos dos municípios do interior do Estado. A distância entre a moradia dos pacientes que residem nos interiores e o centro de tratamento torna-se, muitas vezes, um obstáculo para o tratamento da doença, visto que muitos desses pacientes não têm recursos nanceiros de transporte e moradia para realização de tratamento na capital. Diante disso, torna-se necessário conhecer a distribuição espacial dos portadores da AA nos municípios da Bahia e, assim, contribuir para tomadas de decisões dos órgãos de saúde do Estado no que diz respeito, por exemplo, à instalações de postos de atendimentos especializados nos interirores baianos para o tratamento desta patologia.

Uma outra proposta desse trabalho, é apresentar um estudo inédito sobre a distribuição espacial da Anemia Aplástica nos municípios baianos, uma vez que estes dados fazem parte do estudo "Avaliação da sobrecarga de ferro em pacientes portadores de Anemia Aplástica na Bahia"e é parte integrante da tese de doutorado de Marco Aurélio Salvino de Araújo, médico responsável pela Coordenadoria do Programa de Transplante de Medula Óssea do Estado da Bahia.

(13)

2 REFERENCIAL TEÓRICO

Ao longo dos anos, a estatística espacial vem sendo amplamente utilizada em diversas áreas do conhecimento. Existem vários trabalhos na literatura que utilizam análise espa-cial. Por exemplo, na área agrícola para detecção de padrões espaciais na dispersão do tripes do pranteamento da cebola ou para analisar a produtividade agrícola para conhecer regiões que necessitam de seguro agrícola (VIOLA, 2007; OZAKI, 2008); nas áreas sociais, como por exemplo, para estudos sobre criminalidade, violência doméstica e familiar con-tra a mulher, acidentes de trânsito, análise espacial da mortalidade infantil (BATELLA e DINIZ, 2010; SANTOS, 2011; MATSUMOTO e FLORES, 2012; SCALON, 2012) e na economia, pode-se aplicar a estatística espacial para analisar indicadores econômicos, cres-cimento economicos dos municípios (GOMES e ANDRADE, 2011; SILVA e OLIVEIRA, 2011).

Segundo o Ministério da Saúde, a estatística espacial é o ramo da estatística que per-mite analisar a localização espacial de eventos. Além de identicar, localizar e visualizar a ocorrência de fenômenos que se materializam no espaço, utilizando-se a estatística es-pacial é possível modelar a ocorrência destes fenômenos, incorporando, por exemplo, os fatores determinantes, a estrutura de distribuição espacial ou a identicação de padrões (BRASIL, 2007).

Segundo o Ministério da Saúde, Brasil, 2007:

As principais áreas de aplicação da estatística espacial são o mapeamento de doenças, os estudos ecológicos, a identicação de aglomerados espaciais (cluster) e o monitoramento de problemas ambientais. O mapeamento de doenças consiste na descrição do processo de distribuição espacial, visando a avaliar a variação geográca na sua ocorrência para identicar diferenciais de risco, orientar a alocação de recursos e levantar hipóteses etiológicas. Os estudos ecológicos visam a estudar a relação entre incidência de doenças e potenciais fatores etio-lógicos, que expliquem as diferenças na incidência de determinado evento de saúde.

O estudo do médico inglês John Snow sobre o surto de coléra que ocorreu em Londres (1854) é um dos primeiros registros da distribuição geográca de doenças. Neste estudo, o médico utilizou raciocínios qualicados, grácos e mapas, demostrando o impacto da água contaminada na ocorrência da doença (FRERICHS, 2009).

Muitas vezes, em estudos epidemiológicos, o interesse principal é vericar se a taxa de ocorrência de determinado evento é espacialmente correlacionada em uma determinada área (CAMPOS, 2013).

Na literatura, existem estudos com análise espacial de taxas. Por exemplo, Silva e Tachibana (2011) realizaram um estudo com objetivo de compreender a mortalidade de

(14)

pacientes com cânceres de traqueia, brônquios, pulmão e estômago nas microrregiões do Estado de São Paulo, nos anos de 2005 e 2010. Os resultados mostraram que a taxa de mortalidade por câncer de traqueia, brônquios, pulmão e estômago sofreram redução neste período. Foi detectada autocorrelação espacial para a taxa de mortalidade por câncer de pulmão no ano de 2010. Foi observado que, para os cânceres de pulmão e estômago, as taxas de mortalidade se concentraram no centro e no norte do Estado de São Paulo.

A ideia central da análise de dados espaciais é mensurar propriedades e sua relação com seus vizinhos, levando em conta a localização espacial do fenômeno em estudo de forma explícita (CÂMARA et al., 2002, citado por CAMPOS, 2013).

Segundo Caumo (2006), na análise espacial, três tipos de dados georeferenciados são frequentemente considerados: eventos pontuais, dados de área e superfícies contínuas. A diferença entre esses três tipos de dados está relacionada a sua natureza estocástica. Dessa forma, diferentes metodologias estatísticas são aplicadas para análise de cada um deles. Os três tipos de dados referenciados podem ser denidos como se segue.

2.1 Eventos pontuais

São dados que identicam eventos ou ocorrências como pontos localizados no espaço. Podem ser citados como exemplos de processos pontuais, dados relacionados à criminali-dade ou mortalicriminali-dade causada por determinada doença. Segundo Fook (2005), um padrão espacial de pontos é um conjunto de dados espaciais, compostos por coordenadas dos eventos e sua referência espacial. O objeto de interesse na análise deste tipo de dados é a própria localização espacial dos eventos em estudo.

2.2 Dados de áreas

As áreas são sub-divisões do mapa, delimitadas por polígonos, como por exemplo, dires, bairros, municípios e estados. São dados relacionados a levantamentos populacionais como censos e estatísticas de saúde. Nesse tipo de dados, não existe a localização exata do evento, mas um valor por área. Este tipo de estudo é muito comum na área da saúde por não identicar o paciente e sim seu bairro, município, estado.

2.3 Superfícies contínuas

O tipo de dado estudado, nesse caso são pontos no espaço contínuo, em que é modelada uma superfície. As superfícies contínuas podem ser estimadas a partir de um conjunto de amostras de campo, que podem estar regularmente ou irregularmente distribuídas. As amostras são valores representativos do fenômeno estudado e podem representar variá-veis naturais (teor de argila no solo) e socio-econômicas (taxa de homicídios), além de outras situações (DRUCK et al., 2004, citado por FOOK, 2005). Neste tipo de dado, o

(15)

pesquisador coleta alguns pontos na área de interesse e modela a superfície de uma área especíca.

Existem muitos estudos na literatura que utlizam a análise espacial na área da saúde. A maioria deles, utiliza o semivariograma para detectar dependência espacial nos dados, por exemplo, Campos et al (2002), estimaram áreas de risco para a ocorrência de carga parasitária produzida pelo Ascaris lumbricoides. Lourenço & Landim (2005) utilizaram o semivariograma, dentre outros métodos geoestatísticos, para identicar a existência de padrão espacial e posteriormente fazer o mapeamento das áreas de risco à saúde pública. Opromolla et al (2006), analisaram o padrão espacial da ocorrência dos casos de hanseníase para identicar áreas com probabilidade de riscos de transmissão da doença. Rodrigues Jr. et al. (2006) avaliaram o padrão espacial de incidência de tuberculose na epidemia de Aids, com objetivo de vericar a inuência do espaço físico na causalidade.

Uma outra forma de detectar existência de padrão espacial é através dos testes de aleatorização, aleatorizando os dados observados. Em um estudo feito por Viola (2007), foi utilizado o teste de aleatorização de Mantel para estudar, a partir dos pontos observados, se a dispersão de insetos seguia um padrão aleatório. Os resultados mostraram que, em alguns dias, foram detectados padrão espacial para o número de T hrips tabaci por folha na plantação de cebola.

Segundo Paiva (2007), a dependência espacial é uma característica inerente à represen-tação de dados através de subdivisões territoriais. Quando existe evidência de existência de padrão espacial, os vizinhos mais próximos assemelham-se ao ponto estudado, ou seja, espera-se que quanto mais próxima a observação, mais semelhante será ao ponto estudado. Quando o pesquisador faz uma análise para dados de área, a dependência espacial pode ser analisada por meio do Índice I de Moran. Marconato et al (2012), realizaram um estudo para análise de autocorrelação espacial sobre uso de tecnologias por parte de estabelecimentos agropecuários do Brasil, utilizando os índices I global e local de Moran. Uma vez detectado o padrão espacial, pode-se haver interesse em modelar a superfície da região estudada por meio do método de interpolação de krigagem. Jackob (2002) utilizou a krigagem para analisar as principais causas de morte da população, e a condição sanitária dos domicílios dos municípios da Região Metropolitana da Baixada Santista (RMBS), para os anos de 1980, 1991, 1999 e 2000.

(16)

3 MATERIAIS E MÉTODOS

3.1 MATERIAIS

Os dados estudados dizem respeito a pacientes portadores de Anemia Aplástica aten-didos na Fundação de Hematologia e Hemoterapia da Bahia (HEMOBA), que é referência para o tratamento desta doença. Os dados foram coletados dos prontuários dos pacientes de 62 municípios do Estado da Bahia por um período de 10 anos (2002-2012). Neste tra-balho, a variável resposta é referente a uma taxa dada pela razão entre o número de casos de AA e a população do municípios de naturalidade e procedência dos pacientes. O proto-colo do estudo foi submetido e aprovado pelo Comitê de Ética Avaliação da sobrecarga de ferro em pacientes portadores de Anemia Aplástica na Bahia, obtendo parecer favorável (Protocolo CEP/HUPES n. 67/2011). Estes dados fazem parte da tese de doutorado de Marco Aurélio Salvino Araújo, que é coordenador geral do Programa de transplante de medula óssea so Estado.

3.2 MÉTODOS

3.2.1 Estatística Espacial

Segundo Diggle e Ribeiro Jr. (2007), o termo estatística espacial é usado para des-crever uma ampla série de modelos estatísticos e métodos para análise de dados espaciais referenciados. A estatística espacial tem como objetivo estudar fenômenos ao longo do espaço e pode ser aplicada em diversas áreas do conhecimento, dentre elas, destacam-se a Epidemiologia, Agronomia, Demograa, Geologia e Saúde. Uma maneira para identicar a existência de padrão espacial é utilizando o semivariograma com envelope simulado ou testes de aleatorização de Mantel e de Moran. Uma outra forma também de identicar tal padrão é por meio do gráco de cores, nesse gráco, os dados são identicados por quatro cores distintas (azul, verde, amarela e vermelha), ou seja, a cor azul representa os valores abaixo do 10 quartil, a cor verde representa os valores entre o 10 quartil e a

mediana (quartil 2), a cor amarela representa os valores entre a mediana e o 30 quartil e,

nalmente, a cor vermelha representa os valores acima do 30 quartil.

3.2.1.1 Semivariograma

Um dos método utilizados para vericar a existência de padrão espacial, quando a variável resposta é contínua, se dá pela construção do semivariograma. O semivariograma é um gráco usado para mostrar se existe, ou não, correlação espacial entre os dados e está relacionado com a covariância. É um gráco que mostra a relação entre diferenças

(17)

dos pares amostrais versus a distância entre pontos amostrados, ou seja, é o gráco dos valores observados versus o tempo ou sua localização (VIOLA, 2007).

Na existência de padrão espacial, esse gráco é crescente, pois a variabilidade aumenta à medida que cresce a distância entre os dados. O semivariograma mede também o grau de dependência entre os valores que tenham, aproximadamente, a mesma amplitude de intervalo de tempo e/ou de espaço ou que tenham suas distâncias classicadas. Espera-se que, quando existe dependência espacial, os valores mais próximos sejam mais similares do que os valores mais afastados (VIOLA, 2007).

A função de semivariância γ(h) é denida por:

γ(h) = (1/2)V ar[Y (x + h) − Y (x)]2 (3.1)

em que Y (x) e Y (x+h) são as medidas nas posições x e x+h, respectivamente e, se Y (x) é estacionário, então,

γ(h) = (1/2)E[Y (x + h) − Y (x)]2 (3.2)

Segundo Viola (2007), uma função aleatória é estacionária de primeira ordem, se a média for constante em todos os locais da região e estacionária de segunda ordem, se a covariância entre dois pontos depender apenas da distância h entre esses pontos.

Um semivariograma típico tem os seguintes parâmetros:alcance (φ), que é a distância onde os dados deixam de apresentar dependência espacial; patamar (σ2 + τ2), que é o

ponto da origem até o alcance; efeito pepita (τ2), que é o valor de γ(h) quando h assume

o valor zero. A Figura 1 mostra uma representação do semivariograma.

(18)

Existem três tipos de semivariogramas, o experimental, o verdadeiro e o teórico. O semivariograma experimental é o primeiro gráco que deve ser feito e é obtido a partir do conjunto de dados sobre as coordenadas geográcas. O semivariograma verdadeiro é desconhecido e representa a situação real. A análise estrutural é utilizada para vericar o semivariograma teórico que melhor se ajusta ao semivariograma experimental e então, com base no teórico, fazer inferências sobre o verdadeiro semivariograma (VIOLA, 2007). O semivariograma experimental é obtido através do conjunto de dados do experimento vindos de um processo de amostragem sobre as coordenadas geográcas e é obtido por:

γ∗(h) = 1 2N (h)

X

Yi+h,Yi∈N (h)

E[Y (x + h) − Y (x)]2 , (3.3)

em que Y (x) e Y (x + h) são as medidas nas posições x e x + h e N(h) é o número de pares de pontos separados pela distância h.

Existem alguns pressupostos para utilização do semivariograma. São elas:

i) As diferenças entre pares de valores de amostras são determinadas apenas pela orientação espacial relativa dessas amostras;

ii) A média e a variância das diferenças é visto como interesse principal, ou seja, esses dois parâmetros dependem unicamente da orientação (a chamada hipótese intrínseca);

iii) É assumido que os valores da área de interesse não apresentam tendência que possa afetar os resultados.

Em estudos geoestatísticos, é levado em consideração a direção em que as distâncias são medidas, o que vai caracterizar um fenômeno como anisotrópico ou isotrópico (VIOLA, 2007).

A isotropia ocorre quando não existe efeito direcional. A anisotropia ocorre quando o variograma experimental é calculado para distintas direções, apresentando compor-tamentos distintos. A anisotropia pode ser classicada como zonal ou geométrica. A anisotropia zonal ocorre quando os variogramas construídos com distintas direções apre-sentam diferentes patamares para o mesmo alcance. A anisotropia geométrica ocorre quando variogramas com distintas direções apresentam patamares constantes e alcances diferentes.

Modelos de semivariograma

Dentre os vários modelos de semivariograma existentes, neste trabalho serão apresen-tados quatro: o esférico, o exponencial, o Gaussiano e o modelo geral, denominado de Família Matérn.

Segundo Viola (2007) o modelo esférico, conhecido também como modelo de Matheron, apresenta um crescimento rápido na origem e alcança um patamar a uma distância h nita. O modelo é dado por:

(19)

( τ2 + σ2(3h 2φ− h3 2φ3) ,se 0 < h < φ τ2 + σ ,se h > φ

O modelo exponencial ou Formey apresenta um comportamento linear na origem e o patamar é alcançado apenas assintoticamente e é dado por:

(

τ2 + σ2(1 −exp(−h/φ)) , se h > 0

0,se h = 0

O modelo Gaussiano, conhecido também por parabólico, apresenta um comportamento parabólico na origem. Esse modelo é dado por:

τ2 + σ2(1 −exp(−3h3/φ)),se h ≥ 0

Uma nova estrutura de função de correlação, chamada de Família Matérn, foi proposta por Diggle e Ribeiro Jr. (2000) e pode ser expressa por:

(h/φ)kkk(h/φ)

2k−1γ(h)

em que, kk(.)denota a função de Bessel modicada de ordem k; φ > 0 determina a taxa

em que, aumentando o valor de h, a correlação tende a zero; k > 0 é a ordem do modelo Matérn e determina a suavidade analítica do sinal S(x).

Segundo Viola (2007), a estimação dos parâmetros desse modelo pode ser feita utili-zando o método da máxima verossimilhança, máxima verossimilhança restrita entre ou-tros. O modelo Matérn apresenta alguns casos especiais tais como: o modelo esponencial é o Matérn com k = 1/2; o modelo esférico é o modelo Matérn com k = 1 e o modelo Gaussiano é o modelo Matérn com k → ∞

Uma outra forma de verifcar a existência de padrão espacial é através do gráco de envelope simulado construído a partir do semivariograma experimental. Nesse, gráco, a existência de algum ponto fora das linhas de conança indica a existência de padrão espacial nos dados.

Porém, para utilizar o semivariograma é necessário alguns requisitos, dentre eles, que a resposta seja contínua, mas, em muitas situações, a variável medida no espaço é contagem ou binária. Uma alternativa é vericar a existência de padrão espacial através do teste de aleatorização utilizando a matriz de Mantel (VIOLA, 2007).

3.2.1.2 Teste de Aleatorização

A existência de padrão espacial pode ser testada através da aleatorização da localização dos dados observados. Os testes de aleatorização têm como hipótese de nulidade o fato de que todas as possíveis ordens para os dados têm a mesma chance de ocorrer (MANLY, 2006, citado por VIOLA, 2007).

(20)

Segundo Viola (2007), os testes de aleatorização podem ser executados da seguinte forma: Calcula-se o valor e0 de uma estatística E, para um conjunto de observações.

Em seguida, faz-se a aleatorização dos dados um grande número de vezes que, no caso de dados espaciais, são dadas pela reordenação aleatória da localização dos dados observados, obtendo em cada aleatorização os valores eaque irão gerar uma aproximação por simulação

amostral de E. A partir desses resultados pode-se calcular o p-valor, que é dado pela proporção dos valores ea que são maiores ou iguais a e0. A hipótese de nulidade será

rejeitada se o p-valor for menor que o nível de signicância adotado.

Os testes de aleatorização têm como vantagens serem relativamente fáceis de calcular, aplicáveis a pequenas amostras e/ou amostras não-aleatórias, têm como base estatísticas não padronizadas e não necessitam de informações prévias a respeito da população da qual foi retirada a amostra (MANLY, 2006). A principal desvantagem desses testes é que nem sempre torna-se possível realizar inferência a partir das conclusões obtidas, pois sua construção se restringe a cada conjunto de dados e tipo de problema (VIOLA, 2007). 3.2.1.2.1 Teste de Mantel

Para vericar a existência de padrão espacial aleatório na distribuição dos dados, foi utilizado um teste proposto por Mantel (1967), esse teste permite estudar, a partir da conguração dos pontos se a dispersão dos dados segue um padrão aleatório (VIOLA, 2007). Segundo a mesma autora, este teste pode ser implementado da seguinte maneira: A partir da variável observada com n localizações, são obtidas duas matrizes A e B com dimensões n × n, simétricas, cujos elementos representam as distâncias entre as observações e a distância entre as respostas observadas, repectivamente. Essas matrizes podem ser expressas como A e B:

A =       0 a21 · · · an1 a21 0 · · · an2 ... ... ... ... an1 an2 · · · 0       e B =       0 b21 · · · bn1 b21 0 · · · bn2 ... ... ... ... bn1 bn2 · · · 0      

(21)

(x1j, x2j), cujos elementos são aij =p(x1i− x1j)2+ (x2i− x2j)2. Os elementos da matriz

B são dados por bij =p(zi− zj)2, em que Z é a variável observada em cada ponto.

A seguir, calcula-se a estatística de teste, que é dada pelo coeciente de correlação de Pearson ou Spearman, entre os elementos correspondentes das matrizes A e B. Os coecientes de correlação de Pearson e Spearman são dados, respectivamente, por:

r = m P i<jaijbij − P i<jbij s  mP i<ja2ij −  P i<jaij 2  mP i<jb2ij −  P i<jb2ij 2 (3.4) e rs = 1 − 6Pn i=1d2i n3− n , (3.5)

em que n é o número de pares (x1i, x2i)e di é a diferença entre os números de ordem das

observações xi e yi, isto é, di = n0 ordem de x1i− n0 ordem de x2i. Se for calculado para

os valores observados, produz o valor r0, que é o valor da estatística inicial. Correlação

positiva indica a existência de padrão espacial, ou seja, quando aumenta a distância da localização, aumenta a distância da resposta.

O passo seguinte é a permutação de linhas e colunas de uma das matrizes aleatoriamente, um número N sucientemente grande, e assim, são obtidos os valores rak, k = 1, 2, ..., N.

Finalmente, compara-se a proporção p de valores rak maiores ou iguais a r0 com um valor

do nível de signicância pré-xado, α. A hipótese nula será rejeitada se p < α, em que H0 assume a não existência de padrão espacial.

Segundo Viola (2007), quando a hipótese de nulidade do teste de Mantel é rejeita, pode-se haver interesse em se detectar qual tipo de associação existente entre as variáveis, podendo ser mostrado pelo gráco de bij versus aij. Essa associação pode ser mostrada

por meio de um modelo de regressão linear simples, em que os elementos da matriz A entram como covariável e os elementos da matriz B como variável resposta, ou seja,

bij = β0+ β1aij + ij

em que β0 e β1 são parâmetros que precisam ser estimados e ij é o erro associado à

variável resposta.

Por meio da modelagem geoestatística é possível caracterizar o padrão de dependência existente e realizar predição de quantidades de interesse no problema estudado (VIOLA, 2009).

Quando o pesquisador está interessado em analisar dados de área, ele pode utilizar o Índice I de Moran.

(22)

3.2.1.3 Índice I Global de Moran

Segundo Druck et al (2004), na análise exploratória espacial, torna-se necessário a caracterização da dependência espacial, mostrando como os valores estão correlacionados no espaço. Neste contexto, uma das funções utilizadas para estimar quanto o valor ob-servado de um atributo numa região é dependente dos valores desta mesma variável nas localizações vizinhas é a autocorrelação espacial.

O índice I de Moran fornece a medida geral da associação espacial existente nos mu-nicípios. Este índice varia entre -1 e 1, sendo que valores próximos de zero indicam a inexistência de autocorrelação positiva. Valores positivos indicam a existência de au-tocorrelação. Isso indica que o valor do atributo correspondente a uma determinada localização no espaço tende a ser semelhante ao de seus vizinhos. Quando o índice apre-senta valores negativos, isso signica que existe uma autocorrelação negativa ou inversa (MARCONATO et al, 2012).

O índice I global de Moran é a expressão da autocorrelação considerando apenas o primeiro vizinho mais próximo, expresso da forma:

I = n Pn i=1 Pn j=1zizjwij S0 Pn i=1zi2 , (3.6)

em que n é o total de municípios avaliados; zi = (xi− ¯x)e zj = (xj− ¯x) são as

informa-ções centradas na média da variável X, para os municípios i e j, respectivamente; wij é o

elemento da matriz quadrada simétrica que expressa a relação espacial entre as observa-ções e S0

Pn

i=1z 2

i é uma matriz simétrica de pesos espaciais W . A expressão P n

i=1ziwij

é chamada de variável espacialmente defasada (espatial lag) da localização (CAMPOS, 2013).

O índice I global de Moran tem como hipótese de nulidade a independência espacial, ou seja, seu valor está próximo de zero, indicando que os valores dos municípios variam aleatoriamente no espaço, sem padrão espacial.

Depois de calculado o índice I de Moran, é importante estabelecer sua validade esta-tística. Ou seja, é necessário medir se os valores aferidos possuem uma correlação espacial signicativa. Para tanto, é preciso associar ao índice uma distribuição estatística, sendo comum relacionar a estatística do teste à distribuição normal (MARCONATO et al, 2012) ou por meio de testes de aleatorização.

(23)

3.2.1.4 Krigagem

Segundo Andriotti (2005), a qualidade de uma estimativa não consiste apenas associar um valor a um ponto ou a um bloco, mas também associar a essa avaliação uma idéia da qualidade da estimativa, dimensionando o erro existente. Por meio da krigagem, a Geoestatística fornece uma estimativa do ponto ou bloco e, juntamente com ela, uma medida de acuracidade dessa estimativa.

O termo "krigagem"foi usado por Matheron, em 1965, em homenagem ao Engenheiro de Minas Sul-Africano Daniel G. Krige, que primeiro formulou e implementou essa forma de interpolação, em 1951. A Krigagem pode ser usada em variáveis discretas ou contínuas e é, por isso, sensível para a estimação de variáveis binárias na presença ou ausência da característica estudada (ROSSI et al, 1994, citado por ZIMBACK, 2003).

A krigagem usa informações a partir do variograma para encontrar os pesos ótimos a serem associados às amostras com valores conhecidos que irão estimar pontos desco-nhecidos, ou seja, fazer inferência para pontos não amostrados. É entendida como uma série de técnicas de análise de regressão que procura minimizar a variância estimada a partir de um modelo prévio, que leva em conta a dependência estocástica entre os dados distribuídos no espaço (LANDIM, 2002).

Segundo Jackob (2002), a krigagem é considerada uma boa metodologia de inter-polação de dados, pois utiliza o dado tabular e sua posição geográca para calcular as interpolações. A krigagem utiliza funções matemáticas para acrescentar pesos maiores nas posições mais próximas aos pontos amostrais e pesos menores nas posições mais dis-tantes, e criar assim os novos pontos interpolados com base nessas combinações lineares de dados, esses pesos são inversamente proporcionais a distância entre os dados.

Segundo Andriotti (2005), o estimador de krigagem é considerado o melhor estimador linear não enviesado (BLUE- best linear unbiased estimator). É dito ser linear por ser formado por uma combinação linear dos dados, ou seja:

Zk∗ =

n

X

i=1

λiz(xi)

em que λi são os ponderadores, z(xi)são os dados experimentais, n o número total desses

dados e Z∗

k o estimador de krigagem. O estimador é também não-enviesado (”unbiased”):

Condição de Universalidade: Pn

i=1λi = 1 ou E(Z − Z ∗

k) = 0, ou seja, a krigagem é

um estimador exato. O estimador é também ”best”, o melhor no sentido de fornecer a variância de estimação mínima, denominada variância de estimação de krigagem ou sim-plesmente variância de krigagem: σ2

k= E(Z − Z ∗

(24)

4 RESULTADOS

Neste estudo, a resposta espacial diz respeito a uma taxa dada pela razão entre o número de casos de Anemia Aplástica e a população de cada município. A localização para cada resposta observada é composta pelos pares das variáveis x1i e x2i e essas são

referentes à latitude e à longitude do centro do polígono de cada município do Estado da Bahia. Foram consideradas respostas referentes à naturalidade e a procedência dos pacientes atendidos pela Fundação de Hematologia e Hemoterapia da Bahia.

Na Tabela 1, estão apresentados resultados da análise descritiva referente à natura-lidade do paciente. Pode-se observar que, na maioria (75%) dos municípios houve, no máximo, dois casos de Anemia Aplástica. O valor máximo encontrado para o número de casos da aplasia foi 74 casos. A maior taxa encontrada foi igual a 0,00015 casos por município e a menor população observada foi referente ao município de Itamari com 7.903 habitantes.

Tabela 1  Análise Descritiva referente a naturalidade dos pacientes. Bahia, 2002-2012.

Variável

Mínimo

Q1

Mediana

Média

Q3

Máximo

Resposta

3,402e-06 1,840e-05 3,942e-05 4,352e-05 6,391e-05 1,532e-04

N

0

de casos

1,000

1,000

1,000

2,633

2,000

74,000

População

7.903

19.182

30.340

111.227

78.937

2.675.656

Latitude

-16,450

-13,735

-12,697

-12,504

-11,220

-9,162

Longitude

-43,42

-40,50

-39,51

-39,94

-39,07

-38,02

A Tabela 2 mostra os resultados da análise descritiva referente à procedência dos pacientes. Nota-se que, quanto à procedência, o maior número de casos encontrados foi em Salvador, em que foram observados 83 casos. Foi encontrada uma taxa média de 0,00004091 pacientes por município, variando de 0,000004116 a 0,0001532. Uma parcela de 25% dos municípios era composta por até 19.182 habitantes.

Tabela 2  Análise Descritiva referente a procedência dos pacientes. Bahia, 2002-2012.

Variável

Mínimo

Q1

Mediana

Média

Q3

Máximo

Resposta

4,116e-06 1,690e-05 3,785e-05 4,091e-05 5,404e-05 1,532e-04

N

0

de casos

1,000

1,000

1,000

2,790

1,000

83,000

População

7.459

19.182

30.340

111.227

78.937

2.675.656

Latitude

-17,535

-13,665

-12,669

-12,666

-11,735

-9,162

Longitude

-44,990

-40,400

-39,380

-39,900

-39,020

-38,020

Para vericar existência de padrão espacial, foram comparados três métodos: semiva-riograma considerando envelope simulado, teste de aleatorização para a matriz de Mantel

(25)

e coeciente I de Moran, em que os dois primeiros são utilizados para superfície contínua no espaço e o último é utilizado para dados de área. Inicialmente foram construídos os grácos de cores, de dispersão e histograma. A Figura 2 mostra um diagrama resumo dos dados, tendo como resposta o número de pacientes natural de cada município ponderado pelo seu tamanho. Nesta, pode-se observar que, para determinados pares de coordenadas geográcas, existem uma concentração maior de uma única cor, indicando a existência de padrão espacial. Nesse gráco, a cor azul representa os valores abaixo do 10 quartil, a cor

verde representa os valores entre o 10 quartil e a mediana (quartil 2), a cor amarela

repre-senta os valores entre a mediana e o 30 quartil e, nalmente, a cor vermelha representa

os valores acima do 30 quartil. Pode-se observar também, que a distribuição dos dados

apresentam um comportamento assimétrico à direita. Nota-se ainda a presença de leve anisotropia nos dados.

Figura 2  Diagrama resumo para taxa de naturalidade de AA por município Na Figura 3, estão apresentados os grácos de cores, de dispersão e histograma para os dados tendo como resposta a taxa de procedência dos pacientes. Pode-se observar que, a distribuição dos dados muda conforme aumenta os valores dos pares das coordenadas. Foi observado também, um comportamento assimétrico à direita na distribuição dos dados e leve efeito direcional.

A Figura 4 apresenta os grácos dos semivariogramas com seus respectivos envelopes simulados tendo como variáveis respostas a taxa de naturalidade (a) e a taxa de procedên-cia (b) para cada município, respectivamente. Por meio desses grácos pode-se vericar se existe ou não indícios de padrão espacial nos dados, ou seja, se existir algum ponto

(26)

Figura 3  Diagrama resumo para taxa de procedência de AA por município fora dos limites do envelope, é um indicativo da existência de padrão espacial nos da-dos. Foi feito também o teste de aleatorização para a matriz de Mantel com coeciente de correlação de Spearman para vericar a existência de padrão espacial com 10.000 aleatori-zações. Porém, para os dados tendo como resposta a taxa de naturalidade por município, o teste apresentou um p − valor de 0,0546, indicando não existência de padrão espacial nos dados, apesar desse valor estar bem próximo do nível de signicância, o que também foi observado no limite do envelope simulado. Para vericar a signicância do índice I global de Moran, foi feito um teste de aleatorização, pois foi observada uma distribuição assimétrica nos dados. Esse teste forneceu um p − valor signicativo (0,0371), ou seja, detectou a presença de autocorrelação espacial nos dados. A diferença do resultado no índice I de Moran se deve ao fato deste considerar o mesmo peso para todos os municípios, não ponderando os municípios com menores populações, embora sua variação está entre 7.930 e 2.675.656 habitantes. Neste caso foi apenas calculado o índice I de Moran sem considerar a correção pelo método empírico de Bayes global.

Na Figura 4, pode-se observar a existência de um ponto fora dos limites do envelope simulado quando a variável resposta tem como base a taxa de procedência por municípios, indicando a existência de padrão espacial nos dados. Para essa resposta, o teste de Mantel forneceu um p − valor de 0,0001, detectando existência padrão espacial nos dados. Foi realizado também o teste de aleatorização utilizando o índice I de Moran, porém não houve indícios de existência de padrão espacial, pois o p−valor observado foi 0,1061, sem considerar a correção pelo método empírico de Bayes global.

(27)

Figura 4  Gráco de envelopes simulados para as taxas de AA

Na Figura 5 estão apresentados os semivariograma experimentais, considerando a na-turalidade (a) e procedência (b) por município, respectivamente, modelados por quatro semivariogramas teóricos: Exponencial (linha verde), Esférico (linha vermelha), Gaussi-ano (linha azul) e família Matérn (linha amarela) para vericar qual melhor se ajusta aos dados. O modelo escolhido foi o que apresentou menor soma de quadrados de resíduos ponderados. Para ambas as respostas o modelo escolhido foi o Esférico.

Figura 5  Semivariogramas experimetais ajustados pelos modelos teóricos usuais Uma vez detectada a presença de padrão espacial para a resposta segundo a procedên-cia por município, o passo seguinte foi a utilização do método de interpolação de krigagem para construção do mapa. A Figura 6 mostra a modelagem da superfície da região es-tudada. A cor vermelha representa a região com maiores taxas de Anemia Aplástica,

(28)

enquanto que o azul escuro representa as regiões com menores taxas de AA. A região com maior taxa está em torno do município de Itagi, que possui uma população de 13.051 ha-bitantes, seguida pelo município de Apuarema com população de 7.459 habitantes. Vale ressaltar que estes dois municípios estão muitos próximos, apresentando uma distância de aproximadamente 45 quilômetros.

(29)

5 CONCLUSÕES

Neste trabalho, foram apresentadas três metodologias distintas que permitiram testar a presença de padrão espacial na distribuição de pacientes portadores de Anemia Aplástica nos municípios da Bahia e vericar quais as regiões do Estado que possuem maiores taxas da doença de acordo com o tamanho da população dos municípios.

Neste estudo, foram consideradas respostas quanto à naturalidade do paciente e quanto a sua procedência ponderado pelo tamanho de cada município, para efeito de compara-ção. O semivariograma com envelope simulado detectou indícios da existência de padrão espacial para as taxas de naturalidade e de procedência por município. O teste de ale-atorização de Mantel detectou padrão espacial apenas para a taxa de procedência por município, mostrando que as taxas de municípios mais próximos tendem a ser mais pa-recidas entre si do que aquelas de municípios mais distantes. Por outro lado, o teste de aleatorização com base no índice I de Moran não detectou presença de padrão espacial para essa mesma resposta. Esse último resultado pode ser explicado pelo fato de não ter considerada a correção pelo método empírico de Bayes global.

O método de interpolação de krigagem permitiu mostrar que a região em torno do município de Itagi foi a que apresentou maiores taxas de pacientes com esta doença.

Foi observada que a taxa média da Bahia para os municípios estudados foi 0,0000024, em que 88,71% dos municípios estudados apresentaram uma taxa maior que a taxa média da Bahia.

Essa doença ainda tem causa desconhecida e apresenta diculdade de estudo por ser uma doença muito rara e pela limitação de dados disponíveis. O teste de aleatorização de Mantel, considerando o coeciente de correlação de Spearman apresentou bons resultados para identicar a existência de padrão espacial, e a construção do semivariograma foi importante para denir os parâmetros para a construção do mapa. Estudos adicionais serão feitos considerando outros métodos de análise.

(30)

Referências

ANDRIOTTI, J. L. S. Fundametos de Estatística e Geoestatística. São Leopoldo, Rio Grande do Sul, ed. Unisinos, 2005.

BATELLA, W. B.; DINIZ, A. M. A.. Análise Espacial dos Condicionantes da Criminalidade Violenta no Estado de Minas Gerais. Sociedade Natureza, Uberlândia, 151-163, 2010.

BRASIL - MINISTÉRIO DA SAÚDE. Introdução à Estatística Espacial para a Saúde Pública. 1 ed. Brasília: Ministério da Saúde, 2007.

BRASIL - MINISTÉRIO DA SAÚDE. Secretaria de Atenção à Saúde. Portaria n0

490, de 23 de setembro de 2010. Brasil, Ministério da Saúde, 2010.

BRASIL. Fundação de Hematologia e Hemoterapia da Bahia - HEMOBA. Brasil, 2013. Disponível em http://www.saude.ba.gov.br/index.php?option=com content&id=175&Itemid=20. Data de acesso: 14/08/2013.

CÂMARA, G. et al.Análise espacial de áreas.São José dos Campos - SP: INPE, 2002. CAMPOS, M. R.; VALENCIA, L. I. O. FORTES, B. P. M. D. BRAGA, R. C. C. MEDRONHO, R. A. Distribuição espacial da infecção por Ascaris lumbricoides. Revista de Saúde Pública, Rio de Janeiro, 69-74p, 2002.

CAMPOS, A. C. P. Detecção de Padrões Espaciais na Distribuição dos Pacientes Portadores de Doença Genética com Deciência Física da Associação de Assistência à Criança Deciente (AACD) de Pernambuco. Dissertação de Mestrado, Universidade Federal de Pernambuco, Recife - Pernambuco, 2013.

CAUMO, R. B. Estatística Espacial em Dados de Área: Uma Modelagem Inteiramente Bayesiana para o Mapeamento de Doenças Aplicada à Dados Relacionados com a Natalidade em Mulheres Jovens de Porto Alegre. Monograa, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2006. DIGGLE, P., RIBEIRO JR, P. J. Model-based Geoestatistics. New York, ed. Springer, 1p, p51. 2007.

DRUK, S.; CARVALHO, M.S.; CÂMARA, G.; MONTEIRO, A.V.M. Análise Espacial de Dados Geográcos. EMBRAPA, Brasília, 2004.

FOOK, K. D. Integração da Estatística Espacial em Ambientes GIS. Monograa, Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2005.

(31)

FONSECA, T. C. C.; PAQUINI, R. Anemia Aplástica Severa: Análise dos pacientes Pediátricos atendidos pelo Serviço de Transplante de Medúla Óssea do Hospital de Clínicas de Curitiba no período de 1979-1993. Revista da Associação Médica, Brasil, 48(3): 263-7, 2002.

FRERICHS, R. R. Encyclopedia Britannica - UCLA - School of Pu-blic Health,. Department of Epidemiology, London, 2009. Disponível em http://www.ph.ucla.edu/epi/snow/encyclopediasummaryfrerichs.html. Data de acesso: 14/08/2013.

GOMES, S. C.; ANDRADE, L. C. Análise espacial do crescimento econômico dos municípios paraenses no período 2002-2006. Anais do I Circuito de Debates Acadêmicos, CODE - IPEA, 2011.

HEMORIO Manual do Paciente - Anemia Aplástica. Instituto Estadual de Hematologia Arthur de Siqueira Cavalcanti, edição revisada, 2004.

JACKOB, A. A. B. A Krigagem como Método de Análise de Dados Demográcos. XIII Encontro da Associação Brasileira de Estudos Populacionais, Minas Gerais, 2002.

LANDIM, P. M. B.; STURARO, J.R. Krigagem indicativa aplicada à elaboração de mapas probabilísticos de riscos. UNESP-Rio Claro, Lab. Geomatemática, 2002. LOURENÇO, R. W; LANDIM, P. M. B. Mapeamento de áreas de risco à saúde pública por meio de métodos geoestatísticos. Caderno de Saúde Pública, Rio de Janeiro, 150-160p, 2005.

MANLY, B. F. J. Randomization, Bootstrap and Monte Carlo Methods in Biology. Flórida, Chapman & Hall, 2006, 460p.

MANTEL, B. F. J. The detection of disease clustering and a generalised regression aproach. Cancer Research, Philadelphia, v.27, 1967.

MARCONATO, R.; LAROCCA, A. P. C.; QUINTANILHA, J. A.Análise do uso de tecnologias em estabelecimentos agropecuários por meio dos índices de Moran global e local. Revista de Política Agrícola, Ano XXI n. 1, 2012.

MATSUMOTO, P. S. S.; FLORES, E. F. Estatística Espacial na Geograa: Um Estudo dos Acidentes de Trânsito em Presidente Prudente SP. Revista Geograa em Atos, Presidente Prudente, São Paulo, n. 12, v.1, 2012.

OPROMOLLA, P. A.; DALBEN, I.; CARDIM, M. Análise geoestatística de casos de hanseníase no Estado de São Paulo, 1991-2002. Revista de Saúde Pública, São Paulo, 2006.

(32)

OZAKI, V. Análise espacial da produtividade agrícola no Estado do Paraná: implicações para o seguro agrícola. Revista de Economia e Sociologia Rural - RESR, Piracicaba, São Paulo, v. 46, n. 03, p. 869-886, 2008.

PAIVA, C. Dependência Espacial: Setores censitários, Zonas OD, Distritos, Sub Prefeituras e etc.. Carlos Paiva, 2007.

RODRIGUES JR, A. L., RUFFINO-NETTO, A., CASTILHO, E. A. Distribuição espacial da coinfecção M. tuberculosis/HIV no Estado de São Paulo, 1991-2001. Revista de Saúde Pública, São Paulo, 2006.

SALVINO, M. A. Palestra sobre Aplasia Medular - HEMOBA. Bahia, 2011. SANTOS, F. H. Uma Análise Estatístico-Espacial da Violência Doméstica e Familiar contra a Mulher em Belo Horizonte/ Minas Gerais 2006 a 2010. Dissertação de Mestrado, Pontifícia Universidade Católica de Minas Gerais, Belo Horizonte, 2011.

SCALON, J. D.; JARDIM, S. S. L.; SANTOS, G. R. NOGUEIRA, D. A. Análise do Padrão Espacial da Mortalidade Infantil Utilizando Geoestatística. Revista Univap, São José dos Campos-São Paulo, v. 18, n. 32, 2012.

SILVA, S. U.; TACHIBANA, V. M.; SOUZA, A. D. P. Análise Estatística Espacial dos Óbitos por Câncer de Traqueia, Brônquios, Pulmão e Estômago

Registrados para o Estado de São Paulo em 2005 e 2010. São Paulo, 2011. SILVA, N. C. N.; OLIVEIRA, M. S.; SANTOS, G. R.; BRAGA, A. S. Análise de Dados de Área Aplicada a dois Indicadores Econômicos de Mesorregiões do Estado de Minas Gerais. Revista Brasileira de Biometria, São Paulo, v.29, n.3, p.369-395, 2011.

VIOLA, D. N.Detecção e modelagem de padrão espacial em dados binários e de contagem . Piracicaba - São Paulo, Escola Superior de Agricultura "Luiz de Queiroz"da Universidade de São Paulo, 2007.

ZIMBACK, C. R. L.Geoestatística. Grupo de pesquisa e ciências agrárias georreferenciadas, UNESP, Botucatu, 2003.

(33)
(34)

APÊNDICE

APÊNDICE A - TESTE DE ALEATORIZAÇÃO # Lendo os dados

dados=read.table("BANCO.txt",head=T) dados[1:2,]

LATITUDE LONGITUDE RESP2 POP TAXA 1 -11.66222 -38.01722 1 14.653 6.82454e-05

2 -12.13556 -38.41917 2 141.949 1.40896e-05 x=dados[,1]

y=dados[,2] z=dados[,5]

# carregando pacote para geodados require(geoR)

dadosGeo<-as.geodata(dados, head=T, coords=1:2, data.col=5) # Transformando os da-dos em geodada-dos

# Plotando diagrama resumo plot(dadosGeo)

# Matriz L: matriz dos pontos (xi,yi) L=matrix(c(x,y),192,2)

# Matriz das distâncias das localizações n=nrow(L) n A=matrix(c(rep(0)),n,n) for (i in 1:n) { for (j in 1:n){ if (i==j){ A[i,j]=0 } else { if (i<j) { A[i,j]=sqrt((L[i,1]-L[j,1])2+(L[i,2]-L[j,2])2) } } if (i>j) { A[i,j]=A[j,i] } } }

# Matriz das distâncias das repostas Z=matrix(c(z),192,1)

(35)

m=nrow(Z) m B=matrix(c(rep(0)),m,m) for (i in 1:m) { for (j in 1:m) { if (i==j) { B[i,j]=0 } else { if (i<j) { B[i,j]=sqrt((Z[i,1]-Z[j,1])2) } } if (i>j) { B[i,j]=B[j,i] } } } A1=as.vector(A) B1=as.vector(B) # Teste de Mantel q=10000 # quantidade de aleatorizações proc=function(q){ aux=NULL # Teste de aleatorização for (i in 1:q){ A1.al=sample(A1) correlAl=cor(A1.al,B1, method="spearman") if (correlAl>=cor(A1,B1, method="spearman")) aux[i]=1 else aux[i]=0 } pvalor=mean(aux) pvalor } proc(10000)

APÊNDICE B - PROGRAMA PARA CONSTRUÇÃO DOS SEMIVARIOGRAMAS E KRIGAGEM

# Construção do semivariograma e envelope

dados.bin <- variog(dados, max.dist=6.5) # Plotando semivariograma plot(dados.bin)

(36)

#Construção dos envelopes

dados.vario.env <- variog.mc.env(dados, obj=dados.bin) plot(dados.bin, env=dados.vario.env, xlab="distância", ylab="semivariância")

dados.t.exp <- variot(dados.bin, ini=c(10e-10,2), cov.model="exp", x.kappa=FALSE) # Construção do semivariograma Exponencial

summary(dados.t.exp) dados.t.exp

plot(dados.bin, xlab="distância", ylab="semivariância") lines(dados.t.exp,col="green")

# Construção do semivariograma Esférico

dados.t.sph <- variot(dados.bin, ini=ini.vals, cov.model="sph", x.kappa=FALSE) summary(dados.t.sph)

dados.t.sph

plot(dados.bin, xlab="distância", ylab="semivariância") lines(dados.t.sph,col="red")

# Construção do semivariograma Gaussiano

dados.t.gau <- variot(dados.bin, ini=ini.vals, cov.model="gau", x.kappa=FALSE) summary(dados.t.gau)

dados.t.gau

plot(dados.bin, xlab="distância", ylab="semivariância") lines(dados.t.gau,col="blue")

# Construção do semivariograma Família Matérn

dados.t.mat <- variot(dados.bin, ini=ini.vals, cov.model="matern", x.kappa=FALSE) summary(dados.t.mat)

dados.t.mat

plot(dados.bin, xlab="distância", ylab="semivariância") lines(dados.t.mat,col="yellow3")

# Parâmetros estimados e soma de quadrados ponderados para modelo Exponencial summary(dados.t.exp)$estimated.pars

summary(dados.t.exp)$sum.of.squares

# Parâmetros estimados e soma de quadrados ponderados para modelo Esférico summary(dados.t.sph)$estimated.pars

(37)

# Parâmetros estimados e soma de quadrados ponderados para modelo Gaussiano summary(dados.t.gau)$estimated.pars

summary(dados.t.gau)$sum.of.squares

# Parâmetros estimados e soma de quadrados ponderados para modelo da família Matérn

summary(dados.t.mat)$estimated.pars summary(dados.t.mat)$sum.of.squares

# Modelos teóricos agrupados

plot(dados.bin, xlab="distância", ylab="semivariância") lines(dados.t.exp,col="green")

lines(dados.t.sph,col="red") lines(dados.t.gau,col="blue") lines(dados.t.mat,col="yellow3")

# Krigagem para o modelo Esférico

loci0 <- expand.grid(seq(-48,-35,l=500), seq(-19,-8, l=500)) plot(loci0)

points(loci0, pch="+")

pred.dados.sph <- krige.conv(dados, loc=loci0, krige=krige.control(obj=dados.t.sph)) names(pred.dados.sph)

pred.dados.sph$predict # valores preditos # Plotando mapa de predição # Construção do mapa de predição

image(pred.dados.sph,col=gray(seq(0.95,0.1, l=21)), xlab="Latitude", ylab="Longitude") APÊNDICE C- PROGRAMA PARA ÍNDICE I GLOBAL DE MORAN

# Carregando pacote para o índice require(ape)

dados

n=dim(dados) # Dimensão dos dados

dados.dists <- as.matrix(dist(dados$coords)) dados.dists

dados.dists.inv <- 1/dados.dists # Calculando pelo inverso da distância

diag(dados.dists.inv) <- 0 # Substituindo elementos da diagonal principal dados.dists.inv Moran=Moran.I(dados$data, dados.dists.inv)

(38)

# Teste de aleatorização aux=NULL q=10000 for (i in 1:q){ Data.al=sample(dados$data) MoranAl=Moran.I(Data.al, dados.dists.inv) if (MoranAl$observed>=Moran$observed) aux[i]=1 else aux[i]=0 } pvalor=mean(aux) pvalor

Referências

Documentos relacionados

Resumo: Esta pesquisa teve como objetivo pesquisar os trabalhos acadêmicos existentes que remetem ao tema das relações de trabalho acerca de pessoas identificadas como

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

Os dados referentes aos sentimentos dos acadêmicos de enfermagem durante a realização do banho de leito, a preparação destes para a realização, a atribuição

servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...

Janaína Oliveira, que esteve presente em Ouagadougou nas últimas três edições do FESPACO (2011, 2013, 2015) e participou de todos os fóruns de debate promovidos

intitulado “O Plano de Desenvolvimento da Educação: razões, princípios e programas” (BRASIL, 2007d), o PDE tem a intenção de “ser mais do que a tradução..

Esta dissertação pretende explicar o processo de implementação da Diretoria de Pessoal (DIPE) na Superintendência Regional de Ensino de Ubá (SRE/Ubá) que conforme a

Dessa forma, diante das questões apontadas no segundo capítulo, com os entraves enfrentados pela Gerência de Pós-compra da UFJF, como a falta de aplicação de