• Nenhum resultado encontrado

ANÁLISE ESPACIAL DE INFORMAÇÕES DE SEGURANÇA PÚBLICA DO CENTRO URBANO DE SÃO JOSÉ DO RIO PRETO/SP

N/A
N/A
Protected

Academic year: 2021

Share "ANÁLISE ESPACIAL DE INFORMAÇÕES DE SEGURANÇA PÚBLICA DO CENTRO URBANO DE SÃO JOSÉ DO RIO PRETO/SP"

Copied!
11
0
0

Texto

(1)

ANÁLISE ESPACIAL DE INFORMAÇÕES DE SEGURANÇA PÚBLICA

DO CENTRO URBANO DE SÃO JOSÉ DO RIO PRETO/SP

Manuela Gallo y Sanches José Alberto Quintanilha

Escola Politécnica da Universidade de São Paulo Departamento de Engenharia de Transportes

Laboratório de Geoprocessamento Av. Prof. Almeida Prado, Travessa 2, no. 83

Cidade Universitária - São Paulo - Brasil CEP.: 05508-900 - Tel: +55 11 3091 5504

{mgallo,jaquinta}@usp.br

RESUMO - O presente trabalho tem como objetivo testar uma metodologia que reúna ferramentas de análises espacial e estatística aplicadas a dados criminais de São José do Rio Preto/SP. Dados sócio -econômicos de 1991 da FIBGE e ocorrências criminais relativas ao primeiro trimestre de 2001 cedidas pela Delegacia Seccional do Município, formaram o córpus do estudo. Para escolher quais variáveis explicativas estavam associadas ao índice de criminalidade, foi usada a regressão linear múltipla identificando a Renda e Instalação Sanitária com um ajuste de 0,76. Apesar dos resíduos possuírem média zero e distribuição normal, foi detectado o problema da heterocedasticidade dos dados. Para corrigi-lo, optou-se por transformar todos os termos da regressão em funções logarítmicas. Observou-se que a heterocedasticidade foi resolvida, resultando em um ajuste de 0,78. Para determinar agregamentos através de amostras pontuais utilizou-se a Função K. O uso de indicadores de autocorrelação global e local identificou a existência de agregamento de setores censitários, no centro da área de estudo onde a criminalidade é maior. Concluiu-se que os agregamentos encontrados nas amostras pontuais revelaram que existem áreas em que a criminalidade difere da encontrada no centro urbano.

ABSTRACT - The present study has as aim to apply a methodology capable to congregate tools of spatial and statistical analysis applied to the criminal data of São José do Rio Preto/SP-Brazil. Social-economic data from 1991, by FIBGE and criminal occurrences yielded by the Regional Police of the city, related to the first three months of 2001, formed the córpus for the study. To discover and choose which variables would be associated to the crime index, the multiple linear regression identifying the Average Income and Sanitary Installation was used with an adjustment of 0,76. Despite the analysis of regression residues having average zero and showing a normal errors distribution, the problem of the heteroscedasticity of the data was detected. To correct it, we needed to transforme all the terms of the regression into logarithmic functions. Great part of the heteroscedasticity was handled, resulting in a adjustment of 0,78. To determine clusters through a sample of points where occurred the crimes, Function K was used. The use of global and local autocorre lation allowed us to identify the existence of clusters in the center of the studied area where crime is more intense. The final conclusion is that the clusters found through these points show the existence of some areas where crime has a different way from the urban center of the city.

1 INTRODUÇÃO

Conforme a Fundação Sistema Estadual de Análise de Dados (FSEADE), São José do Rio Preto/SP apresentou em 1999 cerca de 20.000 ocorrências criminais (ocorrências registradas em boletins nos Distritos Policiais) e mais de 25.000 ocorrências policiais (serviços da polícia prestados à comunidade sem necessidade de registros em boletins).

Como a questão da segurança alarma grande parte da população, tornou-se indispensável pesquisar formas de amenizar este fenômeno, sejam elas através da reestruturação das polícias civil e militar, sejam através de

propostas governamentais ou ainda de trabalhos acadêmicos.

O intuito deste trabalho é desenvolver uma metodologia que utilize análise espacial e estatística em dados socioeconômicos conjuntamente com o índice de criminalidade, no primeiro trimestre de 2000, possibilitando a identificação de bolsões de agregamento entre os setores censitários do centro urbano de São José do Rio Preto/SP. Para identificar quais as regiões onde a relação da criminalidade é mais intensa, são necessários conjuntos de ferramentas estatísticas e espaciais tais como correlações e regressões, indicadores globais e locais e diagramas de espalhamento de Moran.

(2)

As utilizações destas técnicas para o estudo da criminalidade vêm se acentuando frente às crescentes demandas do setor de Segurança Pública.

Serão tratadas neste trabalho ocorrências relativas aos Crimes contra o Patrimônio, dados que se referem a furtos e roubos em estabelecimentos comerciais, em veículos, em residências e Crimes contra a Pessoa, dados que se referem a furtos e roubos contra a pessoa.

Segundo Bailey e Gatrell (1995), os Sistemas de Informações Geográficas abrangem muito mais do que simples facilidades de visualização e as funções de análise espacial são cada vez mais importantes. Atualmente estas funções de análise vão além de simples consultas e a integração do software de geoprocessamento com um módulo de funções de estatística espacial é cada vez maior.

As polícias civil e militar do município demonstram particularmente interesse nas análises elaboradas para diagnosticar as irregularidades da sua atuação e interagir estes problemas principalmente com a comunidade e autoridades vigentes.

2 OBJETIVOS

O objetivo específico do projeto é desenvolver uma metodologia que seja capaz de determinar as áreas de risco criminal através de ferramentas de análise espacial e estatística relacionando variáveis sócio-econômicas e ocorrências criminais, por setor censitário.

3 ÁREA DE ES TUDO

A área de estudo compreende a região central do município de São José do Rio Preto/SP e possui como características principais 106 Setores Censitários e 748 delitos criminais.

4 FUNDAMENTAÇÃO TEÓRICA

Segundo Bailey e Gatrell (1995), a análise espacial pode ser definida como o estudo quantitativo de fenômenos que estão localizados no espaço. Os processos de análise espacial incluem conceitualmente três etapas básicas interrelacionadas: a visualização espacial, a análise exploratória e a modelagem dos dados. A análise exploratória permite descrever a distribuição espacial dos dados e os padrões de associação espacial, ou seja, padrões de agrupamento, sendo uma etapa essencial para a modelagem dos dados. A modelagem inclui os procedimentos de validação estatística e modelos de estimação dos dados, por exemplo, para afirmar que um determinado fenômeno pode ser considerado uma variável aleatória e possui uma determinada distribuição de probabilidade.

Anselin (1996), subdivide a primeira etapa considerada por Bailey and Gatrell, a visualização, em

seleção e manipulação. De forma geral, a visualização

considera a essência de manipular e consultar um banco de dados geográficos e criar diferentes mapas temáticos, permitindo explorar visualmente o dado objeto de análise.

4.1 Análise de Padrões Pontuais

Um padrão pontual é nada mais que um conjunto de dados que consiste em uma série de localizações pontuais e indicam a ocorrência de um determinado evento de interesse. Aqui, “evento” é utilizado para se referir a qualquer tipo de fenômeno localizado em um espaço e que possa estar relacionado a uma representação pontual (Câmara et al. 1999).

O CrimeStat, software utilizado nesta etapa, apresenta na versão 1.1, dois procedimentos para a análise de padrões pontuais: o método da distância ao vizinho mais próximo e o da função K. Estes dois métodos analisam as propriedades dos dados, conhecidas como de segunda ordem ou dependência espacial.

A análise da distância utilizando o método ao vizinho mais próximo fornece estatísticas sobre as distâncias a partir da distribuição dos pontos. Uma maneira de verificar o grau de dependência espacial em um padrão de pontos é observar se o comportamento da distribuição dessas distâncias identifica pontos aglomerados ou dispersos (Manual CrimeStat, 2000). Este método procura estimar a função de distribuição cumulativa baseando-se nas distâncias entre um evento escolhido aleatoriamente e um evento mais próximo, dividindo-a posteriormente pelo número de eventos que estão presentes na região (Manual do Spring, 2001).

A Função K é uma ferramenta exploratória, normalmente utilizada para comparar a estimação dos eventos pontuais proporcionando uma descrição mais efetiva da dependência espacial (Manual do Spring, 2001). Alguns softwares de Estatística Espacial que contém este tipo de método calculam um raio para a região de influência baseado na área do projeto (extensão) atribuindo um peso variável conforme a distância. Para entender essa função imagina-se que cada evento é visitado e ao seu redor são construídos círculos espaçados. O número acumulado de eventos dentro de cada um desses círculos é contado. Todos os eventos são visitados e o número de pontos que caem dentro de uma distância h de todos os eventos é calculado. A contagem destes eventos é então transformada em uma função de raiz quadrada, que quando plotada em um gráfico, em função da distância h, picos positivos indicam atração espacial ou agrupamento e picos negativos indicam repulsão ou regularidade (CrimeStat, 2000).

4.2 Análise Espacial em Áreas

Nas análises espaciais de dados divididos por áreas, um dos problemas encontrados é a presença de descontinuidade entre os polígonos que pode ser eliminada através de técnicas que permitam estabelecer a continuidade espacial entre áreas distintas. (Anselin, 1995)

Segundo Anselin (1996), uma das técnicas mais utilizadas para resolver o problema da descontinuidade entre áreas distintas é a construção da matriz de continuidade espacial W(n x n) onde n é um conjunto de

(3)

áreas {A1,..,An}, e cada um dos elementos wij representa uma medida de proximidade entre Ai e Aj. Esta medida de proximidade pode ser calculada a partir de um dos seguintes critérios:

ü wij = 1, se o centróide de Ai está a uma determinada distância de A, caso contrário wij= 0;

ü wij = 1, se Ai compartilha um lado comum com

Aj , caso contrário wij = 0;

ü wij = lij/li, onde lij é o comprimento da fronteira entre Ai e Aj e li é o perímetro de Ai.

O uso da matriz de continuidade espacial torna-se essencial para explorar se o valor observado de um atributo depende ou não dos valores desta mesma variável nas localizações vizinhas (Anselin, 1996). O conceito de dependência espacial, chamado por vários autores de autocorrelação espacial, mede o nível de interdependência geográfica entre as variáveis e a força deste relacionamento. Uma das formas de se detectar a autocorrelação espacial dos dados, segundo Anselin (1995), é através do uso de indicadores globais e locais de associação espacial.

Para Carvalho, et al. (1997) o Índice de Moran Global testa se as áreas conectadas apresentam maior semelhança quanto ao indicador estudado do que o esperado em um padrão aleatório, ou seja, é uma medida de correlação espacial que indica afastamentos em relação a uma distribuição espacial aleatória. Tais afastamentos indicam a existência de padrões espaciais, como por exemplo: aglomerado ou tendência espacial. Os desvios, em relação à média de cada atributo são multiplicados pelos desvios da vizinhança, obtidos pela matriz de proximidade espacial, que representa a estrutura e/ou a dependência espacial das áreas envolvidas.

De uma forma geral, o Índice de Moran, segundo Anselin (1996), testa se as áreas conectadas apresentam maior semelhança quanto ao indicador estudado do que o esperado num padrão aleatório. Nas referências consultadas, a hipótese nula indica total aleatoriedade espacial, mostrando que não existe relação entre o valor do atributo com sua localização espacial.

Carvalho (1997) reforça, como a maioria dos autores nesta área, que o Índice de Moran apresenta um intervalo de valores entre –1 e +1, quantificando o grau de autocorrelação existente, sendo positivo para correlação direta e negativo quando inversa.

A interpretação do índice de Moran como um

coeficiente de regressão sugere, segundo Anselin (1996),

o uso de um diagrama de espalhamento para visualizar a associação espacial entre o valor do atributo de cada elemento (zi) com a média dos valores dos vizinhos (Wzi), denominado de diagrama de espalhamento de Moran. Este diagrama também pode ser apresentado na forma de um mapa temático bidimensional, onde cada polígono é apresentado indicando-se o seu quadrante (Anselin, 1995).

Anselin (1995) destaca, no manual do software SpaceStat, as características dos dados espaciais, divididos em quatro quadrantes. Os quadrantes Q1 e Q2 no diagrama de espalhamento ou “High-High” e

“Low-Low” seus equivalentes no mapa temático, representam respectivamente valores positivos e médias positivas, e valores negativos e médias negativas, indicando pontos de associação espacial positiva, no sentido que uma área possui valores semelhantes à média de seus vizinhos. Os quadrantes Q3 e Q4 no diagrama de espalhamento ou “High-Low” e “Low-High” seus equivalentes no mapa temático, representam respectivamente valores positivos e médias negativas, e valores negativos e médias positivas, indicando pontos de associação espacial negativa, no sentido que uma área possui valores distintos da média de seus vizinhos. Pode-se dizer que estes pontos marcam uma região de possível transição entre regimes espaciais distintos.

Para analisar padrões numa escala de maior detalhe, Anselin (1996) aconselha a utilização de indicadores de associação espacial local como o Moran Local que permite identificar as diferentes localizações de uma variável distribuída espacialmente. Quando usados em conjunto com o Índice (I) de Moran, tais indicadores refinam nosso conhecimento sobre os processos que dão origem à dependência espacial, pois nos permitem identificar as áreas geradas e a dependência espacial que não são evidenciados pelos índices globais. Estes indicadores produzem um valor para cada objeto, permitindo desta maneira a identificação dos valores dos atributos semelhantes (Clusters) e objetos anômalos (Outliers).

Anselin (1995) considera também que um indicador local de autocorrelação espacial - LISA, tem que atender a dois objetivos: permitir a identificação de padrões de associação espacial significativo e ser uma decomposição do índice global de associação espacial. O autor destaca que o Indicador Local ou Moran Local computa o valor de um objeto multiplicando-se a matriz de proximidade espacial, pela média dos desvios de seus vizinhos.

Um dos aspectos mais importantes e laboriosos do uso do Moran Local, colocado por Anselin (1996) diz respeito à sua significância estatística. Novamente aqui podemos utilizar técnicas semelhantes às utilizadas no Moran Global como, por exemplo, a hipótese de normalidade. Determinada a significância de Moran Local, é muito útil gerar um mapa temático (LISA Map) indicando as regiões que apresentam correlação local significativamente diferente do resto dos dados. Estas regiões são chamadas de "bolsões" de não estacionariedade, pois são áreas com dinâmica espacial própria e que merecem análise detalhada. O LISA Map, como é chamado por Anselin (1995), classifica os valores do índice local em 4 grupos: não significantes, com significância de 95%, com significância de 99% e com significância de 99,9% .

4.3 Pressupostos da Regressão e Testes de Hipóteses Para determinar se o modelo de regressão linear múltipla é apropriado, é necessário inicialmente avaliar se existe relação significativa entre a variável dependente (índice de criminalidade) e o conjunto de variáveis

(4)

explicativas (renda média e número de domicílios que possuem rede geral de instalação sanitária). Como existe mais de uma variável explicativa, as hipóteses nula e alternativa podem ser elaboradas, segundo Levine et al. (1998) das seguintes formas:

• Quando não existe relação linear entre a variável dependente e as variáveis explicativas;

Ho: β1 = β2 = 0 (1)

• Quando pelo menos um coeficiente da regressão não é igual a zero.

H1: (pelo menos um βj ≠ 0) (2)

Normalmente, após o cálculo de regressão, algumas anális es devem ser feitas com a finalidade de garantir os resultados obtidos. A construção de gráficos, nesta etapa, torna-se imprescindível para analisar os pressupostos de uma regressão conforme Levine et al., (1998) destaca a seguir.

O primeiro pressuposto, a normalidade, requer que os valores de Y sejam normalmente distribuídos para cada valor de X. Muitos dos testes e análises no diagnóstico da regressão espacial são baseados em hipóteses sobre a normalidade da distribuição dos resíduos. O teste de normalidade dos resíduos, sugerido pelo SpaceStat (1995) é a estatística Jarque-Bera que segue a distribuição Quiquadrado com 2 graus de liberdade. Uma pequena probabilidade indica uma rejeição da hipótese nula de normalidade dos resíduos. Se este for o caso, os testes de heterocedasticidade e dependência espacial devem ser interpretados com cautela, pois eles estão baseados na distribuição normal.

O segundo pressuposto, a homocedasticidade, requer que as variações em torno da linha de regressão sejam constantes para todos os valores de X. Isto significa que Y varia na mesma proporção, quando X for um valor baixo e quando X for um valor elevado. Quando as variações em torno da linha de regressão não são constantes acontece a heterocedasticidade. Em análise de dados espaciais este problema é freqüentemente encontrado, especialmente quando os dados estão em unidades espaciais irregulares (com áreas diferentes) e quando há diferenças regionais sistemáticas (Devore 1999). Para amenizar este tipo de anormalidade, Anselin (1996) propõe certas transformações matemáticas nos dados utilizados como, por exemplo, a função logarítmica de base dez (Log 10). No SpaceStat, o teste que comprova a existência ou não da heterocedasticidade dos dados é o KB (Koenker, 1981 e Koenker e Basset, 1982) que segue como o teste de normalidade a distribuição Quiquadrado com P graus de liberdade, onde P é o número de variáveis na especificação da heterocedasticidade.

O terceiro pressuposto, a independência dos erros, requer que o erro (a diferença residual entre valores observados e previstos de Y) deva ser independente para cada valor de X. Isto é avaliado através do valor Índice (I) de Moran calculado na regressão linear múltipla pelo SpaceStat.

4.4 Análise de Resíduos

Levine et al (1998), define resíduos ou valores de erros estimados como sendo a diferença entre os valores de observados e os valores previstos da variável dependente para os valores dados das variáveis independentes. O autor considera que a análise de resíduos é utilizada para avaliar se o modelo é apropriado para o conjunto de dados e estudar potenciais violações dos pressupostos do modelo.

Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessária uma investigação aprimorada sobre os resíduos provenientes da função de regressão.

Para examinar a adequação do modelo de regressão ajustado torna-se indispensável o desenho dos resíduos padronizados ou ajustados no eixo vertical e os valores correspondentes aos valores das variáveis explicativas no eixo horizontal. “Se o modelo ajustado for apropriado para os dados, não haverá padrão aparente nesse gráfico de resíduos em relação às variáveis explicativas. No entanto, se o modelo ajustado não for apropriado, existirá uma relação entre os valores de X e os resíduos“ (Levine, et al. 1998).

Segundo Devore, (1999) a construção de gráficos ajuda a avaliar o modelo de regressão. Exemplos disso é a construção de histogramas para verificar a distribuição normal dos resíduos padronizados ou ainda a visualização dos valores padronizados no eixo X e dos valores observados no eixo Y para verificar se há violação do pressuposto da homocedasticidade.

5 MATERIAIS E MÉTODOS

O trabalho foi dividido nas seguintes etapas: coleta de dados, digitação dos Boletins de Ocorrência, geocodificação das ocorrências criminais e distritos policiais, digitalização manual dos Setores Censitários, cálculo da Renda Média, cálculo do Índice de Criminalidade, seleção de variáveis, análises tabulares e análises espaciais.

Para que fosse possível realizar as análises espaciais e estatísticas no município foi necessário buscar as seguintes informações:

• Variáveis sócio-econômicas datadas de 1991 e memorial descritivo dos setores censitários;

• Base Cartográfica do município de São José do Rio Preto contendo eixos de rua e,

• Boletins de Ocorrência compreendendo o período de Janeiro, Fevereiro e Março de 2000.

As variáveis sócio -econômicas e a divisão setorial censitária foram adquiridas na Fundação Instituto Brasileiro de Geografia e Estatística (FIBGE). A listagem das variáveis foi disponibilizada pelo órgão em meio digital, com extensão compatível ao software Excell. No entanto, a divisão setorial, disponibilizada em formato texto (denominada memorial descritivo), reunia

(5)

informações técnicas sobre cada setor censitário, indicando o início e o fim de cada polígono. Para que a etapa de digitalização manual dos Setores Censitários fosse possível, foi necessário adquirir a Base Cartográfica (em projeção UTM – Universal Transverse Mercator), através da Prefeitura Municipal de São José do Rio Preto/SP, contendo os eixos de rua, no entanto sem nomenclatura.

Os boletins de ocorrência, cedidos pela Delegacia Seccional do município foram disponibilizadas através de documentos impressos contendo várias informações, entre elas: a especificação criminal, o tipo de delito praticado, o local onde aconteceu o crime e o bairro.

A divisão territorial dos Setores Censitários, por sua vez, não está disponível em meio digital, o que nos obriga à edição dos mesmos, ou seja, foi necessário consultar o arquivo-documento cedido pela FIBGE que especifica as características de cada setor e assim gerar os polígonos. É importante salientar que, sem os polígonos correspondentes aos setores censitários, não é possível realizar nenhum tipo de análise espacial em áreas, tornando este processo dependente e imprescindível.

A elaboração dos 106 setores censitários foi realizada tomando-se como bas e os eixos de rua do município, através do memorial descritivo fornecido pela FIBGE indicando os pontos iniciais e finais de um polígono. Deve-se lembrar que o município de São José do Rio Preto possui ao todo sete Distritos Policiais no entanto quatro deles, os mais movimentados, estão contidos na área piloto do projeto.

5.1 Seleção das Variáveis Utilizadas

Analisandose a quantidade de variáveis sócio -econômicas adquiridas pela FIBGE, optou-se por selecionar previamente quinze (15) variáveis que pudessem indicar tanto o perfil do morador, quanto as condições de infra-estrutura de cada setor censitário. A Tabela I a seguir apresenta todas as variáveis que fizeram parte do estudo.

Tabela 1 - Descrição das Variáveis

Fonte: FIBGE, 1991

Segundo o sociólogo Túlio Kahn (1999), membro do Instituto Latino Americano das Nações Unidas para a

Prevenção do Delito e o Tratamento de Delinqüentes – ILANUD - o cálculo do índice de criminalidade é elaborado da seguinte forma: somatório das taxas por 100 mil habitantes ou 10 mil habitantes (conforme o tamanho do município) das ocorrências criminais (crimes contra a vida, furtos e roubos contra a pessoa e contra o patrimônio), multiplicados cada uma pela pena média atribuída pelo código penal, dividido pelo número de indicadores do índice ou total de delitos criminais. Para o município em questão, foi utilizada a taxa equivalente a 10 mil habitantes, já que a cidade comporta cerca de 400 mil habitantes. Matematicamente o Índice de Criminalidade seria expresso da seguinte maneira:

NúmeroTotaldeDelitos ais DelitosCri PenaMédia Taxas* * min (3)

5.2 Geocodificação das Ocorrências Criminais

Para geocodificar as ocorrências criminais, foi necessário em primeiro lugar organizar o banco de dados com o máximo de informações contidas nos documentos fornecidos pela Delegacia Seccional de São José do Rio Preto/SP.

Uma destas informações é a chamada

especificação criminal conforme o Código Penal

Brasileiro (2000) dividida em: Crimes contra a Vida, Furtos contra a Pessoa, Furtos e Roubos de Veículos, Furtos e Roubos em Residências, Furtos e Roubos no Comércio e Roubos contra a Pessoa. Foram digitados no aplicativo Excell, 748 registros criminais cedidos pela Delegacia Seccional do Município de São José do Rio Preto, referente aos meses de Janeiro, Fevereiro e Março de 2000.

Os dados criminais, bem como os quatro distritos policiais, pertencente à área de estudo, foram geocodificados manualmente via endereçamento através de dois guias: um oficial da cidade (1983) e outro virtual pelo site http://www.geodados.com.br (1999). Cada ponto foi verificado em ambas as fontes citadas, possibilitando melhor qualidade de localização dos pontos. É importante lembrar que até a finalização desta etapa, a Base Cartográfica do município cedido pela Prefeitura, não continha informações de endereçamento dos eixos de rua, já que este procedimento exige tempo para estruturá-la. Isto implicou na edição nominal de algumas ruas para agilizar a localização exata dos pontos.

5.3 Softwares Utilizados

Com o intuito de realizar os objetivos propostos, foram utilizados dois softwares estatísticos: o SpaceStat que trabalha com módulos que calculam índices de correlação espacial das variáveis de interesse tais como: o Índice de Moran Global e o Índice de Moran Local e outras funções indicadas à regiões, e o CrimeStat, que trabalha com amostras pontuais para determinar a presença de agrupamentos.

Variáveis Descrição

INDCRIMA Índice de Criminalidade

TOTDOMA Total de Domicílios

RMEDA Renda Média Nominal dos Chefes de Família

TOTCASA Total de Casas

TOTAPA Total de Apartamentos

INSTD Número de Domicílios que possuem Rede Geral de Instalação Sanitária

IMPROPA Número de Imóveis Próprios

IMALUGA Número de Imóveis Alugados

CF17ESA Chefes de Família de 1 a 7 Anos de Estudo

CF814ESA Chefes de Família de 8 a 14 Anos de Estudo

CF15ESA Chefes de Família com Mais de 15 Anos de Estudo

POPHA População de Homens

POPMA População de Mulheres

POPALFA População Alfabetizada

DENDEM Densidade Demográfica

ABAGA Abastecimento de Água

(6)

O software escolhido para visualizar os resultados gerados no SpaceStat foi o ArcView já que os mesmos possuem interface.

5.4 Análise Espacial e Estatística

Foram analisados, no software Excell, dados referentes às ocorrências criminais de Janeiro, Fevereiro e Março de 2000 e às variáveis sócio-econômicas da FIBGE. Para tanto, foram utilizadas determinadas ferramentas de análise tais como correlações e regressões e ferramentas visuais (assistente de gráfico).

As correlações realizadas no Excell, definiram quais variáveis seriam importadas para o software ArcView. Logo após este processo, foi gerada a matriz de proximidade espacial dos dados, atribuída como matriz peso (W) em todos os cálculos elaborados no software estatístico SpaceStat. No software SpaceStat foram gerados: a matriz de correlação espacial dos dados, o cálculo dos Indicadores de Autocorrelação Espacial: Global e Local das variáveis, divididas pela área de cada setor censitário, fato que indicou maior correlação entre os dados uma vez que a força de associação diminui utilizando valores absolutos, e a regressão linear múltipla.

A vantagem de utilizar um software de análise espacial como o SpaceStat é que este considera a distância entre os centróides de cada setor censitário, o compartilhamento dos lados em comum e a relação existente entre estes lados e o perímetro da área em questão o que difere das análises tabulares. (Manual SpaceStat, 1995)

6 RESULTADOS

Como primeira abordagem, verificou-se que as variáveis que possuem maior correlação com o índice de criminalidade são, em ordem de importância: Número de Domicílios que possuem Rede Geral de Instalação Sanitária e Renda Média. Aparentemente, estas variáveis estão associadas à fenômenos que auxiliam a criminalidade.

6.1 Regressão Linear Múltipla

A Regressão Linear Múltipla considerou como variável dependente (Y) o Índice de Criminalidade e como variáveis explicativas (X), Renda Média e Número de Domicílios com Rede Geral de Instalação Sanitária.

A regressão espacial gerou como resultados expostos na Tabela I, um R2 = 0,7704 e de R 2 Ajustado = 0,7659. A estatística F calculada foi de 172,767 com probabilidade de 1,24 E–33. Analisando o valor de F na Estatística de Regressão, foi possível verificar a rejeição da hipótese nula para H0 já que F(172,77) > 3,07 (valor crítico na distribuição) e sua probabilidade p (1,24 E –33) < 0,05 (nível de confiança adotado). Isto significa que pelo menos um coeficiente de regressão é diferente de zero e pelo menos uma das variáveis explicativas está relacionada ao índice de criminalidade, validando a

regressão. Para validar a regressão e a confiabilidade do R2 foram analisados os testes de multicolinearidade, normalidade, heterocedasticidade e dependência espacial. Tabela 2- Informações sobre a Regressão Linear Múltipla

Tabela 3 - Diagnósticos da Regressão Linear Múltipla

O teste referente à heterocedasticidade indicou, através dos valores da distribuição t-Student que o valor obtido na regressão espacial (48,31) com 2 graus de liberdade é muito maior do que o valor crítico esperado. É possível dizer que há heterocedasticidade dos dados e que os erros ou resíduos da regressão provavelmente não possuem distribuição constante para as observações.

O valor calculado para o I de Moran (0,03) mostrou que não há autocorrelação espacial entre a variável dependente e suas observações. No entanto, o valor de 0,82 indica que há valores de atributo acima da média global e de alto peso de proximidade para uma probabilidade de 0,40 o que possibilita identificar áreas com valores semelhantes agrupados espacialmente.

O número condicional encontrado na regressão espacial foi de 3,06 indicando que não há indícios de multicolinearidade nos dados. Segundo Anselin et al. (1996) o número condicional deve ser menor que 20, caso contrário o diagnóstico deste pressuposto é favorável.

Foi possível verificar através do teste de normalidade com 2 graus de liberdade e uma probabilidade extremamente baixa, a rejeição da hipótese nula de distribuição normal do erro, o que significa que pelo menos um dos coeficientes da regressão é diferente de zero. A distribuição normal dos erros também foi verificada através da construção de gráficos, conforme a seção de análise de resíduos.

6.2 Análise de Resíduos

Pode-se observar através da Figura 1 abaixo que os erros ou resíduos padronizados possuem média igual a zero e distribuição normal, como havia sido previsto na regressão espacial.

(7)

Figura 1- Histograma dos resíduos padronizados Para certificar o pressuposto da homocedasticidade foi construído um gráfico entre os resíduos da regressão conforme a ilustração da Figura 2.

Figura 2- Resíduos Padronizados X Observados Na figura acima foi possível identificar a violação do pressuposto da homocedasticidade, denominado heterocedasticidade dos dados e por esta razão algumas transformações nas variáveis foram realizadas com o intuito de eliminar este problema.

O mapa residual mostrou, conforme a Figura 3 que há valores muito altos e muito baixos de resíduos nos setores identificados pela cor vermelha e azul respectivamente.

Figura 3- Mapa Residual

A partir desta análise visual, é possível dizer que este modelo de regressão que prevê o Índice de Criminalidade não se aplica nestes setores censitários e que a modelagem torna-se mais eficiente nos setores que possuem valores de resíduos intermediários.

Analisando-se todos os resultados anteriores optou-se por amenizar a heterocedasticidade dos dados e por conseqüência proporcionar o melhor ajuste do modelo de regressão para prever o índice de criminalidade nos setores censitários.

As três variáveis que fazem parte da regressão linear múltipla (índice de criminalidade, renda média e número de domicílios que possuem rede geral de instalação sanitária) foram transformadas através da função logarítmica de base dez (Log 10 ).

A regressão onde todos os termos que comp õem o modelo foram transformados na função LOG10, indicou

valores de R2 (0,78), R2 ajustado (0,78), Teste F (187,99) e F de significação (4,21 E-35), como pode ser visto na Tabela 4 abaixo.

Tabela 4- Informações sobre a Regressão Linear Múltipla usando Log10

A ilustração da Tabela 5 exibe os diagnósticos da regressão espacial onde foi possível observar que não há multicolinearidade nos dados já que o número condicional (11,18) é menor que 20.

Tabela 5- Diagnósticos da Regressão Linear Múltipla usando Log10

O teste de heterocedasticidade, avaliou a variável Log10 (Índice de Criminalidade) com uma probabilidade de 0,052 e indicou, segundo a distribuição t-Student, que o valor crítico esperado está entre 3,0777< t < 6,3138.

Analisando-se o histograma, verificou-se conforme a Figura 4 que os dados possuem distribuição normal e média igual a zero o que valida o teste de normalidade dos dados.

O valor do I de Moran (-0,036) mostra que não dependência espacial entre os dados já que a probabilidade calculada pelo SpaceStat é praticamente nula.

Figura 4- Histograma da Regressão usando usando Log10 A construção do gráfico dos resíduos padronizados em relação aos valores observados para a variável Log10 índice de criminalidade, conforme a Figura 5 não indicou nenhuma violação dos pressupostos.

(8)

Figura 5- Resíduos Padronizados X Valores Observados Log10 (Índice de criminalidade)

O mapa residual, ilustrado na Figura 6 abaixo, indicou valores positivos para os resíduos padronizados somente na área onde está localizada a represa municipal. Pode-se dizer que este modelo da regressão não se enquadra nesta área; porém, o mesmo não acontece com o restante dos setores censitários estudados onde os valores residuais são mais baixos, proporcionando melhor ajuste do modelo de regressão.

Figura 6- Mapa Residual da Regressão usando Log10 em todos os termos

6.3 Modelo de Regressão

Considerando-se que a melhor regressão encontrada foi aquela onde todas as variáveis estudadas foram transformadas na função logarítmica de base dez (Log 10 ), o modelo de regressão que melhor se ajusta para prever o fenômeno da criminalidade no centro urbano de São José do Rio Preto/SP pode ser expresso como:

i i i i

X

X

Y

=+2,01842+0,688897 1 +0,750918

2

+ε ^ Onde:

Yi é o valor previsto para o Índice de Criminalidade 2,01842 é a interseção de Y;

0,688897 é a inclinação de Y em relação à variável X1 (Renda Média)

0,750918 é a inclinação de Y em relação à variável X2 (Instalação Sanitária)

ε = Erro aleatório em Y para a observação i 6.4 Análise Espacial em Áreas

Com a finalidade de estimar a variabilidade espacial dos dados por Setor Censitário, a ferramenta

básica utilizada foi a matriz de proximidade espacial, calculada no SpaceStat, segundo Anselin (1996) a partir dos seguintes critérios: vizinhança, proximidade dos centróides de cada polígono e comprimento da fronteira entre eles.

6.4.1 Indicador Global de Autocorrelação Espacial As Figuras 7, 8 e 9 a seguir mostram os resultados do método Moran Global ou Moran Significance aplicado sobre as variáveis: índice de criminalidade, renda média e número de domicílios com rede geral de instalação sanitária.

Figura 7- Moran Global para Índice de Criminalidade

Figura 8- Moran Global para Renda Média

Figura 9- Moran Global para Número de Domicílios com Rede Geral de Instalação Sanitária

Os valores identificados como “High-High representam valores positivos e médias positivas e indicaram pontos de associação espacial significativos para o índice de criminalidade nos setore s que abrangem o centro da cidade onde a concentração de ocorrências criminais é maior. O indicador global mostrou que há aglomerados para a renda média nos setores que pertencem aos bairros Redentora e Imperial. Isto deve-se ao fato do valor da renda ser maior nestes bairros, por consequência a qualidade de vida dos habitantes é melhor. Foram identificados dois bolsões com valores positivos para a variável instalação sanitária tanto no centro comercial quanto no bairro Redentora, o que significa que a quantidade de domicílios com rede geral de instalação sanitária é mais alta.

(9)

6.4.2 Indicador Local de Autocorrelação Espacial

As Figuras 10, 11 e 12 apresentam os resultados do método LISA - Moran Local aplicados sobre as variáveis: Índice de Criminalidade, Renda Média e Número de Domicílios com Rede Geral de Instalação Sanitária.

O LISA MAP identificou para a variável índice de criminalidade focos, altamente significativos nos setores centrais urbanos mostrados em vermelho. Isto significa que o valor do índice de criminalidade não é aleatório nestas condições e que existe uma dependência espacial muito forte desta variável nestes setores onde a significância é de 99,9%. Setores marcados em verde, foram identificados com 95%.

Figura 10- Moran Local para Índice de Criminalidade

Figura 11- Moran Local para Renda Média

Figura 12- Moran Global para Número de Domicílios com Rede Geral de Instalação Sanitária

Algo similar aconteceu para os valores da renda média, no entanto em proporções menores. Os setores identificados pela cor vermelha mostraram que há dois bolsões com nível de significância de 99,9% sugerindo a dependência espacial nestas áreas.

Foi identificado também um bolsão de agregamento de setores censitários para a variável de instalação sanitária (99,9%) na região comercial do município. A explicação deste fenômeno provavelmente é a razão da quantidade de domicílios comerciais ser maior no centro da cidade e sua maioria possuir rede geral de instalação sanitária.

6.4.3 Moran Scartterplot

Uma maneira adicional de visualizar o índice de Moran proposto por Anselin (1996), é a espacialização do relacionamento entre os valores observados e os valores das médias locais através de diagramas de espalhamento, denominado MoranScartterplot conforme as Figuras 13, 14 e 15 abaixo.

Figura 13- Moran Scatterplot para Índice de Criminalidade

Figura 14- Moran Scatterplot para Renda Média

Figura 15- Moran Scatterplot para Domicílios com Rede Geral de Instalação Sanitária

Foram observados valores positivos e médias positivas em vermelho (High-High) para a variável índice de criminalidade no centro urbano do município. Foi possível identificar um pequeno agregamento de setores censitários localizados ao norte, justificando a criminalidade significativa nestas áreas. As associações positivas indicaram que nestes setores os valores de índice de criminalidade são altos bem como de seus vizinhos. Os valores negativos e médias negativas em rosa (Low-Low) estão amostrados na região periférica do município. Os setores identificados como “High-Low” e “Low-High” são valores de transição entre os mais altos e mais baixos. Os valores positivos e médias positivas da renda média marcam claramente em vermelho um bolsão concentrando setores censitários que pertencem em sua maioria a bairros de alto padrão. Foram verificadas regiões de transição de regime, para a esta variável exatamente nos locais de borda.

(10)

O diagrama de espalhamento de Moran identificou uma grande área em vermelho para os valores de instalação sanitária abrangendo boa parte do centro urbano e bairros próximos a ele. Também foram identificadas regiões de transição de regimes nas bordas com altos valores diferenciando as características de vizinhança.

6.5 Análise Espacial em Pontos

Para utilizar a Função K, foi realizada a análise de clusters pretendidos através da estimação de Kernel obtendo como resultado 45 clusters com uma separação de no mínimo 4 metros entre eles. O resultado final, conforme a Figura 16 foi a identificação de 27 clusters com tamanhos de elipses proporcionais a 1 desvio padrão.

Figura 16- Determinação de Clusters com Função K A localização dispersa dos clusters identificados pela Função K mostra que existem diversos agrupamentos de pontos com características muito semelhantes tanto em valor (índice de criminalidade).

7 Conclusões

O desenvolvimento da metodologia permitiu determinar as áreas de risco criminal através de ferramentas de análise espacial e estatística relacionando variáveis sócio-econômicas e ocorrências criminais, por setor censitário.

A regressão que melhor modelou a criminalidade nos setores censitários foi a que todos os termos foram transformados em função logarítmica. A modelagem deste fenômeno visto de forma espacial, considera principalmente as características de vizinhança de cada área sendo isso um fator determinante da estratégia de policiamento a ser empregado, já que valores elevados referentes à taxa de criminalidade revelam condições de segurança deterioradas.

A análise de resíduos mostrou que os erros da regressão possuem distribuição normal e média igual a zero e que a distribuição dos erros padronizados ou ajustados pelos erros observados e estimados mostrou que o problema da heterocedasticidade foi eliminado e que não há violação de nenhum pressuposto de regressão.

Além dos testes estatísticos presentes na regressão elaborada no SpaceStat, um dos quesitos que valida o modelo é independência entre os erros calculados e a variável dependente através da análise do valor do Índice

(I) de Moran. O cálculo do I de Moran na regressão logarítimica indicou que não há dependência espacial entre os erros calculados e a variável dependente.

O modelo de regressão adotado se adapta à maioria dos setores censitários como foi detectado no mapa residual, exceto na área que compreende a Represa Municipal onde os valores residuais estão acima do esperado.

Os indicadores de autocorrelação Global e Local indicaram aglomerados de setores censitários nas três variáveis de estudadas: Log10 (índice de criminalidade), Log10 (renda média) e Log10 (instalação sanitária). A aplicação do Moran Global identificou agrupamento de setores muito parecidos nas três variáveis significando que elas estão correlacionadas. O Moran Local mostrou que existem setores censitários acima do padrão aleatório o que conseqüentemente indica uma dependência espacial muito forte destas variáveis nestes setores.

No caso das amostras pontuais deve-se considerar a atribuição da variável índice de criminalidade como Intensidade nos cálculos dos clusters. Isto significa que além da distância entre os eventos, há a intensidade, que funciona como peso na determinação precisa dos clusters. A utilização de ferramentas de análise espacial apresentou vantagens em relação a análise estatística convencional principalmente quando considerou-se a matriz de continuidade espacial (W). A distância entre os centróides, o compartilhamento dos lados e o comprimento da fronteira de cada área são critérios fundamentais na análise espacial, fato que não ocorre na análise estatística convencional.

AGRADECIMENTOS

• à Escola Politécnica da Universidade de São Paulo – EPUSP;

• ao Laboratório de Geoprocessamento e Departamento de Engenharia de Transportes da EPUSP;

• à Fundação de Amparo à Pesquisa do Estado de São Paulo – FAPESP e

• à Delegacia Seccional de São José do Rio Preto/SP. REFERÊNCIAS

ANSELIN, L. SpaceStat users guide: 1.80. California University, Santa Barbara, 1995.

ANSELIN, L. Local indicators of spatial association- LISA. Geographical Analysis, Ohio, v. 27, n. 2, 1996. CARVALHO, M. S. Aplicação de métodos de análise espacial na caracterização de áreas de risco à saúde. 1997. Tese (Doutorado) - Universidade Federal do Rio de Janeiro, Rio de Janeiro.

CRIMESTAT. Users guide: 1.1. Ned Levine & Associates. National Institute of Justice (NIJ), Washington, DC. Julho 2000.

(11)

DEVORE, J. L. et al. Probability and Statistics for Engineering and the Sciences. 5 Edição. Editora Duxbury, 2000.

FUNDAÇÃO INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA/FIBGE. Censo Demográfico 1991 - Resultado do universo relativo às características da população e dos domicílios. Rio de Janeiro: 1993.

GEDODATA. Geodados, Mapeamento e Pesquisa. Desenvolvido pela própria empresa. Apresentando consulta por endereçamento. Disponível em < http://www.geodata.com.br>. São José do Rio Preto/SP, 1999 Acesso em: 20 ago. 2000.

KAHN, T. Instituto Latino Americano das Nações Unidas para a Prevenção do Delito e o Tratamento de Deliquentes - ILANUD. Disponível em:

<http:/www.conjunturacriminal.com.br>

LEVINE, M. D. et al. Estatística: Teoria e Aplicações usando Microsoft Excell (em português). Ed. LTC, 1998, 811p.

Referências

Documentos relacionados

Quanto ao significado, as instanciações vão do significado central da construção transitiva aos subesquemas em que o argumento sujeito não desempenha o papel semântico de agente e

Vitgem», da enferinaiia, antei ioiineiite na Capela Real do Palácio; para Pierpaolo Quieto, esta obra está proxiina da «Assungâo e Anjos» da Galeria Nacional de Parma e do Museu.

As variáveis contextuais consideradas no estudo são variáveis indicadoras regionais – Centro-Oeste, Norte, Nordeste, Sul e Sudeste; proporção de estabelecimentos que receberam

(…) Ora, há de ser evidente que nenhuma descrição sucinta pode incluir todos esses povos, nenhuma definição isolada, por mais abrangente que seja, pode abarcá-los a

Vomitório, sangria, dieta, lenimento, fórmula com substância de origem vegetal e animal, remédio preparado por Semedo.... Dona Maria Juzarte, mulher de Nicolao Pedro, morador à

Resultados da actividade eléctrica máxima normalizada para a 1ª, 2ª, 3ª, 4ª, 5ª e 6ª Fase, para o salto vertical em função dos músculos Tibialis Anterior TA, Gastrocnemius

At this special point of the domain of existence, where the scaled angular momentum reaches its maximal value, the branches of critical EGBd BHs and singular extremal solutions

O curso de medicina da UFAL passou então por três momentos históricos importantes recentes a partir do ano 2004: entre 2004 e 2012 iniciou a adoção de cotas