• Nenhum resultado encontrado

Reconhecimento de padrões de criminalidade no município do Rio de Janeiro segundo a Análise de Componentes Principais Fuzzy

N/A
N/A
Protected

Academic year: 2021

Share "Reconhecimento de padrões de criminalidade no município do Rio de Janeiro segundo a Análise de Componentes Principais Fuzzy"

Copied!
9
0
0

Texto

(1)

*

Bolsista de Pós-Graduação CAPES

Reconhecimento de padrões de criminalidade no município do Rio de

Janeiro segundo a Análise de Componentes Principais Fuzzy

Rafael Teixeira Silva¹

Regina Serrão Lanzilotti2 Universidade do Estado do Rio de Janeiro (UERJ)

20550-013,Rio de Janeiro, RJ

rafael.teixeira.silva@hotmail.com¹ / reginalanzilotti@terra.com.br²

Resumo. A política desenvolvimentista prioriza esforços para concentrar as iniciativas governamentais na segurança

pública da cidade do Rio de Janeiro devido ao aumento da criminalidade. O Instituto de Segurança Publica (RJ) disponibiliza estatísticas de registros de crimes nas AISP - Áreas Integradas de Segurança Pública. Este trabalho utilizou os dados dos anos de 2007 e 2008 para as variáveis - grupos de crimes. Objetivou-se efetuar a mineração de dados segundo a Análise de Componentes Principais Fuzzy - ACPF para reconhecimento de padrões de criminalidade em confronto com a Análise de Componentes Principais clássica. O método ACPF sob a ótica do algoritmo Fuzzy

1-Lines foi desenvolvido no aplicativo R 2.215 para dez variáveis e dezoito observações, mostrando-se viável. A

contribuição da variância total foi mais explicitada na ACPF (99%) em comparação a ACP (84%). Os gráficos de dispersão possibilitaram a visualização, ressaltando os crimes e as AISP de forma discriminada.

Palavras-chave: Mineração de Dados; Análise de Componentes Principais Fuzzy; Reconhecimento de Padrões

1 Introdução

Atualmente, a política desenvolvimentista dá prioridade a esforços no sentido de concentrar as iniciativas governamentais no contexto da segurança pública, em especial na cidade do Rio de Janeiro devido ao aumento da criminalidade, problema ainda maior se comparado a outros países [1].

O Instituto de Segurança Publica do governo do Rio de Janeiro disponibiliza as estatísticas oficias de registros de crimes nas AISP - Áreas Integradas de Segurança Pública, criadas em 1999, no intuito de obter um combate mais efetivo, Quadro 1.

Quadro 1:Identificação das AISP

(continua)

AISP Bairros

AISP 1 Catumbi, Cidade Nova, Estácio, Rio Comprido e Santa Tereza

AISP 2 Catete, Cosme Velho, Flamengo, Glória, Laranjeiras, Botafogo, Humaitá

e Urca

AISP 3

Cachambi, Méier, Abolição, Encantado, Piedade, Pilares, Engenho Novo, Jacaré, Jacarezinho, Riachuelo, Rocha, Sampaio, São Francisco Xavier, Água Santa, Engenho de Dentro, Lins de Vasconcelos, Todos os Santos, Del Castilho, Engenho da Rainha, Inhaúma, Maria da Graça e Tomás Coelho

AISP 4 Cajú, Mangueira, São Cristóvão e Vasco da Gama;

AISP 5 Centro (parte), Gamboa, Santo Cristo e Saúde

AISP 6 Maracanã, Praça da Bandeira, Tijuca (parte), Alto da Boa Vista, Andaraí, Grajaú e Vila Isabel

AISP 9

Campinho, Cascadura, Praça Seca, Quintino de Bocaiúva, Bento Ribeiro, Marechal Hermes, Oswaldo Cruz, Coelho Neto, Colégio (parte), Honório Gurgel e Rocha Miranda

AISP 13 Centro (parte) e Paquetá

AISP 14

Anchieta, Guadalupe, Parque Anchieta, Ricardo de Albuquerque, Campo dos Afonsos, Deodoro, Jardim Sulacap, Magalhães Bastos, Realengo, Vila Militar, Bangu, Gericinó, Padre Miguel e Senador Camará

AISP 16

Brás de Pina (parte), Complexo do Alemão, Olaria, Penha, Penha Circular (parte), Cordovil, Jardim América, Parada de Lucas e Vigário Geral

(2)

Quadro 1:Identificação das AISP

(conclui) AISP 17

Bancários, Cacuia, Cidade Universitária, Cocotá, Freguesia, Galeão, Jardim Carioca, Jardim Guanabara, Moneró, Pitangueira,Portuguesa, Praia da Bandeira, Ribeira, Tauá e Zumbi

AISP 18 Anil, Cidade de Deus, Curicica, Gardênia Azul, Jacarepaguá, Taquara, Freguesia, Pechincha, Tanque e Vila Valqueire

AISP 19 Copacabana (parte) e Leme

AISP 22 Benfica, Bonsucesso, Higienópolis, Manguinhos, Maré e Ramos

AISP 23 Ipanema, Leblon, Gávea, Jardim Botânico, Lagoa, Rocinha, São

Conrado e Vidigal

AISP 27 Paciência, Santa Cruz e Sepetiba

AISP 31 Barra da Tijuca, Itanhangá, Joá, Recreio do Bandeirantes, Grumari, Vargem Grande, Vargem Pequena e Camorim

AISP 39 Campo Grande, Cosmos, Inhoaíba, Santíssimo, Senador Vasconcelos, Barra de Guaratiba, Guaratiba e Pedra de Guaratiba

Os batalhões da Polícia Militar (PM) são atendidos pelas delegacias monitoradas pela Secretaria de Segurança Pública do Rio de Janeiro (SESP/RJ) através do Instituto de Segurança Pública (ISP), que estão na mesma área da divisão territorial do censo, dessa forma facilitou a análise estatística por área. Este trabalho utilizou os dados correspondentes aos registros de ocorrências dos anos de 2007 e 2008 por tipo de criminalidade e as variáveis utilizadas correspondem a grupos de crimes das AISP, porem foram utilizados apenas os constantes do Quadro 2.

Quadro 2:Identificação das variáveis

Variáveis Crimes

HDLRLM Homicídio Doloso Latrocínio

Lesão Corporal Seguida de Morte

RV Roubo de Veículos

FV Furto de Veículos

RO Roubos

LD Lesão Corporal Dolosa

RC Roubo de Carga RL Roubo em Coletivo AM Ameaças PD Pessoas Desaparecidas FU Furtos

O objetivo deste trabalho é efetuar a mineração de dados segundo a Análise de Componentes Principais Fuzzy para reconhecimento de padrões de criminalidade nas AISP, em confronto com a Análise de Componentes Principais clássica [2].

2 Desenvolvimento

A Análise de Componentes Principais Fuzzy delineiam grupos fuzzy que são importantes para identificar a estrutura de dados [3]. O algoritmo proposto para agrupamento fuzzy estabelece uma função objetivo. Seja X = {x¹,x²,..., xn} Rp sendo um conjunto finito de vetores característicos, onde n é o número de objetos e p é o número de variáveis, Xkj = [x1j,x2j,...,xpj]t e L = [L1,L2,...Ls] sendo s-uplas de protótipos (suporte) que, cada um caracteriza um dos s clusters compondo uma subestrutura dos dados. Uma partição de X em s grupos fuzzy será desenvolvida pela minimização da função objetivo [4]:

(3)

.

(1) onde P = {A¹, A²,...As} é uma partição fuzzy, Ai(Xj)  [0,1], representando o grau de pertinência dos pontos Xj dos clusters Ai [5], e d(xj,Li) é a distância do ponto Xj ao protótipo do cluster Ai, definido pela norma da distância Euclidiana:

.

(2) O conjunto ótimo fuzzy será determinado usando um método iterativo, onde a função J é sucessivamente minimizada em relação a A e L.

Supondo que L é dado, o mínimo da função J(●,L) é obtida por:

.

i = 1,2,...,s. (3) Para um P, o mínimo da função J(P, ● ) é obtido por:

.

i = 1,2,...,k. (4) A fórmula acima permite calcular cada componente P de Li (o centro do cluster i). Cada componente k é uma média ponderada do kth componente correspondente a todos os elementos dos conjuntos de dados. Elementos com maior grau de pertinência no cluster i (ou seja, perto do centro do cluster i) irá contribuir significativamente para esta média ponderada, enquanto os elementos com menor grau de pertinência (longe do centro) quase não irá contribuir.

A forma de um cluster depende da escolha dos protótipos. As associações serão obtidas de acordo com a medida de distância e diferentes algoritmos de lógica fuzzy são feitos desta forma. Se o protótipo de um cluster é um ponto (o centro do cluster), vai dar aglomerados esféricos, se o protótipo é uma linha, resultará em aglomerados tubulares e assim por diante. Em vista da forma linear por consequência de modelos lineares fuzzy, uma escolha de agrupamento fuzzy foi o fuzzy n-means (FNM) generalizada, em que clusters, lineares ou planares, são permitidos tal como protótipos a serem alcançados.

Os grupos fuzzy são caracterizados por protótipos lineares, denotados por L(u,v), onde v é o centro da classe e u é a principal direção, com ǁuǁ = 1. Esta linha é chamada de primeira componente principal dos conjuntos e, esta direção é obtida pelo autovetor u associado ao maior autovalor,Por exemplo, a matriz de covariância (5) é obtida por uma generalização rápida de conjuntos fuzzy da matriz de covariância clássica.

.

(5) O algoritmo aplicado neste artigo permite a determinação dos valores dos A(xj) que melhor descrevem os grupos fuzzy e a relação dos A com seus protótipos lineares (a primeira componente principal). O algoritmo é uma natural extensão do fuzzy 1-lines algorithm.

Para obter a função critério, no caso de um único cluster, nós temos que determinar uma partição fuzzy

(4)

protótipo hipotético e o ponto xj é constante e igual a α/(1-α), onde α é uma constante real dentro do intervalo (0,1). Como consequência a função critério torna-se [6].

.

(6)

O protótipo L que minimiza a função J(A,L,α) é dada por

. (7) Onde . (8) O α representa o grau de pertinência do ponto mais afastado (outlier) para a primeira componente principal. Uma vez que é um parâmetro de entrada, necessita-se determinar o α mais adequado. O interesse é encontrar graus de pertinência fuzzy que contribuam para produzir uma melhor componente principal para o conjunto de dados. O autovalor corresponde associado a dispersão dos dados ao longo da componente, o α será escolhido de modo que maximize os autovalores da primeira componente principal. Como se trata de dados reais, que variam, um α fixo não é bom, em vez disso, será feito mudanças no α entre 0 e 1, para assim escolher o melhor, selecionando o α que maximiza a proporção do maior autovalor em relação aos demais.

Os passos relativos a Análise de Componentes Principais Fuzzy são:

1. Determinar o melhor valor de α, sendo este entre 0 e 1. A cada iteração que muda o valor de α, minimize a função objetivo (equação 6) e com os graus de pertinência ideais, o maior autovalor da matriz C (equação 5), selecionando o valor de α, de acordo com o autovalor máximo.

2. Padronização das variáveis, tornando-as com média zero e variância um.

3. Calcular a covariância usando a matriz C (equação 5). Realizado o passo 2, a matriz C será de correlação.

4. Encontrar os autovalores e seus autovetores correspondentes.

5. Determinar um novo conjunto fuzzy, gerando novas pertinências, usando a equação 8.

6. Se com o novo conjunto de pertinências fuzzy, a norma da diferença entre os novos graus de pertinência e os graus de pertinência gerados na iteração anterior for menor que um erro predefinido (no caso 0,00001), então encerra as iterações e vai para o passo 7, senão, se a diferença for maior, calcula-se novos graus de pertinência e volta para o passo 3.

7. Usando os graus de pertinência fuzzy determinados acima, recalcula-se a matriz de covariância C (equação 5) e determina-se os autovalores e autovetores, identificam as componentes principais fuzzy e os valores de dispersão, respectivamente.

Este algoritmo foi implementado no aplicativo R 2.215, Ambiente R, que apresenta código fonte aberto, podendo ser modificado ou implementado com novos procedimentos desenvolvidos por qualquer usuário, a qualquer momento, também existe um grande número de colaboradores das mais diversas áreas do conhecimento. O aplicativo R torna-se uma importante ferramenta na análise de dados com o uso de pacotes de estatística multivariada e apresenta facilidade na elaboração de diversos tipos de gráficos com

(5)

pleno controle sobre o gráfico criado. O R, de domínio público, pode ser obtido gratuitamente em http://cran.r-project.org, onde é apresentado em versões de acordo com o sistema operacional UNIX, Windows ou Macintosh. Sendo o R uma linguagem de programação orientada a objetos pode-se criar suas próprias funções e sua própria rotina para análise de dados. Outro atributo do aplicativo R é a capacidade de interagir com outros programas estatísticos e no manuseio de banco de dados [7].

A seguir está o passo a passo descrito anteriormente.

# O “a” é o  do passo 1, 0.1 foi o melhor. O “e” é o erro máximo predefinido no passo 6. a<- 0.1

e<- 0.00001

# A “tabela2007padrao” é a matriz de dados com suas n variáveis #(colunas da matriz de dados)

# padronizadas (normalizadas) e com seus m protótipos (linhas da # matriz de dados).

m<- 18 n<- 10

tab<- (tabela2007padrao)^2

# O “d²” representa a equação (2) ao quadrado, esse primeiro “L” é um # vetor nulo, pois os dados estão

# padronizados e centrados na média que é 0. for (w in 1:m) {

for (i in 1:n) {

d²[w] <- d²[w] + ((tabela2007padrao[w,i]) - L[i])^2 }

}

# O “A” representa as primeiras pertinências geradas, conforme a # equação (8).

for (w in 1:18) {

A[w]<- (a/(1-a))/((a/(1-a))+d²[w]) }

# O “E” é o erro dito no passo 6 do algoritmo e o “k” e o número # máximo de iterações.

while ((E > e) && (k < 50)) {

# O “As” representa o divisor da equação (7). for (w in 1:m) {

As<- As + (A[w])^2 }

# O novo “L1” representa a equação (7). for (i in 1:n) {

for (w in 1:m) {

L1[i] <- L1[i] + ((A[w])^2 * tabela2007padrao[w,i]) }

}

L1<- L1/As

# O novo “d²1” representa a equação (2) ao quadrado, usando o novo # ”L1”. for (w in 1:m) { for (i in 1:n) { d²1[w] <- d²1[w] + ((tabela2007padrao[w,i]) – L1[i])^2 } }

# O “A1” representa novas pertinências geradas, conforme equação (8). for (w in 1:m) {

A1[w]<- (a/(1-a))/((a/(1-a))+d²1[w]) }

# O “Ad²” representa a primeira parcela da adição da equação (6). for (w in 1:m) {

Ad²<- Ad² + ((A1[w])^2)*d²1[w] }

(6)

# O “Aca” representa a segunda parcela da adição da equação (6). for (w in 1:m) {

Aca<- Aca + ((1 - A1[w])^2 * (a/(1-a))) }

# O “J1” representa a função J que é a equação (6). J1[k]<- Ad² + Aca

# É feito um teste para ver se a função J (equação (6)) esta sendo # minimizada a cada iteração.

if (J1[k] > J1[k-1]) { break }

# O “E” representa o passo 6 do algoritmo. for (w in 1:m) {

E<- E + (A1[w]-A[w])^2 }

E<- sqrt(E)

# O “tab1” representa os dados fuzificados por suas respectivas # pertinências.

for (w in 1:m) {

As1<- As1 + (A1[w])^2 }

tab1<- tabela2007padrao for (w in 1:m) {

for (i in 1:n) {

tab1[w,i]<- (tab1[w,i] * (A1[w])^2) }

}

tab1<- tab1/As1

# A função “prcomp” faz a Análise de Componentes Principais clássica, # mas como os dados estão

# fuzificados ela faz a Análise de Componentes Principais Fuzzy. ACPF<- prcomp(tab1)

print(summary(ACPF))

# A função “cor” constrói a matriz de correlação clássica, mas como os # dados estão fuzificados ela efetua a matriz de correlação fuzzy,

# então “Cor1” representa a equação (5). Cor1<- cor(tab1)

# É adicionado um ao “k” para ir para a próxima iteração e as

# pertinências (“A”) são atualizadas por suas novas pertinências #(“A1”). k<- k+1 for (w in 1:m) { A[w]<- A1[w] } }

A aplicação do método proposto impôs que os crimes fossem padronizados segundo unidade do desvio padrão, (passo 2), para as 18 AISP e os resultados se encontram na Tabela 1:

Tabela 1: Valores padronizados referentes aos tipos de crimes

(continua) AISP HDLRLM RV FV RO LD RC RL AM PD FU 1 -0,6196 -0,7641 -1,0220 -0,8501 -1,0054 -0,8116 -0,7681 -1,0760 -0,8303 -1,4487 2 -0,9284 -0,6329 0,6475 -0,4536 -0,9759 -0,8797 -0,3773 -0,9033 -1,0375 0,7208 3 0,2388 1,4688 0,3367 1,5451 -0,1053 1,0783 0,7767 -0,0460 0,5629 0,4911 4 -0,9284 -0,7022 -0,9598 -0,7456 -1,2268 0,1078 -0,4437 -1,2496 -0,9685 -1,2952 5 -0,8296 -0,8194 -1,1006 -0,4154 -0,9902 -0,5392 -0,3036 -0,9452 -0,5770 0,5639 6 -0,5023 0,5195 0,3641 0,6426 -0,6501 -0,3689 -0,2040 -0,6260 -0,8418 0,9453

(7)

9 1,7394 0,1640 0,3440 0,5685 1,4566 0,6016 0,4891 2,0113 1,4034 0,4549 13 0,0350 -0,8333 -0,2357 -0,9103 0,4467 -0,2497 -0,8603 0,1049 -0,4388 -0,1606 14 1,8815 2,7174 1,7776 2,6415 1,6095 3,0363 2,2220 1,4514 2,2900 1,5181 16 -0,7616 -0,9098 -1,1043 -1,1917 0,1846 -0,3859 -1,1294 0,1249 -0,1740 -1,1457 17 -0,5887 -0,9120 -0,8885 -1,1711 -0,2272 -0,7945 -1,1626 0,2200 -0,3582 -1,0947

Tabela 1: Valores padronizados referentes aos tipos de crimes

(continua) 18 0,1338 -0,1019 2,5219 0,2290 0,9899 -0,3519 2,0671 1,2561 0,6896 2,3285 19 -0,9654 -0,8901 -1,1262 -0,6594 -1,1535 -0,8967 -0,8898 -1,1414 -1,0836 0,0142 22 1,1157 1,3012 0,5799 0,8368 0,8051 -0,1476 -0,0455 0,4956 0,4363 -0,1065 23 2,0976 0,6070 0,6329 0,7058 2,0110 0,8229 1,3998 1,6110 1,8985 0,2475 27 0,0350 0,5939 0,0349 0,3621 -0,3180 1,2996 0,1278 -0,4376 0,1714 -0,6566 31 -0,8419 -0,6446 -0,6526 -0,8517 -0,9974 -0,9478 -0,8640 -1,0063 -0,9224 -1,0943 39 -0,3108 -0,1616 -0,1497 -0,2825 0,1464 -0,5732 -0,0344 0,1563 -0,2200 -0,2822

Os valores padronizados permitiram indicar a incidência de cada tipo de crime segundo a observação do valor máximo padronizado constantes da Tabela 1, Quadro 3.

Quadro 3: Incidências de crimes nas AISP

AISP Sigla Crime

1 HDLRLM Violento 13 LD 16 LD 17 AM 31 RV 39 AM 9 AM 22 RV 23 HDLRLM 2 FU Contra o patrimônio 4 RC 5 FU 6 FU 19 FU 3 RO 14 RC 18 FV 27 RC

Inicialmente foi realizada a Análise de Componentes Principais (ACP) para os crimes já padronizados, pois o intuito era confrontar com a Análise de Componentes Principais Fuzzy (ACPF), proposta deste estudo.

Na aplicação da ACP os resultados mostraram que duas componentes principais explicavam 84,88% da variabilidade total, sendo 73,55% referente a primeira componente e 11,33%,a segunda. Na busca de alternativa para melhorar o agrupamento, foi aplicado a extensão do algoritmo Fuzzy 1-Lines Algorithm. Na determinação do melhor , foi adotado  = 0,1, verificando se o valor da função objetivo (equação 1) era minimizada e aumentava a contribuição da variabilidade advinda por duas componentes principais, o que convergiu para estabelecer os graus de pertinência otimizados para cada AISP, segundo a precisão de 10-5, obtida pela norma da distância euclidiana entre as pertinências obtidas nas duas últimas iterações. A primeira componente principal fuzzy explica 99% da variabilidade, enquanto na clássica, as duas primeiras componentes explicaram menos de 85%.

(8)

Na Figura 1, a Análise de Componentes Principais clássica não permitiu reconhecer padrões para as AISP de forma clara, porque não discriminou grupos, enquanto no método fuzzy, percebeu-se agrupamentos. A AISP 39 (Campo Grande, Cosmos, Inhoaíba, Santíssimo, Senador Vasconcelos, Barra de Guaratiba, Guaratiba e Pedra de Guaratiba) apresentou valor de pertinência máximo, o que significa ser a primeira mais próxima da média robusta (Equação 4) e a AISP 13 (parte do Centro e Paquetá), enquanto a segunda, se alocaram nos quadrantes superior direito e no inferior esquerdo, respectivamente. As AISP 16 (Brás de Pina (parte), Complexo do Alemão, Olaria, Penha, Penha Circular (parte), Cordovil, Jardim América, Parada de Lucas e Vigário Geral ) e a AISP 17 (Bancários, Cacuia, Cidade Universitária, Cocotá, Freguesia, Galeão, Jardim Carioca, Jardim Guanabara, Moneró, Pitangueira,Portuguesa, Praia da Bandeira, Ribeira, Tauá e Zumbi) se agregaram, posicionadas abaixo do maior grupo localizado no quadrante esquerdo superior. Acima deste quadrante, encontra-se a AISP 6 (Maracanã, Praça da Bandeira, parte da Tijuca, Alto da Boa Vista, Andaraí, Grajaú e Vila Isabel).

-2 0 2 4 6 -1 .5 -1 .0 -0 .5 0 .0 0 .5 1 .0 1 .5 PC1 P C 2 0.0 0.2 0.4 0.6 0.8 -0 .0 0 4 -0 .0 0 3 -0 .0 0 2 -0 .0 0 1 0 .0 0 0 PC1 P C 2

Fig. 1:Visualização pelas duas componentes principais clássica e fuzzy das AISP, respectivamente.

Nota: PC1 (ACP): -2.8499109 -1.6292464 2.0089874 -2.6307745 -1.9459842 -0.3237213 2.9678557 -1.0048705 6.7018953 -2.0152453 -2.1727716 2.9807576 -2.8338570 1.7142932 3.9087833 0.4189492 -2.7671193 -0.5280208 PC2 (ACP): -0.41629597 1.62623645 0.95111467 0.04505475 0.78691331 1.69915344 -1.59767190 -0.80932371 0.54076007 -1.50038590 -1.27091593 1.60875310 0.59990676 -0.41879405 -1.61744950 0.03725221 -0.02735693 -0.23695087 Nota: PC1 (ACPF): -0.04696931 -0.04712049 -0.04762041 -0.04720751 -0.04706523 -0.04755795 -0.04749193 -0.04453723 -0.04744750 -0.04636130 -0.04606745 -0.04745272-0.04708548 -0.04760828 -0.04747109 -0.04784817 -0.04679795 0.79971001 PC2 (ACPF): 0.0001794731 0.0002980263 0.0004870579 0.0002369304 0.0001839821 0.0006750345 0.0003337671 -0.0038404441 0.0003525339 -0.0004382034 -0.0004791719 0.0003754595 0.0001866947 0.0004878427 0.0003537409 0.0004397472 0.0001530394 0.0000144897

A Figura 2 apresenta o gráfico de dispersão relativo aos crimes, tendo as duas primeiras componentes principais como coordenadas, tanto para a ACP quanto para a ACPF. A implementação da ACP gerou 4 grupos. No grupo 1 foram agregados crimes de violência (HDLRLM, PD, AM e LD), enquanto nos demais grupos, crimes contra o patrimônio. No grupo 2 apenas o crime RC; no grupo 3, FV, RO, RL e RV e no grupo 4, somente o FU.

Quando aplicada a ACPF, observou-se a discriminação do mesmo número de grupos. Nos grupos 1 e 2 foram identificados crimes contra o patrimônio, sendo que no grupo 1, RV, RO e RL, enquanto no grupo 2, FV, PD e FU. Nos grupos 3 e 4, crimes com violência, sendo no grupo 3, AM e LD, e no 4, HDLRLM e RC.

A similaridade entre os agrupamentos é observada quando se agregam grupos dois a dois, juntando o grupo 1 com o grupo 2 da ACP há bastante semelhança com a agregação dos grupos 3 e 4 da ACPF. Comportamento análogo é verificado para os grupos 3 e 4 da ACP com os grupos 1 e 2 da ACPF.

ACP

(9)

-0.34 -0.32 -0.30 -0.28 -0.26 -0 .4 -0 .2 0 .0 0 .2 0 .4 Comp.1 C o m p .2 -0.6 -0.4 -0.2 0.0 0.2 -0 .2 0 .0 0 .2 0 .4 0 .6 Comp.1 C o m p .2

Fig. 2:Visualização pelas duas componentes principais clássica e fuzzy dos crimes, respectivamente.

Nota: Comp1 (ACP): -0.3345018 -0.3151735 -0.3058256 -0.3284442 -0.3202837 -0.2992216 -0.3379289 -0.3118253 -0.3493474 -0.2485549

Comp2 (ACP): 0.32349340 -0.15451892 -0.34646263 -0.24196781 0.37866971 0.03945576 -0.23099137 0.36343258 0.26364740 -0.54128868

Nota: Comp1 (ACPF): -0.36415615 -0.18913230 -0.17532090 -0.33079679 0.17162264 -0.67165549 -0.03999133 0.18331146 -0.25766840

-0.33058207

Comp2 (ACPF): -0.28158611 0.47753331 0.07164851 0.43833078 -0.21244979 -0.29844074 0.58781858 0.02021582 0.09573019 -0.07809222

3 Conclusão

O método proposto mostrou viabilidade para reconhecer padrões de criminalidade, apesar de se ter dez variáveis e apenas dezoito observações. Acresce a possibilidade de apontar as AISP que se encontravam mais próximas da média robusta, obtida em função da ponderação das pertinências advindas da constante

. O gráfico de dispersão possibilitou a visualização tanto para os crimes quanto para as AISP de forma discriminada.

A mineração de dados sob a forma multivariada no contexto da criminalidade mostrou que a contribuição da variância total foi mais explicitada na ACPF (99%) em comparação a ACP (84%), apesar de terem sido observados outliers nos valores padronizados no banco de dados por tipo de criminalidade. O uso da Análise de Componentes Principais Fuzzy contribui para explicar algumas das discrepâncias relativas às variáveis quando da análise multivariada, sobre maneira para a eficiência, ajuste de adequabilidade preditiva e robustez.

Referências

1. TEIXEIRA SILVA, R.: ESTUDO DAS ASSOCIAÇÕES ENTRE CRIMES E ÁREAS INTEGRADAS DE SEGURANÇA PÚBLICA NO MUNICÍPIO DO RIO DE JANEIRO – ÁREAS COM UPP. Projeto Final (Bacharel) - Curso de Estatística, Departamento de Estatística, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, (2011) 2. MORRISON, D.F.: Multivariate Statistical Methods. 2ed. Singapore, McGraw-Hill International Editions (1988) 3. CUNDARI, Thomas R.; SÂRBU, Costel; POP, Horia F.. Robust Fuzzy Principal Component Analysis (FPCA) A

Comparative study Concerning interaction of carbon-hidrogen bonds with molybdenum-oxo bonds. J. Chem. Inf. Comput. Sci., Cluj-napoca, 1363-1369, (2002)

4. SÂRBU, C.; POP, H.F.: Principal component analysis versus fuzzy principal component abalysis A case study: the quality of danube water (1985-1996). Talanta, Brussels. 1215-1220 (2004)

5. ZADEH, L. A., POLAK, E.: System Theory 1st ed. USA. Mc Graw Hill. Inc (1969)

6. SÂRBU, C.; POP, H.F.: Fuzzy robust estimation of central location. Talanta, Brussels, 125-130 (2000) 7. Software Livre R: aplicação estatística.:

http://www2.ufersa.edu.br/portal/view/uploads/setores/137/Apostilas%20e%20Tutoriais%20-%20R%20Project/Apostila%20R%20-%20GenMelhor.pdf (2012)

ACP ACPF 1 4 2 3 4 4 4 2 1 3

Referências

Documentos relacionados

Detectadas as baixas condições socioeconômicas e sanitárias do Município de Cuité, bem como a carência de informação por parte da população de como prevenir

Os Oficiais de Registro Civil das Pessoas Na- turais do Estado de São Paulo também têm competência para os atos notariais de reconhecimento de firma, autenticação de cópia

18:00 h).Embora em estudos realizados por Andrade Netto, 2005, com mudas de café em ambiente totalmente controlado, foi verificado que a atividade da RN determinada a pleno

Ainda que hajam progressos marginais em fontes de energias alternativas, a economia energética do mundo industrial é tão profundamente dependente dos combustíveis fósseis

Vai dizer-me que estamos arruinados ou que se vai separar da mãe, ou que vou ter dois irmãos gémeos (10), ou que este ano não podemos ir de férias, porque o avô está com uma

[40] Uma hipótese implícita quando o método de captura-recaptura é usado para estimar o tamanho de uma população é a de que quando os indivíduos são marcados no processo de

Os maiores coeficientes da razão área/perímetro são das edificações Kanimbambo (12,75) e Barão do Rio Branco (10,22) ou seja possuem uma maior área por unidade de

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam