• Nenhum resultado encontrado

Algoritmo 5 – Expansive Network

5.2 Configuração dos experimentos

Para a realização dos experimentos foram escolhidos três áreas de estudos com diferentes extensões territoriais e predomínio de diferentes populações urbanas. As áreas selecionadas são: a AIS 2, que possui uma área de 13,25 km2e é composta por um maior número

de populações residentes, AIS 4 com uma área de 22,11 km2e que reúne bairros centrais com

uma grande quantidade de comércios e uma grande população flutuante, e a AIS 7, que possui uma extensão territorial de 66,61 km2 e possui em sua área uma grande extensão com baixa presença de ruas.

De acordo com o estudo realizado por Felson e Poulsen (2003), o crime tem uma grande variação de acordo com a hora do dia, porém o número de incidentes diminui considera- velmente se a janela de tempo for fragmentada em horas. Com o objetivo de utilizar a informação

do tempo para aprender a dinâmica do crime ao longo dia, além de manter uma quantidade considerável de eventos para criação dos mapas de hotspots e coincidir com as trocas dos turnos das patrulhas, foram criadas janelas de tempo para os experimentos e elas foram separadas em quatro períodos de seis horas: madrugada (de 00:00h até 5:59h), manhã (de 06:00h até 11:59h), tarde (de 12:00h até 17:59h) e noite (de 18:00h até 23:59h), como mostrado no Quadro 4. Cada período é analisado separadamente para identificar a dinâmica do crime e criar mapas de hotspots mais precisos.

Quadro 4 – Separação em períodos de horas. Turno do dia Hora inicial Hora final

Madrugada 00:00h 05:59h

Manhã 06:00h 11:59h

Tarde 12:00h 17:59h

Noite 18:00h 23:59h

Fonte: elaborado pelo autor.

Para a realização dos experimentos é necessário definir uma data de referência, que será utilizada para a determinação das etapas de criação e teste dos mapas de hotspots. Considerando a data de referência, são criadas três janelas de dias separadas em: geração dos hotspots, validação dos parâmetros e período de teste. A Figura 23 mostra como as janelas de dias são definidas considerando a data de referência. Na janela de geração, os dados filtrados são utilizados para construir os primeiros mapas de hotspots; com os dados filtrados na janela de validação, é realizada uma avaliação dos mapas criados anteriormente utilizando as métricas PAI e nPAI, de acordo com o algoritmo utilizado, para todos os parâmetros testados; com os resultados do conjunto de validação, são selecionados os parâmetros que resultaram nos resultados mais altos, e os dados de validação são unidos com dados de geração para a criação de um novo mapa de hotspots; esse novo mapa de hotspots não sofre alterações e é avaliado no conjunto de teste, com exceção do algoritmo i-PHAR, que atualiza o mapa de hotspots para cada novo dia de registro de eventos no período de validação e teste, e tem a possibilidade de criar regiões de hotspots diferentes, de acordo com possíveis mudanças nas concentrações dos crimes. A quantidade de dias necessários para definir janela de dias pode variar de acordo com a região de estudo, ao longo do tempo e não existe na literatura um método cientificamente comprovado para definir o melhor valor. Desta forma, inspirado na estratégia realizada por Chainey et al. (2008), a quantidade de dias da janela de dias utilizadas para a criação dos mapas iniciais de hotspots, são separadas em 3 períodos distintos: 2 meses, 1 ano e 2 anos. O período

Figura 23 – Representação das janelas de dias.

Janela 3 Teste

Período em que são realizados os testes de predição, calculando a

métrica PAI.

Janela 2 Validação

Período em que são testados diferentes parâmetros, de acordo

com a métrica PAI.

Janela 1 Geração

Período em que são gerados os primeiros mapas de hotspots.

Data de referência Fluxo temporal dos dias

Fonte: elaborado pelo autor.

Tabela 1 – Quantidade de dados utilizados nas janelas de geração dos hotspots.

AIS Janela de dias Madru. Manhã Tarde Noite AIS 2 2 meses1 ano 24466 100484 43188 124545

2 anos 407 963 879 1028

AIS 4 2 meses1 ano 28164 110683 111719 151884

2 anos 583 1565 1554 1752

AIS 7 2 meses1 ano 25254 177778 154915 1060176

2 anos 422 1428 1691 2160

Fonte: elaborado pelo autor.

de validação e teste são fixados em 2 meses cada, gerando três experimentos, e o resultado final é apresentado através da média dos 3 experimentos. Desta maneira, reduz-se a possibilidade de resultados anômalos, caso fosse utilizado apenas um período de dias.

A data de referência escolhida para os experimentos foi 1 de novembro de 2018. Desta forma, foi possível utilizar os dados mais recentes do conjunto de dados disponíveis para a janela de teste (2 meses), excluindo o mês de dezembro, que devido às festas e feriados escolares pode ter um comportamento diferente dos outros meses, prejudicando a avaliação dos experimentos. Para evitar também o mês de julho, que também é um período de férias escolares, as janelas de geração e validação dos experimentos realizados utilizando 2 meses, são criadas nas mesmas datas de início e fim. As datas das janelas de dias são mostradas no Quadro 5. A quantidade de dados utilizados nos experimentos, separados pelo período de tempo, para cada área de estudo a partir da data de referência, são mostrados na Tabela 1 para a janela de geração, e na Tabela 2 para as janelas de validação e teste.

Nos algoritmos PHAR, i-PHAR e Subgraph Hotspots Approximated to Road Network (SHAR) o período de validação é utilizado para selecionar os melhores parâmetros do fator de

Tabela 2 – Quantidade de dados utilizados nas janelas de valida- ção e teste dos hotspots.

AIS Janela de dias Madru. Manhã Tarde Noite AIS 2 ValidaçãoTeste 6655 10074 12288 124137 AIS 4 ValidaçãoTeste 6462 110113 111181 151188 AIS 7 ValidaçãoTeste 5466 177161 154202 176242

Fonte: elaborado pelo autor.

Quadro 5 – Data inicial e final das janelas de dias. Janela Dias Data inicial Data final Geração 1 2 meses 01/08/2018 30/09/2018 Geração 2 1 ano 01/08/2017 31/07/2018 Geração 3 2 anos 01/08/2016 31/07/2018 Validação 2 meses 01/08/2018 30/09/2018 Teste 2 meses 01/10/2018 30/11/2018

Fonte: elaborado pelo autor.

ponderação ω e bandwidth do KDE, através da estratégia de grid search. Nos algoritmos do KDE com grade e na estrategia do Expansive Network, os resultados são mostrados para todos os parâmetros testados, e o período de validação é utilizado como um complemento da janela inicial de geração dos hotspots.