• Nenhum resultado encontrado

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ DAINF - DEPARTAMENTO ACADÊMICO DE INFORMÁTICA CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ DAINF - DEPARTAMENTO ACADÊMICO DE INFORMÁTICA CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO"

Copied!
63
0
0

Texto

(1)

UNIVERSIDADE TECNOL ´

OGICA FEDERAL DO PARAN ´

A

DAINF - DEPARTAMENTO ACADˆ

EMICO DE INFORM ´

ATICA

CURSO DE BACHARELADO EM SISTEMAS DE INFORMA ¸

C ˜

AO

PEDRO HENRIQUE DE VARGAS VASCONCELOS

VICTOR GEORGE PRZIBICIEM DE MATTOS

VISUALIZA ¸

C ˜

AO DOS DADOS ABERTOS DA POL´

ICIA

RODOVI ´

ARIA FEDERAL SOBRE ACIDENTES NAS

RODOVIAS BRASILEIRAS

TRABALHO DE CONCLUS ˜

AO DE CURSO

CURITIBA

2019

(2)

PEDRO HENRIQUE DE VARGAS VASCONCELOS

VICTOR GEORGE PRZIBICIEM DE MATTOS

VISUALIZA ¸

C ˜

AO DOS DADOS ABERTOS DA POL´

ICIA

RODOVI ´

ARIA FEDERAL SOBRE ACIDENTES NAS

RODOVIAS BRASILEIRAS

Trabalho de conclus˜ao de curso apresentado ao Curso de Bacharelado em Sistemas de Informa¸c˜ao da Universidade Tecnol´ogica Federal do Paran´a, como requisito parcial para a obten¸c˜ao do t´ıtulo de Bacharel.

Orientador: Prof.a Dr.a N´adia Puchalski Kozievitch DAINF - Departamento Acadˆemico de In-form´atica - UTFPR

CURITIBA

2019

(3)

Ministério da Educação

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Curitiba

Diretoria de Graduação e Educação Profissional

Departamento Acadêmico de Informática

Coordenação do Curso de Bacharelado em Sistemas de Informação

TERMO DE APROVAÇÃO

VISUALIZAÇÃO DOS DADOS ABERTOS DA POLÍCIA RODOVIÁRIA

FEDERAL SOBRE ACIDENTES NAS RODOVIAS BRASILEIRAS

por

Pedro Henrique de Vargas Vasconcelos e Victor George Przibiciem de

Mattos

Este Trabalho de Conclusão de Curso foi apresentado no dia 02deDezembro de2019 como requisito parcial à obtenção do grau de Bacharel em Sistemas de Informação na Universidade Tecnológica Federal do Paraná -UTFPR - Câmpus Curitiba. O(a)(s) aluno(a)(s) foi(ram) arguido(a)(s) pelos membros da Banca de Avaliação abaixo assinados. Após deliberação a Banca de Avaliação considerou o trabalho ________________________________________.

________________________________ <Profa. Nádia Puchalski Kozievitch>

(Presidente - UTFPR/Curitiba)

________________________________ <Prof. Marcelo de Oliveira Rosa>

(Avaliador(a) 1 - UTFPR/Curitiba)

________________________________

<Prof. Rafael Carvalho Barreto> (Avaliador 2(a) - UTFPR/Curitiba)

________________________________ <Profa. Leyza Baldo Dorini>

(Professora Responsável pelo TCC – UTFPR/Curitiba)

_____________________________ <Prof. Marcelo Mikosz Gonçalves>

(Coordenadordo curso de Bacharelado em Sistemas de Informação – UTFPR/Curitiba)

(4)

RESUMO

VASCONCELOS, P. H. V.; MATTOS, V. G. P.; KOZIEVITCH, N. P. Visualiza¸c˜ao dos dados abertos da Pol´ıcia Rodovi´aria Federal sobre acidentes nas rodovias brasileiras. 2019. 53 f. Trabalho de conclus˜ao de curso – Curso de Bacharelado em Sistemas de Informa¸c˜ao, Universidade Tecnol´ogica Federal do Paran´a. Curitiba, 2019.

Os acidentes de trˆansito s˜ao uma das principais causas de ´obito no Brasil e, segundo dados da Confedera¸c˜ao Nacional de Transporte, somente entre o per´ıodo de 2007 a 2017, foram registrados mais de 1.6 milh˜oes de acidentes e mais de 83 mil mortes. Em particular, dados de acidentes possuem n˜ao s´o componentes geogr´aficos e temporais, como tamb´em dinˆ ami-cas incluindo trecho de BR, classifica¸c˜ao diferenciada de acidentes, ve´ıculos e passageiros envolvidos em agrega¸c˜oes diferenciadas (pa´ıs, estado, cidade). Este trabalho prop˜oe uma ferramenta visual de dados de acidentes da Pol´ıcia Rodovi´aria Federal (PRF) referentes ao per´ıodo de Janeiro de 2007 a Junho de 2018, com o objetivo de suprir o problema de sobreposi¸c˜ao de acidentes em ´areas e identifica¸c˜ao de padr˜oes. Para isto, a aplica¸c˜ao foi inspirada aplica¸c˜oes similares, bem como em estudos sobre banco de dados, cidades inteligentes, sistemas de informa¸c˜ao geogr´afica, algoritmos de clusteriza¸c˜ao e dados abertos. Palavras-chave: Cidades Inteligentes. SIG. Dados Abertos. Visualiza¸c˜ao de dados. Clus-teriza¸c˜ao.

(5)

ABSTRACT

VASCONCELOS, P. H. V.; MATTOS, V. G. P.; KOZIEVITCH, N. P. Visualization of open data from Federal Highway Police using accidents in Brazilian Highways. 2019. 53 f. Trabalho de conclus˜ao de curso – Curso de Bacharelado em Sistemas de Informa¸c˜ao, Universidade Tecnol´ogica Federal do Paran´a. Curitiba, 2019.

Traffic accidents are one of the leading causes of death in Brazil and, according to data from the Confedera¸c˜ao Nacional de Transporte, between 2007 and 2017 alone, more than 1.6 million accidents and more than 83,000 deaths were recorded. In particular, accident data have not only geographic and temporal components, but also dynamics including BR stretch, differentiated classification of accidents, vehicles and passengers involved in different aggregations (country, state, city). This paper proposes a visual interface of accident data from the Federal Highway Police from January 2007 to June 2018, with the objective of supplying the problem of accident overlap in areas and pattern identification. In this direction, this interface is inspired by similar applications, as well as studies on databases, smart cities, geographic information systems, cluster algorithms and open data. Keywords: Smart Cities. GIS. Open Data. Data visualization. Clustering.

(6)

LISTA DE FIGURAS

Figura 1 – Agrupamento dos pontos de ˆonibus da cidade de Curitiba. . . 2

Figura 2 – Interface de visualiza¸c˜ao de acidentes de trˆansito com v´ıtimas fatais no munic´ıpio de Curitiba. . . 3

Figura 3 – Mapeamento de temas abordados e suas rela¸c˜oes. . . 4

Figura 4 – N´umero de acidentes e n´umero de ´obitos ocorridos em rodovias federais policiadas entre 2007 e 2017. . . 5

Figura 5 – Visualiza¸c˜ao de acidentes no Google Maps em parceria com o Waze. . . 6

Figura 6 – Projeto piloto da parceria entre DNIT e Waze. . . 7

Figura 7 – Base de dados de acidentes do portal do The Police Data Initiative. . . 11

Figura 8 – Base de dados de acidentes do portal New York City Open Data. . . . 12

Figura 9 – Arquitetura de Sistemas de Informa¸c˜ao Geogr´afica. . . 14

Figura 10 – The Globe of Economic Complexity. . . 15

Figura 11 – Interface de consulta visual e sa´ıda do TaxiVis. . . 16

Figura 12 – Visualiza¸c˜ao dos voos pelo Flightradar24. . . 17

Figura 13 – Mapa de Londres com ´obitos por c´olera identificados por pontos e po¸cos de ´agua representados por cruzes. . . 18

Figura 14 – Diagrama de fluxo do algoritmo Marker Clusterer. . . 20

Figura 15 – Visualiza¸c˜ao inicial (esquerda), HeatMap (centro) e Marker Clusterer (direita). . . 21

Figura 16 – Proje¸c˜ao dos dados de destrui¸c˜ao da cidade de Aleppo na cidade de Berlim. A cor avermelhada representa a reproje¸c˜ao da destrui¸c˜ao. . . . 22

Figura 17 – Mapa de migra¸c˜ao global de 2010 a 2015. . . 23

Figura 18 – Visualiza¸c˜ao da interface do Bike Share Map. . . 23

Figura 19 – Visualiza¸c˜ao da interface do Mapping 10 Years of Fatal Traffic Accidents. 25 Figura 20 – Visualiza¸c˜ao da interface do Seattle Collisions. . . 26

Figura 21 – Interface do New York City Open Data. Visualiza¸c˜ao de acidentes por pontos (cima), heat map (meio) e regi˜ao (baixo). . . 26

Figura 22 – Interface do The Boston Crash Model. . . 27

Figura 23 – Interface do Markercluster Pie Charts. . . 28

Figura 24 – Etapas da metodologia utilizada. . . 31

Figura 25 – Arquitetura da aplica¸c˜ao. . . 33

Figura 26 – Diagrama da base de dados. . . 34

Figura 27 – N´umero de acidentes x hor´ario. . . 35

Figura 28 – Tipos de acidentes mais relevantes. . . 36

Figura 29 – N´umero de mortes x dia da semana. . . 36

(7)

Figura 31 – Interface inicializada com os gr´aficos carregados com todos os dados

(2007 a 2018) e mapa carregado com os dados de 2018. . . 38

Figura 32 – Dados clusterizados. . . 38

Figura 33 – Cluster aproximado. . . 39

Figura 34 – Quantidade de acidentes por dia da semana. . . 39

Figura 35 – Quantidade de acidentes por ano. . . 40

Figura 36 – Cinco hor´arios mais comuns de acidentes. . . 40

Figura 37 – Dez causas mais comuns de acidentes. . . 40

Figura 38 – Dez BRs com maior n´umero de acidentes. . . 41

Figura 39 – Classifica¸c˜ao dos acidentes. . . 41

Figura 40 – Dez estados com maior n´umero de acidentes. . . 42

(8)

LISTA DE TABELAS

Tabela 1 – Comparativo de aplica¸c˜oes de visualiza¸c˜ao de dados geogr´aficos. . . 24 Tabela 2 – Comparativo de aplica¸c˜oes de visualiza¸c˜ao de dados de acidentes de

(9)

SUM ´ARIO 1 – INTRODU ¸C ˜AO . . . 1 1.1 OBJETIVOS . . . 3 1.1.1 OBJETIVO GERAL . . . 3 1.1.2 OBJETIVOS ESPEC´IFICOS . . . 4 1.2 JUSTIFICATIVA . . . 5 2 – REVIS ˜AO DE LITERATURA . . . 9 2.1 CIDADES INTELIGENTES . . . 9 2.1.1 DADOS ABERTOS . . . 9

2.1.2 DADOS ABERTOS DE ACIDENTES DE TR ˆANSITO . . . 11

2.2 SIG . . . 12

2.2.1 REPRESENTA ¸C ˜OES GR ´AFICAS . . . 14

2.2.2 APLICA ¸C ˜OES . . . 15

2.3 VISUALIZA ¸C ˜AO DE DADOS . . . 17

2.3.1 VISUALIZA ¸C ˜AO DE DADOS GEOGR ´AFICOS . . . 18

2.3.2 CLUSTERIZA ¸C ˜AO . . . 19

2.3.3 APLICA ¸C ˜OES . . . 21

2.3.4 VISUALIZA ¸C ˜AO DE DADOS DE ACIDENTES DE TR ˆANSITO 24 3 – METODOLOGIA . . . 30

4 – DESENVOLVIMENTO . . . 32

4.1 AN ´ALISE DO PROBLEMA . . . 32

4.2 ARQUITETURA . . . 33

4.2.1 BASE DE DADOS . . . 34

4.2.1.1 LIMPEZA DOS DADOS . . . 35

4.2.1.2 CARACTER´ISTICAS DOS DADOS . . . 35

4.3 INTERFACE DA APLICA ¸C ˜AO . . . 37 4.3.1 PRINCIPAIS CONSULTAS . . . 39 4.4 AVALIA ¸C ˜AO DA APLICA ¸C ˜AO . . . 42 4.5 DESAFIOS ENCONTRADOS . . . 43 5 – CONCLUS ˜AO . . . 44 Referˆencias . . . 45

(10)

Apˆ

endices

48

APˆENDICE A–Question´ario inicial . . . 49

APˆENDICE B–Question´ario final de avalia¸c˜ao da interface . . . 51

APˆENDICE C–Tarefas . . . 52

(11)

1

1 INTRODU ¸C ˜AO

Cidade Inteligente ´e o termo dado `a cidade que utiliza Tecnologias da Informa¸c˜ao e Comunica¸c˜ao (TIC) de forma criativa, inclusiva e eficiente na gest˜ao p´ublica, auxiliando nas tomadas de decis˜ao, bem como na cria¸c˜ao de inova¸c˜oes que fa¸cam uso destas informa¸c˜oes para gerar solu¸c˜oes que facilitem a vida dos cidad˜aos (WEISS; BERNARDES; CONSONI, 2017).

Dentro do ˆambito de Cidades Inteligentes, uma das pe¸cas-chave da gest˜ao p´ublica para a dissemina¸c˜ao da informa¸c˜ao e a promo¸c˜ao da transparˆencia ´e a abertura de dados p´ublicos, os chamados dados abertos. A disponibiliza¸c˜ao de informa¸c˜oes para cidad˜aos e empresas contribui para a cria¸c˜ao de um ambiente inovador e para a melhoria e cria¸c˜ao de servi¸cos (CUNHA; PRZEYBILOVICZ; MACAYA; SANTOS, 2016). O aumento de dados p´ublicos cria um cen´ario favor´avel `a participa¸c˜ao social, permitindo o cidad˜ao ajudar a produzir informa¸c˜oes que auxiliem na discuss˜ao e no mapeamento de problemas, bem como o poder p´ublico na identifica¸c˜ao dos mesmos (LEMOS, 2013).

No Brasil, cidades como Curitiba1, Rio de Janeiro2 e Porto Alegre3 a s˜ao

reconhe-cidas como cidades inteligentes, tanto no cen´ario nacional quanto no cen´ario internacional (WEISS; BERNARDES; CONSONI, 2017). Em Curitiba, por exemplo, a Prefeitura Muni-cipal (PMC) disponibiliza para a popula¸c˜ao, atrav´es do seu portal online4, diversas bases

de dados referentes ao munic´ıpio. Dados sobre o transporte coletivo, sa´ude e seguran¸ca municipal, dentre outros, s˜ao disponibilizados de forma irrestrita para consulta.

Bem como as prefeituras citadas, a Pol´ıcia Rodovi´aria Federal (PRF)5 possui dados abertos publicados sobre acidentes e infra¸c˜oes de trˆansito desde 2007. Segundo estes dados, por exemplo, para o ano de 2018 entre os meses de Janeiro e Abril, ocorreram mais de 35 mil acidentes de trˆansito com um total de mais de 5 mil mortos, fazendo dos acidentes de trˆansito uma das principais causas de morte no pa´ıs (IPEA – INSTITUTO DE PESQUISA ECON ˆOMICA APLICADA; PRF – POL´ICIA RODOVI ´ARIA FEDERAL, 2015). Embora existam relat´orios e dados referentes aos acidentes nas rodovias federais, n˜ao existe uma caracteriza¸c˜ao sistem´atica e completa das situa¸c˜oes que resultam nos acidentes com mortes e feridos, o que seria de fundamental importˆancia para um programa efetivo de preven¸c˜ao e redu¸c˜ao destes eventos (BEZERRA; ROSENSTOCK, 2016).

Com o intuito de compreender melhor as caracter´ısticas dos acidentes registrados pela PRF, o uso de tecnologias geoespaciais como os Sistemas de Informa¸c˜ao Geogr´afica (SIG) proporciona, al´em de facilidade na an´alise, um entendimento visual dos dados

1www.curitiba.pr.gov.br - Acessado em: 20 de agosto de 2018. 2www.rio.rj.gov.br - Acessado em: 20 de agosto de 2018. 3https://prefeitura.poa.br - Acessado em: 20 de agosto de 2018.

4www.curitiba.pr.gov.br/dadosabertos - Acessado em: 20 de agosto de 2018. 5www.prf.gov.br/portal/dados-abertos - Acessado em: 15 de agosto de 2018.

(12)

Cap´ıtulo 1. INTRODU ¸C ˜AO 2

contidos em tabelas (VILA, 2016), bem como a cria¸c˜ao de modelos espaciais que auxiliem no processo de tomada de decis˜oes (TAO, 2013). Vila (2016) propˆos uma interface de visualiza¸c˜ao de dados geogr´aficos com t´ecnicas de clusteriza¸c˜ao utilizando a base de dados de mobilidade urbana da cidade de Curitiba, como mostra a Figura 1. De acordo com Vila (2016), a clusteriza¸c˜ao e visualiza¸c˜ao de uma grande quantidade de dados abertos georreferenciados possibilita a resolu¸c˜ao de problemas computacionais de sobreposi¸c˜ao de pontos sobre um mapa. Assim, a visualiza¸c˜ao espacial dos dados se torna mais intuitiva.

Figura 1 – Agrupamento dos pontos de ˆonibus da cidade de Curitiba.

Fonte: Vila (2016).

O IPPUC (Instituto de Pesquisa e Planejamento Urbano de Curitiba)6 disponi-bilizou, em 2018, uma interface7 de visualiza¸c˜ao dos dados geogr´aficos de acidentes de trˆansito com v´ıtimas fatais no munic´ıpio de Curitiba e, para isso, utilizou os dados abertos da PRF, como mostra a Figura 2. Al´em da visualiza¸c˜ao, o IPPUC tamb´em disponibilizou, em forma de gr´aficos, os dados mais relevantes destes acidentes, de modo que o usu´ario possa filtrar e definir quais dados devem aparecer nos gr´aficos.

Em particular, dados de acidentes possuem n˜ao s´o componentes geogr´aficos e temporais, como tamb´em dinˆamicas incluindo trecho de de rodovia federal, classifica¸c˜ao

6www.ippuc.org.br - Acessado em: 09 de outubro de 2018.

7www.ippuc.org.br/mapasinterativos/acidentesDeTransito/dashboard.html - Acessado em: 17 de abril

(13)

Cap´ıtulo 1. INTRODU ¸C ˜AO 3

diferenciada de acidentes, ve´ıculos e passageiros envolvidos em agrega¸c˜oes diferenciadas (pa´ıs, estado, cidade). Neste sentido, este trabalho utiliza como base os trabalhos do IPPUC8 e Vila (2016) (juntamente com outros que ser˜ao citados posteriormente) para uma ferramenta visual de dados de acidentes, com o objetivo de suprir o problema de sobreposi¸c˜ao de acidentes em ´areas e identifica¸c˜ao de padr˜oes. Para isso, foram usados dados de mais de uma d´ecada da PRF.

Figura 2 – Interface de visualiza¸c˜ao de acidentes de trˆansito com v´ıtimas fatais no munic´ıpio de Curitiba.

Fonte: IPPUC.

1.1 OBJETIVOS

1.1.1 OBJETIVO GERAL

O objetivo geral deste projeto ´e adaptar, prototipar e desenvolver uma aplica¸c˜ao Web, que permita a visualiza¸c˜ao de uma grande massa de dados, evitando a sobreposi¸c˜ao dos mesmos, e que possibilite a identifica¸c˜ao dos locais de maior incidˆencia de acidentes em rodovias brasileiras, a compreens˜ao das causas destes de acidentes e a identifica¸c˜ao de padr˜oes. Para isto, a aplica¸c˜ao foi inspirada nas interfaces de visualiza¸c˜ao de Vila (2016), IPPUC, bem como em estudos sobre aplica¸c˜oes similares, APIs, banco de dados, cidades inteligentes, SIG e dados abertos.

8www.ippuc.org.br/mapasinterativos/acidentesDeTransito/dashboard.html - Acessado em: 17 de abril

(14)

Cap´ıtulo 1. INTRODU ¸C ˜AO 4

1.1.2 OBJETIVOS ESPEC´IFICOS

Com o intuito de atingir o objetivo geral, s˜ao considerados os seguintes objetivos espec´ıficos:

a) Realizar uma revis˜ao bibliogr´afica acerca dos conceitos de cidades inteligentes, SIG e visualiza¸c˜ao de dados, como mostrados na Figura 3;

b) Criar um question´ario de valida¸c˜ao do projeto que ser´a destinado ao p´ublico em geral;

c) Desenvolver uma interface de visualiza¸c˜ao adaptando conceitos das interfaces de Vila (2016), IPPUC e dos demais trabalhos citados, utilizando a base de dados da PRF,

gerados por Kozievitch, Berardi e Kageyama (2019), e listar as principais dificuldades encontradas durante o desenvolvimento;

d) Realizar testes na interface;

e) Apresentar o prot´otipo criado para um grupo de usu´arios para a avalia¸c˜ao do funcionamento da aplica¸c˜ao;

f) Indicar conclus˜oes acerca dos resultados obtidos na visualiza¸c˜ao e an´alise dos dados. Figura 3 – Mapeamento de temas abordados e suas rela¸c˜oes.

(15)

Cap´ıtulo 1. INTRODU ¸C ˜AO 5

1.2 JUSTIFICATIVA

Segundo uma pesquisa realizada pela Confedera¸c˜ao Nacional de Transporte (CNT)9 os acidentes de trˆansito s˜ao uma das principais causas de ´obitos no Brasil e, somente nas rodovias federais policiadas, no per´ıodo entre 2007 e 2017, foram registrados 1.652.403 acidentes e 83.481 mortes, como mostra o gr´afico da Figura 4. A pesquisa ainda aponta que as mortes em acidentes ocorridos nas rodovias federais brasileiras correspondem, em m´edia, a 26,0% do total de mortes dos acidentes de trˆansito no pa´ıs e estima-se que os custos m´edios anuais consequentes desses acidentes giram em torno de R$ 10 bilh˜oes. Esse n´umero alt´ıssimo de mortes e acidentes acaba causando preju´ızo para toda a sociedade e, um pa´ıs que busca o desenvolvimento, necessita de medidas capazes de minimizar todos esses danos.

Figura 4 – N´umero de acidentes e n´umero de ´obitos ocorridos em rodovias federais policia-das entre 2007 e 2017.

Fonte: Adaptado de CNT - Confedera¸c˜ao Nacional de Trˆansito (2018).

No entanto, a maior dificuldade encontrada nos estudos e an´alises t´ecnicas mais profundas de acidentes se d´a por estes serem, em geral, acontecimentos imprevis´ıveis, somados a circunstˆancias aleat´orias e podendo ser somente observados ap´os as suas ocorrˆencias. As causas que levam ao acidente podem tamb´em estar correlacionadas a diversas circunstˆancias e fatores aleat´orios, dificultando ainda mais na defini¸c˜ao de medidas que sejam eficientes para a sua redu¸c˜ao e a de seus danos (CNT - CONFEDERA ¸C ˜AO NACIONAL DE TR ˆANSITO, 2018).

E, em meio `as dificuldades citadas, os SIGs tˆem sido uma ferramenta popular para visualiza¸c˜ao de dados de acidentes e an´alise de hotspots em rodovias. Segundo Erdogan, Yilmaz, Baybura e Gullu (2008), diversas agˆencias de tr´afego j´a tˆem usado os SIGs para

(16)

Cap´ıtulo 1. INTRODU ¸C ˜AO 6

an´alise de acidentes. Estudos de an´alise de acidentes visam identificar locais com uma alta taxa de acidentes e tamb´em ´areas com deficiˆencia de seguran¸ca nas rodovias. Desta forma, as autoridades de trˆansito respons´aveis podem implementar medidas de precau¸c˜ao e provis˜oes para a seguran¸ca no trˆansito.

Dois dos maiores aplicativos de navega¸c˜ao do mercado, o Google Maps10e o Waze11, fizeram uma parceria12 na qual ´e poss´ıvel, dentro do Google Maps, obter a localiza¸c˜ao dos acidentes reportados pelos usu´arios do Waze, como mostra a Figura 5.

Figura 5 – Visualiza¸c˜ao de acidentes no Google Maps em parceria com o Waze.

Fonte: Canaltech (2018).

O Departamento Nacional de Infraestrutura de Transportes (DNIT)13, em 2018,

tamb´em fez uma parceria com o Waze com o intuito de conectar ´org˜aos e operadores oficiais a plataforma, bem como trocar informa¸c˜oes em tempo real entres os aplicativos sobre vias interditadas, obras planejadas e acidentes, tornando a comunica¸c˜ao mais r´apida, fornecendo ao governo dados para a gest˜ao e planejamento vi´ario. A implanta¸c˜ao do projeto encontra-se em fase piloto, como mostra a Figura 6.

Todos os aplicativos citados j´a utilizam algum mecanismo de visualiza¸c˜ao de acidentes de trˆansito, e a grande semelhan¸ca entre eles ´e que, at´e o momento, todos dependem dos seus usu´arios para que sejam registrados estes acidentes, bem como a atualiza¸c˜ao da sua situa¸c˜ao, em tempo real. Por´em, no que diz respeito `a an´alise e

10www.google.com.br/maps - Acessado em: 08 de setembro de 2018. 11www.waze.com/pt-BR - Acessado em: 08 de setembro de 2018.

12

www.canaltech.com.br/apps/veja-informacoes-sobre-acidentes-de-transito-pelo-waze-no-google-maps - Acessado em: 08 de setembro de 2018.

(17)

Cap´ıtulo 1. INTRODU ¸C ˜AO 7

Figura 6 – Projeto piloto da parceria entre DNIT e Waze.

Fonte: DNIT - Departamento Nacional de Infraestrutura de Transportes (2018).

visualiza¸c˜ao destes acidentes, esses aplicativos acabam por n˜ao serem a melhor alternativa, pois o intuito da divulga¸c˜ao destes acidentes ´e de utilidade a curto prazo, ou seja, n˜ao h´a um aprofundamento hist´orico nos locais de maior incidˆencia ou nas causas dos acidentes, tornando estas informa¸c˜oes relevantes somente para o caso de desvio de rotas, com o objetivo de ganhar tempo contornando eventuais engarrafamentos ocasionados por estes acidentes.

Portanto, o prop´osito deste projeto ´e criar uma solu¸c˜ao alternativa `as aplica¸c˜oes citadas, possuindo foco total nos acidentes de trˆansito,contemplando diversas vari´aveis que ir˜ao permitir ao usu´ario identificar as principais caracter´ısticas referentes aos acidentes de trˆansito de Janeiro de 2007 a Junho de 2018 nas rodovias brasileiras. O intuito desta aplica¸c˜ao ´e, atrav´es da visualiza¸c˜ao dos trechos historicamente mais perigosos, utilizar t´ecnicas de clusteriza¸c˜ao para suprir o problema de sobreposi¸c˜ao dos dados de acidentes e possibilitar a identifica¸c˜ao de padr˜oes dos mesmos. Diferente da maioria das aplica¸c˜oes revisadas neste trabalho, esta possui c´odigo aberto para a livre utiliza¸c˜ao.

Este trabalho est´a dividido em cinco se¸c˜oes. Na pr´oxima se¸c˜ao ser˜ao abordados os principais temas acerca dos objetivos e suas aplica¸c˜oes. Na se¸c˜ao 3 ser´a apresentada a metodologia. Na se¸c˜ao 4 ser´a apresentado todo o desenvolvimento da interface e os

(18)

Cap´ıtulo 1. INTRODU ¸C ˜AO 8

resultados dos testes com usu´arios. Na ´ultima se¸c˜ao s˜ao apresentadas as dificuldades encontradas e as considera¸c˜oes finais do estudo realizado.

(19)

9

2 REVIS ˜AO DE LITERATURA

Nesta se¸c˜ao s˜ao apresentados os principais conceitos relacionados a este trabalho: cidades inteligentes, dados abertos, sistemas de informa¸c˜ao geogr´afica (SIG) e visualiza¸c˜ao de dados.

2.1 CIDADES INTELIGENTES

Segundo proje¸c˜oes da Organiza¸c˜ao das Na¸c˜oes Unidas (ONU)1, 55% da popula¸c˜ao

mundial estar´a residindo em cidades em 2018 e, para 2050, projeta-se que este n´umero suba para 68% (ONU - ORGANIZA ¸C ˜AO DAS NA ¸C ˜OES UNIDAS, 2018). Este aumento populacional dentro das cidades representa um grande desafio para os governos na gest˜ao p´ublica. A intensa urbaniza¸c˜ao pode causar precariedade, ou at´e perda, de servi¸cos b´asicos, como gest˜ao de res´ıduos, gest˜ao de recursos naturais, educa¸c˜ao, seguran¸ca p´ublica, sa´ude, mobilidade urbana, etc, afetando significativamente a qualidade de vida da popula¸c˜ao (WEISS; BERNARDES; CONSONI, 2017).

As cidades inteligentes utilizam a tecnologia como um meio para prestar, de forma mais eficiente, os servi¸cos urbanos e melhorar a qualidade de vida dos cidad˜aos. `A medida que o mundo se torna cada vez mais instrumentado, interconectado e inteligente, as cidades tˆem a chance fazer uso de novas solu¸c˜oes e pr´aticas de gerenciamento “inteligentes” (DIRKS; KEELING; DENCIK, 2009). O uso das TICs pelos governos proporciona ganhos de efici-ˆ

encia e efic´acia na gest˜ao p´ublica, melhorando processos e fluxo de informa¸c˜oes, bem como amplia¸c˜ao e a qualidade da presta¸c˜ao de servi¸cos p´ublicos (CUNHA; PRZEYBILOVICZ; MACAYA; SANTOS, 2016).

Ainda quanto ao uso das TICs pelas cidades, Weiss, Bernardes e Consoni (2013) dizem que o uso inteligente dessas tecnologias est´a aprimorando as formas de produ¸c˜ao e a realiza¸c˜ao de neg´ocios, estimulando as intera¸c˜oes sociais entre a popula¸c˜ao e os governos, promovendo a transparˆencia, as melhorias nos servi¸cos e a comunica¸c˜ao entre os respons´aveis que atuam nas cidades.

Lemos (2013) complementa que as TICs servem como referˆencia e guia para as tomadas de decis˜ao de governos, empresas e cidad˜aos, tornando as atividades urbanas mais eficientes e sustent´aveis nas esferas econˆomicas, pol´ıticas, sociais e ecol´ogicas. 2.1.1 DADOS ABERTOS

A Open Knowledge International2 define que, para um dado ser considerado aberto,

qualquer pessoa pode ter acesso a ele, bem como deve ser poss´ıvel utiliz´a-lo, modific´a-lo

1www.un.org/en - Acessado em: 12 de setembro de 2018.

(20)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 10

e compartilh´a-lo para qualquer finalidade, desde que se preserve a integridade de sua abertura e origem.

Eaves (2009) propˆos trˆes leis a respeito de dados abertos governamentais: 1. Se o dado n˜ao pode ser encontrado e indexado na Web, ele n˜ao existe;

2. O dado n˜ao poder´a ser aproveitado caso n˜ao esteja aberto e dispon´ıvel em formato compreens´ıvel por m´aquina;

3. Se houver algum dispositivo legal que n˜ao permita a replica¸c˜ao do dado, ele se torna in´util.

`

A medida que as cidades se fazem mais inteligentes, uma grande quantidade de dados pode ser colocada `a disposi¸c˜ao da popula¸c˜ao e empresas, impulsionando o desenvolvimento de aplica¸c˜oes comerciais, pesquisas e apoio `a tomada de decis˜oes complexas (LOPES; VIDAL; OLIVEIRA, 2016), contribuindo para o desenvolvimento de novos servi¸cos de utilidade para cidad˜aos e gestores municipais (CUNHA; PRZEYBILOVICZ; MACAYA; SANTOS, 2016).

Com aux´ılio das TICs, como a Internet, a promo¸c˜ao da transparˆencia pode ser potencializada, pois os meios eletrˆonicos proporcionam uma maior facilidade de acesso aos dados e informa¸c˜oes da administra¸c˜ao p´ublica, permitindo bases de dados brutas serem livremente manipuladas, filtradas ou cruzadas, construindo novas aplica¸c˜oes e conhecimentos pela sociedade (VAZ; RIBEIRO; MATHEUS, 2010).

Os conceitos de dados abertos j´a est˜ao presentes na legisla¸c˜ao brasileira atrav´es da Lei Complementar 131/2009, conhecida como Lei da Transparˆencia3, que determina que

sejam dispon´ıveis, em tempo real, informa¸c˜oes sobre a execu¸c˜ao or¸cament´aria e financeira da Uni˜ao, dos Estados, do Distrito Federal e dos Munic´ıpios. E tamb´em atrav´es da Lei 12.527/2011, conhecida como Lei de Acesso `a Informa¸c˜ao4, que possibilita, sem necessidade de apresentar um motivo, a qualquer pessoa, f´ısica ou jur´ıdica, o recebimento de informa¸c˜oes p´ublicas dos ´org˜aos e entidades.

Diversas prefeituras de cidades do Brasil e do mundo j´a possuem portais de dados abertos, como por exemplo: Curitiba5, S˜ao Paulo6, Rio de Janeiro7, Paris8 e Nova Iorque9.

Ainda no cen´ario brasileiro, o Tribunal de Contas da Uni˜ao (TCU)10 elaborou

em 2015 uma publica¸c˜ao11 apresentando cinco raz˜oes para que as organiza¸c˜oes p´ublicas

investissem em iniciativas de abertura de dados governamentais. Os cinco motivos propostos

3www.leidatransparencia.cnm.org.br - Acessado em: 12 de setembro de 2018.

4www.acessoainformacao.gov.br/assuntos/conheca-seu-direito/a-lei-de-acesso-a-informacao - Acessado

em: 12 de setembro de 2018.

5http://www.curitiba.pr.gov.br/dadosabertos - Acessado em: 07 de novembro de 2018. 6http://dados.prefeitura.sp.gov.br - Acessado em: 07 de novembro de 2018.

7http://portalgeo.pcrj.opendata.arcgis.com - Acessado em: 07 de novembro de 2018. 8https://opendata.paris.fr/explore - Acessado em: 07 de novembro de 2018.

9https://opendata.cityofnewyork.us - Acessado em: 07 de novembro de 2018. 10www.portal.tcu.gov.br/inicio - Acessado em: 12 de setembro de 2018.

11

(21)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 11

pelo TCU s˜ao, em suma:

1. Transparˆencia na gest˜ao p´ublica;

2. Contribui¸c˜ao da sociedade com servi¸cos inovadores ao cidad˜ao; 3. Aprimoramento na qualidade dos dados governamentais; 4. Viabiliza¸c˜ao de novos neg´ocios;

5. Obrigatoriedade por lei.

2.1.2 DADOS ABERTOS DE ACIDENTES DE TR ˆANSITO

Diversas cidades j´a disponibilizam os dados sobre acidentes de trˆansito para a popula¸c˜ao, nos Estados Unidos, por exemplo, o The Police Data Initiative (PDI)12

disponibiliza, atrav´es do seu site, a base de dados de acidentes de trˆansito, tanto entre ve´ıculos, como acidentes envolvendo pedestres e ciclistas. Esta base de dados ´e composta pelos dados de acidentes reportados por diversos departamentos de pol´ıcia de cidades dos Estados Unidos, como mostra a Figura 7.

Figura 7 – Base de dados de acidentes do portal do The Police Data Initiative.

Fonte: The Police Data Initiative (2018).

Ainda nos Estados Unidos, a cidade de Nova Iorque possui um portal chamado New York City Open Data13, que disponibiliza para a popula¸c˜ao diversas informa¸c˜oes

sobre a cidade, ´e poss´ıvel ter acesso a dados de diversas categorias, como neg´ocios, sobre o

12www.policedatainitiative.org - Acessado em: 18 de setembro de 2018. 13www.opendata.cityofnewyork.us - Acessado em: 18 de setembro de 2018.

(22)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 12

governo, educa¸c˜ao, transporte, meio ambiente e sa´ude, bem como dados sobre os acidentes de trˆansito14. A Figura 8 mostra como est´a estruturada a tabela com estes dados dentro

do portal.

Figura 8 – Base de dados de acidentes do portal New York City Open Data.

Fonte: New York City Open Data (2018).

No Brasil, a PRF possui, como citado anteriormente, uma base de dados dos acidentes de trˆansito ocorridos nas rodovias brasileiras. O modelo apresentado pela PRF se assemelha ao implantado pelo New York City Open Data, mostrando os dados de localiza¸c˜ao do acidente (latitude e longitude), os ve´ıculos envolvidos, a causa do acidente, a quantidade de pessoas envolvidas, v´ıtimas (fatais ou n˜ao), hora do ocorrido, etc.

2.2 SIG

Os Sistemas de Informa¸c˜ao Geogr´afica (SIG) possuem como funcionalidades principais a captura, armazenamento, consulta, an´alise e exibi¸c˜ao de dados geoespaciais (CHANG, 2015). Os dados geoespaciais representam objetos e fenˆomenos em que a

locali-14www.data.cityofnewyork.us/Public-Safety/NYPD-Motor-Vehicle-Collisions/h9gi-nx95/data -

(23)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 13

za¸c˜ao geogr´afica ´e a uma caracter´ıstica essencial para trat´a-los (C ˆAMARA; CASANOVA; MAGALH ˜AES, 1996).

Longley, Goodchild, Maguire e Rhind (2005) definem os SIGs como uma extens˜ao de sistemas de informa¸c˜ao, que armazena n˜ao s´o eventos e atividades, mas tamb´em onde estes acontecem. Para um acidente de trˆansito em uma rodovia brasileira, por exemplo, esses dados geoespaciais descrevem, al´em da localiza¸c˜ao, informa¸c˜oes relacionadas como: em que BR ocorreu, em que Quilˆometro ocorreu, qual era o sentido da pista, o hor´ario, a data, etc.

Cˆamara, Casanova e Magalh˜aes (1996) argumentam que os SIGs abrangem dife-rentes tipos de dados e aplica¸c˜oes, em diversas ´areas do conhecimento. Alguns exemplos citados s˜ao: otimiza¸c˜ao de tr´afego, gerenciamento de servi¸cos de utilidade p´ublica, demogra-fia, cartogrademogra-fia, administra¸c˜ao de recursos naturais, controle de epidemias e planejamento urbano.

Fox e Leidig (2014) dividem a arquitetura de um SIG nas trˆes seguintes camadas: • Camada de apresenta¸c˜ao

– Elemento pelo qual ´e feita a intera¸c˜ao do usu´ario com o sistema, sendo poss´ıvel entrar com parˆametros para consultas e, consequentemente, visualizar seus resultados.

• Camada de processamento

– ´E a camada respons´avel por tratar as entradas do usu´ario, transformando-as em consultas para o banco de dados. Tamb´em ´e respons´avel por tratar os resultados de acordo com o escopo da aplica¸c˜ao antes de retornar o resultado ao usu´ario. • Camada de dados

– Local onde ´e armazenado dados espaciais e semˆanticos. Os dados espaciais consistem em pontos, pol´ıgonos e arestas em algum sistema de coordenadas. J´a os semˆanticos representam os nomes e dados relacionados `a esses locais. Estas camadas foram ilustradas por Druck (2004) na arquitetura dos SIGs da Figura 9.

(24)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 14

Figura 9 – Arquitetura de Sistemas de Informa¸c˜ao Geogr´afica.

Fonte: Druck (2004).

A organiza¸c˜ao de banco de dados geogr´aficos mais popular ´e o modelo geo-relacional. Este modelo utiliza um Sistema Gerenciador de Banco de Dados (SGBDs) relacionais para, atrav´es de plugins e extens˜oes, introduzir atributos de objetos geogr´aficos (DRUCK, 2004).

2.2.1 REPRESENTA ¸C ˜OES GR ´AFICAS

Algumas das representa¸c˜oes gr´aficas utilizados por SIGs s˜ao: • Pontos

– Representados por um par ordenado de coordenadas espaciais;

– Ex.: (x,y). Um ponto indica um local de ocorrˆencia de um evento (DRUCK, 2004).

• Pol´ıgonos

– Um conjunto de pares ordenados em que o primeiro e o ´ultimo s˜ao iguais, assim formando uma regi˜ao fechada no plano;

– Ex.: [(3,4),(3,6),(2,2),(3,4)] (HAMADA; GON ¸CALVES, 2007). • Amostras

– Uma tripla ordenada (x,y,z), onde (x,y) representa coordenadas como em um ponto e z representa um valor relacionado a essa coordenada. Seu conceito pode ser generalizado para o caso de m´ultiplas medidas em uma mesma localidade (DRUCK, 2004).

(25)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 15

– Uma matriz em que cada elemento ´e associado a um valor num´erico. A matriz em si ´e associada a uma regi˜ao da superf´ıcie terrestre, a partir da coordenada inicial e de espa¸camentos regulares na horizontal e vertical (DRUCK, 2004). • Imagem

– Matriz em que cada elemento est´a associado a um valor num´erico inteiro (geralmente em uma faixa de 0 a 255). Esta matriz ´e utilizada para apresenta¸c˜ao

gr´afica de uma grade regular (DRUCK, 2004). 2.2.2 APLICA ¸C ˜OES

OLAYA (2011) classifica as aplica¸c˜oes de SIG em categorias, dentre estas destacam-se:

• SIG como uma ferramenta de modelagem

– Diversos processos de an´alise espacial podem ser aplicados em um SIG, permi-tindo an´alises geogr´aficas complexas. Um exemplo de aplica¸c˜ao ´e o projeto “O Globo de Complexidade Econˆomica” (The Globe of Economic Complexity)15,

que consiste em um globo interativo que mapeia a economia mundial atrav´es de detalhes sobre as rela¸c˜oes comerciais entre na¸c˜oes, quais produtos cada regi˜ao importa e exporta e seus respectivos valores, ilustrado na Figura 10.

Figura 10 – The Globe of Economic Complexity.

Fonte: International Development, Harvard University (2015). • SIG como ferramenta para difus˜ao de informa¸c˜ao geogr´afica

(26)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 16

– Uma das caracter´ısticas mais interessantes do SIG ´e a capacidade de exibir dados geogr´aficos em um formato mais compreens´ıvel, possibilitando uma maior difus˜ao de diversos tipos de informa¸c˜ao geogr´afica.

• SIG como ferramenta para tomada de decis˜oes

– Um exemplo de SIG para tomada de decis˜oes ´e apresentado por Ferreira, Poco, Vo, Freire e Silva (2013) que prop˜oe o TaxiVis, um sistema visual que analisa um conjunto de dados geogr´aficos de viagens de t´axi na cidade de Nova Iorque. Destes dados, s˜ao extra´ıdas informa¸c˜oes sobre o deslocamento entre pessoas, bairros, hor´arios, etc. Esta aplica¸c˜ao permite a realiza¸c˜ao de consultas visuais a esses dados com diversos filtros, assim, possibilitando a obten¸c˜ao de diversas informa¸c˜oes. A interface do sistema ´e representada na Figura 11.

Figura 11 – Interface de consulta visual e sa´ıda do TaxiVis.

Fonte: Ferreira, Poco, Vo, Freire e Silva (2013). • SIG para desktops

– ´E a forma mais tradicional de SIG que executa a¸c˜oes como a gest˜ao de dados, visualiza¸c˜ao, edi¸c˜ao, an´alise e gera¸c˜ao de mapeamento.

• SIG para plataformas Web

– S˜ao tecnologias que possibilitam inserir funcionalidades do SIG dentro de p´aginas web. Um exemplo deste tipo de aplica¸c˜ao ´e o site Flightradar2416 que disponibiliza a visualiza¸c˜ao de avi˜oes em sua respectiva localiza¸c˜ao pelo mundo todo, em tempo real, como mostra a Figura 12.

(27)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 17

Figura 12 – Visualiza¸c˜ao dos voos pelo Flightradar24.

Fonte: Flightradar24 (2009).

• SIG para plataformas m´oveis

– S˜ao tecnologias que permitem a demonstra¸c˜ao dos SIGs dentro de plataformas m´oveis, atrav´es de aplicativos ou p´aginas Web, como nos aplicativos Waze e Google Maps, citados anteriormente.

2.3 VISUALIZA ¸C ˜AO DE DADOS

Com o aumento da quantidade de dados e informa¸c˜oes dispon´ıveis, torna-se cada vez mais necess´ario o uso de ferramentas e t´ecnicas que ajudem a fazer uso efetivo desse excesso de informa¸c˜ao, como por exemplo, a visualiza¸c˜ao de dados. Em praticamente qualquer dom´ınio, a visualiza¸c˜ao pode ser e est´a se tornando uma ferramenta eficaz para auxiliar na an´alise e na comunica¸c˜ao de dados (WARD; GRINSTEIN; KEIM, 2015).

Ward, Grinstein e Keim (2015) definem a visualiza¸c˜ao como a comunica¸c˜ao de informa¸c˜oes usando representa¸c˜oes gr´aficas. A visualiza¸c˜ao possibilita, por exemplo, que uma ´unica imagem possua uma quantidade enorme de informa¸c˜oes e seja mais rapidamente assimilada e compreendida pelo sistema perceptivo humano, se comparada a palavras em um texto. Outra caracter´ıstica das imagens ´e que elas podem ser interpretadas independente de uma linguagem espec´ıfica, por exemplo, um mapa pode ser compreendido por pessoas sem l´ıngua comum. Alexandre e Tavares (2007) complementam que a constru¸c˜ao de uma imagem visual na mente humana se torna um artif´ıcio externo para a constru¸c˜ao de conhecimento utilizando as capacidades perceptivas e cognitivas humanas.

A visualiza¸c˜ao cient´ıfica faz uso da tecnologia computacional para a cria¸c˜ao de visualiza¸c˜oes, com o intuito de facilitar a compreens˜ao, o racioc´ınio e a resolu¸c˜ao de problemas onde a ˆenfase n˜ao est´a no armazenamento da informa¸c˜ao, mas sim na constru¸c˜ao do pensamento (EARNSHAW; WISEMAN, 2012).

(28)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 18

No que diz respeito a visualiza¸c˜ao geogr´afica ou cartogr´afica, Ramos (2005) define como o processo de realizar representa¸c˜oes visuais concretas, seja em papel, por meio de computador, ou outra m´ıdia, para tornar contextos e problemas espaciais vis´ıveis. A visualiza¸c˜ao de dados geogr´aficos se baseia em dados espaciais, ou seja, dados de posi¸c˜ao de GPS e dados de aplica¸c˜oes de sensoriamento remoto. Essencialmente, s˜ao dados que podem ser representados em uma mapa ou gr´afico (ELLIS; MANSMANN, 2010).

2.3.1 VISUALIZA ¸C ˜AO DE DADOS GEOGR ´AFICOS

Um dos exemplos mais antigos, e at´e ent˜ao pioneiro sobre visualiza¸c˜ao e an´alise de dados, foi realizado por John Snow em 1854, em Londres, onde ocorria, na ´epoca, uma grave epidemia de c´olera, cuja as causas da doen¸ca eram ainda pouco compreendidas. Snow mapeou a localiza¸c˜ao das residˆencias onde houve ´obitos relacionados `a doen¸ca e constatou que havia uma grande concentra¸c˜ao destas mortes nas residˆencias ao redor da bomba de ´agua, e que a c´olera atingiu majoritariamente as pessoas que moravam pr´oximo ou beberam desta bomba da Broad Street, como mostra a Figura 13.

Figura 13 – Mapa de Londres com ´obitos por c´olera identificados por pontos e po¸cos de ´

agua representados por cruzes.

Fonte: Druck (2004).

Baseado nesta informa¸c˜ao, Snow mandou remover a bomba, diminuindo conside-ravelmente a epidemia que j´a havia matado mais de 500 pessoas (WARD; GRINSTEIN; KEIM, 2015). Este caso documentado pelo Dr. John Snow, foi um dos primeiros exemplos

(29)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 19

que comprovou que a rela¸c˜ao espacial entre os dados contribuiu significativamente para o avan¸co na compreens˜ao do fenˆomeno (DRUCK, 2004).

Em ambientes altamente interdisciplinares com aplica¸c˜oes sendo utilizadas em ´

areas t˜ao distintas, emerge o grande desafio de identificar os princ´ıpios, m´etodos e t´ecnicas fundamentais para o gerenciamento de grande volume de dados, suplantando as dificuldades inerentes `a an´alise de dados (JACOBS, 2009) (LAZER; KENNEDY; KING; VESPIGNANI, 2014). Segundo Vila et al. (2016) os esfor¸cos de integrar diferentes conjuntos de dados incluem:

• do ponto de vista do SIG:

– O desafio ´e como integrar efetivamente diferentes fontes, como abordar diferentes semˆanticas, como maximizar a eficiˆencia da integra¸c˜ao de dados e como construir uma estrutura robusta capaz de lidar com a integra¸c˜ao.

• da perspectiva da integra¸c˜ao:

– O desafio ´e como evitar um gargalo. • do ponto de vista de dados:

– O desafio ´e detectar a qualidade dos dados, encontrar metadados confi´aveis, entender a limita¸c˜ao dos dados capturados e fornecer uma vis˜ao unificada para a navega¸c˜ao dos dados.

• da perspectiva pedag´ogica:

– O desafio ´e poder explorar todos esses conjuntos de dados enquanto preserva sua semˆantica. Outro desafio ´e como criar um ambiente de aprendizagem que incorpore esses dados para fomentar a aprendizagem interdisciplinar e a pesquisa.

2.3.2 CLUSTERIZA ¸C ˜AO

Za¨ıane, Foss, Lee e Wang (2002) descreve o processo de clusteriza¸c˜ao de dados como um agrupamento de informa¸c˜oes, considerando: (i) existˆencia de uma forte similaridade entre os elementos pertencentes ao mesmo grupo e (ii) existˆencia de uma fraca similaridade de elementos pertencentes a grupos diferentes.

A clusteriza¸c˜ao geogr´afica define dois conceitos importantes em sua defini¸c˜ao: • Markers

– S˜ao os pontos que representam a localiza¸c˜ao geogr´afica de um determinado elemento.

• Clusters

– Representam o agrupamento de markers.

A interface de Vila (2016), dentre os algoritmos e t´ecnicas de clusteriza¸c˜ao, utilizou: • K-means

– Consiste no particionamento de observa¸c˜oes e a aloca¸c˜ao destas em diversos clusters esf´ericos de forma que cada observa¸c˜ao perten¸ca ao grupo mais pr´oximo

(30)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 20

da m´edia. Para a correta distribui¸c˜ao de markers, ´e necess´ario que os clusters esf´ericos sejam do mesmo tamanho e dimens˜ao. Para utilizar o algoritmo ´e necess´ario conhecer o parˆametro K (n´umero de clusters a ser utilizado) (ANDRADE; PEREIRA; WANNER, 2014).

• Marker Clusterer

– O algoritmo Marker Clusterer consiste no agrupamento markers dentro de clusters atrav´es de itera¸c˜oes. O primeiro marker ´e colocado em um cluster e os seguintes s˜ao inseridos em um cluster apenas se estiverem determinada distˆancia de qualquer cluster existente. Caso contr´ario, ´e criado um novo cluster que agrupa esse marker espec´ıfico (VILA, 2016). O processo geral do algoritmo, em diagrama de fluxo, ´e representado na Figura 14.

Figura 14 – Diagrama de fluxo do algoritmo Marker Clusterer.

Fonte: Vila (2016).

Um exemplo dessas t´ecnicas pode ser visto na Figura 15, onde se compara uma visualiza¸c˜ao inicial de um conjunto de pontos com a implementa¸c˜ao do heatmap e do algoritmo de clusteriza¸c˜ao Marker Clusterer.

A exemplo de Vila (2016), aplica¸c˜oes como Seattle Collisions, NYPD Motor Vehicle Collisions e Markercluster Pie Charts tamb´em fazem uso de clusteriza¸c˜ao em suas interfaces de visualiza¸c˜ao de dados. Estas aplica¸c˜oes ser˜ao abordadas detalhadamente nas

(31)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 21

Figura 15 – Visualiza¸c˜ao inicial (esquerda), HeatMap (centro) e Marker Clusterer (direita).

Fonte: Vila (2016).

se¸c˜oes seguintes, onde ser˜ao apresentados exemplos de aplica¸c˜oes de visualiza¸c˜ao de dados. 2.3.3 APLICA ¸C ˜OES

Nesta se¸c˜ao ser˜ao apresentados alguns exemplos, de diversos contextos, de aplica-¸c˜oes que utilizam visualiza¸c˜ao de dados. No final da se¸c˜ao ser´a apresentada uma tabela de compara¸c˜ao das aplica¸c˜oes citadas com o trabalho proposto neste projeto.

A aplica¸c˜ao web Aleppo in Berlin17 utilizou imagens de sat´elite que mostravam

danos de toda a cidade (edif´ıcios e infraestrutura) de Aleppo, na S´ıria, e as projetou em mapas das cidades de Berlim e Londres, como mostra a Figura 16. Para isso, foi utilizado um Choropleth Map (mapa coropl´etico) que representa a proporcionalidade da vari´avel estat´ıstica em causa, neste caso, a densidade dos estragos. O c´odigo da aplica¸c˜ao n˜ao ´e aberto e, al´em do OpenStreetMap, para o desenvolvimento desta aplica¸c˜ao fora usado a plataforma Carto18, que ´e um servi¸co com ferramentas de SIG e mapeamento da Web

para exibi¸c˜ao em um browser.

Com a utiliza¸c˜ao de dados abertos sobre migra¸c˜ao l´ıquida mundial entre 2010 e 2015, fornecidos pela Divis˜ao de Popula¸c˜ao das Na¸c˜oes Unidas19, Max Galka20 planejou

visualizar esse grande volume de dados em um mapa chamado World Migration Map21 (Mapa de Migra¸c˜ao Mundial). Este mapa de bolhas (o tamanho da bolha indica a

con-centra¸c˜ao dos dados) mostra a imigra¸c˜ao l´ıquida estimada (entradas menos sa´ıdas) por pa´ıs de origem e destino entre 2010 e 2015. Os c´ırculos azuis significam migra¸c˜ao l´ıquida positiva (migrante), os c´ırculos vermelhos significam migra¸c˜ao l´ıquida negativa (emigrante) e cada ponto amarelo representa 1.000 pessoas, como mostra a Figura 17. Este mapa foi constru´ıdo em Javascript, utilizando as bibliotecas D322, three.js23 e MapboxGL24. O

17http://hanshack.com/aleppo/#berlin - Acessado em: 09 de outubro de 2018. 18https://www.carto.com - Acessado em: 23 de novembro de 2018.

19www.un.org/en/development/desa/population - Acessado em: 09 de outubro de 2018. 20www.metrocosm.com/about - Acessado em: 09 de outubro de 2018.

21www.metrocosm.com/global-migration-map.html - Acessado em: 09 de outubro de 2018. 22www.d3js.org - Acessado em: 05 de novembro de 2018.

23www.threejs.org - Acessado em: 05 de novembro de 2018.

(32)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 22

Figura 16 – Proje¸c˜ao dos dados de destrui¸c˜ao da cidade de Aleppo na cidade de Berlim. A cor avermelhada representa a reproje¸c˜ao da destrui¸c˜ao.

Fonte: Aleppo in Berlin (2017).

c´odigo da aplica¸c˜ao ´e fechado, por´em a aplica¸c˜ao ´e colaborativa, visto que os usu´arios podem sugerir diversas altera¸c˜oes nas localiza¸c˜oes.

O Bike Share Map25 (Mapa de Compartilhamento de Bicicletas) ´e uma aplica¸c˜ao

web que mostra os locais das esta¸c˜oes de acoplamento associadas aos sistemas de com-partilhamento de bicicletas de mais de 300 cidades em todo o mundo. Cada esta¸c˜ao de acoplamento ´e representada por um c´ırculo, seu tamanho e cor, dependendo do tamanho e do n´umero de bicicletas atualmente nele, como mostra a Figura 18. O c´odigo da aplica¸c˜ao n˜ao ´e aberto e, al´em do OpenStreetMap26, para o desenvolvimento desta aplica¸c˜ao fora

usado a ferramenta de desenvolvimento de mapas Mapnik27, e principalmente para o desenho dos c´ırculos de forma dinˆamica, fora usado a biblioteca OpenLayers 428.

Como citado anteriormente, Vila (2016) propˆos uma interface de visualiza¸c˜ao de dados integrando diversas bases de dados abertos, como IPPUC, URBS (Urbaniza¸c˜ao de Curitiba)29, Open Street Map e Google Maps, todas relacionadas a mobilidade urbana da

cidade de Curitiba. O maior desafio era criar uma interface de visualiza¸c˜ao e consulta ´unica, que permitisse apresentar esses dados integrados sem perder a semˆantica. A visualiza¸c˜ao de

25www.bikes.oobrien.com - Acessado em: 09 de outubro de 2018. 26www.openstreetmap.org - Acessado em: 09 de outubro de 2018.

27www.github.com/mapnik/mapnik - Acessado em: 09 de novembro de 2018. 28www.openlayers.org/ - Acessado em: 09 de novembro de 2018.

(33)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 23

Figura 17 – Mapa de migra¸c˜ao global de 2010 a 2015.

Fonte: Max Galka (2016).

Figura 18 – Visualiza¸c˜ao da interface do Bike Share Map.

Fonte: Bike Share Map (2013).

Vila (2016) utilizou clusteriza¸c˜ao de dados por k-means e pelo algoritmo de clusteriza¸c˜ao Marker Clusterer, que ser˜ao abordados a seguir.

A Tabela 1 abaixo apresenta um comparativo das aplica¸c˜oes de visualiza¸c˜ao de dados geogr´aficos citados anteriormente em rela¸c˜ao ao trabalho proposto neste projeto. A tabela leva em considera¸c˜ao a interatividade dos dados (se os dados visualizados na

(34)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 24

tela s˜ao animados, comportam-se em tempo real ou permanecem est´aticos), as principais de t´ecnicas de visualiza¸c˜ao de dados no mapa (t´ecnicas como clusteriza¸c˜ao, Heat Map, geometria vetorial, etc) e se a aplica¸c˜ao ´e colaborativa (se usu´arios podem contribuir com informa¸c˜oes para a aplica¸c˜ao).

Tabela 1 – Comparativo de aplica¸c˜oes de visualiza¸c˜ao de dados geogr´aficos.

Vila (2016)

Google

Maps Waze Flightradar24

Aleppo in Berlin World Migration Map Bike Share Map The Globe of Economic Complexity Este trabalho

Interatividade Est´atico Animado/ Tempo real

Animado/ Tempo real

Animado/

Tempo real Est´atico Animado Tempo

real Animado Est´atico Principais

t´ecnicas de Visualiza¸c˜ao

Clusteriza¸c˜ao Dot Map Dot Map Dot Map Chloropleth Map

Bubble Map

Bubble

Map Dot Map Clusteriza¸c˜ao

Colaborativo N˜ao Sim Sim N˜ao N˜ao N˜ao N˜ao N˜ao N˜ao

Dados

abertos Sim N˜ao N˜ao N˜ao Sim Sim Sim Sim Sim

Fonte: Autoria pr´opria.

2.3.4 VISUALIZA ¸C ˜AO DE DADOS DE ACIDENTES DE TR ˆANSITO

Nesta se¸c˜ao, ainda dentro do ˆambito de visualiza¸c˜ao de dados e como foco principal deste trabalho, ser˜ao apresentados alguns exemplos de aplica¸c˜oes que utilizam visualiza¸c˜ao de acidentes de trˆansito e, ao fim da se¸c˜ao, ser´a apresentada uma tabela de compara¸c˜ao das aplica¸c˜oes citadas com o trabalho proposto neste projeto.

Com base nos dados do Fatality Analysis Reporting System (FARS)30 do US

Department of Transportation (Departamento de Transporte dos Estados Unidos)31, o

Mapping 10 Years of Fatal Traffic Accidents32´e um mapa virtual que mostra a localiza¸c˜ao de todos os acidentes de trˆansito fatais dos Estados Unidos entre os anos de 2004 e 2013. Para o desenvolvimento desta aplica¸c˜ao fora usado a ferramenta MapBox33 e o OpenStreetMap. Cada ´ıcone no mapa corresponde a um acidente fatal. A forma do ´ıcone relaciona-se com o indiv´ıduo que morreu no acidente: homem, mulher, crian¸ca (menor de 16 anos) ou m´ultiplos. A cor identifica se a pessoa era motorista, passageiro, pedestre ou ciclista. O mapa ainda permite destacar falhas por fator contribuinte: ´alcool, excesso de velocidade ou dire¸c˜ao distra´ıda, como mostra a Figura 19. Dentre as causas do acidente repassadas pela FARS, trˆes se destacam como as mais significativas e evit´aveis: o ´alcool foi um fator que contribuiu para 31,1% dos acidentes fatais, enquanto o excesso de velocidade contribuiu com 31,2% e a dire¸c˜ao distra´ıda envolveu 17,6% dos acidentes fatais.

30www.nhtsa.gov/research-data/fatality-analysis-reporting-system-fars - Acessado em: 10 de outubro

de 2018.

31www.transportation.gov - Acessado em: 10 de outubro de 2018.

32www.metrocosm.com/10-years-of-traffic-accidents-mapped.html - Acessado em: 10 de outubro de

2018.

(35)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 25

Figura 19 – Visualiza¸c˜ao da interface do Mapping 10 Years of Fatal Traffic Accidents.

Fonte: Mapping 10 Years of Fatal Traffic Accidents (2015).

Utilizando dados abertos do departamento de trˆansito34 sobre acidentes, dados

estat´ısticos35 de les˜oes e mortes e seus custos relacionados a acidentes de trˆansito e dados

sobre delimita¸c˜oes espaciais dos bairros, todos relacionados a cidade de Seattle (EUA), o Seattle Collisions36 ´e um mapa virtual que mostra a visualiza¸c˜ao, utilizando clusteriza¸c˜ao, destes dados nos ´ultimos 10 anos, como mostra a Figura 20. O desenvolvimento desta aplica¸c˜ao foi realizado com a tecnologia OpenStreetMaps, em conjunto da biblioteca javascript Leaflet37.

Citado anteriormente, o New York City Open Data ´e um portal que disponibiliza diversos tipos de dados abertos sobre a cidade de Nova Iorque. Al´em da disponibiliza¸c˜ao dos dados abertos sobre acidentes de trˆansito, o portal tamb´em oferece uma visualiza¸c˜ao destes dados de forma customizada, permitindo a visualiza¸c˜ao por pontos, heat map e regi˜ao, como mostra a Figura 21. As tecnologias utilizadas na implementa¸c˜ao das visualiza¸c˜oes foram as j´a citadas OpenStreetMap e Carto.

O The Boston Crash Model38´e um projeto liderado por volunt´arios que trabalham em parceria com a cidade de Boston (EUA), que tem como objetivo eliminar acidentes fatais e graves at´e 2030. A prefeitura espera que a ciˆencia de dados torne poss´ıvel entender

34www.data-seattlecitygis.opendata.arcgis.com/datasets?t=transportation - Acessado em: 15 de outubro

de 2018.

35www.injuryfacts.nsc.org/motor-vehicle/overview/introduction - Acessado em: 15 de outubro de 2018. 36www.seattlecollisions.timganter.io/collisions - Acessado em: 15 de outubro de 2018.

37www.leafletjs.com/- Acessado em: 23 de novembro de 2018

(36)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 26

Figura 20 – Visualiza¸c˜ao da interface do Seattle Collisions.

Fonte: Seattle Collisions (2017).

Figura 21 – Interface do New York City Open Data. Visualiza¸c˜ao de acidentes por pontos (cima), heat map (meio) e regi˜ao (baixo).

Fonte: New York City Open Data (2017).

o que torna alguns locais mais perigosos que outros em termos de acidentes de trˆansito. Al´em do mapeamento dos dados abertos39 de acidentes, o modelo ainda prevˆe, para cada

(37)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 27

segmento de estrada e interse¸c˜ao, para cada semana, a chance de ocorrˆencia de um acidente, como mostra a Figura 22. Toda a parte de visualiza¸c˜ao fora feita atrav´es da ferramenta de cria¸c˜ao de mapas interativos ArcGis40, da empresa Esri41.

Figura 22 – Interface do The Boston Crash Model.

Fonte: The Boston Crash Model (2018).

O IPPUC, como citado anteriormente, desenvolveu uma interface de visualiza¸c˜ao de dados geogr´aficos de acidentes de trˆansito com v´ıtimas fatais no munic´ıpio de Curitiba, utilizando os dados abertos da PRF, como mostrado na Figura 2. Para o desenvolvimento da interface, foram utilizadas as ferramentas Tableau42 para a os gr´aficos e MapBox para

o mapa interativo. Diferente do que foi proposto por Vila (2016), por exemplo, o projeto do IPPUC n˜ao utilizou t´ecnicas de clusteriza¸c˜ao.

Em 2013, B˚ard Romstad propˆos uma interface43 de visualiza¸c˜ao dos dados de

acidentes de trˆansito daquele ano na cidade de Oslo, na Noruega, chamada de Markercluster Pie Charts. Esta aplica¸c˜ao utiliza gr´aficos de rosca na customiza¸c˜ao do cluster, separando-o em partes cseparando-omseparando-o mseparando-ostra a Figura 23, separando-onde separando-os acidentes fseparando-oram divididseparando-os cseparando-onfseparando-orme mostra o ´ındice da figura. Para tal, foi utilizada a biblioteca D3.js do Javascript. Para o desenvolvimento da interface proposta neste trabalho, utilizou-se o c´odigo aberto da aplica¸c˜ao Markercluster Pie Charts. Com isso, foi poss´ıvel adaptar os gr´aficos de rosca citados acima.

40https://www.arcgis.com/index.html - Acessado em: 23 de novembro de 2018. 41https://www.esri.com/en-us/home - Acessado em: 24 de novembro de 2018. 42www.tableau.com - Acessado em: 12 de abril de 2019.

(38)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 28

Figura 23 – Interface do Markercluster Pie Charts.

Fonte: Markercluster Pie Charts (2013).

Durante o levantamento das informa¸c˜oes das aplica¸c˜oes de visualiza¸c˜ao de acidentes, constatou-se que na pesquisa por aplica¸c˜oes que possuem foco em acidentes de trˆansito, muito pouco, ou nada, existe de concreto a n´ıvel de Brasil nesta ´area, com grande predom´ınio de aplica¸c˜oes feitas nos Estados Unidos.

A Tabela 2 abaixo mostra um comparativo das aplica¸c˜oes de visualiza¸c˜ao de acidentes de trˆansito citadas nesta se¸c˜ao e anteriormente no decorrer do projeto. A tabela leva em considera¸c˜ao, a exemplo da Tabela 1, a interatividade dos dados (se os dados visualizados na tela s˜ao animados, comportam-se em tempo real ou permanecem est´aticos), as principais t´ecnicas de visualiza¸c˜ao de dados no mapa (t´ecnicas como clusteriza¸c˜ao, Heat Map, Dot Map, etc.), se a aplica¸c˜ao ´e colaborativa (se usu´arios podem contribuir com informa¸c˜oes para a aplica¸c˜ao), se utiliza dados abertos, se a aplica¸c˜ao possui foco em acidentes de trˆansito e disponibiliza¸c˜ao hist´orica de acidentes.

Google Maps e Waze s˜ao duas das aplica¸c˜oes mais populares no Brasil quando se trata se trata de visualiza¸c˜ao de dados de trˆansito e, como ilustrado na Tabela 2, ambos possuem ferramentas de visualiza¸c˜ao de acidentes de trˆansito. Por´em, como citado anteriormente, esse n˜ao ´e o foco destas aplica¸c˜oes, fazendo com que esses dados n˜ao se aprofundem nos acidentes, mas sim na localiza¸c˜ao do acidente, proporcionando ao usu´ario uma rota alternativa para desvio. Al´em disso, ambos dependem das informa¸c˜oes disponibilizadas pelos seus usu´arios para o mapeamento de acidentes, o que torna todo o sistema vulner´avel a usu´arios mal-intencionados que podem tentar alterar ou fornecer informa¸c˜oes falsas ao sistema. Sob estas condi¸c˜oes, estes servi¸cos enfrentam uma s´erie de vulnerabilidades de seguran¸ca e qualidade de dados (VILA, 2016).

(39)

Cap´ıtulo 2. REVIS ˜AO DE LITERATURA 29

Tabela 2 – Comparativo de aplica¸c˜oes de visualiza¸c˜ao de dados de acidentes de trˆansito.

Google Maps Waze Mapping 10 Years of Fatal Traffic Accidents Seattle Collisions NYPD Motor Vehicle Collisions The Boston Crash Model IPPUC Markercluster Pie Charts Este trabalho Interatividade Animado/ Tempo real Animado/ Tempo real

Est´atico Est´atico Est´atico Est´atico Est´atico Est´atico Est´atico

T´ecnica de visualiza¸c˜ao Dot Map Dot Map Dot Map Clusteriza¸c˜ao Heat Map/ Clusteriza¸c˜ao Heat Map Dot

Map Clusteriza¸c˜ao Clusteriza¸c˜ao

Colaborativo Sim Sim N˜ao N˜ao N˜ao N˜ao N˜ao N˜ao N˜ao

Dados

abertos N˜ao N˜ao Sim Sim Sim Sim Sim Sim Sim

Foco em acidentes de trˆansito

N˜ao N˜ao Sim Sim Sim Sim Sim Sim Sim

Hist´orico

de acidentes N˜ao N˜ao Sim Sim Sim Sim Sim N˜ao Sim

Fonte: Autoria pr´opria.

Todas as aplica¸c˜oes citadas na Tabela 2 utilizam o OpenStreetMap e, com exce¸c˜ao do Seattle Collisions e Markercluster Pie Charts, que fazem uso de bibliotecas do Javascript, s˜ao utilizadas ferramentas pagas especializadas em visualiza¸c˜ao de mapas. Al´em disso, a maioria delas n˜ao faz uso de ferramentas de clusteriza¸c˜ao (o que gera sobreposi¸c˜ao dos dados e dificulta o entendimento dos mesmos), al´em de n˜ao possu´ırem c´odigo aberto.

Este trabalho prop˜oe, inspirado pelas interfaces de visualiza¸c˜ao de IPPUC44

e Markercluster Pie Charts45, bem como na t´ecnica de clusteriza¸ao de Vila (2016),

utilizando a base de dados da PRF, gerados por Kozievitch, Berardi e Kageyama (2019), uma ferramenta de visualiza¸c˜ao, de c´odigo aberto, com o intuito de facilitar a identifica¸c˜ao de padr˜oes visuais nos acidentes.

44www.ippuc.org.br/mapasinterativos/acidentesDeTransito/dashboard.html 45http://bl.ocks.org/gisminister/10001728

(40)

30

3 METODOLOGIA

A metodologia deste trabalho est´a dividida em 05 etapas, como ilustrado abaixo na Figura 24.

A primeira etapa consistiu no levantamento bibliogr´afico de diversas publica¸c˜oes e aplica¸c˜oes, cujos temas est˜ao fortemente relacionados com os objetivos deste trabalho. Os principais conceitos acerca de cidades inteligentes, visualiza¸c˜ao de dados geogr´aficos e de acidentes, SIG e dados abertos foram retirados destes trabalhos, com o intuito de contextualizar parte da problem´atica levantada neste projeto.

A segunda etapa consistiu no aprofundamento da an´alise dos dados abertos de acidentes de trˆansito disponibilizados pela PRF e gerados por Kozievitch, Berardi e Kageyama (2019), na an´alise das aplica¸c˜oes de visualiza¸c˜ao de acidentes de trˆansito e das interfaces de visualiza¸c˜ao desenvolvidas por Vila (2016), IPPUC e MarkerCluster Pie Charts1, que serviram de guia para este projeto. Nesta etapa tamb´em foi desenvolvido um question´ario direcionado a comunidade em geral com o intuito de investigar a relevˆancia do projeto proposto, bem como adquirir informa¸c˜oes que viessem a auxiliar o restante do projeto.

A terceira etapa consistiu na modelagem e desenvolvimento da interface de visualiza¸c˜ao proposta, adaptando os conceitos e ferramentas relevantes das interfaces de Vila (2016), IPPUC e MarkerCluster Pie Charts, gerando um prot´otipo para a quarta etapa.

Na quarta etapa foram realizados testes na interface do prot´otipo, assim como houve uma avalia¸c˜ao da mesma por um grupo de usu´arios com o intuito de verificar a sua funcionalidade, identificar eventuais falhas e sugest˜oes de melhoria.

A quinta etapa consistiu na an´alise dos resultados obtidos em todas as etapas do projeto e da visualiza¸c˜ao em si, bem como o apontamento de conclus˜oes, informa¸c˜oes relevantes obtidas na etapa de an´alise e considera¸c˜oes a respeito das dificuldades encontradas durante o projeto.

(41)

Cap´ıtulo 3. METODOLOGIA 31

Figura 24 – Etapas da metodologia utilizada.

(42)

32

4 DESENVOLVIMENTO

Nesta se¸c˜ao s˜ao apresentados os resultados obtidos com a aplica¸c˜ao dos question´ a-rios elaborados, a arquitetura da aplica¸c˜ao e quais tecnologias foram usadas, a descri¸c˜ao da base de dados, a descri¸c˜ao da interface, as principais consultas utilizadas e os desafios encontrados nesta etapa.

4.1 AN ´ALISE DO PROBLEMA

Com base em um question´ario aplicado de 30/04/2019 `a 17/09/2019, com 30 respostas de usu´arios escolhidos aleatoriamente, nota-se que as rodovias brasileiras tem sido amplamente utilizadas e que elas se mostram perigosas para a maioria dos usu´arios. Ao todo foram 8 perguntas, sendo 7 obrigat´orias e 1 opcional. O objetivo principal da pesquisa foi o levantar informa¸c˜oes acerca do perfil, opini˜oes e sugest˜oes de usu´arios das rodovias federais brasileiras (passageiro, motorista, etc), bem como dimensionar o interesse na aplica¸c˜ao desenvolvida. O question´ario pode ser encontrado no Apˆendice A.

Algumas caracter´ısticas relevantes da amostra s˜ao:

• A respeito da idade, 15 possuem entre 18 e 21 anos (50%), 7 entre 25 e 29 anos (23,3%), 6 entre 22 e 24 anos (20%), 1 entre 40 e 49 anos (3,33%) e 1 com 50 anos

ou acima (3,33%).

• A respeito do gˆenero, 24 s˜ao do sexo masculino (80%) e 6 s˜ao do sexo feminino (20%).

• A respeito do uso de rodovias federais, 27 fazem uso de alguma rodovia, seja como motorista ou passageiro (90%), enquanto 3 n˜ao usam nenhuma (10%).

• A respeito de acidentes nas rodovias, 24 j´a sofreram, ou possuem algum conhe-cido/familiar que se envolveu em algum acidente em rodovias brasileiras (80%), 6 n˜ao possuem (20%).

• A respeito de seguran¸ca nas rodovias brasileiras, 21 as consideram perigosas (70%), 5 as acham seguras (16,7%) e 4 n˜ao sabem opinar (13,3%).

• A respeito da aplica¸c˜ao desenvolvida, dada a descri¸c˜ao, 21 fariam uso da aplica¸c˜ao (70%), 6 n˜ao souberam opinar (20%) e 3 n˜ao fariam uso (10%).

• A respeito da capacidade da aplica¸c˜ao em auxiliar a identifica¸c˜ao de padr˜oes de acidentes e, possivelmente, ajudar na redu¸c˜ao dos mesmos, 20 acham que a aplica¸c˜ao ajudaria na redu¸c˜ao (66,7%), 6 n˜ao souberam opinar (20%) e 4 acham que n˜ao ajudaria (13,3%).

A pergunta opcional do question´ario se tratava de sugest˜oes do usu´ario sobre qual tipo de informa¸c˜ao este gostaria de visualizar na aplica¸c˜ao. As respostas est˜ao resumidas na lista a seguir:

(43)

Cap´ıtulo 4. DESENVOLVIMENTO 33

• Qualidade das rodovias (estado do asfalto, ilumina¸c˜ao, etc.), tipos de via (simples, dupla, etc.), sinaliza¸c˜ao e radares (quantidade de multas).

• Gr´afico com os n´umeros de acidentes ao longo dos anos.

• N´umero de ´obitos, causas, locais, hor´arios e datas com maior incidˆencia de acidentes. • Interface sem polui¸c˜ao visual.

• Desvio de rota com acidentes, como no aplicativo Waze. • Dicas de preven¸c˜ao de acidentes.

Com exce¸c˜ao de informa¸c˜oes espec´ıficas que n˜ao se encontram na base de dados de acidentes da PRF, como estado de asfalto, ilumina¸c˜ao e infra¸c˜oes de trˆansito, as demais informa¸c˜oes foram disponibilizadas na aplica¸c˜ao. A sugest˜ao de desvio de rotas de acidentes, como no aplicativo Waze, faz mais sentido em uma aplica¸c˜ao que utilize algum sistema de GPS, o que n˜ao ´e o caso. As dicas de preven¸c˜ao de acidentes poderiam ser implementadas,

levando-se em considera¸c˜ao os tipos de acidentes, em um trabalho futuro.

4.2 ARQUITETURA

A arquitetura da aplica¸c˜ao ´e uma arquitetura espec´ıfica para SIGs, como citado no Cap´ıtulo 2, na Figura 9, e adaptado para a arquitetura ilustrada na Figura 25 abaixo.

O prot´otipo de visualiza¸c˜ao foi desenvolvido para a web e utiliza a arquitetura apresentada na Figura 25: PostgreSQL 11.01 e PostGIS 6.5.22 (camada de dados); Node.js

8.12.03 e Express 4.17.04 (camada de processamento); HTML, CSS, JavaScript, D3 3.5.17

e Leaflet 0.7.2 e OpenStreetMap (camada de apresenta¸c˜ao). Figura 25 – Arquitetura da aplica¸c˜ao.

Fonte: Autoria pr´opria.

1www.postgresql.org - Acessado em: 31 de outubro de 2018. 2www.postgis.net - Acessado em: 31 de outubro de 2018. 3www.nodejs.org/en - Acessado em: 31 de outubro de 2018. 4www.expressjs.com/pt-br - Acessado em: 31 de outubro de 2018.

(44)

Cap´ıtulo 4. DESENVOLVIMENTO 34

O servidor de banco de dados utilizado ´e composto por dois cores AMD EPYC 7401 com 1.5GB e mem´oria, sistema operacional Debian 9 e Kernel 5.1.

A m´aquina utilizada para o desenvolvimento da interface possui as seguintes caracter´ısticas: processador Intel i5 7500, armazenamento de 1TB de HD, 24GB de mem´oria RAM e sistema operacional Windows 10 Home. Para o desenvolvimento dos testes com o usu´ario, foi utilizado uma m´aquina com as seguintes caracter´ısticas: processador Intel i3 3220, armazenamento de 1TB de HD, 6GB de mem´oria RAM e sistema operacional Ubuntu 12.04.5 LTS.

4.2.1 BASE DE DADOS

A base de dados referente aos acidentes de trˆansito da PRF utilizadas neste trabalho foram, anteriormente a esta proposta, inseridos em uma base PostgresSQL por Kozievitch, Berardi e Kageyama (2019). Neste trabalho, Kozievitch, Berardi e Kageyama (2019) desenvolveram o script de cria¸c˜ao da tabela de acidentes da PRF, que pode ser visto no Apˆendice D. Neste trabalho foram inseridos 10 anos e meio de dados em um servidor PostgresSQL, com mais de 1.5 milh˜oes de tuplas. A Figura 26 apresenta os dados da PRF. Os principais ´ındices criados foram para: ano, BR, KM, entre outros.

Figura 26 – Diagrama da base de dados.

(45)

Cap´ıtulo 4. DESENVOLVIMENTO 35

4.2.1.1 LIMPEZA DOS DADOS

Ap´os a inser¸c˜ao dos dados na base, percebeu-se que alguns dados n˜ao poderiam ser utilizados na aplica¸c˜ao. Por exemplo, alguns dados possu´ıam latitude e longitude incorretas, apontando para locais fora do Brasil, at´e mesmo no oceano. Dados com latitude ou longitude faltando (nulos) tamb´em foram descartados. Ao todo foram exclu´ıdos 124.892 dados de acidentes.

Tamb´em foi feito uma padroniza¸c˜ao nas colunas referentes ao dia da semana e a causa do acidente, pois as mesmas apresentavam dados que, apesar de representar a mesma coisa, estavam registrados de forma diferente. Ex: ”S´abado” e ”s´abado”, ”pista escorregadia” e ”Pista escorregadia”.

Como a visualiza¸c˜ao trabalha com as horas inteiras (das 18:00 `as 18:59, por exemplo), tamb´em fora criado um campo extra espec´ıfico para esse dado, pois extrair apenas a hora da coluna ”data inversa” em todas as consultas ´e extremamente custoso. 4.2.1.2 CARACTER´ISTICAS DOS DADOS

Uma breve an´alise dos dados est´a listada a seguir. Para o exemplo, foram feitas as consultas de n´umeros de acidentes por hor´ario, tipos de acidentes mais relevantes, n´umero de mortes por dia da semana e n´umero de acidentes por dia da semana.

A Figura 27 mostra a quantidade de acidentes em rela¸c˜ao ao hor´ario em que ocorreram. Nota-se que a maior parte dos acidentes ocorre `as 18h00, o que costuma ser comum na maioria dos pa´ıses, como visto em Kozievitch, Berardi e Kageyama (2019).

Figura 27 – N´umero de acidentes x hor´ario.

(46)

Cap´ıtulo 4. DESENVOLVIMENTO 36

A Figura 28 mostra quais tipos de acidentes mais ocorreram no per´ıodo. Nota-se que colis˜ao traseira lidera como a maior causa de acidentes nas rodovias.

Figura 28 – Tipos de acidentes mais relevantes.

Fonte: Kozievitch, Berardi e Kageyama (2019).

A Figura 29 mostra a quantidade de ´obitos em rela¸c˜ao aos dias da semana. Nota-se que a maioria dos acidentes com ´obitos ocorre aos finais de semana.

Figura 29 – N´umero de mortes x dia da semana.

Fonte: Kozievitch, Berardi e Kageyama (2019).

A Figura 30 mostra a quantidade de acidentes em rela¸c˜ao aos dias da semana. Nota-se que, a exemplo da Figura 29, a maioria dos acidentes acontece nos finais de semana,

Referências

Documentos relacionados

Além das espécies selvagens, existem também algumas variedades de tomate da espécie Solanum lycopersicum que podem ser utilizadas como fontes de resistência a algumas pragas, entre

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

a) O polícia disse um palavrão, após ter saído da casa de Adrian. Corrige as falsas.. A mãe também está com gripe. “Quase que não consegui ficar calado quando vi que não

Tanto em sua paisagem física como em sua paisagem humana, o Mediterrâneo encruzilhada, o Mediterrâneo heteróclito apresenta-se em nossas lembranças como uma imagem coerente, como

No primeiro, destacam-se as percepções que as cuidadoras possuem sobre o hospital psiquiátrico e os cuidados com seus familiares durante o internamento; no segundo, evidencia-se

Dessa forma, diante das questões apontadas no segundo capítulo, com os entraves enfrentados pela Gerência de Pós-compra da UFJF, como a falta de aplicação de

Muito embora, no que diz respeito à visão global da evasão do sistema de ensino superior, o reingresso dos evadidos do BACH em graduações, dentro e fora da

Depois de considerar a confidência, conteúdo, distribuição, e assuntos de oportunidade associadas com a distribuição de um relatório, um controlador pode, então,