Acidentes em Rodovias Federais
DADOS ABERTOS
Histórico de Revisão
Data Versão Descrição Autores E-mail
21/07/2015 1.0 Concepção do documento Gilmar Santos [email protected]
Sumário
1. Glossário ... 4
2. Introdução ... 4
3. Análise de Viabilidade ... 5
4. Visão Geral do Projeto ... 5
4.1 Análise do Cenário Atual ... 5
4.2 Descrição das Tecnologias Utilizadas ... 7
4.3 Experimentos ... 7
5 Conclusão ... 8
1.
Glossário
Glossário de termos utilizados neste artefato:
I. BrBrasil - cataloga todos os boletins de ocorrência registrados após um acidente em uma rodovia federal e que é administrado e mantido pelo PRF;
II. MJ – Ministério da Justiça;
III. Open Government Data – grupo de trabalho do Open Knowledge Foundation. A expressão governo
aberto (open government) refere-se a projetos e ações que visam à promoção da transparência, à luta contra a corrupção, ao incremento da participação social e ao desenvolvimento de novas tecnologias, de modo a tornar os governos mais abertos, efetivos e responsáveis.
IV. PDA – Portal de Dados Abertos do Governo Federal do Brasil. Repositório de dados abertos do governo Brasileiro.
V. PDAG – Programa de Dados Abertos Governamentais;
VI. SIGER – Sistema de Informações Gerenciais;
2.
Introdução
Em atendimento às diretrizes do Programa de Dados Abertos Governamentais (PDAG), da Polícia Rodoviária Federal (PRF) disponibiliza dados referentes as ocorrências classificadas como ‘ACIDENTE’ nas Rodovias Federais Brasileiras. A disponibilização desses dados está de acordo com os cinco motivos para a abertura de dados na Administração Pública, que são:
1. Transparência na gestão pública;
2. Contribuição da sociedade com serviços inovadores ao cidadão; 3. Aprimoramento na qualidade dos dados governamentais; 4. Viabilização de novos negócios e
5. Obrigatoriedade por lei.
Além desses motivos, o conjunto de dados disponibilizados estão aderentes aos oito princípios fundamentados pelo grupo de trabalho do Open Government Data que se reuniu na Califórnia, Estados Unidos da América, em 2007. Sendo esses princípios:
1. Completos – Todos os dados públicos são disponibilizados. Dados são informações eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são dados que não estão sujeitos às limitações válidas de privacidade, segurança ou controle de acesso, reguladas por estatutos;
2. Primários – Os dados são publicados na forma coletada na fonte com a mais fina granularidade possível e não na forma agregada ou transformada;
3. Atuais – Os dados são disponibilizados o quão rapidamente seja necessário para preservar o seu valor;
4. Acessíveis – Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis;
6. Acesso não discriminatório - os dados estão disponíveis a todos, sem que seja necessária identificação ou registro;
7. Formatos não proprietários – Os dados estão disponíveis em um formato sobre o qual nenhum ente tenha controle exclusivo;
8. Livres de licenças – Os dados não estão sujeitos às regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos. Os dados são originários do Sistema BrBrasil - que cataloga todos os boletins de ocorrência registrados após um acidente em uma rodovia federal e que é administrado e mantido pelo PRF. A base de dados do BrBrasil é consolidada no Sistema de Informações Gerenciais (SIGER).
3.
Análise de Viabilidade
Ao DPRF mediante a expertise em processamento de dados e a qualidade em infraestrutura de processamento e armazenamento de dados é possível realizar a extração e disponibilizar os dados oriundos do Sistema BrBrasil em periodicidade trimestral a partir do ano de 2007. Os dados serão extraídos a partir de sistema extrator dedicado, construído em tecnologia JAVA e que isenta os dados de manipulação, apenas organizando esses dados e viabilizando a seleção de valores domínios relacionados em substituição aos valores codificados.
4.
Visão Geral do Projeto
N o m e d o P ro j e t o C ó d i g o
Prospecção de Dados Abertos PDA
R e s p o n s á v e l p e l o D a d o s Ár e a d e l o t a ç ã o
Gilmar Correa dos Santos DIASI
E- m a i l T e l e f o n e
[email protected] (61) 3025-6805
4.1 Análise do Cenário Atual
Em 2013, o PRF - a partir de solicitação do MJ - forneceu um conjunto de dados para alimentar o Portal de Dados Abertos – PDA. Esses dados estavam agrupados em periodicidade semestral e em formato não estruturado. Visando facilitar o acesso a informação e evitar dualidade de conceitos, o DPRF decidiu agrupar os dados e substituir os códigos pelos seus respectivos domínios, sendo essa a única manipulação nesses dados, afim de preservar os princípios fundamentados pelo Open Government Data. Assim a reconstrução da informação será facilitada, para qualquer tipo de técnica ou ferramenta que o usuário queira utilizar. Até mesmo a análise direta desses dados será imediata, mediante a inexistência da necessidade de relacionamento com outras fontes.
4.1.1 Necessidade do Negócio
1. Os dados serão gerados em periodicidade trimestral, contendo as seguintes informações: Observação: o Tipo de Ocorrência registrada se refere ao ‘ACIDENTE’ em Rodovia Federal.
Atributo Atributo de
Origem
Tipo de Dados Tabela de Origem
Descrição
Ano ocodataocorrencia DATE ocorrencia Ano da Ocorrência
Ano/Trimestre ocodataocorrencia DATE ocorrencia Trimestre da Ocorrência
Data ocodataocorrencia DATE ocorrencia Data da Ocorrência
Data e Hora do
Registro da Ocorrência
ocodataregistro TIMESTAMP ocorrencia Data Hora do Registro da
Ocorrência
Status da Ocorrência ocostatus CHAR(1) ocorrencia Status da Ocorrência ("N",
"Aberta"; "S", "Encerrada"; "A", "Anulada"; "E", "Estatística"; "R", "Retificada"; "P", "Em Processo")
UF tufdenominacao VARCHAR(60) uf Unidade da Federação da
Ocorrência
BR lbrbr CHAR(3) localbr Rodovia (BR) da ocorrência
KM lbrkm CHAR(5) localbr Quilometragem em que
aconteceu a ocorrência
Trecho descricao_dprf VARCHAR(255) pnv Descrição do trecho da
ocorrência
Município tmundenominacao VARCHAR(60) municipio Município da Ocorrência
Latitude lbrlatitude CHAR(20) localbr Latitude do trecho da
ocorrência
Longitude lbrlongitude CHAR(20) localbr Longitude do trecho da
ocorrência
Sentido da Via ocosentido CHAR(1) ocorrencia Sentido da via em que
aconteceu a ocorrência
Tipo de Acidente ttacodigo INTEGER tipoacident
e
Identifica o tipo de Acidente da ocorrência
partir do estado físico das
pessoas envolvidas no
acidente.
Qtd. Mortos pesestadofisico SMALLINT pessoa Quantidade de óbitos na
ocorrência
Qtd. Feridos Graves pesestadofisico SMALLINT pessoa Quantidade de pessoas
feridas com gravidade na ocorrência
Qtd. Feridos Leves pesestadofisico SMALLINT pessoa Quantidade de pessoas
feridas levemente na
ocorrência
Qtd. Ilesos pesestadofisico SMALLINT pessoa Quantidade de pessoas
ilesas na ocorrência
4.2 Descrição das Tecnologias Utilizadas
Origem Informação SGBD Banco de Dados Schema/Diretório
IBM - Informix Brbrasil brbrasil
Destino da Informação
Tipo de Arquivo Tipo de Envio Diretório de destino
Arquivo separado por
virgula (.csv), compactação (.zip).
Deve ser definido um tipo de envio, por exemplo: FTP, SMTP
entre outros.
Deverá ser definido o diretório de envio para que os arquivos
sejam enviados e armazenados.
4.3 Experimentos
Para a extração dos dados referentes à acidentes em rodovias federais, foi construído um processo de extração que consiste na seguinte estrutura:
O processo de extração consiste em acessar a base de dados do Contexto BrBrasil no SIGER e extração direta dos dados, por ano e trimestre. Substituição dos códigos de referência pelos respectivos domínios e disponibilização em arquivo compactado no formato arquivo separado por vírgula (.csv).
5
Conclusão
A partir da análise apresentada concluímos que o projeto é viável com ampla possibilidade de execução de imediato na periodicidade indicada, ou seja, trimestral. Com dados em formato separado por vírgula, compactado e que poderá ser enviado pelo modo mais adequado, FTP entre outros, para o endereço (repositório) indicado.
6
Referências
1. Open Knowledge Brasil – http://br.okfn.org;
2. Open Government Data – http://opengovernmentdata.org; 3. Open Government Data: The Book – https://opengovdata.io; 4. PBDA – Portal Brasileiro de Dados Abertos – http://dados.gov.br