Infrações em Rodovias Federais
DADOS ABERTOS
Histórico de Revisão
Data Versão Descrição Autores E-mail
04/08/2015 1.0 Concepção do documento Gilmar.Santos gilmar.santos.prestador@prf.gov.br
05/08/2015 1.1 Revisão do Documento Raphael Valente raphael.vieira.prestador@prf.gov.br
Sumário
1. Glossário ... 4
2. Introdução ... 4
3. Análise de Viabilidade ... 5
4. Visão Geral do Projeto ... 5
1.1 Análise do Cenário Atual ... 5
1.2 Descrição das Tecnologias Utilizadas ... 6
1.3 Experimentos ... 7
1.4 Conclusão... 8
1.
Glossário
Glossário de termos utilizados neste artefato:
I. SISCOM - cataloga todos as multas registradas nas rodovias federais e que são administradas e mantidas pela PRF;
II. MJ – Ministério da Justiça;
III. Open Government Data – grupo de trabalho do Open Knowledge Foundation. A expressão governo aberto (open government) refere-se a projetos e ações que visam à promoção da transparência, à luta contra a corrupção, ao incremento da participação social e ao desenvolvimento de novas tecnologias, de modo a tornar os governos mais abertos, efetivos e responsáveis.
IV. PDA – Portal de Dados Abertos do Governo Federal do Brasil. Repositório de dados abertos do governo Brasileiro.
V. PDAG – Programa de Dados Abertos Governamentais;
VI. SIGER – Sistema de Informações Gerenciais;
2.
Introdução
Em atendimento às diretrizes do Programa de Dados Abertos Governamentais (PDAG), da Polícia Rodoviária Federal (PRF) disponibiliza dados referentes às multas em Rodovias Federais Brasileiras. A disponibilização desses dados está de acordo com os cinco motivos para a abertura de dados na Administração Pública, que são:
1. Transparência na gestão pública;
2. Contribuição da sociedade com serviços inovadores ao cidadão; 3. Aprimoramento na qualidade dos dados governamentais; 4. Viabilização de novos negócios e
5. Obrigatoriedade por lei.
Além desses motivos, o conjunto de dados disponibilizados está aderente aos oito princípios fundamentados pelo grupo de trabalho do Open Government Data que se reuniu na Califórnia, Estados Unidos da América, em 2007. Sendo esses princípios:
1. Completos – Todos os dados públicos são disponibilizados. Dados são informações eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são caracterizados por não estarem sujeitos às limitações válidas de privacidade, segurança ou controle de acesso, reguladas por estatutos;
2. Primários – Os dados são publicados na forma coletada na fonte com a mais fina granularidade possível e não na forma agregada ou transformada;
3. Atuais – Os dados são disponibilizados o quão rapidamente seja necessário para preservar o seu valor;
4. Acessíveis – Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis;
5. Processáveis por máquina – Os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado;
6. Acesso não discriminatório - os dados estão disponíveis à todos, sem que seja necessária identificação ou registro;
8. Livres de licenças – Os dados não estão sujeitos às regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos. Os dados são originários do Sistema BrBrasil - que cataloga todos os boletins de ocorrência registrados após um acidente em uma rodovia federal e que é administrado e mantido pela PRF. A base de dados do BrBrasil é consolidada no Sistema de Informações Gerenciais (SIGER).
3.
Análise de Viabilidade
A PRF mediante a expertise em processamento de dados e a qualidade em infraestrutura de processamento e armazenamento de dados é possível realizar a extração e disponibilizar os dados oriundos do Sistema SISCOM em periodicidade trimestral a partir do ano de 2007. Os dados serão extraídos a partir de sistema extrator dedicado, construído em tecnologia JAVA e que isenta os dados de manipulação, apenas organizando esses dados e viabilizando a seleção de valores domínios relacionados em substituição aos valores codificados.
4.
Visão Geral do Projeto
N o m e d o P ro j e t o C ó d i g o
Prospecção de Dados Abertos PDA
R e s p o n s á v e l p e l o D a d o s Ár e a d e l o t a ç ã o
Gilmar Correa dos Santos DIASI
E- m a i l T e l e f o n e
diasi@prf.gov.br 61 20256805
1.1 Análise do Cenário Atual
Em 2013, a PRF - a partir de solicitação do MJ - forneceu um conjunto de dados para alimentar o Portal de Dados Abertos – PDA. Esses dados estavam agrupados em periodicidade semestral e em formato não estruturado. Visando facilitar o acesso à informação e evitar dualidade de conceitos, o DPRF decidiu agrupar os dados e substituir os códigos pelos seus respectivos domínios, sendo essa a única manipulação nesses dados, a fim de preservar os princípios fundamentados pelo Open Government Data. Assim, a reconstrução da informação será facilitada, para qualquer tipo de técnica ou ferramenta que o usuário queira utilizar. Até mesmo a interpretação desses dados será imediata, mediante a inexistência da necessidade de relacionamento com outras fontes.
1.1.1. Necessidade do Negócio
1. Os dados serão gerados em periodicidade trimestral a partir de 2010, contendo as seguintes informações:
Atributo Atributo de Origem Tipo de Dados Tabela de Origem Descrição
Ano da Infração dat_infracao DATE tbl_historico_
auto
Ano do registro da
infração
Trimestre da Infração dat_infracao DATE tbl_historico_
auto
Trimestre do registro da infração
Código da Infração cod_infracao VARCHAR(5) tbl_infracao_
cometida
Código da infração
cometida
Descrição Abreviada da Infração des_abreviada VARCHAR(25
5)
tbl_infracao Descrição Abreviada da Infração cometida
Gravidade gravidade VARCHAR(10) gravidade_inf
racao
Gravidade da Infração
Descrição do Tipo Veículo tip_auto INTEGER tbl_historico_
auto
Descrição do Tipo
Veículo
Descrição da Espécie Espécie_veiculo VARCHAR(15) infracao Descrição da Espécie do
Veículo
UF Município uf_infracao VARCHAR(2) tbl_ai_valido Unidade da Federação
do Município da Infração cometida
Nome Município nome_municipio VARCHAR(25
5)
tbl_municipio Nome do Município da Infração cometida
Número BR Infração tmundenominacao VARCHAR(60) municipio Município da Infração
cometida
Número KM Infração km VARCHAR(10) Tbl_infracao Quilômetro da Infração
Nacionalidade do Veículo ind_veiculo_estran
geiro
CHAR(1) tbl_ai_valido Nacionalidade do
Veículo
Valor da Multa vl_multa VARCHAR(10) tbl_multa Valor da Multa
1.2 Descrição das Tecnologias Utilizadas
Origem Informação SGBD Banco de Dados Schema/Diretório
IBM - Informix sicom-infracoes siscom
Destino da Informação
Tipo de Arquivo Tipo de Envio Diretório de destino
Arquivo separado por
virgula (.csv),
compactação (.zip).
Deve ser definido um tipo de envio, por exemplo: FTP,
SMTP entre outros.
Deverá ser definido o diretório de envio para que os arquivos sejam enviados e armazenados.
1.3 Experimentos
Para a extração dos dados referentes à multas por infrações em rodovias federais, foi construído um processo de extração que consiste na seguinte estrutura:
O processo de extração consiste em acessar a base de dados do Contexto Multas no SIGER e extração direta dos dados, por ano e trimestre. Substituição dos códigos de referência pelos respectivos domínios e disponibilização em arquivo compactado no formato arquivo separado por vírgula (.csv).
1.4 Conclusão
A partir da análise apresentada concluímos que o projeto é viável com ampla possibilidade de execução de imediato na periodicidade indicada, ou seja, trimestral. Com dados em formato separado por vírgula, compactado e que poderá ser enviado pelo modo mais adequado, FTP, entre outros, para o endereço (repositório) indicado.
1.5 Referências
1. Open Knowledge Brasil – http://br.okfn.org;
2. Open Government Data – http://opengovernmentdata.org; 3. Open Government Data: The Book – https://opengovdata.io; 4. PBDA – Portal Brasileiro de Dados Abertos – http://dados.gov.br