Agregando rastreabilidade a dados abertos
governamentais para transparência da informação
Trabalho de Mestrado
Eva Marinello,Fernanda Baião (Orientadora), Claudia Cappelli (Co-orientadora)
Programa de Pós Graduação em Informática – Núcleo de Pesquisa e Prática em Tecnologia (NP2Tec) – Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
Avenida Pasteur, 458 – Urca – CEP 22290-240 – Rio de Janeiro – RJ – Brasil {eva.marinello, fernanda.baiao, claudia.cappelli}@uniriotec.br
Ano de Ingresso no Programa de Mestrado: 2010 Época esperada de conclusão: Setembro de 2012
Etapas já concluídas: Definição da Proposta, Seminário de Acompanhamento
Resumo. Este artigo apresenta uma proposta para aumentar a transparência da informação no contexto dos dados abertos governamentais. Dados Abertos Governamentais representa um conjunto de leis e princípios definidos e que devem ser seguidos pelas organizações públicas. Este trabalho propõe uma extensão dos princípios de dados abertos agregando o conceito de rastreabilidade de modo a tornar as informações disponibilizadas ainda mais transparentes. É apresentado também um mecanismo como forma de operacionalizar rastreabilidade.
Palavras-chave: Transparência da Informação, Dados Abertos Governamentais, Rastreabilidade
1. Introdução
Transparência da informação tem sido um tema relevante e cada vez mais discutido por organizações governamentais e não-governamentais, aumentando assim a necessidade das organizações se posicionarem quanto a este tema. No Brasil, diversas leis têm sido aprovadas no sentido de promover a transparência da informação. A Lei Complementar n°131 sobre liberação de informações financeiras em tempo real [Lei 131, 2009] e a Lei de acesso à informação pública, garante o acesso às informações e sua divulgação [Lei 12.527, 2011]. A Carta de Serviços ao Cidadão obriga a apresentação de determinadas informações ao cidadão [Decreto 6.932, 2009]. Além disso, iniciativas como o Portal da Transparência da CGU [Portal da Transparência] e a iniciativa de Dados Abertos Governamentais também contribuem para demonstrar a importância do tema.
Transparência da informação foi definida [Cappelli, 2009] como “a característica que possibilita ao cidadão acesso, facilidade de uso, qualidade de conteúdo, entendimento e auditoria às/das informações de seu interesse, sob a tutela de centros de autoridade”, e reúne um conjunto de 33 características, dentre elas a rastreabilidade.
Neste mesmo trabalho, rastreabilidade da informação é a capacidade de seguir o desenvolvimento de uma ação ou a construção de uma informação, suas mudanças e justificativas. Na literatura, alguns trabalhos têm endereçado rastreabilidade e evidenciado sua relevância. Na engenharia de requisitos, a rastreabilidade busca suportar toda análise de impacto de mudanças nos requisitos [Santos et al, 2004] [Sayão e Leite, 2005]. Na área de Arquitetura Empresarial, rastreabilidade é primordial no Framework do Zachman, pois relaciona os diversos artefatos organizacionais de modo que se tenha entendimento de seu desdobramento [Zachman, 1987]. No entanto, a análise dos princípios de dados abertos [Open Knowledge Foundation, 2011] e suas contribuições para as características de transparência da informação evidenciam que esta característica não é endereçada neste contexto.
A hipótese desta pesquisa é que se o conceito de rastreabilidade for agregado aos princípios de dados abertos então será possível proporcionar mais transparência da informação no contexto dos dados abertos governamentais. Este trabalho tem como objetivo propor uma extensão de dados abertos agregando o conceito de rastreabilidade, de modo a tornar as informações disponibilizadas ainda mais transparentes. O enfoque de solução a ser adotado neste trabalho é a utilização de um modelo de proveniência de dados como um dos mecanismos de implementação da rastreabilidade no contexto de dados abertos governamentais.
Este artigo está organizado da seguinte forma: a seção 2 apresenta os conceitos de transparência da informação e dados abertos governamentais, e a análise da contribuição do segundo às características da primeira. A seção 3 apresenta a rastreabilidade conjugada aos princípios dos dados abertos e a seção 4 conclui.
2. Transparência da Informação e Dados Abertos Governamentais
Diversos trabalhos abordam o tema da transparência da informação [Dawes et al, 2008][Helbig et al, 2010]. Usaremos neste trabalho a definição de Cappelli [2009] na qual um conjunto de trinta e três características compõe o conceito de transparência e foram organizadas em um framework apresentado na Figura 1.
Figura 1. Framework de Transparência [Cappelli, 2009]
Com o objetivo de promover a união dos esforços de governo e sociedade no intuito de melhorar a vida dos cidadãos, permitindo que pessoas ou órgãos (re)utilizem
dados e criem maneiras de se beneficiar que não tenham sido previstas por quem forneceu ou publicou tais dados, surgiu a idéia de dados abertos governamentais [W3C Brasil, 2009]. Dado aberto é “um dado que pode ser livremente utilizado, reutilizado e redistribuído por qualquer um” [Open Knowledge Foundation, 2011].
A idéia de dados abertos governamentais é regida por três leis [Eaves, 2009]: (i) se o dado não pode ser encontrado e indexado na web, ele não existe; (ii) se o dado não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; e (iii) se algum dispositivo legal não permitir a replicação do dado, ele não é útil. Baseando-se nestas leis, um grupo de trabalho da Open Knowledge
Foundation [2011] propôs um conjunto de oito princípios, que definem que os dados
precisam ser Completos, Primários, Atuais, Acessíveis, Compreensíveis por máquinas, Não discriminatórios, Não proprietários e Livres de licenças. Para auxiliar a implementação da prática dos dados abertos governamentais, foram desenvolvidos manuais [Open Knowledge Foundation, 2011] [W3C Brasil, 2011] contendo informações técnicas.
A prática dos Dados Abertos é uma ação que contribui com a transparência da informação para a sociedade. A Figura 2 detalha esta contribuição, focando nos grupos de características de mais alto nível de granularidade. Na figura, cada princípio dos dados abertos aponta para os grupos de características para os quais pode contribuir. O detalhamento de cada contribuição identificada na análise e que gerou cada relacionamento está descrito na Tabela 1, que apresenta o princípio analisado na primeira coluna; uma ou mais características as quais o princípio contribui na segunda coluna e as justificativas das contribuições na terceira coluna. O relacionamento evidenciou que nenhuma das características do grupo “auditabilidade” é influenciada pelos princípios de dados abertos, constituindo uma oportunidade importante de extensão da abordagem de dados abertos. Em especial, a rastreabilidade é considerada importante porque dados que são disponibilizados devem apresentar suas origens e transformações de modo que possam ser usados adequadamente.
dƌĂŶƐƉĂƌġŶĐŝĂ ĂĐĞƐƐŝďŝůŝĚĂĚĞ ĂƵĚŝƚĂďŝůŝĚĂĚĞ ŝŶĨŽƌŵĂƚŝǀŽ ĞŶƚĞŶĚŝŵĞŶƚŽ ƵƐĂďŝůŝĚĂĚĞ ĂƚƵĂŝƐ ĂĐĞƐƐşǀĞŝƐ ŶĆŽͲ ĚŝƐĐƌŝŵŝŶĂƚſƌŝŽƐ ŽŵƉƌĞĞŶƐşǀĞŝƐ ƉŽƌŵĄƋƵŝŶĂ ĐŽŵƉůĞƚŽƐ ůŝǀƌĞƐĚĞ ůŝĐĞŶĕĂ ĂĚŽƐ ĂďĞƌƚŽƐ ƉƌŝŵĄƌŝŽƐ ƉƌŽƉƌŝĞƚĄƌŝŽƐŶĆŽͲ
Figura 2. Contribuição dos Princípios dos Dados Abertos com os Grupos das Características da Transparência
Tabela 1. Análise dos Princípios dos Dados Abertos
Princípio Característica Justificativa
Completos Completeza Contribui diretamente pelo próprio significado
Primários Uniformidade Considerando que os dados coletados na fonte são disponibilizados nos formatos de arquivo indicados
Primários Simplicidade Clareza Corretude
Dados publicados como coletados na fonte são mais simples, claros e corretos do que dados que dados que já tenham passado por algum tipo de transformação ou agregação
Primários Detalhamento Comparabilidade Integridade
Dados publicados com maior nível de granularidade são dados detalhados. Dados primários são mais fáceis de comparar e proporcionam mais integridade por não terem sido transformados
Atuais Atualidade Contribui diretamente pelo próprio significado Acessíveis Disponibilidade
Publicidade
Este princípio garante que as organizações disponibilizem os dados públicos ao maior número possível de usuários
Compreensíveis por máquinas Portabilidade Operabilidade Adaptabilidade Desempenho Amigabilidade
Considerando a estruturação dos dados para processamento automatizado, facilitam o uso, aumentando seu desempenho e contribuem para “amigabilidade”, pois podem reduzir o esforço de processamento
Não discriminatórios Disponibilidade Simplicidade
Proporcionam menos restrições de acesso aos dados e a diminuição dos possíveis obstáculos para acesso aos mesmos
Não proprietários Livres de licenças
3. Rastreabilidade conjugada a dados abertos governamentais
Conforme exposto na Seção 2, um dos objetivos da iniciativa de dados abertos governamentais é o uso dos dados pelos cidadãos e organizações. No entanto, para permitir a reutilização efetiva de um dado público é importante que tenham sido disponibilizadas informações relacionadas ao dado que indiquem a sua proveniência (origem, responsabilidade de criação, transformações ocorridas). Informações de rastreabilidade dos dados públicos permitem que potenciais usuários analisem os dados quanto à sua confiabilidade, atualidade, corretude e consistência. Ao publicar os dados dois aspectos devem ser considerados: (i) é importante para o usuário conhecer a fonte do dado como, por exemplo, quem o produz, quem o mantém, a periodicidade de sua atualização, (ii) e é preciso conhecer quais foram as ações realizadas para que o dado chegasse do sistema de origem ao local onde está, ou seja, que transformações foram feitas, por quem, onde e como. Para conjugar rastreabilidade ao contexto de dados abertos, é necessário definir mecanismos para esta implementação. Estes mecanismos devem possibilitar formas de apresentar as informações mencionadas nos itens (i) e (ii).
Este trabalho propõe a aplicação do conceito de proveniência, que é definida como “a fonte ou origem de um objeto; sua história e linhagem; um registro de sua derivação final e passagem de um item através de seus diversos donos” [Oxford English Dictionary, apud Freire et al, 2008]. Moreau et al [2007] publicaram um modelo de proveniência aberto, OPM (Open Provenance Model) que será adotado como enfoque de solução deste trabalho. O OPM assume que a proveniência de objetos, digitais ou não, pode ser representada por um grafo de causalidade, conforme o metamodelo da Figura 3. Este grafo é definido como um registro de execuções passadas (ou em andamento) que captura as dependências causais entre as entidades, como se fossem relacionamentos e por fim, as entidades que são os artefatos, definidos como um pedaço de estado imutável que deve ter uma incorporação física em um objeto físico ou uma representação digital num sistema computacional (exemplo: dado estatístico de segurança). No contexto dos dados abertos, este registro de execuções passadas permite que a construção da informação, bem como possíveis transformações realizadas posteriormente, sejam conhecidas pelo usuário da informação, uma vez que dados de proveniência são capturados e divulgados associados a elas.
Para demonstrar como informações de proveniência de dados podem ser utilizadas como mecanismo de implementação de rastreabilidade em dados abertos, foi utilizado um exemplo real de dados abertos da Secretaria de Segurança Pública do Rio Grande do Sul [www.ssp.rs.gov.br], referentes às estatísticas de segurança pública de todo o estado. A Figura 4 ilustra um trecho destes dados em formato CSV, em que os últimos 3 campos são informações de proveniência adicionadas (sistema de origem, registrado por e extraído por) com base nos conceitos do OPM. Por exemplo, o campo “extraído por” representa a captura de informação de proveniência identificada como um agente do grafo de proveniência, que pode ser o “DEPTI”. Os dados acrescentados são fictícios, apenas para ilustrar a proposta de solução desta pesquisa.
Para chegar nesta proposta de modificação de apresentação de dados abertos, uma instanciação do OPM foi realizada através do grafo de proveniência, conforme a Figura 5. No exemplo dos dados da SSPRS, o artefato pode ser considerado como cada tipo de informação da secretaria (delitos de corrupção, entorpecentes, estelionato e extorsão) como também o próprio arquivo com os tipos de dados da SSPRS consolidados. O processo é representado pela ação de consolidação dos dados e o agente é representado pelos sistemas e agentes envolvidos no registro e consolidação dos dados (SistemadeOcorrencias, Agente de Polícia, DEPTI).
Figura 4. Exemplos de dados adicionais de proveniência
Figura 3. Metamodelo do OPM Figura 5. Exemplo do OPM As relações de causalidade entre as entidades identificadas no exemplo acima são: “usado por”, “foi controlado por” e “foi gerado por”. No contexto dos dados abertos, as relações seriam ações anteriores à publicação dos dados da SSPRS. Por exemplo, há uma relação de causalidade entre as entidades “DEPTI” e “Consolidação de Dados SSPRS” que mostra que o DEPTI (Departamento de TI) é um agente catalisador do processo de consolidação dos dados e no arquivo CSV apresentado na Figura 4. Esta informação deve ser obtida através do campo “extraído por”, que mostra quais dados foram extraídos por “DEPTI SSPRS”, que foram os dados de “Delitos relacionados à corrupção”, “Entorpecentes” “Estelionato” e “Extorsão”, que estão relacionados ao campo “Fato” do arquivo em formato CSV.
4. Conclusão
Este artigo apresentou uma proposta de pesquisa para aumentar a transparência no contexto de dados abertos governamentais através da conjugação de rastreabilidade. Foi realizada uma análise evidenciando que os princípios dos dados abertos governamentais contribuem com algumas características de transparência, mas a rastreabilidade mostrou-se uma característica em aberto, apesar de relevante. Um modelo de proveniência de dados (OPM) foi proposto como mecanismo de operacionalização de rastreabilidade. O próximo passo desta pesquisa é a definição de um método para orientar o usuário a incluir informações de proveniência utilizando os conceitos do OPM, e a realização de um estudo exploratório para avaliar, através de um questionário, a viabilidade do método e o grau de rastreabilidade da informação resultante através de um indicador de rastreabilidade adaptado de [Hazan e Leite, 2003], que propõe indicadores de rastreabilidade para requisitos, onde um destes indicadores apresenta o percentual de dados rastreáveis até a sua origem. A validação da solução proposta será num estudo de caso real em uma organização governamental.
Referências
Cappelli, C. (2009), “Uma Abordagem para Transparência em Processos Organizacionais Utilizando Aspectos”, Tese de Doutorado, PUC-RJ.
Dawes S.S., Pardo T.A., Jiang Y. (2008), “A Holistic Framework for Understanding Government Information Access Initiatives”, ICEGOV.
Decreto 6.932, de 11 de Agosto de 2009 -
www.planalto.gov.br/ccivil_03/_Ato2007-2010/2009/Decreto/D6932.htm#art20. Acessado em dez/2011.
Eaves, D. (2009), “As Três Leis dos Dados Abertos Governamentais”. Disponível em
http://eaves.ca/2009/09/30/three-law-of-open-government-data/ Acessado em set/11. Freire J., Koop D., et.al (2008), “Provenance for Computational Tasks: A Survey”, CISE
Hazan C., Leite J. (2003), “Indicadores para Gerência de Requisitos”, VI Workshop em Engenharia de Requisitos, Piracicaba - SP
Helbig N., Styrin E., Canestraro D.S., Pardo T.A. (2010), “Information and transparency: learning from recovery act reporting experiences”, Proceedings of the 11th Annual International Conference on Digital Government Research
Lei Complementar 131, de 27/05/2009 - www.planalto.gov.br/ccivil_03/Leis/LCP/Lcp131.htm.
Acessado em dez/2011.
Lei 12.527, de 18 de Novembro de 2011 -
www.planalto.gov.br/ccivil_03/_Ato2011-2014/2011/Lei/L12527.htm. Acessado em dez/2011.
Moreau L., Freire J., Frutrelle J., et al. (2007), “The Open Provenance Model”.
Open Knowledge Foundation (2011), “Open Data Manual”. Disponível em
http://opendatamanual.org/. Acessado em set/2011.
Portal da Transparência – Portal da Transparência do Governo Federal. Disponível em
www.portaltransparencia.gov.br. Acessado em set/2011.
Santos F., Vargas K., Abreu C. (2004), “Rastreabilidade de requisitos através da web”, XIII Seminco,SC
Sayão M., Leite J. (2005), “Rastreabilidade de Requisitos”, PUC – RJ
SSPRS – Site da Secretaria de Segurança Pública do Rio Grande do Sul. Disponível em
www.ssp.rs.gov.br. Acessado em set/2011.
W3C Brasil (2009), “Melhorando o acesso ao governo com o melhor uso da web”, Disponível
www.w3.org/TR/egov-improving/. Acessado em set/11.
W3C Brasil (2011), “Manual dos Dados Abertos: Desenvolvedores”, São Paulo – SP.