• Nenhum resultado encontrado

Uma Aplicação Interligando Dados de GPS com Linked Geo Data

5. Interligação de Dados

Foi necessário dividir o processo em três fases: coleta de dados; transformação e carga; e realização das consultas. Para a fase de coleta dos dados dos ônibus, utilizamos o site da equipe do Laboratório de Engenharia de Software do Instituto de Computação da UFF (SEL-UFF/RJ)8, tendo seus insumos catalogados por dia. A utilização do portal do SEL-

UFF foi de fundamental importância para a obtenção de dados históricos, uma vez que fora realizado por eles um processo de extração e armazenamento dos dados do GPS dos ônibus obtidos através do Data Rio. Esses insumos foram tratados e carregados em um banco de dados relacional. Em relação aos dados do Linked Geo Data, utilizamos a base disponível no site oficial do projeto9.

Na fase de transformação e carga, utilizamos a ferramenta D2RQ para gerar o mapeamento do banco de dados relacional para o formato de triplas. Após a geração, definimos o namespace a ser utilizado na URI e geramos a extração RDF, serializado em Turle para ser carregado num banco de triplas. Utilizamos a ferramenta Virtuoso OpenSource 6.1 para armazenar as triplas a serem interligadas, através da funcionalidade Quad Store Upload, conforme figura 1.

7 http://lod.openlinksw.com/sparql, acessado em outubro de 2016 8 http://sel.ic.uff.br, acessado em abril de 2016

Figura 1. Tela de carregamento de bases RDF no banco Virtuoso Opensource 6.1

Na última fase foi preciso definir as consultas em SPARQL a serem utilizadas. Para aproveitar as características dos dados geolocalizados, utilizamos funções de GeoSPARQL de interseção, de forma a ser possível, através de um par latitude e longitude de um dado ônibus no tempo, identificar pontos de interesse e locais na sua proximidade. É possível passar como parâmetro o raio de interseção, em quilômetros.

Dessa forma, construímos duas possíveis consultas, uma retornando pontos de interesse ao redor de um dado ônibus e outra retornando à referência de lugar mais próxima.

Tabela 1. Consulta em SPARQL de busca por pontos de interesse na proximidade de 100 metros

Prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>

Prefix ogc: <http://www.opengis.net/ont/geosparql#>

Prefix geom: <http://geovocab.org/geometry#>

Prefix lgdo: <http://linkedgeodata.org/ontology/>

Prefix datario: <http://datario/bus_rdf/>

SELECT ?linha ?amenity WHERE { ?s a lgdo:Amenity ; rdfs:label ?amenity ; geom:geometry [ ogc:asWKT ?g ] .

?busp a datario:BusPosition ; rdfs:label ?linha ;

datario:longitude a long? ; datario:latitude a lat? ;

Filter (

bif:st_intersects (?g, bif:st_point (?long, ?lat), 0.1)

) . }

Tabela 2. Consulta em SPARQL de busca por local atual através de ordenamento entre locais mais próximos

Prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>

Prefix ogc: <http://www.opengis.net/ont/geosparql#>

Prefix geom: <http://geovocab.org/geometry#>

Prefix lgdo: <http://linkedgeodata.org/ontology/>

Prefix datario: <http://datario/bus_rdf/>

SELECT ?linha ?place WHERE { ?s a lgdo:Place ; rdfs:label ?place ; geom:geometry [ ogc:asWKT ?g ] .

?busp a datario:BusPosition ; rdfs:label ?linha ;

datario:longitude a long? ; datario:latitude a lat? ;

Filter (

BIND (STRDT(CONCAT("POINT(",?long, " ", ?lat, ")"),ogc:WktLiteral) as ?p) ) .

}

ORDER BY ASC(ogc:distance(?g, ?p)) LIMIT 1

6. Conclusão

Essa aplicação evidenciou que, apesar de existir ferramental para coletar, armazenar e consultar os dados, foi necessário utilizar diversas ferramentas para conseguir alcançar o objetivo final. Além disso, tivemos o desafio de contornar limitações e problemas apresentados por essas ferramentas, visto não estar disponível outra opção que integrasse todo o processo de maneira mais simplificada.

A utilização de GeoSPARQL foi adequada para os datasets utilizados, representando um ganho pela possibilidade de utilização de operações espaciais, não sendo necessário referenciar objetos estaticamente pelo nome, mas sim através de sua posição geoespacial. É necessário um estudo mais aprofundado das funções oferecidas, aplicação em outros domínios que não o de transportes e integração com outros tipos de dados geolocalizados, de forma a ser possível avaliar a sua robustez e aplicação.

Projetar a arquitetura de dados interligados se mostrou uma parte importante do processo, visto que não só altera as consultas realizadas, mas impacta no desempenho e atualidade dos dados. A opção escolhida serviu pela abordagem exploratória do estudo, mas foram encontradas dificuldades na necessidade de coleta contínua e armazenagem em um servidor central. É importante avaliar a opção de consultas federadas, no âmbito de aplicação e de desempenho, visto sua natureza descentralizada que se adequa mais à proposta de Linked Data.

Essas dificuldades se aplicam principalmente à esfera governamental, provavelmente em virtude da dependência de um ferramental e técnicas já ultrapassadas no mercado para a divulgação dos dados. Essas ferramentas, por mais consolidadas que estejam, não atendem ao nível de maturidade que se espera para a interligação dos dados, tornando-os difíceis de se manipular. Espera-se que, de maneira gradual, as diversas

autarquias governamentais comecem a evoluir seus ambientes de publicação e exploração de dados, passando a utilizar maior padronização na divulgação dos dados, e aumentando a qualidade na descrição e apresentação dessa informação para a população.

Esperamos que futuramente possamos divulgar mais amplamente os resultados obtidos através dessas análises, bem como verificar as implicações de utilizar um maior número de fontes de dados integradas para gerar informações úteis aos cidadãos.

Agradecimentos

Agradecemos à professora Maria Luiza Campos pela orientação durante o desenvolvimento deste artigo e revisão. Também agradecemos à equipe do Laboratório de Engenharia de Software do Instituto de Computação da UFF (SEL-UFF/RJ) por gentilmente ter disponibilizado suas bases para o público em geral.

Referências

BERNERS-LEE, T. Linked Data. 2006. Disponível em:

<https://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 14 out. 2016. BESSA, A. et al. RioBusData: Outlier Detection in Bus Routes of Rio de Janeiro.

2007.

HART, G.; DOLBEAR, C. Linked Data: A Geographic Perspective. [s.l.] CRC Press, 2013.

HARTIG, O. Querying Linked Data with SPARQL. 2009. Disponível em:

<http://pt.slideshare.net/olafhartig/querying-linked-data-with-sparql>. Acesso em: 14 out. 2016.

KOLAS, D.; PERRY, M.; HERRING, J. Getting Started with GeoSPARQL. 2013. Disponível em:

<http://www.ssec.wisc.edu/meetings/geosp_sem/presentations/GeoSPARQL_G etting_Started - KolasWorkshop Version.pdf>. Acesso em: 14 out. 2016. MARUJO, L. G. et al. Um método para avaliação do desempenho de ônibus

baseado em dados de GPS. XXIX Congresso Nacional de Pesquisa em Transportes da ANPET, p. 1194–1205, 2015.

MATHEUS, R.; RIBEIRO, M. M. Case Study Open Government Data in Rio de Janeiro City. p. 1–50, 2014.

OPEN LINK SOFTWARE. Geometric Objects. 2014. Disponível em:

<http://docs.openlinksw.com/virtuoso/sqlrefgeospatialgo/>. Acesso em: 14 out. 2016.

ZHANG, L. How structured data (Linked Data) help in Big Data Analysis---Expand Patent Data with Linked Data Cloud. 2013.

Utilização de Sistema Especialista para Diagnósticos de