L
A
C
Publicação de Dados Governamentais
no Padrão Linked Data
Karin Breitman José Viterbo Edgard Marx Percy Salas
1.
Apresentar os conceitos relacionados ao
padrão Linked Data;
1.
Introdução
2.
Motivação
3.
Princípios
4.
Características
5.
Aplicações
Sumário
Páginas web tradicionais
B C
HTML HTML
HTML
Web
Browsers EnginesSearch
hyper-links
Espaço de informação global único
2. URLs são usadas como:
IDs globalmente únicas
Mecanismo de recuperação de informação 3. HTML como formato de compartilhamento de informação 4. Hyperlinks A
Problema e Solução
Problema
Como o conteúdo da Web é apenas
fracamente estruturado, é difícil para
aplicações realizarem tarefas inteligentes
com essas informações.
Solução
APIs e Mashups
Web API AMashup
Up
Desvantagens
2.
APIs provide proprietary
interfaces
•
Mashups are based on a
fixed set of data
sources.
4.
You can not set
hyperlinks between data
Web API B Web API C Web API D
Linked Data
B C RDF RDF link A D E RDFlinks linksRDF linksRDF
RDF RDF RDF RDF RDF RDF RDF RDF RDF
Usa tecnologias da Web Semântica para:
Publicar dados estruturados na Web,
•
Estabelecer links entre dados de uma fonte
para outras.
Princípios de Linked Data
1.
Usar URIs como nomes para os itens.
2.
Usar URIs HTTP para que as pessoas
possam consultar esses nomes.
3.
Quando alguém consulta uma URI, prover
informação RDF útil.
4.
Incluir sentenças RDF com links para outras
URIs, a fim de permitir que itens
relacionados possam ser descobertos.
Tim Berners-Lee 2007 http://www.w3.org/DesignIssues/LinkedData.html
RDF – Modelo de dados
Richard
Cyganiak
dbpedia:Berlin
foaf:name
foaf:based_near
foaf:Person
rdf:type
pd:cygri
Identificando itens com URIs HTTP
pd:cygri
Richard
Cyganiak
dbpedia:Berlin
foaf:name
foaf:based_near
foaf:Person
rdf:type
pd:cygri
= http://richard.cyganiak.de/foaf.rdf#cygri
dbpedia:Berlin
= http://dbpedia.org/resource/Berlin
Resolvendo URIs na Web
dp:Cities_in_Germany 3.405.259 dp:population skos:subjectRichard
Cyganiak
dbpedia:Berlin
foaf:name
foaf:based_near
foaf:Person
rdf:type
pd:cygri
Dereferenciando URIs na Web
dp:Cities_in_Germany 3.405.259 dp:population skos:subjectRichard
Cyganiak
dbpedia:Berlin
foaf:name
foaf:based_near
foaf:Person
rdf:type
dbpedia:Hamburg
dbpedia:Muenchen
skos:subject
skos:subject
pd:cygri
Propriedades
•
Qualquer um pode publicar dados
•
Entidades são conectadas por links
– O grafo de dados globais se espalha por diversas fontes e permitem a descoberta de novas fontes de dados.
•
Dados são auto-descritos
– Se uma aplicação encontra dados representados com um
vocabulários desconhecido, a aplicação pode resolver as URIs que identificam termos deste vocabulário para achar suas
definições RDFS ou OWL.
•
A Web de Dados é aberta
– Significa que aplicações podem descobrir novas fontes de dados durante tempo de execução seguindo os links.
Implementação
É assim mesmo?
B C RDF RDF link A D E RDFlinks linksRDF linksRDF
RDF RDF RDF RDF RDF RDF RDF RDF RDF
Projeto Linking Open Data/W3C
Esforço da comunidade de pesquisa
para:
Publicar conjuntos de dados de licença
aberta existentes como Linked Data na Web
Interconectar itens entre diferentes fontes
de dados
Dados disponíveis / maio - 2007
Examplo de links RDF
•
Links RDF da DBpedia para outra fonte
<http://dbpedia.org/resource/Berlin> owl:sameAs <http://sws.geonames.org/2950159> .
<http://dbpedia.org/resource/Tim_Berners-Lee> owl:sameAs
Estatísticas / julho - 2009
Domínio
Triplas
%
Links
%
Mídia
698.000.00010,4%
1.238.000
0,8%
Publicações
212.000.0003,2%
4.922.000
3,3%
Ciências
2.429.000.00036,1% 133.199.00
0
89,4%
Dados geográficos
3.097.000.00046,0%
4.038.000
2,7%
Conteúdo de
usuários
76.000.0001,1% 1.559.000
1,0%
Cross-Domain
214.000.0003,2% 3.992.000
2,7%
Total
6.726.000.000148.948.00
0
Aplicações
B C Thing typed links A D E typedlinks typedlinks typedlinks
Thing Thing Thing Thing Thing Thing Thing Thing Thing
Search
Engines
Linked Data
Mashups
Linked Data
Browsers
Browsers para Linked Data
Tabulator Browser (MIT, USA)
Marbles (FU Berlin, DE)
OpenLink RDF Browser (OpenLink, UK)
Zitgist RDF Browser (Zitgist, USA)
Humboldt (HP Labs, UK)
Disco Hyperdata Browser (FU Berlin, DE)
Fenfire (DERI, Irland)
Mashups
•
Aplicações específicas para um determinado
domínio que utilizam Linked Data
DBpedia em dispositivos móveis
Geospatial entry point
into the Web of Data
Starts with DBpedia,
Mecanismos de busca de dados
•
Falcons (IWS, China)
•
Sig.ma (DERI, Ireland)
•
Swoogle (UMBC, USA)
•
VisiNav (DERI, Ireland)
Participação das grandes empresas
•
Yahoo! e Google já começaram a pesquisar dados
no padrão Linked Data, na forma RDFa serializada
e também como Microformats.
•
Yahoo!
– Provê accesso a dados através da API Yahoo BOSS
– Usa esses dados no Yahoo Search Monkey para tornar os resultados de busca mais úteis e com maior apelo visual.
•
– Usa dados RDF para sua API Social Graph
– Planeja usar esses dados para melhorar o resultado da busca sobre resenhas e pessoas.
Próximos passos
•
Mais dados se tornam disponíveis....
–
Dados dos governos americano e britânico
–
Dados bibliográficos via Open Archives ORE
Christian Bizer, Tom Heath, Tim Berners-Lee. Linked Data – The Story So Far. Disponível em:
http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf
Linking Open Data Project Wiki. Disponível em:
http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
Christian Bizer, Richard Cyganiak, Tom Heath. Tutorial How to Publish Linked
Data on the Web. Disponível em:
http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial