Interoperabilidade na Web
Semântica: Linked Data
Renato Fernandes Corrêa
Com o advento da Web tornou-se mais
necessário integrar os dados!
A Web
revolucionou a
forma como os
dados são gerados
e manipulados!
Web semântica
Extensão da Web
Facilita a interpretação e integração dos dados
• Visão da Web denominada de Web Semântica (Semantic
Web)
– Semântica diz respeito à atribuição de significado a elementos, dados ou expressões que precisam ser interpretados numa dada situação.
– atribuir significado aos dados interligando-os com outros conjuntos de dados ou outros domínios de conhecimento, conseguindo, assim, criar uma relação de significância entre os conteúdos publicados na Internet de modo que seja perceptível tanto pelo usuário quanto pelos agentes de software.
Linked Data
• A web de dados foi proposta por Tim Berners-Lee em
2006 como uma extensão da web, utilizando as
tecnologias criadas para a web semântica e alguns
princípios.
– A finalidade é publicar e compartilhar dados na web, bem
como dar suporte a consolidação da web semântica.
– Motivado inicialmente pela disponibilização e acesso aberto
a grandes bases de dados científicas na web.
• A web de dados visa permitir inferências sobre dados
publicados na web ligando os dados através de links
semânticos.
Linked data
• Linked data ou dados interligados é a concretização dos
esforços atuais na construção da Web Semântica para
publicação e acesso a dados na web.
– Se baseia na publicação e uso de ontologias vinculada a dados no formato RDF (Resource Description Framework).
É um conjunto de boas práticas que sendo aplicadas tem
dando origem à “Web de Dados”
A Web de Dados cria inúmeras oportunidades para a
integração semântica
Web de Dados
• Uso de tecnologias semânticas para integração de
dados
– Dados descritos no formato RDF
– Integração de dados baseada em ontologias
• É necessária a definição de Correspondências
entre Ontologias para consulta a várias fontes de
dados e integrar dados
• A consulta a diversas fontes e integração dos
dados ainda depende de um esforço intelectual
humano.
Pilha de Tecnologias da Web de Dados
Web de Documentos
vs. Web de dados
• WEB DE DOCUMENTOS
Mecanismo de identificação global único (URIs)
Mecanismo de acesso universal (HTTP)
Formato de representação de conteúdo (HTML) ou (XML)
• WEB DE DADOS
Mecanismo de identificação global único (URIs)
Mecanismo de acesso universal (HTTP)
Modelo padrão para representação de dados (RDF)
Princípios do Linked data
Princípios básicos [Berners-Lee et al 2006] :
1. Usar URIs como nome para recursos
2. Usar URIs HTTP para que as pessoas possam encontrar
esses nomes
3. Quando alguém procurar por uma URI, garantir que
informações úteis possam ser obtidas por meio dessa URI
4. Incluir links para outras URIs para que outros recursos
LOD
Fundado em 2007
Apoiado pelo W3C Semantic Web
Education and Outreach Group
Objetivo: identificar conjuntos de
dados sob licenças abertas e
convertê-lo para RDF
LOD
Fase inicial: pesquisadores e desenvolvedores de
laboratórios universitários e empresas de
pequeno porte
Requisitos: conjunto de dados de acordo com os
princípios do Linked Data e interligação aos
Exemplo de Base de Dados de Triplas
(modelo em grafo)
5 estrelas dos dados abertos
Segundo Berners-Lee, “Dados Abertos
Interligados são Dados Linkados
publicados por meio de licenças abertas”
Dados Interligados não são
necessariamente abertos
Dado Aberto Interligado só é assim
considerado se for aberto
5 estrelas dos dados abertos
• Disponível na Internet (em qualquer formato. Porexemplo: PDF), desde que com licença aberta, para que seja considerado Dado Aberto
• Disponível na Internet de maneira estruturada (em um arquivo Excel com extensão XLS)
• Disponível na Internet, de maneira estruturada e em formato não proprietário (CSV em vez de Excel)
• Seguindo todas as regras acima, mas dentro dos padrões estabelecidos pelo W3C (RDF e SPARQL): usar URL para identificar coisas e propriedades, de forma que as pessoas possam direcionar para suas publicações
• Todas as regras acima, mais: vincular seus dados aos de outras pessoas, de forma a fornecer um contexto.
Desafios para Integração de Dados na
Web
• Existem algumas diferenças que precisam ser consideradas quando
fontes de dados Web são integradas como:
– O número de fontes de dados pode ser grande, o que dificulta os processos de integração de esquemas e resolução de conflitos.
– As fontes de dados
• são muito dinâmicas e assim a adição ou remoção de fontes de dados deve ser feita de maneira a minimizar o impacto na visão integrada.
• são bastante heterogêneas, com modelos lógicos e conceituais de dados distintos.
• São semiestruturadas e, na maioria das vezes, não fornecem informações suficientes para a integração dos esquemas.
17
Como armazenar
e
Consumir
esses dados?
18
Armazenar
Rdf Store
Wrappers
banco de dados relacional
Web API
19
Consumir
Rdf dump
Consumo de dados interligados
• Browser Linked Data
-Lodlive
Permite alimentá-lo com uma URI e de forma interativa, seguir os links associados. URIs podem vir de DBedia, Freebase, entre outras.
Consumo de dados interligados
• Linked Open
Vocabularies - LOV
Oferece busca e
navegação sobre
vocabulários
(ontologias).
Consumo de dados interligados
• Motores de Busca
-Swoogle
Coleta de dados e
ontologias na web e
oferece busca e consulta
aos dados.
Consumo de dados interligados
• Motores de Busca
-watson
Coleta de dados e
ontologias na web e
oferece busca e consulta
aos dados.
Consumo de dados interligados
• Motores de Busca
-Sindice
Coleta de dados na web
de muitas maneiras e
oferece busca e consulta
através dos dados.
Consumo de dados interligados
• Aplicações para domínios
específicos - DBPedia
Provê a visualização de
um mapa com
informações oriundas das
entidades DBpedia e
informações de outras
bases de conhecimento
Desafios
Criar meios eficientes que viabilizem o uso do grande volume
de dados
Disponibilizar informação útil, específica e relevante
Linked Data é a chave para a transformação da Web através
dos metadados ligados ou vinculados dos documentos
Aplicações da Web Semântica
Site da BBC (Semantic Publishing)
http://www.bbc.com/sport/football/teams/chelsea
http://www.bbc.co.uk/ontologies
http://www.bbc.co.uk/ontologies/coreconcepts
http://www.bbc.co.uk/blogs/bbcinternet/2012/04/sports_dynamic_semantic. html
Site da Best Buy
http://www.bestbuy.com/
http://www.heppnetz.de/projects/goodrelations/
http://wiki.goodrelations-vocabulary.org/Main_Page
http://wiki.goodrelations-vocabulary.org/Datasets
Redação de feeds com Zemanta
http://www.zemanta.com/
Nasa XSearch
https://sweet.jpl.nasa.gov/
Aplicações do Linked Data
Projetos da dbpediaRepositórios e Aplicações dos Dados
Abertos
Repositórios de Dados Abertos da plataforma ckan
https://ckan.org/about/instances/
Portal de Dados Abertos da Prefeitura do Recife
4/23/2019 34
Casos Brasileiros
• Orçamento Federal em Formato Aberto
• Disponibilização dos dados e ontologia em
30/08/2012
–
www.siop.planejamento.gov.br
–
https://www1.siop.planejamento.gov.br/siopdoc/doku.
php/acesso_publico:dados_abertos
• Uma Ontologia da Classificação da Despesa do
Orçamento Público Federal
Casos Brasileiros
• Open Knowledge Brasil
-http://br.okfn.org/projetos/
–
http://dapp.fgv.br/mosaico/mosaic_f/2014
• Reúne dados abertos de diversas fontes para responder
à pergunta: ParaOndeFoiOMeuDinheiro?
• Organiza os dados da maior granularidade até o menor,
chegando até à empresa que prestou o serviço
Sites
Web Semântica - W3C http://www.w3c.br/Padroes/WebSemantica
Linked Data (http://www.w3.org/DesignIssues/LinkedData.html) Publicação de Dados Governamentais no Padrão Linked Data
(
http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf)
LiAM: Linked Archival Metadata: Semantic Web browsers.
(http://sites.tufts.edu/liam/2014/03/22/browsers/)
Lodlive (http://en.lodlive.it/) Sindice (http://sindice.com/)
As 5 Estrelas dos Dados Abertos (
Referências
CUNHA, D. R. B.; SOUZA, D. Y. ; LOSCIO, B. F. (2011) Linked Data: da Web de Documentos para a Web de Dados. V Escola Regional de Informática Ceará, Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de novembro de 2011. [livro eletrônico]
Heath, T.; Bizer, C. Linked Data: Evolving the Web into a Global Data
Space (1st edition). Synthesis Lectures on the Semantic Web: Theory
and Technology. Morgan & Claypool, 2011.
Isotani, S.; Bittencourt, I. I. Dados abertos conectados. Novatec: 2015. [Livro eletrônico]
http://ceweb.br/livros/dados-abertos-conectados/