• Nenhum resultado encontrado

FPS aula6 LinkedData

N/A
N/A
Protected

Academic year: 2021

Share "FPS aula6 LinkedData"

Copied!
37
0
0

Texto

(1)

Interoperabilidade na Web

Semântica: Linked Data

Renato Fernandes Corrêa

(2)

Com o advento da Web tornou-se mais

necessário integrar os dados!

A Web

revolucionou a

forma como os

dados são gerados

e manipulados!

(3)

Web semântica

 Extensão da Web

 Facilita a interpretação e integração dos dados

• Visão da Web denominada de Web Semântica (Semantic

Web)

– Semântica diz respeito à atribuição de significado a elementos, dados ou expressões que precisam ser interpretados numa dada situação.

– atribuir significado aos dados interligando-os com outros conjuntos de dados ou outros domínios de conhecimento, conseguindo, assim, criar uma relação de significância entre os conteúdos publicados na Internet de modo que seja perceptível tanto pelo usuário quanto pelos agentes de software.

(4)

Linked Data

• A web de dados foi proposta por Tim Berners-Lee em

2006 como uma extensão da web, utilizando as

tecnologias criadas para a web semântica e alguns

princípios.

– A finalidade é publicar e compartilhar dados na web, bem

como dar suporte a consolidação da web semântica.

– Motivado inicialmente pela disponibilização e acesso aberto

a grandes bases de dados científicas na web.

• A web de dados visa permitir inferências sobre dados

publicados na web ligando os dados através de links

semânticos.

(5)

Linked data

• Linked data ou dados interligados é a concretização dos

esforços atuais na construção da Web Semântica para

publicação e acesso a dados na web.

– Se baseia na publicação e uso de ontologias vinculada a dados no formato RDF (Resource Description Framework).

 É um conjunto de boas práticas que sendo aplicadas tem

dando origem à “Web de Dados”

 A Web de Dados cria inúmeras oportunidades para a

integração semântica

(6)

Web de Dados

• Uso de tecnologias semânticas para integração de

dados

– Dados descritos no formato RDF

– Integração de dados baseada em ontologias

• É necessária a definição de Correspondências

entre Ontologias para consulta a várias fontes de

dados e integrar dados

• A consulta a diversas fontes e integração dos

dados ainda depende de um esforço intelectual

humano.

(7)

Pilha de Tecnologias da Web de Dados

(8)

Web de Documentos

vs. Web de dados

• WEB DE DOCUMENTOS

 Mecanismo de identificação global único (URIs)

 Mecanismo de acesso universal (HTTP)

 Formato de representação de conteúdo (HTML) ou (XML)

• WEB DE DADOS

 Mecanismo de identificação global único (URIs)

 Mecanismo de acesso universal (HTTP)

 Modelo padrão para representação de dados (RDF)

(9)

Princípios do Linked data

Princípios básicos [Berners-Lee et al 2006] :

1. Usar URIs como nome para recursos

2. Usar URIs HTTP para que as pessoas possam encontrar

esses nomes

3. Quando alguém procurar por uma URI, garantir que

informações úteis possam ser obtidas por meio dessa URI

4. Incluir links para outras URIs para que outros recursos

(10)

LOD

 Fundado em 2007

 Apoiado pelo W3C Semantic Web

Education and Outreach Group

 Objetivo: identificar conjuntos de

dados sob licenças abertas e

convertê-lo para RDF

(11)

LOD

 Fase inicial: pesquisadores e desenvolvedores de

laboratórios universitários e empresas de

pequeno porte

 Requisitos: conjunto de dados de acordo com os

princípios do Linked Data e interligação aos

(12)

Exemplo de Base de Dados de Triplas

(modelo em grafo)

(13)
(14)

5 estrelas dos dados abertos

 Segundo Berners-Lee, “Dados Abertos

Interligados são Dados Linkados

publicados por meio de licenças abertas”

 Dados Interligados não são

necessariamente abertos

 Dado Aberto Interligado só é assim

considerado se for aberto

(15)

5 estrelas dos dados abertos

• Disponível na Internet (em qualquer formato. Por

exemplo: PDF), desde que com licença aberta, para que seja considerado Dado Aberto

• Disponível na Internet de maneira estruturada (em um arquivo Excel com extensão XLS)

• Disponível na Internet, de maneira estruturada e em formato não proprietário (CSV em vez de Excel)

• Seguindo todas as regras acima, mas dentro dos padrões estabelecidos pelo W3C (RDF e SPARQL): usar URL para identificar coisas e propriedades, de forma que as pessoas possam direcionar para suas publicações

• Todas as regras acima, mais: vincular seus dados aos de outras pessoas, de forma a fornecer um contexto.

(16)

Desafios para Integração de Dados na

Web

• Existem algumas diferenças que precisam ser consideradas quando

fontes de dados Web são integradas como:

– O número de fontes de dados pode ser grande, o que dificulta os processos de integração de esquemas e resolução de conflitos.

– As fontes de dados

• são muito dinâmicas e assim a adição ou remoção de fontes de dados deve ser feita de maneira a minimizar o impacto na visão integrada.

• são bastante heterogêneas, com modelos lógicos e conceituais de dados distintos.

• São semiestruturadas e, na maioria das vezes, não fornecem informações suficientes para a integração dos esquemas.

(17)

17

Como armazenar

e

Consumir

esses dados?

(18)

18

Armazenar

Rdf Store

Wrappers

banco de dados relacional

Web API

(19)

19

Consumir

Rdf dump

(20)

Consumo de dados interligados

• Browser Linked Data

-Lodlive

 Permite alimentá-lo com uma URI e de forma interativa, seguir os links associados. URIs podem vir de DBedia, Freebase, entre outras.

(21)
(22)
(23)

Consumo de dados interligados

• Linked Open

Vocabularies - LOV

 Oferece busca e

navegação sobre

vocabulários

(ontologias).

(24)

Consumo de dados interligados

• Motores de Busca

-Swoogle

 Coleta de dados e

ontologias na web e

oferece busca e consulta

aos dados.

(25)

Consumo de dados interligados

• Motores de Busca

-watson

 Coleta de dados e

ontologias na web e

oferece busca e consulta

aos dados.

(26)

Consumo de dados interligados

• Motores de Busca

-Sindice

 Coleta de dados na web

de muitas maneiras e

oferece busca e consulta

através dos dados.

(27)
(28)
(29)

Consumo de dados interligados

• Aplicações para domínios

específicos - DBPedia

 Provê a visualização de

um mapa com

informações oriundas das

entidades DBpedia e

informações de outras

bases de conhecimento

(30)

Desafios

 Criar meios eficientes que viabilizem o uso do grande volume

de dados

 Disponibilizar informação útil, específica e relevante

 Linked Data é a chave para a transformação da Web através

dos metadados ligados ou vinculados dos documentos

(31)

Aplicações da Web Semântica

 Site da BBC (Semantic Publishing)

 http://www.bbc.com/sport/football/teams/chelsea

 http://www.bbc.co.uk/ontologies

 http://www.bbc.co.uk/ontologies/coreconcepts

 http://www.bbc.co.uk/blogs/bbcinternet/2012/04/sports_dynamic_semantic. html

 Site da Best Buy

 http://www.bestbuy.com/

 http://www.heppnetz.de/projects/goodrelations/

 http://wiki.goodrelations-vocabulary.org/Main_Page

 http://wiki.goodrelations-vocabulary.org/Datasets

 Redação de feeds com Zemanta

 http://www.zemanta.com/

 Nasa XSearch

 https://sweet.jpl.nasa.gov/

(32)

Aplicações do Linked Data

 Projetos da dbpedia

(33)

Repositórios e Aplicações dos Dados

Abertos

 Repositórios de Dados Abertos da plataforma ckan

 https://ckan.org/about/instances/

 Portal de Dados Abertos da Prefeitura do Recife

(34)

4/23/2019 34

Casos Brasileiros

• Orçamento Federal em Formato Aberto

• Disponibilização dos dados e ontologia em

30/08/2012

www.siop.planejamento.gov.br

https://www1.siop.planejamento.gov.br/siopdoc/doku.

php/acesso_publico:dados_abertos

• Uma Ontologia da Classificação da Despesa do

Orçamento Público Federal

(35)

Casos Brasileiros

• Open Knowledge Brasil

-http://br.okfn.org/projetos/

http://dapp.fgv.br/mosaico/mosaic_f/2014

• Reúne dados abertos de diversas fontes para responder

à pergunta: ParaOndeFoiOMeuDinheiro?

• Organiza os dados da maior granularidade até o menor,

chegando até à empresa que prestou o serviço

(36)

Sites

 Web Semântica - W3C http://www.w3c.br/Padroes/WebSemantica

 Linked Data (http://www.w3.org/DesignIssues/LinkedData.html)  Publicação de Dados Governamentais no Padrão Linked Data

(

http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf)

 LiAM: Linked Archival Metadata: Semantic Web browsers.

(http://sites.tufts.edu/liam/2014/03/22/browsers/)

 Lodlive (http://en.lodlive.it/)  Sindice (http://sindice.com/)

 As 5 Estrelas dos Dados Abertos (

(37)

Referências

 CUNHA, D. R. B.; SOUZA, D. Y. ; LOSCIO, B. F. (2011) Linked Data: da Web de Documentos para a Web de Dados. V Escola Regional de Informática Ceará, Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de novembro de 2011. [livro eletrônico]

 Heath, T.; Bizer, C. Linked Data: Evolving the Web into a Global Data

Space (1st edition). Synthesis Lectures on the Semantic Web: Theory

and Technology. Morgan & Claypool, 2011.

 Isotani, S.; Bittencourt, I. I. Dados abertos conectados. Novatec: 2015. [Livro eletrônico]

 http://ceweb.br/livros/dados-abertos-conectados/

Referências

Documentos relacionados

2011 4 Nas Auditorias ao Sistema, em particular aos Processos FOR, ACA, CRC, CIN, RHU e PGE, considerar ao requisitos definidos pelos Guiões de AACEF e no Manual de

 Nutrição: Estimar as necessidades energéticas e proteicas em conjunto com a equipe médica, monitorar as complicações da terapia nutricional, determinar a formulação enteral

4.2. Os documentos deverão ser entregues em envelope lacrado e etiquetado com o NOME COMPLETO do candidato e a identificação: TRANSFERÊNCIA INTERNA, pessoalmente

Os resultados apontam que dos 40 treinadores 30 possuem experiência com ex-atleta de futebol profissional, apenas 14 destes possuem formação em Educação Física e 47%

Este artigo explora redes altamente interconectadas e estáticas, apresentando uma relação entre a quantidade de nós, número de usuários e número de conexões – ou

UVC100 Combo de tinta marcadora invisível fluorescente para qualquer superfície UV999E Tinta de marcação fluorescente para qualquer superfície, 473 ml (16 onças) UV991

Incentivo Leitos Retaguarda Enfermaria Clínica 39 leitos Novos (Pt GM 2395/11) _ Valor da produção incorporado ao teto MAC * vinculo 4590. **TOTAL GERAL

Aqui, e na maioria das obras de Borges, depara-se com o fantástico, isto é, algo que não é real, mas por sua verossimilhança - descrever o fantástico como algo provável -