Uso da Tecnologias da Web Semântica para
Publicação e Integração Semântica de Glossários
Ricardo Ávila, David Araujo, Gabriel Lopes,
Vânia Vidal, José Macedo
ONTOBRAS 2017
Sumário
Gestão de Dados de E&P
Integração Semântica das Bases de Dados de E&P
Framework Proposto
Ontologia de Glossários de E&P
Publicação dos Glossários de E&P na Web de Dados
Geração de Links semânticos entre Glossários de E&P
Conclusions e Trabalhos Futuros
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
Perfura
ção
Perfilag
em
Teste de
Formação
Propriedade
Análises
Dados de Rochas
e Fluidos
Gestão de
Integração Semântica
das Bases
de Dados E&P
• Vocabulário formal e explícito para especificar a semântica das fontes de dados.
• Enriquecimento semântico das
fontes de dados
• Facilita a geração dos
mapeamentos entre bases de
dados heterogênea
• Navegação/Busca semântica
sobre as fontes de dados
• Inferências a partir dos dados
integrados
PRO LAB SIGE O VISÃO ONTOLÓGICA Sistemas UsuárosOntologias e Dados Interligados
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
“Linked Data” refere-se às melhores práticas
(Berners-Lee 2006) para a publicação e
interligação de dados estruturados na web.
A combinação de Ontologias e Dados Interligados
provê uma solução inovadora para
desenvolvimento de aplicações onde existe a
necessidade de integrar diferentes fontes de
dados
Integração Semântica
Baseada
em Ontologias e Linked Data
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
• Ontologia de Domínio é usada
como vocabulário comum a ser
compartilhado pelas fontes de
dados
• As
Ontologias
Exportadas
especificam a semântica das
fontes de dados usando o
vocabulário comum
Ontologia de Dominio Ontologia Exportada Ontologia ExportadaData Source Data Source
Mapeamentos
Integração Semântica
Baseada
em Ontologias e Linked Data
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017 Ontologia de Dominio Ontologia Exportada Ontologia Exportada
Data Source Data Source
Mapeamentos
Links
4 Passos:
1. Modelagem da Ontologia de
Dominio;
2. Geração dos Mapeamentos e
Ontologias Exportadas;
3. Identificação das Ligações
(links);
TESTEMUNHAGEM
AMOSTRA
ANÁLISE
Integração Semântica
das Bases
de Dados E&P
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017 Integração Semântica Mashup de Glossários Fontes de Dados Base de Conhecimento E&P
▪ Fontes de Dados Integradas semanticamente usando ontologias; ▪ Ontologias enriquecidas com termos do Mashupde glossários; ▪ Conjunto delinks entre as diferentes fontes;
Consultas Semânticas Mineração Semântica Aplicação Cliente Mashup de Dados Consultas Federadas
Publicação e Integração
Semântica de Glossários de
E&P
Glossários Integrados
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Schlumberger Oilfield Glossary http://www.glossary.oilfield.slb.com
Glossário da Agência Nacional do Petróleo, Gás Natural e Biocombustíveis
(ANP) http://www.anp.gov.br/?id=582
Bureau of Safety and Environmental Enforcement (BSEE)
http://www.bsee.gov/BSEE-Newsroom/Publications-Library/Glossary-of-Terms
PetroWiki - SPE's E&P Glossary http://petrowiki.org/Category:Glossary
Petrobras SINPEP Documentos fornecidos pela equipe da Petrobras
Wikipédia https://wikipedia.org
Publicação e Integração
Semântica de Glossários de
E&P
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Passos:
1. Modelagem da
Ontologia de Glossários
de E&P
2.
Publicação dos
Glossários como Linked
Data
3. Identificação de Links
entre os glossários
4.
Limpeza dos dados
Passo 1: Ontologia de Glossários
de E&P
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Passo 2: Triplificação dos
Glossários
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017 Base de Documentos Glossários de E&P Coletar Processo de Triplificação Outr os
Passo 2: Triplificação dos
Glossários
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Passos para Definição das Regras de
Match:
Definição intuitiva de regras (usa amostra de
100 predicados skos:prefLabel)
Formalização das regras;
Execução das regras no SILK (usa SPARQL)
Avaliação dos resultados
Refinamento das regras
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
EXPERIMENTOS:
Coleta de de 5373 termos dos glossários
Schlumberger Oilfield e PetroWiki - SPE’s E&P
Links Gerados foram avaliados por um
geólogo especialista no domínio E&P para
comprovar a eficácia do modelo proposto;
Execução das regras no SILK
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Passo 3: Geração de Links
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Publicação e Integração
Semântica de Glossários de
E&P
Motivação :
–
Enriquecimento de ontologias no domínio de E&P
– Facilita a Integração semântica de ontologias no
domínio de E&P
– Busca Semântica
– Inferências
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
24 Po ço Bloco Contrato Empres a possui pertence a direito de explorar participa Perfila gem possui realiza poss ui ocorre Perfur ação Fa se poss ui poss ui ocor re reali za Ocorrên cia gera Dados de Rocha Perfilage m Perfuraç ão Poço Bloco e Processo Explorató rio Amostra Lateral ocorre gera Proprieda de Geológica Propried ade Petrofísi ca possui poss ui possui possui Recup eração obtém Corri da Condi çao Mecân ica Porosid ade Compos ição possui possui Permeabili dade Localizaç ão Ba se Top o Profun didade Top o Ba se
Conclusões
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Framework baseado em Ontologias para
Integração semântica de Glossários.
Extração e Publicação dos Glossários de
E&P na Web de Dados
Algoritmo eficaz para a geração
semiautomática de Links semânticos
Trabalhos Futuros
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
ONTOBRAS 2017
Melhorar a eficácia do algoritmo de
geração de links skos:broader,
skos:narrower e skos:related.
Enriquecimento de ontologias no domínio de
E&P
Uso dos Glossários no Alinhamento de
ontologias no domínio de E&P
Uso da Tecnologias da Web Semântica para
Publicação e Integração Semântica de Glossários
Ricardo Ávila, David Araujo, Gabriel Lopes,
Vânia Vidal, José Macedo
ONTOBRAS 2017
Framework Baseado em Ontologias para Publicação e Integração Semântica de Glossários
Papel das Ontologias em E&P
• A análise de dados de E&P frequentemente exige
mais informação e conhecimento do que pode
ser obtido a partir de fontes de dados isoladas.
• A combinação de Ontologias e Dados
Interligados provê uma solução inovadora para
aplicações onde existe a necessidade de integrar
diferentes fontes de dados para responder à
Processo de Enriquecimento de
Ontologias
A interligação de dados oferece grande potencial por meio da geração
de linkssemânticos
Os links semânticos podem ser processados de forma mais rica por
máquina, explorando e enriquecendo cognitivamente o significado da ligação entre ambos os recursos
A conexão de base de dados relacionais heterogêneas em bases Linked Data possibilita a inferência e um melhor uso dos dados