• Nenhum resultado encontrado

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION

N/A
N/A
Protected

Academic year: 2021

Share "ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION"

Copied!
8
0
0

Texto

(1)

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA

1

ONTOLOGY FOR SCIENTIFIC PUBLICATION

Andrenizia Aquino Eluan

Mestranda do Programa de Pós-Graduação em Ciência da Informação Universidade Federal de Santa Catarina (UFSC).

andrenizia@gmail.com

Gleisy Regina Bóries Fachin

Doutoranda do Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, FSC Professora do Departamento de Ciência da Informação, UFSC

gleisy@cin.ufsc.br

Resumo: Este artigo descreve a criação e implementação de uma ontologia para publicação científica, voltada

inicialmente para artigos científicos publicados em revistas eletrônicas. A aplicação foi desenvolvida na linguagem de programação Hypertext Preprocessor – PHP, tendo como objetivo, possibilitar a busca e a recuperação das informações sobre autores e seus artigos publicados. As classes, instâncias e propriedades desta ontologia, foram criadas em Web Ontology language - OWL, construída com auxilio do software Protégé.

Palavras-chave: Ontologia - publicação científica. Ontologia - PHP. Web semântica.

Abstract: This article describes the creation and implementation of an ontology for scientific publication, initially focussed on scientific articles published in electronic journals. The application was developed in Hypertext Preprocessor (PHP) programming language, with the objective of making it possible to search for and recover information on authors and the articles they have published. The classes, instances and properties of these ontology were compiled using Web Ontology language (OWL), built with the aid of Protégé software.

Keywords: Ontology – scientific publication. Ontology - PHP. Semantic Web.

1 INTRODUÇÃO

A sociedade atual é gerida pela informação e pelo conhecimento. Neste sentido, a falta de significações consistentes nos documentos disponibilizados na Web levou pesquisadores e estudiosos a propor a inserção de significados em toda a documentação disponibilizada na Web atual, surgindo então, a Web semântica e as Ontologias.

Segundo Morshed; Singh (2005), a ontologia pode ser usada para compartilhar conhecimento usando o vocabulário, a semântica e os relacionamentos similares entre conceitos de um domínio. Complementa-se, ainda, que podem ser usados também os tesauros e as taxonomias, abordados semânticamente e migrados para as linguagens específicas para a Web semântica, como Extensible Markup Language (XML), Resource Description Framework (RDF), Agent Markup Language (DARPA) + Ontology Interchange Language (DAML+OIL) e a Web Ontology Language (OWL), sendo uma das mais utilizadas e indicada pelo World Wide

(2)

O acréscimo de conceitualização na identificação dos recursos disponibilizados na Web objetiva tornar possível que os agentes de software, que atuam na rede, assim como os humanos, se tornem aptos no sentido de compreender e de processar, de forma inteligente, o conteúdo descrito em todos os recursos solicitados. A construção ágil e eficiente de ontologias contribui para isso, haja vista que aposta no desenvolvimento desta nova visão que é a da Web semântica. Esta, segundo se percebe em discussões e publicações sobre o assunto, pode ser considerada como o conjunto de um grande número de ontologias que se interligam entre si, formando um emaranhado de pontos de acesso.

As instituições e organizações tornaram acessíveis seus recursos na Web, tendo o seu conteúdo disponibilizado de forma semântica. Para isso, ferramentas e recursos tecnológicos cada vez mais aprimorados e evoluídos estão sendo projetados e oferecidos para intercambiar e processar essas informações entre todos os usuários.

De acordo com isso, este artigo apresenta a metodologia de uma aplicação que almeja disponibilizar a ontologia Publicação Científica na Web. Ele contém uma breve identificação da ontologia, descreve a criação do aplicativo utilizando a linguagem PHP, relata as dificuldades encontradas e tece algumas considerações finais, à guisa de conclusão.

2 CRIAÇÃO DA ONTOLOGIA EM OWL

Em contato com a área da comunicação científica, optou-se por desenvolver uma ontologia para a recuperação de artigos científicos on-line, utilizando como referencial teórico e prático os seguintes recursos: Sotfware PROTÉGÉ, v. 3.2.1; Norma NBR6023 – de Referência, da Associação Brasileira de Normas Técnicas - ABNT; Desarrollo de Ontologias-101: de Noy e

McGuinness (2005). Como exemplo de desenvolvimento de ontologia, utilizou-se o artigo de

Cantais et. al. (2005), An example of food ontology for diabetes control, que descreve uma ontologia de comidas para diabéticos.

Baseando-se na Norma de Referências para fazer uma citação de artigo científico, extraíram-se os termos essenciais, utilizados no processo de busca e recuperação de um artigo

on-line. Em seguida, construíram-se as perguntas que a ontologia deveria responder:

1) Quais são os autores que publicaram sobre determinado assunto?

2) Determinado autor tem artigos publicados?

3) Que autor publicou sobre determinado assunto?

4) Que artigos foram publicados em determinado ano?

5) Quais periódicos publicaram sobre determinado assunto?

6) Existem artigos publicados em 2005 sobre um determinado assunto?

(3)

Após elaborar as perguntas que deverão ser respondidas de forma relevante e precisa, iniciou-se o processo de construção da estrutura de propriedades das classes, subclasses e suas relações. Após a estruturação das classes, utilizou-se o software Protégé, onde foi criada a ontologia “Publicação Científica” em OWL. O Protégé encontra-se disponível para download no site http://protegewiki.stanford.edu/index.php/Protege_Ontology_Library. É um software livre, recomendado pela W3C para construção de ontologias e foi desenvolvido para a área biomédica, em atenção às bases de conhecimento que formam a Biblioteca Nacional de Medicina.

No quadro 1 a seguir demonstra-se a estrutura da ontologia “Publicação Científica”.

Quadro 1: Estrutura de propriedades das classes, subclasses e suas relações.

CLASSES SUB CLASSES

PROPRIEDADES RELAÇÕES OBSERVAÇÂO

Autor - 1- tem_nome_autor

2 - tem_afiliação 3 - publicação_de_ autores

- As propriedades 1 e 2 são intrínsecas, pois pertencem a esta classe.

-A propriedade 3 é extrínseca, pois vem de outra classe, a de Publicações_científicas. Editor - 1 - nome_editor

2 - nome_editor_ instituição

- Estas duas propriedades são intrínsecas. - A propriedade 2 é referente ao editor quando for uma instituição. Local - 1 - tem_cidade 2 - tem_local 3 - tem_UF

Todas elas são intrínsecas

Fontes Anais Fascículo_revista_ científica 1 - tem_ano 2 - tem_mes 3 - tem total_pags 4 - tem_editor 5 - publicações_da_ fonte 6 – nome_evento 7 – tem_fascículo 8 – tem volume 9 - tem_titulo_revista - As propriedades 1, 2 e 3, são intrínsecas da classe Fontes. - As propriedades 4 e 5 são extrínsecas da classe Fonte. - A propriedade 6 é intrínseca da subclasse Anais

- As propriedades 7 e 8 são intrínsecas, a 9 é extrínseca. Sendo estas pertencentes a subclasse Fascículo_revista_científica. - As subclasses herdam as propriedades da classe. Publicação_ científica Artigo Comunicação 1 – tem_local 2 – tem_autores 3 – tem_fonte 4 – tem_int_pag 5 – tem_titulo 6 – tem _pal_chave 7 – tem_url_artigo - As propriedades 1, 2 e 3 são extrínsecas. A 4 e 5 e 6, são extrínsecas, sendo todas da classe Publicação_científica. - As propriedades 6 e 7 são intrínsecas e fazem parte da subclasse Artigo. - As subclasses herdam as propriedades da classe. Título_ revista - 1- titulo_de_revista 2 – tem_url_revista 3 – tem_ periodicidade 4 – tem_editor As propriedades 1, 2 e 3 são intrínsecas e a 4 é extrínseca, pois vem de outra classe.

(4)

3 IMPLEMENTAÇÃO DA ONTOLOGIA

Utilizando-se a linguagem PHP e a Application Programming Interface (API) Resource

Description Framework (RDF), desenvolveu-se a aplicação da ontologia Publicação Científica,

que objetiva criar uma interface para possibilitar que o usuário possa efetuar consultas na ontologia. São apresentadas as principais funcionalidades da aplicação.

A figura 1 apresenta a tela inicial da aplicação e as opções para efetuar consultas à ontologia.

Figura 1: Tela inicial da aplicação

Na figura 2 ao lado é possível visualizar o arquivo em RDF da ontologia, através da opção ‘Visualizar a Ontologia – Textual’.

(5)

Figura 2: Tela da visualização da ontologia – Textual

Pode-se visualizar a ontologia que está sendo usada na consulta, a qual informará as opções de pesquisa (sujeito, predicado, objeto), bem como opções para refinamento da pesquisa, como: tipo de objeto, apenas um recurso ou um nó em branco, conforme apresentado na figura 3 – Visualização da Ontologia – Tabela.

Figura 3: Tela da visualização da ontologia – Tabela

(6)

No. ?nome_autor ?afiliacao ?data_de_publicacao ?titulo_artigo

Literal: ANDRENIZIA AQUINO ELUAN

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: UFSC (rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: JUN 2007 (rdf:datatype="http://www.w3.org/2001/XMLSch

Literal: WEB SEMANTICA

(rdf:datatype="http://www.w3.org/2001/XMLSche

Literal: ANDRENIZIA AQUINO ELUAN

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: UFSC (rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: JUL 2007 (rdf:datatype="http://www.w3.org/2001/XMLSch

Literal: WEB SEMANTICA NO ENSINO

(rdf:datatype="http://www.w3.org/2001/XMLSche

Literal: GLEISY REGINA BORIES FACHIN

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: UFSC (rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: JUL 2007 (rdf:datatype="http://www.w3.org/2001/XMLSch

Literal: WEB SEMANTICA NO ENSINO

(rdf:datatype="http://www.w3.org/2001/XMLSche

Figura 4: Tela de consulta por autor

Na figura 5 a seguir, demonstra-se a consulta por data de publicação, que mostra os autores que publicaram em uma determinada data. A abreviação do mês atende as normas da ABNT para artigos científicos on-line, acrescido do ano – ‘maio 2007’. Nesta figura é possível verificar que três autores são apresentados para o mesmo artigo, pois é de autoria múltipla.

No. ?nome_autor ?afiliacao ?data_de_publicacao ?titulo_artigo

1. Literal: MARIA CARMEN ROMCY DE CARVALHO (rdf:datatype="http://www.w3.org/2001/XMLSchema#string")

Literal: UCB

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string" )

Literal: MAIO 2007

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string")

Literal: ACESSO ABERTO A PRODUÇÃO CIENTIFICA NA UNIVERSIDADE CATOLICA

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string" )

2. Literal: THIAGO FERREIRA COVOES

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string") Literal: CVA-RICESU (rdf:datatype="http://www.w3.org/2001/XMLSchema#string" ) Literal: MAIO 2007 (rdf:datatype="http://www.w3.org/2001/XMLSchema#string")

Literal: ACESSO ABERTO A PRODUÇÃO CIENTIFICA NA UNIVERSIDADE CATOLICA

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string" )

3. Literal: MARIA CELIA DE TOLEDO DUBOIS (rdf:datatype="http://www.w3.org/2001/XMLSchema#string")

Literal: PUC-CAMPINAS

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string" )

Literal: MAIO 2007

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string")

Literal: ACESSO ABERTO A PRODUÇÃO CIENTIFICA NA UNIVERSIDADE CATOLICA

(rdf:datatype="http://www.w3.org/2001/XMLSchema#string" )

(7)

A consulta por título de artigos, por afiliação e demais opções poderão ser incluídas. No presente estágio de pesquisa, apresenta-se quatro opções, conforme se pode observar na figura 4 acima.

É importante ressaltar que, como os termos foram padronizados utilizando a norma NBR6023 – de Referência da ABNT, os campos recuperados em todas as consultas apresentadas são os mesmos, porém as informações mudam conforme a busca.

4 CONSIDERAÇÕES FINAIS

O uso da ontologia proporciona a disseminação, o compartilhamento, a busca e a recuperação mais eficientes das informações que estão disponíveis na Web.

Nesta aplicação, em especial, as informações disponibilizadas são metadadosextraídos de

artigos científicos on-line, que é fonte referencial para a pesquisa e desenvolvimento do conhecimento em todas as áreas do saber. O desenvolvimento da ontologia na área da comunicação científica permite a tão esperada interoperabilidade entre as diversas fontes de publicações científicas, o reuso, a adaptação e implementação, possibilitando um acesso globalizado e igualitário.

A aplicação teve por finalidade demonstrar as funcionalidades obtidas pelo uso da linguagem PHP para a execução da tarefa de manipulação da ontologia. Conclui-se que é possível efetuar consultas à ontologia em OWL, a partir da inserção da API RDF própria para o PHP.

Com o desenvolvimento desta aplicação, foi constatado que o PHP é uma linguagem que possui suporte e que implementa as funcionalidades necessárias para trabalhar com Web semântica. Porém, cabe ressaltar que todo o trabalho de desenvolvimento necessita ser feito de forma braçal, sem o uso de ambiente gráfico para auxilio na criação de aplicações e, complementa-se ainda, tal implementação poderá ser aperfeiçoada conforme o domínio que os desenvolvedores possuírem desta linguagem.

REFERÊNCIAS

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS (ABNT). Disponível em:

<http://www.abnt.org.br>.

CANTAIS, Jaime, et. al. An example of food ontology for diabetes control. In: Working notes of

the ISWC 2005 workshop on Ontology Patterns for the Semantic Web. 2005, Galway, Ireland.

Disponível em: <http://www.csc.liv.ac.uk/~floriana/PIPS/papers/FoodOntology.pdf>. Acesso em 15 ago.2007.

(8)

MORSHED, Ahsan-ul; SINGH, Ramanjit. Evaluation and Ranking of Ontology Construction Tools. Technical Report DIT-05-013. March 2005. Disponível em:

<http://eprints.biblio.unitn.it/archive/00000747/01/013.pdf>.

NOY, Natalya F.; MCGUINNESS, Deborah L. Desarrollo de Ontologías -101: Guía para crear

tu primera ontología. Stanford University, Stanford, CA, 19 set. 2005. Disponível em:

<http://protege.stanford.edu/publications/ontology_development/ontology101-es.pdf>. Acesso em: 20 jul 2007.

PROTÉGÉ - Ontology Editor and Knowledge Acquisition System, v. 3.2.1. The National Center for Biomedical Ontology, Stanford Medical Informatics. Disponível em:

<http://protege.stanford.edu>. Acesso em: 20.jul 2007.

RDQL – tutorial. Disponível em: <http://phpxmlclasses.sourceforge.net/rdql.html>. Acessado em: 8 set 2007.

RAP - RDF API for PHP. Disponível em:

Referências

Documentos relacionados

Considerar de forma sistemática e transparente as opções escolhidas para abordar o problema de política definido anteriormente... Decidindo e descrevendo

(Ver o Artigo 7 para mais informações sobre como.. encontrar revisões sistemáticas [9].) Os formuladores de políticas também podem encontrar evidências locais sobre os prejuízos

No entanto, sabemos que a incerteza para o desempenho da economia foi majorada devido a mais esse episódio da crise política, o que significa dizer que é

O Plano Estratégico do Sistema Estatístico Nacional 2008-2012, afirma sobre os recursos humanos, que o Instituto Nacional de Estatística pretende criar um quadro

Após remover a Lâmina segure firmemente o Volante Superior N° 05 (fig. 01), empurre o mesmo verticalmente para cima e em seguida puxe-o para a frente da máquina.

LAJE MACIÇA DE BETÃO ARMADO FUNGIFORME - Fornecimento e aplicação de betão da classe C25/30 em enchimento de lajes maciças, conforme projecto e CTE.. - Fornecimento e aplicação

Por meio de análise bibliográfica, entrevistas com grupos de scanlators e leitores, foi possível realizar um paralelo entre os impactos causados pelos grupos ao mercado

Com a nova geração de tratores T8, nossos clientes estarão totalmente conectados e preparados para esta nova era digital, sem perder a performance e a força para as mais