• Nenhum resultado encontrado

Um Visualizador Online de Ontologias Utilizando Árvores Hiperbólicas

N/A
N/A
Protected

Academic year: 2021

Share "Um Visualizador Online de Ontologias Utilizando Árvores Hiperbólicas"

Copied!
10
0
0

Texto

(1)

1

Um Visualizador Online de Ontologias Utilizando Árvores

Hiperbólicas

Patrícia Mylius Pizzinato (Unisinos/PUCRS) patricia.pizzinato@gmail.com

Renata Vieira (PUCRS) renata.vieira@pucrs.br

Sandro José Rigo (Unisinos) rigo@unisinos.br

Resumo: A área de Visualização de Informação surgiu para auxiliar na assimilação de conhecimento. Na área de ontologias ela se faz essencial, posto que essas estruturas possuem uma grande quantidade de informação. Com isso, esse trabalho se propõe a analisar as técnicas e ferramentas existentes para esse fim, bem como propor uma ferramenta interativa de visualização de ontologias que contempla aspectos não previstos nas ferramentas encontradas.

Palavras-chave: Visualização de Informação; Árvore Hiperbólica.

1. Introdução

A Web Semântica é um projeto inovador, que vem sendo desenvolvido desde 1998 por Tim Berners-Lee em conjunto com os outros membros da W3C (World Wide Web

Consortium) (BERNERS-LEE, 1998) (BREITMAN, 2005). A Web Semântica seria

uma extensão da Web atual, na qual haveria a possibilidade de atribuir significado aos arquivos disponíveis na Internet, de forma que esses poderiam ter seus dados compreendidos tantos por humanos como por computadores (BERNERS-LEE et al., 2001).

O projeto da Web Semântica tornou-se uma crescente área de pesquisa, estando entre suas propostas a formalização do conhecimento, sendo as ontologias o modelo de representação utilizado para este fim (SOUZA e ALVARENGA, 2004). Uma das definições mais utilizadas na literatura para conceituar o termo ontologia é dada por Gruber: “ontologias são definidas como uma especificação formal e explícita de uma

conceituação compartilhada” (GRUBER, 1993) (GRUBER, 1995).

Essas iniciativas visam auxiliar na solução do problema de sobrecarga de informação, mas não são suficientes para resolvê-lo. Tendo como um dos objetivos melhorar a seleção de informações relevantes, surge um novo esforço: o da Visualização de Informação (FREITAS et al., 2001), que tem por finalidade auxiliar usuários fazendo com que estes tenham um menor trabalho cognitivo na medida em que tentam

(2)

2

transformar objetos informativos (como textos, tabelas, estruturas hierárquicas) em objetos visuais (DIAS e CARVALHO, 2009). Está área surge como uma combinação entre a Computação Gráfica, o Processamento de Imagens, a Mineração de Dados, a Interface Humano-Computador e a Visualização Científica (FREITAS et al., 2001). Nesse contexto, este trabalho tem por objetivo geral realizar uma junção dessas duas áreas, através da construção de uma ferramenta interativa de visualização hiperbólica de ontologias. Para isso foi feita a adaptação de uma ferramenta de visualização para exibição de ontologias de forma mais completa, mais do que uma simples apresentação de hierarquias, como usualmente proposto em (SANTOS, 2008) e (MORAES, 2007). Na próxima seção serão introduzidos alguns conceitos sobre visualização de informação e visualização de ontologias, assim como será dada uma maior descrição sobre a técnica escolhida. Na seção 3 será feita uma breve elucidação sobre os trabalhos relacionados e, na seção 4, haverá a apresentação do desenvolvimento da ferramenta de visualização. Por fim, a seção 5 finaliza o trabalho, com considerações finais.

2. Fundamentação Teórica

Nas subseções seguintes são introduzidos alguns conceitos relevantes para o desenvolvimento desse trabalho.

2.1 Visualização de Informação

A área de Visualização de Informação é relativamente nova, mas já é possível encontrar diversos trabalhos sobre o assunto nos mais diferentes tipos de domínio (CHEN, 2006). Esta área abrange um amplo número de estruturas representativas e também novas formas de representar informação, as quais estão continuamente sendo inventadas (WARE, 2004).

Até pouco tempo, o termo visualização tinha o significado de ser construção mental de uma imagem visual. Esse conceito foi gradativamente sendo modificado, adquirindo então o significado de representação gráfica de dados ou conceitos. Deste modo, a visualização deixou de ser simplesmente uma construção mental para tornar-se de fato um objeto de apoio à tomada de decisão (WARE, 2004).

A área de Visualização de Informação possui muitas características importantes, tais como:

(3)

3

• A visualização facilita a compreensão de uma grande quantidade de dados. • Ela permite que problemas existentes com os dados tornem-se mais aparentes,

fazendo-se assim inestimável em controle de qualidade.

• A visualização auxilia também na compreensão de características dos dados, sejam essas de grande ou pequena escala.

Destaque-se que um dos maiores benefícios da visualização de dados é a possibilidade de compartilhamento de uma grande quantidade de informação, que pode ser rapidamente interpretada se for bem representada. Além disso, segundo Ware “nós

adquirimos mais informação através da visão do que através de todos os outros sentidos combinados” (WARE, 2004).

Na subseção a seguir é feita uma elucidação sobre ontologias, sendo também apresentadas algumas técnicas de visualização utilizadas para estas.

2.2 Ontologias e Visualização de Ontologias

O termo ontologia teve sua origem na filosofia, significando o estudo do ser e da existência (PICKLER, 2007). Hoje em dia, o consórcio W3C lhe atribui um conceito segundo o qual a ontologia é “a definição dos termos utilizados para descrever e

representar uma área do conhecimento” (W3C, 2009a).

Atualmente diversos padrões e linguagens vêm sendo utilizados para a construção de ontologias e grande parte deles é baseada na linguagem XML (eXtensible Markup

Language). Mas, desde 2004, a W3C recomenda o uso do formato OWL (Web Ontology Language) para construção de ontologias, visando com isso uma padronização

no desenvolvimento dessas na Web (W3C, 2009b).

Os elementos fundamentais para construção de uma ontologia são as classes e as propriedades (que são as relações e os atributos das classes). Podemos ainda ter um conjunto de indivíduos associados a uma classe, os quais são chamados de instâncias da classe (LIMA e CARVALHO, 2005).

Exatamente pelo fato de uma ontologia ser mais do que uma hierarquia de conceitos, o trabalho de desenvolver um método de visualização de ontologias não é uma tarefa fácil. Acaba, pois, não sendo simples criar uma visualização que seja eficiente na

(4)

4

exibição de informações e que permita também que o usuário tenha uma boa interação (KATIFORI et al., 2007).

Segundo Katifori et al. (2007), uma boa visualização de ontologias deveria ser capaz de mostrar os seguintes elementos:

• Classes: O método de visualização deve ser capaz de exibir pelo menos os nomes das classes de forma legível.

• Instâncias: Boa parte dos usuários está interessada nessa informação, mas as instâncias não são exibidas na maior parte dos métodos de visualização.

• Relações: A exibição de outros tipos de relação que não a relação do tipo “é um” (Isa) é essencial; essas relações não são fáceis de serem representadas.

• Taxonomia (relação Isa): A apresentação dessa relação é fundamental para o entendimento da relação de herança entre as classes.

• Herança Múltipla: São os casos em que uma classe tem mais de um pai, e assim como as relações, não são fáceis de serem efetivamente representadas.

Abaixo são introduzidas algumas técnicas de visualização que são aplicadas a ontologias, apresentadas em (KATIFORI et al., 2007):

• Lista Indentada: A maioria dos editores de ontologia, como o Protégé1, oferecem esse tipo de visualização. Nessa visão, a taxonomia da ontologia é representada como uma árvore. Ela também é utilizada em muitos navegadores de arquivos (ex: Windows Explorer).

• Foco+Contexto: Nessa técnica o nodo em foco é geralmente o que está no centro, sendo que ao seu redor ficam representados outros nodos restantes. O tamanho desses nodos é reduzido até não serem mais visíveis. Geralmente, são construídos com a ajuda de equação hiperbólica.

Dentro do método Foco+Contexto foram criadas várias técnicas, dentre as quais, para um melhor entendimento desse trabalho, uma delas especificamente precisa ser conceituada:

(5)

5

Árvore Hiperbólica (Hyperbolic Tree): Essa técnica, que foi escolhida para o

desenvolvimento deste trabalho, explora a geometria hiperbólica. Ela consiste basicamente em formar uma hierarquia em um plano hiperbólico e mapear este plano para uma região circular. Isso é feito de maneira uniforme, de modo que a distância entre os nodos é aproximadamente a mesma em toda a hierarquia. Na visualização hiperbólica, inicialmente, é exibida uma árvore com sua raiz no centro, mas é possível interagir com a visualização para trazer os outros nodos para o foco (LAMPING et. al., 1995). Alguns fatores que levaram a escolha da presente técnica em detrimento de outras foram:

o É uma visualização de fácil entendimento sobre como está estruturada a hierarquia de conceitos;

o Segundo Katifori et al. (2007), mesmo que essa técnica seja geralmente utilizada para exibição da taxonomia, ela possibilitaria a sua expansão para uma exibição mais completa das informações da ontologia;

o Além disso, para Santos (2008), essa técnica é ideal para visualização e navegação de grandes hierarquias.

Na próxima seção serão mostrados alguns trabalhos relacionados.

3. Trabalhos Relacionados

Desenvolvido por Santos (2008), para a empresa Embrapa Informática Agropecuária2, o HyperTree Browser é um navegador hiperbólico implementado em linguagem de programação Java. Essa ferramenta faz parte do HyperTree Studio, que consiste em um navegador, o HyperTree Browser, e um programa de construção de hierarquia de conceitos, o HiperEditor. Este trabalho não se destina à visualização de ontologias, ele utiliza árvores hiperbólicas para exibição de páginas de sites, funcionando como um mapa do site. O HyperTree Browser permite apenas a visualização de arquivos com extensão HTZ, que são gerados com o HyperTree Studio.

A Treebolic3, de Bernard Bou, é um software de código aberto, desenvolvido na linguagem Java, que atualmente se encontra na sua segunda versão. Ele possibilita a geração de árvores hiperbólicas e a criação de applets para exibição dos resultados.

(6)

6

Também permite realizar várias modificações gráficas nas árvores construídas, tais como: inserção de figuras nos nodos e possibilidade de usar cores diferentes para visualização dos nodos e arestas. A Treebolic trabalha com XML, mas também possibilita o carregamento de ontologias, utilizando para isso a API do Jena4.

O OntoCover foi desenvolvido em 2003, pelo professor Renato Fileto, e atualizado em 2007, por Marcelo Oliveira de Moraes (MORAES, 2007). Desenvolvido em linguagem Java, esta ferramenta possibilitaria os seguintes tipos de interação:

• Carregar ontologias (as ontologias construídas em RDF5 poderiam ser carregadas pelo programa);

• Visualizar e navegar;

• Comparar termos (é possível selecionar dois termos da árvore e o programa indicaria se esses são iguais ou não);

Fazer consultas do tipo SQL através da aba Query Engine.

FIGURA 1 – Ontologia de solos exibida no Ontocover (MORAES, 2007).

A Figura 1 exibe a visualização do OntoCover na forma de uma árvore hiperbólica. As diferentes cores servem para separar os conceitos por assuntos/temas. Abaixo da visualização é possível ver a descrição de cada nodo selecionado, se este possuir uma.

3.1 Escolha da Ferramenta

As três ferramentas relatadas acima foram testadas para fins de análise e comparação das suas funcionalidades. O HyperTree Browser6 na versão 1.6, a Treebolic na versão

3 http://treebolic.sourceforge.net/en/index.html 4 http://jena.sourceforge.net/

5

Modelo de descrição de recursos (Resource Description Framework)

(7)

7

2.0.1 e o Ontocover7 na sua versão 1.0 (pois a versão atualizada do trabalho não foi encontrada).

Com base nos testes efetuados foi selecionada a ferramenta Treebolic para o desenvolvimento deste trabalho. Os critérios para essa seleção foram:

• A disponibilização do código fonte;

• O fato da ferramenta permitir várias modificações gráficas no conteúdo exibido; • A forma como a ferramenta exibe o conteúdo, que pode esconder ou mostrar

certas informações, como por exemplo, propriedades;

Além disso, a Treebolic também possui a funcionalidade de carregar ontologias, mas a mesma não funciona na versão disponível para instalação, tendo que ser baixado seu código fonte e recompilado para seu funcionamento. Ela utiliza a biblioteca Jena para manipulação de ontologias, porém em testes realizados, contatou-se que a ferramenta nem sempre conseguia exibir a ontologia de forma correta. Para o desenvolvimento desse trabalho optou-se então por substituir a biblioteca Jena pela biblioteca OWL API8, ao invés de tentar consertar os erros de utilização do Jena, deixando assim a ferramenta mais atualizada e compatível com o padrão OWL 29.

A próxima seção traz uma maior explicação sobre o desenvolvimento do visualizador.

4. Projeto do Visualizador

Baseado nas análises feitas, este trabalho estendeu as seguintes funcionalidades a partir da Treebolic:

Visualização das propriedades (data properties e object properties);

• Visualização das instâncias da ontologia (ao menos o nome das instâncias existentes na ontologia deve ser exibido);

• Possibilidade de carregar ontologias no formato OWL, usando OWL API.

A Figura 2 ilustra o funcionamento do visualizador desenvolvido. Primeiramente, é dado como entrada um arquivo no formato OWL, do qual serão extraídas as informações de classes, propriedades e instâncias, utilizando-se para isso a OWL API.

7 Disponível para download em http://www.inf.ufsc.br/~celoom/ontocover/OntoCover.exe 8 http://owlapi.sourceforge.net/

(8)

8

Essas informações são adaptadas para exibição na Treebolic, na qual, depois de processadas, é gerado o applet para visualização da ontologia.

FIGURA 2 – Arquitetura do visualizador.

O visualizador é capaz de exibir todos os elementos mencionados na seção 2.2, sendo que as relações (Object Properties) são exibidas da mesma forma que os atributos e o

range dessas relações é mostrado como forma de comentário. Na Figura 3 são

apresentadas algumas das melhorias implementadas: a exibição das relações (Data

Properties) e o menu para exibição de instâncias.

FIGURA 3 – Exibição dos Data Properties da Ontologia de Currículo Lattes (CASTANÕ, 2008), disponível no site OntoLP - http://www.inf.pucrs.br/~ontolp/downloads-ontolattes.php.

5. Considerações Finais

A ferramenta desenvolvida nesse trabalho tem como objetivo auxiliar os usuários do portal OntoLP10 na escolha de recursos, na medida em que esses poderão ter uma melhor noção das características de cada ontologia sem a necessidade de abrir cada uma delas em um editor. Tornando-se assim uma importante ferramenta de apoio à tomada de decisão.

9 http://www.w3.org/TR/owl2-overview/ 10 http://www.inf.pucrs.br/~ontolp/

OWL Extração das

Informações

Construção da visualização

(9)

9

A visualização de informação oferece um grande auxílio para entendimento dos dados existentes nas ontologias. A idéia de possibilitar uma forma de visualização que consiga extrair o maior número possível de informação desse tipo de estrutura é o desafio ao qual este trabalho se propõe.

Esse visualizador será aplicado no Portal de Ontologias OntoLP, no qual será possível realizar uma análise sobre o enriquecimento da visualização das ontologias com as melhorias aplicadas. Atualmente, o Portal já possibilita uma visualização hiperbólica das hierarquias de classe, criada através da ferramenta E-Termos11, que possui uma adaptação do HyperTree Studio (BESTTETI et. al., 2010). A visualização atual não contempla a visualização de propriedades e instâncias, o que será possível com a aplicação deste trabalho.

6. Agradecimentos

O presente trabalho foi alcançado em cooperação com a Hewlett-Packard Brasil Ltda. e com recursos provenientes da Lei de Informática (Lei nº 8.248, de 1991).

Referências

BERNERS-LEE, Tim. (1998) Semantic Web Road map. Disponível em: http://www.w3.org/DesignIssues/Semantic.html. Acessado em Agosto de 2009.

BERNERS-LEE, Tim; HENDLER, James; LASSILA, Ora. The semantic web. Scientific American. New York, p. 1-18, Maio 2001.

BESTETTI, Anderson ; FREITAS, Larissa A. ; VIEIRA, Renata . Using extended metadata model

OMV and metrics in OntoLP Portal. In: 1st Workshop on Ontology Repositories and Editors for the

Semantic Web (ORES-2010), 2010, Hersonissos. Proceedings of the 1st Workshop on Ontology Repositories and Editors for the Semantic Web (ORES-2010), Greece, May 31, 2010., 2010. v. 596. BREITMAN, Karin. Web semântica: a internet do futuro. Rio de Janeiro: LTC, 2005.

CASTAÑO, André Casado. Populando ontologias através de informações em HTML - o caso do

Currículo Lattes. 2008. Dissertação (Mestrado em Ciências da Computação) - Universidade de São

Paulo.

CHEN, Chaomei. Information Visualization: Beyond the Horizon. New York; London: Springer, 2006 DIAS, Mateus Pereira; CARVALHO, José Oscar Fontanini. A Visualização da Informação e a sua

contribuição para a Ciência da Informação. DataGramaZero - Revista de Ciência da Informação, v.8,

n.5, out/07, Artigo 02. Disponível em: http://www.datagramazero.org.br/out07/Art_02.htm Acessado em Agosto de 2009.

FREITAS, C. M. Dal S.; CHUBACHI, O.M.; LUZZARDI, P. R.G.; CAVA, R.A. Introdução à

visualização de informações. RITA, v. 8, n. 2, p. 1-16, 2001.

GRUBER, T. R. A translation approach to portable ontology specications. Knowl. Acquis., Academic Press Ltd., London, UK, UK, v. 5, n. 2, p. 199-220, 1993. ISSN 1042-8143.

11

(10)

10 GRUBER, T. R. Toward principles for the design of ontologies used for knowledge sharing. Int. J. Hum.-Comput. Stud., Academic Press, Inc., Duluth, MN, USA, v. 43, n. 5-6, p. 907-928, 1995. ISSN 1071-5819.

KATIFORI, Akrivi; HALATSIS, Constantin; LEPOURAS, George; VASSILAKIS, Costas; GIANNOPOULOU, Eugenia. Ontology Visualization Methods - A Survey, ACM Computing Surveys, Volume 39 , Issue 4, Article No. 10, October 2007.

LAMPING, John; RAO, Ramana; PIROLLI, Peter. A Focus+Context Technique Based on Hyperbolic

Geometry for Visualizing Large Hierarchies. CHI'95: Proceedings of the ACM Conference on Human

Factors and Computing Systems, p. 401-408, Denver, Colorado, 1995.

LIMA, Júlio César; CARVALHO, Cedric L. de. Ontologias: OWL (Web Ontology Language), 2005. (Relatório Técnico)

MORAES, M. O.; FILETO, R. Atualização do OntoCover: uma biblioteca Java para manipular

ontologias em aplicações da Web semântica. In: IV Escola Regional de Banco de Dados (ERBD),

Florianópolis. Brasil, 2008.

PICKLER, Maria Elisa Valentim. Web Semântica: ontologias como ferramentas de representação do

conhecimento. Perspect. ciênc. inf. [online]. 2007, vol.12, n.1, pp. 65-83. ISSN 1413-9936. doi:

10.1590/S1413-99362007000100006.

SANTOS, R. M. G. dos. Teoria e desenvolvimento de software multiplataforma para visualização e

manipulação de árvores hiperbólicas. 2008. 65 f. Trabalho de graduação (Curso Superior de

Tecnologia em Informática) - Centro Superior de Educação Tecnológica, Universidade Estadual de Campinas, Campinas.

SOUZA, Renato Rocha; ALVARENGA, Lídia. A Web Semântica e suas contribuições para a ciência

da informação. Ci. Inf. [online]. 2004, vol.33, n.1, pp. 132-141. ISSN 0100-1965.

W3C. OWL Web Ontology Language Use Cases and Requirements - W3C Recommendation 10 February 2004a. Disponível em: http://www.w3.org/TR/webont-req/ Acessado em Novembro de 2009. W3C. OWL Web Ontology Language Overview - W3C Recommendation 10 February 2004b. Disponível em: http://www.w3.org/TR/owl-features/ Acessado em Julho de 2009.

WARE, C. Information Visualization: Perception for Design. San Francisco: Morgan Kaufmann Publisher, 2004.

Referências

Documentos relacionados

O TBC surge como uma das muitas alternativas pensadas para as populações locais, se constituindo como uma atividade econômica solidária que concatena a comunidade com os

Founded in Southern of Brazil, Riva conquered the world and has become an international reference in luxury design in stainless steel and silver objects.. In addition to the

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

As pontas de contato retas e retificadas em paralelo ajustam o micrômetro mais rápida e precisamente do que as pontas de contato esféricas encontradas em micrômetros disponíveis

Código Descrição Atributo Saldo Anterior D/C Débito Crédito Saldo Final D/C. Este demonstrativo apresenta os dados consolidados da(s)

O pressuposto teórico à desconstrução da paisagem, no caso da cidade de Altinópolis, define que os exemplares para essa análise, quer sejam eles materiais e/ou imateriais,

Para entender o supermercado como possível espaço de exercício cidadão, ainda, é importante retomar alguns pontos tratados anteriormente: (a) as compras entendidas como

Este desafio nos exige uma nova postura frente às questões ambientais, significa tomar o meio ambiente como problema pedagógico, como práxis unificadora que favoreça