• Nenhum resultado encontrado

Classificação e elementos (componentes) das ontologias

3. REVISÃO DA LITERATURA

3.3 TESAUROS E ONTOLOGIAS

3.3.2 Ontologias

3.3.2.1 Classificação e elementos (componentes) das ontologias

Ontologias descrevem domínios utilizando uma organização taxonômica, ou seja, baseando-se nos conceitos de especialização (subclasse) e generalização (superclasse). Já as relações que envolvem composição, tais como parte-todo ou gênero-espécie, só podem ser representadas através de propriedades não estruturais, e desta forma pode-se considerar aspectos léxico-semântico para estabelecer estas relações, por exemplo.

Um sistema de classificação que utiliza a generalização da ontologia como o critério principal para a classificação foi proposto por Guarino (1998). Neste sistema o autor identifica:

 Ontologias de nível superior (alto-nível ou meta-ontologias) – descrição de conceitos muito genéricos, tais como espaço, tempo, eventos, dentre outros. Estes conceitos podem ser compartilhados por uma grande comunidade de usuários, pois independem do domínio de aplicação, podendo inclusive ser reutilizados para criação de novas ontologias.

 Ontologias de domínio - descrevem o vocabulário relativo a um domínio genérico buscando especializar conceitos da ontologia de alto nível. Pode-se citar como exemplos ontologias de veículos, documentos, dentre outros.

 Ontologias de tarefas - descrevem o vocabulário relacionado a uma tarefa ou atividade genérica através da especialização de conceitos presentes na ontologia de alto nível.  Ontologias de aplicação - são as ontologias mais específicas por serem utilizadas dentro

das aplicações. Conceitos em ontologias de aplicação correspondem, de maneira geral, a papéis desempenhados por entidades do domínio no desenrolar de alguma tarefa. Um exemplo é uma ontologia para uma aplicação que trabalhe com carros de luxo. Essa ontologia especializará conceito da ontologia de veículos (que é uma ontologia de domínio).

A Figura 9 mostra os diversos tipos de ontologias e seus relacionamentos. Observa-se que quanto mais alto o nível das ontologias maior é sua reusabilidade por definir conceitos genéricos; enquanto as ontologias de baixo nível ou de aplicação são as que possuem menor capacidade de reuso, por definir conceitos relativos a uma aplicação específica.

Figura 9: Diferentes tipos de ontologias e seus relacionamentos

Fonte: figura elaborada pela autora.

Além da classificação das ontologias alguns elementos (componentes) também são apresentados. Para facilitar o compartilhamento do conhecimento de um dado domínio uma ontologia apresenta diversos elementos, tais como:

 Conceitos ou Classes – (organizadas em uma taxonomia) termo relacionado a um determinado domínio. Como exemplo o termo “metrô” é um conceito relacionado ao domínio de transportes.

 Definição do conceito – trata-se do significado semântico do conceito de um determinado domínio. Por exemplo, o termo “carro” no domínio de transportes pode ser definido como um meio de transporte privado, que possui quatro rodas e trafega sobre vias urbanas apropriadas para a circulação destes veículos.

 Propriedade (características) – é o atributo de um termo que permite a caracterização em um determinado domínio, ou seja, é uma identificação que o diferencia das demais instâncias neste domínio tornando-o único. Como exemplo, podemos caracterizar um “carro” citando informações como placa, chassi, fabricante, modelo, cor, dentre outros.

 Relação (relacionamentos) – é o relacionamento dos termos/conceitos, ou seja, determina como os conceitos se relacionam (representam o tipo de interação entre os conceitos de um domínio). O termo “carro” é utilizado pelo conceito transporte particular.

 Restrição – são representadas através de axiomas (usados para modelar sentenças sempre verdadeiras) e define determinados limites para os conceitos de um domínio. Como exemplo, o conceito “usuário só pode utilizar o ônibus se tiver o conceito passagem eletrônica”. Restrições de valor e de cardinalidade (cardinalidade mínima e máxima) são as mais utilizadas. Restrições também podem ser utilizadas para representar o “ou exclusivo” e para definir melhor a semântica de classes especializadas derivadas de classes genéricas.

 Instâncias - utilizadas para representar elementos específicos, ou seja, os próprios dados (GRUBER, 1995; NOY e MCGUINNESS, 2002).

Estes são os elementos típicos que compõem uma ontologia, porém não são obrigatórios. A relação entre propriedades, classes e instâncias é de extrema importância na criação de ontologias, conforme Figura 10.

Figura 10: Relação entre propriedades, classes e instâncias

Fonte: figura elaborada pela autora.

Assim sendo, uma ontologia formal pode assumir diversas formas desde que inclua um vocabulário de termos e alguma especificação do significado de suas definições, ou seja, aquela que define vocabulário com lógica. Desta forma, uma ontologia consiste em termos, definições e axiomas. Não basta construir redes semânticas entre palavras, onde são apresentadas cadeias de associações, que na maioria dos casos não estão baseadas em relações

lógicas. Uma ontologia formal é formada por redes conceituais e provê relações de generalização e agregação, encadeadas logicamente. Além disso, temos os axiomas que determinam as regras para a interpretação, ou seja, são importantes para a definição semântica dos termos e restrições contidas na ontologia. Além dos elementos já citados, uma ontologia pode conter a especificação dos atributos das classes como valores que estes podem assumir, ou seja, valor padrão, cardinalidade e restrições. Assim podemos afirmar que uma ontologia é diferente de uma taxonomia.

Para Breitman (2005) taxonomia é a classificação na forma hierárquica, ou seja, é possível estabelecer relacionamentos e classificar a informação no formato árvore que usa o relacionamento pai-filho (generalização ou tipo-de), por exemplo, uma estrutura de diretórios. Já a ontologia possui diversos tipos de relacionamentos entre as classes (facetas) como “parte- de”, “causa-efeito”, “localização”, não se restringindo a generalização, além de ser possível atribuir características ou propriedades aos termos (atributos). Para Dodebei (2002) faceta é a técnica de fragmentar um assunto em partes constituintes (aspectos/partes) utilizando categorias para estabelecer a relação.

Em vocabulários controlados uma faceta (F) contém características distintas para cada conceito, provendo em uma comparação relações combinadas como segue:

F = lg, mg, Ri, onde:

lg identifica conceitos específicos (um ou mais), mg indica conceitos mais gerais (um ou mais) e, R identifica conceitos relacionados (um ou mais).

Quando se pretende realizar uma correspondência entre dois vocabulários (V1, V2) considera-se F como conceitos de ambos os vocabulários. Para cada faceta (F) do vocabulário 1 (V1) é verificada a correspondência com todas as facetas (F) do vocabulário 2 (V2). Os conceitos das facetas de ambos os vocabulários são armazenados em tabelas para fins de correspondência. O princípio do algoritmo aplicado a cada conceito correspondente pode ser observado na Figura 11.

Figura 11: comparação de vocabulários

Fonte: figura elaborada pela autora.

Vários algoritmos para comparação de ontologias são reportados na literatura dentre os quais SMOA Distance, Hamming Distance, Jaro Medida, SubString Distância, N-gram, Jaro WinKler Measure, Lavestein Distance, dentre outros. Alguns desses algoritmos de comparação apresentam uma abordagem top-down, ou seja, primeiramente comparam conceitos mais gerais, que caso sejam correspondentes, então podem ser considerados sinônimos, por exemplo. Em segundo lugar faz-se uma comparação dos conceitos menos genéricos que podem apresentar uma correspondência parcial ou não correspondência.

A título de exemplo, considerando duas ontologias (A e B) conforme Figura 12, as arestas pontilhadas indicam correspondências entre as entidades de A e B. No exemplo, percebe-se uma correspondência entre as entidades carro e automóvel. Também é possível atribuir peso às arestas de forma a indicar o grau de confiança dessa correspondência. Observe que o grau de confiança da correspondência entre carro e automóvel é de 0,9, (ABOLHASSANI et al, 2006).

Figura 12: Exemplo de alinhamento entre duas ontologias

Fonte: Abolhassani et al, 2006.

Vários dos algoritmos citados fazem uma classificação baseada nas abordagens de alinhamento, vistas como técnicas no nível sintático e/ou terminológico. Assim sendo, o

processo de alinhamento de ontologias está pautado em ligações semânticas que podem ser estabelecidas a partir de funções de similaridade. Estas funções de similaridade permitem comparar termos baseados em strings, ou seja, uma sequência de caracteres. Assim a semelhança entre dois termos aumenta quando a semelhança entre as suas sequências de caracteres correspondentes também aumenta.

Não é proposta deste trabalho avaliar nenhum algoritmo de comparação de ontologias, mas sim utilizar-se de alguma ferramenta que possa servir como recurso para identificar termos recorrentes e gerar uma versão de um microtesauro.