Ontologias para Ambientes Arqueológicos
Dissertação de Mestrado em
Engenharia Informática
Maria Cristina Graça Caldeira
Professor Doutor Luís Gonzaga Mendes Magalhães
Ontologia para Ambientes Arqueológicos
Dissertação de Mestrado em
Engenharia Informática
Maria Cristina Graça Caldeira
Professor Doutor Luís Gonzaga Mendes
Magalhães
Composição do Júri:
Presidente: Doutor Paulo Nogueira Martins, Professor Auxiliar c/Agregação da Universidade de Trás-os-Montes e Alto Douro.
Vogal: Doutor Luís Gonzaga Mendes Magalhães, Professor Auxiliar c/Agregação da Universidade do Minho.
Vogal: Doutor António Fernando Vasconcelos Cunha Costa Coelho, Professor Auxiliar da Universidade do Porto.
Dissertação apresentada por Maria Cristina Graça Caldeira à Universidade de Trás-os-Montes e Alto Douro para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Engenharia Informática, sob a orientação do Professor Doutor Luís Gonzaga Mendes Magalhães.
v
Quero começar por agradecer ao meu orientador Professor Doutor Luís Gonzaga Mendes Magalhães pela sua constante disponibilidade, pelos seus conselhos e indicações de ordem técnica.
Ao meu marido Rui Guedes, pelo constante carinho, apoio e incentivo que sempre me deu, e pela sua ajuda no desenvolvimento deste trabalho.
Ao meu filho Alexandre, pelo tempo que não lhe dediquei, por ser a fonte da minha motivação e porque o sorriso dele conseguiu alegrar os piores momentos desta caminhada.
À minha irmã Filipa pelo apoio e incentivos que me deu e, principalmente aos meus pais, pela educação, motivação e concelhos dados ao longo da minha vida.
Quero agradecer à Camara Municipal de Sernancelhe por todo o apoio prestado e pela disponibilidade de informação.
Agradeço à Maria do Céu Nunes pelo apoio prestado na revisão literária.
Por último, a todos aqueles que direta ou indiretamente, contribuíram para esta imensa felicidade que estou a sentir neste momento.
vii
Os vestígios arqueológicos são elementos importantes das nossas cidades, permitindo reconhecer visualmente, por vezes unicamente de uma forma parcial, qual o seu aspeto original, representando um importante legado para as gerações futuras. A necessidade de obter uma representação digital desses elementos levou à criação de ontologias específicas para a área da arqueologia. Porém, essas ontologias são demasiado genéricas e, geralmente, não são suficientes para descrever com o detalhe necessário, os sítios arqueológicos.
Neste âmbito, este trabalho tem como principal objetivo efetuar um estudo sobre as ontologias existentes para a área da arqueologia e identificar o seu potencial para descrever sítios arqueológicos.
O trabalho iniciou com a análise de um conjunto de ontologias, tendo sido selecionadas duas delas, dado o seu potencial para a caracterização de sítios arqueológicos. Para identificar o potencial de cada uma dessas ontologias optou-se por uma metodologia de estudo de caso. Assim, as duas ontologias em questão foram aplicadas num caso de estudo, a Igreja Matriz de Sernancelhe, de modo a identificar os seus pontos fortes e fracos para esta área de aplicação.
Para a representação de uma grande variedade de monumentos arqueológicos, o CityGML é uma ontologia que abrange um grande leque de representação de monumentos. Porém, a criação de um ficheiro CityGML pode ser uma tarefa complexa e demorada. A segunda ontologia apesar de ser de fácil compreensão e o processo de criação ser rápido e simples, por enquanto, a implementação existente só possibilita a representação de monumentos do tipo Igreja.
Nenhuma das ontologias satisfaz, de uma forma isolada, os requisitos necessários para efetuar uma representação 3D de um monumento, mas em conjunto com outras ontologias obtém-se resultados com muito mais abrangência, quer a nível de representação quer ao nível da complexidade do objeto a representar, permitindo maior detalhe através de uma ontologia em detrimento de outra sem esse mesmo nível de representação, enriquecendo o resultado final.
Palavras-chave: Ontologias, CIDOC, CityGML, representação 3D e modelação a partir
ix
The archaeological remains are important elements of our cities, enabling to visually recognize, sometimes only partially, what was its original aspect, representing an important legacy for future generations. The need to obtain a digital representation of these elements led to the creation of ontologies specific to the field of archaeology. However, these ontologies are too generic and, generally, are not sufficient to describe with the necessary detail, the archaeological sites.
In this context, this paper has as main objective to conduct a study on the existing ontologies for the area of archaeology and identify their potential to describe archaeological sites.
The work began with the analysis of a set of ontologies, having been selected two of them, given their potential for characterization of archaeological sites. To identify the potential of each of these ontologies a case study methodology was used. Thus, the two ontologies in question were applied in a case study, the Igreja (mother church) of Sernancelhe in order to identify their strengths and weaknesses for this application area.
For the representation of a wide variety of archaeological monuments, the CityGML is an ontology covering a wide range of representation of monuments. However, the creation of a CityGML file can be complex and time-consuming. The second ontology despite being easy to understand and the process of creation be quick and simple, for the time being, the existing implementation only allows the representation of monuments like Church.
Alone, none of the ontologies satisfies, the conditions required to make a 3D representation of a monument, but in conjunction with other ontologies are obtained results with much more coverage, both at the level of representation and in terms of complexity of the object to represent, allowing greater detail through an ontology in detriment of another without that same level of representation, enriching the final result.
Keywords: Ontology, CIDOC, CityGML, 3D representation and modelling from
xi
“ A ciência será sempre uma busca e jamais uma descoberta. É uma viagem,
nunca uma chegada.”
xiii
Agradecimentos ... v
Resumo ... vii
Abstract ... ix
Índice de Figuras ... xv
Índice de Tabelas ... xvii
Lista de abreviaturas, Siglas e Acrónimos ... xix
1 – Introdução ... 1
2 – Enquadramento conceptual ... 5
2.1 – Ontologias ... 5
2.1.1– O que são ontologias………. 5
2.1.2– Áreas de aplicação das ontologias……….. 10
2.2 – Ontologias aplicadas à arqueologia ... 13
2.2.1– CIDOC Conceptual Reference Module (CRM) ………. 13
2.2.2– CityGML – Ontologias de ambiente urbano ………. 14
2.2.3– Relação do CityGML com outras ontologias ……… 21
2.3 – Ferramentas de criação / visualização de ontologia ... 24
2.3.1– Protégé……… 24
2.3.2 – Aristoteles ………. 25
2.3.3– Modelação a partir de Descrição Textual ……….. 25
2.3.4– Autodesk LandXplorer ……….. 27
2.3.5 –3DGIS Cityvu ………. 27
2.3.6 –libcitygml C++ library & citygml2vrml converter………. 28
2.3.7 – Conclusão……….. 28
2.4 – Linguagens de representação de ontologias. ... 30
2.4.1– OWL………... 30
2.4.2– Ontolingua ………. 31
2.4.3– UML ……….. 32
2.4.4– Conclusão ……….. 33
3– Definição do caso de estudo ... 35
3.1 – Localização ... 35
xiv
3.2.3 – Descrição do Castelo ……… 42
3.2.4 – Descrição da Casa da Comenda da ordem de Malta ………. 43
3.2.5 – Descrição do Solar dos Carvalhos ……… 45
3.3 – Escolha do monumento ... 47
4– Aplicação das ontologias ao caso de estudo ... 49
4.1 – Levantamento dos dados ... 49
4.2 – Representação do modelo 3D da igreja ... 51
4.2.1 – Representação em CityGML………. 52
4.2.2 – Modelação a partir de descrição textual ………... 58
5- Conclusões ... 61
5.1- Síntese da dissertação ... 61
5.2- Discussão dos resultados e contributos ... 62
5.3 - Limitações do trabalho ... 63
5.4 - Trabalho futuro ... 64
Referências e Bibliografia ... 65
Anexo I - Entidades do CIDOC-CRM ... 71
Anexo II – Propriedades do CRM ... 75
Anexo III – Representação do Código do Ficheiro XML do CityGML ... 77
Anexo IV – Representação do Código do Ficheiro XML com os dados da descrição textual ... 121
xv
Figura 1 - Classificação das ontologias e seu relacionamento ... 8
Figura 2 - Processo de conversão de ficheiro em formato XML para um modelo 3D ... 15
Figura 3 – Modelo de cidade semântica 3D, com o CityGML no centro da informação que liga as diversas disciplinas, alinhando a informação com as entidades do modelo de cidade. (Kolbe T., 2009). ... 16
Figura 4 - Ilustração dos diferentes níveis definidos pelo CityGML. (Kolbe T., 2009) ... 17
Figura 5 - Modelação de CityGML versão 1.0.0. Módulos verticais fornecem as definições dos diferentes modelos temáticos. Módulo horizontal define as estruturas relevantes. (Kolbe T., 2009). ... 18
Figura 6 - Diagrama UML da hierarquia de classe de nível superior do CityGM. (Kolbe T., 2009 ... 19
Figura 7 - Trecho simplificado do diagrama UML do modelo de construção CityGML. (Kolbe T., 2009 ... 20
Figura 8 - Várias ontologias ligadas ao CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010) ... 22
Figura 9 – Conjunto de modelos em torno do CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010) ... 23
Figura 10 – Interligação de conjunto de modelos em torno do CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010) ... 24
Figura 11 – Modelo de dados para edifícios monumental (Baptista, Reis, & Magalhães, 2012) ... 26
Figura 12 - Exemplo de mapeamento da gramática (Baptista, Reis, & Magalhães, 2012) ... 27
Figura 13 - Planta atual da zona histórica de Sernancelhe. (Fonte: Câmara Municipal de Sernancelhe) ... 36
Figura 14 - Localização do Património (Fonte: Câmara Municipal de Sernancelhe) ... 37
Figura 15 - Uma das janelas intactas da Capela-mor ... 38
Figura 16 – Interior da janela da Capela-mor ... 38
Figura 17 – Representação do arco da porta de entrada ... 39
Figura 18 – Representação do arco da porta de entrada da parte interior ... 40
Figura 19 - Fachada poente ... 40
xvi
Figura 23 – Parte das Muralhas do Castelo ... 43
Figura 24 – Imagens atual da Casa da Comenda da Ordem de Malta ... 44
Figura 25 – Porta de entrada da Casa da Comenda da Ordem de Malta com representação do brasão e as bocas de canhões. ... 44
Figura 26 - Concha dourada da porta de entrada da capela do Solar dos Carvalhos ... 45
Figura 27 – Brasão da fachada principal do Solar dos Carvalhos ... 46
Figura 28 - Solar dos Carvalhos. ... 46
Figura 29 – Imagens da Igreja Matriz ... 47
Figura 30 – Imagem do levantamento topográfico – fachada leste ... 50
Figura 31 - Imagem do levantamento topográfico – fachada Norte ... 50
Figura 32 - Imagem do levantamento topográfico – fachada oeste ... 51
Figura 33 - Imagem do levantamento topográfico – fachada sul ... 51
Figura 34 – Trecho de código do ficheiro XML – identificação da localização ... 52
Figura 35 - Trecho de código do ficheiro XML – identificação da divisão do monumento em várias partes ... 53
Figura 36 – Fachada principal do monumento arqueológico no nível LOD2 ... 54
Figura 37 - Fachada norte do monumento arqueológico no nível LOD2 ... 54
Figura 38 – Vista de cima do monumento arqueológico no nível LOD2 ... 55
Figura 39 - Fachada leste do monumento arqueológico no nível LOD2 ... 55
Figura 40 - Fachada sul do monumento arqueológico no nível LOD2 ... 56
Figura 41 – Introdução do código correspondente aos objetos. ... 56
Figura 42 – Trecho de código correspondente à inserção de objetos (portas, janelas) ... 57
Figura 43 - Fachada principal do monumento arqueológico correspondente ao nível LOD3 . 57 Figura 44 – Código XML do modelo interno ... 58
Figura 45 – Texto em linguagem natural do caso de estudo ... 59
xvii
Tabela 1 - Síntese das ferramentas de visualização /desenvolvimento de ontologias ... 28 Tabela 2 – Resume das linguagens de utilização de ontologias ... 33 Tabela 3 – Descrição das vantagens e limitações da aplicação das ontologias ao caso de estudo ... 63 Tabela I - Propriedades do CRM. ( Crofts, Doerr, Gill, Stead, & Stiff, 2010)……….75
xix
Nesta dissertação são utilizadas abreviaturas de designações comuns apenas apresentadas aquando da sua primeira utilização:
AGRE Agent, Group, Role, Environment B2B Business-to-Business
CityGML City Geography Markup Language
CO3L Compact Object Oriented Ontology Language
FRBR Functional Requirements for Bibliographical Records GIS Geographic Information System
GML3 Geography Markup Language 3 IIP Imóvel de Interesse Público
ISO International Organization for Standardization KIF Knowledge Interchande Format
LOD Levels of Detail (níveis de detalhe) O3F Object Oriented Ontology Framework ODM Ontology Definittion Metamodel OGC Open Geospatial Consortium OMG Object Management Group
OUPP Ontology of Urban Planning Process OWL Web Ontology Language
RDF Resource Description Framework UML Unified Modeling Language W3C World Wide Web Consortium XML Extensible Markup Language
1
1 – Introdução
A preservação do património cultural deve ser assumido como algo fundamental por toda a sociedade. O rápido crescimento das cidades está a alterar e destruir o património existente de muito valor, em que os cidadãos o fazem sem se aperceberem do valor patrimonial em questão. A preservação digital, isto é, a representação de uma forma digital do artefacto (dos monumentos) para memória futura constitui uma das componentes disponíveis para a preservação do património. A representação digital destes artefactos poderá ser efetuada recorrendo a ontologias específicas para a área da arqueologia.
Uma ontologia define os termos utilizados para descrever e representar uma determinada área do conhecimento, de onde resulta um conjunto de termos classificados e relacionados entre si. É uma especificação ou formalização de uma conceptualização, ou seja, é uma especificação explícita e formal de uma conceptualização partilhada. (Fensal, D., 2000). É uma conceptualização porque representa uma visão abstrata e simplificada do mundo que deseja representar. É explícita porque significa que os tipos de conceitos usados e as restrições usadas com esses conceitos estão definidos expressamente. Por fim, é formal porque deve ser possível ser processada por uma máquina.
Existe uma diversidade de áreas onde as ontologias podem ser aplicadas. Algumas das áreas onde as ontologias são aplicadas é em bibliotecas digitais, Web Semântica, Gestão do Conhecimento, Comercio Eletrónico, Sistemas Multiagentes, entre outros.
O CityGML é uma das ontologias mais utilizada para a representação de ambientes urbanos. É um modelo de informação que representa objetos urbanos em 3D. É baseado num modelo de informação de uso de conteúdo de geometria e gráficos que permite aplicar modelos de cidades 3D virtuais para tarefa de análise em diferentes domínios de aplicação, como: simulações, facilidade de gestão e consultas técnicas. O CityGML é aplicado em varias áreas, tais como a urbana e paisagista, projetos arquitetónicos, turismo e lazer, telecomunicações, gestão de desastres, entre outros.
Na área da arqueologia uma das ontologias mais usadas é o CIDOC-CRM. O CIDOC é um modelo de referência concetual que, fornece definições e uma estrutura formal para descrever os conceitos implícitos e explícitos em relações utilizadas na documentação do património cultural. (CIDOC, 2010).
2
Porem, podem ser levantadas algumas questões em relação à utilização das ontologias na área da arqueologia. Será que as ontologias existentes serão capazes de representar sítios arqueológicos? Ou, então uma outra questão que se coloca também, será que as ontologias existentes serão suficientes para descrever sítios e monumentos arqueológicos?
Deste modo, o principal objetivo deste trabalho é efetuar um estudo sobre as ontologias existentes para a área da arqueologia e identificar o seu potencial para descrever sítios arqueológicos. Para tal, foi aplicada uma metodologia de investigação estudo de caso. O estudo iniciou-se com a identificação de ontologias que podem ser utilizadas para a representação de sítios arqueológicos. Numa segunda fase, foi definido um caso de estudo, onde foram aplicadas as ontologias selecionadas.
Deste estudo resultam um conjunto de observações que poderão ser úteis para a definição de uma ontologia específica representar sítios arqueológicos, não só sob uma perspetiva geométrica, mas também em termos semânticos e históricos. Além deste contributo principal, podem, ainda, ser identificadas as seguintes contribuições:
O estudo aprofundado sobre as várias ontologias existentes;
Uma melhor compreensão do estudo das ontologias aplicadas a ambientes arqueológicos;
Aplicação de ontologias a ambientes arqueológicos.
A estrutura do documento reflete a sequência de trabalhos realizados de acordo com os objetivos propostos. Os capítulos estão organizados de modo a permitir uma compreensão progressiva, seguindo um fio condutor desde um conjunto de reflexões iniciais até uma série de expectativas futuras e considerações finais.
Refletindo sobre esta organização é possível identificar dois grandes momentos. O primeiro sendo uma parte mais teórica, na qual é apresentado a definição de ontologias, área de aplicação das ontologias, as ontologias aplicadas à área da arqueologia, algumas das ferramentas de criação e visualização de ontologias e por fim as linguagens de representação de ontologias. O segundo momento é apresentado o caso de estudo e aplicação das ontologias ao caso de estudo.
O presente capítulo, introdutório, procura sintetizar todo o projeto. Caracteriza globalmente, a realidade da sociedade em que vivemos, salienta a importância das ontologias nos ambientes arqueológicos. São salientados os fatores motivadores do trabalho realizado, caracterizado o problema cuja resolução se pretende contribuir, é
3
realizada a identificação das finalidades e objetivos definidos e genericamente sintetizados os contributos do trabalho desenvolvido.
O segundo capítulo (enquadramento conceptual) estabelece as metas conceptuais do estudo. Neste capítulo são revistos alguns dos conceitos fundamentais de modo a proporcionar uma base teórica para o estudo e aplicação das ontologias.
No terceiro capítulo (caso de estudo) fornece a descrição do sítio arqueológico, assim como a sua localização, características dos edifícios, entre outros aspetos relevantes.
No quarto capítulo (aplicação das ontologias ao caso de estudo) são escolhidas duas ontologias, das apresentadas no segundo capítulo e depois é representado o sítio arqueológico usando as ontologias selecionadas.
No quinto e último capitulo (Conclusões), é fornecida uma generalização de tudo o que foi apresentado nos capítulos anteriores, através da discussão dos resultados e contributos para o desenvolvimento das ontologias. Termina referindo algumas limitações do trabalho produzido e apresentando algumas reflexões sobre a continuidade para trabalhos futuros.
5
2 – Enquadramento conceptual
Neste capítulo será apresentada a noção / definição de ontologias e identificado onde esta é aplicada num contexto geral. Serão ainda apresentadas algumas ontologias aplicadas à área da arqueologia. O capítulo termina com a descrição de algumas das ferramentas de criação e de visualização de ontologias, incluindo as linguagens de utilização de ontologia.
2.1 – Ontologias
Na vasta bibliografia sobre este tema podem ser encontradas diversas definições para o termo ontologia assim como da sua aplicação.
2.1.1– O que são ontologias
Ontologia deriva do grego na qual, onto corresponde ao ser e logos corresponde a palavra (Pickler, 2007). O termo original de ontologia deriva da palavra aristotélica “categoria”, que pode ser utilizada para classificar alguma coisa. (Almeida & Bax, 2003). Assim, a ontologia é um ramo da filosofia que lida com a natureza e a organização do ser/realidade. Neste ramo, a ontologia tenta responder a duas questões, sendo elas: “o que é o ser?” e “Quais as características comuns a todos os seres?”.
O termo ontologia pode apresentar definições conforme é tido em conta a filosofia ou a organização da informação. Dependendo dos autores e da área de aplicação, podem ser encontradas muitas definições para este termo e muitas delas são até contraditória. De seguida são apresentadas algumas definições para o termo ontologia, referidas por vários autores.
Uma definição de ontologia que é bastante interessente foi apresentada por (Gruber T. , 1993) no seu artigo “What is na Ontology?”:
“An ontology is a specification of a conceptualization.” Na qual em Português, “Uma ontologia é uma especificação de uma conceptualização”. Na qual “conceptualização” afirma uma visão abstrata e simplificada do mundo que deseja representar, ou seja, refere-se a modelos abstratos de alguma coisa que identifica conceitos relevantes dessa coisa.
6
“Uma ontologia é uma especificação explícita e formal de uma conceptualização
compartilhada”. (Studer, 1998)
A palavra “explícita” da definição anterior significa que uma “coisa” de nível simbólico deve ser expresso formalmente e de maneira clara, ou seja, os tipos de conceitos utilizados e as limitações desse mesmo conceito deve ser definido de uma forma clara e precisa. A palavra “formal” refere uma ontologia, na qual deve ser possível de ser processada por uma máquina. Por fim, para finalizar a explicação de significados de algumas das palavras utilizadas na definição anterior, a palavra “compartilhada”, quer dizer que uma ontologia captura um conhecimento consensual, ou seja, este conhecimento deve ser aceite por um grupo de pessoas e não por uma única pessoa.
Em suma, da definição apresentada por Studer podem-se apurar algumas características importantes que deve possuir uma ontologia, indicando essas características que, uma ontologia deve ser explícita, formal e descreve um conhecimento a um grupo.
Uma outra definição é apresentada por (Gómez-Pérez, 2004):
“Uma ontologia é um conjunto de termos ordenados hierarquicamente para descrever um domínio que pode ser usado como um esqueleto para uma base de conhecimentos.”
O autor (Freitas F. , 2003) refere algo semelhante, ou seja “Uma ontologia é
organizada em hierarquias de conceitos”.
Uma ontologia pode ser considerada como a materialização do nível do conhecimento e é organizada hierarquicamente para a sua melhor compreensão. Assim, uma ontologia possui um conjunto de termos organizados com uma hierarquia associada. Como já foi referido na definição apresentada pelo autor Gomez-Pérez, uma ontologia pode servir como um esquema para uma base de conhecimento, sendo esta muito utilizada no ramo da gestão do conhecimento.
Esta última definição faz uma distinção entre uma ontologia e a gestão do conhecimento. Assim, uma ontologia providencia uma estrutura básica sobre a qual pode ser construída uma base de conhecimento.
No contexto da inteligência artificial, uma ontologia pode ser interpretada como sendo um conjunto de entidades com as suas relações, restrições, axiomas1 e vocabulários (Freitas F. , 2003).
7
Uma ontologia requer a utilização de um vocabulário específico para descrever uma realidade e um conjunto de axiomas lógicos necessários para dar semântica ao significado pretendido pelas palavras do vocabulário. Por exemplo, duas ou mais ontologias referentes à mesma semântica, podem apresentar vocabulários diferentes na representação, mesmo como linguagens diferentes para descrevem a ontologia, ou seja, no fundo a ontologia pode ser a mesma mas descrita de maneira diferente, segundo o que afirma a autora (Martins, 2002).
Martins (2002), também menciona que são quatro os objetos para a construção de uma ontologia, sendo eles entidades, atributos, relações e restrições. O primeiro descreve conceitos e providencia numa representação lógica. O segundo objeto descreve as propriedades das entidades. O terceiro objeto descreve as ligações entre os objetos, ou seja, a relação entre as entidades e os atributos. Por fim, o último objeto representa as condições que a pessoa que desenvolve a ontologia impõe sobre os três objetos anteriores (entidades, atributos ou relações).
Em (Pickler, 2007) é referido que o principal objetivo da utilização de ontologias no ambito das Ciências da Computação (informática) é a construção de bases de conhecimento interoperáveis e melhor estruturadas.
Uma ontologia é composta por vários componentes. (Dziekaniak, 2009) inumera os seguintes componentes:
Classes: organizadas em taxonomia2;
Relações: representam o tipo de interação entre os conceitos de um domínio;
Axiomas: utilizados para modelar sentenças sempre verdadeiras;
Instâncias: utilizadas para representar elementos específicos.
São inumeras as vantagens de uma ontologia, é importante que as destaque. De seguida são apresentadas algumas vantagens da utilização de ontologias na área da informática: (PUC-Rio)
Fornecem um vocabulário para a representação do conhecimento. Este vocabulário usufrui de uma conceptualização que o suporta, de forma a prever significados diferentes dele.
2 Uma taxonomia é a classificação de informação no formato de uma hierarquia de acordo com o
relacionamento estabelecido com entidades do mundo real de representação (Breitman, 2005), ou seja, a Taxonomia também pode ser chamada hierarquia de classes.
8
As ontologias permitem o compartilhamento de conhecimentos. Significa que havendo uma ontologia que molde adequadamente certo domínio de conhecimento, esta pode ser partilhada e usada por utilizadores que utilizem aplicaçoes dentro desse domínio.
As ontologias fornecem uma descrição exata do conhecimento;
É possível fazer o mapeamento da linguagem da ontologia sem que seja alterado a sua conceptualização;
Pode ser estudado o uso de uma ontologia genérica de forma a que ela se adeque a um domínio específico;
Oportunidade para os criadores reutilizarem ontologias e bases de conhecimento, mesmo com adaptações e extensões;
A disponibilidade de uma vasta gama de ontologias prontas para serem utilizadas e reutilizadas;
A possibilidade de tradução entre diversas linguagens e formalismos de representação de conhecimento;
Figura 1 - Classificação das ontologias e seu relacionamento
Uma ontologia pode ser classificada de quatro maneiras distintas, como é mostrado na figura 1. (Guarino, 1997) classifica as ontologias de acordo com a sua dependência em relação a uma tarefa específica ou a um ponto de vista:
9
Ontologias de alto-nível – descreve conceitos muito gerais, tais como: espaço, tempo, evento, entre outros. Uma ontologia de alto-nível é partilhada por grandes comunidades de utilizadores;
Ontologias de domínio – descreve um vocabulário relacionado com um domínio genérico, através da específicação de conceitos introduzidos nas ontologias de alto-nível;
Ontologias de tarefas – descreve um vocabulário relacionado com uma tarefa ou atividade genérica, através da específicação de conceitos introduzidos nas ontologias de alto-nível;
Ontologias de aplicação – descreve conceitos que dependem tanto de um domínio específico como de uma tarefa específica e, normalmente é uma específicação de ambos. Assim, esta ontologia específica possui conceitos tanto das ontologias de domínio, como das ontologias de tarefas.
Pode-se concluir que as ontologias de alto-nível são as que possuem maior capacidade de serem reutilizadas, por definirem conceitos genéricos. As ontologias de aplicação são as que possuem menor capacidade de serem reutilizadas, por definirem conceitos relativos a uma aplicação específica. Como já foi referido, a figura 1 mostra os diferentes tipos de ontologias (classificação das ontologias) e a relação existente entre elas.
Uma ontologia possui vários princípios, incluindo clareza, legibilidade, coerência, extensibilidade e codificação. O primeiro princípio define só o que se supõe ser útil na resolução da classe do problema a ser alcançado. O segundo princípio corresponde às definições correntes e informais. O terceiro corresponde às consequências derivadas da ontologia que devem ser corretas. O princípio da extensibilidade permite que novas classes possam ser definidas a partir das classes já existentes. Por fim, a codificação corresponde à especificação de conceitos genéricos que devem ser estabelecidos para utilizar notações e codificações, para garantir a extensibilidade. (Freitas F. , 2003)
Uma ontologia é composta por quatro etapas de construção, sendo elas:
Definição das classes;
Arrumação das classes em hierarquia de taxonomia;
Definição das propriedades e atributos;
10
As ontologias são utilizadas para capturar conhecimentos sobre um domínio de interesse. Uma determinada ontologia descreve os conceitos de um domínio e tambem as relações que existem entre esses conceitos. (Horridge, 2005)
2.1.2– Áreas de aplicação das ontologias
As ontologias são aplicadas em diversas áreas. De seguida são apresentadas algumas áreas onde as ontologias podem ser aplicadas e é apresentada uma pequena explicação para a sua melhor compreensão.
Bibliotecas digitais
Uma biblioteca digital pode ser definida como um conjunto de objetos digitais construídos a partir do uso de instrumentos eletrónicos, concebidos com o objetivo de registar e comunicar pensamentos, ideias, imagens e sons, disponíveis a um contingente ilimitado de pessoas, dispersas onde quer que a plataforma www alcance.
"[...] Biblioteca digital parece estar a firmar como um conjunto de artefactos, conhecimento, práticas e uma comunidade que engendra compromissos realísticos assumidos por profissionais da informação, analistas de sistemas e utilizadores". (Alvarenga, 2001).
Web Semântica
A Web semântica possibilita criar e compartilhar conteúdo de uma forma colaborativa e, automaticamente pode-se, apresentar a informação de forma explícita e com semântica para que os utilizadores possam utiliza-la. Para desenvolver a web semântica foram desenvolvidas diversas técnicas, sendo elas os metadatos e a ontologia.
“Uma ontologia define os termos e relacionamentos básicos que compreendem o vocabulário de uma área, as combinações desses termos e as relações para definir extensões desse vocabulário” (Berners-Lee, Hendler, & Lassila, 2001)
(Berners-Lee, Hendler, & Lassila, 2001) Refere que utiliza três tecnologias principais (ontologia, XML e RDF) para resolver problemas que possam surguir ao adicionar semântica às páginas web. As ontologias são usadas para fornecer uma estrutura semântica para anotação das páginas Web.
11
Espera-se que esta estrutura semântica sirva para tornar as pesquisas mais precisas e fornecer uma maior capacidade aos agentes de software que utilizem conteúdos da Web.
Gestão do conhecimento
Os sistemas de gestão do conhecimento lidam com a aquisição, manutenção e acesso ao conhecimento dentro de uma organização. Dentro desta área a tecnologia de ontologias auxilia das seguintes formas: (PUC-Rio)
As ontologias fornecem a estrutura básica sobre a qual se constroem bases de conhecimento;
Uma dificuldade dos sistemas de gestão do conhecimento é o facto de que muito do conhecimento presente dentro das organizações encontra-se na forma não estruturada;
Processamento da linguagem natural
Nesta área de aplicação das ontologias, é utilizado o conhecimento como sendo muito importante para a compreensão coerente do texto. Este pode ser dado por intermédio de uma ontologia sobre o domínio de discurso do texto.
A utilização das ontologias neste âmbito possui, uma vital importância por dois motivos: o auxílio e elucidação de ambiguidades de compreensão existentes no texto; a ontologia funcionar como um dicionário de conceitos dentro do domínio do texto. (PUC-Rio)
Comércio eletrónico
Na área do comércio eletrónico (Business-to-Business ou B2B) pode-se tirar proveito da utilização das ontologias. Para o uso de ontologias para o comércio eletrónico é necessário ter em conta as vantagens de ontologia, podendo-se resumir que a sua abordagem é muito útil. Assim, possibilita uma abordagem comum, ou seja, a definição de uma determinada coisa por todas as lojas e, também impõe uma taxinomia entre elas.
Sistemas multiagentes
Os sistemas multiagentes originam de uma subárea da Inteligência Artificial Distribuída e centraliza-se no estudo de agentes autónomos num “mundo” multiagente. Normalmente, cada agente detém dum conjunto de
12
capacidades comportamentais que definem a competência, um conjunto de objetivos e, a autonomia necessária para usar as suas capacidades comportamentais a fim de conseguir seus objetivos. Um sistema multiagente possui como elementos, como o próprio nome indica, os agentes, onde a organização do sistema obedece às interações entre os agentes. Este sistema é um sistema capaz de auto-organização.
“ A estrutura do sistema é formada pelos agentes e é modificada pelo
processo do sistema, isto é, pela atividade coletiva dos agentes sobre objetos no ambiente e sobre outros agentes.” (Carvalho, Varenne, &
Bragra, 2013)
(Carvalho, Varenne, & Bragra, 2013) refere que para explorar as ontologias que subsistem aos sistemas complexos multiagentes depende e apresentam o modelo AGRE (Agent, Group Role, Environment), também conhecido como Moledo Agente, Grupo, Papel e Ambiente, na qual os agentes são representados em suas funções ou papeis que assumem em um grupo e também por sua localização em uma área ou espaço.
O modelo AGRE apresenta quatro princípios, tendo em conta o que refere Ferber et al. (2005), sendo eles descritos a seguir; (Carvalho, Varenne, & Bragra, 2013)
1. Os agentes são unidades em um mundo multiagente onde manifestam sua existência através de dois “mundos”. Sendo eles o mundo organizacional e o mundo físico;
2. Um agente pode possuir vários modos de diferentes tipos. Limites sobre o número de modos que um agente possui depende do mundo no qual foi registado;
3. Um agente é situado simultaneamente em uma área e em uma organização. Os papéis e os corpos são modos de existência de um agente em espaço de interação;
4. Um modo é a via de ação de um agente sobre um espaço de interação. Um agente pode agir em um espaço de interação somente se existe um modo que o possibilita fazê-lo.
13 2.2 – Ontologias aplicadas à arqueologia
2.2.1– CIDOC Conceptual Reference Module (CRM)
O CIDOC–CRM destina-se a promover uma compreensão comum das informações de património cultural, fornecendo uma estrutura semântica comum e extensível para qualquer informação de património cultural onde pode ser mapeada para tal. ( Crofts, Doerr, Gill, Stead, & Stiff, 2010)
O objetivo principal do CIDOC – CRM é permitir a ligação da informação com fontes heterogéneas de informação de património cultural. O CIDOC-CRM fornece definições de semântica e explicação necessária para transformar as fontes de informação diferentes e, localizadas num recurso global coerente, seja ele dentro de uma grande instituição ou, na Internet. (Nick Crofts, Martin Doerr, Tony Gill, Stephen Stead, Matthew Stiff, 2010). Deste modo, o modelo CIDOC-CRM é uma “ontologia formal criada para facilitar a integração, medição e intercâmbio de informações heterogéneas do património cultural”. Desenvolvido desde 1994, de forma independente da iniciativa FRBR (Functional Requirements for Bibliographical Records). Este modelo foi aprovado como padrão internacional ISO 21127:2006. (Lima & da Cunha)
A função do CIDOC-RCM é a captura do contexto local específico e institucional. Este objetivo determina as construções e níveis de detalhe do CRM. (Nick Crofts, Martin Doerr, Tony Gill, Stephen Stead, Matthew Stiff, 2010).
O CRM é uma ontologia que pode ser expressa em termos de lógica ou numa linguagem de representação de conhecimentos adequados. Os conceitos desta ontologia podem ser instanciados como conjuntos de declarações que fornecem um modelo da realidade. Na codificação das instâncias CRM duma linguagem formal que preserva as relações entre as classes, propriedades e regras de herança de um formulário compatível como CRM. As classes e propriedades do CRM são identificadas por códigos, como por exemplo “E55” ou “P12”. ( Crofts, Doerr, Gill, Stead, & Stiff, 2010)
O modelo CIDOC–CRM utiliza mnemónicas antes dos nomes de classes e das propriedades, que são formados pela composição de uma letra (E ou P) seguida de um número e de um nome. (Lima & da Cunha).
Não é necessário usar todas as classes e propriedades do CRM para o registo de informação. Qualquer codificação de instância CRM em uma linguagem formal que mantenha as relações dentro de um subconjunto consistente de classes, propriedades e regras de herança é considerada um “formato limitado CRM-Compatível”, por outras
14
palavras, se o subconjunto não viola as normas de verificação de uma classe com subconjunto de uma outra a partir da comparação das duas definições e, herança das classes. ( Crofts, Doerr, Gill, Stead, & Stiff, 2010)
São respeitadas todas as condições aplicáveis a uma forma compatível CRM;
O subconjunto não viola as regras de subjunção e herança;
Qualquer instância reduzida de forma compatível com o CRM também é uma instância válida de uma forma compatível de CRM.
No anexo I pode-se verificar como é apresentado o índice das entidades do CIDOC-CRM como uma única hierarquia. Este índice foi referido pelos autores (Crofts, Dionissiadou, Doerr, & Stiff, 2011)
No anexo II encontra-se representado uma tabela onde estão mencionadas as propriedades do CRM.
2.2.2– CityGML – Ontologias de ambiente urbano
Em agosto de 2008 o OGC (Open Geospatial Consortium) definiu um padrão OpenGIS (software livre) para modelos de cidades 3D chamado de CityGML (City
Geography Markup Language). (Métral, Billen, Cutting-Decelle, & van Ruymbeke,
2010)
O CityGML é um padrão internacional para representar cidades 3D semânticas e armazenamento e troca de modelos virtuais 3D de cidades e paisagens (Gröger, G., Kolbe, T.H., Czerwinski, A., Nagel, C., 2008) (CityGML Homepage).
“É um esquema de aplicação para a versão GML3 (Geography Markup 3.1.1), o padrão extensível internacional para o intercâmbio de dados espaciais emitida pelo OGC
(Open Geospatial Consortium) e a ISO TC211. O objetivo do desenvolvimento de
CityGML é chegar a uma definição comum das entidades básicas, atributos e relações de um modelo 3D da cidade. Isto é especialmente importante no que diz respeito à manutenção relação custo-eficácia sustentável de modelos de cidade 3D, permitindo a reutilização dos mesmos dados em campos de aplicação diferentes” (OGC, 2012).
O CityGML é um modelo de dados aberto e contém um formato baseado em XML
(Extensible Markup Language). A W3C (World Wide Web Consortium) para criar
linguagem de marcação para necessidades especiais, para armazenar e trocar modelos virtuais 3D.
15
O processo de conversão dos ficheiros XML para a criação de modelos em 3D, é representado no seguinte esquema:
Figura 2 - Processo de conversão de ficheiro em formato XML para um modelo 3D
A figura 2 representa o processo de criação do modelo 3D, como por exemplo, criação de monumento. Para cada modelo interno e para cada nó que representa uma estrutura para a qual está definido uma forma padrão, é criado um nó CityGML que pode ser visualizado numa aplicação.
O CityGML é representado num formato livre e baseado no ISO standard, podendo ser especializado ou generalizado de acordo com as necessidades, e suporta geometria e topologia 3D simples ou complexa.
O CityGML representa um modelo comum de informação para a representação de objetos urbanos em 3D. Nele podemos encontrar classes e relações para objetos topográficos mais revelantes de uma cidade, ou seja, as propriedades geométricas, topológicas e de visualização da cidade. O CityGML para além de representar a forma e a aparência gráfica dos modelos da cidade, trata também, e especificamente, da semântica dos objetos e da representação das propriedades temáticas e agregações.
O CityGML foi desenvolvido com o objetivo de chegar a uma definição básica e compreensão das entidades básicas, atributos e relações dentro de um modelo de cidade 3D. Fornece um modelo de núcleo com entidades que são relevantes para o modelo da cidade onde se tornam no ponto central de informação ao qual diferentes aplicações podem anexar as suas informações de domínio específico, como pode ser verificado na figura seguinte.
16
Figura 3 – Modelo de cidade semântica 3D, com o CityGML no centro da informação que liga as diversas disciplinas, alinhando a informação com as entidades do modelo de cidade. (Kolbe T., 2009).
O CityGML armazena não só a informação geométrica referente à forma e características topológicas dos edifícios, como armazena também a informação semântica, existente numa relação entre o objeto geométrico e o objeto semântico.
No CityGML, os objetos presentes na cidade ou a temática da mesma, são definidos por classes relacionadas para primitivas geométricas (linhas, pontos, entre outros), como atributos geométricos. Na realidade, existe uma ontologia (ontologia muito simples) na origem do CityGML. (Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010).
Nos modelos 3D no formato CityGML, um modelo identifica o edifício, a informação sobre a posição absoluta e relativa, bem como a informação quantitativa relativa às dimensões do monumento.
Cada tipo de monumento corresponde a uma forma geométrica simples, e possui um modelo específico.
Dos diversos formatos existentes para a representação dos modelos 3D, o CityGML, baseado no GML3 do OGC, abrange os aspetos geométricos, topológicos e
17
semânticos de modelos urbanos tridimensionais. Assim, permite distinguir edifícios de outros artefactos feitos pelo homem, tais como, a vegetação, rios, ruas, passeios, entre outros.
O CityGML encontra-se estruturado de forma a permitir 5 níveis (LOD) de detalhe (figura 4): o nível 0 (LOD0), que representa o modelo digital do terreno, até ao nível 4 (LOD4), que representa o interior do edifício. Assim, todos os objetos podem ser representados até cinco níveis diferentes de detalhes. (Kolbe T. , 2009). A definição dos diferentes níveis representados pelo CityGML é descrita a seguir: (Kolbe T., 2009).
Nível 0 (LOD0) – é o nível de procura, é essencial nos modelos de terreno digital em várias dimensões.
Nível 1 (LOD1) – é o nível onde os edifícios são representados por blocos, sem qualquer estrutura detalhada.
Nível 2 (LOD2) – é um nível onde são representados todos os detalhes. Por exemplo, num edifício este nível mostra a estrutura do telhado, varandas e escadas.
Nível 3 (LOD3) – mostra os modelos arquitetónicos com as estruturas detalhadas (parede, teto, portas, janelas e baias).
Nível 4 (LOD4) – adiciona ao nível 3, as estruturas interiores (salas, escadas e mobiliário).
Figura 4 - Ilustração dos diferentes níveis definidos pelo CityGML. (Kolbe T., 2009)
O CityGML é dividido em módulos desde a versão 1.0.0, como pode ser observado na figura 5. Os módulos verticais fornecem as definições dos diferentes
18
modelos temáticos (edifícios), relevo (modelos digitais do terreno), etc. Os modelos horizontais definem estruturas que são relevantes, ou podem ser aplicadas a todos os módulos temáticos. Estas estruturas permitem por um lado a implementação parcial do CityGML e, por outro lado a extensão a outros modelos temáticos. (Kolbe T., 2009).
Figura 5 - Modelação de CityGML versão 1.0.0. Módulos verticais fornecem as definições dos diferentes modelos temáticos. Módulo horizontal define as estruturas relevantes. (Kolbe T., 2009).
2.1.1 Representação multiescala
Como já foi referido, o CityGML diferencia cinco níveis de detalhes consecutivos, onde os objetos tornam-se muito mais detalhados conforme se avança nos níveis sobre a geometria e a diferenciação temática. Os diferentes níveis surgem frequentemente de processos de recolha de dados independentes e facilitam a visualização e análise dos mesmos. Num conjunto de dados do CityGML, o mesmo objeto pode ser representado nos cinco níveis simultaneamente, facilitando a análise e a visualização do objeto em diferentes tipos de resolução.
2.1.2 Semântica
O modelo semântico do CityGML emprega as normas ISO 19100 para a modelação de características geográficas. De acordo com a norma ISO 19109 as características geográficas são abstrações do mundo real (ISO 19109, 2005).
19
Cada característica geográfica pode ter um número arbitrário de atributos espaciais e não espaciais.
O CityGML fornece as definições de classe, regulamentos normativos e explicações da semântica para as mais importantes características geográficas dentro dos modelos de cidades virtuais 3D (por exemplo os edifícios e a vegetação). Os modelos por classe são formalmente especificados utilizando a notação UML (Unified Modeling
Language). (Booch, 1997)
A figura 6 apresenta a hierarquia de classes de nível superior do CityGML. A classe base de todas as classes temáticas é a classe class CityObject. Esta classe herda os atributos nome, descrição e gml:id da superclasse GML e fornece as características e os atributos adicionais creationDate e terminationDate para modelar diferentes estados dos objetos ao longo de determinados períodos de tempo.
A classe CityObject pode estar ligada a outros objetos ou mesmo a base de dados externas através de um número arbitrário de ExternalReferences (referências). A classe
CityObject por ser agrupada para construir um CityModel, que é uma subclasse da
superclasse GML FeatureCollection.
Os objetos temáticos são considerados como características geográficas e as suas classes são derivadas da superclasse CityObject. Na figura 6 foram omitidos os atributos das classes para facilitar a sua leitura.
20
As subclasses da classe CityObject pertencem a diferentes áreas temáticas e são definidas dentro dos seus correspondentes módulos, como pode ser verificado na figura 7. De seguida, o modelo de construção será analisado mais em detalhe para ilustrar os princípios gerais da modelação do CityGML.
AbstractBuilding é a classe fundamental no modelo de construção na qual se
derivam duas classes não abstratas, classes Building e BuildingPart. A figura seguinte representa uma hierarquia de agregação de profundidade arbitrária das classes.
Building e BuildingPart são descritos por atributos opcionais da classe AbstractBuilding.
Figura 7 - Trecho simplificado do diagrama UML do modelo de construção CityGML. (Kolbe T., 2009
2.1.3 Geometria
O CityGML utiliza um subconjunto do modelo de geometria GML3, sendo este, uma implementação das normas ISO 19107 (Herring, J., 2001). De acordo com estas
21
normas os modelos geométricos de recurso geográfico, são representados como objetos, possuindo uma identificação e várias subestruturas geométricas. (Kolbe T. , 2009)
2.1.4 Topologia
Esta aplicação é bastante complexa quando aplicada em objetos. Por exemplo, se calcularmos o volume de um edifício, as superfícies delimitadoras do edifício devem ser fechadas para serem capazes de efetuar o cálculo.
2.1.5 Aparência
Informações sobre a aparência da superfície, ou seja, propriedades visíveis da superfície, são consideradas como parte integrante dos modelos de cidades virtuais 3D.
2.1.6 Coerência espaço-semântica
Utiliza o padrão ISO 19109 para a modelação de recursos geográficos, implica uma estrutura de duas classes, como objetos temáticos de um lado e propriedades espaciais do outro lado. Tanto os objetos como os edifícios, podem ser decompostos em estruturas temáticas como em estruturas geométricas. (Kolbe T. , 2009).
2.1.7 Extensibilidade
O CityGML foi criado como sendo um modelo de informação topográfica universal onde define recursos, classes e atributos. Estes são úteis para uma ampla gama de aplicações. Em questões práticas muitas vezes torna-se necessário alterar/trocar os atributos por outros recursos que não pertençam às classes predefinidas.
2.2.3– Relação do CityGML com outras ontologias
É de extrema importância relacionar várias arqueologias. Nem sempre uma ontologia consegue alcançar o que nós queremos, assim, consideramo-los num contexto mais abrangedor.
Os autores ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010) referem que para realizar a integração de informações, quando necessário, deve ser atualizada
22
facilmente, e para isso é necessário considerá-las em pelo menos três modelos sucessivos de ontologias: uma ontologia arqueológica genérica, uma ontologia dedicado ao mundo de Maya e por fim, uma ontologia especialmente dedicada à cidade de Calakmul. A figura seguinte mostra que o CityGML pode estar interligado com outras ontologias. A primeira ontologia do lado esquerdo representa os conceitos universais da arqueologia, na segunda temos os conceitos históricos para descrever a Maya e, por fim, temos os objetos específicos e situações que ligam ao local de calakmul. O uso de ontologias parece ser a solução mais sensata para integrar conhecimentos arqueológicos e informação de um modelo urbano mais amplo.
Figura 8 - Várias ontologias ligadas ao CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010)
Tendo em conta os mesmos autores ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010), referem que é impossível desenvolver um modelo urbano e universal, uma vez que a perceção da realidade urbana é diversa e múltipla, mas que por outro lado, desenvolver modelos isolados para cada aplicação é inconcebível. Para ligarem informações urbanas, os autores adotaram o que pode ser generalizado para modelos de interligação através de ontologias para construir gradualmente um conjunto interligado
23
de modelos que apresentam diferentes perceções do ambiente urbano. O conjunto de ligações poderia ser constituído em torno do CityGML, como apresentado na figura 9.
Figura 9 – Conjunto de modelos em torno do CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010)
Os autores ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010) afirmam que para garantir uma boa ligação entre modelos, têm de criar regras. Os modelos têm que obedecer a normas existentes sempre que possível e de características geométricas como por exemplo a normas ISO ou OGC. Ou seja, se alterar elementos / dados de um modelo, como por exemplo Maya, essas alterações não afetam os outros modelos que estão ligados. Mas se existir algumas alterações na definição de objetos do CityGML poderá ter um impacto enorme na ligação dos modelos.
A figura 10 representa um conjunto de modelos interligados que permite o processamento de consultas específicas.
O CityGML aparenta ser um “bom candidato” como um modelo central, afirmam os autores ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010), trata modelos urbanos e geométricos
24
Figura 10 – Interligação de conjunto de modelos em torno do CityGML ( Métral, Billen, Cutting-Decelle, & van Ruymbeke, 2010)
2.3 – Ferramentas de criação / visualização de ontologia
Neste ponto serão apresentados três ferramentas de criação e três ferramentas de visualização. As três primeiras são de criação e as outras são de visualização.
2.3.1– Protégé
O Protégé é um editor de ontologia. Este editor é livre e de código aberto, na qual é baseado na base do conhecimento Framework3.
A aplicação Protégé suporta a modelação de duas maneiras de representar ontologias através dos editores/modelos Protégé-Frames e Protégé-OWL. A primeira permite ao utilizador criar e preencher ontologias que são baseadas em Framework. Neste modelo, uma ontologia consiste num conjunto de classes organizadas numa hierarquia representada em conceitos salientes de um domínio, ou conjunto associado às classes para descrever as propriedades e relações, e um conjunto de instâncias dessas classes. A segunda, o editor Protégé-OWL permite aos utilizadores construir ontologias para a web
3 “Framework é um conjunto de classes que colaboram para realizar uma responsabilidade para um
25
semântica. Uma das vantagens deste editor é a possibilidade de exportar a ontologia em vários formatos, sendo eles o RDF, OWL (Web Ontology Language), XML, entre outas.
Esta aplicação é baseada em Java, fornecendo um ambiente de Plug-and-play na qual a torna uma base flexível para rápido desenvolvimento de aplicações.
2.3.2 – Aristoteles
O Aristoteles foi projetado como um Framework para aplicações que necessitam de desenvolver, demostrar ou avaliar novas características para os modelos 3D. Esta aplicação foi desenvolvida para uso científico.
Permite aos utilizadores e criadores que não tenham a possibilidade de visualizar cenas, mas para ter acesso a dados semânticos, atributos ou dados fornecidos com os modelos 3D.
Esta aplicação corresponde à ontologia CityGML.
2.3.3– Modelação a partir de Descrição Textual
Os autores ( Rodrigues, Coelho, & Reis, Modelação Expedita de Edifícios Monumentais a Partir de Descrições Textuais) criaram uma feramente que possibilita a modelação expedita de edifícios urbanos. Elaboraram uma proposta para representar a modelação expedita de edifícios a partir de texto descritivo, sendo depois convertido para um formato intermédio em XML, e de seguida convertido para CityGML, sendo este modelo 3D visualizado imediatamente através dos visualizadores existentes e já referidos anteriormente.
A modelação expedita de edifícios a partir de informação textual encontra-se dividida em várias fases de desenvolvimento. Numa primeira fase, os autores pretenderam gerar um modelo 3D realista, que representa o edifício descrito em português, utilizando uma gramática simples4, mas representativa na estrutura. Este
processo de modelação divide-se em duas fases:
A extração das características do modelo, contidas no ficheiro de texto escrito em linguagem natural, para um formato interoperável e armazenado na forma de um ficheiro XML,
4 A gramática utiliza recursos de reconhecimento de português implementado pelo portal Port4Nooj
26
Conversão do modelo interno para um modelo 3D, no formato CityGML.
Na segunda fase, mais propriamente, na fase de desenvolvimento, é necessário colocar dados quantitativos relativamente às características do edifício, ou seja, as suas dimensões.
A figura 11 apresenta uma representação simplificada do modelo de dados desenvolvido pelos autores (Baptista, Reis, & Magalhães, 2012) que faz corresponder os nós do ficheiro XML com os atributos das classes criadas para a criação do modelo em CityGML.
Figura 11 – Modelo de dados para edifícios monumental (Baptista, Reis, & Magalhães, 2012)
A extração de informação tem como objetivo principal a extração de palavras-chave ou padrões de informação do ficheiro de texto criado, na qual está guardado num formato XML e é necessário que obedeça a especificações do schame que suporta o modelo de dados, como descrevem os autores (Baptista, Reis, & Magalhães, 2012). Os mesmos autores referem que nas 109 gramáticas criadas, são definidos padrões conforme a sequência de texto pretendida e adicionadas anotações para enquadrar a informação
27
extraída. A figura 12 representa um exemplo de mapeamento da gramática, com os padrões e anotações que se pretende no output.
Figura 12 - Exemplo de mapeamento da gramática (Baptista, Reis, & Magalhães, 2012)
A extração de informação de uma descrição textual para obter a representação 3D é feita para edifícios arqueológicos do tipo Igrejas.
2.3.4– Autodesk LandXplorer
O LandXplorer é um software para a gestão e visualização de modelos de cidade 3D. Tem suporte aos formatos GIS, 3D, CityGML e OGC.
2.3.5 –3DGIS Cityvu
Esta ferramenta representa ontologias CityGML na qual efetua modelação tridimensional, sendo esta bastante importante para difundir o uso de sistemas tridimensionais.
A descrição da realidade e a análise dos fenómenos que ocorrem com o auxílio desta ferramenta, são realizados do melhor modo, considerando as suas dimensões, ou seja, a representação em três dimensões.
Como esta ferramenta representa a informação tridimensional (3D), permite-nos perceber melhor a realidade numa compreensão espacial dos fenómenos e das estruturas
28
e, ajuda na resolução de problemas que não podiam ser geridos/resolvidos na representação em duas dimensões (2D).
É abrangente o ramo de domínio na qual esta aplicação representa informação tridimensional, sendo eles o ambiente, planeamento, proteção civil, turismo, transporte, educação, planos de comunicação e políticas com sistemas e simulação de alteração na realidade.
Esta aplicação depois de vários anos de experiencia na modelação e tratamento de dados tridimensionais, neste momento atende a todas as necessidades expressas e pode ser utilizada em qualquer aplicação que precisa de ver e consultar modelos tridimensionais.
2.3.6 –libcitygml C++ library & citygml2vrml converter
O libcitygml é uma ferramenta que pertence à ontologia CityGML. Este é um pequeno código aberto em c++, fácil de utilizar e permite analisar arquivos do CityGML, na qual os dados podem ser facilmente explorados por aplicações 3D.
2.3.7 - Conclusão
Existem várias linguagens para a descrição/representação de ontologias onde estão presentes as classes, relações e heranças.
Tabela 1 - Síntese das ferramentas de visualização /desenvolvimento de ontologias Ferramen
tas Vantagens Desvantagens
Formato/ Ontologia correspondente O que é? Protégé - Possibilidade de exportar a ontologia em vários formatos (RDF, OWL, XML…) - Ambiente Plug-and-play na qual facilita um rápido
desenvolvimento; - Armazena a
ontologia em base de dados;
- Não existe uma preocupação visível na publicação e partilha de ontologias; CityGML; Web semântica; Ferramenta de criação
29 Autodesk LandXplo rer - Aplicação de gestão e visualização de modelos em 3D; - É necessário comprar a aplicação para poder usufruir; GIS, 3D, CityGML e OGC; Ferramenta de visualização Aristotele s - Permite acesso a dados semânticos, atributos ou dados fornecidos com os modelos 3D; - Desenvolvida para uso científico; - Não possibilita a visualização de cenas; CityGML; Ferramenta de criação 3DGIS Cityvu - Representa a modelação tridimensional; - Facilita a resolução de problemas na representação em 3D; - Pode ser utilizada em qualquer aplicação para ver e consultar modelos 3D - Difícil de configurar; CityGML, 3D; Ferramenta de visualização libcitygml C++ library & citygml2v rml converter - Fácil de utilizar; - Permite a análise de arquivos do CityGML; - Interface em c++; CityGML Ferramenta de visualização Modelaçã o a partir de Descrição Textual - Fácil de utilizar; - Permite abrir os ficheiros no CityGML; - O protótipo atual só permite monumentos do tipo Igrejas; CityGML, 3D; Ferramenta de criação
A ferramenta Protégé é uma excelente opção para representar ontologia devido às várias vantagens que apresenta em relação às restantes abordagens. A tabela 1 lista algumas dessas vantagens. A ferramenta Protégé mostra-se multifacetada no desenvolvimento de ontologia. A criação de ontologias, recorrendo ao Protégé pode ser mais demorado, pois é necessário criar as classes, identificar se são abstratas ou concretas, as propriedades que herdam de outras classes, entre outros.
A modelação a partir de descrição textual é bastante fácil de utilizar, pois só é necessário identificar as medidas do monumento, e as entradas, seja ele feito a partir da criação de ficheiro XML ou através de textos em linguagem natural ou formal. Mas como em tudo existem também desvantagens, e neste caso a principal é o facto do protótipo
30
atual desta ferramenta de criação só ainda estar disponível para monumentos do tipo Igrejas.
2.4 – Linguagens de representação de ontologias.
Uma ontologia é especificada através de uma linguagem formal. De seguida são abordadas a análises mais relevantes na representação de ontologias. É feita a análise de algumas das linguagens mais utilizadas na representação de ontologias.
2.4.1– OWL
A OWL (Web Ontology Language) é uma linguagem na qual define e instância as ontologias da web. Esta linguagem foi desenvolvida no âmbito do W3C.
Foi planeada para ser utilizada por aplicações que necessitam de processar o conteúdo da informação, em vez de este ser apresentado pelos humanos. Assim, pode ser processada a informação, possibilitando a interpretação por máquinas do conteúdo da web como por exemplo em XML.
Esta ontologia de linguagem web é vista como uma tecnologia importante para a implementação numa das várias áreas de aplicação das ontologias.
A OWL encontra-se classificada em três espécies (também utilizado por muitos autores como sublinguagens) sendo elas: OWL-Lite, OWL-DL e OWL-Full. (Horridge, 2005). Estas três sublinguagens têm como principal objetivo para as quais foram projetadas, a utilização de comunidades específicas de programadores e utilizadores. De seguida são descritas as três sublinguagens da linguagem OWL: ( Smith, Welty, & McGuinness, 2004)
OWL-Lite: é a mais simples e menos expressiva. É suportada pelos utilizadores que necessitam de uma classificação hierárquica e restrições simples.
OWL-DL: é mais expressiva que a OWL-Lite e baseia-se em lógica descritiva, um fragmento de Lógica de Primeira Ordem, passível portanto de raciocínio automático. É possível assim comparar automaticamente a hierarquia de classes e verificar inconsistências na ontologia. (Horridge, 2005)
31
Os principais elementos que podemos encontrar no OWL na definição de uma ontologia são as classes, propriedades e indivíduos. Passo a descrever uma pequena definição segundo o autor (Correia, 2010)
Classes: As classes são um conjunto de indivíduos. São constituídas através de descrições que especificam as condições que devem ser satisfeitas por um indivíduo para que este possa pertencer a uma determinada classe. O OWL permite também a hierarquia de classes e subclasses.
Propriedades: Em OWL as propriedades são conhecidas por relações binárias que ligam dois indivíduos entre si ou, associam um indivíduo a um valor. O OWL permite a especificação de subpropriedades, relacionando várias propriedades hierarquicamente.
Indivíduos: os indivíduos no OWL permitem representar objetos de domínio. Estes objetos podem ser instanciados de uma ou de mais classes. Em suma, o OWL é uma linguagem, de descrição de ontologias concebida pelo W3C pensada para a Web. Trata-se da linguagem de descrição de ontologias mais divulgada hoje em dia.
2.4.2– Ontolingua
Ontolingua foi criado para descrever ontologias num formato compatível com múltiplas linguagens de representação do conhecimento. (Gruber T. R., 1993)
As ontologias escritas nesta linguagem podem ser partilhadas por vários utilizadores e grupos de investigação utilizando os seus sistemas de representação preferidos (Correia, 2010). A Ontolingua vem facilitar a partilha de ontologias.
A sintaxe e semântica das definições Ontolingua são baseadas na notação de uma versão estendida do cálculo de predicados de primeira ordem, KIF5. O KIF foi concebido para ser uma linguagem de publicação e comunicação do conhecimento, não sendo portanto uma linguagem de representação pois não fornece mecanismos de inferência ou
5 KIF (Knowledge Interchande Format) linguagem para a troca do conhecimento entre sistemas