3. TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO (T.I.C.)
3.3 SEMÂNTICA E INTEROPERABILIDADE ENTRE AS T.I.C
Com o avanço no desenvolvimento de novas ferramentas em diferentes arquiteturas de T.I.C., o aumento no número de informações e conteúdos na internet vem provocando dois problemas: a semântica das informações e a interoperabilidade dos sistemas. A maioria das informações disponíveis na internet não possui um padrão semântico sendo apenas compreendidas pelas pessoas, ou seja, não favorecem a compreensão pelos demais computadores. Dá-se como exemplo: quando um usuário insere o termo “Hotéis em Florianópolis” em um determinado portal de busca, como por exemplo, o Google, Yahoo, A9, entre outros, surgirão diversas opções de acessos relacionados mais as palavras “hotéis” e “Florianópolis” do que propriamente dito o significado de informações de hospedagem na cidade de Florianópolis (grifo nosso).
Para Fernández e García (2006) o problema está centrado na dificuldade de identificar corretamente o real significado do termo que se busca. Citam a existência de pelo menos três situações que podem produzir esse problema:
• pluralidade de significado: ao solicitar a busca por um termo se obtém acesso aos portais com significados diferentes;
• sinônimos: se obtém acesso aos portais apenas com termos sinônimos; e • múltiplas línguas: solicitar a busca de um termo em espanhol e não conseguir
acesso também em português ou em outra língua.
Para solucionar esse problema Tim Berners-Lee, criador da World Wide Web, desenvolveu a web semântica com o objetivo de melhorar a compreensão das informações e conteúdos. Como uma extensão da corrente da WWW – World Wide
Web que fornece não somente informações em nível sintático para os usuários
(pessoas), mas também no entendimento entre computadores, portanto, permite que agentes inteligentes passam buscar mais eficientemente as informações. Menciona- se também que a web semântica é o fator chave para a expansão dos recursos da
web, ou melhor, expressa a futura web possibilitando a interoperabilidade dos sistemas (MAEDCHE, STAAB, 2003).
Georgolios et.al. (2007) mencionam que a web semântica permite descrever aos agentes externos a compreensão da sua funcionalidade e da sua estrutura interna de modo que os mesmos possam descobrir, compor e invocar tais serviços. Fernández e García (2006) descrevem que a base de conhecimento da web semântica será construída a partir das anotações adquiridas por meio da navegação entre as páginas da web. Destacam que a arquitetura atual aberta da web é inadequada para o uso da linguagem de representação do conhecimento tradicional, pois, presumem a existência de diferentes vocabulários utilizados por diferentes grupos. Para solucionar esse impasse o W3C – World Wide Web Consortion define como representação do conhecimento na web semântica o RDF – Resource
Description Framework, ou marco de descrição de recursos.
Para Hepp, Siorpaes e Daniel (2006) a web semântica visa tornar a riqueza das informações que estão disponíveis na web acessível para uma pesquisa mais precisa e uma extração e processamento de informações automatizadas, com base em uma máquina de representação de significado sob a forma de ontologias. O núcleo dos componentes da tecnologia da web semântica é constituído, segundo Hepp, Siorpaes e Daniel (2006), conforme figura 11:
• XML: como uma genérica série de sintaxe com maturidade de ferramenta de apoio;
• RDF: como um modelo de dados para a representação semântica das redes distribuídas em uma sequência;
• Linguagem de ontologia como RDF-S, OWL, e WSML para a representação de um domínio de discurso;
• (TBox) ontologias, como por exemplo, Wordnet, Cyc, TOVE, Dublin Core e HARMONISE, e
• (Abox) dados, nos quais pode ser considerada parte da ontologia ou não, dependendo das respectivas comunidades científicas.
Unicode é um sistema de codificação de caracteres que visa uma padronização de representação indiferente da plataforma, linguagem e programa utilizados. O URI – Uniform Resource Identifier, ou identificador uniforme de recursos, identifica qualquer coisa na internet como sujeito, objeto e propriedades. A
camada XML – Extensible Markup Language, ou linguagem extensível de anotação, tem como objetivo permitir a criação de marcações e anotações próprias, ao contrário da linguagem em HTML – Hiper Text Mark-up Language, ou linguagem de marcação de hipertexto, que foi desenvolvida para formatação de apresentação de documentos e não para representá-los semanticamente.
Figura 11: Arquitetura em camadas da web semântica. Fonte: W3C Semantic Web Activity (2003)
O RDF é uma estrutura para representação de informação na web e é composto por três componentes: o sujeito, a propriedade e o objeto. Utiliza o XML para codificar a informação e a URI para garantir que os conceitos sejam os desejados. Fernández e García (2006) explicam que aplicações da web semântica armazenam conhecimento de vocabulários, conceitos e propriedades criados a partir de novos termos de URI, e que esses termos são criados por qualquer pessoa.
Para que haja o entendimento do significado de novo termo é necessário o compartilhamento de ontologias, representadas como RDFschema e OWL – Web
Ontology Language, ou linguagem de ontologia na web. A camada lógica (logic layer) consiste em regras que permitem a inferência. É obrigada a fornecer
explicações sobre as respostas dadas pelos agentes inteligentes que utilizarão a informação.
E na camada da prova (proof & trust layer) a maioria das construções das aplicações de uma prova é feita de acordo com algumas regras bastante limitadas, portanto o que a outra parte tem a fazer é validar a prova (MAEDCHE; STAABA,
2005). Importante ressaltar a função das ontologias para a web semântica e para a interoperabilidade dos sistemas.
Para Gómez-Perez e Benjamins (1999, p. 15) a palavra ontologia vem da filosofia, onde significa a explanação sistemática da Existência. Descreve que “uma ontologia define os termos básicos e relações compreendendo o vocabulário de uma área, bem como as regras de combinação de termos e relações para definir extensões para o vocabulário”. No sentido filosófico, classifica-se uma ontologia como um sistema de categorias explicando certa visão do mundo, que não depende de uma linguagem em particular. Para Inteligência Artificial, uma ontologia se refere a um artefato de engenharia formado por um vocabulário específico que é usado para descrever uma certa realidade e um conjunto de afirmações explícitas sobre o significado das palavras do vocabulário.
Já Grube´s (1993 apud GOMÉZ PÉREZ et. al. 1999) e Kalyanpur et. al. (2004) definem ontologia como significado de uma existência, é explicitamente uma especificação de conceitos. Já Borts (1997 apud GOMÉZ PÉREZ et. al. 1999) modificou o conceito anterior mencionando que as ontologias são definidas como uma especificação formal de experiências comuns de conceitos.
Gómez Pérez e Suárez-Figueroa (2003) destacam que as primeiras palavras sobre evolução na ontologia surgiram em 1994 e que nos últimos anos ocorreu um aumento no interesse na Ontological Engineering Community para a sua evolução tanto em linguagens como métodos. Ao longo dos anos diversos conceitos acerca da ontologia vêm sendo difundidos destacando que a ontologia é hierarquicamente estruturada e estabelecida nos termos descrevendo um domínio que pode ser usado na construção de uma base de conhecimento. Ou ainda, a ontologia aponta para captura de um domínio de conhecimento em um caminho genérico e proporciona um acordo de compreensão do domínio onde deve ser reusado e compartilhado.
Por fim, concluem que existem diversos conceitos sobre ontologia, todavia existindo entre estes um consenso no uso das ontologias e que algumas definições são independentes do processo seguido para construir a ontologia e o seu uso nas aplicações.
Para Hackl (2006) a ontologia é definida como um espaço conceitual onde pessoas e organizações podem cooperar, intercambiar informações, realizar negócios sem erros. Werthner et. al. (2003) dizem que a ontologia deve ser formal para tornar-se um mecanismo compreensível. Seu objetivo final é reduzir ou eliminar
as confusões de conceitos e terminologias. A ontologia pode facilitar a compreensão (entendimento), pois permite a percepção dos significados dos conceitos e seus relacionamentos, a comunicação, sustentando a clareza na definição dos termos, a cooperação, permitindo a colaboração das pessoas em ambos os níveis – interno, externo − e o intercâmbio de informação (grifo nosso).
Höepken e Clissmann (2004) mencionam que as ontologias são particularmente utilizadas onde existem várias entidades, como, por exemplo, o mercado turístico (agências de viagens, cadeias de hotéis, departamento turístico governamental, entre outros) ativo sobre o mesmo domínio, mas cada área utilizando o seu próprio domínio. Quando essas entidades necessitam se comunicar, uma linguagem comum é necessária. Portanto, a ontologia servirá como a ponte de comunicação entre todas as entidades, mapeando-a os seus modelos de domínios (fontes) e depois transferindo-os da ontologia para outro modelo de domínio (destino).
Pode-se perceber que os autores supracitados mencionam que a web semântica ainda está em desenvolvimento, entretanto acreditam que com o desenvolvimento de novas ferramentas de T.I.C. em um futuro próximo haverá o uso mais sistematizado, automatizado, amigável e eficiente da web.