• Nenhum resultado encontrado

Aplicações da Web Semântica nas Redes Sociais

N/A
N/A
Protected

Academic year: 2021

Share "Aplicações da Web Semântica nas Redes Sociais"

Copied!
73
0
0

Texto

(1)

UNIVERSIDADE CATÓLICA DE PELOTAS

CENTRO POLITÉCNICO

PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA

Aplicações da Web Semântica nas Redes

Sociais

Por

André Desessards jardim

Trabalho Individual

TI 2008-2-01

Orientador: Prof. Dr. Luiz Antônio Moro Palazzo

(2)

LISTA DE FIGURAS ... 3

LISTA DE ABREVIATURAS E SIGLAS ... 4

RESUMO ... 5 ABSTRACT ... 6 1. INTRODUÇÃO... 7 1.2 Objetivos... 9 1.2 Organização do Texto... 9 2. WEB SEMÂNTICA ... 11

2. 1 XML (eXtensible Markup Language) ... 16

2.2 RDF (Resource Description Framework) ... 18

2. 3 OWL (Web Ontology Language) ... 20

2.4 Vocabulários ... 21

2.4 FOAF (Friend of a Friend) ... 21

2.5 Dublin Core ... 22

3. WEB 2.0 - REDES SOCIAIS... 24

4. ONTOLOGIAS ... 30

5. PROTÉGÉ ... 34

6. ONTOLOGIA DO DOMÍNIO DAS REDES SOCIAIS ... 37

7. CONSIDERAÇÕES FINAIS ... 44

8. REFERÊNCIAS BIBLIOGRÁFICAS ... 46

9. ANEXOS ... 51

9.1 Anexo A – Descrição dos conceitos da Ontologia do Domínio das Redes Sociais ... 51

9.2 Anexo B – A evolução da Web ... 70

9.2 Anexo C – Web 2.0 Framework ... 71

9.3 Anexo D – Adoção de Redes Sociais e Web 2.0 nas Empresas Americanas... 72

(3)

Figura 2.1 - Comparação entre Web 1.0, 2.0 e 3.0 ... 12

Figura 2.2 – A evolução da Web (Semantic Wave 2008) ... 13

Figura 2.3 – As Camadas da Web Semântica... 16

Figura 3.1 – Tag Cloud com os principais temas da Web 2.0... 24

Figura 3.2 – Web 2.0 Framework... 25

Figura 3.3 – Exemplo de site utilizando Redes Sociais... 28

Figura 3.4 – Adoção das tecnologias de Web 2.0 e Redes Sociais nas empresas americanas ... 29

Figura 5.1 – Interface Protégé versão 3.1.1 ... 35

(4)

URI - Uniform Resource Identifier XML – eXtensible Markup Language RDF – Resource Description FRamework RDFS – RDF Schema

SPARQL – Simple Protocol and RDF Query Language SQL – Structured Query Language

RIF – Rule Interchange Format OWL – Web Ontology Language W3C – World Wide Web Consortium HTML – HyperText Markup Language DTD – Document Type Definition

SGML Standard Generalized Markup Language XSLT - XML Stylesheet Language Transformations XMI - XML Metadata Interchange

FOAF – Friend of a Friend DC – Dublin Core

API – Aplication Program Inteface CGM – Consumer-Generated Media

(5)

Até recentemente, a manipulação de grandes quantidades de informação era uma tarefa de especialistas, agora constitui uma necessidade para pessoas de todas as áreas, tanto na sua atividade profissional como na maioria das tarefas do dia a dia. A qualidade na recuperação de informação é crucial em muitas profissões, e a melhoria dos sistemas pode ter um grande impacto nesta, especialmente quando se trata de coleções de documentos heterogêneos. A pesquisa na Web tem sido um excelente campo para a recuperação de informação em grande escala e a indexação automática maciça. O presente trabalho se propõe um estudo geral sobre Web Semântica, Web 2.0, redes sociais e ontologias, suas aplicações, linguagens e metodologias, tendo como finalidade principal, a criação de uma Ontologia do Domínio das Redes Sociais, com o objetivo de verificar como as redes sociais podem ser potencializadas através da Web Semântica, e de como no futuro a Web Semântica e as redes sociais irão se integrar. O grande desafio consiste em modelar este domínio de uma forma a facilitar o desenvolvimento de aplicações para ele, utilizando tecnologias e ferramentas da Web Semântica. Este trabalho teve também como objetivo sistematizar o estudo das redes sociais, Web 2.0, Web Semântica e ontologias, de forma a servir de base e referência para estudos futuros.

(6)

Until recently, the handling of large amounts of information was a task for specialists, is now a need for people from all areas, in their professional and in the tasks of everyday life. The quality in information retrieval is crucial in many professions, and improvement of systems can have a major impact on this, especially when it comes to heterogeneous collections of documents. The research on the Web has been an excellent field for information retrieval and massive automatic indexing on a large scale. This research proposes a general study on Semantic Web, Web 2.0, social networks and ontologies, its applications, languages and methodologies, with the main purpose of creating of an Social Networks Ontology, in order to see how the social networks can be enhanced through the Semantic Web, and see how in the future the Semantic Web and social networks will be integrated. The big challenge is to shape this field in a manner to facilitate the development of applications for it, using technologies and tools of the Semantic Web. This work was also intended to systematize the study of social networks, Web 2.0, Semantic Web and ontologies in order to serve as a basis and reference for future studies.

(7)

1. INTRODUÇÃO

No início, a Web era caracterizada por sites estáticos, sem interação com os usuários. A primeira grande mudança na forma em que usamos a Internet veio com a larga aplicação de sites de comércio eletrônico. Assim, a rede passou a nos oferecer produtos e serviços. A Seguir veio a fase dos sites de relacionamento e compartilhamento de conteúdos, a chamada Web 2.0.

A organização da imensa vastidão de conteúdo disponível atualmente na Internet, de uma forma simples, eficiente e focada em nossas necessidades, se tornou um problema. Dessa necessidade surgiu a Web Semântica. Sua principal aplicação se refere à capacidade de os sistemas computacionais interpretarem o conteúdo disponível nos sites da Internet e conseguir entender de forma diferenciada uma página em que a palavra bala é um doce ou é um projétil de armas, por exemplo. Ou seja, o conteúdo é interpretado de acordo com seu contexto (Clicko, 2008).

A Web Semântica representa a evolução da Web atual. Enquanto a Web tradicional foi desenvolvida para ser compreendida somente pelos usuários, a Web Semântica está sendo projetada para ser entendida também pelas máquinas. Este entendimento se dá na forma de agentes computacionais, que são capazes de operar eficientemente sobre as informações, podendo entender seus significados. Portanto, auxiliando os usuários em operações na Web (Dziekaniak et al., 2004).

A Web Semântica tem como objetivo incorporar semântica às informações. Com isso, não somente os usuários entenderão as informações como também as máquinas. Ela pretende fornecer estruturas e dar significado semântico ao conteúdo das páginas Web, criando assim um ambiente onde agentes de software possam trabalhar em conjunto com o usuário (Dziekaniak et al., 2004).

De acordo com Berners-Lee (2001) os computadores necessitam ter acesso a coleções estruturadas de informações (dados e metadados) e de conjuntos de regras de inferência que ajudem no processo de dedução automática para que seja administrado o raciocínio automatizado, ou seja, a representação do conhecimento.

Estas regras são especificadas através de ontologias, as quais permitem representar explicitamente a semântica dos dados. Através dessas ontologias é possível elaborar uma rede enorme de conhecimento humano, complementando o processamento

(8)

da máquina e, portanto, melhorando qualitativamente o nível de serviços na Web (Silva, 2002).

De acordo com Hendler (2001) e citado em Dziekaniak et al. (2004), a Web Semântica pode ser considerada como a composição de um grande número de pequenos componentes ontológicos que apontam entre si. Dessa forma, universidades, companhias, agências governamentais e grupos de interesses específicos terão grande interesse em ter seus recursos Web ligados a um conteúdo ontológico, pois ferramentas poderosas serão disponibilizadas para prover interoperabilidade e processar essas informações entre aplicações Web.

Algumas tecnologias foram desenvolvidas para a Web Semântica, tais como o XML, linguagem de marcação que permite aos usuários criarem tagspersonalizadas sobre o documento criado. Outra tecnologia utilizada pela Web Semântica é o RDF, que trabalha com um trio de informação o qual expressa o significado das informações. Cada componente do trio tem sua própria finalidade, em analogia ao sujeito, verbo e objeto de uma frase e recebe uma identificação URI. Estas tecnologias são fundamentais para o funcionamento da Web Semântica e serão abordadas de forma mais específica nas seções seguintes.

As principais pesquisas no mundo da rede estão focadas na construção da Web Semântica, baseada mais diretamente nas percepções cognitivas e no modo de ver o mundo por meio da informação de cada usuário. Uma rede adaptativa, flexível, e principalmente visível (ou visual) (Saad, 2008). Isso significa que a Web está cada vez mais Semântica. O impacto desta mudança nas Redes Sociais é muito grande e necessita ser sistematicamente estudado para ser compreendido e facilitar o desenvolvimento de aplicações.

As ontologias oferecem um meio de lidar com a representação de recursos de informação: o modelo de domínio descrito por uma ontologia pode ser usado como uma estrutura unificadora para dar semântica e uma representação comum à informação (Falbo et al., 2004).

Atualmente ontologias são utilizadas diversas áreas do conhecimento, com o objetivo de organizar a informação. Segundo Lima (2001), ontologias fornecem um entendimento comum e compartilhado de um domínio, que pode ser comunicado através de pessoas e sistemas de aplicação, tornando-se fator chave para o

(9)

desenvolvimento da Web Semântica.

Ontologias são muito utilizadas como representações de dados para bases de conhecimento e marcação de dados na Web Semântica (Berners-Lee et al., 2001). Abordagens baseadas em ontologias mostraram as vantagens da integração de informações e interoperabilidade de sistemas incluindo reusabilidade, análise de verificação, etc. Dessa forma, será criada uma Ontologia do Domínio das Redes Sociais, com o objetivo de facilitar o desenvolvimento de aplicações para as Redes Sociais utilizando as ferramentas e recursos da Web Semântica. Ontologias serão abordadas com mais detalhes nas próximas seções deste trabalho.

1.2 Objetivos

O presente trabalho tem por objetivo principal fazer um estudo aprofundado sobre Web Semântica, Web 2.0, redes sociais e ontologias, do qual resulta a proposta de criação de uma ontologia do domínio das redes sociais;

Este trabalho tem como objetivos específicos:

• Estudar os trabalhos já realizados e caracterizar o estado da arte nos temas citados;

• Pesquisar definições e pesquisas relacionadas com a Web Semântica, Web 2.0, redes sociais e ontologias;

• Concentrar recursos, ponteiros e informações úteis para auxiliar na concepção de temas de estudo e pesquisa na área;

• Desenvolver uma ontologia do domínio das redes sociais, utilizando as ferramentas da Web Semântica para descrever a Web 2.0 e as redes sociais;

• Registrar e analisar resultados;

• Concluir e levantar novas possíveis questões.

1.2 Organização do Texto

O trabalho está estruturado da seguinte forma: o capítulo 2 diz respeito a Web Semântica, suas características e os elementos que tornam possível sua existência, como XML, RDF, OWL, FOAF e Dublin Core. O capítulo 3 aborda as definições e

(10)

características da Web 2.0, com ênfase nas Redes Sociais. O capítulo 4 apresenta conceitos e definições de ontologias, assim como suas vantagens, benefícios de sua utilização, e tipos de ontologias. O capítulo 5, por sua vez, mostra a ferramenta Protégé, um editor de ontologias que foi utilizado para construir a ontologia neste trabalho. No capítulo 6 é apresentada a ontologia do domínio das redes sociais, o qual se constitui o foco principal deste trabalho. Também são apresentadas no capítulo 7 as conclusões, considerações finais e trabalhos futuros. Nos Anexos, mais especificamente, no anexo A, são mostradas as descrições de cada um dos conceitos da Ontologia do Domínio das Redes Sociais. Nos Anexos B, C, D e E são mostradas, de forma realçada, algumas das figuras presentes no texto

(11)

2. WEB SEMÂNTICA

A Web Semântica, também conhecida por Web 3.0, consiste na materialização da proposta de Tim Berners-Lee, o criador da Web de dotar a Web com uma representação semântica compartilhada, de uma forma que pudesse ser interpretada simultaneamente por seres humanos e máquinas, permitindo assim a inferência automática de conteúdo, futuros estados e ações.

De acordo com Berners-Lee (2007), o modo mais simples de explicar a Web Semântica é o seguinte:

“No seu computador você tem seus arquivos, os documentos que você lê, e existem arquivos de dados como agendas, programas de planejamento financeiro, planilhas de cálculo. Estes programas contêm dados que são usados em documentos fora da web. Eles não podem ser colocados na Web”.

Segundo o mesmo autor,

“a Web Semântica é sobre a colocação de arquivos de dados na Web. Não é apenas uma Web de documentos, mas também de dados. A tecnologia de dados da Web Semântica terá muitas aplicações, todas interconectadas. Pela primeira vez haverá um formato comum de dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da Web troquem arquivos”. Segundo Berners-Lee et al. (2001), grande parte do conteúdo da Web atual é projetada para o entendimento humano apenas, não para programas de computador manipulá-los significativamente, pois as máquinas ainda não possuem um método seguro para processar a semântica. De acordo com ele, o objetivo da Web Semântica é trazer estrutura para o conteúdo das páginas Web, aumentando-lhes o significado, criando um ambiente onde agentes de software podem fluir de página a página, cumprindo sofisticadas tarefas para os seus usuários.

Ainda de acordo com Berners-Lee et al. (2001), e citado em Ramalho (2006), o primeiro passo para o desenvolvimento da Web Semântica é a inclusão de dados em um formato que os sistemas computacionais possam naturalmente compreender de forma direta ou indireta, tendo como principal objetivo possibilitar um melhor aproveitamento

(12)

das potencialidades do ambiente Web, onde por meio do uso intensivo de linguagens computacionais e instrumentos de metadados espera-se obter o acesso automatizado às informações de maneira mais precisa, utilizando-se para isso processamentos semânticos de dados e heurísticas automáticas.

Conforme afirmam Berners-Lee et al. (2001): “A Web Semântica é uma extensão da Web atual, onde a informação possui um significado claro e bem definido, possibilitando uma melhor interação entre computadores e pessoas”. Deste modo, é evidente que o objetivo final da Web Semântica é atender as pessoas e não os computadores, mas para isso torna-se necessário construir instrumentos que forneçam sentido lógico e semântico para as máquinas. Assim, pode-se verificar que a Web Semântica é uma tentativa inversa de solução, comparando-se com as tradicionalmente desenvolvidas, onde a idéia é pensar nas máquinas para que estas possam servir aos humanos de maneira mais eficiente (Ramalho, 2006).

A Web Semântica representa a evolução da Web atual. A Web tradicional foi desenvolvida para ser entendida apenas pelos usuários, já a Web Semântica foi idealizada para ser compreendida também pelas máquinas. Para isso utiliza diversas tecnologias, que são capazes de operar de maneira eficiente sobre as informações, podendo entender seus significados, assim, auxiliando os usuários em operações na Web (Dziekaniak et al., 2004). Ela tem como objetivo fornecer estruturas e dar significado semântico ao conteúdo das páginas Web, criando um ambiente cooperativo, onde agentes de software e usuários possam atuar juntos. Esta evolução é ilustrada nas figuras 2.1 e 2.2.

(13)

Figura 2.2 – A evolução da Web (Fonte – Semantic Wave 2008)

A figura 2.2 mostra a evolução da Web, com uma projeção até o ano de 2020. O eixo horizontal mostra o aumento da conectividade social, enquanto o eixo vertical mostra o aumento da conectividade de conhecimento e raciocínio. Começa no canto inferior esquerdo, mostrando a Web, que conecta informações. No canto inferior direito está e Web Social, que conecta pessoas. No canto superior esquerdo se encontra a Web Semântica, que conecta conhecimento. E por fim, no canto superior direito está a Web Ubíqua, que conecta inteligência. Dentro de cada quadro se encontram termos descrevendo características de casa tipo de Web. A figura 2.2 é mostrada de forma realçada no Anexo B.

Segundo Golbeck et al. (2003), e citado em Jorge (2005), a Web Semântica é uma visão de futuro da Web que irá dar significado a todos os dados, assim como tornar as informações públicas e acessíveis a qualquer um que tenha interesse nelas. Enquanto muitos sites da Web irão querer manter seus dados proprietários, muitos outros irão optar por tornar suas informações públicas e abertas, usando marcações semânticas nos conteúdos disponibilizados. Desta forma, continua a autora, a Web Semântica oferece novas capacidades, tornando possível a adição de documentos que representam o 'conhecimento' sobre uma página, foto ou base de dados, público e de acesso livre, em

(14)

um formato capaz de ser interpretado também pelas máquinas.

De acordo com Ramalho (2006), uma das bases da Web Semântica reside na utilização de ontologias, de modo que se espera que, com o desenvolvimento de ontologias formais, seja possível descrever as informações semânticas dos recursos Web, possibilitando o compartilhamento e a manipulação de informações que possam ser interpretadas computacionalmente de maneira automática, a partir da utilização de regras lógicas. Ontologias serão estudadas mais detalhadamente no capítulo 4.

A Web Semântica é construída de acordo com princípios que são implementados em camadas de tecnologias e de padrões Web.

A camada Unicode/URI (Uniform Resource Identifier) fornece a interoperabilidade em relação à codificação de caracteres e ao endereçamento e nomeação de recursos da Web Semântica. O Unicode é um padrão de codificação para fornecer uma representação numérica universal e sem ambigüidade para cada caractere de maneira independente da plataforma de software e do idioma. O URI é um padrão para identificar um recurso físico ou abstrato de maneira única e global. É o elemento básico da estruturas a partir dos quais os demais componentes são construídos.

A camada XML, com as definições de namespace e schema, torna possível a integração das definições da Web Semântica com outros padrões baseados em XML. XML também permite a criação de novas tags para atender aplicações específicas.

As camadas RDF e RDF Schema tornam possível a definição de vocabulários que podem ser atribuídos por URIs e também possibilitam estabelecer declarações sobre objetos com URIs. A camada RDF permite a representação de metadados e é acessível por máquinas. RDF Schema é um modelo de tipos de dados simples que permite a criação de classes e propriedades. Permite obter estruturas de informação sem ambigüidades.

A camada da Ontologia fornece suporte para a evolução de vocabulários e para processar e integrar a informação existente sem problemas de indefinição ou conflito de terminologia e também pode definir relações entre conceitos diferentes. Esta camada é o núcleo da Web Semântica, que não pode ser construída sem ela.

SPARQL é uma linguagem de consulta para os padrões de grafos RDF/RDFS. Está para a Web Semântica assim como SQL está para as bases de dados relacionais. É

(15)

formada por padrões de consultas, por um protocolo para uso na Web e formato XML para a saída dos resultados.

RIF (Rule Interchange Format) é uma proposta de um formato padronizado para o compartilhamento de regras entre diferentes comunidades: acadêmicas, governamentais, empresariais, etc.

Lógica Unificadora (Unifying Logic) é uma representação unificada de expressões SPARQL, RIF e ontologias (descritas em OWL). O grande objetivo desta camada é oferecer um framework único para possibilitar a combinação dos elementos das camadas inferiores.

Na camada de prova (Proof), mecanismos de inferência devem especificados para o uso das regras previamente definidas. É realizada a validação de informações com o uso de agentes (Palazzo, 2008): software executado sem controle humano direto ou supervisão constante para cumprir objetivos definidos por um usuário; coletam, filtram e processam informações na Web, eventualmente com o auxílio de outros agentes.

Na camada de Criptografia (Crypto), situada transversalmente às diversas camadas da Web Semântica, muitas vezes é necessário garantir a segurança e privacidade das informações. Com esta finalidade, mecanismos de criptografia são integrados às camadas, especialmente em aplicações mais sensíveis.

Na camada de Confiança (Trust), após a informação desejada ser obtida, é necessário determinar a sua autenticidade Declarações de confiabilidade podem ser verificadas se houver confirmação de outra entidade (também confiável).

No que diz respeito à camada de Interface com o Usuário e Aplicações (User

Interface & Applications), segundo Palazzo (2008), uma das metas da Web Semântica é

a personalização da interface do usuário em suas aplicações. Para isso é necessário modelar as preferências, necessidades e interesses de cada usuário Contribuem para essa meta o desenvolvimento (semi-) automatizado de ontologias pessoais com o uso de vocabulários controlados como o Dublin Core e o FOAF.

(16)

Figura 2.3 – As camadas da Web Semântica

A importância do estudo da Web Semântica reside no fato de que aplicações baseadas na estrutura usual da Web tendem a incorporar cada vez mais os recursos da Web Semântica (metadados, ontologias, índices de pesquisa e serviços em geral), uma vez que tais recursos beneficiam, facilitam e viabilizam grandes aplicações distribuídas. O principal desafio da Web Semântica é criar uma linguagem que consiga ao mesmo tempo expressar o significado e estabelecer regras para processar esse significado de forma a inferir novos dados e regras. As regras para o processamento do significado devem ser exportadas para a Web de forma a permitir que outros sistemas inteligentes possam interagir (Morais et al., 2003).

Atualmente, novas formas de representação e recuperação de informação são cada vez mais necessárias, fundamentando pesquisas em diversas áreas da ciência, como a ciência da computação, a ciência da informação e a lingüística.

2. 1 XML (eXtensible Markup Language)

XML (eXtensible Markup Language) é uma recomendação da W3C (World

Wide Web Consortium) para gerar linguagens de marcação para necessidades especiais.

É um subtipo de SGML (Standard Generalized Markup Language) capaz de descrever diversos tipos de dados. Seu propósito principal é a facilidade de compartilhamento de informações através da Internet.

(17)

Em determinados aspectos, o XML é semelhante ao HTML. Ambas são derivadas do SGML e contêm tags para descrever o conteúdo de um documento. A diferença é que enquanto o HTML (HyperText Markup Language) tem como objetivo controlar a forma com que os dados serão exibidos, o XML se concentra na descrição dos dados que o documento contém. Além disso, o XML é flexível no sentido de que podem ser acrescentadas novas tags à medida que forem necessárias, bastando para isso que estejam descritas em um DTD (Document Type Definition) específico. Em outras palavras, qualquer comunidade de desenvolvedores pode criar suas marcações (tags) específicas que sirvam aos propósitos de descrição de seus dados (Souza et al., 2004).

Estimulado pela insatisfação com os formatos existentes (padronizados ou não), o W3C começou a trabalhar em meados da década de 1990 em uma linguagem de marcação que combinasse a flexibilidade da SGML (Standard Generalized Markup

Language) com a simplicidade da HTML. O principio do projeto era criar uma

linguagem que pudesse ser lida por software, e integrar-se com as demais linguagens. Sua filosofia seria incorporada por vários princípios importantes (Wikipedia, 2008):

• Separação do conteúdo da formatação;

• Simplicidade e Legibilidade, tanto para humanos quanto para computadores;

• Possibilidade de criação de tags sem limitação;

• Criação de arquivos para validação de estrutura (Chamados DTDs);

• Interligação de bancos de dados distintos;

• Concentração na estrutura da informação, e não na sua aparência.

Segundo Chaves et al (2001), e citado em Jorge (2005), a maior parte dos documentos disponíveis na Web hoje está identificada apenas com informações de exibição. Diante da necessidade de se prover meios mais adequados para possibilitar acesso – mediado por máquina – ao repositório de informações disponível na Web, é necessária a utilização da tecnologia XML, que possibilita a exploração da semântica dos conteúdos desses documentos.

XML é uma linguagem simples, de formato texto muito flexível, derivada do SGML. Originalmente projetada para enfrentar os desafios de publicações eletrônicas

(18)

de larga escala, está desempenhando um papel cada vez mais importante nas trocas de uma grande variedade de dados na Web.

Atualmente, a linguagem XML é uma das tecnologias mais amplamente adotadas para intercâmbio e representação de informações na Web, com a vantagem de permitir, a cada um, criar suas próprias tags, rótulos ocultos que anotam as páginas Web, ou seções de texto em uma página (Jorge, 2005).

Existem ainda os recursos dos DTDs, XSLT (XML Stylesheet Language

Transformations), XMI (XML Metadata Interchange) que complementam esta

tecnologia. Pode-se organizar todos os arquivos no formato XML, preenchê-los de metadados e publicá-los na Internet. Tem-se então a Web Semântica construída.

2.2 RDF (Resource Description Framework)

A RDF é um padrão recomendado pelo W3C que usa notação XML como sintaxe de codificação para descrição de metadados. Segundo Jorge (2005), RDF é uma aplicação XML que serve como uma base para o processamento de metadados. Seu principal objetivo é o de facilitar o intercâmbio de informações, que podem ser interpretadas por máquinas, entre aplicativos via Web.

Jorge (2005) ainda afirma que a RDF é o padrão para representação de metadados na Web. Essa linguagem permite aos computadores representar e compartilhar dados semânticos na Web.

Um documento ou elemento RDF faz declarações sobre recursos. Uma declaração afirma que um certo recurso possui uma ou mais propriedades. Cada propriedade tem um tipo, que é um nome, e um valor. O valor de uma propriedade pode ser um literal, como um texto, um número, ou pode ser outro recurso. Uma declaração é composta de três partes (Jorge, 2005):

Recurso (ou Sujeito) – Qualquer objeto que é identificável unicamente, ou seja, que possui uma URI. Podem ser livros, páginas da Web, elementos em uma página e pessoas individuais, por exemplo;

• Propriedade (ou Verbo) – É uma característica, um atributo ou um relacionamento específico de um recurso. Em outras palavras, um

(19)

recurso que tenha um determinado nome e possa ser utilizado como uma propriedade;

• Valor (ou Objeto) - Deve ser atômico na natureza (literal de texto ou números, por exemplo) ou outros recursos, os quais podem ter suas próprias propriedades. Consiste na combinação de um recurso, de uma propriedade, e de um valor.

De acordo com Moura (2001), e citado em Dziekaniak et al. (2004), o RDF proporciona vantagens em diversas áreas:

• Na área de descoberta de recursos, possibilita a implementação de mecanismos de pesquisa mais eficientes.

• Na área de catalogação, o mesmo pode ser utilizado para descrever os recursos de informação em um sítio da Web, como em uma biblioteca digital.

• Na área de agentes inteligentes, pode facilitar o intercâmbio de informações e o compartilhamento de conhecimento.

O RDF é um sistema para auxílio ao desenvolvimento de metadados cuja finalidade é promover a interoperabilidade entre aplicações que compartilham informações que sejam entendidas por sistemas na Web (Dziekaniak et al., 2004). Metadados representados em RDF são utilizados para dar significado aos recursos da Web Semântica por permitir que estes sejam manipulados e compreendidos por máquinas.

Trata-se de um mecanismo de descrição neutro, que tem como objetivo descrever recursos de qualquer área do conhecimento. Não predefine qualquer semântica nem pressupõe um domínio específico de conhecimento. (RDF, 1998).

Em RDF, um domínio de conhecimento é definido via um RDF Schema (RDF, 1998). É no RDF Schema, portanto, que é definida a semântica e as características de uma propriedade. Uma aplicação que crie metadados em RDF e outra que utilize estes metadados devem utilizar o mesmo Schema para um funcionamento adequado.

(20)

2. 3 OWL (Web Ontology Language)

A OWL é uma linguagem utilizada para definir e instanciar ontologias na Web. Uma ontologia OWL pode incluir descrições de classes e suas respectivas propriedades e seus relacionamentos. Foi projetada para o uso por aplicações que precisam processar o conteúdo da informação ao invés de apenas apresentá-la aos humanos.

Segundo (Wikipedia, 2008), OWL é vista como uma tecnologia importante para a futura implementação da Web Semântica. Ela vem ocupando um papel importante em um número cada vez maior de aplicações, e vem sendo foco de pesquisa para ferramentas, técnicas de inferências, fundamentos formais e extensões de linguagem.

OWL foi projetada para disponibilizar uma forma comum para o processamento de conteúdo semântico da informação na Web. Ela foi desenvolvida para aumentar a facilidade de expressar semântica disponível em XML, RDF e RDFS. Portanto, pode ser considerada uma evolução destas linguagens em termos de sua habilidade de representar conteúdo semântico da Web interpretável por máquinas. Visto que é baseada em XML, a informação pode ser facilmente trocada entre diferentes tipos de computadores utilizando diferentes sistemas operacionais e linguagens de programação. OWL vem sendo usada para criar padrões que forneçam um framework para gerenciamento de ativos, integração empresarial e compartilhamento de dados na Web (Wikipedia, 2008).

De acordo com o W3C e citado por Jorge (2005), a linguagem OWL é projetada para ser usada por aplicações que necessitam de processar o conteúdo das informações, ao invés de apenas apresentar informações aos seres humanos. OWL facilita uma maior interpretação do conteúdo Web por máquinas do que XML, RDF e RDFS, por prover vocabulário adicional juntamente com a semântica formal. Ainda segundo o W3C, também citado por Jorge (2005), OWL pode ser usada para:

• Formalizar um domínio pela definição de classes e propriedades destas classes;

• Definir instâncias e propriedades sobre elas;

• Raciocinar a respeito destas classes e instâncias até o grau permitido pela semântica formal da linguagem.

(21)

expressividade em ordem crescente: OWL Lite, OWL DL e OWL Full (Jorge, 2005).

OWL Lite suporta aqueles usuários que necessitam principalmente de uma classificação hierárquica e restrições simples. Embora suporte restrições de cardinalidade, ela só permite valores de cardinalidade 0 ou 1. Também permite um caminho de migração mais rápido de tesauros e outras taxonomias. OWL Lite também tem uma menor complexidade formal que OWL DL.

OWL DL suporta aqueles usuários que querem a máxima expressividade, enquanto mantém a computabilidade e decidibilidade. OWL DL inclui todas as construções da linguagem OWL, porém elas somente podem ser usadas com algumas restrições. OWL DL é assim chamada devido a sua correspondência com as lógicas de descrição, um campo de pesquisa que estudou a lógica que forma a base formal da OWL.

OWL Full é direcionada àqueles usuários que querem a máxima expressividade e a liberdade sintática do RDF sem nenhuma garantia computacional. OWL Full permite que uma ontologia aumente o vocabulário pré-definido de RDF ou OWL. É improvável que algum software de inferência venha a ser capaz de suportar completamente cada recurso da OWL Full.

As linguagens de ontologias, representadas, sobretudo, pela linguagem OWL, permitem que se escrevam conceituações formais e explícitas de modelos de domínio, empregando, como requisitos básicos, uma sintaxe bem definida, uma semântica formal e alto nível de expressividade, fornecendo apoio eficiente ao processo de inferência de significado.

2.4 Vocabulários

2.4 FOAF (Friend of a Friend)

FOAF, um acrônimo de Friend of a Friend (Amigo de um Amigo), é um conjunto de dados, legíveis para computadores, descrevendo pessoas (suas atividades,

(22)

interesses, relações com outras pessoas etc.), como estão conectadas e as cosas que elas criaram e fazem (Wikipedia, 2008).

O projeto FOAF estabelece um padrão RDF para descrição de pessoas. Utiliza a Web semântica para criar aplicações que descrevam perfis de pessoas, as ponham em contato e relacionem seus trabalhos e preferências. Esta ferramenta situa a pessoa na Web, e o lugar que a Web ocupa em seu próprio mundo.

Com ela será possível compartilhar informação entre páginas diferentes da Web - como Redes Sociais - e reutilizá-la sem problemas. Também servirá para encontrar amigos comuns ou pessoas com os mesmos interesses. Cada perfil que se introduz na ferramenta possui um identificador único, que pode ser um endereço de correio eletrônico, ou um endereço IP.

FOAF permite que pessoas criem páginas Web que contenham informações pessoais e que possam ser lida por agentes de software. Uma das propriedades mais interessantes de FOAF é a foaf: term_knows a qual possibilita que uma pessoa diga quem ela conhece (Wikipedia, 2008).

2.5 Dublin Core

O padrão Dublin Core tem como objetivo oferecer uma coleção básica de elementos de metadados para serem utilizados por qualquer comunidade, independente de sua área de domínio.

O padrão Dublin Core (DC) de metadados consiste em um simples, mas efetivo conjunto de elementos para descrever uma ampla quantidade de recursos eletrônicos (Silva, 2007). O DC compreende quinze elementos semânticos que foram estabelecidos através do consenso de grupos interdisciplinares internacionais de bibliotecários, cientistas da computação, comunidade de museus, e outros estudiosos deste campo.

De acordo com Rocha (2004), os elementos de Dublin Core estão organizados em três grupos: Conteúdo, propriedade intelectual e instância. Os elementos que descrevem o conteúdo do recurso são: Título, assunto, descrição, linguagem, fonte, recursos relacionados (relação) e abrangência (espacial ou temporal). Os elementos de propriedade intelectual são: o criador (responsável intelectual pela criação do recurso), publicador (quem tornou o recurso público), contribuidor e direitos autorais. Os elementos de instância são data, tipo (ex.: página da Web, artigo, livro), formato (ex.:

(23)

pdf, world, mp3) e identificador (ex.: URI, ISSBN).

Segundo Silva (2007), o DC tem como objetivo seguir as seguintes características:

• Simplicidade de criação e manutenção: o conjunto de elementos foi mantido pequeno a fim de permitir que um não-especialista crie registros descritivos simples facilmente, enquanto fornece recursos de recuperação efetiva no ambiente conectado em rede.

• Semântica comumente compreendida: a descoberta de informações na Internet é dificultada pelas diferenças de terminologias de um campo de conhecimento para outro.

• Escopo internacional: O conjunto de elementos do DC foi originalmente desenvolvido em inglês, mas versões foram sendo criadas em outras linguagens, incluindo finlandês, norueguês, tailandês, japonês, francês, português, alemão, grego, indonésio, e espanhol.

• Extensibilidade: apesar dos esforços de manter a simplicidade na descrição dos recursos digitais, o DC reconhece a importância de fornecer mecanismos de extensão para necessidade de recursos adicionais descobertos.

(24)

3. WEB 2.0 - REDES SOCIAIS

Web 2.0 é um termo utilizado para definir a chamada segunda geração da Internet, fortemente marcada pela interatividade, pelos conteúdos gerados por usuários e pela personalização de serviços (Costa, 2008). Essa geração da Internet é caracterizada, principalmente, pelo surgimento das Redes Sociais. Alguns exemplos de sites típicos são os blogs (e as variações fotologs e videologs), sites de compartilhamento de arquivos, Wikis (Wikipedia, Wiki Wiki Web, Webopedia), Comunidades Virtuais (Orkut, Myspace, Facebook) e Fóruns. A figura 3.1 apresenta uma tag cloud (descrição visual de tags geradas pelos usuários) apresentando os principais temas da Web 2.0.

Figura 3.1 – Tag cloud com os principais temas da Web 2.0

A Web 2.0 é a segunda geração de serviços online e caracteriza-se por potencializar as formas de publicação, compartilhamento e organização de informações, além de ampliar os espaços para a interação entre os participantes do processo. Refere-se não apenas a uma combinação de técnicas, mas também a um determinado período tecnológico, a um conjunto de novas estratégias mercadológicas e a processos de comunicação mediados pelo computador (Primo, 2007).

De acordo com Wikipedia (2008), a Web 2.0 tem repercussões sociais importantes, que potencializam processos de trabalho coletivo, de troca afetiva, de

(25)

produção e circulação de informações, de construção social de conhecimento apoiada pela informática. São essas formas interativas, mais do que os conteúdos produzidos ou as especificações tecnológicas em jogo, que serão aqui discutidas.

A figura 3.2 fornece um framework e explica alguns dos princípios da Web 2.0. Esta figura se encontra em Framework (2008). Nas entradas (Inputs) se encontram Conteúdo Gerado por Usuários, que inclui texto, imagens, vídeos, mídias interativas e arquitetura virtual; Opiniões, que incluem links, clicks, tagging, avaliações e conexões sociais; e Aplicações, que incluem aplicações Web e Widgets. Dentro de Mecanismos (Mechanisms) se encontram Tecnologias, com XML, API’s, AJAX e Ruby on Rails; Recombinação, com Mashups, remixagem, agregação e embarcamento; Filtragem colaborativa, com ranking e correlações e perfis; Estruturas. Com folksonomias, tag

clouds e mundos virtuais; e Syndication, com RSS. E por fim Resultados Emergentes

(Emergent Outcomes), com os seguintes itens: mais importante se torna visível, recomendações personalizadas, comunidades com significado, conteúdo relevante facilmente encontrado, usabilidade reforçada e inteligência coletiva. Esta figura se encontra de forma realçada no Anexo C.

(26)

Segundo O’Reilly (2006), não há como demarcar precisamente as fronteiras da Web 2.0. Trata-se de um núcleo ao redor do qual gravitam princípios e práticas que aproximam diversos sites que os seguem.

Web 2.0 é um termo cunhado em 2004 pela empresa estadunidense O’Reilly Media para designar uma segunda geração de comunidades e serviços baseados na plataforma Web, como wikis, aplicações baseadas em folksonomia e redes sociais. Embora o termo tenha uma conotação de uma nova versão para a Web, ele não se refere à atualização nas suas especificações técnicas, mas a uma mudança na forma como ela é encarada por usuários e desenvolvedores (Wikipedia, 2008).

Segundo O’Reilly (2006), Web 2.0 é a mudança para uma Internet como plataforma, e um entendimento das regras para obter sucesso nesta nova plataforma. Entre outras, a regra mais importante é desenvolver aplicativos que aproveitem os efeitos de rede para se tornarem melhores quanto mais são usados pelas pessoas, aproveitando a inteligência coletiva.

O'Reilly (2006) ainda sugere algumas regras que ajudam a definir sucintamente a Web 2.0:

• O beta perpétuo: não trate o software como um artefato, mas como um processo de comprometimento com seus usuários.

• Pequenas peças frouxamente unidas: abra seus dados e serviços para que sejam reutilizados por outros. Reutilize dados e serviços de outros sempre que possível.

• Software acima do nível de um único dispositivo: não pense em aplicativos que estão no cliente ou servidor, mas desenvolva aplicativos que estão no espaço entre eles.

• Lei da Conservação de Lucros, de Clayton Christensen: lembre-se de que em um ambiente de rede, APIs abertas e protocolos padrões vencem, mas isso não significa que a idéia de vantagem competitiva vá embora.

• Dados são o novo “Intel inside”: a mais importante entre as futuras fontes de fechamento e vantagem competitiva serão os dados, seja através do aumento do retorno sobre dados gerados pelo usuário, sendo

(27)

dono de um nome ou através de formatos de arquivo proprietários. Umas das principais características é que ela pode ser utilizada como uma plataforma, isto é, viabilizando funções online que antes só poderiam ser conduzidas por programas instalados em um computador. Isso significa ver a Web não como um programa, mas sim como um ambiente dinâmico onde o usuário não acessa dados simplesmente, mas pode criar e editar conteúdos.

A segunda geração da Internet é movida a dados. A chave para a vantagem competitiva em aplicativos para Internet é permitir que os usuários complementem dados já disponíveis com seus próprios. Assim, a “arquitetura de participação” vai além do desenvolvimento de software, com usuários envolvidos de forma a criar conteúdo na plataforma, assim como na divulgação desta (Costa, 2008).

Um dos pontos principais da Web 2.0 é a Consumer-Generated Media (CGM) ou mídia gerada pelo consumidor é um termo utilizado para descrever o conteúdo que é criado e divulgado pelo próprio consumidor. Com o surgimento da Internet e o avanço das tecnologias digitais, da mesma maneira que o acesso dos consumidores à informação teve um aumento significativo, aumentou também a facilidade dos consumidores em expressar suas opiniões.

Na Internet o CGM está presente em comentários, fóruns, lista de discussões, blogs e fotologs, comunidades, grupos, sites participativos, no YouTube, na própria Wikipedia. Os consumidores utilizam todas as ferramentas disponíveis (Messenger, sites, blogs, e-mails, mensagens, celulares, etc.) para divulgar, sobretudo, suas experiências pessoais e opiniões em relação a produtos, serviços, marcas, empresas, notícias. Um exemplo é o site Flickr, mostrado na figura 3.3, um site que permite que usuários postem e compartilhem fotos.

(28)

Figura 3.3 – Exemplo de site utilizando Redes Sociais

Segundo Wikipedia (2008), Redes Sociais na Internet são as relações entre os indivíduos na comunicação mediada por computador. Esses sistemas funcionam através da interação social, com o objetivo de conectar pessoas e proporcionar sua comunicação, sendo utilizados, portanto, para forjar laços sociais. As pessoas levam em conta diversos fatores ao escolher conectar-se ou não a alguém. As organizações sociais geradas pela comunicação mediada por computador podem atuar também de forma a manter comunidades de suporte que, sem a mediação da máquina, não seriam possíveis porque são socialmente não-aceitas.

A figura 3.4 mostra uma pesquisa realizada em 2006, em empresas que utilizam tecnologias de Web 2.0 e Redes Sociais, mostrando a razão pela qual as empresas adotaram tais tecnologias. A pergunta foi a seguinte: Quais das seguintes razões descreve melhor por quê sua empresa adotou tecnologias de Redes Sociais e Web 2.0? Com mais de 80%, a principal resposta foi “Porque elas aumentam a eficiência de nossos negócios”, seguido de: “Sentimos que era uma necessidade competitiva”; “Elas resolvem problemas em nossos negócios”; “Foram recomendadas por parceiros”; “Clientes, funcionários e parceiros exigiram”; e “Elas vieram incluídas em produtos que adquirimos”. Daí a importância de seu estudo. A figura 3.4 se encontra de forma realçada no Anexo D.

(29)

Figura 3.4 – Adoção das tecnologias de Web 2.0 e Redes Sociais nas empresas americanas

(30)

4. ONTOLOGIAS

Ontologias são utilizadas em inteligência artificial, Web Semântica, engenharia de software, arquitetura da informação e em diversas outras áreas da Informática, como uma forma de representação de conhecimento sobre o mundo ou alguma parte deste. A sua utilização tem como objetivo estruturar de forma organizada as informações de um determinado domínio de conhecimento e refletir um entendimento semântico de situações do mundo real.

Hendler (2001) apresenta a seguinte definição: "Uma ontologia é uma especificação formal e explícita de uma conceitualização compartilhada". Onde: "formal" significa legível para computadores; "especificação explícita" diz respeito a conceitos, propriedades, relações, funções, restrições, axiomas, explicitamente definidos; "compartilhado" quer dizer conhecimento consensual; e "conceitualização" diz respeito a um modelo abstrato de algum fenômeno do mundo real. A conceitualização é formada por um vocabulário controlado que é arranjado hierarquicamente e através de relações entre conceitos, como nas taxonomias e tesauros. Uma conceitualização é uma visão abstrata e simplificada do mundo que se deseja representar.

Os computadores necessitam ter acesso a coleções estruturadas de informações (dados e metadados) e de conjuntos de regras de inferência que auxiliem no processo de dedução automática para que seja administrado o raciocínio automatizado, ou seja, a representação do conhecimento Dziekaniak et al. (2004).

Estas regras são especificadas através de ontologias, as quais permitem representar explicitamente à semântica dos dados. Através dessas ontologias torna-se possível a elaboração de uma enorme rede de conhecimento humano, complementando o processamento da máquina, além de melhorar qualitativamente o nível de serviços na Web.

Em Hinz (2006), é apresentada uma lista com as principais vantagens da utilização de ontologias na Ciência da Computação:

• Ontologias fornecem um vocabulário para representação do conhecimento. Esse vocabulário possui uma conceitualização que o sustenta, evitando assim interpretações ambíguas do mesmo.

(31)

• Ontologias permitem o compartilhamento de conhecimento. Caso exista uma ontologia que modele adequadamente certo domínio de conhecimento, a mesma pode ser compartilhada e ulitizada por pessoas que desenvolvam aplicações dentro desse domínio.

• Fornece uma descrição exata do conhecimento. Ao contrário da linguagem natural em que as palavras podem possuir semântica totalmente diferente conforme o seu contexto, a ontologia, por ser escrita em linguagem formal, não deixa espaço para a diferença semântica existente na linguagem natural.

• É possível fazer o mapeamento da linguagem da ontologia sem que com isso seja alterada a sua conceitualização, ou seja, uma mesma conceitualização pode ser expressa em várias línguas.

• Pode ser possível estender o uso de uma ontologia genérica de forma a que ela se adapte a um domínio específico.

Segundo Schiessl (2007), uma ontologia é projetada levando-se em conta os propósitos da área de atuação e aplicação e, enfatizado por Gruber (1993), algumas características relevantes devem ser consideradas no seu planejamento, como se segue:

• Clareza: as definições devem ser objetivas e, quando viável, completas. É preferível que uma definição seja declarada através de axiomas lógicos. Todas as definições devem ser documentadas em linguagem natural.

• Coerência: uma ontologia deve permitir inferências que sejam consistentes com as definições.

• Extensível: uma ontologia deve permitir que novos termos sejam definidos, para usos especiais, baseados no vocabulário existente, de maneira que não seja necessária a revisão das definições já existentes.

• Mínimo viés de codificação: a conceituação deve ser especificada no âmbito do conhecimento, ou seja, a escolha da representação não deve se basear somente na conveniência da notação ou implementação.

• Mínimo compromisso ontológico: uma ontologia deve necessitar de um compromisso ontológico apenas o suficiente para permitir que as atividades

(32)

de compartilhamento do conhecimento esperadas aconteçam.

Existem diverso tipos de ontologias, que de acordo com seu grau de genericidade, podem ser classificadas como (Gomes-Perez, 1999):

• Ontologias de representação: definem as primitivas de representação – frames, axiomas, atributos e outros – de forma declarativa;

• Ontologias Gerais: trazem definições abstratas necessárias para a compreensão de aspectos do mundo, como tempo, processos, papéis, espaço, seres, coisas, etc;

• Ontologias Centrais ou Genéricas: definem os ramos de estudos de uma área e/ou conceitos mais genéricos e abstratos desta área. Por exemplo, regras básicas do direito;

• Ontologias de Domínio: tratam de um domínio mais específico de uma área genérica de conhecimento, como direito tributário, microbiologia, etc;

• Ontologias de Aplicação: procuram solucionar um problema específico de um domínio, como identificar doenças do coração, a partir de uma ontologia de domínio de cardiologia.

Ainda de acordo com Gómez-Perez (1999), existe ainda outra classificação para ontologias, aplicáveis apenas para as duas últimas citadas acima. São elas:

• Ontologias de tarefas: descrevem tarefas de um domínio – como processos, planos, metas, escalonamentos, etc – com uma visão mais funcional, embora declarativa, de um domínio;

• Ontologias de domínio: tem uma visão mais epistemológica do domínio, focando nos conceitos e objetos do universo discurso.

Ontologias são muito importantes na Web Semântica. Segundo Berners-Lee et al. (2001) e citado em Jorge (2005), as ontologias típicas para a Web têm uma taxonomia e um conjunto de regras de inferência. A taxonomia define classes de objetos e relações entre eles. Pode-se expressar um grande número de relações entre entidades assinalando propriedades para as classes e permitindo que subclasses herdem suas propriedades. Regras de inferência fornecem poder adicional às ontologias.

(33)

Os portais podem se favorecer do uso de ferramentas baseadas em ontologias e da marcação semântica das páginas da Web de várias maneiras. Berners-Lee et al. (2001), citado em Jorge (2005), afirma que as ontologias podem aumentar a funcionalidade da Web das seguintes formas:

• Podem ser usadas de uma maneira simples para melhorar a eficácia de pesquisas na Web. O programa pesquisador olha hoje apenas para as páginas que contêm o termo preciso, ao invés de olhar para todas aquelas que usam termos equivalentes;

• Páginas podem ser direcionadas para outras páginas, cuja ontologia define como informações relacionadas. As informações são processadas e podem ser usadas para responder questões que normalmente exigiriam intervenção de um humano

• Adicionalmente, as marcações com significados específicos tornam mais fácil o desenvolvimento de programas de software que podem responder a questões complexas cujas soluções não residem em uma página Web simples.

(34)

5. PROTÉGÉ

Para o desenvolvimento da Ontologia foi utilizada uma das ferramentas disponíveis para edição de ontologias, o Protégé versão 3.1.1. Ela foi escolhida por possuir uma interface simples, o que permitiu que o desenvolvimento da ontologia não fosse uma tarefa muito complexa e por ter atendido as necessidades para a conclusão do trabalho. O desenvolvimento de uma ontologia no Protégé consiste basicamente nos seguintes passos: primeiramente é definido um esquema com as classes (class), subclasses (subclass), propriedades e relações (slots) referentes ao domínio que se deseja modelar, neste caso do domínio das Redes Sociais.

De acordo com Semprebom (2007), O Protégé é uma ferramenta que permite construir ontologias de domínio, personalizar formulários de entrada de dados, inserir e editar dados, possibilitando então, a criação de bases de conhecimento guiadas por uma ontologia. Sua interface gráfica provê acesso a barra de menus e barra de ferramentas, alem de apresentar cinco áreas de visualização (views) que funcionam como módulos de navegação e edição de classes, atributos, formulários, instâncias e pesquisas na base de conhecimento, propiciando a entrada de dados e a recuperação das informações.

De acordo com Gómez-Perez (1999), Protégé possui as seguintes características:

A linguagem axiomática PAL (Protégé AxiomaticLanguage)

• A geração de arquivos de saída alteráveis. Atualmente podem ser criados classes e instâncias em CLIPS - a base de conhecimento é gerada nativamente para esse motor de inferência

• Uma excelente interface para entrada de conhecimento, incluindo um gerador automático de formulários para as classes definidas, admitindo ainda a reposição da interface original por componentes mais adequados à aplicações específicas. Esta interface facilita sobremaneira o gerenciamento de conhecimento de uma ou mais ontologias.

Sua interface gráfica, como exibida na figura 5.1, provê acesso à barra de menus e barra de ferramentas, além de apresentar cinco áreas de visualização (views) que funcionam como módulos de navegação e edição de classes, atributos, formulários, instâncias e pesquisas na base de conhecimento, propiciando a entrada de dados e a

(35)

recuperação das informações (Gómez-Perez, 1999). . Esta interface permite que especialistas sobre um determinado domínio, modelem sua área de conhecimento de uma maneira fácil e natural.

FIGURA 5.1 - Interface Software Protégé versão 3.1.1

De acordo com Wikipedia (2008), a plataforma Protégé possui duas principais formas de modelagem de Ontologias:

• O editor de Frames do Protégé. Permite ao usuário construir e preencher ontologias que são baseadas em frames de acordo com o protocolo OKBC (Open Knowledge Base Connectivity). Neste modelo, uma ontologia consiste em um conjunto de classes organizadas em uma classificação hierárquica para representar os conceitos importantes de um domínio, um conjunto de slots associados com as classes para descrever suas propriedades e relacionamentos, e um conjunto de instâncias destas classes - exemplares individuais dos conceitos que contém valores específicos para as suas propriedades.

(36)

• O editor OWL do Protégé. Permite aos usuários construir ontologias para a Web Semântica, em especial utilizando a linguagem OWL especificada pela W3C. Uma ontologia desenvolvida em OWL pode incluir descrições de classes, propriedades e suas instâncias. Dada uma determinada ontologia, a semântica formal da OWL especifica como derivar suas conseqüências lógicas, isto é, fatos que não estão explicitamente presente na ontologia, mas conferida pela semântica.

(37)

6. ONTOLOGIA DO DOMÍNIO DAS REDES SOCIAIS

O objetivo desta pesquisa é construir uma ontologia do domínio das Redes Sociais, utilizando o ambiente Protege Beta 3.1.1. Através da análise do domínio foi possível identificar os termos importantes e relevantes para o contexto. Um exemplo disso são os conceitos e propriedades que, antes de serem representados formalmente, devem ser identificados e especificados de maneira informal.

O principal desafio consiste modelar este domínio de uma forma que possa permitir facilmente o desenvolvimento de aplicações futuras para ele com a tecnologia e as ferramentas da Web Semântica. A ontologia poderá ser utilizada em várias aplicações, como por exemplo, na construção de bases de dados tecnológicas.

Para atingir os objetivos descritos acima, as seguintes atividades foram realizadas: Revisão bibliográfica sobre Web Semântica, Redes Sociais e ontologias; Estudo e criação de uma ontologia do domínio das Redes Sociais, descrevendo conceitos e como se relacionam entre si.

A seguir apresenta-se o nível mais alto da ontologia e os principais relacionamentos binários, assim como uma breve descrição de cada conceito. Todos os conceitos utilizados na ontologia, assim como as suas respectivas descrições se encontram no Anexo A do trabalho.

Na criação da Ontologia, tudo na Web foi considerado como recurso. Então, Resource é o nível mais alto da Ontologia. Na fase inicial do trabalho, foi decidido que todos os conceitos dentro da ontologia seriam considerados como recursos. Tais recursos possibilitam e disponibilizam todos os serviços na Web. Dentro deste nível estão os demais conceitos.

Agent diz respeito a quem utiliza a Web, seja usuário ou máquina (na forma de um programa ou aplicação). Os dois tipos de usuários – person e

machine – são considerados agentes, sem os quais a Web 2.0 e as Redes

Sociais não podem existir.

o Person refere-se a um usuário da Web. Os usuários em sistemas de informação são agentes externos ao sistema que usufruem da tecnologia para realizar determinado trabalho. Podem ser desde os usuários comuns do sistema até administradores,

(38)

programadores ou analistas de sistemas.

o Machine - uma máquina é todo o dispositivo mecânico ou orgânico que executa ou ajuda no desempenho das tarefas, precisando para isto de uma fonte de energia. No caso da ontologia, a principal máquina seria o computador. Denomina-se computador uma máquina capaz de variados tipos de tratamento automático de informações ou processamento de dados.

API (Interface de Programação de Aplicativos), é um conjunto de rotinas e padrões estabelecidos por um software para a utilização das suas funcionalidades por programas aplicativos, isto é, programas que não querem envolver-se em detalhes da implementação do software, mas apenas usar seus serviços. Após uma extensiva pesquisa na Web, a lista de API foi feita de acordo com a lista do site Technology Magazine (http://techmagazine.ws/full-web-20-api-list/ ).

Service são os serviços oferecido na Web. Web service é uma solução utilizada na integração de sistemas e na comunicação entre aplicações diferentes. Com esta tecnologia é possível que novas aplicações possam interagir com aquelas que já existem e que sistemas desenvolvidos em plataformas diferentes sejam compatíveis. A escolha do serviços mostrados na ontologia foi feita após extensiva pesquisa na Web. Os termos e conceitos foram retirados do site All Things Web 2.0 (http://www.allthingsweb2.com/), que possui uma grande e atualizada lista de serviços disponíveis na Web 2.0. Todas as listagens, classificações, comentários, e comparações são feitos pelos usuários finais, desenvolvedores, investidores e empresários. Possui uma lista de sites com as principais aplicações, softwares, código-aberto, sites Web, produtos e serviços sobre cada um dos conceitos listados.

Artifact consiste em qualquer objeto concreto utilizado na Web (texto, vídeo, etc). Todas as classes da ontologia utilizam este conceito

o Photo: por definição, fotografia é, essencialmente, a técnica de

(39)

em uma superfície sensível. Designa-se por fotografia digital (utilizada na Web) a fotografia tirada com uma câmera digital ou determinados modelos de telefone celular, resultando num arquivo de computador que pode ser editado, impresso, enviado por e-mail ou armazenado em websites ou CD-ROMs, DVD’s, Pendrives, etc.

o Video: o vídeo é uma a tecnologia de processamento de sinais eletrônicos analógicos ou digitais para capturar, armazenar, transmitir ou apresentar imagens em movimento. O Vídeo Digital (em inglês, Digital Video ou DV) é um formato de vídeo digital que permite a gravação em fitas magnéticas.

o Sound: o som é a propagação de uma frente de compressão

mecânica ou onda longitudinal; esta onda se propaga de forma circuncêntrica, apenas em meios materiais - que têm massa e elasticidade, como os sólidos, líquidos ou gasosos, quer dizer, não se propaga no vácuo. O som digital ou áudio digital é a codificação digital de um sinal elétrico que representa uma onda sonora. A gravação de som digital utiliza formatos digitais (binários) para arquivar e editar os sons. O som digital pode, por exemplo, ser captado com um gravador digital ou com um microfone acoplado à placa de som de um computador.

o Text: em lingüística, a noção de texto é ampla e ainda aberta a

uma definição mais precisa. Grosso modo, pode ser entendido como manifestação lingüística das idéias de um autor, que serão interpretadas pelo leitor de acordo com seus conhecimentos lingüísticos e culturais. Seu tamanho é variável.

Network: uma rede de computadores consiste de 2 ou mais computadores e outros dispositivos conectados entre si de modo a poderem compartilhar seus serviços, que podem ser: dados, impressoras, mensagens (e-mails), etc. Diz respeito às Redes Sociais (na forma de Comunidades Virtuais) e às Redes Físicas;

(40)

o Social: Rede Social é uma das formas de representação dos relacionamentos afetivos ou profissionais dos seres humanos entre si ou entre seus agrupamentos de interesses mútuos. A rede é responsável pelo compartilhamento de idéias entre pessoas que possuem interesses e objetivo em comum e também valores a serem compartilhados. Assim, um grupo de discussão é composto por indivíduos que possuem identidades semelhantes. Essas redes sociais estão hoje instaladas principalmente na Internet devido ao fato desta possibilitar uma aceleração e ampla maneira das idéias serem divulgadas e da absorção de novos elementos em busca de algo em comum.

o Physical: uma rede de computadores consiste de 2 ou mais

computadores e outros dispositivos conectados entre si de modo a poderem compartilhar seus serviços, que podem ser: dados, impressoras, mensagens (e-mails), etc. A Internet é um amplo sistema de comunicação que conecta muitas redes de computadores. Existem várias formas e recursos de vários equipamentos que podem ser interligados e compartilhados, mediante meios de acesso, protocolos e requisitos de segurança.

Technology é um termo que envolve o conhecimento técnico e científico e as ferramentas, processos e materiais criados e/ou utilizados a partir de tal conhecimento. Diz respeito às técnicas, conhecimentos, métodos, materiais, ferramentas, e processos usados para resolver problemas ou ao menos facilitar a solução dos mesmos na Web. Descreve as tecnologias necessárias para criar e gerenciar os sites na Web. O conhecimento de tais tecnologias é fundamental para as tarefas citadas.

o HTML (HyperText Markup Language) significa Linguagem de

Marcação de Hipertexto é uma linguagem de marcação utilizada

para produzir páginas na Web. Documentos HTML podem ser interpretados por navegadores.

o XML (eXtensible Markup Language) é uma recomendação da W3C para gerar linguagens de marcação para necessidades

(41)

especiais. É um subtipo de SGML capaz de descrever diversos tipos de dados. Seu propósito principal é a facilidade de compartilhamento de informações através da Internet.

o Browser Scripting: linguagens de script são linguagens de

programação executadas do interior de programas e/ou de outras linguagens de programação. As linguagens de script servem para estender a funcionalidade de um programa e/ou controlá-lo.

Client-side scripting geralmente refere-se à classe de programas

de computador na Web que são executados do lado do cliente, ao invés de serem executados do lado do servidor (no servidor Web).

o Server Scripting: linguagens de script são linguagens de

programação executadas do interior de programas e/ou de outras linguagens de programação. As linguagens de script servem para estender a funcionalidade de um programa e/ou controlá-lo. Server-side scripting é uma tecnologia de servidor Web em que um pedido do usuário é atendido pela execução de um script diretamente no servidor Web para gerar páginas HTML dinâmicamente.

o .NET: é um Domínio de topo genérico (gTLD) usado nos DNS's da Internet. O gTLD.net é administrado atualmente pela VeriSign.

o Multimedia: é a combinação, controlada por computador, de pelo

menos um tipo de mídia estática (texto, fotografia, gráfico), com pelo menos um tipo de media dinâmica (vídeo, áudio, animação).

o Browsers: o Navegador, também conhecido como Web browser

ou simplesmente browser, é um programa que habilita seus usuários a interagirem com documentos virtuais, também conhecidos como páginas HTML, que estão hospedadas num servidor Web.

Para relacionar estes conceitos, foram criados três tipos de relacionamentos binários, sendo que na hierarquia de relacionamentos, Supports é o mais importante, seguido de Relevant_to e Relates_to, respectivamente.

Referências

Documentos relacionados

1.HISTÓRIA ASSISTENCIAL DA PSIQUIATRIA PORTUGUESA – UM PERCURSO EM INSTITUIÇÕES REVISÃO HISTÓRICA DO PRIMEIRO SÉCULO — António Alho; Núria Santos;

Não administrar a gatos tratados com inibidores da monoaminoxidase (IMAO) ou tratados com um IMAO nos 14 dias anteriores ao tratamento com o medicamento veterinário, uma vez que

Sendo: N o , número de sementes por tratamento; G, armazenamento em geladeira; F, armazenamento em freezer; G%, porcentagem de germinação; IVG, índice de velocidade de germinação;

Sendo que o primeiro se refere à possibilidade de formular perguntas ás testemunhas, ao ofendido, ao perito, informantes ao próprio investigado, já o segundo trata-se da

O estudo permite, assim, apontar que: (i) o paradigma verbal em Jurussaca apresenta variação em relação ao pvb falado em outras regiões do Brasil; (ii) no tocante às

XIX.. As pessoas que pretenderem fazer remessas de dinheiro, para serem Convertidas em vales de Portugal, deverão preen- cher e apresentar um boletim de deposito em que designem

Kit de Protecção de Pintura ­ Brilhante (A9930381) PVP 60,45 €