• Nenhum resultado encontrado

Web Semântica

N/A
N/A
Protected

Academic year: 2022

Share "Web Semântica"

Copied!
76
0
0

Texto

(1)

Web Semântica

Ademir Ferreira

Augusto Lazzarotto Eduardo Melo

Natacha Targino

(2)

Roteiro

Histórico

Web Semântica

Arquitetura

Tecnologias da Web Semântica oURI / IRI

oXML oRDF

oSPARQL oOWL

Web Semântica e RI

Conclusão

(3)

Histórico

O homem em busca de reunir todo o conhecimento da humanidade:

Biblioteca de Alexandria (princípios do século III a.C.);

Mundaneum (1920);

Memex (1939);

Xanadu (1960);

• Internet

.

(4)

Histórico - Internet

• 1969 - Advanced Research Project Agency Network (ARPANET)

• 1980 – Protocolo TCP/IP

• 1985 – NSFNet

• 1989 – WWW (Tim Berners-Lee)

• 1994 – W3C (World Wide Web Consortium)

(5)

Capa da proposta original da World Wide Web (Gillies e Cailliau, 2000)

(6)

Histórico - Internet

• Modelada em padrões abertos

• “Espírito Comunitário” difundida na área acadêmica

• Modelos de padrões abertos:

oHypertext Transfer Protocol (HTTP) – Tim Berners-Lee, 1990 oUniform Resource Identifier (URI)

(7)

Histórico - Internet

• Junto ao WWW surgiu o HTML

oPrioriza modo de apresentação do conteúdo oInicialmente utilizando padrão ASCII

o HTML 5 utiliza non-ASCII

oLimitada em “tags” pré-determinadas oSem semântica

oEngenhos de busca recuperam grande volume de dados

(8)

Web Semântica

“A Web Semântica é uma extensão da Web atual, onde a informação possui um significado claro e bem definido, possibilitando uma melhor interação entre computadores e pessoas”.

(Berners-Lee et al., 2001)

(9)

Web Semântica

• Avanço exponencial na quantidade de informação disponível;

• Modelos clássicos de organização e recuperação de informações precisam ser (re)pensados;

• Desenvolvimento de meios de organização de conjuntos específicos de informação e instrumentos de representação da informação.

(10)
(11)

Web Semântica

• Web Semântica é uma tentativa inversa de solução para a Web;

• Princípio de que “tudo” pode ser identificado por um URI (Koivunen e Miller, 2001);

• Definição de conceitos úteis em links para o entendimento das máquinas;

(12)

Estruturação de recursos e links na web atual

(Miller, 2004)

Recurso Recurso

Recurso

Recurso Recurso

Recurso

Recurso Recurso Recurso

Recurso

linksTo

linksTo

linksTo

linksTo

linksTo

linksTo

linksTo linksTo linksTo

linksTo

(13)

Estruturação de recursos e links na Web Semântica

(Miller, 2004)

Documento Biblioteca 1 Imagem Biblioteca 2 Software

Documento

Tópico Tópico Pessoa

Lugar hasManual

requires

requires

isBasedOn inPartOf

subject

subject

hasAuthor

livesAt subject

(14)

Web Semântica

Ponto de sustentação mais forte é a utilização de ontologias;

Necessário padronizar a forma que a informação é manipulada pelos diversos softwares disponíveis na Web;

Composta por tecnologias inter-relacionadas;

Padronização Integral;

W3C propôs uma estrutura idealmente escalonável;

(15)

Arquitetura Web Semântica (W3C, 2013)

Arquitetura

(16)

Unifying Logic

• Interface lógica única para Web Semântica;

• Engloba RDF, RDFS, OWL, SPARQL e RIF;

• Possibilita agentes computacionais realizarem inferências automáticas;

• Pode inferir novas informações;

(17)

Proof

• Verificação/comprovação da coerência lógica dos recursos;

• Aspectos semânticos das informações descritos de forma adequada;

• Fornece um mecanismo seguro para que humanos possam verificar como um agente de software chegou a uma certa conclusão.

(18)

Trust e Crypto

• Certificar e verificar se as declarações provenientes da WS sejam confiáveis;

• Utiliza assinatura digital;

• Garantir que as informações estejam representadas de modo correto;

(19)

URI/IRI

• Uniform Resource Identifier / Internacionalized Resource Identifier

“Padrão conjunto que abarca os conceitos de Uniform Resource Locator (URL) e do Uniform Resource Name (URN), de forma que, pode ser representado por qualquer um destes, ou por ambos”

(Tim Berners-Lee et al, 1994) (Fielding, 1995)

(20)

URI/IRI

• Representa recursos de forma única, sem ambiguidade;

• Pode ser considerado na forma mais popular como URL;

• Basicamente formado por três partes:

oProtocolo

oRepresentação do Recurso (Indicando o Servidor) oNome do Recurso

(21)

150.161.2.9

Partes que constituem uma URL

http://www.cin.ufpe.br/~in1152/2016/cronograma-2016.xlsx

Localização do Recurso (Indicando o Servidor)

Protocolo Nome do Recurso

URI/IRI

(22)

XML

• Extensible Markup Language oLinguagem de marcadores

oExtensível: permite definição de novos marcadores.

• Padrão XML

oRepresentação de dados oTroca de informações

(23)

XML

• HTML x XML

HTML

Utiliza tags padrão fixas

Formatação e exibição das informações

XML

Permite criar tags personalizadas

Descrição e armazenamento de informações

Regras de formatação mais rígidas.

(24)

XML

• Validação de documentos

oDTD – Document Type Definition oXML Schema

(25)

XML

• DTD – Document Type Definition

DTD

Documento XML

Parser

Documento XML válido

Documento XML inválido

(26)

XML

• Exemplo de documento XML

<?xml version="1.0"?>

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forget me this weekend!</body>

</note>

(27)

XML

• Exemplo de DTD

<!ELEMENT note (to, from, heading, body)>

<!ELEMENT to (#PCDATA)>

<!ELEMENT from (#PCDATA)>

<!ELEMENT heading (#PCDATA)>

<!ELEMENT body (#PCDATA)>

(28)

XML

XML Schema

Uso de namespaces

o Distinção de nomes utilizados em documentos XML.

o Evitar colisão de nomes e ambiguidades

Associa-se um namespace a uma URI e desta forma, ainda que um nome apareça em mais de um espaço ele deve ser único no seu namespace.

É escrito em XML (extensível)

Suporta tipos de dados

(29)

XML

• Exemplo de XML Schema

<?xml version="1.0"?>

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

targetNamespace="http://www.w3schools.com"

xmlns="http://www.w3schools.com"

elementFormDefault="qualified">

<xs:element name="note">

<xs:complexType>

<xs:sequence>

<xs:element name="to" type="xs:string"/>

<xs:element name="from" type="xs:string"/>

<xs:element name="heading" type="xs:string"/>

<xs:element name="body" type="xs:string"/>

</xs:sequence>

</xs:complexType>

</xs:element>

</xs:schema>

(30)

XML

• Referência para DTD

<?xml version="1.0"?>

<!DOCTYPE note SYSTEM

"http://www.w3schools.com/xml/note.dtd">

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forget me this weekend!</body>

</note>

(31)

XML

• Referência para XML Schema

<?xml version="1.0"?>

<note

xmlns="http://www.w3schools.com"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.w3schools.com note.xsd">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forget me this weekend!</body>

</note>

(32)

XML

• Classes de documentos

oBem formado: de acordo com o padrão XML.

oVálido: documento bem formado que está de acordo com a DTD ou XML Schema.

(33)

XML

• Vantagens

oPadrão aberto oReuso

oDocumentos são auto-descritíveis

oSintaxe para outras linguagens de marcação

(34)

RDF

• Camada conceitual que associado com a XML torna-se possível a

implementação da web semântica, através dela é possível representar e compartilhar dados semânticos.

• A web semântica pode ser vista como uma arquitetura de três níveis.

(35)

RDF

Camada de Dados

Modelo Básico da RDF

o Recurso – Propriedade – Recurso(Valor) ou;

o Sujeito – Predicado – Objeto

Usa sintaxe XML

(36)

RDF

Camada de Dados RDF

Recurso

o Objeto do qual se pode dizer algo

Autores, livros, editoras, pessoas, etc.

o Possui URI único

Propriedade

o Relacionamento entre os recursos

Escrito por, idade, quantidade de páginas, nome, título, etc.

(37)

Camada de Dados RDF

Valor

oRecurso ou dado que se relaciona ao recurso

Representação em Triplas o(Livro, Escrito por, Autor)

Representação em Grafos

RDF

(38)

RDF

Exemplo

(39)

RDF

Camada de Dados RDF Schema

• É usado para definir a semântica do domínio de conhecimento e permitir a criação de uma hierarquia de classes e

propriedades

(40)

RDF

(41)

RDF

(42)

RDF

(43)

RDF

(44)

Modelagem dos recursos da RDF e RDF SCHEMA

RDF

(45)

SPARQL

SparQL (SPARQL Protocol and RDF Query Language)

o XML e RDF não são suficientes para tornar toda a Web entendível por um computador;

o SPARQL surge em 2008 devido à necessidade de extrair as informações a partir das triplas RDF;

o Consultar arquivos RDF através de uma linguagem parecida com SQL;

o Realizar uniões complexas de datasets diferentes em uma única e simples consulta.

(46)

SPARQL

Principais Cláusulas:

o SELECT, FROM, WHERE, PREFIX, FILTER, ORDER BY, UNION, BASE, LIMIT, OFFSET, OPTIONAL, UNBOUND

Algumas consultas:

o SELECT ?voo WHERE{ ?voo rdf:type :Voo}

o SELECT ?passagem ?preco WHERE{ ?passagem rdf:type :Passagem.

?passagem :preco ?preco} ORDER BY ?preco

(47)

SPARQL

DBPedia

o Versão em RDF da informação do Wikipedia o Contém quase 2 bilhões de triplas RDF

o http://dbpedia.org/sparql

Mais consultas:

o SELECT DISTINCT ?concept WHERE {?s rdf:type ?concept . } LIMIT 50

(48)

SPARQL

Exemplo de Consulta

Selecione todos os países sem litoral com uma população maior que 15 milhões

(49)

SPARQL

Exemplo de Consulta

Diferentes traduções para o mesmo país. Especificando uma linguagem:

(50)

“Ontologias são modelos conceituais que capturam e explicitam o vocabulário utilizado nas aplicações semânticas, servem como base para garantir uma comunicação livre de ambiguidades. “ (Breitman, 2005)

“Ontologias fornecerão o vocabulário necessário para a comunicação entre os agentes e as páginas da web, definindo as relações entre os conceitos.”

(Dziekaniank e Kirinus, 2004)

Ontologias

(51)

Representação do conhecimento

Expressividade Semântica

Compartilhamento de Conhecimento

Integração de Dados

Mesma palavra e significados diferentes o Usar diferentes URIs

Ontologias

(52)

• Usos

oRecuperação de Informação na Internet oProcessamento de Linguagem Natural oGestão do Conhecimento

oWeb Semântica

• Benefícios

oComunicação oFormalização

oRepresentação de Conhecimento e Reutilização

Ontologias

(53)

Ontologias

(54)

Ontologias

Limitações

Ontologias são difíceis de criar, implementar e manter;

É difícil inferir conhecimentos que envolvam associações entre várias propriedades;

Podem ser enormes, com muitos conceitos e relações.

(55)

OWL = Web Ontology Language

“A linguagem OWL foi projetada para aplicações que necessitam processar o conteúdo da informação em vez de apenas apresentar informações em nós. “ (Smith et al., 2004)

OWL

(56)

Desenvolvida pelo Web Ontology Working Group do W3C;

Permite a criação de Ontologias complexas;

Fundamental para garantir a interoperabilidade semântica na Web;

Baseada em XML e RDF, oferecendo mecanismos para uma semântica formal.

Descreve classes, propriedades, relacionamentos;

Permite definir restrições de cardinalidade;

Possui operadores de União, Interseção e Complementação

OWL

(57)

OWL

O W3C estabelece na OWL três diferentes sub-linguagens:

OWL Full

o Possibilita o máximo de expressividade;

o Podem ser violadas restrições da Lógica Descritiva com o objetivo de ser compatível com o maior número possível de bancos de dados e sistemas de representação do conhecimento.

(58)

OWL

OWL DL (Description Logic)

o Suporta implementações baseadas em Lógica Descritiva;

o Fornece um subconjunto que possui propriedades desejáveis em sistemas que necessitem ontologias com um maior nível de detalhamento e restrições.

OWL Lite

o Permite uma fácil implementação;

o Fornece aos usuários um subconjunto funcional baseado em classificações hierárquicas e restrições simples;

o Possibilita a migração de sistemas baseados em tesauros e taxonomias para o formato de ontologias.

(59)

OWL

Estrutura do Documento OWL

De acordo com o W3C, pode-se dividir a estrutura de um documento OWL baseando-se nos seguintes elementos básicos:

Namespaces;

Cabeçalhos;

Classes;

Indivíduos;

Propriedades;

Restrições.

(60)

OWL

Estrutura do Documento OWL

Namespaces

Permite identificar sem ambiguidades a localização dos vocabulários correspondentes ao conjunto de conceitos utilizados na ontologia.

(61)

OWL

Estrutura do Documento OWL

Cabeçalho

Utilizados para registrar comentários, controlar a versão da ontologia e a inclusão de conceitos e propriedades de outras ontologias.

(62)

OWL

Estrutura do Documento OWL

Classes e Subclasses

São abstrações que caracterizam o que se quer representar. Podem surgir a partir de união, interseção, complemento de outras classes. Assim como as subclasses permitem definir a hierarquia da taxonomia através de generalizações/especializações.

(63)

OWL

Estrutura do Documento OWL

Indivíduos

São as ocorrências de cada conceito.

Atributos

São características aplicáveis indivíduo. Podem ser simétricas, transitivas, etc.

(64)

OWL

Estrutura do Documento OWL

Restrições

Uma restrição é utilizada para definir limites para indivíduos pertencentes a uma determinada classe.

Podem ser divididas basicamente em três tipos:

Restrições que utilizam quantificadores;

Restrições de cardinalidade;

Restrições do tipo hasValue(“tem valor de”).

(65)

Web Semântica e RI

A Web Semântica é mais vista e estudada sob o aspecto de aperfeiçoar a recuperação da informação.

Possibilitando recuperação mais eficiente no contexto digital.

Permitindo que as buscas obtenham respostas mais relevantes ao interesse de seu usuário.

(66)

Web Semântica e RI

Ontoweb

• Fruto de um projeto de desenvolvimento científico(2001-2004);

• Utilizando engenharia de ontologias, semânticas e estruturas valorativas para contextualizar as buscas e refinar os resultados.

(67)

Web Semântica e RI

Globo.com

Foram criadas entidades semânticas, para o relacionamento das notícias com essas entidades.

Utiliza o Virtuoso (Base de Triplas), onde são salvas as relações.

(68)

Web Semântica e RI

GOOGLE KNOWLEDGE GRAPH

Esta proposta surgiu com a ideia de inserir semântica ao processo de busca realizado pela Google.

Desenvolvido a partir da necessidade dos buscadores irem além da busca por palavras chaves, ou textos, e conseguir realizar a busca por entidades;

O mapeamento utiliza base de dados de informações abertos da Web, como: Wikidata, Wikipedia e CIA World Factbook.

(69)

Web Semântica e RI

GOOGLE KNOWLEDGE GRAPH

Melhora a busca de três modos:

Sem ambiguidade de resultados;

Obtenção do melhor resumo do tema e;

O usuário pode adquirir novos conhecimentos, indo além da pesquisa inicial.

(70)

Web Semântica e RI

GOOGLE KNOWLEDGE GRAPH

(71)

Web Semântica e RI

Limitações

Não se mostrou possível o desenvolvimento de ontologias tão avançadas que pudessem dar conta de todos os campos do conhecimento existentes;

Até o momento a implementação efetiva da Web Semântica só se mostrou possível em domínios restritos ou específicos.

(72)

Conclusão

Web Semântica

Estruturação de conteúdo solto na web

Componentes em desenvolvimento

Obstáculos

o Adoção de novas tecnologias o Descentralização

(73)

Referências

1. GILLIES, J.; CAILLIAU, R. How The Web was Born. New York: Oxford University Press, 2000.

2. BERNERS-LEE, T. Information Management: a proposal. CERN, Genebra, mar. 1989. Disponível em: <http://www.w3.org/History/1989/proposal.html>. Acesso em: 16 out. 2016.

3. BOSAK, J. XML, Java, and the future of the Web. 1997. Disponível em:

<http://www.ibiblio.org/pub/sun-info/standards/xml/why/xmlapps.htm>. Acesso em: 16 out.

2016.

4. W3C. Semantic Web. https://www.w3.org/standards/semanticweb/. Acesso em: 16 out. 2016.

BERNERS-LEE, T. Semantic Web - XML2000. 2000. Disponível em:

<https://www.w3.org/2000/Talks/1206-xml2k-tbl>. Acesso em: 16 out. 2016.

5. MILLER, E. The semantic Web. 2004. Disponível em: <https://www.w3.org/2004/Talks/0120- semweb-umich/Overview.html>. Acesso em: 16 out. 2016.

(74)

Referências

6. Silva, R.; Santos, P.; Ferneda, E. 2013 MODELOS DE RECUPERAÇÃO DE INFORMAÇÃO E WEB

SEMÂNTICA: A QUESTÃO DA RELEVÂNCIA. Disponível em:

<http://www.uel.br/revistas/uel/index.php/informacao/article/viewFile/12822/pdf_3>.

Acesso em: 15 de outubro de 2016.

7. Santarem, J.; Souza, J.; Coneglian, C. 2015. WEB SEMANTICA: INTRODUÇÃO A RECURSOS DE VISUALIZAÇÃO DE DADOS EM FORMATO GRÁFICO. Disponível em:

<http://www.ufpb.br/evento/lti/ocs/index.php/enancib2015/enancib2015/paper/viewFile/27 80/1174>. Acesso em: 15 de outubro de 2016.

8. Dissertação de Mestrado. Rogério Aparecido Sá Ramalho. 2006. Web Semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da Ciência da Informação.

Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP, Campus de Marília.

Disponível em: <https://www.marilia.unesp.br/Home/Pos-

Graduacao/CienciadaInformacao/Dissertacoes/ramalho_ras_me_mar.pdf>. Acesso em: 15 de outubro de 2016.

(75)

Referências

9. Silva, G.; Lima, T. 2001. RDF e RDFS na Infraestrutura de Suporte à Web Semântica. Disponível em: <http://www2.ic.uff.br/~gsilva/slreic.pdf>. Acesso em: 14 de outubro de 2016.

10. Slide Web Semântica. Carlos Eduardo Martins Barbosa. 2013 - UFPE

11. Slide Web Semântica. Daniel Costa, Gustavo Oliveira, Leandro Aguiar, Winícius Santos.

12. Pickler, M. 2007. WEB SEMANTICA: Ontologias como ferramentas de representação do

conhecimento Disponível em: <http://knowtec.com/wp-

content/uploads/2014/06/websemantica_artigo.pdf>. Acesso em: 15 de outubro de 2016.

13. W3C Schools . XML. Disponível em: <http://www.w3schools.com/xml/> Acesso em: 16 de outubro de 2016.

(76)

Dúvidas

Referências

Outline

Documentos relacionados

O corpo docente do MBA em Marketing, assim como dos outros cursos do MBA USP/Esalq, é composto por professores da Universidade de São Paulo (USP), profissionais de

Dessa forma, o objetivo do presente estudo foi desen- volver um modelo biomecânico composto por per- na, retropé e antepé para avaliação do deslocamento angular dos segmentos do

Foi somente depois desse momento que os sites de relacionamentos – inclusive o microblog 8 Twitter, objeto principal dessa pesquisa - ganharam força no ambiente

A literatura assevera que estratégias edu- cativas voltadas para o ensino dos diagnós- ticos de enfermagem têm sido desenvolvidas com vistas a melhorar o estabelecimento do raciocínio

Este trabalho compara dois métodos de pós-processamento estatístico, Model Output Statistics (MOS) e Model Output Calibration (MOC), com o modelo numérico de previsão do tempo (BRAMS)

O presente estudo buscou identificar o padrão de consumo de drogas, para distinguir as diferentes necessidades de intervenção breve num grupo de homens usuários de um

Rama, modelo de ação e virtude: Rama é mais um dos avateres de Vishnu, sendo considerado o deus da verdade e da virtude.. Diferente de outros deuses hindus, acredita-se que Rama

Ainda que o termo ontologia tenha se referido a conceitos e processo diferenciados ao longo da história do pensamento humano, três conclusões são possíveis