• Nenhum resultado encontrado

Maria Luiza de A. Campos Pré ConfOA

N/A
N/A
Protected

Academic year: 2021

Share "Maria Luiza de A. Campos Pré ConfOA"

Copied!
47
0
0

Texto

(1)

Interoperabilidade Semântica e

Compatibilização de Linguagens em

ambientes heterogêneos: a questão do

acesso aberto e as possibilidades de

tratamento terminológico

Profa. Dra Maria Luiza de Almeida Campos

Universidade Federal Fluminense

Departamento de Ciência da Informação

Programa de Pós-Graduação em Ciência da Informação

Grupo de Pesquisa - Estudos ônticos e ontológicos em contextos

informacionais: representação, recuperação e métricas

(2)

A Ciência Aberta e o

TratamentoTerminológico

O tema Ciência Aberta vem alterando, não só conceitos, mas

também o modus operandi das instituições de pesquisa científica

em todo o mundo, principalmente, nas universidades,

institutos de pesquisa e laboratórios.

Oriunda do movimento de Acesso Aberto ao Conhecimento,

a Ciência Aberta vem, aos poucos implantando mudanças

expressivas principalmente relacionadas à organização,

recuperação e acesso às informações e dados científicos.

Neste sentido, uma questão que se apresenta está relacionada

a integração entre esses diversos dados através de uma

terminologia consistente para obtenção de uma recuperação

precisa em Ambientes Heterogêneos.

(3)

Ambientes Heterogênicos e os

Produtos Informacionais

Tipos de dados podem incluir, por exemplo,

números, imagens, textos, vídeos, áudio,

software, algoritmos, equações,

animações, modelos, simulações.

(4)

No Espaço da Ciência

Exemplos específicos: sequência genômica, exemplar de

uma planta, dados atmosféricos

(5)

A questão da Heterogeneidade

Um problema de difícil tratamento e de recuperação

devido a diversidade de fontes de informação e formas

de tratamento

Essas fontes possuem diferenças de natureza sintática,

semântica e estruturais entre os sistemas

Envolve interoperabilidade e cooperação entre essas

múltiplas fontes de informação

(6)

A questão que se coloca

Como possibilitar o intercâmbio

desses dados e o compartilhamento

de informações e conhecimentos de

maneira que as informações

recebidas sejam processadas de

maneira significativa?

(7)

Interoperabilidade Semântica

• Capacidade dos sistemas de tecnologias de

informação e comunicação (TIC) para o

intercâmbio de dados e compartilhamento de

informações e conhecimentos de forma

significativa.

(8)

Objetivo

• Contribuir para a discussão no âmbito do acesso

aberto de algumas questões que envolvem a

interoperabilidade semântica em ambientes

heterogêneos

• Apresentar procedimentos teóricos e metodológicos

no âmbito da Ciência da Informação relacionados a

compatibilização de linguagens, visando

melhorias no tratamento e recuperação de

informação nesses ambientes

(9)

O Universo de Ciência e de Tecnologia nos Sistemas de Informação de Pesquisa (CRIS)

UM AMBIENTE HETEROGÊNIO

Organizações de

Pesquisa

Oportunidades de

Investimento

Projetos

Publicações

Patentes

Equipamento

Governos

Financiadores

Pesquisadores

Publicadores

Bibliotecas

Centros de

Dados

Instituições

de

Pesquisa

Indústria

Produtos

Dados de Pesquisa

Infraestrutura

Pesquisadores

Fonte: EUROCRIS.org

Maria Luiza de A. Campos – Pré ConfOA

(10)

Fonte: EUROCRIS.org

Uso

Racional de

Metadados

Descrição de

Dados de

Forma

Consistente

Uso de

Ontologias

Fontes de Dados

Heterôgeneos

podem ser

tratados através

de associações

semânticas

(11)

0

0

1

1

0

0

0

1

1

1

0

0

0

1

1

0

1

0

1

0

0

0

1

0

1

1

0

0

0

1

0

1

1

1

0

1

0

0

1

0

1

1

0

0

1

0

1

0

0

1

1

1

1

1

0

1

0

1

0

1

0

0

“Informação” não estruturada X estruturada

INFORMAÇÃO DESCONTEXTUALIZADA

INFORMAÇÃO CONTEXTUALIZADA

Buscar por “João

Brasil”???

Maria Luiza de A. Campos – Pré ConfOA

Fonte: material didático do prof. Carlos Henrique Marcondes (UFF)

Informações

precisam ser

contextualizadas

(12)

A questão fundamental é que

queremos possibilitar o acesso a

estas informações em um

espaço de uma Web que se quer

semântica

INFORMAÇÃO CONTEXTUALIZADA = SENTIDO APROPRIADO PARA

ATENDER A UM PROPÓSITO

(13)

Onde está a

Semântica?

Na Web Semântica

(14)

O Cavalo Canadense é um

herbívoro que come folhas de

Plátano

(15)

Vegetal

herbívoro

Árvore

Cavalo

come

É-um

É-um

Cavalo Canadense

É-um

Folha

É-parte-de

Plátano

É-um

A Semântica está no processo cognitivo de um indivíduo?

(16)

M

(17)

M

A Semântica na Web Semântica deve ser extraída dos dados contidos nas

informações e deverão ser transportados para um Modelo Formal.

(18)

ִ ! ִ" # $ " % % " $ " " $ % " & $ " " & # $ " ' ( ִ % % ) " % " $ " * % "

A linguagem natural para a

máquina pode ser definida

como um conjunto de

caracteres que não fazem

sentido.

É necessário que subjacente

a estes caracteres exista uma

linguagem formalizada

(19)

A Linguagem

Natural deve ser

“escrita” para a

máquina como um

modelo formal.

(20)

O MODELO DEVE SER TRANSFERIDO DA MENTE DO

INDIVÍDUO PARA A MÁQUINA ATRAVÉS DE UMA LINGUAGEM

FORMALIZADA QUE POSSA POSSIBILITAR INFERÊNCIAS

(21)

Web semântica

Ontologias

são fundamentais para a interoperabilidade

semântica – possuem uma linguagem formalizada

Uma ontologia é (definindo de forma bem simples) um vocabulário

consensual, compartilhado, de entendimento comum de um domínio.

Escrito através de uma especificação formal, que a máquina “entende”.

21

Maria Luiza de A. Campos – Pré ConfOA Fonte: material didático - Disciplina Representação da Informação / UFF

(22)

Ontologia do dinossauro

(23)

Trecho do código OWL da ontologia

23

Maria Luiza de A. Campos – Pré ConfOA Fonte: material didático - Disciplina Representação da Informação / UFF

(24)

Ligações comuns x nomeadas: exemplo

(25)

Buscas apoiadas por ontologias

leves/tesauros

NECESSIDADE DE CONTROLE TERMINOLÓGICO

25

Relações

nomeadas

(26)

A Web semântica: características

Uma Web de

dados descritos com metadados

Capaz de ser entendida por humanos e máquinas

simultaneamente

Informação estruturada e com

semântica bem definida

Permite a

realização de inferências

sobre o seu conteúdo

Oferece suporte a aplicações inteligentes e inovadoras

Agentes de software capazes de processar e entender os dados

Facilita a automação, integração e distribuição dos dados

(27)

Web semântica

Interoperabilidade Sintática

Formatos de dados e linguagens compatíveis

Interoperabilidade Semântica

É preciso ser capaz de concordar sobre o

“significado” de dados e operações sobre esses

dados

(28)
(29)

Eis a questão ...

Hoje em dia, os dados manipulados pelas instituições estão

dispersos nos mais variados recursos de informação, tais

como bases de dados e documentos de diferentes tipos.

Com isso, a integração da informação contida nessas

fontes é uma tarefa árdua.

Diferentes abordagens podem ser seguidas para

conseguir a integração, porém o desafio principal será

conquistar a interoperabilidade semântica entre as

fontes de informação, garantindo a manipulação do

conjunto sem forçar a conversão das partes em um

formato único.

(30)

Para atingir a interoperabilidade

semântica é necessário adotar

princípios de Compatibilização

(31)

Compatibilização

Ciência da Computação

Capacidade dos

computadores de vários

tipos de utilizar programas

escritos para outros sem

conversão para outras

linguagens de máquinas

Ciência da Informação

Medida de similaridade entre

duas linguagens, onde se

introduz o conceito de graus

de compatibilidade e

estabelecem a distribuição

entre compatibilidade no

plano semântico e no plano

linguístico.

(32)

Compatibilidade

de Linguagens de

Tratamento e

Recuperação de

Informações: o desafio do

profissional de

informação

(33)

Compatibilidade

Medida de similaridade entre duas

linguagens, onde se introduz o

conceito de graus de compatibilidade

e estabelecem a distribuição entre

compatibilidade no plano semântico e

no plano linguístico.

(34)

Compatibilidade pode ser definida, em

outras palavras, como...

a qualidade de um vocabulário de se

articular com outro de temática afim,

direta ou indiretamente , seja para definir

equivalências conceituais entre seus

termos, estabelecendo relações de

semelhança, seja para complementá-lo

em seu escopo, estabelecendo relações de

natureza lógica ou ontológica

(35)

Compatibilidade - motivação

Possibilidade de recuperar informação que pode

coexistir ou ser conectada de forma coerente entre

sistemas que utilizam esses vocabulários, permitindo

um intercâmbio de informações entre esses sistemas.

Para tanto cria-se Matriz de Compatibilização

Mapeamento das potencialidade semânticas

e linguísticas as Linguagens

Taxa de Coincidência Verbal

Grau de Compatibilidade Conceitual

(36)

Taxa de coincidência verbal

Analise da medida de similaridade

entre o símbolo linguístico e seu

conteúdo conceitual

Autor no Sistema A = Produtor

intelectual de um Documento

Autor no Sistema Y = O que

(37)

Grau de Compatibilidade

Conceitual

Compreende três fases:

Coincidência conceitual

Termos possuem a mesma forma verbal e todas as sua características são idênticas.

Termos são idênticos conceitualmente e possuem/ e não possuem o mesmo

termo genérico – problemas encontrados nas Ontologias da GO

Correspondência conceitual

Dois conceitos combinam a maior parte de suas características, sendo similares

São considerados quase sinônimos - problemas encontrados nas Ontologias da

GO

Correlação Conceitual

Dois conceitos são correlacionados através de símbolos matemáticos, por exemplo.

Indica que um conceito em uma linguagem equivale a uma combinação de

conceitos na outra linguagem

(38)

A Medida de Compatibilidade Conceitual

está diretamente relacionada com o

estudo das definições e das relações

conceituais

As características dos conceitos, são também

conceitos e estão expressas na definição conceitual e

nas relações

Estudo das definições conceituais

Estudo das relações

Método de Dalhberg – matriz de compatibilidade

conceitual- mapear as potencialidade semânticas

Compatibilização pressupõe o estudo das

definições e relações conceituais

(39)

Produto da compatibilização

Pode ser :

Um novo vocabulário, fruto da junção

de vocabulários compatíveis, ou

Uma linguagem intermediária que

estabelece correspondências entre os

termos destes vocabulários.

(40)

Existem diversas Propostas

metodológicas

Linguagem Mundial

– possibilidade de elaboração

de uma linguagem universal

Linguagem de Comutação

– propõe a criação de

uma estrutura básica comum, servindo de elemento

norteador no desenvolvimento de linguagens

individuais

Linguagem Intermediária

– é uma linguagem de

conversão que integra diversas linguagens

Este conceito surge em 1963, esboçado pelo Groupe d´Etude sur Information

Scientifique (GEIS) no projeto de criação de um léxico intermediário.

(41)

Linguagem Intermediária

Criação de uma léxico intermediário com um sistema

de códigos que possa convergir para dois ou mais

instrumentos de representação a ser

compatibilizados

Características:

As Linguagens originais são mantidas

Criação de uma linguagem de conversão ( sistema de

códigos)

Propõe a adoção de uma Linguagem Base

A linguagem de maior abrangência no domínio. Será utilizada como

padrão para análise

(42)

Linguagem Intermediária

Criação de uma léxico intermediário com um sistema

de códigos que possa convergir para dois ou mais

instrumentos de representação a ser compatibilizados

Características:

Estabelece onze níveis de correspondência

correspondência exata (idiomas diferentes, plural/singular);

termos sinônimos; termo específico para o termo genérico...

Ex: O vocabulário de origem usa uma só um descritor para

designar um conceito, enquanto que para o mesmo conceito o

vocabulário destino precisa usar dois ou mais descritores em

conjunto

Ex: o descriptor do vocabulário de origem existe no

vocabulário de destino descriptor mais genérico

(43)

Léxico intermediário

Vocabulário central

que atua como um

mediador de mapeamentos entre n

vocabulários com os quais queremos

estabelecer compatibilidade.

O Mapeamento é feito entre cada

vocabulário e o léxico.

Maria Luiza de A. Campos – Pré ConfOA

Método de Neville – Reconciliação de Tesauros –

propõe uma linguagem intermediária através do mapeamento entre

vocabulários

(44)

Mapeamento

no mapeamento busca-se obter uma

correspondência entre dois vocabulários,

onde se estabelecem critérios de

conversão de um vocabulário para o

outro.

é unidirecional, ou seja, é feito tendo em

vista a conversão de um vocabulário para

outro, mas não vice-versa.

(45)

Uma outra Proposta ...

O Vocabulário Integrado

Na integração o foco é gerar um novo vocabulário,

que possivelmente tem seu escopo ampliado em

relação aos vocabulários originais, uma vez que é o

resultado da agregação desses vocabulários.

Essa visão contrasta com a abordagem do léxico

intermediário, que têm por princípio a

preservação dos vocabulários originais e o

estabelecimento de equivalências entre os

vocabulários, enquanto que na integração essa

preservação é perdida uma vez que se cria um novo

vocabulário.

(46)

Abordagens para integração

Uso de diversas estratégias de casamento léxico

a normalização prévia dos termos dos

vocabulários

a exploração da estrutura hierárquica

a análise de documentos indexados com os

vocabulários

a participação de especialistas para validar o

resultado proposto de casamentos propostos

por processos semi-automatizados

(47)

Qual o princípio adotar?

O que serve aos nossos

propósitos visando possibilitar o

acesso aberto????

OBRIGADA!!!

Maria Luiza de A. Campos – Pré ConfOA

Estudos ônticos e ontológicos em

contextos informacionais: representação,

recuperação e métricas

Referências

Documentos relacionados

Inicialmente, destacamos os principais pontos de convergência: • O papel tático e operacional exercido pela área de TI dos Câmpus é claramente identificável, tanto nos

Antes de caminhar efetivamente ao encontro de métodos e mecanismos que nos levem a solucionar os problemas de ajustamento e inclusão dos jovens oriundos das “tribos” juvenis urbanas

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-

After selecting the participants, we applied a standardized questionnaire which had been previously tested by the research group, and collected data on socioeconomic

De acordo com SUKHIANI e colaboradores (1996), JERRAM & DEWEY (1999b) e MAYHEW e colaboradores (2004), cães que realizam cirurgia descompressiva podem reapresentar os

In a study with 5,306 patients carried out by the Global Research on Acute Conditions Team (GREAT), among a great number of biomarkers measured at admission in patients with

Os maiores coeficientes da razão área/perímetro são das edificações Kanimbambo (12,75) e Barão do Rio Branco (10,22) ou seja possuem uma maior área por unidade de

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar