• Nenhum resultado encontrado

Tipologia de Sistemas de Terminologia

N/A
N/A
Protected

Academic year: 2019

Share "Tipologia de Sistemas de Terminologia"

Copied!
107
0
0

Texto

(1)

Tipologia de

Sistemas de

Terminologia

(

Sistemas de Organização do

Conhecimento

)

(2)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(3)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(4)

Sistemas de Terminologia

Terminologia:

Lista de Termos

Tesauro:

terminologia classificada por ordem alfabética ou

por assunto, contendo sinônimos (e outras

relações semânticas)

Glossário (em terminologia chamado de

vocabulário):

Terminologia ou Tesauro acompanhado por

definições

(5)

pâncreas

aparelho digestivo

fígado

Brasil

(6)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(7)

(3) pâncreas

(1) aparelho digestivo {trato digestivo,

digestive tracet}

(2) fígado

{liver, hepar}

(4) Brasil

Tesauro

GEOGRAFIA ANATOMIA (1) (2) (3) (4)

(1) has-part (2)

(1) has-part (3)

(8)

Ex.: Ser Humano Homem

- Relacionamento Hierárquico - Gênero / Espécie (is_a)

Ex.: Ser Humano Cabeça

Tronco Membros

- Relacionamento Partitivo - entre um todo e suas partes (has_part)

No tesauro: TGP/TEP No tesauro: TG/TE

(9)

- Relacionamento de Oposição

Ex.: Inflação/Deflação

Ex.: Barbeiro / Doença de Chagas Vacina/Veneno

- Relacionamento Funcional - entre categorias (coisas - processos, material-produto)

No tesauro: TO/TO No tesauro: TA/TA TR/TR

- Relacionamento de Equivalência

Ex.: Aipim/Mandioca

(10)

Tesauro de Medicina Clínica

Doença

Na:

TE Doença Respiratória

TE Doença Cardiovascular

TE Doença do Sistema Nervoso

Doença Cardiovascular

Na

TG Doença

Doença Respiratória

Na:

TG Doença

Doença do Sistema Nervoso

Na:

TG Doença

(11)
(12)

O

Tesauro

deve ser elaborado

como um

Sistema de

Classificação

.

A Classificação se dá em duas

etapas:

1. Inclusão dos descritores nas categorias; 2. Organização das classes.

(13)

Maria Luiza de A. Campos

-Classificação dos

Descritores em Categorias

Conceituais

Inclusão dos descritores nas categorias e facetas correspondentes.

Teoria da Classificação.

(14)

Inclusão dos Descritores nas

Categorias

Categorias formais Dahlberg Subcategorias formais Princípios Objetos imateriais Objetos materiais Quantidades Qualidades Relações Operações Estados Processos Tempo Posição Espaço Entidades Propriedades Atividades Dimensões Ranganathan

P – entidades

M - matéria

E - energia

S - espaço

(15)

Organização das classes

A organização das classes segue princípios lógicos:

1- Escolha uma Categoria e procure organizar seus descritores: verifique qual a característica comum a um conjunto de descritores.

Por exemplo:

 Área de Saúde

Categoria Processos

 Classe Doença

(16)

Organização das Classes

de Conceitos

- Escolha uma categoria e procure organizar seus descritores

- Verifique qual a característica comum a um conjunto de

descritores.

- Selecione um subconjunto- Faceta

- Forme uma hierarquia:

- As características que revelam hierarquia, são aquelas que descrevem a essência e as partes de um referente. (cadeias e renques)

(17)

Estabelecimento das relações

Relações Hierárquicas ( TG/TE - TGP/TEP)

- Análise da parte sistemática para descrever na parte alfabética as relações hierárquicas.

Relações Associativas (TA/TA)

- Análise da definição para verificar outros termos relacionados ao termo selecionado.

Relações de Equivalência (USE/UP)

(18)

Tesauro Brasileiro de Ciência da

Informação

• Lançado pelo IBICT em 2014:

– PINHEIRO, Lena Vania Ribeiro; FERREZ, Helena Dodd. Tesauro

Brasileiro de Ciência da Informação. Rio de Janeiro; Brasília: Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict), 2014.

DISPONÍVELAQUI

– Propósitos: classificação da área e de instrumento para a recuperação da informação de sua literatura em

bibliotecas, bases de dados, repositórios e bibliotecas digitais, entre outros serviços e produtos de informação

– Foi construído utilizando o software comercial Multites.

(19)

Tesauro Brasileiro de Ciência da

Informação

• Organização

– Os termos foram organizados em categorias e depois relacionados hierarquicamente.

– As principais categorias se constituem disciplinas, sendo: as disciplinas estruturais reunidas em Fundamentos da Ciência da Informação; as instrumentais passaram a ser representadas por Organização e

Processamento da Informação; as disciplinas gerenciais ganharam o nome de Gestão da Informação; as tecnológicas foram agrupadas

pelas Tecnologias da Informação; e as disciplinas socioculturais ficaram

identificadas por Transferência da Informação” (PINHEIRO; FERREZ,

(20)

Categorias

1 Epistemologia da Ciência da Informação 1.1 História da Ciência da Informação 1.2 Teorias na Ciência da Informação 1.3 Interdisciplinaridade

1.4 Métodos de Pesquisa e Análise

1.4.1 Metrias da informação e comunicação

1.5 Ensino e Pesquisa em Ciência da Informação e Áreas Afins 1.6 Profissão e Mercado de Trabalho

2 Organização do Conhecimento e Recuperação da Informação 2.1 Organização do Conhecimento

2.1.1 Representação da informação

2.1.2 Sistemas de organização do conhecimento 2.2 Recuperação da Informação

2.2.1 Medidas de avaliação de sistemas de recuperação da informação

3 Gestão da Informação

3.1 Gestão de Bibliotecas e Recursos de Informação 3.1.1 Serviços de biblioteca

3.1.2 Desenvolvimento de coleções 3.1.3 Preservação de documentos 3.2 Usuários e Usos da Informação 3.3 Serviços de Informação

4 Informação e Conhecimento Estratégicos nas Organizações 4.1 Inteligência Competitiva

4.1.1 Métodos de análise na inteligência competitiva 4.2 Gestão do Conhecimento

5 Tecnologias da Informação e Comunicação - TICs 5.1 Equipamentos de Computador

5.2 Programas de Computador 5.3 Aplicações de Computador

5.3.1 Bases de dados e extração da informação

5.4 Redes de Comunicação e Informação, Internet, Web 5.5 Gestão nas TICs

5.5.1 Normas e protocolos

5.6 Inteligência Artificial e Engenharia do Conhecimento

6 Comunicação e Acesso à Informação 6.1 Comunicação Científica

6.1.1 Produtividade científica

6.1.2 Publicações científicas: periódicos 6.2 Transferência e Acesso à Informação

6.2.1 Direito à informação e propriedade intelectual 6.2.2 Políticas e ações de informação

6.3 Indústria da Informação 6.4 Sociedade da Informação

7 Documento e Informação como Componente 7.1 Tipos de Documento

7.2 Suportes de Informação 7.3 Conteúdos da Informação

(21)

Tesauro Brasileiro de Ciência da

Informação

gestão da informação

ING: information resources management (UF information management, IRM) ESP: gestión de la informacion, gestión de recursos de información

UP gestão de recursos de informação TG gestão

TE desenvolvimento de coleções gestão de bases de dados gestão de conteúdos na web gestão de documentos

TR disseminação da informação fluxo da informação

gestão de bibliotecas microfilmagem

necessidades de informação recursos de informação

NE: Conjunto de atividades com o objetivo de planejar, adquirir, organizar,

processar, armazenar, disseminar e disponibilizar informação para fins de recuperação e uso. Trata-se de termo adotado também em outras áreas, como administração e ciência da computação, com acepções distintas e que enfatizam as tecnologias da informação e

(22)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(23)

(3) pâncreas

(1) aparelho digestivo

{trato digestivo, digestive tracet}

(2) fígado

{liver, hepar}

(4) Brasil

Glossário (ou

Vocabulário)

GEOGRAFIA ANATOMIA (1) (2) (3) (4)

(1) has-part (2)

(1) has-part (3)

Parte do organismo onde ocorre a digestão dos alimentos

Órgão onde ocorre a metabolização da maior parte dos nutrientes

Glândula que produz o suco pancreático e alguns hormônios

Maior e mais populoso país da América Latina

(24)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(25)

Sistemas de Classificação

(26)
(27)
(28)
(29)

Sistema de Classificação Ideal

Arvore (hierárquica simples) de classes

subclasses

Definição extensional das classes não

terminais

Disjunção de Classes:

Nenhum indivíduo pertence a duas classes

(não contando relação de inclusão de classes)

Exaustão:

(30)

Problemas Práticos em Sistemas de

Classificação

Individualidade na definição e delimitação das

classes

Granularidade depende do objetivo da

classificação (estatística, tarifas para o

reembolso de serviços, documentação)

(31)

Classificação

Classificação

Significa reunir livros segundo os assuntos que tratam com a finalidade de mostrar a ordem dos livros nas estantes, recuperar a informação e determinar quais os livros existentes em cada assunto e sua quantidade.

Os dois sistemas de classificação mais conhecidos e utilizados na classificação de acervo bibliográfico são:

CDD – Classificação Decimal de Dewey;

CDU – Classificação Decimal Universal.

A CDD e a CDU são um sistema internacional de classificação de documentos.

Baseiam-se no conceito de que todo o conhecimento pode ser dividido em 10 classes

(32)

Classificação

Classificação do acervo

A ordem das publicações é feita segundo a

ordenação alfabética dos autores dentro de

um mesmo

assunto (classe)

.

Tabela de Cutter

(33)

Classificação

Sistemas de Classificação

CDD (Classifição Decimal Dewey) – o conhecimento é dividido em 10 (dez)

grandes classes e representado por números. As classe básicas estão organizadas pelas disciplinas ou campo de estudo e não pelo assunto.

Classes na CDD:

000 – Ciência da Computação, informação e Obras Gerais 100 – Filosofia, Psicologia

200 – Religião, Teologia

300 – Ciências Sociais, Direito 400 – Linguagem, Linguística

500 – Ciências (Puras, Naturais, Matemática) 600 – Tecnologia, Ciências aplicadas

700 – Artes e recreação 800 – Literatura

(34)

A CDD organiza todo o conhecimento em dez classes

principais que, excluindo a primeira (000

Computadores, informação e referência geral),

prosseguem do metafísico (filosofia e religião) ao

mundano (história e geografia).

O esquema dispõe de três sumários.

– O primeiro contem as 10 classes principais numeradas de 000 a 900. O primeiro dígito representa a classe principal.

– O segundo conta com as 100 divisões. O segundo dígito em cada número de três dígitos indica a divisão.

– O terceiro dispõe 1000 seções. O terceiro dígito em cada número de três dígitos indica a seção.

(35)

TABELAS AUXILIARES

T1 Subdivisão Padrão -01/-09

T2 Áreas geográficas, Períodos históricos e Pessoas -1/-9

T3 Subdivisões para Artes,

literaturas individuais e

formas literárias específicas -01/-89. A T3 é dividida em

três tabelas (T3A, T3B e T3C).

T4 Subdivisões de línguas individuais

-01/-86

T5 Grupos raciais, étnicos e nacionais -01/-99

T6 Línguas

-1/-9

(36)

NOTAÇÃO

• A notação é expressa em números arábicos (notação pura).

• Utiliza-se apenas um ponto, após o terceiro algarismo para facilitar a leitura, pois este ponto não possui outro valor na notação.

• Utiliza alguns mecanismos de uma classificação facetada,

combinando elementos de diferentes partes da estrutura para construir um número representando o assunto do conteúdo frequentemente combinando dois elementos de assuntos juntando números que representam áreas geográficas(local) ou épocas ou tipo do material, produzindo números de

(37)

NOTAÇÃO

Ex.:

– 330 para economia + 94 para Europa = 330.94 Economia européia;

– 973 para Estados Unidos + 005 que é a divisão para

periódicos resulta em 973.005 para designar periódicos sobre os Estados Unidos de uma forma geral).

Pode ser consultada em inglês em:

• https://www.oclc.org/pt-americalatina/dewey/features.html

(38)

Hierarquia

A hierarquia na CDD é expressa por estrutura

e notação.

– Hierarquia estrutural significa que todos os tópicos (exceto as dez classes principais) são parte dos tópicos mais amplos acima deles. Qualquer nota referente à natureza de uma classe se mantém verdadeira para todas as classes subordinadas, inclusive tópicos logicamente subordinados classificados em números coordenados.

– A hierarquia de notação é expressa pelo comprimento da notação. Números em um determinado nível são geralmente subordinados a uma classe cuja notação tem um dígito a menos; coordenados com uma classe cuja notação tem o mesmo número de dígitos

(39)

Hierarquia

• Os dígitos no exemplo a seguir demonstram a hierarquia de notação:

600 Tecnologia

630 Agricultura e tecnologias relacionadas 636 Pecuária

636.7 Cachorro 636.8 Gato

– “Cachorro” e “Gato” são mais específicos do que (isto é, são subordinados a) "Pecuária"; são igualmente específicos (isto é, são coordenados com) entre si; – "Pecuária" é menos específico do que (isto é, é superordenado a) “Cachorro”

e “Gato”.

• Às vezes, outros dispositivos devem ser usados para

expressar a hierarquia quando não for possível ou desejável fazê-lo por notação.

(40)

Classificação

Sistemas de Classificação

CDU (Classificação Decimal Universal) – o conhecimento também é divido em 10 (dez) classes e representado por números, sinais gráficos, letras ou

palavras.

Classes da CDU:

0 – Generalidades, Ciência, Conhecimento 1 – Filosofia, Psicologia

2 - Religião, Teologia

3 - Ciências Sociais, Direito, Administração 4 - Está vaga (cancelada em 1963)

5 - Ciências Puras, Matemática, Ciências Naturais 6 - Ciências Aplicadas, Medicina, Tecnologia

7 - Artes, Arquitetura, Recreação, Diversão, Esportes 8 - Linguagem, Linguística, Literatura

(41)

Estrutura

• Baseada na classificação decimal de Dewey, mas usa sinais auxiliares para indicar vários aspectos especiais de um assunto ou relações entre assuntos. Assim, o sistema contém um elemento facetado ou analítico-sintético significativo.

• Cada uma das grandes classes mais genéricas é identificada por um único algarismo arábico, (diferenciando-se da CDD que precisa de no mínimo três algarismos).

(42)

Estrutura

A CDU é considerada como uma classificação

por

aspectos

, na qual um

fenômeno é

classificado

segundo

uma

disciplina

ou

contexto. Por isso vários aspectos de um assunto

encontram-se em diferentes lugares.

Por exemplo, carvão não ocupa um único lugar:

– O aspecto petrológico aparece em 552.574;

– O aspecto da geologia econômica está em 553.94;

– O aspecto de mineração encontra-se em 622.23, outros aspectos podem ser encontrados.

http://www.udcsummary.info/php/index.php

(43)
(44)

Por exemplo a classe 5 dividi-se nas seguintes classes

:

50 Generalidades sobre ciências puras 51 Matemática

52 Astronomia. Astrofísica. Pesquisa espacial 53 Física

54 Química. Ciências mineralógicas

55 Ciências da Terra. Geociências. Geologia etc. 56 Paleontologia

57 Ciências biológicas em geral 58 Botânica

(45)

Cada uma dessas subclasses é uma

subdivisão da classe 5, sendo que cada

uma delas pode ser subdividida

novamente e assim por diante.

Podemos dividir as classes em:

COORDENADAS

(46)

Coordenadas:

são as classes nas quais os

números de classificação tem a mesma

extensão, denotando um nível similar de

generalidade;

Superordenadas

: são as classes com

números menos longos

Subordinadas:

são as classes de números

mais longos, que indicam, maior

(47)

Sendo:

(48)

Notação

A notação da CDU é considerada

MISTA, pois a mesma é formada por

números, letras e sinais

Ex. 329.05(81)“1968” (043)

(49)

Notação

+ mais adição e.g. 59+636zoologiaecriação seletiva de animais

/ barra Extensão e.g. 592/599 Zoologia sistemática (tudo de 592 a 599 inclusive)

: dois pontos Relação e.g. 17:7 Relação entreéticaeartes

[] Colchetes sub-agrupamento algébrico

e.g.

31:[622+669](485)estatísticas demineraçãoe metalurgi anaSuécia(o auxiliar considera 622+669 como uma unidade)

= Igual Linguagem e.g. =111 emInglês; 59=111 Zoologia, em inglês

(50)

Tabelas auxiliares

As tabelas auxiliares apresentam-se em duas

divisões: os sinais e as subdivisões auxiliares. O uso

destas tabelas permitem, além dos números simples,

a construção de números compostos e sínteses.

Os números compostos são os criados por síntese,

ou seja, a composição feita com números extraídos

de mais de uma parte da tabela (principal ou

auxiliar), que juntos formam uma notação de

(51)

Para a classificação dos assuntos compostos ou

sínteses, contidos nos documentos, a CDU faz uso de

sinais

• Os sinais, apresentados nas Tabela Ia – Coordenação e

Extensão e Tabela Ib – Relação, Subagrupamento e Ordenação são em número de cinco:

• Coordenação, representado pelo sinal de + (adição);

• Extensão, representado pela / (barra ablíqua);

• Relação, representado pelo sinal de : (dois pontos);

• Subagrupamento, representado pelos [ ] (colchetes) e

(52)

Sendo:

+ Adição

usado para ligar dois ou mais

assuntos não consecutivos na tabela

/ Barra oblíqua

usado para ligar números

consecutivos na tabela

Nº simples

número comum

: : Dois pontos duplos

indica relação sem

reversão

: Relação

indica a relação de dois assuntos

(53)

Subdivisões Auxiliares

As subdivisões auxiliares subdividem-se em Auxiliares Comuns e Auxiliares Especiais.

• a) Auxiliares comuns: possibilitam o inter-relacionamento entre assuntos e indicam características repetitivas, ou seja, aquelas que são aplicadas em todas as classes principais. São eles: Auxiliar Comum de Língua, de Forma, de Lugar, de Raça, de Tempo, de Ponto de Vista, de Materiais e de Pessoas,

Incluem-se, também, o asterisco e as extensões alfabéticas

• b) Auxiliares especiais: indicam características que se

repetem em determinados lugares da tabela, isto é, aqueles que são aplicáveis a um número limitado da tabela, cuja

classe principal a qual está subordinada autorize sua

(54)

Sendo elas:

= Língua  designa a língua em que está escrito o doc. (0...) Forma  indica a forma em que está escrito o doc. (1/9) Lugar  indica o âmbito geográfico do assunto

(=) Raça e nacionalidade  indica os aspectos de raça e nacionalidade do assunto

“ “ Tempo  indica o aspecto temporal do doc.

A/Z Alfabética  indica a ordem alfabética se necessário de assunto

.00 Ponto de vista  indica os pontos mais gerais sob os quais um assunto pode ser considerado

-03 materiais  indica materiais ou elementos constituintes de que são feitos objetos ou produtos

(55)

Exercício

Represente o conceito de “recuperação da

informação” utilizando:

CDD

:

https://www.oclc.org/pt-americalatina/dewey/features/summaries.html

CDU

: http://www.udcsummary.info/php/index.php?lang=pt

Tesauro de Ciência da Informação do IBICT, 2014

:

(56)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(57)

Nomenclaturas

Sistema de termos compostos obedecendo

regras de composição pré-estabelecidas

Consiste em “eixos” (idealmente) ortogonais

Cada eixo constitui, em si, um sistema de

classificação

(58)

SNOMED

(59)

SNOMED: Características (I)

SNOMED é um sistema terminológico multi-axial

tipo nomenclatura:

Vantagem: Permite a codificação muito

detalhada de qualquer tipo de entidade

Desvantagens:

Processo de codificação trabalhoso

Existem várias alternativas para codificar a

mesma entidade

(60)

Topografico (anatômico) Morfológico

Diagnóstico -Procedimentos Funcional

Organismos vivos Químico

Agentes físicos, ações e forças Contexto social

Ocupações Geral

(61)

SNOMED: Características (II)

SNOMED é composta de 11 eixos:

• Topografico (anatômico) - T : anatomia funcional para medicina humana e veterinária

• Morfológico - M: alterações encontradas nas células, tecidos e organismos

• Diagnóstico - D: classificação de condições reconhecidas

clinicamente encontradas na medicina humana e veterinária

• Procedimentos - P: procedimentos administrativos, diagnósticos e terapêuticos

(62)

SNOMED: Características (III)

• Organismos vivos - L: organismos com vida de etiologia significante na doença humana e animal

• Químico - C: drogas, produtos biológicos e manufaturados farmacêuticos

• Agentes físicos, ações e forças - A: compêndio de ações físicas, perigos físicos, e forças da natureza

• Contexto social - S: condições sociais e suas relações de importância para a medicina

• Ocupações - J: termos que descrevem a ocupação

(63)

Exemplos

T-01000 (pele)

M-4300 (inflamação crônica)

M-01735 (eritema papulovesicular)

C3000 (reação de hipersensibilidade alérgica)

F-A2300

(coceira).

T-28000 (pulmão)

M-40000 (inflamação)

(64)

SNOMED: Exemplo 1

D-13510 (Pneumonia pneumocócica) é

equivalente a combinação de :

T-28000 (código topográfico para pulmão);

M-40000 (código morfológico para inflamação)

L-25116 (código para Streptococcus pneumoniae

(65)

SNOMED: Exemplo 2

Dermatite atópica (D0-10130) equivale:

T-01000 (código topográfico para pele)

M-4300 (código morfológico para inflamação

crônica)

M-01735 (código morfológico para eritema

papulovesicular)

F-C3000 (código funcional para reação de

hipersensibilidade alérgica)

(66)

Sistemas de

Terminologia

Terminologia

Tesauros

Vocabulários

Classificações

Nomenclaturas

(67)

Taxonomia

No contexto da Ciência da Informação, taxonomia é um

sistema para classificar e facilitar o acesso à informação.

É uma lista estruturada de categorias de assunto;

Não inclui definição de tópicos, apresenta relações

hierárquicas e partitivas entre os tópicos

Possibilita a organização e recuperação da informação

através de navegação;

(68)

Conceito

Não existe uma taxonomia

certa ou errada

, o

que existe é uma

taxonomia organizada a

partir de um determinado ponto de vista

,

uma forma classificatória de entendimento de

uma dada realidade, atendendo a diferentes

propósitos.

• Ou seja, as taxonomias não são neutras, são

(69)

Conceito

O objetivo primário da Taxonomia é prever

uma

relação entre termos e conceitos

.

• É um sistema de classificação hierárquico de termos e conceitos...

(70)

Aplicações

Reconhecer o

raciocínio de dada área do

conhecimento

ou instituição....

• ... auxiliando na

avaliação e na administração dos ativos

intelectuais.

– .... a fim de:

» ajudar na criação de um

mapa explícito

do

conhecimento

» permitir automação parcial no processo de

(71)

AS RELAÇÕES ENTRE OS OBJETOS

Relação Categorial:

Determina a natureza do conceito: processo, entidade,

propriedade, lugar, dentre outras.

Relação Hierárquica:

É a base da taxonomia, apresenta a ordenação dos

conceitos interligados em uma sucessão lógica.

Relação Gênero-espécie e todo-parte.

Relação Partitiva:

(72)

Estruturas Taxonômicas

Dois tipos principais:

Taxonomia Descritiva

(73)

Estruturas Taxonômicas

Taxonomia Descritiva

• Baseia-se na estrutura de tesauros, pois há seleção de termos

autorizados e o estabelecimento dos termos significativos em um

determinado contexto, trabalhando com relações semânticas.

• O objetivo é a padronização da linguagem a fim de melhorar a

comunicação.

(74)

Estruturas Taxonômicas

Taxonomia Navegacional

• Organiza a informação e por meio da navegação pode ser visualizada pelo usuário.

• A estruturação das informações fica visível ao usuário, pois o objetivo é que a descoberta das informações aconteça no

momento da navegação.

(75)

Taxonomia

A taxonomia é uma estrutura classificatória

hierárquica que representa conceitualmente um

domínio através da modelagem conceitual.

A taxonomia possibilita a recuperação da informação

através de navegação

Teoria da classificação Facetada possibilita um método

de construção.

A Teoria dos Níveis Integrativos permite pensar um

domínio interdisciplinar, pois trabalha com a

(76)

Exemplo: MAPA CONCEITUAL da Taxonomia da área de Geoquímica Ambiental Geoquímica Ambiental Personalidade Espaço Tempo Energia Propriedade Matéria

Entidade Física Entidade Química Entidade Biológica Entidade Heterogênea

Material Padrão de Qualidade

Áreas Periféricas

Região Geográfica

Tempo Geológico Clima

Estado da federação brasileira Paisagem Física Biosfera Áreas Formal e Estrutural Áreas Geológica e Cosmológica Processo Químico Processo Físico-Químico

Processo Biológico Processo Biogeoquímico Processo Geomórfico Processo Climático

(77)

• Ontologia é uma especificação formal e explícita de uma

conceitualização compartilhada:

• Conceitualização: refere-se a um modelo de fenômeno abstrato no mundo por ter identificado os conceitos relevantes daquele fenômeno;

• Explícito: significa que o tipo dos conceitos usados e as restrições no seu uso são definidos explicitamente;

• Formal: refere-se ao fato que a ontologia deveria ser lida pela máquina;

• Compartilhado: reflete que ontologia deveria capturar conhecimento consensual aceito pelas comunidades.

• Ontologia é definida como um conjunto de conceitos e termos que podem ser usados para descrever alguma área do conhecimento ou construir uma representação para o conhecimento;

• Ontologia contém o vocabulário (termos) e a definição de conceitos e seus relacionamentos para um dado domínio;

• Define uma semântica formal da informação, permitindo o processamento pelo computador.

• Permite a ligação entre o entendimento do mundo real e o conteúdo processado pelo computador através de terminologias consensuais

(78)

Finalidade da Ontologia

Finalidade da Ontologia

Classificação de conceitos (Sistemas de

Classificação, Taxonomia)

Associação

e

relações

entre

conceitos

(Tesauro)

Regras e conhecimento sobre que relações

são permitidas e fazem sentido (Ontologias)

(79)

Questões Fundamentais da

Ontologia

Questões Fundamentais da

Ontologia

O que significa a existência para um ser?

– Quando duas coisas são idênticas ?

– É tudo o que existe também real?

– Será que algo existe, sendo ele possível ?

– Há coisas não-existentes?

Que categorias de objetos existe?

– Existem coisas que são apenas únicas, ou apenas múltipla (universalidade) ?

– Existem coisas que são unilateralmente dependente dos outras (substâncias) ?

– De que tipo é essa dependência (causalidade) ?

– Existem propriedades necessárias (essências) ?

(80)

Fonte: Frederico Fonseca

Diferentes Grupos de Pessoas

Por que desenvolver Ontologias?

Por que desenvolver Ontologias?

(81)

Por que desenvolver Ontologias?

Por que desenvolver Ontologias?

• Para compartilhar o entendimento comum da estrutura de informação

– entre pessoas ou agentes de software

• Possibilitar reuso do conhecimento de um domínio

– Introduzir padrões que permitam interoperabilidade

• Tornar explícitas as suposições de domínios

– Auxilia no entendimento e atualização de dados legados

• Separar conhecimento de domínio de conhecimento operacional para fins de reuso

(82)

Crescimento na utilização de ontologias

Crescimento na utilização de ontologias

 Ontologias na Web

– taxonomias para categorizar Web sites

• por exemplo Yahoo! Categories

– categorizações de produtos para venda e suas características

• por exemplo Amazon.com (catálogo de produtos)  Ontologias em padrões de terminologia

– Unified Medical Language System (UMLS)

(83)

• Recuperação de informação (mecanismos de busca);

• Bibliotecas digitais;

• Web Semântica;

• Serviços Web;

• Gestão do conhecimento;

• Engenharia do conhecimento;

• Extração e Integração de informação;

• Processamento de linguagem natural;

• Comércio eletrônico;

• Comunicação de agentes inteligentes.

(84)

 Ontologia de Alto Nível: descreve conceitos gerais como espaço, tempo, assunto, objeto, evento, ação, etc, os quais são independentes de um problema ou domínio específico.

 Ontologia de Domínio/Tarefa: descreve o vocabulário

relacionado ao domínio genérico (exemplo: medicina, automóvel), ou uma tarefa/atividade genérica (exemplo: diagnóstico, venda), especializando os termos introduzidos na ontologia de alto nível.

 Ontologia de Aplicação: descreve conceitos dependendo de

um domínio e tarefa específicos, os quais são freqüentemente especializações das ontologias relacionadas. Esses conceitos correspondem aos papéis das entidades do domínio enquanto desempenham uma certa atividade como unidade substituível ou componente dispensável.

(85)

Exemplo I

Além

do Tesauro...

(86)

Estrutura

Estrutura

Uma classe é um conceito em um domínio

classe vinhos

classe produtores de vinho

classe vinhos rosé

Uma classe é uma coleção de elementos com

propriedades similares

Instâncias de classes

(87)

Classes e a Hierarquia de Classes Herança Classes e a Hierarquia de Classes Herança

• Classes normalmente contituem uma hierarquia taxonômica (uma hierarquia subclasse-super classe)

• Uma hierarquia de classes é usualmente uma hierarquia é-um Uma instância de uma subclasse é uma instância de uma

super classe

• Se uma classe é um conjunto de elementos, uma subclasse é um sub-conjunto

• Exemplos

– Maçã é uma subclasse de Fruta

Toda maçã é uma fruta

– Vinho Tinto é uma subclasse de Vinho

Todo vinho tinto é um vinho

– Vinho Chianti é uma subclasse de Vinho Tinto

(88)

Classes e a Hierarquia de Classes Níveis de Hierarquia Classes e a Hierarquia de Classes Níveis de Hierarquia

Middle level

Top level

(89)

Propriedades

Propriedades

As classes são descritas/definidas por meio de propriedades

Properties em uma definição de classe descrevem atributos

de instâncias da classe e relações com outras classes

Cada vinho terá: color, sugar content, producer, …

• Tipos de propriedades

– Propriedades “intrínsecas”: flavor e color do vinho

– Propriedades “extrínsecas”: name e price do vinho

– Partes: ingredients em um prato

– Relações com outros objetos: producer de vinhos (winery)

• Propriedades simples e complexas

– Propriedades simples (atributos): contém valores primitivos (strings, numbers) – Propriedades complexas (relações): contém (ou aponta para) outros objetos

(90)

Propriedades para a Classe Wine

Propriedades para a Classe Wine

(91)

Propriedades e Herança de Classes

Propriedades e Herança de Classes

Uma subclasse herda todos as propriedades

da super classe

Se um vinho tem um name e flavor, um vinho tinto

também tem um name e flavor

Se uma classe tem múltiplas super classes, ela

herda as propriedades de todas as super

classes

Port é um vinho para sobremesa e um vinho tinto. Ele

(92)

Restrições de Propriedades

Restrições de Propriedades

Restrições de propriedades descrevem

ou limitam o conjunto de valores

possíveis para uma propriedade

O nome de um vinho é uma string

(93)

Restrições Comuns

Restrições Comuns

cardinality

o número de valores que pode

ter

value type

o tipo de valores que pode ter

Minimum and maximum value

uma faixa de

valores numérico possível

(94)

Tipos de valor

Tipos de valor

String: uma cadeia de caracteres (“Ch

â

teau Lafite”)

Number: um integer ou um float (15, 4.5)

Boolean: uma flag true/false

Enumerated type: uma lista de valores permitidos

(high, medium, low)

Complex type: uma instância de outra classe

– Especifica a classe para a qual a instância pertence

A classe Wine é o tipo de valor para o slot “produces” na

(95)

Restrições e Herança de Classe

Restrições e Herança de Classe

Uma subclasse herda todas restrições as

propriedades da superclasse

Uma subclasse pode ignorar as restrições para

“limitar” a lista de valores permitidos

– Tornar a faixa de cardinalidade menor

Algumas restrições são definidas por meio de

axiomas

, por não poderem ser explicitadas por

meio de restrições de propriedade.

(96)
(97)

Gene Ontology (I)

Vocabulário controlado para descrição de

componentes celulares, funções moleculares e

processos biológicos.

esforço colaborado e dirigido a necessidade

da descrição do produto de genes em

diferentes bases de dados.

(98)

Gene Ontology (II)

Define conceitos comuns em toda biologia

(99)

O que a Gene Ontology não é

Não

é uma base de dados de seqüências de

genes, nem catalogo de produtos de genes.

Não

é uma base de dados biológicas unificada.

Não

é um padrão ditado ou exigido de

(100)

GO: Três Sub-Ontologias

Função Molecular (atividade): ação

característica de um produto de gene

(bioquímico)

Processo Biológicos: fenômeno marcado por

mudanças que conduzem a um resultado

particular, medidas por produtos de gene”

(101)

Arquitetura da Gene Ontology

Dois princípios classificatórios

Is-a

Part-of

Hierarquias múltiplas

Gráficos Acíclicos Dirigidos (DAGs)

Conectada com um banco de dados de genes

e produtos de genes

Mais Detalhes:

http://geneontology.org/page/go-database

(102)

Gene

Gene caracterizado por

conceitos das três sub-ontologias: Processo Biológico

(103)

Links

CDD na wikipedia

https://pt.wikipedia.org/wiki/Classifica%C3%A7%

C3%A3o_decimal_de_Dewey

CDU na wikipedia

https://pt.wikipedia.org/wiki/Classifica%C3%A7%

C3%A3o_decimal_universal

UDCS Linked Data:

Universal Decimal

Classification (UDC)

(104)

Ferramentas para construção de

Ontologias

 W3C

 http://www.w3.org/standards/semanticweb/

 Protégé: Editor, ambiente e framework gratuito e de código aberto

◦ http://protege.stanford.edu/

◦ http://webprotege.stanford.edu/

 Chimaera/Ontolingua: Ferramentas para construção de ontologias

◦ http://www.ksl.stanford.edu/software/ontolingua/

 ONTOKEM: Ferramenta para construção de ontologias (pt-br)

◦ http://ontokem.egc.ufsc.br/

 ONTOLP: Construção de ontologias a partir de textos

◦ http://www.inf.pucrs.br/ontolp/downloads-ontolpplugin.php  Tutoriais

◦ http://protegewiki.stanford.edu/wiki/Protege4GettingStarted

(105)

Repositórios de Ontologias

 Mecanismo de busca por ontologias

◦ http://swoogle.umbc.edu/

 Lista de Boas Ontologias do W3C

 http://www.w3.org/wiki/Good_Ontologies

 Repositórios de ontologia

◦ http://www.inf.pucrs.br/~ontolp/downloads.php

◦ http://owl.cs.manchester.ac.uk/repository/

◦ http://www.daml.org/ontologies/

◦ http://www.schemaweb.info/

◦ http://www.ksl.stanford.edu/software/ontolingua/

◦ http://pronto.metadata.net/ontologies

 Sistema de recuperação de informação baseado em ontologias

◦ http://www6.ufrgs.br/fabrico/notes/ontologia.php#pr_descrição

 Site anotado semânticamente

(106)

Aplicações da Web Semântica

 Site da BBC (Semantic Publishing)

 http://www.bbc.com/sport/football/teams/chelsea

 http://www.bbc.co.uk/ontologies

 http://www.bbc.co.uk/ontologies/coreconcepts

 http://www.bbc.co.uk/blogs/bbcinternet/2012/04/sports_dynamic_semantic. html

 Site da Best Buy

 http://www.bestbuy.com/

 http://www.heppnetz.de/projects/goodrelations/

 http://wiki.goodrelations-vocabulary.org/Main_Page

 http://wiki.goodrelations-vocabulary.org/Datasets

 Redação de feeds com Zemanta  http://www.zemanta.com/

 Nasa XSearch

 https://sweet.jpl.nasa.gov/

(107)

Referências

Slides do Curso de Terminologia na área

biomédica,PUC-PR,2003.

Slides da Prof. Maria Luiza de A. Campos

Referências

Documentos relacionados

A segunda contribuição é explicitar que a aplicação desse método, mesmo que tratando de um recorte específico no processo histórico de formação para o trabalho simples e

a) Realizar entrevistas com duas empresas importadoras, sendo uma de equipamentos médico-hospitalares, para identificação de requisitos para desenvolvimento de um protótipo de

Era de conhecimento de todos e as observações etnográficas dos viajantes, nas mais diversas regiões brasileiras, demonstraram largamente os cuidados e o apreço

A ontologia provê, ainda, um conjunto de conceitos ou termos com o objetivo de descrever algum domínio, enquanto a base de conhecimento utiliza estas estruturas para representar o

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

• Ponto 38: Antonio Jose Gomes esquina com a Francisco de Assis Andrade • Ponto 39: Antonio jose Gomes em frente ao terreno baldio de esquina • Ponto 40: Jose Bonifacio próximo

Somente na classe Aberta Jr e Sr, nas modalidades de Apartação, Rédeas e Working Cow Horse, que será na mesma passada dessas categorias e os resultados serão separados. O

 Ao clicar no botão Congurar Apresentação de Slides , uma caixa de diálogo será aberta (gura 59), para que congurações sejam estabelecidas, tais como tipo