Tipologia de
Sistemas de
Terminologia
(
Sistemas de Organização do
Conhecimento
)
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Sistemas de Terminologia
•
Terminologia:
Lista de Termos
•
Tesauro:
terminologia classificada por ordem alfabética ou
por assunto, contendo sinônimos (e outras
relações semânticas)
•
Glossário (em terminologia chamado de
vocabulário):
Terminologia ou Tesauro acompanhado por
definições
pâncreas
aparelho digestivo
fígado
Brasil
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
(3) pâncreas
(1) aparelho digestivo {trato digestivo,
digestive tracet}
(2) fígado
{liver, hepar}
(4) Brasil
Tesauro
GEOGRAFIA ANATOMIA (1) (2) (3) (4)(1) has-part (2)
(1) has-part (3)
Ex.: Ser Humano Homem
- Relacionamento Hierárquico - Gênero / Espécie (is_a)
Ex.: Ser Humano Cabeça
Tronco Membros
- Relacionamento Partitivo - entre um todo e suas partes (has_part)
No tesauro: TGP/TEP No tesauro: TG/TE
- Relacionamento de Oposição
Ex.: Inflação/Deflação
Ex.: Barbeiro / Doença de Chagas Vacina/Veneno
- Relacionamento Funcional - entre categorias (coisas - processos, material-produto)
No tesauro: TO/TO No tesauro: TA/TA TR/TR
- Relacionamento de Equivalência
Ex.: Aipim/Mandioca
Tesauro de Medicina Clínica
Doença
Na:
TE Doença Respiratória
TE Doença Cardiovascular
TE Doença do Sistema Nervoso
Doença Cardiovascular
Na
TG Doença
Doença Respiratória
Na:
TG Doença
Doença do Sistema Nervoso
Na:
TG Doença
O
Tesauro
deve ser elaborado
como um
Sistema de
Classificação
.
A Classificação se dá em duas
etapas:
1. Inclusão dos descritores nas categorias; 2. Organização das classes.
Maria Luiza de A. Campos
-Classificação dos
Descritores em Categorias
Conceituais
Inclusão dos descritores nas categorias e facetas correspondentes.
Teoria da Classificação.
Inclusão dos Descritores nas
Categorias
Categorias formais Dahlberg Subcategorias formais Princípios Objetos imateriais Objetos materiais Quantidades Qualidades Relações Operações Estados Processos Tempo Posição Espaço Entidades Propriedades Atividades Dimensões RanganathanP – entidades
M - matéria
E - energia
S - espaço
Organização das classes
A organização das classes segue princípios lógicos:
1- Escolha uma Categoria e procure organizar seus descritores: verifique qual a característica comum a um conjunto de descritores.
Por exemplo:
Área de Saúde
Categoria Processos
Classe Doença
Organização das Classes
de Conceitos
- Escolha uma categoria e procure organizar seus descritores
- Verifique qual a característica comum a um conjunto de
descritores.
- Selecione um subconjunto- Faceta
- Forme uma hierarquia:
- As características que revelam hierarquia, são aquelas que descrevem a essência e as partes de um referente. (cadeias e renques)
Estabelecimento das relações
Relações Hierárquicas ( TG/TE - TGP/TEP)
- Análise da parte sistemática para descrever na parte alfabética as relações hierárquicas.
Relações Associativas (TA/TA)
- Análise da definição para verificar outros termos relacionados ao termo selecionado.
Relações de Equivalência (USE/UP)
Tesauro Brasileiro de Ciência da
Informação
• Lançado pelo IBICT em 2014:
– PINHEIRO, Lena Vania Ribeiro; FERREZ, Helena Dodd. Tesauro
Brasileiro de Ciência da Informação. Rio de Janeiro; Brasília: Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict), 2014.
DISPONÍVELAQUI
– Propósitos: classificação da área e de instrumento para a recuperação da informação de sua literatura em
bibliotecas, bases de dados, repositórios e bibliotecas digitais, entre outros serviços e produtos de informação
– Foi construído utilizando o software comercial Multites.
Tesauro Brasileiro de Ciência da
Informação
• Organização
– Os termos foram organizados em categorias e depois relacionados hierarquicamente.
– As principais categorias se constituem disciplinas, sendo: as disciplinas estruturais reunidas em Fundamentos da Ciência da Informação; as instrumentais passaram a ser representadas por Organização e
Processamento da Informação; as disciplinas gerenciais ganharam o nome de Gestão da Informação; as tecnológicas foram agrupadas
pelas Tecnologias da Informação; e as disciplinas socioculturais ficaram
identificadas por Transferência da Informação” (PINHEIRO; FERREZ,
Categorias
1 Epistemologia da Ciência da Informação 1.1 História da Ciência da Informação 1.2 Teorias na Ciência da Informação 1.3 Interdisciplinaridade
1.4 Métodos de Pesquisa e Análise
1.4.1 Metrias da informação e comunicação
1.5 Ensino e Pesquisa em Ciência da Informação e Áreas Afins 1.6 Profissão e Mercado de Trabalho
2 Organização do Conhecimento e Recuperação da Informação 2.1 Organização do Conhecimento
2.1.1 Representação da informação
2.1.2 Sistemas de organização do conhecimento 2.2 Recuperação da Informação
2.2.1 Medidas de avaliação de sistemas de recuperação da informação
3 Gestão da Informação
3.1 Gestão de Bibliotecas e Recursos de Informação 3.1.1 Serviços de biblioteca
3.1.2 Desenvolvimento de coleções 3.1.3 Preservação de documentos 3.2 Usuários e Usos da Informação 3.3 Serviços de Informação
4 Informação e Conhecimento Estratégicos nas Organizações 4.1 Inteligência Competitiva
4.1.1 Métodos de análise na inteligência competitiva 4.2 Gestão do Conhecimento
5 Tecnologias da Informação e Comunicação - TICs 5.1 Equipamentos de Computador
5.2 Programas de Computador 5.3 Aplicações de Computador
5.3.1 Bases de dados e extração da informação
5.4 Redes de Comunicação e Informação, Internet, Web 5.5 Gestão nas TICs
5.5.1 Normas e protocolos
5.6 Inteligência Artificial e Engenharia do Conhecimento
6 Comunicação e Acesso à Informação 6.1 Comunicação Científica
6.1.1 Produtividade científica
6.1.2 Publicações científicas: periódicos 6.2 Transferência e Acesso à Informação
6.2.1 Direito à informação e propriedade intelectual 6.2.2 Políticas e ações de informação
6.3 Indústria da Informação 6.4 Sociedade da Informação
7 Documento e Informação como Componente 7.1 Tipos de Documento
7.2 Suportes de Informação 7.3 Conteúdos da Informação
Tesauro Brasileiro de Ciência da
Informação
gestão da informação
ING: information resources management (UF information management, IRM) ESP: gestión de la informacion, gestión de recursos de información
UP gestão de recursos de informação TG gestão
TE desenvolvimento de coleções gestão de bases de dados gestão de conteúdos na web gestão de documentos
TR disseminação da informação fluxo da informação
gestão de bibliotecas microfilmagem
necessidades de informação recursos de informação
NE: Conjunto de atividades com o objetivo de planejar, adquirir, organizar,
processar, armazenar, disseminar e disponibilizar informação para fins de recuperação e uso. Trata-se de termo adotado também em outras áreas, como administração e ciência da computação, com acepções distintas e que enfatizam as tecnologias da informação e
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
(3) pâncreas
(1) aparelho digestivo
{trato digestivo, digestive tracet}
(2) fígado
{liver, hepar}
(4) Brasil
Glossário (ou
Vocabulário)
GEOGRAFIA ANATOMIA (1) (2) (3) (4)(1) has-part (2)
(1) has-part (3)
Parte do organismo onde ocorre a digestão dos alimentos
Órgão onde ocorre a metabolização da maior parte dos nutrientes
Glândula que produz o suco pancreático e alguns hormônios
Maior e mais populoso país da América Latina
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Sistemas de Classificação
Sistema de Classificação Ideal
•
Arvore (hierárquica simples) de classes
subclasses
•
Definição extensional das classes não
terminais
•
Disjunção de Classes:
Nenhum indivíduo pertence a duas classes
(não contando relação de inclusão de classes)
•
Exaustão:
Problemas Práticos em Sistemas de
Classificação
•
Individualidade na definição e delimitação das
classes
•
Granularidade depende do objetivo da
classificação (estatística, tarifas para o
reembolso de serviços, documentação)
Classificação
Classificação
Significa reunir livros segundo os assuntos que tratam com a finalidade de mostrar a ordem dos livros nas estantes, recuperar a informação e determinar quais os livros existentes em cada assunto e sua quantidade.
Os dois sistemas de classificação mais conhecidos e utilizados na classificação de acervo bibliográfico são:
CDD – Classificação Decimal de Dewey;
CDU – Classificação Decimal Universal.
A CDD e a CDU são um sistema internacional de classificação de documentos.
Baseiam-se no conceito de que todo o conhecimento pode ser dividido em 10 classes
Classificação
Classificação do acervo
•
A ordem das publicações é feita segundo a
ordenação alfabética dos autores dentro de
um mesmo
assunto (classe)
.
Tabela de Cutter
Classificação
Sistemas de Classificação
CDD (Classifição Decimal Dewey) – o conhecimento é dividido em 10 (dez)
grandes classes e representado por números. As classe básicas estão organizadas pelas disciplinas ou campo de estudo e não pelo assunto.
Classes na CDD:
000 – Ciência da Computação, informação e Obras Gerais 100 – Filosofia, Psicologia
200 – Religião, Teologia
300 – Ciências Sociais, Direito 400 – Linguagem, Linguística
500 – Ciências (Puras, Naturais, Matemática) 600 – Tecnologia, Ciências aplicadas
700 – Artes e recreação 800 – Literatura
•
A CDD organiza todo o conhecimento em dez classes
principais que, excluindo a primeira (000
Computadores, informação e referência geral),
prosseguem do metafísico (filosofia e religião) ao
mundano (história e geografia).
•
O esquema dispõe de três sumários.
– O primeiro contem as 10 classes principais numeradas de 000 a 900. O primeiro dígito representa a classe principal.
– O segundo conta com as 100 divisões. O segundo dígito em cada número de três dígitos indica a divisão.
– O terceiro dispõe 1000 seções. O terceiro dígito em cada número de três dígitos indica a seção.
TABELAS AUXILIARES
•
T1 Subdivisão Padrão -01/-09
•
T2 Áreas geográficas, Períodos históricos e Pessoas -1/-9
•
T3 Subdivisões para Artes,
literaturas individuais e
formas literárias específicas -01/-89. A T3 é dividida em
três tabelas (T3A, T3B e T3C).
•
T4 Subdivisões de línguas individuais
-01/-86
•
T5 Grupos raciais, étnicos e nacionais -01/-99
•
T6 Línguas
-1/-9
NOTAÇÃO
• A notação é expressa em números arábicos (notação pura).
• Utiliza-se apenas um ponto, após o terceiro algarismo para facilitar a leitura, pois este ponto não possui outro valor na notação.
• Utiliza alguns mecanismos de uma classificação facetada,
combinando elementos de diferentes partes da estrutura para construir um número representando o assunto do conteúdo frequentemente combinando dois elementos de assuntos juntando números que representam áreas geográficas(local) ou épocas ou tipo do material, produzindo números de
NOTAÇÃO
•
Ex.:
– 330 para economia + 94 para Europa = 330.94 Economia européia;
– 973 para Estados Unidos + 005 que é a divisão para
periódicos resulta em 973.005 para designar periódicos sobre os Estados Unidos de uma forma geral).
•
Pode ser consultada em inglês em:
• https://www.oclc.org/pt-americalatina/dewey/features.html
•
Hierarquia
•
A hierarquia na CDD é expressa por estrutura
e notação.
– Hierarquia estrutural significa que todos os tópicos (exceto as dez classes principais) são parte dos tópicos mais amplos acima deles. Qualquer nota referente à natureza de uma classe se mantém verdadeira para todas as classes subordinadas, inclusive tópicos logicamente subordinados classificados em números coordenados.
– A hierarquia de notação é expressa pelo comprimento da notação. Números em um determinado nível são geralmente subordinados a uma classe cuja notação tem um dígito a menos; coordenados com uma classe cuja notação tem o mesmo número de dígitos
Hierarquia
• Os dígitos no exemplo a seguir demonstram a hierarquia de notação:
600 Tecnologia
630 Agricultura e tecnologias relacionadas 636 Pecuária
636.7 Cachorro 636.8 Gato
– “Cachorro” e “Gato” são mais específicos do que (isto é, são subordinados a) "Pecuária"; são igualmente específicos (isto é, são coordenados com) entre si; – "Pecuária" é menos específico do que (isto é, é superordenado a) “Cachorro”
e “Gato”.
• Às vezes, outros dispositivos devem ser usados para
expressar a hierarquia quando não for possível ou desejável fazê-lo por notação.
Classificação
Sistemas de Classificação
CDU (Classificação Decimal Universal) – o conhecimento também é divido em 10 (dez) classes e representado por números, sinais gráficos, letras ou
palavras.
Classes da CDU:
0 – Generalidades, Ciência, Conhecimento 1 – Filosofia, Psicologia
2 - Religião, Teologia
3 - Ciências Sociais, Direito, Administração 4 - Está vaga (cancelada em 1963)
5 - Ciências Puras, Matemática, Ciências Naturais 6 - Ciências Aplicadas, Medicina, Tecnologia
7 - Artes, Arquitetura, Recreação, Diversão, Esportes 8 - Linguagem, Linguística, Literatura
Estrutura
• Baseada na classificação decimal de Dewey, mas usa sinais auxiliares para indicar vários aspectos especiais de um assunto ou relações entre assuntos. Assim, o sistema contém um elemento facetado ou analítico-sintético significativo.
• Cada uma das grandes classes mais genéricas é identificada por um único algarismo arábico, (diferenciando-se da CDD que precisa de no mínimo três algarismos).
Estrutura
•
A CDU é considerada como uma classificação
por
aspectos
, na qual um
fenômeno é
classificado
segundo
uma
disciplina
ou
contexto. Por isso vários aspectos de um assunto
encontram-se em diferentes lugares.
•
Por exemplo, carvão não ocupa um único lugar:
– O aspecto petrológico aparece em 552.574;
– O aspecto da geologia econômica está em 553.94;
– O aspecto de mineração encontra-se em 622.23, outros aspectos podem ser encontrados.
•
http://www.udcsummary.info/php/index.php
Por exemplo a classe 5 dividi-se nas seguintes classes
:
50 Generalidades sobre ciências puras 51 Matemática
52 Astronomia. Astrofísica. Pesquisa espacial 53 Física
54 Química. Ciências mineralógicas
55 Ciências da Terra. Geociências. Geologia etc. 56 Paleontologia
57 Ciências biológicas em geral 58 Botânica
Cada uma dessas subclasses é uma
subdivisão da classe 5, sendo que cada
uma delas pode ser subdividida
novamente e assim por diante.
Podemos dividir as classes em:
COORDENADAS
Coordenadas:
são as classes nas quais os
números de classificação tem a mesma
extensão, denotando um nível similar de
generalidade;
Superordenadas
: são as classes com
números menos longos
Subordinadas:
são as classes de números
mais longos, que indicam, maior
Sendo:
Notação
A notação da CDU é considerada
MISTA, pois a mesma é formada por
números, letras e sinais
Ex. 329.05(81)“1968” (043)
Notação
+ mais adição e.g. 59+636zoologiaecriação seletiva de animais
/ barra Extensão e.g. 592/599 Zoologia sistemática (tudo de 592 a 599 inclusive)
: dois pontos Relação e.g. 17:7 Relação entreéticaeartes
[] Colchetes sub-agrupamento algébrico
e.g.
31:[622+669](485)estatísticas demineraçãoe metalurgi anaSuécia(o auxiliar considera 622+669 como uma unidade)
= Igual Linguagem e.g. =111 emInglês; 59=111 Zoologia, em inglês
Tabelas auxiliares
•
As tabelas auxiliares apresentam-se em duas
divisões: os sinais e as subdivisões auxiliares. O uso
destas tabelas permitem, além dos números simples,
a construção de números compostos e sínteses.
•
Os números compostos são os criados por síntese,
ou seja, a composição feita com números extraídos
de mais de uma parte da tabela (principal ou
auxiliar), que juntos formam uma notação de
Para a classificação dos assuntos compostos ou
sínteses, contidos nos documentos, a CDU faz uso de
sinais
• Os sinais, apresentados nas Tabela Ia – Coordenação e
Extensão e Tabela Ib – Relação, Subagrupamento e Ordenação são em número de cinco:
• Coordenação, representado pelo sinal de + (adição);
• Extensão, representado pela / (barra ablíqua);
• Relação, representado pelo sinal de : (dois pontos);
• Subagrupamento, representado pelos [ ] (colchetes) e
Sendo:
+ Adição
usado para ligar dois ou mais
assuntos não consecutivos na tabela
/ Barra oblíqua
usado para ligar números
consecutivos na tabela
Nº simples
número comum
: : Dois pontos duplos
indica relação sem
reversão
: Relação
indica a relação de dois assuntos
Subdivisões Auxiliares
As subdivisões auxiliares subdividem-se em Auxiliares Comuns e Auxiliares Especiais.
• a) Auxiliares comuns: possibilitam o inter-relacionamento entre assuntos e indicam características repetitivas, ou seja, aquelas que são aplicadas em todas as classes principais. São eles: Auxiliar Comum de Língua, de Forma, de Lugar, de Raça, de Tempo, de Ponto de Vista, de Materiais e de Pessoas,
Incluem-se, também, o asterisco e as extensões alfabéticas
• b) Auxiliares especiais: indicam características que se
repetem em determinados lugares da tabela, isto é, aqueles que são aplicáveis a um número limitado da tabela, cuja
classe principal a qual está subordinada autorize sua
Sendo elas:
= Língua designa a língua em que está escrito o doc. (0...) Forma indica a forma em que está escrito o doc. (1/9) Lugar indica o âmbito geográfico do assunto
(=) Raça e nacionalidade indica os aspectos de raça e nacionalidade do assunto
“ “ Tempo indica o aspecto temporal do doc.
A/Z Alfabética indica a ordem alfabética se necessário de assunto
.00 Ponto de vista indica os pontos mais gerais sob os quais um assunto pode ser considerado
-03 materiais indica materiais ou elementos constituintes de que são feitos objetos ou produtos
Exercício
•
Represente o conceito de “recuperação da
informação” utilizando:
–
CDD
:
https://www.oclc.org/pt-americalatina/dewey/features/summaries.html–
CDU
: http://www.udcsummary.info/php/index.php?lang=pt–
Tesauro de Ciência da Informação do IBICT, 2014
:
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Nomenclaturas
•
Sistema de termos compostos obedecendo
regras de composição pré-estabelecidas
•
Consiste em “eixos” (idealmente) ortogonais
•
Cada eixo constitui, em si, um sistema de
classificação
SNOMED
SNOMED: Características (I)
SNOMED é um sistema terminológico multi-axial
tipo nomenclatura:
•
Vantagem: Permite a codificação muito
detalhada de qualquer tipo de entidade
•
Desvantagens:
–
Processo de codificação trabalhoso
–
Existem várias alternativas para codificar a
mesma entidade
Topografico (anatômico) Morfológico
Diagnóstico -Procedimentos Funcional
Organismos vivos Químico
Agentes físicos, ações e forças Contexto social
Ocupações Geral
SNOMED: Características (II)
SNOMED é composta de 11 eixos:
• Topografico (anatômico) - T : anatomia funcional para medicina humana e veterinária
• Morfológico - M: alterações encontradas nas células, tecidos e organismos
• Diagnóstico - D: classificação de condições reconhecidas
clinicamente encontradas na medicina humana e veterinária
• Procedimentos - P: procedimentos administrativos, diagnósticos e terapêuticos
SNOMED: Características (III)
• Organismos vivos - L: organismos com vida de etiologia significante na doença humana e animal
• Químico - C: drogas, produtos biológicos e manufaturados farmacêuticos
• Agentes físicos, ações e forças - A: compêndio de ações físicas, perigos físicos, e forças da natureza
• Contexto social - S: condições sociais e suas relações de importância para a medicina
• Ocupações - J: termos que descrevem a ocupação
Exemplos
•
T-01000 (pele)
M-4300 (inflamação crônica)
M-01735 (eritema papulovesicular)
C3000 (reação de hipersensibilidade alérgica)
F-A2300
(coceira).
•
T-28000 (pulmão)
M-40000 (inflamação)
SNOMED: Exemplo 1
•
D-13510 (Pneumonia pneumocócica) é
equivalente a combinação de :
–
T-28000 (código topográfico para pulmão);
–
M-40000 (código morfológico para inflamação)
–
L-25116 (código para Streptococcus pneumoniae
SNOMED: Exemplo 2
•
Dermatite atópica (D0-10130) equivale:
–
T-01000 (código topográfico para pele)
–
M-4300 (código morfológico para inflamação
crônica)
–
M-01735 (código morfológico para eritema
papulovesicular)
–
F-C3000 (código funcional para reação de
hipersensibilidade alérgica)
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Taxonomia
•
No contexto da Ciência da Informação, taxonomia é um
sistema para classificar e facilitar o acesso à informação.
•
É uma lista estruturada de categorias de assunto;
•
Não inclui definição de tópicos, apresenta relações
hierárquicas e partitivas entre os tópicos
•
Possibilita a organização e recuperação da informação
através de navegação;
Conceito
•
Não existe uma taxonomia
certa ou errada
, o
que existe é uma
taxonomia organizada a
partir de um determinado ponto de vista
,
uma forma classificatória de entendimento de
uma dada realidade, atendendo a diferentes
propósitos.
• Ou seja, as taxonomias não são neutras, são
Conceito
•
O objetivo primário da Taxonomia é prever
uma
relação entre termos e conceitos
.
• É um sistema de classificação hierárquico de termos e conceitos...
Aplicações
•
Reconhecer o
raciocínio de dada área do
conhecimento
ou instituição....
• ... auxiliando na
avaliação e na administração dos ativos
intelectuais.
– .... a fim de:
» ajudar na criação de um
mapa explícito
doconhecimento
» permitir automação parcial no processo de
AS RELAÇÕES ENTRE OS OBJETOS
Relação Categorial:
•
Determina a natureza do conceito: processo, entidade,
propriedade, lugar, dentre outras.
Relação Hierárquica:
•
É a base da taxonomia, apresenta a ordenação dos
conceitos interligados em uma sucessão lógica.
Relação Gênero-espécie e todo-parte.
Relação Partitiva:
Estruturas Taxonômicas
•
Dois tipos principais:
–
Taxonomia Descritiva
Estruturas Taxonômicas
Taxonomia Descritiva
• Baseia-se na estrutura de tesauros, pois há seleção de termos
autorizados e o estabelecimento dos termos significativos em um
determinado contexto, trabalhando com relações semânticas.
• O objetivo é a padronização da linguagem a fim de melhorar a
comunicação.
Estruturas Taxonômicas
Taxonomia Navegacional
• Organiza a informação e por meio da navegação pode ser visualizada pelo usuário.
• A estruturação das informações fica visível ao usuário, pois o objetivo é que a descoberta das informações aconteça no
momento da navegação.
Taxonomia
•
A taxonomia é uma estrutura classificatória
hierárquica que representa conceitualmente um
domínio através da modelagem conceitual.
•
A taxonomia possibilita a recuperação da informação
através de navegação
•
Teoria da classificação Facetada possibilita um método
de construção.
•
A Teoria dos Níveis Integrativos permite pensar um
domínio interdisciplinar, pois trabalha com a
Exemplo: MAPA CONCEITUAL da Taxonomia da área de Geoquímica Ambiental Geoquímica Ambiental Personalidade Espaço Tempo Energia Propriedade Matéria
Entidade Física Entidade Química Entidade Biológica Entidade Heterogênea
Material Padrão de Qualidade
Áreas Periféricas
Região Geográfica
Tempo Geológico Clima
Estado da federação brasileira Paisagem Física Biosfera Áreas Formal e Estrutural Áreas Geológica e Cosmológica Processo Químico Processo Físico-Químico
Processo Biológico Processo Biogeoquímico Processo Geomórfico Processo Climático
• Ontologia é uma especificação formal e explícita de uma
conceitualização compartilhada:
• Conceitualização: refere-se a um modelo de fenômeno abstrato no mundo por ter identificado os conceitos relevantes daquele fenômeno;
• Explícito: significa que o tipo dos conceitos usados e as restrições no seu uso são definidos explicitamente;
• Formal: refere-se ao fato que a ontologia deveria ser lida pela máquina;
• Compartilhado: reflete que ontologia deveria capturar conhecimento consensual aceito pelas comunidades.
• Ontologia é definida como um conjunto de conceitos e termos que podem ser usados para descrever alguma área do conhecimento ou construir uma representação para o conhecimento;
• Ontologia contém o vocabulário (termos) e a definição de conceitos e seus relacionamentos para um dado domínio;
• Define uma semântica formal da informação, permitindo o processamento pelo computador.
• Permite a ligação entre o entendimento do mundo real e o conteúdo processado pelo computador através de terminologias consensuais
Finalidade da Ontologia
Finalidade da Ontologia
•
Classificação de conceitos (Sistemas de
Classificação, Taxonomia)
•
Associação
e
relações
entre
conceitos
(Tesauro)
•
Regras e conhecimento sobre que relações
são permitidas e fazem sentido (Ontologias)
Questões Fundamentais da
Ontologia
Questões Fundamentais da
Ontologia
• O que significa a existência para um ser?
– Quando duas coisas são idênticas ?
– É tudo o que existe também real?
– Será que algo existe, sendo ele possível ?
– Há coisas não-existentes?
• Que categorias de objetos existe?
– Existem coisas que são apenas únicas, ou apenas múltipla (universalidade) ?
– Existem coisas que são unilateralmente dependente dos outras (substâncias) ?
– De que tipo é essa dependência (causalidade) ?
– Existem propriedades necessárias (essências) ?
Fonte: Frederico Fonseca
Diferentes Grupos de Pessoas
Por que desenvolver Ontologias?
Por que desenvolver Ontologias?
Por que desenvolver Ontologias?
Por que desenvolver Ontologias?
• Para compartilhar o entendimento comum da estrutura de informação
– entre pessoas ou agentes de software
• Possibilitar reuso do conhecimento de um domínio
– Introduzir padrões que permitam interoperabilidade
• Tornar explícitas as suposições de domínios
– Auxilia no entendimento e atualização de dados legados
• Separar conhecimento de domínio de conhecimento operacional para fins de reuso
Crescimento na utilização de ontologias
Crescimento na utilização de ontologias
Ontologias na Web
– taxonomias para categorizar Web sites
• por exemplo Yahoo! Categories
– categorizações de produtos para venda e suas características
• por exemplo Amazon.com (catálogo de produtos) Ontologias em padrões de terminologia
– Unified Medical Language System (UMLS)
• Recuperação de informação (mecanismos de busca);
• Bibliotecas digitais;
• Web Semântica;
• Serviços Web;
• Gestão do conhecimento;
• Engenharia do conhecimento;
• Extração e Integração de informação;
• Processamento de linguagem natural;
• Comércio eletrônico;
• Comunicação de agentes inteligentes.
Ontologia de Alto Nível: descreve conceitos gerais como espaço, tempo, assunto, objeto, evento, ação, etc, os quais são independentes de um problema ou domínio específico.
Ontologia de Domínio/Tarefa: descreve o vocabulário
relacionado ao domínio genérico (exemplo: medicina, automóvel), ou uma tarefa/atividade genérica (exemplo: diagnóstico, venda), especializando os termos introduzidos na ontologia de alto nível.
Ontologia de Aplicação: descreve conceitos dependendo de
um domínio e tarefa específicos, os quais são freqüentemente especializações das ontologias relacionadas. Esses conceitos correspondem aos papéis das entidades do domínio enquanto desempenham uma certa atividade como unidade substituível ou componente dispensável.
Exemplo I
–
Além
do Tesauro...
Estrutura
Estrutura
•
Uma classe é um conceito em um domínio
–
classe vinhos
–
classe produtores de vinho
–
classe vinhos rosé
•
Uma classe é uma coleção de elementos com
propriedades similares
•
Instâncias de classes
Classes e a Hierarquia de Classes Herança Classes e a Hierarquia de Classes Herança
• Classes normalmente contituem uma hierarquia taxonômica (uma hierarquia subclasse-super classe)
• Uma hierarquia de classes é usualmente uma hierarquia é-um Uma instância de uma subclasse é uma instância de uma
super classe
• Se uma classe é um conjunto de elementos, uma subclasse é um sub-conjunto
• Exemplos
– Maçã é uma subclasse de Fruta
Toda maçã é uma fruta
– Vinho Tinto é uma subclasse de Vinho
Todo vinho tinto é um vinho
– Vinho Chianti é uma subclasse de Vinho Tinto
Classes e a Hierarquia de Classes Níveis de Hierarquia Classes e a Hierarquia de Classes Níveis de Hierarquia
Middle level
Top level
Propriedades
Propriedades
• As classes são descritas/definidas por meio de propriedades
• Properties em uma definição de classe descrevem atributos
de instâncias da classe e relações com outras classes
Cada vinho terá: color, sugar content, producer, …
• Tipos de propriedades
– Propriedades “intrínsecas”: flavor e color do vinho
– Propriedades “extrínsecas”: name e price do vinho
– Partes: ingredients em um prato
– Relações com outros objetos: producer de vinhos (winery)
• Propriedades simples e complexas
– Propriedades simples (atributos): contém valores primitivos (strings, numbers) – Propriedades complexas (relações): contém (ou aponta para) outros objetos
Propriedades para a Classe Wine
Propriedades para a Classe Wine
Propriedades e Herança de Classes
Propriedades e Herança de Classes
•
Uma subclasse herda todos as propriedades
da super classe
Se um vinho tem um name e flavor, um vinho tinto
também tem um name e flavor
•
Se uma classe tem múltiplas super classes, ela
herda as propriedades de todas as super
classes
Port é um vinho para sobremesa e um vinho tinto. Ele
Restrições de Propriedades
Restrições de Propriedades
•
Restrições de propriedades descrevem
ou limitam o conjunto de valores
possíveis para uma propriedade
O nome de um vinho é uma string
Restrições Comuns
Restrições Comuns
•
cardinality
–
o número de valores que pode
ter
•
value type
–
o tipo de valores que pode ter
•
Minimum and maximum value
–
uma faixa de
valores numérico possível
Tipos de valor
Tipos de valor
•
String: uma cadeia de caracteres (“Ch
â
teau Lafite”)
•
Number: um integer ou um float (15, 4.5)
•
Boolean: uma flag true/false
•
Enumerated type: uma lista de valores permitidos
(high, medium, low)
•
Complex type: uma instância de outra classe
– Especifica a classe para a qual a instância pertence
A classe Wine é o tipo de valor para o slot “produces” na
Restrições e Herança de Classe
Restrições e Herança de Classe
•
Uma subclasse herda todas restrições as
propriedades da superclasse
•
Uma subclasse pode ignorar as restrições para
“limitar” a lista de valores permitidos
– Tornar a faixa de cardinalidade menor
•
Algumas restrições são definidas por meio de
axiomas
, por não poderem ser explicitadas por
meio de restrições de propriedade.
Gene Ontology (I)
•
Vocabulário controlado para descrição de
componentes celulares, funções moleculares e
processos biológicos.
•
esforço colaborado e dirigido a necessidade
da descrição do produto de genes em
diferentes bases de dados.
Gene Ontology (II)
•
Define conceitos comuns em toda biologia
O que a Gene Ontology não é
•
Não
é uma base de dados de seqüências de
genes, nem catalogo de produtos de genes.
•
Não
é uma base de dados biológicas unificada.
•
Não
é um padrão ditado ou exigido de
GO: Três Sub-Ontologias
•
Função Molecular (atividade): ação
característica de um produto de gene
(bioquímico)
•
Processo Biológicos: fenômeno marcado por
mudanças que conduzem a um resultado
particular, medidas por produtos de gene”
Arquitetura da Gene Ontology
•
Dois princípios classificatórios
–
Is-a
–
Part-of
•
Hierarquias múltiplas
Gráficos Acíclicos Dirigidos (DAGs)
•
Conectada com um banco de dados de genes
e produtos de genes
•
Mais Detalhes:
–
http://geneontology.org/page/go-database
Gene
Gene caracterizado por
conceitos das três sub-ontologias: Processo Biológico
Links
•
CDD na wikipedia
–
https://pt.wikipedia.org/wiki/Classifica%C3%A7%
C3%A3o_decimal_de_Dewey
•
CDU na wikipedia
–
https://pt.wikipedia.org/wiki/Classifica%C3%A7%
C3%A3o_decimal_universal
•
UDCS Linked Data:
Universal Decimal
Classification (UDC)
Ferramentas para construção de
Ontologias
W3C
http://www.w3.org/standards/semanticweb/
Protégé: Editor, ambiente e framework gratuito e de código aberto
◦ http://protege.stanford.edu/
◦ http://webprotege.stanford.edu/
Chimaera/Ontolingua: Ferramentas para construção de ontologias
◦ http://www.ksl.stanford.edu/software/ontolingua/
ONTOKEM: Ferramenta para construção de ontologias (pt-br)
◦ http://ontokem.egc.ufsc.br/
ONTOLP: Construção de ontologias a partir de textos
◦ http://www.inf.pucrs.br/ontolp/downloads-ontolpplugin.php Tutoriais
◦ http://protegewiki.stanford.edu/wiki/Protege4GettingStarted
Repositórios de Ontologias
Mecanismo de busca por ontologias
◦ http://swoogle.umbc.edu/
Lista de Boas Ontologias do W3C
http://www.w3.org/wiki/Good_Ontologies
Repositórios de ontologia
◦ http://www.inf.pucrs.br/~ontolp/downloads.php
◦ http://owl.cs.manchester.ac.uk/repository/
◦ http://www.daml.org/ontologies/
◦ http://www.schemaweb.info/
◦ http://www.ksl.stanford.edu/software/ontolingua/
◦ http://pronto.metadata.net/ontologies
Sistema de recuperação de informação baseado em ontologias
◦ http://www6.ufrgs.br/fabrico/notes/ontologia.php#pr_descrição
Site anotado semânticamente
Aplicações da Web Semântica
Site da BBC (Semantic Publishing)
http://www.bbc.com/sport/football/teams/chelsea
http://www.bbc.co.uk/ontologies
http://www.bbc.co.uk/ontologies/coreconcepts
http://www.bbc.co.uk/blogs/bbcinternet/2012/04/sports_dynamic_semantic. html
Site da Best Buy
http://www.bestbuy.com/
http://www.heppnetz.de/projects/goodrelations/
http://wiki.goodrelations-vocabulary.org/Main_Page
http://wiki.goodrelations-vocabulary.org/Datasets
Redação de feeds com Zemanta http://www.zemanta.com/
Nasa XSearch
https://sweet.jpl.nasa.gov/