Disciplina:
Sistemas de categorização
Linguagem documentária (LD), relações entre conceitos,
categorização de conceitos
Renato Fernandes Corrêa
Universidade Federal de Pernambuco
Departamento de Ciência da Informação
Principais Funções Desenvolvidas em muitos Tipos de Serviços de Informação ENTRADA Análise Conceitual Tradução
Base de Dados em forma impressa ou
eletrônica Tradução Análise Conceitual Pedidos População de usuários do sistema
Definição
“Linguagem documentária como uma linguagem construída, oposta à natural, portanto, tem como objetivo específico tratar a informação
para fins de recuperação”. (TÁLAMO, p.10,1997)
“ Sistema simbólico instituído por uma comunidade que visa traduzir os conteúdos dos documentos, mas diferente da linguagem natural está
LD como linguagem construída
Uma linguagem construída é produto de
uma operação nas palavras que as transforma em termos.
Linguagens documentárias integram
vocabulários controlados.
Para caracterizar esse controle de
LD como linguagem construída
Bakhtin (1981) “no plano ideológico, a
palavra é uma unidade neutra, isto é, apta a se adequar a diferentes padrões
culturais”.
Isso ocorre porque ela é portadora de
Polissemia e Ambigüidade
Polissemia - é quando uma palavra pode comportar mais de um significado.
Ex.: O cachorro do meu vizinho uivou a noite toda.
(o cachorro pertence ao vizinho) (o vizinho é um cachorro)
Ambigüidade – a possibilidade de uma comunicação prestar-se a mais de uma interpretação.
Ambas ocorrem na Linguagem Natural
Numa Linguagem Documentária, tanto a polissemia, quanto a ambigüidade devem ser neutralizadas, para que
LD tem que ser uma linguagem de natureza
monossêmica, ou seja ter apenas um significado para cada termo.
LN x LD
A Linguagem Natural, plurissêmica, tem função interpretativa, criadora e informativa.
A Linguagem Documentária tem função apenas
informativa, e de maneira determinada, de acordo com a estruturação da própria linguagem.
Ilustrando...
Significante Significado LD
LN
Significante
Significado 1 Significado 2
Termos controlados/
Códigos
Exato Compacto Consistente Processável Rígido Não intuitivo
Granularidade Fixa
Caro (manutenção)
LD e controle de vocabulário
Quando se afirma que as LDs supõem um controle do vocabulário, afirma-se simultaneamente:
A existência de mecanismos interpretativos próprios;
A possibilidade de se produzir linguagens de natureza
monossêmica;
A existência de um vocabulário próprio que que comporta,
MODELO PARA A CONSTRUÇÃO
DO CONCEITO
Teoria do conceito - O conceito, segundo
Dahlberg, é uma “unidade de
conhecimento” e é formado por três
elementos: referente, características e forma de apresentação.
O processo de determinação do conceito se dá
a partir da seleção de um item de referência, em seguida atribuem-se predicados segundo
Unidade de Conhecimento
CONCEITO
REFERENTE
PREDICAÇÃO DENOTAÇÃO
DESIGNAÇÃO
CARACTERÍSTICAS FORMA VERBAL
conceito de infarto de miocárdio
“infarto do miocárdio” (Português) “myocardial infarction” (Inglês)
“I21” (CID-10)
Predicados que caracterizam
Semiótica
Teoria dos signos / símbolos
Um símbolo representa um objeto / uma
classe de objetos reais
Lingüística = Semiótica dos signos da
linguagem natural (palavras, frases...)
Cuidado: Não confundir signos com os
objetos designados, e.g.
Triangulo de Odgen & Richards
símbolo, signo objeto , instancia referente indivíduo „cadeira", "chair"
Triangulo de Odgen & Richards
Símbolo, signo: representação de um
conceito por meio de uma linguagem
Objeto, referente, instância, indivíduo:
Segmento de um mundo real ou fictício
Pensamento, referencia,
interpretante, conceito:
Unidade deTriangulo de Odgen & Richards
infarto de miocárdio do paciente #123456
conceito de infarto de miocárdio
“infarto do miocárdio” (Português) “myocardial infarction” (Inglês)
Duas classes de símbolos
Dados / Informações / Conhecimento em domínios específicos
Códigos / Vocabulário Controlado
Linguagem Natural
Gramática
Regras de formação de unidades lingüísticas
Sintaxe:
Formação de frases / sentenças
Morfologia
Sintaxe, Semântica
sintaxe: relações internas que mantêm os
signos entre si
“o cachorro está latindo”
“o cachorro
estão
latindo”
semântica: relação dos signos com o seu
significado:
Sintaxe, Semântica: outros signos
Exemplo 1: códigos CID-10:
sintaxe: letra + 2-3 algarismos, ponto depois do
2º algarism:
Válido: D01, S10.3, inválido: 10D, $R2
Semântica: D01 = Carcinoma in situ de outros órgãos
digestivos
Exemplo 2: linguagens de programação:
sintaxe: válido: sqrt(a), inválido sqrt(a,b)
Lexicografia
Termo: signo lingüístico (não só palavra)
Léxico, dicionário: lista de termos com atributos
lingüísticos e significação
Critérios de inclusão / exclusão:
Domínio (e.g. medicina, computação)
forma básica (“neoplasia”, não “neoplasias”)
atomicidade (“Escherichia coli”, não “neoplasia maligna
do esôfago”)
Glossário: definições de termos usando
linguagem natural
Relações Léxico-Semânticas
Sinônimos : sentidos semelhantes:
falecer = morrer
Antônimos: significação oposta:
distal proximal
Homônimos: escritas ou pronunciadas de modo
idêntico, significação diferente:
Homófonos: cassar caçar
Homógráfos : almoço (S) almoço(V)
Homônimos perfeitos = homófonos + homógrafos
Sinonímia
Sinonímia – é uma relação de equivalência entre, ao menos, duas palavras
Relação de Equivalência (na LD)
Normaliza a polissemia, ou seja, várias palavras compartilham um mesmo descritor
Compatibiliza a linguagem dos usuários com a linguagem do sistema
Na elaboração de LDs é fundamental tratar sinônimos e quase-sinônimos, uma vez que essas linguagens têm por função compatibilizar duas linguagens: a de
Quase sinônimos
Quase sinônimos podem ser:
Palavras pertencentes a dialetos diferentes;
Palavras pertencentes a diferentes estilos ou registros como dor de
cabeça / cefaléia;
Palavras que guardam apenas uma diferença emotiva ou valorativa
(países em vias de desenvolvimento / países subdesenvolvidos);
Palavras que tem sua ocorrência limitada como gilete /
lâmina de barbear;
Palavras cujos significados são muito próximos como
Relações Semânticas (próprias)
Hiperônimo : conceito mais geral:
Coração Órgão
Hipônimo: conceito mais específico:
Órgão Coração
Holónimo: conceito todo da parte Merónimo: conceito parte do todo
}
inclusão:
Hiponímia
Hiponímia – noção de inclusão , a mesma noção que permite reunir unidades numa classe. (Gênero / espécie)
Flor
Rosa Cravo
Estão incluídos em
Termo superordenado (hiperônimo) Termo subordinado (hipôniomo) Termo subordinado (hipôniomo)
Em termos do léxico, o sentido de um hipônimo é produto do sentido de um nome superordenado e de um modificador adjetival real ou potencial, que responde a perguntas do seguinte tipo: que espécie de...? Que tipo de..?
Exemplo de classificação de animal
Com vida vs Sem vida
Vegetal Animal
Ave
Relação taxonômica
Principal relação de ordem em sistemas de
classificação e terminologias
Relaciona conceitos (classes) gerais com
conceitos (classes) mais específicos
Corresponde a:
Implicação entre predicados:
x: A(x) B(x)
Inclusão entre conjuntos EA EB
Relação is-a (é do tipo, é um) entre conceitos
Cuidados
Não confundir is-a com outras relações:
hexose biosynthesis is-a monosaccharide
biosynthesis
hexose biosynthesis is a hexose
metabolism
Não confundir is-a com instance-of:
medico(Eduardo)
Eduardo instance-of medico Eduardo Emedico
Teoria de conjuntos nem sempre aplicável:
Outras relações semânticas
Propriedades algébricas: reflexiva: x: R(x,x)
transitiva: x,y,z: R(x,y), R(y,z) R(x,z) simétrica: x,y: R(x,y) R(y,x)
assimétrica: x,y: R(x,y) not(R(y,x)) Exemplos:
reflexiva transitiva simétrica
pai - - -
casado - - +
subconjunto + + -
descendente - + -
assimétrica
Propriedades de típicas relações
biomédicas
prevents - - (?) -
causes - + (?) -
precedes - + -
treats - - -
adjacent to - - +
+
+ + + - UMLS SN reflexiva transitiva simétrica
part-of - + -
has-location + (?) + -
instance-of - - -
is-a + + -
assimétrica
Sistemas de Terminologia
sinônimo: TERMINOLOGIAS, Linguagens
documentárias
termo geral para
sistemas de codificação / classificação vocabulários
nomenclaturas tesauros
Características
Conceitos/classes: entidades de
pensamento (abstrações de objetos)
Termos: descrições dos conceitos em
linguagem natural
Códigos: strings de caracteres não
Conceitos/classes
Termos, Códigos
Objetos
Códigos significativos vs. códigos
não significativos
Vantagens de códigos significativos
Vantagens de códigos não significativos
Códigos aleatórios Códigos sequenciais
D50.1
Definição intensional: Gênero e
características específicas
Exemplo: Granulócitos sao leucócitos com
granulos
Definição extensional: conjunto de
todos os conceitos mais específicos de
um conceito mais amplo.
Exemplo: Granulócitos: Neutrófilos,
Eosinófilos, or Basófilos
Discussão
Extensão / Intensão
Vantagens de definições extensionais
Pré-Coordenação vs.
Pós-Coordenação
Termos complexos constituem uma classe
Exemplo:
“Neoplasia maligna da glândulatireóide”
Termos complexos são construídos pela
combinação de várias classes
Exemplo: Patologia:
“Neoplasia”Atributo:
“maligno”Anatomia:
“GlândulaDiscussão Pré-Coordenação /
Pós-Coordenação
Vantagens de pré-coordenação de conceitos
Hierarquias simples /
Hierarquias múltiplas
vértice arco
Hierarquias Múltiplas /
Herança múltipla
Meningite
Doença Infecciosa Doença do SNC
Meningite Viral Doença inflamatória
por Vírus Doença do SNC Doença
inflamatória
Doença
Hierarquia simples
Doenças inflamatórias
Doenças inflamatórias causadas por vírus
Doenças inflamatórias do sistema
nervoso causadas por vírus
Doenças inflamatórias do sistema
nervoso central causadas por vírus
Discussão Hierarquias Simples /
Hierarquias Múltiplas
Vantagens de hierarquias simples
Classificação
Classificação: Um processo mental pelo qual
coisas, seres ou pensamento, são reunidos segundo as semelhanças ou diferenças que apresentam.
Para que haja esse agrupamento de coisas,
semelhantes ou não, é preciso um elemento de ligação que sirva de base para a reunião. Esse
elemento chama-se característica da classificação. Significa o elemento que serve para reunir os
Classificação
A classificação teve origem nas Categorias de
Aristóteles
taxonomia para os objetos do mundo
As características da classificação determinam um
dos cinco predicados lógicos.
Predicado é cada uma das cinco relações que se seguem num arranjamento lógico: Classe (genus), espécies (species), diferença (difference),
Classificação
Uma classe (isto é, um grupo de pessoas ou coisas) pode ser subdi
vidida em espécies (isto é, subdivisão com atributos comuns), pelo acréscimo de uma diferença (isto é, uma característica). A soma ou união desses subgrupos, ou seja, das espécies, forma uma classe (genus).
Uma espécie (isto é, uma subdivisão da classe) pode novamente se
subdividir pelo acréscimo de nova diferença e, nesse caso se constitui numa nova classe, originando novas espécies e assim sucessivamente.
Propriedade significa algo próprio de cada elemento de uma classe
mas que não é imprescindível à definição da classe.
Acidente é uma qualidade não obrigatória a todos os elementos de
Classificação
Por exemplo: o assunto trabalho é uma classe (genus).
Acrescentando-se a essa classe a diferença, ou seja, a (característica) pessoa que executa o trabalho, se terá
várias espécies (subgrupos), tais como:
trabalho das crianças, das mulheres, dos velhos, dos homens, dos
presos etc.
Cada uma dessas espécies se constitui novamente em
classes, que, acrescidas de nova diferença — como o tipo do trabalho realizado originará outras espécies (outros
subgrupos):
trabalho da mulher na pecuária, na aviação, nas artes, na
Classificação
As características usadas para subdivisão
dos assuntos devem ser empregadas de maneira exclusiva, uma de cada vez e de maneira exaustiva, isto é, devem dividir os
grupos até que não comportem mais
subdivisão e permitir que novos assuntos lhes sejam anexados, reunidos, não só
CATEGORIZAÇÃO E RELAÇÕES
CONCEITUAIS
O uso de facetas em substituição a característica foi
introduzido por Ranganathan, e possuem a
propriedade de possibilitar a sistematização do conhecimento em elementos do conhecimento e unidades do conhecimento.
Facetas e característica significam diferentes
aspectos ou pontos de vista dos assuntos.
Inclusão dos descritores nas categorias
correspondentes
Inclusão dos Descritores nas
Categorias
Categorias formais Dahlberg Subcategorias formais Princípios Objetos imateriais Objetos materiais Quantidades Qualidades Relações Operações Estados Processos Tempo Posição Espaço Entidades Propriedades Atividades Dimensões RanganathanP – entidades
M - matéria
E - energia
S - espaço
Organização das classes
A organização das classes segue princípios lógicos:
Por exemplo
Área de Saúde
Categoria Processos
Classe Doença
Podemos fazer grupamentos por doenças segundo diferentes características ou facetas como:
•sistemas/órgãos (Categoria Dimensões): digestivo, circulatório, hepático etc,
•Parasitos (Categoria Entidade)
Sistemas de
Terminologia
Terminologia
Tesauros
Vocabulários
Classificações
Nomenclaturas
Referências
Slides do Prof. Stefan Schulz. Curso de
Terminologia na área biomédica,PUC-PR,2003.