UNIVERSIDADE FEDERAL DE ALAGOAS UNIVERSIDADE FEDERAL DE ALAGOAS
INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES CURSO DE BIBLIOTECONOMIA
CURSO DE BIBLIOTECONOMIA ANÁLISE DA INFORMAÇÃO I ANÁLISE DA INFORMAÇÃO I
TRATAMENTO TEMÁTICO DA INFORMAÇÃO:
Processos de Análise e Representação
Prof. Edivanio Duarte de Souza
edivanioduarte@gmail.com
Maceió, Alagoas 2011.1
Tratamento da Informação no Sistema de
Tratamento da Informação no Sistema de
Recuperação da Informação (SRI)
Recuperação da Informação (SRI)
Diversos modelos, mais ou menos, similares de SRI;
“Entrada;
◦ desenvolvimento da coleção [seleção e aquisição];
◦ tratamento da informação [análise e representação da informação];
◦ armazenamento.
Saída:
Saída:
◦ análise/negociação de questões [usuário];
◦ estratégia de busca;
◦ busca;
◦ disseminação” (DIAS; NAVES, 2007, p. 15, grifo meu).
Em outros modelos, por exemplo, nos de Cesarino (1985),
Lancaster (2004) e Dodebei (2007), o tratamento da informação
faz parte de um subsistema intermediário dedicado ao
Tratamento da Informação na Ciência da
Tratamento da Informação na Ciência da
Informação/Biblioteconomia
Informação/Biblioteconomia
Expressão ou área do conhecimento (Ciência a
Informação/Biblioteconomia) que abarca:
◦ descrição física e temática dos documentos em uma biblioteca ou SRI;
◦ desenvolvimento de instrumentos a serem utilizados nessas
◦ desenvolvimento de instrumentos a serem utilizados nessas descrições (códigos, linguagens, normas, padrões);
◦ concepção e implantação de estrutura físicas ou bases de dados destinadas ao armazenamento dos documentos e de seus
simulacros (fichas, registros eletrônicos, etc.);
Compreende as disciplinas classificação, catalogação,
indexação e outras delas derivadas ou a elas relacionadas, tais
como metadados e ontologias (DIAS; NAVES, 2007).
Tratamento da Informação
Tratamento da Informação
Tipos de tratamento da informação:
◦ tratamento descritivo: elementos físicos extraídos do documento (catalogação) - identificação extrínseca;
◦ tratamento temático: descreve o conteúdo (assunto) do
documento (indexação, catalogação de assuntos e classificação) -identificação intrínseca.
Etapas do tratamento temático:
Etapas do tratamento temático:
◦ análise de assunto (análise conceitual, análise temática, análise documentária ou análise de informação): leitura do documento e extração dos conceitos que representam o seu conteúdo;
◦ tradução: passagem dos termos extraídos em linguagem natural para linguagem de indexação ou linguagem documentária
(descritores de assunto, cabeçalhos de assunto, palavras-chave, termos de indexação ou enunciados) (DIAS; NAVES, 2007).
Tratamento da Informação
Tratamento da Informação
Os Processos de Tratamento da
Os Processos de Tratamento da
Informação
Informação
Descrição física:
◦ exame do documento (leitura técnica do documento);
◦ identificação de elementos que representam
extrinsecamente/fisicamente o documento (autor, título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc.);
páginas/folhas, etc.);
◦ seleção dos elementos e forma de descrição com base num instrumento de representação/código de catalogação (AACR2).
Descrição temática:
◦ exame do documento (leitura técnica do documento);
◦ extração e seleção de conceitos que representam
Atividades e Designações do Tratamento
Atividades e Designações do Tratamento
da Informação
da Informação
Catalogação:
◦ descrição dos aspectos físicos (objetivos) dos documentos (autor, título, edição, editora, local de publicação, ano de publicação,
quantidade de páginas/folhas, etc) – chamada de representação/catalogação descritiva;
representação/catalogação descritiva;
◦ descrição do conteúdo do documento – catalogação por assunto (pontos de acesso ou pistas).
Classificação:
◦ descrição do conteúdo do documento:
a) lugar do documento na coleção organizada por assunto;
b) sistemas de classificação (CDD e CDU) para representar o assunto (DIAS; NAVES, 2007).
Atividades e Designações do Tratamento
Atividades e Designações do Tratamento
da Informação
da Informação
Indexação:
◦ representação do conteúdo do documento;
◦ atividade dos serviços de “indexação e resumo” (periódicos científicos).
Metadados:
Metadados:
◦ descrição física dos documentos em bibliotecas digitais;
◦ cumpre, nas bibliotecas digitais, papel semelhante ao da catalogação nas bibliotecas tradicionais.
Ontologias:
◦ organização dos recursos eletrônicos com base no conteúdo;
◦ atividade semelhante aos processos de catalogação, classificação e indexação, que são realizadas em bibliotecas tradicionais (DIAS; NAVES, 2007).
Atividades de Tratamento Temático da
Atividades de Tratamento Temático da
Informação
Informação
Há uma tendência em considerá-las (indexação, catalogação de
assuntos e classificação) sob uma única designação decorrente
de suas semelhanças:
◦ identificam o assunto do documento;
◦ traduzem esse assunto para uma linguagem de indexação
◦ traduzem esse assunto para uma linguagem de indexação (linguagem documentária);
Há, porém, diferenças:
◦ a classificação visa determinar um único local do documento na coleção/estante;
◦ a indexação e a catalogação de assunto podem indicar para um documento várias entradas num índice ou num catálogo (política de indexação) (DIAS; NAVES, 2007).
Instrumentos Usados no Tratamento da
Instrumentos Usados no Tratamento da
Informação
Informação
Tratamento descritivo:
◦ Catalogação: códigos de catalogação (Instruções Prussianas, Código de Panizzi, Código de Jewett e Código de Catalogação Anglo-Americano);
◦ Referências (bibliográficas): normas de descrição (NBR 6023/ABNT);
◦ Metadados: formatos de metadados (Dublin Core).
Tratamento Temático:
Tratamento Temático:
◦ Indexação: linguagens de indexação ou documentárias (Cabeçalhos de Assunto e Tesauros);
◦ Classificação: linguagens de indexação simbólicas ou sistemas de classificação bibliográfica e documentária (Classificação Decimal de Dewey e Classificação Decimal Universal);
◦ Resumo: normas de elaboração (NBR 6028/ABNT) (DIAS; NAVES, 2007).
Dias e Naves (2007) citam as tabelas de notação de autor (Cutter e
PHA) como instrumentos de representação temática, mas elas
apenas auxiliam aqueles na formação do número de chamada.
Produtos do Tratamento da Informação
Produtos do Tratamento da Informação
Registros bibliográficos (referência bibliográfica);
Registros catalográficos (ficha catalográfica);
Resumos (Abstracts e/ou Serviço de Indexação e Resumo);
Metadados (registros bibliográficos ou catalográficos de
Metadados (registros bibliográficos ou catalográficos de
documentos eletrônicos);
Pontos de acesso de catálogos (autor, título e/ou assunto);
Pontos de acesso de bibliografias (autor, título e/ou assunto);
Arranjo sistemático de coleções de documentos (a própria
A Indexação
A Indexação
O termo indexação assume dois sentidos na literatura:
◦ indexação (lato sensu): construção de índices (autores, títulos e assunto), em livros, catálogos ou bancos de dados;
◦ indexação (sticto sensu): pontos de acesso ou catalogação de assunto das informações contidas em documentos.
Na literatura de língua inglesa:
Na literatura de língua inglesa:
◦ indexação back-of-book: no final do livro (mais exaustiva);
◦ indexação acadêmica: base de dados de resumo e catálogos de bibliotecas (menos exaustiva).
Etapas da indexação (abordagem clássica):
◦ extração dos conceitos representativos;◦ tradução (instrumentos de indexação – linguagens de indexação ou linguagens documentárias).
Etapas da indexação:
◦ análise do assunto do texto;
◦ expressão do conteúdo do assunto nas palavras dos indexadores (linguagem natural);
◦ tradução para um vocabulário de indexação;
◦ expressão do assunto em termos de índice (CHU; O’BRIEN, 1993 apud DIAS; NAVES, 2007, p. 28).
Processos da Indexação
Processos da Indexação
apud DIAS; NAVES, 2007, p. 28).
A literatura dá maior destaque ao processo de tradução,
sobretudo, as linguagens de indexação e
classificação/documentárias (elaboração e uso);
Pouca literatura sobre como os indexadores decidem sobre o
assunto do documento (sobre o que ele trata) – processo de
análise da informação.
Dificuldades na indexação:
◦ processo subjetivo;◦ percepções diferentes dos indexadores:
o efetivo conteúdo do documento;
a parte desse conteúdo que poderá responder às necessidades dos usuários;
Processos da Indexação
Processos da Indexação
usuários;
os conceitos importantes que devem ser selecionados para representar esse conteúdo;
os descritores definidos para representar esses conceitos (STREHL, 1998 apud DIAS; NAVES, 2007).
?
? ?
Necessidade de política de indexação:
◦ cobertura (especificidade e exaustividade);
◦ coeficientes de recuperabilidade (revocação e precisão).
Consistência na indexação:
◦ medida de similaridade (concordância) entre termos atribuídos por diversos indexadores a um mesmo documento;
Processo da Indexação
Processo da Indexação
por diversos indexadores a um mesmo documento;
◦ ponto crítico em todo o processo de indexação (subjetividade);
Inconsistência na indexação:
◦ medida de variação de termos atribuídos a um mesmo documento por mais de um indexador (lista de indexação);
◦ diferentes indexadores atribui diferentes termos indexadores a um mesmo documento;
◦ localiza-se, principalmente, no momento da expressão (verbalização) dos conceitos (níveis de especificidade).
Relevância na indexação:
◦ julgamento feito pelo usuário diante do resultado da busca em SRI;
◦ conexões entre as situações de usuários (questão feita pelo usuário) e informação contida nos documentos (resposta dada pelo SRI);
Processo de Indexação
Processo de Indexação
pelo SRI);
◦ avaliação da satisfação do usuário em relação à representação do documento. Questão representação da necessidade de informação Documento representação do conteúdo do documento Relevância
A análise e a representação da informação constituem o
processo de indexação;
Análise da informação:
◦ determinação do conteúdo de um documento.;
◦ identificação dos conceitos centrais do conteúdo do documento.
Representação da informação:
◦ atribuição de termos representativos desses conceitos
Processos de Análise e Representação
Processos de Análise e Representação
◦ atribuição de termos representativos desses conceitos (linguagem natural);
◦ tradução desses termos em linguagem do SRI (vocabulário controlado).
Funções dos processos de análise e de representação da
informação:
◦ construção de pontos de acesso/índices /catálogos (meio);
Análise e Representação da Informação
Análise e Representação da Informação
De que trata o documento? - determinação do
conteúdo;
Análise da Informação
Como representar este conteúdo? - atribuição de termos àqueles conceitos; Representação da Informação Documento
Esquema do Indexador
Catálogo* conteúdo; - extração de conceitos. àqueles conceitos; - tradução do termos em LI/LD. - Seleção de materiais de informação; - Formação de acervos; - Desenvolvimento de acervos. -Seleção de fontes de informação; - Formação de coleções; - Desenvolvimento de coleções. Vocabulário Controlado *impresso ou on-line.Análise e Representação da Informação
Análise e Representação da Informação
Qual minha necessidade de informação?
- determinação do conteúdo;
Análise da Informação
Como representar este conteúdo? - atribuição de termos àqueles conceitos; Representação da Informação Necessidade de informação
Esquema do Usuário
Catálogo* conteúdo; - extração de conceitos. àqueles conceitos; - tradução do termos em LI/LD. - Seleção de materiais de informação; - Formação de acervos; - Desenvolvimento de acervos. - Seleção de fontes de informação; - Formação de coleções; - Desenvolvimento de coleções. Controle de vocabulário (catálogo) *impresso ou on-line.
Linguagem de indexação/linguagem documentária: conjunto de
termos e/ou símbolos usados para determinar/representar
classes de assuntos em SRI;
Componentes básicos:
◦ vocabulário (termo propriamente dito): relação dos termos e/ou símbolos empregados na representação temática do documento:
controle semântico ou de significado.
Linguagem de Indexação/Documentária
Linguagem de Indexação/Documentária
controle semântico ou de significado.
◦ sintaxe (estrutura frásica): regras para a combinação de termos e/ou símbolos que representam os documentos:
estabelece regras sobre o uso dos termos indexadores;
revela relações existentes entre os conceitos e os termos da linguagem de indexação;
controle estrutural por intermédio da coordenação conceitos simples para representar conceitos compostos (especificar e definir ordem de citação, por exemplo).
O uso de linguagem natural pode acarretar diversos problemas:
◦ dispersão terminológica;
◦ dispersão sintática.
O controle de vocabulário ou o uso de LI/LD diminui essa
dispersão a um nível aceitável:
◦ controle de relações semânticas;
◦ controle de relações sintáticas (PINTO, 1985)
Linguagem de Indexação/Documentária
Linguagem de Indexação/Documentária
◦ controle de relações sintáticas (PINTO, 1985)
Classificação das LI/LD:
◦ evolução histórica (conceito de coordenação):
tradicionais (pré-coordenadas). Ex.: Os cabeçalhos de assunto , os sistemas de classificação (CDD, CDU);
modernas (pós-coordenadas). Ex.: Os tesauros. ◦ Ordenação:
sistemas alfabéticos. Ex.: Os cabeçalhos de assunto.
sistemas classificados. Ex.: Os sistemas de classificação (CDD, CDU) (CESARINO; PINTO, 1978).
Indica o termo alternativo ou substitutivo na relação;
Evidencia-se na própria definição do termo;
Subtipos de relações semânticas:
◦ Equivalências: fornecem termos substitutivos (“ver”, “use” “see” ou “X”):
sinônimo e antônimo (adubos x fertilizantes);
quase sinônimo (datiloscopia x impressão digital);
Relações Semânticas
Relações Semânticas
quase sinônimo (datiloscopia x impressão digital);
grafias diferentes (contact x contato);
abreviaturas e acrônimos (ONU x Organização das Nações Unidas);
traduções (recall x revocação);
ordem de citação (automação de bibliotecas x biblioteca, automação de).
◦ Hierárquicas: fornecem termos alternativos (“ver também”, “use também”, “see also” ou “XX”) – exprimem o posicionamento de um conceito em relação a outro.
◦ Hierárquicas (continuação):
gênero x espécie:
a) quase-genérica (gato x animal de estimação)
b) genérica (gato x mamífero)
todo x parte (aparelho respiratório x pulmão).
◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia
Relações Semânticas
Relações Semânticas
◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia de busca:
coordenação (porta x janelas);
genética (pai x filho);
concorrente (educação x ensino);
causa e efeito (ensino x aprendizagem);
instrumental (medicina preventiva x vacinação);
material (esquadrias x alumínio);
Relações Sintáticas
Relações Sintáticas
Indica a relação entre os termos que representam o assunto;
Necessidade de se recuperar a interseção entre dois ou mais
conceitos:
◦ assuntos simples (um único conceitos);
◦ assuntos compostos (dois ou mais conceitos).
As relações sintáticas são temporárias: dependem do
documento;
documento;
Definem a importância dos termos numa estrutura frásica
(ordem de citação):
Ex.: Uso do procedimento em cadeia para acesso aos conceitos ocultos (Ranganathan):
1 - NORMAS PARA FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO 2 - FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO – NORMAS PARA 3 - ESQUADRIAS DE ALUMÍNIO - NORMAS PARA FUNDIÇÃO DE 4 - ALUMÍNIO – NORMAS PARA FUNDIÇÃO DE ESQUADRIAS (PINTO,1985).
Cutter em 1876:
◦ regra: usar a ordem da linguagem natural. Ex. Biblioteca Universitária;
◦ cabeçalho invertido: quando o segundo termo do cabeçalho composto for notoriamente mais significativo (subjetividade). Ex. Bibliotecas, Planejamento de.
Relações Sintáticas: ordem de citação
Relações Sintáticas: ordem de citação
“O MAIS SIGNIFICATIVO” – “O MENOS SIGNIFICATIVO”
Ex. BIBLIOTECONOMIA - HISTÓRIA
Kaiser em 1911: buscou maior consistência:
CONCRETO – PROCESSO (PINTO, 1985) Ex. BIBLIOTECA – PLANEJAMENTO.
Coates em 1960 – teoria da concretividade decrescente:
COISA depois a AÇÃO
Ex. BIBLIOTECA – PLANEJAMENTO;
Introduzindo o elemento “material”:
Relações Sintáticas: ordem de citação
Relações Sintáticas: ordem de citação
Introduzindo o elemento “material”:
COISA – MATERIAL – AÇÃO e
Ex. BIBLIOTECA – LIVROS - SELEÇÃO;
Dependente da coisa: parte, tipo ou propriedade:
COISA – PARTE – MATERIAL – AÇÃO (PINTO, 1985).
Conceito: palavras ou grupos de palavras que expressam o
conteúdo de um documento;
Necessidade de controle de linguagem:
◦ fatores humanos (autores, indexadores e usuários):
diferenças de cultura;
experiência dos autores;
Cabeçalho de Assunto: aspectos gerais
Cabeçalho de Assunto: aspectos gerais
domínio da terminologia.
◦ fatores lingüísticos:
sinônimos: vários termos designam o mesmo conceitos;
homógrafos: o mesmo termo designam conceitos diferentes;
sintaxe: o sentido dos termos é condicionado pela posição que este ocupa na frase.
◦ fatores hierárquicos: um conceito implica em outros mais amplos e/ou mais restritos (CESARINO, PINTO, 1978).
Funções dos cabeçalhos de assunto num SRI:
◦ representar o assunto de maneira consistente;◦ permitir a coincidência entre linguagem do indexador e linguagem do pesquisador;
◦ possibilitar o indexador modular o nível de sua pesquisa do mais geral para o mais específico, e vice-versa, segundo a necessidade do usuário.
Cabeçalho de Assunto: funções e princípios
Cabeçalho de Assunto: funções e princípios
necessidade do usuário.
Princípios de elaboração dos cabeçalhos de assunto:
◦ princípio específico: os assuntos devem dar entrada por termos específicos;
◦ princípio de uso: os assuntos seguem o princípio da conveniência do usuário;
◦ princípio sindético: os assuntos devem ser interligados por uma rede bem construída de referências cruzadas (ver e ver também) (CESARINO ; PINTO, 1978).
Características do Cabeçalho de Assunto
Características do Cabeçalho de Assunto
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Medidas das Linguagens de Indexação
Pode-se adotar duas abordagens:
◦ abordagem analítica:garantia literária;
participação do usuário;
◦ abordagem formal:
Cabeçalho de Assunto: elaboração
Cabeçalho de Assunto: elaboração
◦ abordagem formal:
trabalho de especialistas;
Referências
Referências
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6028: informação e documentação – resumo – apresentação. Rio de Janeiro: ABNT, 2003. 2p.
CESARINO, M. A. N. Sistemas de recuperação de informação. Revista da Escola de
Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 157-168, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.
______; PINTO, M. C. M. Cabeçalho de assunto como linguagem de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 7, n. 2, p. 268-288, set. 1978. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011. DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e prática. Brasília: Teshaurus, 2007. 116p.
DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. 119p.
LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos Livros, 2004. 347p.
PINTO, M. C. M. F. Análise e representação de assuntos em sistemas de recuperação de informação; linguagens de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 169-186, set. 1985. Disponível em: