• Nenhum resultado encontrado

TRATAMENTO TEMÁTICO DA INFORMAÇÃO: Processos de Análise e Representação

N/A
N/A
Protected

Academic year: 2021

Share "TRATAMENTO TEMÁTICO DA INFORMAÇÃO: Processos de Análise e Representação"

Copied!
36
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DE ALAGOAS UNIVERSIDADE FEDERAL DE ALAGOAS

INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES CURSO DE BIBLIOTECONOMIA

CURSO DE BIBLIOTECONOMIA ANÁLISE DA INFORMAÇÃO I ANÁLISE DA INFORMAÇÃO I

TRATAMENTO TEMÁTICO DA INFORMAÇÃO:

Processos de Análise e Representação

Prof. Edivanio Duarte de Souza

edivanioduarte@gmail.com

Maceió, Alagoas 2011.1

(2)

Tratamento da Informação no Sistema de

Tratamento da Informação no Sistema de

Recuperação da Informação (SRI)

Recuperação da Informação (SRI)



Diversos modelos, mais ou menos, similares de SRI;



“Entrada;

◦ desenvolvimento da coleção [seleção e aquisição];

◦ tratamento da informação [análise e representação da informação];

◦ armazenamento.



Saída:



Saída:

◦ análise/negociação de questões [usuário];

◦ estratégia de busca;

◦ busca;

◦ disseminação” (DIAS; NAVES, 2007, p. 15, grifo meu).



Em outros modelos, por exemplo, nos de Cesarino (1985),

Lancaster (2004) e Dodebei (2007), o tratamento da informação

faz parte de um subsistema intermediário dedicado ao

(3)

Tratamento da Informação na Ciência da

Tratamento da Informação na Ciência da

Informação/Biblioteconomia

Informação/Biblioteconomia



Expressão ou área do conhecimento (Ciência a

Informação/Biblioteconomia) que abarca:

◦ descrição física e temática dos documentos em uma biblioteca ou SRI;

◦ desenvolvimento de instrumentos a serem utilizados nessas

◦ desenvolvimento de instrumentos a serem utilizados nessas descrições (códigos, linguagens, normas, padrões);

◦ concepção e implantação de estrutura físicas ou bases de dados destinadas ao armazenamento dos documentos e de seus

simulacros (fichas, registros eletrônicos, etc.);



Compreende as disciplinas classificação, catalogação,

indexação e outras delas derivadas ou a elas relacionadas, tais

como metadados e ontologias (DIAS; NAVES, 2007).

(4)

Tratamento da Informação

Tratamento da Informação



Tipos de tratamento da informação:

◦ tratamento descritivo: elementos físicos extraídos do documento (catalogação) - identificação extrínseca;

◦ tratamento temático: descreve o conteúdo (assunto) do

documento (indexação, catalogação de assuntos e classificação) -identificação intrínseca.

Etapas do tratamento temático:



Etapas do tratamento temático:

◦ análise de assunto (análise conceitual, análise temática, análise documentária ou análise de informação): leitura do documento e extração dos conceitos que representam o seu conteúdo;

◦ tradução: passagem dos termos extraídos em linguagem natural para linguagem de indexação ou linguagem documentária

(descritores de assunto, cabeçalhos de assunto, palavras-chave, termos de indexação ou enunciados) (DIAS; NAVES, 2007).

(5)

Tratamento da Informação

Tratamento da Informação

(6)

Os Processos de Tratamento da

Os Processos de Tratamento da

Informação

Informação



Descrição física:

◦ exame do documento (leitura técnica do documento);

◦ identificação de elementos que representam

extrinsecamente/fisicamente o documento (autor, título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc.);

páginas/folhas, etc.);

◦ seleção dos elementos e forma de descrição com base num instrumento de representação/código de catalogação (AACR2).



Descrição temática:

◦ exame do documento (leitura técnica do documento);

◦ extração e seleção de conceitos que representam

(7)

Atividades e Designações do Tratamento

Atividades e Designações do Tratamento

da Informação

da Informação



Catalogação:

◦ descrição dos aspectos físicos (objetivos) dos documentos (autor, título, edição, editora, local de publicação, ano de publicação,

quantidade de páginas/folhas, etc) – chamada de representação/catalogação descritiva;

representação/catalogação descritiva;

◦ descrição do conteúdo do documento – catalogação por assunto (pontos de acesso ou pistas).



Classificação:

◦ descrição do conteúdo do documento:

a) lugar do documento na coleção organizada por assunto;

b) sistemas de classificação (CDD e CDU) para representar o assunto (DIAS; NAVES, 2007).

(8)

Atividades e Designações do Tratamento

Atividades e Designações do Tratamento

da Informação

da Informação



Indexação:

◦ representação do conteúdo do documento;

◦ atividade dos serviços de “indexação e resumo” (periódicos científicos).



Metadados:



Metadados:

◦ descrição física dos documentos em bibliotecas digitais;

◦ cumpre, nas bibliotecas digitais, papel semelhante ao da catalogação nas bibliotecas tradicionais.



Ontologias:

◦ organização dos recursos eletrônicos com base no conteúdo;

◦ atividade semelhante aos processos de catalogação, classificação e indexação, que são realizadas em bibliotecas tradicionais (DIAS; NAVES, 2007).

(9)

Atividades de Tratamento Temático da

Atividades de Tratamento Temático da

Informação

Informação



Há uma tendência em considerá-las (indexação, catalogação de

assuntos e classificação) sob uma única designação decorrente

de suas semelhanças:

◦ identificam o assunto do documento;

◦ traduzem esse assunto para uma linguagem de indexação

◦ traduzem esse assunto para uma linguagem de indexação (linguagem documentária);



Há, porém, diferenças:

◦ a classificação visa determinar um único local do documento na coleção/estante;

◦ a indexação e a catalogação de assunto podem indicar para um documento várias entradas num índice ou num catálogo (política de indexação) (DIAS; NAVES, 2007).

(10)

Instrumentos Usados no Tratamento da

Instrumentos Usados no Tratamento da

Informação

Informação



Tratamento descritivo:

◦ Catalogação: códigos de catalogação (Instruções Prussianas, Código de Panizzi, Código de Jewett e Código de Catalogação Anglo-Americano);

◦ Referências (bibliográficas): normas de descrição (NBR 6023/ABNT);

◦ Metadados: formatos de metadados (Dublin Core).



Tratamento Temático:



Tratamento Temático:

◦ Indexação: linguagens de indexação ou documentárias (Cabeçalhos de Assunto e Tesauros);

◦ Classificação: linguagens de indexação simbólicas ou sistemas de classificação bibliográfica e documentária (Classificação Decimal de Dewey e Classificação Decimal Universal);

◦ Resumo: normas de elaboração (NBR 6028/ABNT) (DIAS; NAVES, 2007).



Dias e Naves (2007) citam as tabelas de notação de autor (Cutter e

PHA) como instrumentos de representação temática, mas elas

apenas auxiliam aqueles na formação do número de chamada.

(11)

Produtos do Tratamento da Informação

Produtos do Tratamento da Informação



Registros bibliográficos (referência bibliográfica);



Registros catalográficos (ficha catalográfica);



Resumos (Abstracts e/ou Serviço de Indexação e Resumo);



Metadados (registros bibliográficos ou catalográficos de



Metadados (registros bibliográficos ou catalográficos de

documentos eletrônicos);



Pontos de acesso de catálogos (autor, título e/ou assunto);



Pontos de acesso de bibliografias (autor, título e/ou assunto);



Arranjo sistemático de coleções de documentos (a própria

(12)

A Indexação

A Indexação



O termo indexação assume dois sentidos na literatura:

◦ indexação (lato sensu): construção de índices (autores, títulos e assunto), em livros, catálogos ou bancos de dados;

◦ indexação (sticto sensu): pontos de acesso ou catalogação de assunto das informações contidas em documentos.



Na literatura de língua inglesa:



Na literatura de língua inglesa:

◦ indexação back-of-book: no final do livro (mais exaustiva);

◦ indexação acadêmica: base de dados de resumo e catálogos de bibliotecas (menos exaustiva).



Etapas da indexação (abordagem clássica):

◦ extração dos conceitos representativos;

◦ tradução (instrumentos de indexação – linguagens de indexação ou linguagens documentárias).

(13)



Etapas da indexação:

◦ análise do assunto do texto;

◦ expressão do conteúdo do assunto nas palavras dos indexadores (linguagem natural);

◦ tradução para um vocabulário de indexação;

◦ expressão do assunto em termos de índice (CHU; O’BRIEN, 1993 apud DIAS; NAVES, 2007, p. 28).

Processos da Indexação

Processos da Indexação

apud DIAS; NAVES, 2007, p. 28).



A literatura dá maior destaque ao processo de tradução,

sobretudo, as linguagens de indexação e

classificação/documentárias (elaboração e uso);



Pouca literatura sobre como os indexadores decidem sobre o

assunto do documento (sobre o que ele trata) – processo de

análise da informação.

(14)



Dificuldades na indexação:

◦ processo subjetivo;

◦ percepções diferentes dos indexadores:

 o efetivo conteúdo do documento;

 a parte desse conteúdo que poderá responder às necessidades dos usuários;

Processos da Indexação

Processos da Indexação

usuários;

 os conceitos importantes que devem ser selecionados para representar esse conteúdo;

 os descritores definidos para representar esses conceitos (STREHL, 1998 apud DIAS; NAVES, 2007).

?

? ?

(15)



Necessidade de política de indexação:

◦ cobertura (especificidade e exaustividade);

◦ coeficientes de recuperabilidade (revocação e precisão).



Consistência na indexação:

◦ medida de similaridade (concordância) entre termos atribuídos por diversos indexadores a um mesmo documento;

Processo da Indexação

Processo da Indexação

por diversos indexadores a um mesmo documento;

◦ ponto crítico em todo o processo de indexação (subjetividade);



Inconsistência na indexação:

◦ medida de variação de termos atribuídos a um mesmo documento por mais de um indexador (lista de indexação);

◦ diferentes indexadores atribui diferentes termos indexadores a um mesmo documento;

◦ localiza-se, principalmente, no momento da expressão (verbalização) dos conceitos (níveis de especificidade).

(16)



Relevância na indexação:

◦ julgamento feito pelo usuário diante do resultado da busca em SRI;

◦ conexões entre as situações de usuários (questão feita pelo usuário) e informação contida nos documentos (resposta dada pelo SRI);

Processo de Indexação

Processo de Indexação

pelo SRI);

◦ avaliação da satisfação do usuário em relação à representação do documento. Questão representação da necessidade de informação Documento representação do conteúdo do documento Relevância

(17)



A análise e a representação da informação constituem o

processo de indexação;



Análise da informação:

◦ determinação do conteúdo de um documento.;

◦ identificação dos conceitos centrais do conteúdo do documento.



Representação da informação:

◦ atribuição de termos representativos desses conceitos

Processos de Análise e Representação

Processos de Análise e Representação

◦ atribuição de termos representativos desses conceitos (linguagem natural);

◦ tradução desses termos em linguagem do SRI (vocabulário controlado).



Funções dos processos de análise e de representação da

informação:

◦ construção de pontos de acesso/índices /catálogos (meio);

(18)

Análise e Representação da Informação

Análise e Representação da Informação

De que trata o documento? - determinação do

conteúdo;

Análise da Informação

Como representar este conteúdo? - atribuição de termos àqueles conceitos; Representação da Informação Documento

Esquema do Indexador

Catálogo* conteúdo; - extração de conceitos. àqueles conceitos; - tradução do termos em LI/LD. - Seleção de materiais de informação; - Formação de acervos; - Desenvolvimento de acervos. -Seleção de fontes de informação; - Formação de coleções; - Desenvolvimento de coleções. Vocabulário Controlado *impresso ou on-line.

(19)

Análise e Representação da Informação

Análise e Representação da Informação

Qual minha necessidade de informação?

- determinação do conteúdo;

Análise da Informação

Como representar este conteúdo? - atribuição de termos àqueles conceitos; Representação da Informação Necessidade de informação

Esquema do Usuário

Catálogo* conteúdo; - extração de conceitos. àqueles conceitos; - tradução do termos em LI/LD. - Seleção de materiais de informação; - Formação de acervos; - Desenvolvimento de acervos. - Seleção de fontes de informação; - Formação de coleções; - Desenvolvimento de coleções. Controle de vocabulário (catálogo) *impresso ou on-line.

(20)



Linguagem de indexação/linguagem documentária: conjunto de

termos e/ou símbolos usados para determinar/representar

classes de assuntos em SRI;



Componentes básicos:

◦ vocabulário (termo propriamente dito): relação dos termos e/ou símbolos empregados na representação temática do documento:

 controle semântico ou de significado.

Linguagem de Indexação/Documentária

Linguagem de Indexação/Documentária

 controle semântico ou de significado.

◦ sintaxe (estrutura frásica): regras para a combinação de termos e/ou símbolos que representam os documentos:

 estabelece regras sobre o uso dos termos indexadores;

 revela relações existentes entre os conceitos e os termos da linguagem de indexação;

 controle estrutural por intermédio da coordenação conceitos simples para representar conceitos compostos (especificar e definir ordem de citação, por exemplo).

(21)



O uso de linguagem natural pode acarretar diversos problemas:

◦ dispersão terminológica;

◦ dispersão sintática.



O controle de vocabulário ou o uso de LI/LD diminui essa

dispersão a um nível aceitável:

◦ controle de relações semânticas;

◦ controle de relações sintáticas (PINTO, 1985)

Linguagem de Indexação/Documentária

Linguagem de Indexação/Documentária

◦ controle de relações sintáticas (PINTO, 1985)



Classificação das LI/LD:

◦ evolução histórica (conceito de coordenação):

 tradicionais (pré-coordenadas). Ex.: Os cabeçalhos de assunto , os sistemas de classificação (CDD, CDU);

 modernas (pós-coordenadas). Ex.: Os tesauros. ◦ Ordenação:

 sistemas alfabéticos. Ex.: Os cabeçalhos de assunto.

 sistemas classificados. Ex.: Os sistemas de classificação (CDD, CDU) (CESARINO; PINTO, 1978).

(22)



Indica o termo alternativo ou substitutivo na relação;



Evidencia-se na própria definição do termo;



Subtipos de relações semânticas:

◦ Equivalências: fornecem termos substitutivos (“ver”, “use” “see” ou “X”):

 sinônimo e antônimo (adubos x fertilizantes);

 quase sinônimo (datiloscopia x impressão digital);

Relações Semânticas

Relações Semânticas

 quase sinônimo (datiloscopia x impressão digital);

 grafias diferentes (contact x contato);

 abreviaturas e acrônimos (ONU x Organização das Nações Unidas);

 traduções (recall x revocação);

 ordem de citação (automação de bibliotecas x biblioteca, automação de).

◦ Hierárquicas: fornecem termos alternativos (“ver também”, “use também”, “see also” ou “XX”) – exprimem o posicionamento de um conceito em relação a outro.

(23)

◦ Hierárquicas (continuação):

 gênero x espécie:

a) quase-genérica (gato x animal de estimação)

b) genérica (gato x mamífero)

 todo x parte (aparelho respiratório x pulmão).

◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia

Relações Semânticas

Relações Semânticas

◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia de busca:

 coordenação (porta x janelas);

 genética (pai x filho);

 concorrente (educação x ensino);

 causa e efeito (ensino x aprendizagem);

 instrumental (medicina preventiva x vacinação);

 material (esquadrias x alumínio);

(24)

Relações Sintáticas

Relações Sintáticas



Indica a relação entre os termos que representam o assunto;



Necessidade de se recuperar a interseção entre dois ou mais

conceitos:

◦ assuntos simples (um único conceitos);

◦ assuntos compostos (dois ou mais conceitos).



As relações sintáticas são temporárias: dependem do

documento;

documento;



Definem a importância dos termos numa estrutura frásica

(ordem de citação):

Ex.: Uso do procedimento em cadeia para acesso aos conceitos ocultos (Ranganathan):

1 - NORMAS PARA FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO 2 - FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO – NORMAS PARA 3 - ESQUADRIAS DE ALUMÍNIO - NORMAS PARA FUNDIÇÃO DE 4 - ALUMÍNIO – NORMAS PARA FUNDIÇÃO DE ESQUADRIAS (PINTO,1985).

(25)



Cutter em 1876:

◦ regra: usar a ordem da linguagem natural. Ex. Biblioteca Universitária;

◦ cabeçalho invertido: quando o segundo termo do cabeçalho composto for notoriamente mais significativo (subjetividade). Ex. Bibliotecas, Planejamento de.

Relações Sintáticas: ordem de citação

Relações Sintáticas: ordem de citação

“O MAIS SIGNIFICATIVO” – “O MENOS SIGNIFICATIVO”

Ex. BIBLIOTECONOMIA - HISTÓRIA



Kaiser em 1911: buscou maior consistência:

CONCRETO – PROCESSO (PINTO, 1985) Ex. BIBLIOTECA – PLANEJAMENTO.

(26)



Coates em 1960 – teoria da concretividade decrescente:

COISA depois a AÇÃO

Ex. BIBLIOTECA – PLANEJAMENTO;

Introduzindo o elemento “material”:

Relações Sintáticas: ordem de citação

Relações Sintáticas: ordem de citação

Introduzindo o elemento “material”:

COISA – MATERIAL – AÇÃO e

Ex. BIBLIOTECA – LIVROS - SELEÇÃO;

Dependente da coisa: parte, tipo ou propriedade:

COISA – PARTE – MATERIAL – AÇÃO (PINTO, 1985).

(27)



Conceito: palavras ou grupos de palavras que expressam o

conteúdo de um documento;



Necessidade de controle de linguagem:

◦ fatores humanos (autores, indexadores e usuários):

 diferenças de cultura;

 experiência dos autores;

Cabeçalho de Assunto: aspectos gerais

Cabeçalho de Assunto: aspectos gerais

 domínio da terminologia.

◦ fatores lingüísticos:

 sinônimos: vários termos designam o mesmo conceitos;

 homógrafos: o mesmo termo designam conceitos diferentes;

 sintaxe: o sentido dos termos é condicionado pela posição que este ocupa na frase.

◦ fatores hierárquicos: um conceito implica em outros mais amplos e/ou mais restritos (CESARINO, PINTO, 1978).

(28)



Funções dos cabeçalhos de assunto num SRI:

◦ representar o assunto de maneira consistente;

◦ permitir a coincidência entre linguagem do indexador e linguagem do pesquisador;

◦ possibilitar o indexador modular o nível de sua pesquisa do mais geral para o mais específico, e vice-versa, segundo a necessidade do usuário.

Cabeçalho de Assunto: funções e princípios

Cabeçalho de Assunto: funções e princípios

necessidade do usuário.



Princípios de elaboração dos cabeçalhos de assunto:

◦ princípio específico: os assuntos devem dar entrada por termos específicos;

◦ princípio de uso: os assuntos seguem o princípio da conveniência do usuário;

◦ princípio sindético: os assuntos devem ser interligados por uma rede bem construída de referências cruzadas (ver e ver também) (CESARINO ; PINTO, 1978).

(29)

Características do Cabeçalho de Assunto

Características do Cabeçalho de Assunto

(30)

Medidas das Linguagens de Indexação

Medidas das Linguagens de Indexação

(31)

Medidas das Linguagens de Indexação

Medidas das Linguagens de Indexação

(32)

Medidas das Linguagens de Indexação

Medidas das Linguagens de Indexação

(33)

Medidas das Linguagens de Indexação

Medidas das Linguagens de Indexação

(34)

Medidas das Linguagens de Indexação

Medidas das Linguagens de Indexação

(35)



Pode-se adotar duas abordagens:

◦ abordagem analítica:

 garantia literária;

 participação do usuário;

◦ abordagem formal:

Cabeçalho de Assunto: elaboração

Cabeçalho de Assunto: elaboração

◦ abordagem formal:

 trabalho de especialistas;

(36)

Referências

Referências

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6028: informação e documentação – resumo – apresentação. Rio de Janeiro: ABNT, 2003. 2p.

CESARINO, M. A. N. Sistemas de recuperação de informação. Revista da Escola de

Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 157-168, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.

______; PINTO, M. C. M. Cabeçalho de assunto como linguagem de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 7, n. 2, p. 268-288, set. 1978. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011. DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e prática. Brasília: Teshaurus, 2007. 116p.

DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. 119p.

LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos Livros, 2004. 347p.

PINTO, M. C. M. F. Análise e representação de assuntos em sistemas de recuperação de informação; linguagens de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 169-186, set. 1985. Disponível em:

Referências

Documentos relacionados

Macaíba); Instrutor Letras (Língua Portuguesa) – Senac Natal e Macaíba; Instrutor Letras (Língua Espanhola) – Senac Assú e Macaíba; Instrutor de Matemática

OBJETO: Aquisição de Gêneros Alimentícios da Agricultura Familiar para Alimentação Escolar, para alunos da rede de educação básica pública, verba FNDE/PNAE, 1º e 2º semestres

Este sistema de DVD permite retomar a reprodução do disco a partir do ponto da última paragem (apenas possível para os últimos 10 discos gravados sem menu).. A Carregue um

Argumentou o representante que o PV teria utilizado o espaço destinado à difusão do ideário programático, de mensagens aos filiados, de sua posição sobre temas

Estudos (8,15,17) que utilizaram instrumentos semelhantes ao adotado na presente pesquisa, para avaliar as estratégias de aprendizagem entre alunos do ensino a

HÖFLE GPS SPA/ BOSSA ART GS1 PORTUGAL JOSE NEVES MPACK NEFAB ONE WORLD PACKAGING PACK 4 EMBALAGEM PACKWORKS POLIPOP - ESPUMAS TÉCNICAS PSAPLAST RAJAPACK SAFESOL SCHUR SEALED

Trabalho empírico; Pesquisa; Palavras-chave; Informação quantitativa; Informação documental Ferramentas de pesquisa; Avaliação de resultados; Fontes de

Tipos de variáveis e dados Dados Qualitativos Categorias nominais Dados agrupados categorias Dados individuais Dados agrupados classes categorias Categorias ordinais Dados