6 METODOLOGIA
6.1 P ROCEDIMENTO M ETODOLÓGICO
6.1.2 Instrumento de Coleta de Dados
6.1.2.1 Elaboração do protocolo
Com a sustentação teórica e a definição da metodologia, foi possível traçar as etapas e os procedimentos a serem realizados para a consecução desta pesquisa, que é a análise dos RIs em busca de elementos que potencializem a interoperabilidade semântica.
A utilização de um protocolo de coleta de dados buscou orientar e regular a estratégia de pesquisa, com o objetivo de garantir que os resultados possam ser replicados (CALAZANS, 2007).
O protocolo de coleta de dados é composto por:
a) roteiro para a análise dos RIs contemplando os aspectos observados e identificados retratados em um relatório final, destacando as seguintes informações: forma de arquivamento, responsáveis pelo arquivamento, tipo de material aceito para publicação, identificação dos metadados descritivos e existência de política de informação, principalmente no que se refere ao fluxo de submissão para auxiliar não somente os procedimentos, mas também instrumentos que facilitam essas submissões (APÊNDICE A);
b) planilha para identificação de instrumentos e elementos da representação temática, referenciados pela literatura como facilitadores da interoperabilidade (APÊNDICE B). De posse dessa planilha, os RIs selecionados foram analisados para a identificação dos metadados descritivos e elementos da representação temática adotados. Essas informações foram obtidas por meio da visualização da descrição completa dos metadados de cada tipo de documento disponibilizado pelo RI.
Buscaram-se também informações disponíveis nos sites para identificação dos procedimentos ou políticas adotadas pelo RI na perspectiva da organização do conhecimento
Definição de parâmetros para a análise dos repositórios
Ao partir da premissa de que a adoção de padrões de tratamento da informação no ambiente digital possibilita a interoperabilidade semântica com outros sistemas e mecanismos de busca, foi analisado o elemento dos metadados descritivos assunto (dc.subject), um dos 15 elementos do padrão DC (Quadro 10), e seus valores, por entender que eles viabilizam procedimentos que maximizam a integração de fontes diversificadas e heterogêneas de informação entre os sistemas.
As categorias de assunto podem se apresentar segundo a classificação ou a indexação dos documentos. Os procedimentos de descrição temática permitem que os documentos sejam dispostos de acordo com o interesse dos usuários do sistema de informação ou com as tarefas que estes sistemas oferecem. Essa descrição pode servir de base para associar uma descrição ao conhecimento prévio do usuário que busca informação na interface do sistema [...] (MONTEIRO, 2008, p. 83).
Em se tratando das estruturas de organização e das diferentes ‘ligações’ que podem se estabelecer entre conteúdos [...], é pertinente a correlação entre estes elementos e os padrões, instrumentos ou esquemas utilizados na descrição física ou temática [...] (MONTEIRO, 2008, p. 83).
Quadro 10 Elementos metadados Dublin Core
ELEMENTOS DESCRIÇÃO
Title
(Título) Nome atribuído ao recurso. Creator
(Autor) A principal entidade responsável pela criação dos conteúdos do recurso. Normalmente, o nome de um “Creator” deverá ser utilizado para indicar a entidade
Subject (Assunto)
O assunto do recurso. Normalmente, o elemento “subject” será expresso como palavras-chave, frases-chave ou códigos de classificação que descrevam o conteúdo intelectual do recurso
Description
(Descrição) Informação sobre o conteúdo do recurso. A descrição pode incluir resumo, sumários, referências a representações gráficas do conteúdo e texto livre com informação do conteúdo, entre outros dados
Publisher (Editora)
Uma entidade responsável pela disponibilização dos recursos. Uma pessoa, uma organização ou um serviço podem constituir exemplos de editor. Normalmente, o nome de um editor deverá ser utilizado para mencionar a entidade
Contributor
(Colaborador) Uma entidade responsável por realizar contributos para o conteúdo do recurso. Uma pessoa, uma organização ou um serviço podem constituir exemplos de um colaborador. Normalmente, o nome de um colaborador deverá ser utilizado para referenciar a entidade
Date
(Data de publicação)
A data referente a um evento no ciclo de vida do recurso. Normalmente, a data está associada à criação ou à disponibilização do recurso. A prática recomendada para codificar o valor data é definida na norma ISO 8601 [W3CDTF] e segue o formato YYYY-MM-DD
Type
(Tipo) O tipo de resultado científico do qual o recurso é uma manifestação. No elemento DC “type”, descreve-se o tipo de divulgação ou o tipo de conteúdo intelectual do recurso. Emprega-se para explicar ao utilizador que tipo de recurso se visualiza, se é um livro ou um artigo, se foi escrito para uso interno ou externo etc.
Format
(Formato) Manifestação física ou digital do recurso. Normalmente, o elemento “Format‟ pode incluir o tipo de meio ou as dimensões do recurso. O elemento “Format‟ pode ser utilizado para determinar o software, o hardware ou outro equipamento necessário para mostrar ou operar o recurso. Exemplos de dimensões são o tamanho e a duração. A prática recomendada é selecionar um valor de um vocabulário controlado (por exemplo, a lista de tipos de meios da Internet [MIME] que define os formatos para os equipamentos informáticos)
Identifier (Identificador)
Referência inequívoca do recurso num contexto determinado Source
(Fonte) Referência a um recurso do qual deriva o recurso atual Language
(Idioma) Idioma do conteúdo intelectual do recurso Relation
(Relação) Referência a um recurso relacionado Coverage
(Cobertura)
Extensão ou âmbito do conteúdo do recurso. Normalmente, a cobertura inclui a localização espacial (nome do lugar ou coordenadas geográficas), um período temporal (etiqueta de período, data ou intervalo de datas) ou a jurisdição (por exemplo, o nome de uma entidade administrativa)
Rights
(Direito) Informação sobre os direitos no recurso e sobre o recurso Audience
(Público) Um tipo de entidade para a qual o recurso é dirigido ou útil Fonte: Adaptado de Driver (2009)
No Quadro 11, são apresentados esquemas de codificação possíveis de serem utilizados para a representação temática.
Quadro 11 Esquemas de codificação para descrição temática
Term Name: CMIType
URI: http://purl.org/dc/terms/DCMIType Label: DCMI Type Vocabulary
Definition: The set of classes specified by the DCMI Type Vocabulary, used to categorize the nature or genre of the resource.
See: http://dublincore.org/documents/dcmi-type-vocabulary/ See: http://purl.org/dc/dcmitype/
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#DCMIType-003
Term Name: DDC
URI: http://purl.org/dc/terms/DDC
Label: DDC
Definition: The set of conceptual resources specified by the Dewey Decimal Classification. See: http://www.oclc.org/dewey/
Type of Term http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#DDC-003
Term Name: IMT
URI: http://purl.org/dc/terms/IMT
Label: IMT
Definition: The set of media types specified by the Internet Assigned Numbers Authority. See: http://www.iana.org/assignments/media-types/
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#IMT-004
Term Name: LCC
URI: http://purl.org/dc/terms/LCC
Label: LCC
Definition: The set of conceptual resources specified by the Library of Congress Classification. See: http://lcWeb.loc.gov/catdir/cpso/lcco/lcco.html
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#LCC-003
Term Name: LCSH
URI: http://purl.org/dc/terms/LCSH
Label: LCSH
Definition: The set of labeled concepts specified by the Library of Congress Subject Headings. Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme
Version: http://dublincore.org/usage/terms/history/#LCSH-003
Term Name: MeSH
URI: http://purl.org/dc/terms/MeSH
Label: MeSH
Definition: The set of labeled concepts specified by the Medical Subject Headings. See: http://www.nlm.nih.gov/MeSH/MeSHhome.html
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#MeSH-003
Term Name: NLM
URI: http://purl.org/dc/terms/NLM
Label: NLM
Definition: The set of conceptual resources specified by the National Library of Medicine Classification. See: http://wwwcf.nlm.nih.gov/class/
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#NLM-002
Term Name: TGN
URI: http://purl.org/dc/terms/TGN
Label: TGN
Definition: The set of places specified by the Getty Thesaurus of Geographic Names. See: http://www.getty.edu/research/tools/vocabulary/tgn/index.html
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#TGN-003
Term Name: UDC
URI: http://purl.org/dc/terms/UDC
Label: UDC
Definition: The set of conceptual resources specified by the Universal Decimal Classification. See: http://www.udcc.org/
Type of Term: http://purl.org/dc/dcam/VocabularyEncodingScheme Version: http://dublincore.org/usage/terms/history/#UDC-003
Como os metadados descritivos podem conter informações sobre um recurso, e essas podem estar baseadas em mais de um procedimento ou um elemento, a análise preestabelece a inclusão de elementos/qualificadores que não estejam definidos na planilha de análise.
Ainda nessa perspectiva, serão analisados os procedimentos técnicos de indexação, catalogação e categorização dos conteúdos informacionais.