As duas faces da reconfiguração dos catálogos: FRBR e web semântica

Regras e códigos de catalogação

3.3 Síntese da literatura

3.3.1 Sobre a função, circunstância e relevância dos catálogos bibliográficos

3.3.1.5 As duas faces da reconfiguração dos catálogos: FRBR e web semântica

Na literatura mais recente em que se enquadram as questões dos catálogos bibliográficos existem dois temas primordiais: por um lado, a exploração das vantagens e experimentação com o modelo FRBR; por outro, a necessidade cada vez mais premente de alinhamento com os rápidos desenvolvimentos da WWW. Sendo temas com motivações, cronologias e âmbitos diferentes – no primeiro caso de ordem essencialmente interna ao catálogo procurando a sua eficiência local e, no segundo, de natureza exógena, adveniente de fatores de arquitetura da própria WWW – não deixam de estar associados, concorrendo mutuamente para aspetos que acabam por ser confluentes.

No que respeita ao modelo FRBR, são ainda as questões relacionadas com a melhoria da visualização dos dados bibliográficos nos OPAC que imperam, através da exploração das vantagens do modelo para um acesso mais eficiente à informação bibliográfica: para, por exemplo, evitar a dispersão da informação sobre a mesma obra por um sem número de registos (Carlyle, 2006), dar uma colocação mais lógica às referências ao nível da obra e da expressão (Bowen, 2005), reduzir o número de pesquisas redundantes e facilitar a visualização eficaz de conjuntos de registos relacionados (Allgood, 2007).

Estudos de utilizador, desenvolvidos por Pisanski e Žumer (2010a, 2010b, 2012)77 e Zhang e Salaba (2012)78, confirmam a utilidade do modelo FRBR e da sua implementação nos catálogos. A carência destes estudos já tinha sido apontada por Madison (2005), alertando para o facto do modelo FRBR ter sido aceite como fio condutor para novos Princípios Internacionais de catalogação (2009) sem no entanto,

77_{Os estudos focaram apenas o material “livro” e as relações do Grupo1 do modelo FRBR.} 78

Estudo de utilizador com base na análise de três dos primeiros catálogos baseados em FRBR (WorldCat, Fiction-Finder, e Library Labs of Libraries Australia).

Parte I – Objeto e metodologia de investigação 100

devido a pressões temporais e financeiras, ter havido um estudo de utilizador específico durante a sua criação.

As múltiplas experiências de FeRBeRização mostram que, apesar de alguns problemas motivados por inconsistências nas bases de dados, diferentes normas de catalogação e práticas locais, a conversão dos catálogos é possível mas não é trivial (Hegna e Murtomaa, 2002; Hickey e O'Neill, 2005; Zumer e outros, 2011), o que pode explicar o prolongamento de uma fase essencialmente experimental, isto é, continuando sem se atingir uma implementação em larga escala do modelo.

Embora o desenvolvimento do modelo FRBR seja anterior ao surgimento das iniciativas que concretizam a web semântica, não tendo por isso, na origem, uma relação direta, não deixa de surgir muito frequentemente relacionado com os objetivos e os normativos dessa nova realidade da WWW. O que explica essa relação é o facto de o modelo se basear numa metodologia analítica de E-R (Entidade-Relação) que facilita a compreensão da natureza e constituição do universo dos dados bibliográficos de uma forma que muito se aproxima dos conceitos e práticas de modelação subjacentes a tecnologias de bases de dados e à formulação dos normativos da web semântica (Coyle, 2010c; Dunsire, 2010a). Por outro lado, ao favorecer a explicitação clara das entidades, atributos e relações do universo bibliográfico, o modelo FRBR favorece também a sua desagregação face ao registo bibliográfico, tornando mais fácil, pelo menos conceptualmente, o seu alinhamento com as normas da web semântica e mais evidente o seu potencial nesse domínio (Coyle, 2010g).

É por estas razões que o modelo FRBR passa a surgir frequentemente como elemento importante da reconfiguração dos catálogos face à evolução da WWW. Para acompanhar essa evolução e recuperar o alcance e relevância da informação estruturada que os catálogos encerram torna-se essencial que essa informação seja reconfigurada para participar na web, isto é, assumindo formas de disponibilização aberta e transparente na rede que permitam a sua reutilização por outros sistemas para além dos do seu próprio setor, ou seja, num contexto mais alargado sem exigir

Parte I – Objeto e metodologia de investigação 101

conhecimentos especializados dos normativos que especificamente determinam a sua estrutura e significados.

O contexto conceptual que encerra este desígnio é o da chamada web semântica (Berners-Lee, Hendler e Lassila, 2001), em que documentos, suas partes componentes e dados das bases de dados são definidos, expressos e interligados de modo a permitir, para além da apresentação da informação, a compreensão e processamento por máquinas que possibilite uma integração funcional e reutilização dos dados por diferentes aplicações de software.

É neste contexto, em que a estrutura e significado dos dados na Web deve ser acessível não só a pessoas mas também a sistemas, que surgem e se generalizam normativos como o XML79 o RDF80 e extensões destes para representações de tipologias específicas de dados estruturados como, por exemplo, SKOS81 e OWL (Web Ontology Language) respetivamente para partilha na Web de instrumentos de organização do conhecimento expressos de forma simples, ou ontologias formais processáveis por máquina e capazes de inferências. Numa perspetiva da WWW como espaço aberto para publicação, descoberta, navegação e reutilização de dados, generalizou-se, como elemento da chamada web semântica, a prática de disponibilização de dados na forma de dados ligados (linked data), com base em URI82 e RDF.

Genericamente, XML refere-se a um conjunto de especificações para representação textual de dados que ultrapassa as limitações do HTML, providenciando estruturas extensíveis de elementos, subelementos e atributos que são normalmente declarados na rede através de um esquema XML que fornece a informação sobre o significado e outras características dos dados, facilitando assim a sua compreensão e utilização. Ver mais informação em: http://www.w3.org/XML/.

RDF (Resource Description Framework) é um modelo de dados e uma sintaxe expressos em XML, para representar informação sobre recursos na Web, isto é, metadados, usando URI (Uniform Resource Identifiers) para nomear/identificar entidades e atributos. Associado a um esquema de dados (RDFS- RDF Schema) permite declarar de forma normalizada o nível semântico dos vocabulários usados nos metadados. Para mais informação ver: http://www.w3.org/RDF/.

SKOS (Simple Knowledge Organization System) é um modelo de dados RDF especificamente concebido para registo e partilha de tesauros, taxonomias, sistemas de classificação, etc.. Para mais informação ver: http://www.w3.org/2004/02/skos/specs.

82_{URI (Uniform Resource Identifier) é uma cadeia de carateres usada para denominar/identificar} inequivocamente um recurso na internet, de acordo com regras e sintaxe próprias. Ver Berners-Lee, Fielding e Masinter (2005), em: http://www.ietf.org/rfc/rfc3986.txt.

Parte I – Objeto e metodologia de investigação 102

A web semântica passou a ter destaque na literatura biblioteconómica surgindo em números especiais de revistas como a Cataloging & Classification Quarterly

(“Knitting the Semantic Web”, 2007) ou a Library Technology Reports (“Understanding

the Semantic Web: bibliographic data and metadata”, 2010), realçando o potencial dos dados bibliográficos para o desenvolvimento da web semântica, os modos da sua transformação para esse efeito e também os benefícios que daí podem advir para as bibliotecas; e em conferências e grupos de interesse promovidos por bibliotecas (por ex., British Library (2007) com a Data Model Meeting)83, associações como a IFLA (para além de comunicações em conferências desde 2008, ver por ex. IFLA ISBD/XML Study Group, estabelecido em 2008 84 e IFLA Semantic Web Special Interest Group85, estabelecido em 2011), ou o próprio World Wide Web Consortium (W3C Library Linked Data Incubator Group, 2010-2011)86.

Na bibliografia recente que se centra na análise da componente base do catálogo – o registo bibliográfico – cada vez mais se coloca a questão da evolução da função e relevância do catálogo na rede passar pela web semântica por recurso ao modelo de dados RDF, quer na exposição de dados na rede quer na própria reformulação dos processos de produção desses mesmos dados, nas operações de catalogação (Hillmann, 2008a, 2012; Harper, 2009; Hellman, 2009; Yee, 2009; Bowen, 2010; Hillmann e outros, 2010; Dunsire, 2010a, 2010b, 2011a, 2011b; Willer, Dunsire e Bosancic, 2010; Dunsire e Willer, 2011a; Coyle, 2012; Dunsire e outros, 2012; Hillmann, Dunsire e Phipps, 2013; Mitchell, 2013; Tillett, 2013b).

Entre os exemplos mais conseguidos de alinhamento e participação dos dados bibliográficos das bibliotecas na web semântica é o do portal VIAF – Virtual International Authority File87, que de experiência de partilha de dados de autoridade já evoluiu para serviço colaborativo em operação (Tillett, 2004c; O'Neill e Bennett, 2004;

Disponível em: http://www.bl.uk/bibliographic/meeting.html. 84

Atualmente designado “ISBD Linked Data Study Group”. Ver mais informação em:

http://www.ifla.org/node/1795. 85

Ver mais informação em: http://www.ifla.org/swsig. 86

Ver mais informação em: http://www.w3.org/2005/Incubator/lld/.

Parte I – Objeto e metodologia de investigação 103

Bennett e outros, 2006; Hickey, 2009), e que agrega registos de autoridade de um conjunto alargado de agências bibliográficas e os disponibiliza como dados ligados (Hickey, 2011) associados a outros dados ligados exteriores ao domínio das bibliotecas como é o caso, por exemplo, da DBpedia88, uma extração de dados ligados da Wikipedia.

3.3.2 Sobre o aparato normativo subjacente aos catálogos bibliográficos

No documento Estruturas conceptuais e técnicas de gestão bibliográfica (páginas 127-131)