• Nenhum resultado encontrado

QUESTÕES DE COMPETÊNCIA DA ONTOLOGIA DE REFERÊNCIA PARA

1.2 DESCRIÇÃO DO PROBLEMA

Esta pesquisa trata de periódicos científicos digitais, sua evolução, seu uso em redes e sua situação no atual ambiente em que se tornou a Web, reconhecida hoje como o maior repositório de informações.

O surgimento do primeiro periódico em 1665 e sua evolução no transcorrer dos tempos, mostra que os periódicos acompanharam a evolução das ciências e dos recursos existentes em cada época, adequando-se a cada novo mecanismo, recurso, exigência, gerando estudos e pesquisas dentro de suas áreas de atuação (ROYAL SOCIETY, 2009). Percebe-se que as ações eram fechadas e específicas em suas áreas. A Figura 1.1 configura a evolução da comunicação científica.

Figura 1.1 – Esquema demonstrativo da evolução da comunicação científica Fonte: A autora.

A comunicação científica em si caracteriza-se como um amplo campo de pesquisa, por sua tradição, multidisciplinariedade e constante inovação. Assim, leva-se em consideração e de forma globalizada, que todas as investigações, sistemas e processos não são únicos ou universais, como afirma Bjork (2007), a comunicação científica é um sistema de informação global, corroborado por Guédon (2010) quando destaca que a ciência é para todos, mas cabe a cada um adequá-la a sua realidade e necessidade.

A partir da década de 90, as tecnologias de informação e comunicação sobressaem-se e ocorrem mudanças no modo como professores, pesquisadores e cientistas usam, produzem e disseminam informações, em suas áreas específicas, e que são acessadas por todas as demais áreas, conforme discorrem Bailey e Burd (2006) e Giannasi- Kaimen e Carelli (2010), onde a Web se tornou um dos mais importantes métodos de comunicação em um período curto de tempo. E, falando de comunicação e publicação – tudo está na Web, o desafio é encontrar.

Para encontrar dados relevantes na Web existem os sistemas de recuperação de informações, que evoluem constantemente, adotando estratégias inovadoras e de gestão na organização de informações, buscando recursos tecnológicos avançados e cooperantes que possibilitam a organização, tratamento e disseminação de informações, semanticamente tratadas e interoperáveis.

Entre as ferramentas para o tratamento e organização de informações encontram-se as classificações, tesauros, taxonomias, sendo precursores Melvil Dewey, Paul Otlet e Ranganathan, entre outros e, mais recentemente, com a Web Semântica ocorreu à eclosão de ontologias que, para Gruber (1996), trata-se da representação de uma conceitualização, um conjunto de conceitos estudados e especificados sobre uma determinada área de domínio. Para Guarino (1998) é um conjunto de axiomas lógicos, concebido para ter em conta o significado de um vocabulário específico, ou seja, destinado a uma única área do conhecimento.

Na área da Ciência da Informação, Almeida e Bax (2003, p. 9) baseando-se Gruber (1996) apresentam uma definição para ontologia, que trata de uma “especificação formal e explícita de uma conceitualização compartilhada”. Nesta definição, formal significa legível para computadores; especificação explícita refere-se a conceitos, propriedades, relações, funções, restrições, axiomas, explicitamente definidos; compartilhado quer dizer conhecimento consensual; e

conceitualização diz respeito a um modelo abstrato de algum fenômeno do mundo real.

Os mecanismos de buscas – agentes automatizados – se aperfeiçoam, passando a utilizar recursos da área da inteligência artificial e despontam como soluções para o problema de buscas eficazes com o uso da Web Semântica. A criação desses mecanismos, na visão de Lassila (1997, p. 2), “permite uma descrição mais precisa e conceitual das coisas que estão na Web e isto poderia elevar o status da Web de legível-por-máquina para algo que poderia chamar de compreensível-por-máquina”. Embora esta afirmação tenha mais de dez anos, a visão da autora reflete os anseios e desejos de pesquisadores que vêem nos recursos tecnológicos as soluções para recuperar informações relevantes, precisas e rápidas.

Os recursos tecnológicos disponibilizados, tanto em hardware como em software específicos, com o advento do movimento de acesso livre e arquivos abertos modificam o processo de editoração de publicações científicas. Disponibilizar, recuperar e preservar são assuntos que têm sido tema de pesquisas e investigações em diversas áreas do conhecimento como a da Ciência da Computação, em especial a Engenharia e Gestão do Conhecimento e da Ciência da Informação.

A elaboração de ferramentas destinadas ao tratamento, organização e recuperação de informações, entre elas as ontologias, demanda parcerias entre áreas do conhecimento e multidisciplinaridade, pois envolvem conhecimentos organizacionais, linguísticos e tecnológicos (manuseio de softwares). E isso é estudado e analisado constantemente em todas as áreas, como pode ser exemplificado com a publicação de Robredo e Bräscher (2010), que representa e recupera a evolução da representação, organização e tratamento da informação e, consequentemente do conhecimento.

A interação entre as áreas e a interdisciplinaridade entre pesquisadores vem sendo práticas em universidades e centros de pesquisas, como demais instituições, uma vez que, com a abrangência e interação entre todas as áreas científicas, proporcionada pelas tecnologias, requer que as pessoas estejam inseridas num universo de conhecimento mais amplo, ou seja, dominando sua área de formação, mas com domínio em áreas correlatas.

Por isto, a maioria dos países tem coordenado trabalhos multidisciplinares, como World Wide Web Consortium (W3C), Organização das Nações Unidas (UNESCO), International Federation of Library Associations (IFLA), National Information Standards Organization (NISO), Joint Information Systems Committee (JISC),

Joint Academic NETwork (JANET) e os disponibilizados, em acesso livre, bem como publicações, modelos e padrões para a Web Semântica, para construção de ontologias.

Por outro lado, o desenvolvimento de ontologias requer recursos tecnológicos estruturados semanticamente e migrados para as linguagens específicas como Hypertext Markup Language (HTML); eXtensible Markup Language (XML); eXtensible Hypertext Markup Language (XHTML); Resource Description Framework (RDF); Web Ontology Language (OWL), entre outras (ALMEIDA, 2003; CAMPOS, 2008).

Desta forma, há necessidade da adoção de padrões internacionais para a interoperabilidade entre os sistemas de informação, existindo entre eles o Machine Readable Cataloging (MARC), o Dublin Core Metadata Initiative (Dublin Core), Structured Markup Language (SGML), Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH), Standard for Learning Object Metadata (IEEE-LOM) e o UK Learning Object Metadata Core (UK LOM Core) (ZENG; CHAN, 2009).

Os recursos informacionais1 já existentes, para serem incorporados na Web, necessitam adotar e/ou otimizar padrões, que possibilitam a interoperabilidade e a inferência para uma recuperação relevante.

Diante do exposto, questiona-se que formatos, padrões, normas e recursos tecnológicos seriam possíveis para compor um periódico, de cunho científico, quanto à sua estrutura? Que informações e/ou dados são necessários para que o periódico seja indexado em fontes de informação referenciais? Que ferramentas ou recursos ontológicos seriam essenciais para utilizar na configuração, gestão, manutenção e disseminação de um periódico científico digital?

Dessa maneira, o universo da investigação desta tese está circunscrito à compreensão de como a identificação, definição, compilação e demonstração de um conjunto de metadados para periódico científico digital, promoveria sua qualificação, validação e visibilidade diante da universalidade das ciências, possibilitando sua interoperabilidade e recuperação eficazes, conforme representado na Figura 1.2.

1“Expressão geral que indica o conjunto dos meios utilizados na transferência de documentos,

Nas investigações sobre formas para implementar o conjunto de metadados e diante das opções da Web Semântica, encontrou-se recursos que visam a interoperabilidade entre os diversos sistemas de recuperação de informações, que buscam garantir uma recuperação mais relevante e precisa e, entre esses recursos estão as ontologias. Passou-se então, a estudar se a ontologia poderia implementar o conjunto de metadados para periódicos científicos digitais, objeto dessa pesquisa, proporcionando melhorias na recuperação de informações científicas contidas em periódicos.

Tomando por base que a padronização é uma condição necessária para o entendimento das representações, sejam elas estruturais, convenções, sintaxe e significado consensual dos metadados, questiona- se se, dentre a gama de normas e padrões, formatos e linguagens existentes e utilizáveis na área da comunicação científica, quais são os metadados para padronização dos periódicos científicos digitais que possibilitam a interoperabilidade, inferência e inserção dos mesmos nas

fontes referenciais, por meio do uso de ferramentas ontológicas2 que

proporcionem melhor recuperação dos mesmos na Web? 1.3 OBJETIVOS

1.3.1 Objetivo geral

Propor um conjunto de metadados para periódico científico digital, possibilitando a interoperabilidade por meio do uso de ferramenta ontológica.

1.3.2 Objetivos específicos

a) Identificar metadados para periódico científico digital;

b) Compilar a lista de metadados para periódico científico digital com padrões e formatos existentes;

c) Comparar os metadados selecionados com critérios de avaliação de fontes de informação referenciais;

d) Elaborar uma ontologia de referência com os metadados padronizados;

e) Apresentar a ontologia de referência para periódico científico digital, utilizando a plataforma Protégé e cenários de aplicabilidade.