• Nenhum resultado encontrado

Produção científica brasileira em Organização da Informação e do Conhecimento nas bases de dados bibliográficas Web of Science e Scopus

N/A
N/A
Protected

Academic year: 2021

Share "Produção científica brasileira em Organização da Informação e do Conhecimento nas bases de dados bibliográficas Web of Science e Scopus"

Copied!
15
0
0

Texto

(1)

Brazilian scientific production in Information and Knowledge Organization in bibliographic databases Web of Science and Scopus

Cibele Araújo Camargo Marques dos Santos (Universidade de São Paulo. Escola de Comunicações e Artes. Departamento de Biblioteconomia e Documentação, São Paulo, Brasil) – cibeleac@usp.br

Juliana Segato Delvalle (Universidade de São Paulo. Escola de Comunicações e Artes. Departamento de Biblioteconomia e Documentação, São Paulo, Brasil) –

julianasegatodelvalle@gmail.com

Maria Cristina Alves Silva Xavier (Universidade de São Paulo. Escola de Comunicações e Artes. Departamento de Biblioteconomia e Documentação, São Paulo, Brasil) –

mcxbiblio@gmail.com

Victor Hugo Delvalle Souza (Universidade Estadual Paulista, Brasil) ) – victorhugodelvallesouza@gmail.com

Abstracts: Displays mapping of scientific literature on the Information and Knowledge Organization (ICO) by Brazilian authors in the databases Web of Science and Scopus from articles published in Brazilian and international journals and event papers. It is objectived to get indicators of Brazilian research in the area, identified trends and analyzed visibility. The Information Science presents differentiated and interdisciplinary scientific communication, so scientific production has dispersed in various fields publications, which motivated this research in multidisciplinary databases as Web of Science (WOS) and Scopus. To identify publications by Brazilian authors and compose the corpus, the titles of the Brazilian indexed journals were surveyed, research conducted by authors and selectioned by subject. It were employed quantitative bibliometric methods and ICO procedures for data standardization, and the articles were indexed with a controlled vocabulary. Comparison of database fields exported to Excel had identified articles published in four Brazilian journals and researchers articles which were published in international journals. The study allowed the comparison of articles and paper indexed by the two major bibliographic databases. The results pointed to demands and trends in production in the area, which shows the importance of support for researchers to publish their work in national and international journals.

Keywords: Scientific Production, Information and Knowledge Organization, Databases, bibliometric analysis.

Produção científica brasileira em Organização da Informação e do Conhecimento nas bases de dados bibliográficas Web of Science e Scopus

Resumo: Apresenta mapeamento da produção científica sobre Organização da Informação e do Conhecimento (OIC) de autores brasileiros nas bases de dados Web of Science e Scopus a partir de artigos de periódicos brasileiros e internacionais e de eventos. Objetiva obter indicadores da pesquisa brasileira na área, identificar tendências e analisar visibilidade. A Ciência da Informação apresenta comunicação científica diferenciada e interdisciplinar, tem produção científica dispersa em publicações de campos diversos, o que motivou esta pesquisa nas bases de dados multidisciplinares Web of Science (WOS) e Scopus. Para identificar publicações de autores brasileiros e compor o corpus, foram pesquisados os títulos de periódicos brasileiros da área indexados, realizada pesquisa por autores e seleção por assunto. Foram empregados métodos bibliométricos quantitativos,

(2)

procedimentos da OIC para a padronização dos dados, e indexação de parte dos artigos com vocabulário controlado. A comparação dos dados dos campos no Excel permitiu identificar artigos publicados em quatro títulos de revistas brasileiras indexadas e artigos de pesquisadores publicados em revistas internacionais. O estudo permitiu a comparação da indexação da produção brasileira em duas grandes bases de dados bibliográficos. Os resultados apontaram para demandas e tendências da produção na área, reforçando a importância do apoio aos pesquisadores para a publicação de seus trabalhos em revistas nacionais e internacionais.

Palavras-chave: Produção Científica, Organização da Informação e do Conhecimento, Bases de dados, Análise bibliométrica.

Agradecimentos

Pesquisa realizada com recursos da FAPESP Projeto 2013-04109/7, Bolsa de Iniciação Científica do CNPQ e Iniciação Científica sem Bolsa na ECA/USP.

(3)

Introdução

Este artigo apresenta a produção científica sobre Organização da Informação e do Conhecimento (OIC) em mapeamento inicial de trabalhos de autores brasileiros nas bases de dados Web of Science e Scopus realizado a partir de artigos de periódicos brasileiros e internacionais e de trabalhos de eventos. Tem por objetivos obter indicadores da pesquisa na área, identificar tendências para estudos posteriores e analisar a visibilidade da pesquisa brasileira na área.

A análise da produção científica é um recurso fundamental para o planejamento de uma política científica nacional e para as instituições. A comunicação científica nos canais formais de divulgação dos resultados registrados das pesquisas beneficia-se dos estudos quantitativos, baseados em indicadores bibliométricos, para sugerir os padrões e tendências de comportamento das áreas científicas, relacionados à gestão e ao desenvolvimento de um campo (Santin, Bramdilla & Stumpf, 2013). Neste sentido, reforçam também que a ciência estruturada em áreas do conhecimento, caracterizadas por formas diferentes de produzir e comunicar suas pesquisas tem estas características refletidas na comunicação científica da área.

As Ciências Sociais e Humanidades e, portanto, a Ciência da Informação apresentam uma comunicação científica diferenciada, assim como, devido à interdisciplinaridade que caracteriza o conhecimento na sociedade contemporânea, sua produção científica está muitas vezes dispersa em publicações de campos diversos e não apenas nos periódicos da área, o que motivou o desenvolvimento da pesquisa nas bases de dados multidisciplinares Web of Science (WOS) e Scopus.

Embora estas bases de dados incluam uma pequena parte da produção científica de países como o Brasil segundo Rowlands e Olivieri (2007), porém, as bases contêm informações estruturadas que permitem analisar as publicações científicas, e consequentemente a produção na área. A concorrência oferecida à Web of Science pela base Scopus depois de sua criação, permitiu o aumento do número de periódicos, inclusive brasileiros, indexados em ambas as bases.

De acordo com Meneghini (2009), o crescimento da produção científica brasileira que ocorreu entre 2007 e 2008 foi devido ao incremento de revistas brasileiras de todas as áreas na Web of Science, que passou de 26 títulos em 2006 para 63 em 2007, e 103 títulos em 2008. Em 2011, identificou-se, no início desta pesquisa, que a Web of Science aumentou para 132 títulos brasileiros das diversas áreas, e em 2014 passou para 140 títulos em Ciências, Artes e Humanidades, e Ciências Sociais do total de 12.000 títulos indexados. A base Scopus indexa aproximadamente 22.000 títulos sendo 314 revistas brasileiras ativas em 2014.

A busca de informação nas bases de dados pesquisadas, que apresentam diversos recursos para análise bibliométrica e análise de citação, apresenta limitações linguísticas em seus índices de assunto, pois estes índices utilizam as palavras-chave dos autores em inglês e os artigos não são indexados por uma linguagem documentária. Por isso, para conhecer os indicadores temáticos da produção científica da área foi necessário padronizar dados e reindexar artigos.

Para identificar publicações de autores brasileiros e compor o corpus deste trabalho, foram pesquisados os títulos de periódicos brasileiros da área, realizada pesquisa por autores e seleção por assunto, sendo necessário identificar termos representativos para a área.

(4)

Assim, buscou-se no primeiro momento, a definição de Organização da Informação e do Conhecimento, para identificar a abrangência de assuntos cobertos por este tema e a terminologia utilizada.

Organização da Informação e do Conhecimento

A literatura às vezes refere-se à Organização da Informação como tendo o mesmo conceito da Organização do Conhecimento, e outras vezes como conceitos diferentes e/ou complementares.

Segundo Broughton (2008), Bliss foi um dos primeiros a insistir no desenvolvimento de uma base filosófica para a área, que considerava uma disciplina à parte, tendo sido também o primeiro a usar o termo Organization of Knowlegde.

Smiraglia (2013) define Organização do Conhecimento como uma ciência cujo domínio pertence a uma comunidade discursiva e relaciona-se a ordenações ou sequências classificatórias naturais, heurísticas ou impostas. Para o autor, os produtos do domínio são segmentos ordenados do que é conhecido contendo regras para as ordens naturais ou regras para imposição, por vezes rigorosas, de uma sequência útil em que estruturas e regras são objetos de comunicação que ocorrem em um dado ambiente cultural ou entre atores em diferentes ambientes culturais. Como Smiraglia considera que a Organização do Conhecimento é realizada por uma comunidade discursiva, os fatores sociais e linguísticos influenciam na estrutura lógico-semântica das classes, ordenações e sequências.

Para San Segundo (2013), a Organização do Conhecimento envolve disciplinas com metodologias diversas e fundamentos teóricos que se baseiam em dois paradigmas: positivista e pragmatista.

O paradigma positivista tem como correlação no contexto da OIC, o paradigma bibliográfico, que permitiu o desenvolvimento das classificações universais no final do século XIX e início do século XX para organização de acervos bibliográficos como a Classificação de Dewey e a Classificação da Library of Congress nos Estados Unidos, bem como, a Classificação Decimal Universal de Paul Otlet e La Fontaine, que culminou com o início da Documentação.

Henry Bliss que cunhou o termo Organização do Conhecimento na área desenvolveu a Classificação de Bliss, a partir de estudos e questionamentos sobre as classificações bibliográficas da época, quando estudou na Universty College of London. Neste período teve como colega, o bibliotecário indiano Ranganathan que também desenvolveu um sistema de classificação denominado Colon Classification.

O modelo teórico de recuperação da informação baseado na equivalência invariável do paradigma bibliográfico que está em desuso, de acordo com San Segundo (2013), sendo substituído por um processo de busca de informação interativo, baseado no Pragmatismo. Esta mudança na direção da interação tem modificado as ferramentas de organização e representação, e a área está desenvolvendo metodologias para estes instrumentos. Por fim, a autora cita as tecnologias da informação que transformaram o fazer científico. Desta forma, a Organização do Conhecimento na atualidade situa-se no pragmatismo da interação entre o usuário e a organização do ambiente digital.

Ortega (2013) lembra que é preciso distinguir a Organização do Conhecimento e a organização para acesso visando seu uso, para a autora “a Organização da Informação seria a atividade-meio para o objetivo ou fim da área, atividade segundo a qual convergem outros elementos constitutivos, como os aportes gerenciais e os tecnológicos”.

O Capítulo Brasileiro da International Society of Knowledge Organization tem por objetivo promover a pesquisa, o desenvolvimento e aplicações de sistemas de organização

(5)

conceituais do conhecimento, utilizando a terminologia Organização e Representação do Conhecimento para suas publicações. O grupo de associados também se dedica a estudar aspectos filosóficos e epistemológicos da área.

Considerando que embora o conceito de Organização do Conhecimento, tenha surgido na década de 30 do século 20, a área ainda não estabeleceu consenso sobre estes conceitos, decidiu-se pensar a Organização da Informação e do Conhecimento como a análise, identificação de assunto e transformação da informação em substitutos de documentos originais, visando à disponibilização para acesso e uso, incluindo a manipulação e a construção de ferramentas que facilitam o armazenamento e recuperação de informações documentárias nos ambientes analógicos e digitais.

Métodos

Foram empregados métodos bibliométricos quantitativos e procedimentos da Organização da Informação e do Conhecimento para a padronização dos dados temáticos, e a indexação de parte dos artigos com vocabulário controlado.

A bibliometria e análise de bases de dados online permitem a identificação de características das disciplinas científicas e através da junção dos estudos métricos com os mecanismos de busca, podem ser traçadas as tendências da produção científica. Segundo Wormell (1998), com a utilização da análise quantitativa, podem ser mapeados conhecimentos produzidos em áreas específicas. Também de acordo com Van Raan (2003), os métodos bibliométricos permitem monitorar e mapear a pesquisa científica, principalmente de áreas interdisciplinares, acrescentando uma característica qualitativa à análise.

Mugnaini (2003b) lembra que os registros dos documentos indexados dependem do trabalho dos indexadores das bases de dados. Para o autor, do ponto de vista estatístico, a análise de uma base de dados não é exaustiva na cobertura da produção científica de uma área, porém também não é aleatória. A Bibliometria pode ser usada como um filtro de informação, podendo ser de grande utilidade para o pesquisador no levantamento do estado da arte do seu tema de pesquisa Mugnaini (2003a).

Para análise da produção científica brasileira na área de Organização da Informação e do Conhecimento foi utilizada a Web of Science que permite acesso aos periódicos de maior impacto do mundo e a trabalhos de eventos, sendo que os registros estão disponíveis na base a partir da data de publicação de 1900, embora o corpus da pesquisa compreenda os anos de 2000 a 2013. A base permite busca por diversos campos, acesso ao link o texto completo, análise de citações, fator de impacto e exportação de dados para gerenciador de referências e para planilhas. A base Scopus, cujos dados também foram utilizados na pesquisa, permite busca em mais campos e também apresenta análises bibliométricas a partir de campos específicos, e diversas possibilidades de exportação.

Ambas as bases, no entanto, não indexam os artigos e trabalhos com uma linguagem documentária, trazendo em seu índice de assunto as palavras-chaves dos autores e utilizam preferencialmente o idioma inglês.

Para a constituição do corpus foram identificados nas bases artigos de periódicos brasileiros da área de Ciência da Informação no campo da Organização da Informação e do Conhecimento, bem como os trabalhos (artigos e papers) de autores brasileiros de OIC publicados em revistas e eventos internacionais, utilizando uma lista de pesquisadores coletada através de consulta à Plataforma Lattes e aos cursos de pós-graduação e graduação na área, coletada, desenvolvida para pesquisas anteriores e utilizada por Santana e Kobashi (2013). Esta tabela de autores/pesquisadores foi desenvolvida para no estudo

(6)

“Pesquisa brasileira em organização do conhecimento: indicadores temáticos, de internacionalização e de redes de colaboração (2002-2012)”, da Profa. Dra. Nair Yumiko Kobashi, aprovado pelo CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico), da qual foram utilizados aproximadamente 80 nomes nas buscas realizadas em ambas as bases.

As pesquisas que fazem análise temática em bases de dados indexadas por palavras-chave ou por descritores de uma linguagem documentária geram uma grande lista de descritores de baixa frequência, ou seja, alta dispersão, de acordo com Kobashi e Santos (2008). Desta forma, o descarte de dados sem critérios consistentes pode alterar os resultados da análise e uma solução possível consiste na inserção de descrição temática de nível mais genérico. Por este motivo, para a análise temática dos dados coletados, foi necessário reindexar as palavras-chave em inglês, utilizando o Vocabulário Controlado da USP, o que foi realizado nos registros da Web of Science.

Foram definidos os termos de pesquisa para identificação de artigos dos autores brasileiros em ambas as bases para seleção nas revistas brasileiras e internacionais. Foram também identificados os periódicos brasileiros indexados nas bases que são: na Web of Science (WOS) Informação e Sociedade, Perspectivas em Ciência da Informação, Transinformação e na Scopus, estes três títulos mais Ciência da Informação.

Foram necessários testes e ajustes para a geração e exportação dos registros com formatação e padronização no Microsoft Excel. Como as pesquisas na WOS e na Scopus foram feitas a partir dos nomes dos autores e títulos de periódicos havia registros duplicados intra base e entre as duas bases. Para análise comparativa entre as bases, os registros foram tabulados em conjunto, organizando assim o layout para o início das análises.

Após a coleta, seleção, exportação, e padronização dos registros, iniciou-se a etapa de indexação das palavras-chave dos registros da Web of Science utilizando descritores do Vocabulário USP para identificar e mapear as áreas com maior concentração de estudos. Nesta fase foi possível notar que alguns termos não eram descritores do Vocabulário USP, os quais tiveram sua inclusão solicitada, pois estes termos apontam atualizações e tendências de pesquisa, ainda não inseridas no mesmo, devido à dinâmica da linguagem especializada.

Resultados

Nas buscas por autores brasileiros na Web of Science foram encontrados 178 registros Após filtro para eliminar as duplicatas, restaram 157 publicações. Na base Scopus foram encontrados 192 registros para 41 nomes de autores e 25 não foram recuperados. Além disso, por revistas foram encontrados, na Scopus com posterior seleção temática: 442 registros na Ciência da Informação, 119 registros na Informação e Sociedade, 262 registros na revista Perspectivas em Ciência da Informação e 79 registros na Transinformação.

O conjunto do corpus após seleção na base Scopus ficou constituído por 85 artigos da área publicados em periódicos nacionais de Ciência da Informação e por 236 referências levantadas a partir da lista de pesquisadores da área, indicando a constituição de um corpus maior que da Web of Science devido à cobertura de cada base.

Quanto aos dados identificados na Web of Science, o número de artigos de OIC por periódicos encontrados foram divididos conforme a Figura 1. As pesquisas por autores incluíram todas as publicações encontradas para cada autor, tanto nacionais como internacionais.

(7)

Figura 1: Número de publicações indexadas pela base de dados Web of Science. Fonte: elaborada pelos autores

Na Figura 2 são apresentados os resultados dos artigos e trabalhos encontrados na busca por autores/pesquisadores da área de Organização da Informação e do Conhecimento na base Web of Science divididos por ano de publicação no período, incluindo a média de palavras-chaves.

Nota-se expressivo número de publicações de autores brasileiros em 2008 em relação aos anos anteriores e que, conforme mostra o gráfico foi decrescendo nos anos seguintes.

Figura 2 - Número de publicações por autores, ano da publicação, e palavras-chave. Fonte: elaborada pelos autores

Apesar disso, o aumento das publicações a partir de 2008, o que foi positivo para a visibilidade da produção brasileira, pode ser explicado, a partir do aumento expressivo de revistas brasileiras indexadas na Web of Science.

(8)

É possível justificar que este aumento tenha ocorrido após o lançamento da base Scopus, criada pela Elsevier, uma das principais editoras de revistas científicas internacionais, gerando assim uma concorrência entre as bases de dados multidisciplinares. Sobre a queda de publicações no ano de 2013, a explicação refere-se aos artigos publicados ainda não indexados até a data da coleta dos registros, que ocorreu entre dezembro de 2013 e fevereiro de 2014, existe a possibilidade de atraso para as publicações e para a indexação, mesmo em bases internacionais com sistemas ágeis de coleta e disseminação.

Foram também analisadas as palavras-chave dos registros encontrados na Web of Science. Notou-se que as palavras-chave não constaram na exportação para o Excel dos registros da base. Realizou-se então a busca manual das palavras-chave em cada artigo para complementação dos dados.

Nesta busca percebeu-se que 28% dos registros não continham palavra-chave cadastrada na base de dados, nem acesso online à publicação, de tal forma que as publicações com palavras-chave somaram 131 registros e a Figura 2 mostra a quantidade de registros por ano que apresentaram ou não palavras-chave.

Nas buscas por autores brasileiros, a partir da já mencionada lista, foram 359 publicações para 50 autores. Como as pesquisas foram feitas a partir dos nomes dos autores, haviam publicações duplicadas, visto ser comum parceria entre os autores nos artigos. Eliminadas as duplicatas, restaram 159 publicações, que datam de 2000 a 2013.

A reindexação das palavras-chave dos artigos da Web of Science, em sua maioria em inglês, para descritores em português utilizando o Vocabulário USP, consumiu mais tempo que o esperado, devido à especificidade da tarefa. Muitos assuntos identificados nos artigos não constavam do Vocabulário USP, o que gerou uma lista para inclusão como descritores, já que este corpus apresenta garantia literária para a área, pois estes termos candidatos a descritores do Vocabulário apontam tendências atuais de pesquisa.

Além disso, a indexação em português que tinha por objetivo diminuir a dispersão temática, teve como resultado o controle da linguagem, mas não diminuiu de forma significativa a dispersão já que os termos do Vocabulário são bem específicos.

Na Scopus, a partir dos artigos obtidos pela pesquisa da mesma lista de autores, após filtragem, foram obtidos 86 artigos de periódicos dos títulos das revistas brasileiras: Ciência da Informação, Informação e Sociedade, Perspectivas em Ciência da Informação e Transinformação. Assim, obteve-se: 17 artigos dos periódicos “Transinformação” e “Informação e Sociedade’, 9 do periódico “Ciência da Informação” e 43 referentes ao periódico “Perspectiva em Ciência da Informação”, como representado na Figura 3.

(9)

Figura 3 – Número de artigos de OIC por título de periódico na base Scopus Fonte: elaborada pelos autores

Assim, sobre estes resultados identificou-se que os registros levantados nesta coleta de periódicos incluíam os anos entre 2006 a 2014 segmentados conforme Figura 4.

Figura 4 – Número de artigos de OIC por título de periódico e por ano na base Scopus Fonte: elaborada pelos autores

O arquivo com os dados referentes à junção das bases de dados Web of Science e Scopus continha inicialmente 392 registros. As duplicatas, referentes aos artigos que foram indexados em ambas as bases, passaram por um filtro, onde foi mantido apenas um dos registros e criada uma nova coluna na tabela nomeada como “Fonte”, na qual os registros encontrados nas duas bases receberam a inserção da palavra “ambas”, os registros exclusivos da Web of Science receberam a palavra “Web of Science” e os registros oriundos da base Scopus receberam o título “Scopus”. Tal medida possibilitou a separação dos

(10)

artigos pela fonte, permitindo assim o reconhecimento do número de artigos que cada base tem em comum com a outra.

As publicações analisadas estão compreendidas no período de 2000 à 2014, salvo 04 exceções que datam 1977, 1994, 1996 e 1998, sendo os 3 primeiros registros coletados na Web of Science e o último pertencente à Scopus. Os artigos em questão entraram nos resultados a partir da cobertura por autor, tema ou evento e não por cobertura de título de revista. Esses 04 casos foram desconsiderados na análise comparativa, por não pertencerem ao intervalo de tempo 2000-2014.

Com a criação da ‘coluna organizadora’ para a filtragem dos registros, chegamos ao número total de 302 registros, sendo 148 da base Scopus, 68 da base Web of Science e 86 registros que foram encontrados nas duas bases.

Dos 302 registros, 85 por cento continham ao menos uma palavra-chave, do autor ou inserida pela própria base de dados ou por outras bases, sendo que algumas destas outras bases utilizam vocabulários controlados como é o caso do Medline. Assim, embora neste artigo seja usada a terminologia “palavra-chave” em alguns casos trata-se de descritor pertencente a uma linguagem documentária e neste sentido existe o indicativo de intercambio de dados entre a Web of Science e a Scopus com outras bases de dados. Considerou-se o percentual aceitável embora a recuperação por palavras-chave apresente a dificuldade com sinônimos e com polissemia, mesmo que o idioma inglês seja comumente pedido pelas revistas para título, resumo e palavra-chave de artigos.

Na Figura 5 é apresentado o Diagrama de Venn com o número dos artigos que continham palavras-chave e a base ao qual pertencem.

Figura 5: Número de artigos, palavras-chave e bases de dados de origem Fonte: elaborada pelos autores

Com o propósito de analisar cada palavra-chave individualmente, foi criada uma linha de registro, com todos os dados referentes ao artigo, para cada palavra-chave, passando de 302 linhas/registros/artigos para 2390 linhas, dessas linhas chamadas de ‘registros’, 2347 continham palavra-chave.

52

82 125

WoS

Scopus

Sem palavra-chave

17 04 22

(11)

Na análise quantitativa o número de palavras-chave por origem versus o número de artigos coletado em cada base, a Scopus apresentou um número de palavras-chave maior que a Web of Science. Excluindo-se o número de palavras-chave indicadas pelo autor, a WoS apresenta apenas 146 palavras chave para os seus 154 artigos, enquanto que a Scopus exibe 1173 palavras-chave para 234 títulos, ou seja, a base WOS não chega a ter, em média, 1 palavra-chave por título entre os analisados conforme Tabela 1.

Tabela 1 – Análise quantitativa de palavras-chave em cada base

A fim de aprofundar a análise, foram filtrados e selecionados os artigos sem palavra-chave do autor, e analisadas quantas palavras-chave cada base indexou, pois são necessárias as palavras-chave para que o usuário possa realizar uma busca por assunto mais efetiva e, uma vez que o autor não as incluiu, a base poderia suprir essa falta, criando a obrigatoriedade de pelo menos uma palavra-chave ou descritor por artigo.

Separados os artigos que constavam nas duas bases foram encontrados 10 títulos em comum, que receberam 104 palavras-chave da Scopus, e 17 na WOS. Dos arquivos encontrados apenas na Scopus, foram encontrados 48 sem palavra-chave do autor e a Scopus forneceu 321 chave para suprir essa falta, uma média de 6,68 palavras-chave por artigo.

Em relação à WOS, foram encontrados 20 artigos sem palavra-chave designada pelo autor e apenas 16 palavras-chave indicadas pela base, ou seja, menos de uma por artigo.

A WOS teve resultado maior na coluna “ambas”, o que pode indicar que sejam artigos com mais visibilidade, por estarem nas duas bases de dados.

Na Tabela 2 são apresentados os artigos sem palavra-chave do autor por base.

(12)

Para mostrar melhor essa diferença entre o número de palavras-chave indexadas pelas duas bases, foi selecionado um artigo aleatoriamente sem palavra-chave do autor, que consta das duas bases de dados analisadas e que contém palavras-chave indexadas.

No Quadro 1 estão as informações do título do artigo, as palavras-chave e/ou descritores e a indicação de fonte de onde esta informação veio ou foi copiada.

TÍTULO: “Novel Protein-Protein Interactions Inferred from Literature Context”

WOS Scopus

BIOLOGICAL

NETWORKS accuracy

computer

prediction molecular cloning Proteins CONCEPT PROFILES algorithm controlled study mouse

receiver operating characteristic

GENE Algorithms Dysferlin muscle protein recombinant

protein HUMAN PHENOME alpha actinin Human Muscle Proteins Recombinant

Proteins

IDENTIFICATION Animal Humans parvalbumin reproducibility

INTERACTION MAP Animals information

processing parvalbumin B

Reproducibility of Results

KNOWLEDGE Article information

retrieval protein ROC Curve

MEDLINE Biology intermethod

comparison protein analysis

sensitivity and specificity

MEDLINE Calpain MEDLINE protein analysis statistical model

MOLECULAR INTERACTION DATABASE

Calpain MEDLINE protein binding two hybrid system MUSCLE-SPECIFIC

CALPAIN calpain 3 Metabolismo Protein Binding

unclassified drug

SKELETAL-MUSCLE CAPN3 protein Methodology protein database United States Chemistry Mice protein expression United States

Cloning Models

Statistical

Protein Interaction

Mapping web browser

Computational

Biology Molecular

protein protein interaction

A base de dados Web of Science indexou 12 palavras-chave, para o artigo, sendo uma repetida, enquanto a base Scopus indexou, para o mesmo artigo, 58 palavras-chave, contendo 26 palavras com alguma semelhança com outra, como plural e singular, por exemplo.

Se desconsiderássemos as palavras repetidas ou com semelhança, o número de palavras-chave neste caso específico passaria a ser de 11 para WOS e 32 para a Scopus.

A diferença entre a quantidade de palavras-chave ainda é grande, mas a finalidade do exemplo foi mostrar que a possibilidade grande quantidade de palavras-chave que apareceram na somatória de todos os artigos da Scopus não parecem refletir a qualidade na escolha das mesmas, pois o uso de linguagem natural e a tentativa de diminuir sinônimos e polissemia não parece melhorar de forma efetiva a recuperação.

(13)

Conclusões

Alguns fatores apresentaram-se como desafios nesta pesquisa como a incerteza quanto à situação da publicação de autores brasileiros em periódicos internacionais, que pôde apenas ser identificada por amostragem. Além disso, a dificuldade de abordar temas interdisciplinares e a forma de acesso a registros sobre temas, bem como o fato, de que as bases de dados pesquisadas, embora apresentem recursos para análises bibliométricas, não foram desenhadas para análise bibliométrica temática, o que se mostrou como uma limitação para o estudo.

A busca nas bases de dados bibliográficas por nome de autores necessita da identificação dos pesquisadores da área e esta tarefa é complexa. A lista de autores pesquisados precisa de constante atualização e análise de consistência, e consequentemente de novas buscas na Web of Science e na Scopus para complementação, sem contar que o controle de autoridade para entrada de nomes próprios nas bases, embora sejam realizados pelos desenvolvedores dos produtos sempre apresentam dificuldades, que incluem grande variação de entrada, nomes parecidos ou iguais para pessoas diferentes, e problemas de padronização na afiliação, que podem facilitar a coleta de dados se estiverem normalizados.

A junção dos dados coletados nas duas bases mostrou como esperado uma superposição de artigos, que exige a eliminação dos dados repetidos e a reformatação para a criação de um registro mais completo com dados vindos das duas bases. Embora uma simples classificação identifique dados duplicados, a complementação tem que ser realizada de forma manual.

No entanto, a comparação dos dados principalmente dos campos exportados das bases para o Excel, permitiu identificar trabalhos na área de OIC publicados em revistas brasileiras indexadas nas bases, quatro títulos, bem como artigos de autores pesquisadores da área que publicaram em revistas internacionais.

A reindexação das palavras-chaves em inglês para o Vocabulário USP também apresentou alguns entraves. Muitos termos não foram encontrados no Vocabulário gerando uma lista de termos para solicitação de inclusão como descritor no citado vocabulário, pois o corpus estudado é um indicativo da garantia literária e das tendências da área de Organização da Informação e do Conhecimento para a inclusão dos termos identificados. De forma que pesquisas de análise bibliométrica temáticas, apesar da necessidade de trabalhar com amostragem podem contribuir para identificação de terminologia para a elaboração e atualização de linguagens documentárias.

Por outro lado, a reindexação embora permita o controle da linguagem nos descritores, diminuindo em parte a dispersão existente nas palavras-chave com linguagem natural, não atingiu o objetivo de eliminar a dispersão, pois os descritores utilizados para indexação são termos bem específicos. Será necessário para um mapeamento mais concentrado retrabalhar este corpus com termos mais gerais ou grandes áreas, o que poderá ser analisado em outro trabalho com este mesmo conjunto de dados.

O estudo gerou também a possibilidade de comparação da indexação de duas grandes bases de dados bibliográficos, e levou a observações acerca de suas estruturas de dados, elemento determinante para criação do corpus e de seus métodos de indexação, que ainda devem ser mais estudados.

Considerando o recorte específico deste estudo, os resultados apontaram para demandas e tendências da produção na área de Organização da Informação e do Conhecimento, que indica a importância do apoio aos pesquisadores para a publicação de

(14)

seus trabalhos e principalmente a publicação em revistas internacionais. A internacionalização exige o aprimoramento do conhecimento individual de língua estrangeira bem como, e principalmente, da criação nas universidades de escritórios para suporte a pesquisa, editoração e comunicação científica.

Outro destaque importante deste estudo relaciona-se a presença de quatro títulos de revistas brasileiras de Ciência da Informação nestas bases. É urgente a melhoria da qualidade da publicação brasileira na área, inclusive a adequação de idioma, pois com as revistas eletrônicas é possível ter uma revista bilíngue que terá maiores chances de ser indexada nas bases e, portanto divulgadas internacionalmente, já que a área tem boa publicação sobre o tema.

Dada à importância da compreensão do comportamento de produção científica de OIC no Brasil, para melhorar aspectos de convergência de acesso e uso da informação nos ambientes analógicos e digitais, cabe ressaltar que estudos bibliométricos sobre o tema podem ser considerados fatores relevantes na avaliação da produção de conhecimento, pesquisa acadêmica e no desenvolvimento de sistemas de organização do conhecimento. Assim, com tal relevância, a sistematização destes estudos torna-se, hoje, essencial no cenário nacional.

Referências

Broughton, V. (2008). Henry Evelyn Bliss – the other inmortal, or a prophet without honour? Journal of Librarianship and Information Science, 40(1), pp. 45-58. Kobashi, N. Y., & Santos, R. N. (2008). Arqueologia do trabalho imaterial: uma aplicação

bibliométrica à análise de dissertações e teses. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, pp. 106-115.

Meneghini, R. (2009). O inusitado aumento da produção científica. Jornal da Ciência. Mugnaini, R. (2003a). A bibliometria na exploração de bases de dados: a importância da

Linguística. Transinformação, 15(1), pp. 45-52.

Mugnaini, R. (Campinas). Indicadores bibliométricos de base de dados Pascal como fonte de informação da produção científica e tecnológica do Brasil. 2003b.

Ortega, C. D. (2013). Aspectos teóricos, procedimentais, normativos e pragmáticos como categorias para uma epistemologia da organização da informação. In: J. A.

Guimarães, & V. (. Dodebei, Complexidade e organização do conhecimento: desafios do nosso século. Rio de Janeiro, Marília: ISKO-Brasil; FUNDEPE. Rowlands, I. O. (2007). Research productivity and the journals system: a study of

immunology and microbiology authors. Research Evaluation, 16(1), pp. 23-34. San Segundo, R. (2013). Panorama de investigación en Organización del conocimiento en

(15)

e organização do conhecimento: desafios do nosso século (pp. 26-33). Rio de Janeiro, Marilia: ISKO-Brasil, FUNDEPE.

Santana, S. A., & Kobashi, N. Y. (2013). Produção científica em organização da informação em periódicos Brasileiros de ciência da informação (2000-2010). Seminário de Pesquisa da FESPSP. São Paulo: FESPSP.

Santin, D. M., Bramdilla, S. D., & Stumpf, I. R. (2013). Produção científica em Neurociências da UFRGS indexada na Web of Science: 2000-2009. Liinc em Revista, 9(1), pp. 66-84.

Smiraglia, R. (2013). The epistemological dimension of knowledge organization. In: J. A. Guimarães, & V. (. Dodebei, Complexidade e organização do conhecimento: desafios do nosso século (pp. 17-25). Rio de Janeiro, FUNDEPE: ISKO-Brasil, FUNDEPE.

Van Raan, A. F. (2003). The use of bibliometric analysis in research performance assessment and monitoring of interdisciplinary scientific developments. Technikfolgenabschatzung: theorie und praxis, 12(1), pp. 20-29.

Wormell, I. (1998). Informetria: explorando bases de dados com instrumento de análise. Ciência da Informação, 27(2).

Referências

Documentos relacionados

No ultrarromantismo eles morriam de amor é quanto mais doído melhor, assim como nas músicas de sofrência quanto mais traído melhor, há uma semelhança enorme se formos

Nesta pesquisa temos como objetivo identificar os conhecimentos tidos pelos moradores de uma comunidade na zona rural de Jequié, acerca do impacto ambiental

[r]

DETALHAMENTO SISTEMAS DE INJEÇÃO.. Pneus como Combustível Alternativo - Histórico Em Janeiro de 2001, a fábrica Rio Branco S/A – Unidade Paraná, iniciou os testes

Quanto aos aspectos diversos de concordância e regência (inclusive crase), assinale a alternativa INCORRETA. A) O Brasil é um dos países que buscam soluções para uma vida

Detalhes: Console Bartira madeira •Altura •Cumprimento – •Largura

Crisóstomo (2001) apresenta elementos que devem ser considerados em relação a esta decisão. Ao adquirir soluções externas, usualmente, a equipe da empresa ainda tem um árduo

Ainda nos Estados Unidos, Robinson e colaboradores (2012) reportaram melhoras nas habilidades de locomoção e controle de objeto após um programa de intervenção baseado no clima de