• Nenhum resultado encontrado

MAX CIRINO DE MATTOS DA POSSIBILIDADE DE UMA WEB OF SCIENCE

N/A
N/A
Protected

Academic year: 2021

Share "MAX CIRINO DE MATTOS DA POSSIBILIDADE DE UMA WEB OF SCIENCE"

Copied!
73
0
0

Texto

(1)

DA POSSIBILIDADE DE UMA WEB OF SCIENCE PARA A

AMÉRICA LATINA E CARIBE

:

extração automática de uma base de citações do SciELO para o periódico PCI

e para a Coleção Saúde Pública

Profa. Dra. BEATRIZ VALADARES CENDÓN (ECI-UFMG; orientadora) Profa. Dra. MARIA CRISTINA SOARES GUIMARÃES (ICICT-FIOCRUZ)

Profa. Dra. CÍCERA HENRIQUE DA SILVA (ICICT-FIOCRUZ)

Prof. Dr. RICARDO HIROSHI CALDEIRA TAKAHASHI (MATEMÁTICA-UFMG) Profa. Dra. MARLENE OLIVEIRA TEIXEIRA DE MELO (ECI-UFMG)

Profa. Dra. RENATA MARIA ABRANTES BARACHO PORTO (ECI-UFMG)

(2)

UTOPIA / MOTOR:

inverter a relação 99% suor + 1% análise PARA 1% suor + 99% análise INÍCIO [no doutorado]:

• Discussão no grupo de pesquisa: TCC Wesley R. Fernandes

Disponibilidade no PORTAL CAPES das fontes citadas nas teses de 2005-2007 na ECI-UFMG • Continuidade: BDTD (extração automática de PDF…)

PIBIC – problemas de padronização das referências Redes Neurais: base criada manualmente - Magali R. G. Meireles • SciELO – arquivos XML

(3)

Relevância do trabalho • Possibilidade de…

• estudos posteriores por área, periódico, coleção… • aumento da visibilidade dos periódicos do SciELO • automação da extração de dados estatísticos

Criação de uma metodologia que permtirá a interpretação de todos os arquivos XML do SciELO

oferecendo a possibilidade de criação de uma Web of Science para a América Latina, Caribe e outras Coleções do SciELO

(4)

• Introdução (Cap. 1) 1’ – 11’ • Fundamentação teórica (Cap. 2) 11’ – 25’ • Metodologia (Cap. 3) 25’ – 37’

• FASE I – Dados Cadastrais

• Resultados (Cap. 4) • Análise da FASE I (Cap. 7) • FASE II – Base de Citações (Cap. 3)

• Análise das FASES I e II (Cap. 7)

• Resultados para a PCI (Cap. 5) 37’ – 42’ • Resultados para a CSP (Cap. 6) 42’ – 46’ • Análise da FASE II (Cap. 7) 46’ – 48’

(5)
(6)

• Garfield (processamento manual) • PORTAL CAPES

ARMAZENAMENTO MAGNÉTICO

• Grandes volumes de dados • Automação

• Nascimento do ISI - WoS

ÍNDICES LOCAIS • Importância • Políticas, investimentos, avaliação

SciELO

Extração automática (XML)

(7)

FIGURA 1 – Fundamentos para estudo das bases de citações

Fonte: Desenvolvida pelo autor

Estruturação da fundamentação teórica (CAP. 2)

BC

Bibliotecas Digitais de Periódicos Científicos BIBLIOTECAS DIGITAIS Cientometria BIBLIOMETRIA Avaliação de Coleções Digitais AVALIAÇÃO DE COLEÇÕES

(8)
(9)

Justificativa

• Medir publicações científicas não cadastradas no ISI é importante,

porém há carência de bases de dados nesses moldes

• SciELO: iniciativa para contemplar essas publicações

(MENEGHINI, 1998)

• Áreas de conhecimento em que a tradição é de disseminação local

(CENDÓN, GUIMARÃES, SILVA, OLIVEIRA, MATTOS, SANTANA e FERNANDES, 2012)

• Processos de gestão de atividades científicas deformados pela falta

de índices locais

(10)

Justificativa

• Dificuldade: processar um enorme volume de dados • Esforços datam de 1927 (mapeamento fracionado)

(GARFIELD, 1972)

• Usar a tecnologia como recurso essencial de desenvolvimento da CI Protótipo

• Integração CC e CI:

Lourenço (2005) – MER e MTD-BR

(11)

Pergunta

É POSSÍVEL A AUTOMAÇÃO DO PROCESSO DE CRIAÇÃO DE UMA BASE DE CITAÇÕES PARA OS PERIÓDICOS

DO SciELO?

Objetivos

• Descrição de uma metodologia para a criação de uma base de

citações atualizada automática e continuamente a partir dos periódicos cadastrados no SciELO

• Desenvolver um protótipo para testar a metodologia • Validar o protótipo para testar sua aplicação prática • Identificar fatores limitadores e propor alternativas

(12)

Premissas e limites

• Não se pretendeu corrigir o conteúdo dos arquivos XML • Não foram usados critérios para filtragem de informações

• Não integra o escopo do trabalho a análise específica de nenhuma

área

• O processo depende dos padrões identificados para acesso aos dados

(13)
(14)

Periódicos científicos e a Internet: bibliotecas digitais

• “A comunicação [científica] situa-se no próprio coração da ciência”

(MEADOWS, 1999)

• Internet: visibilidade a todos os periódicos

• Preços: incentivo à disseminação de periódicos de acesso aberto • SciELO (meados 1990)

(MENEGHINI E SILVA, 2012, informação verbal)

• Bibliotecas digitais:

• Expansão do número de usuários e abrangência

(15)

Bibliometria e Cientometria: criação e uso da Web of Science

• Price (Lotkka, Bradford, Zipf): leis cientométricas; “mapas de ciência” • “Mapas”: evidenciam importância e cobertura das revistas

• “Mapas”: embasamento do projeto do ISI

(SANTOS E KOBASHI, 2009)

VINITI – All-Union Institut for Science and Technical Information • Academia de Ciências da ex-URSS

• 1969: Nalimov e Mulchenko – termo “cientometria” no título • Nalimov (cibernética), Styazhkin e Vledutsiv em 1959:

“As informações científicas e técnicas como uma das tarefas da cibernética”

(VANTI, 2011)

(16)

Bibliometria e Cientometria: criação e uso da Web of Science

• Garfield percebeu a possibilidade de uso das referências citadas

como elementos de recuperação assim como palavras-chave

• Base para a criação da WoS

(VANTI, 2011)

• WEB OF SCIENCE

• +12.000 periódicos de grande impacto no mundo inteiro • +150.000 conferências

• + 250 disciplinas • A partir de 1.900

(17)

01.10.2013 MAX CIRINO DE MATTOS

Bibliometria e Cientometria: criação e uso da Web of Science • ISI: “rei” absoluto

• “Candidatos ao trono”: limitação uma/poucas áreas; não

empreendem esforços para prover índices de citação nos moldes do ISI (ADAM, 2002)

• Importância de índices locais para o desenvolvimento científico (WEBSTER, 1998;

XIN-NING, 2001;

GOGOLIN ET AL., 2003;

NEGISHI, SUN e SHIGI, 2004; SULEIMENOV, 2009;

GUIMARÃES, SILVA, SANTANA, BRAGA, BOCHNER, E GOLDBAUM, 2011;

CENDÓN, GUIMARÃES, SILVA, OLIVEIRA, MATTOS, SANTANA E FERNANDES, 2012; ZIBAVERA e PARMON, 2012)

(18)

Bibliometria e Cientometria: criação e uso da Web of Science

(Interesse: criação do ISI -> criação da BC do SciELO) GARFIELD (1972; 1979; 1992; 1995)

• Mapas fragmentados (esforço manual) • Uso de meio magnético

• Amostra: out/dez 1969 (2.200 periódicos; 1.000.000 citações) • Listagens:

• Frequência de citações

• Estatística dos periódicos citados • Estatística dos periódicos citantes

(19)

FIGURA 6 – Frequências de citações

32

(20)

33

FIGURA 7 – Estatísticas dos periódicos citados Fonte: Garfield, 1972, p.529

(21)

34

Fonte: Garfield, 1972, p.530 FIGURA 8 – Estatísticas dos periódicos citantes

(22)

Bibliometria e Cientometria: criação e uso da Web of Science

(Interesse: criação do ISI -> criação da BC do SciELO) Base de citação (GARFIELD):

• Potencial de gerenciamento de coleções de periódicos

• Principal aplicação: avaliação de pesquisas e políticas científicas • Definição de políticas de investimento e avaliação de desempenho • Alerta para a cobertura seletiva do ISI: sugeriu a criação de um

(23)

Bibliometria e Cientometria: criação e uso da Web of ScienceWoS x Google Scholar (WINTER, ZADPOOR E DODOU, 2013)

• Acesso restrito X público

• Indexação seletiva X coleta automática (frágil)

Jacsó (2005; 2008), Cathcart e Roberts (2005);

Donlan e Cooke (2005); Vine (2006) e Wleklinski (2005)

Evolução do Google Scholar

• Química, Física, Economia, Medicina (HARZING, 2013)

• Perfis de +30.000 pesquisadores (RADICCHI E CASTELLANO, 2013) • Críticas aos resultados (PRATHAP, 2013)

(24)

Bibliometria e Cientometria: criação e uso da Web of Science • Colaboração científica

• Coautoria (SCHUBERT E BRAUN, 1990)

• Cooperação Turquia/Malásia: combustíveis energéticos

(KUMAR E JAN, 2013)

• Estudos de gênero

• Produção feminina iraniana (NOURMOHAMMADI E HODAEI, 2013)

• Preferência no uso de gráficos e tabelas entre homens e mulheres

(HARTLEY E CABANAC, 2013)

• Nanotecnologia – JCR 2005 e 2007 (SOTUDEH E KHOSHIAN, 2013) • Uso do EXCEL e SPSS (99% suor…)

(25)

Bases de citações locais e o uso do SciELO • Negishi, Sun e Shigi (2004)

• Criação de um índice de citações para periódicos japoneses

Citation Database for Japanese Papers (CJP)

• Importância da criação de índices de língua não inglesa • Chinese Science Citation Database

China Scientific and Technical Papers and Citations Database

Chinese Social Science Citation Index

Zibareva e Parmon (2012) : Russian Science Citation IndexSuleimenov et al. (2009) : Kazakh Science Citation Index

(26)

Bases de citações locais e o uso do SciELO • América Latina e Caribe

Krauskopf et al. (1995) : ISI entre 1981 e 1993

Argentina, Brasil, chile, Colômbia, Costa Rica, Cuba, Jamaica, México, Peru e Venezuela (recebido em 10 mai. 1995)

• Collazo-Reyes (2013): português passou a ser a segunda língua

– atrás apenas do inglês – na produção científica registrada no ISI para países da América Latina e Caribe

• Análise bibliométrica da produção científica sobre AIDS na

América Latina e Caribe

(MACIAS-CHAPULA, RODEA-CASTRO E NARVAEZ-BERTHELENOT, 1998)

(27)

Bases de citações locais e o uso do SciELO

• O uso de indicadores provenientes do SciELO contribui para a

adequação de critérios de avaliação da produção científica nacional (MUGNANI, 2006)

• “a metodologia do Projeto [SciELO] é diferenciada do conjunto de

informações levadas à Internet, por obedecer a rígido controle de avaliação, seleção e operacionalidade”

(VASCONCELLOS, 1999)

(28)

Bases de citações locais e o uso do SciELO

• Obtenção dos dados estatísticos de forma manual

• Goldenberg et al. (2007) – Acta Cirúrgica Brasileira • Solano e Valdivea (2003) – AIDS 1997 a 2003

• Población e Goldenberg (2001) – Acta Cirúrgica Brasileira • A importância do SciELO é inegável

(29)

Outras aplicações: avaliação de coleções digitais • O que o acervo possui e não deveria possuir;

e o que não possui mas deveria possuir… (LANCASTER, 1996)

• Acervo do PORTAL CAPES

• 45% dos artigos citados estavam disponíveis no PORTAL CAPES • Análise bibliométrica como critério para gestão do acervo

(FERNANDES E CENDÓN, 2010)

• Histórico de criação do PORTAL CAPES e composição do acervo

(CORREA ET AL., 2008; ALMEIDA, GUIMARÃES E ALVES, 2010; FERNANDES, 2012)

(30)

Outras aplicações: avaliação de coleções digitais • Estudos sobre a coleção do PORTAL CAPES

• Avaliação a partir da percepção do usuário

(MAIA, 2005; CUNHA, 2009; SANTANA e PEIXOTO, 2010; FERNANDES, 2012; MAIA e CENDÓN, 2012)

• Avaliação a partir da existência das referências citadas

(OLIVEIRA e ODDONE, 2007; FERNANDES, 2009;

FERNANDES e CENDÓN, 2010; SANTANA e PEIXOTO, 2010)

• Limitações:

(31)
(32)

Caracterização da pesquisa

• Pesquisa aplicada ou exploratória (LAKATOS E MARCONI, 2007)

Demonstrar a viabilidade de um determinado programa ou técnica como uma solução em potencial para problemas práticos

• Híbrida (CRESWELL E CLARCK, 2011)

Utiliza métodos qualitativos (abstração, generalização - metodologia) e quantitativos – base de citações associada à bibliometria

(33)

FIGURA 9 – Visão geral da metodologia: passos e modelagem de dados simplificada

(34)

FASE I – Dados Cadastrais FIGURA 3 – Processo automático de preparação dos dados cadastrais dos periódicos do SciELO Fonte: desenvolvida

(35)

• Periódicos de uma Coleção

• Periódicos correntes e não-correntes

(36)
(37)

FASE I – Dados Cadastrais

Fonte: desenvolvida pelo autor

(38)

FASE I – Dados Cadastrais – Resultados (CAP. 4)

(39)

FASE I – Dados Cadastrais – Resultados (CAP. 4) • 904 periódicos

• 895 vinculados a somente 1 Coleção • 9 encontrados em 2 Coleções

• 1 delas sempre a CSP

MESMO ISSN EM DUAS COLEÇÕES

DADOS CADASTRAIS DIFERENTES?

(40)
(41)
(42)
(43)
(44)

FASE II – Base de Citações

FIGURA 2 – Fases para a criação da base de citações do SciELO

(45)

FASE II – Base de Citações

Fonte: Desenvolvida pelo autor

(46)
(47)

FASE II – Base de Citações

• Dados fonte de cada periódico (scielo_estatistica – 7.324 registros) • ISSN, ano, fascículos, artigos

(48)

FASE II – Base de Citações Fonte: Desenvolvida pelo autor FIGURA 18 – Módulo “Base de Citações”

(49)

FIGURA 28 – Quantidade de registros incorporados no banco de dados: PCI

(50)

FASE II – Base de Citações – Análise (CAP. 7) FASE I x FASE II TABELA 16 – Periódicos encontrados em mais de uma Coleção do SciELO e dados XML

(51)
(52)

FIGURA 22 – Resumo da importação de dados do SciELO: dados fonte e arquivos XML

(53)

FIGURA 29 – Frequências de citações: PCI

(54)
(55)

Fonte: desenvolvida pelo autor

(56)

Fonte: desenvolvida pelo autor

(57)

Fonte: desenvolvida pelo autor

(58)

Fonte: desenvolvida pelo autor

(59)
(60)
(61)

Fonte: desenvolvida pelo autor

FIGURA 35

(62)

FIGURA 37

(63)

Problemas identificados que podem justificar diferenças • Exclusão de informações do SciELO

• Estrutura incompleta de TAGS XML

(64)
(65)

FASE II – Base de Citações

• Importação foi considerada satisfatória: > 260.000 arquivos XML • As 4 situações identificadas, caso corrigidas,

podem reduzir significativamente as diferenças encontradas

• Sugere-se uma análise mais aprofundada da metodologia SciELO • Falta de padronização de nomes de autores e fontes

(66)
(67)

Próximos passos

• Criação de bases de citação para cada periódico do SciELO • Criação de base centralizada com todos os periódicos

para consultas da produção científica nacional registrada no SciELO

• Gestão de conteúdo: criação de interfaces para desambiguação

manual

(68)

Desambiguação automática de nomes de autores e de fontes • Muita informação incompatível e redundante em SICT

(LATTES, OJS/SEER, QUALIS, COLETA, BDTD)

• Vinculação por CPF / Researcher ID / Google Acadêmico • Aspectos culturais, políticos, tecnológicos

• FAPESP: exige Researcher ID

• CPF informado no OJS/evento: dados do LATTES

• Evita duplicação de nome em eventos por grafia diferente • Distingue homônimos

• ISSN: obtenção automática do QUALIS

(69)

Avaliação automática de coleções: PORTAL CAPES

• A partir das fontes armazenadas na base de citações • Para determinado periódico ou Coleção

• Fazer a consulta automática ao PORTAL CAPES • Identificar fontes disponíveis no PORTAL…

… e fontes usadas mas não disponíveis

• Repetir o processo para outras bibliotecas digitais • OJS/SEER

(70)

Relevância do trabalho • Possibilidade de…

• estudos posteriores por área, periódico, coleção… • aumento da visibilidade dos periódicos do SciELO • automação da extração de dados estatísticos

Criação de uma metodologia que permtirá a interpretação de todos os arquivos XML do SciELO

oferecendo a possibilidade de criação de uma Web of Science para a América Latina, Caribe e outras Coleções do SciELO

(71)

Possibilidades…

FIGURA 20 – Periódicos SciELO agrupados por área de conhecimento

(72)

Descrição de uma metodologia para a criação de uma base de citações atualizada automática e continuamente a partir dos periódicos cadastrados no SciELO

Desenvolver um protótipo para testar a metodologia Validar o protótipo para testar sua aplicação prática Identificar fatores limitadores e propor alternativas

(73)

“Nosso fascínio pela tecnologia nos fez esquecer

o objetivo principal da informação: informar.

Todos os computadores do mundo de nada servirão

se seus usuários não estiverem interessados

na informação que esses computadores podem gerar.”

DAVENPORT, 1998

Referências

Documentos relacionados

autoincriminação”, designadamente através da indicação de exemplos paradigmáticos. Sem prejuízo da relevância da matéria – traduzida, desde logo, no número e

For additional support to design options the structural analysis of the Vila Fria bridge was carried out using a 3D structural numerical model using the finite element method by

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Partindo deste princípio, e com experiência à frente dos proces- sos formativos na área de Informações e Registros em Saúde, o Labo- ratório de Educação Profissional

a) AHP Priority Calculator: disponível de forma gratuita na web no endereço https://bpmsg.com/ahp/ahp-calc.php. Será utilizado para os cálculos do método AHP

Com o intuito de aperfeic¸oar a realizac¸˜ao da pesquisa O/D, o objetivo do presente trabalho ´e criar um aplicativo para que os usu´arios do transporte p´ublico informem sua origem

Neste capítulo, será apresentada a Gestão Pública no município de Telêmaco Borba e a Instituição Privada de Ensino, onde será descrito como ocorre à relação entre