2.1 INFORMETRIA, BIBLIOMETRIA e CIENTOMETRIA
2.1.7 Leis na Informetria, Bibliometria e Cientometria
Nesta seção são relacionadas as principais teorias relacionadas com a informetria e suas divisões, bibliometria e cientometria.
O QUADRO 5 apresenta o conjunto de teorias relacionadas com a informetria, bibliometria e cientometria, desenvolvidas a partir do final do século XIX sendo a mais antiga a que Borschiever e Guedes (2005) denominaram de Lei dos 80/20, e
que também é conhecida como Lei de potência de Pareto. Pareto observou a ocorrência da proporção 80/20 em muitas situações como a distribuição de terras na Itália (80% das terras pertencem a 20% da população). Esta Lei, quando aplicada à elaboração de coleções em bibliotecas, por exemplo, indica que com 20% dos títulos de livros ou periódicos científicos em uma determinada área, obtêm-se 80% de cobertura dos assuntos relacionados com a área (BELLIS, 2009).
Denominação Focos de Estudo
Principais Autores
Principais Aplicações
Lei de Bradford Periódicos Samuel Bradford Estimar o grau de relevância de periódicos
em dada área do conhecimento.
Lei de Lotka Autores Alfred Lotka Estimar o grau de relevância de autores em
dada área do conhecimento.
Lei de Zipf Palavras George Zipf
Andrew Booth
Indexação automática de artigos científicos e tecnológicos.
Ponto de Transição (T) de Goffman
Palavras Willian Goffman Indexação automática de artigos científicos
e tecnológicos.
Colégios Invisíveis Citações Derek Solla Price Identificação da elite de pesquisadores em
dada área do conhecimento. Fator de
Imediatismo ou de Impacto
Citações Eugene Garfield
Derek Solla Price
Estimar o grau de relevância de artigos, cientistas e periódicos científicos em determinada área do conhecimento. Acoplamento
Bibliográfico
Citações Robert Fano
M. Kessler
Estimar o grau de ligação entre dois ou mais artigos.
Co-citação Citações Irina Marshakova
Henry Small
Estimar o grau de ligação entre dois ou mais artigos.
Obsolescência da Literatura
Citações Charles F. Gosnell Estimar o declínio da literatura de
determinada área do conhecimento.
Vida-média Citações Richard Burton
Richard Kleber
Estimar a vida-média de uma unidade da literatura de dada área do conhecimento. Teoria Epidêmica
de Goffman
Citações Willian Goffman Estimar a razão de crescimento e declínio
de determinada área do conhecimento.
Lei do Elitismo Citações Derek Solla Price Estimar o tamanho da elite de determinada
população de autores.
Frente de Pesquisa Citações Wolfgang Glänzel
Hans-Jürgen Czerwon
Identificação de um padrão de relação múltipla entre autores que se citam.
Lei dos 80/20 Demanda de
informação
Vilfredo Pareto Composição, ampliação e redução de
acervos.
QUADRO 5 – TEORIAS UTILIZADAS NA INFORMETRIA, BIBLIOMETRIA E CIENTOMETRIA FONTE: ADAPTADO DE BORSCHIVER E GUEDES (2005, p. 14)
Três autores, Lotka, Bradford e Zipf, publicaram suas teorias relacionadas à produção bibliográfica na primeira metade do século XX. Estas teorias receberam o
tratamento de leis junto à comunidade científica especializada e impulsionaram interpretações e versões (BORSCHIVER e GUEDES, 2005). O QUADRO 6 apresenta, de forma sumarizada, os precursores Lotka, Bradford e Zipf e suas leis.
Autor Ano Foco do estudo Formulação matemática
Arthur Lotka
1926 Produtividade científica de autores, que pode ser enunciado da seguinte forma: A quantidade de autores que produzem um número n de contribuições é
aproximadamente igual ao inverso do
quadrado de n (1/n2) da quantidade de
autores que produzem apenas uma contribuição.
Formulação original de Lotka:
𝑝(𝑛) ≅ 1 𝑛2
Onde p é a quantidade de autores
que produzem n contribuições.
Formulação revisada da Lei de Lotka:
𝑝(𝑛) ≅ 𝐶 𝑛𝑎
Onde p é a quantidade de autores
que produzem n contribuições, C é
uma constante característica do
campo de pesquisa e a, o “expoente
Lotka”, é uma constante que está no intervalo de 2 a 4, relacionado com o campo de pesquisa.
Samuel Bradford
1934 Seleção de periódicos para a composição de uma coleção; Bradford observou que: Se os periódicos que contém artigos relevantes sobre determinado assunto forem classificados em ordem decrescente de produtividade (quantidade de artigos relevantes em um dado período de tempo), calculando-se o número de artigos que cada periódico contribui, o resultado será um núcleo de poucos periódicos que representam a maior parte dos artigos sobre tal assunto.
Assim, a “lei de Bradford” enfoca a dispersão de autores em diferentes periódicos, e visa determinar o núcleo de periódicos que melhor se concentra em um tema, de modo a apoiar o estabelecimento dos critérios utilizados para seleção de periódicos na composição de uma coleção.
Bradford apresentou o enunciado de sua lei na forma verbal e na forma gráfica, e sua conclusão é de que existe uma relação entre a
quantidade de periódicos nos grupos que segue a proporção:
1: 𝑚: 𝑚2: …
Onde m é o “multiplicador Bradford” e é característico da coleção em análise.
George Zipf
1935 Frequência no uso das palavras: A “lei de Zipf”, baseada no princípio do esforço mínimo, propõe que palavras cujo custo de utilização seja pequeno ou cujo esforço para transmissão seja mínimo, são mais frequentemente utilizadas em um texto longo.
Formulação da primeira Lei de Zipf:
𝑟 × 𝑓 = 𝑐
Onde r é a posição da palavra no
ranking, f é a frequência de
ocorrência da palavra e c é uma
constante específica do texto. QUADRO 6 – PRECURSORES E LEIS NA BIBLIOMETRIA
2.1.7.1 Lei de Lotka
Alfred Lotka estabeleceu sua teoria sobre a produtividade de autores com o fundamento de que alguns autores publicam muito e muitos autores publicam pouco.
Lotka analisou dados do Chemical Abstracts (1907 a 1916), e do Auerbach’s
Geschichtstafeln der Physik (até o ano de 1900). Em sua contagem foram considerados apenas os autores sêniores, em casos de artigos com mais de um autor. Lotka percebeu que a relação encontrada entre autores e quantidade de artigos publicados por estes autores, em qualquer área científica, segue a proporção do inverso do quadrado (1/n2). Em um determinado período de tempo, observando um número n de artigos, o número de autores que escrevem dois artigos seria igual a 1/4 (um sobre quatro) do número de autores que escreveram um artigo. A quantidade de autores que escreveram três artigos seria igual a 1/9 (um sobre nove) do número de autores que escreveram um, e assim sucessivamente (BORSCHIVER e GUEDES, 2005). Experimentos subsequentes revelaram que o expoente no denominador não é necessariamente sempre igual a dois, mas está no intervalo aproximado de dois a quatro (BELLIS, 2009). Portanto a Lei de Lotka pode ser expressa pela equação:
EQUAÇÃO 1 – REPRESENTAÇÃO MATEMÁTICA DA LEI DE LOTKA
𝑝(𝑛) = 𝐶
𝑛𝑎 (1)
Onde p é a quantidade de autores que produzem n contribuições, C é uma
constante característica do campo de pesquisa, e a, chamado de expoente de Lotka, é um parâmetro que também depende do campo de pesquisa.
2.1.7.2 Lei de Bradford
Samuel Bradford, bibliotecário chefe do London Science Museum, estava
insatisfeito com os serviços de indexação disponíveis à sua época. Ele observou o modo como os artigos científicos estavam dispersos nos periódicos a partir da análise e classificação em duas bibliografias de geofísica: Current Bibliography of
Applied Geophysics (referente ao período de 1928 a 1931) e o Quarterly
Bibliography of Lubrication (referente ao período de 1931 a 1933).
Com base em suas observações, Bradford enunciou sua teoria da seguinte forma:
[...] se periódicos científicos forem ordenados em ordem decrescente de produtividade de artigos sobre um determinado assunto, poderão ser divididos em um núcleo de periódicos mais particularmente dedicados ao assunto e em vários grupos ou zonas, contendo a mesma quantidade de artigos que o núcleo. O número de periódicos (n), no núcleo e zonas
subsequentes, variará na proporção 1:n:n2:... [...] (BORSCHIVER e
GUEDES, 2005, p. 4).
A teoria de Bradford é polêmica entre os cientistas da área. Diversos artigos foram publicados por autores como Brian Vickery, Ferdinand Leimkuhler, Bertram C. Brookes, Leo Egghe, Ronald Rousseau e Eugene Garfield, que discutem a teoria de Bradford. A razão da polêmica é que Bradford apresentou sua teoria na forma verbal e na forma gráfica sem, entretanto, apresentar uma equação matemática correspondente. Dentre os que demonstraram a que a forma verbal e a forma gráfica da lei de Bradford não são equivalentes estão Brian Vickery, em 1948, (BELLIS, 2009) e Leo Egghe (EGGHE, 1988).
2.1.7.3 Lei de Zipf
A Lei de Zipf, comparada às Leis de Lotka e Bradford, que tratam de produtividade de autores e de periódicos, respectivamente, parece estar fora de contexto, pois refere-se à frequência de ocorrência de palavras dentro de textos, enquanto Lotka e Bradford tratam de elementos externos ao conteúdo do texto (BELLIS, 2009).
Zipf observou que em um texto existe uma relação entre a frequência com que uma determinada palavra ocorre no texto e a sua posição, ordenada de modo decrescente, segundo sua frequência de ocorrência no texto (BORSCHIVER e GUEDES, 2005).
Zipf, em 1938, descreveu esta relação da seguinte forma:
EQUAÇÃO 2 – REPRESENTAÇÃO MATEMÁTICA DA PRIMEIRA LEI DE ZIPF
𝑟 × 𝑓 = 𝑐 (2)
Onde r é a posição da palavra, f é a frequência da palavra e c é uma constante específica do texto. Esta relação, entretanto, aplica-se apenas ao conjunto de palavras de maior frequência no texto. A segunda Lei de Zipf enuncia que, em um determinado texto, várias palavras de baixa frequência de ocorrência têm a mesma frequência.
Booth (1967) revisou e modificou a relação proposta por Zipf para as palavras de baixa frequência e propôs sob a forma:
EQUAÇÃO 3 – REPRESENTAÇÃO MATEMÁTICA DA SEGUNDA LEI DE ZIPF
𝐼1 𝐼𝑛 =
𝑛(𝑛 + 1)
2 (3)
Onde I1 é o número de palavras que ocorrem apenas uma vez (frequência igual a 1), In é o número de palavras com frequência n, e 2 é uma constante válida para o idioma inglês.