• Nenhum resultado encontrado

Leis na Informetria, Bibliometria e Cientometria

2.1 INFORMETRIA, BIBLIOMETRIA e CIENTOMETRIA

2.1.7 Leis na Informetria, Bibliometria e Cientometria

Nesta seção são relacionadas as principais teorias relacionadas com a informetria e suas divisões, bibliometria e cientometria.

O QUADRO 5 apresenta o conjunto de teorias relacionadas com a informetria, bibliometria e cientometria, desenvolvidas a partir do final do século XIX sendo a mais antiga a que Borschiever e Guedes (2005) denominaram de Lei dos 80/20, e

que também é conhecida como Lei de potência de Pareto. Pareto observou a ocorrência da proporção 80/20 em muitas situações como a distribuição de terras na Itália (80% das terras pertencem a 20% da população). Esta Lei, quando aplicada à elaboração de coleções em bibliotecas, por exemplo, indica que com 20% dos títulos de livros ou periódicos científicos em uma determinada área, obtêm-se 80% de cobertura dos assuntos relacionados com a área (BELLIS, 2009).

Denominação Focos de Estudo

Principais Autores

Principais Aplicações

Lei de Bradford Periódicos Samuel Bradford Estimar o grau de relevância de periódicos

em dada área do conhecimento.

Lei de Lotka Autores Alfred Lotka Estimar o grau de relevância de autores em

dada área do conhecimento.

Lei de Zipf Palavras George Zipf

Andrew Booth

Indexação automática de artigos científicos e tecnológicos.

Ponto de Transição (T) de Goffman

Palavras Willian Goffman Indexação automática de artigos científicos

e tecnológicos.

Colégios Invisíveis Citações Derek Solla Price Identificação da elite de pesquisadores em

dada área do conhecimento. Fator de

Imediatismo ou de Impacto

Citações Eugene Garfield

Derek Solla Price

Estimar o grau de relevância de artigos, cientistas e periódicos científicos em determinada área do conhecimento. Acoplamento

Bibliográfico

Citações Robert Fano

M. Kessler

Estimar o grau de ligação entre dois ou mais artigos.

Co-citação Citações Irina Marshakova

Henry Small

Estimar o grau de ligação entre dois ou mais artigos.

Obsolescência da Literatura

Citações Charles F. Gosnell Estimar o declínio da literatura de

determinada área do conhecimento.

Vida-média Citações Richard Burton

Richard Kleber

Estimar a vida-média de uma unidade da literatura de dada área do conhecimento. Teoria Epidêmica

de Goffman

Citações Willian Goffman Estimar a razão de crescimento e declínio

de determinada área do conhecimento.

Lei do Elitismo Citações Derek Solla Price Estimar o tamanho da elite de determinada

população de autores.

Frente de Pesquisa Citações Wolfgang Glänzel

Hans-Jürgen Czerwon

Identificação de um padrão de relação múltipla entre autores que se citam.

Lei dos 80/20 Demanda de

informação

Vilfredo Pareto Composição, ampliação e redução de

acervos.

QUADRO 5 – TEORIAS UTILIZADAS NA INFORMETRIA, BIBLIOMETRIA E CIENTOMETRIA FONTE: ADAPTADO DE BORSCHIVER E GUEDES (2005, p. 14)

Três autores, Lotka, Bradford e Zipf, publicaram suas teorias relacionadas à produção bibliográfica na primeira metade do século XX. Estas teorias receberam o

tratamento de leis junto à comunidade científica especializada e impulsionaram interpretações e versões (BORSCHIVER e GUEDES, 2005). O QUADRO 6 apresenta, de forma sumarizada, os precursores Lotka, Bradford e Zipf e suas leis.

Autor Ano Foco do estudo Formulação matemática

Arthur Lotka

1926 Produtividade científica de autores, que pode ser enunciado da seguinte forma: A quantidade de autores que produzem um número n de contribuições é

aproximadamente igual ao inverso do

quadrado de n (1/n2) da quantidade de

autores que produzem apenas uma contribuição.

Formulação original de Lotka:

𝑝(𝑛) ≅ 1 𝑛2

Onde p é a quantidade de autores

que produzem n contribuições.

Formulação revisada da Lei de Lotka:

𝑝(𝑛) ≅ 𝐶 𝑛𝑎

Onde p é a quantidade de autores

que produzem n contribuições, C é

uma constante característica do

campo de pesquisa e a, o “expoente

Lotka”, é uma constante que está no intervalo de 2 a 4, relacionado com o campo de pesquisa.

Samuel Bradford

1934 Seleção de periódicos para a composição de uma coleção; Bradford observou que: Se os periódicos que contém artigos relevantes sobre determinado assunto forem classificados em ordem decrescente de produtividade (quantidade de artigos relevantes em um dado período de tempo), calculando-se o número de artigos que cada periódico contribui, o resultado será um núcleo de poucos periódicos que representam a maior parte dos artigos sobre tal assunto.

Assim, a “lei de Bradford” enfoca a dispersão de autores em diferentes periódicos, e visa determinar o núcleo de periódicos que melhor se concentra em um tema, de modo a apoiar o estabelecimento dos critérios utilizados para seleção de periódicos na composição de uma coleção.

Bradford apresentou o enunciado de sua lei na forma verbal e na forma gráfica, e sua conclusão é de que existe uma relação entre a

quantidade de periódicos nos grupos que segue a proporção:

1: 𝑚: 𝑚2: …

Onde m é o “multiplicador Bradford” e é característico da coleção em análise.

George Zipf

1935 Frequência no uso das palavras: A “lei de Zipf”, baseada no princípio do esforço mínimo, propõe que palavras cujo custo de utilização seja pequeno ou cujo esforço para transmissão seja mínimo, são mais frequentemente utilizadas em um texto longo.

Formulação da primeira Lei de Zipf:

𝑟 × 𝑓 = 𝑐

Onde r é a posição da palavra no

ranking, f é a frequência de

ocorrência da palavra e c é uma

constante específica do texto. QUADRO 6 – PRECURSORES E LEIS NA BIBLIOMETRIA

2.1.7.1 Lei de Lotka

Alfred Lotka estabeleceu sua teoria sobre a produtividade de autores com o fundamento de que alguns autores publicam muito e muitos autores publicam pouco.

Lotka analisou dados do Chemical Abstracts (1907 a 1916), e do Auerbach’s

Geschichtstafeln der Physik (até o ano de 1900). Em sua contagem foram considerados apenas os autores sêniores, em casos de artigos com mais de um autor. Lotka percebeu que a relação encontrada entre autores e quantidade de artigos publicados por estes autores, em qualquer área científica, segue a proporção do inverso do quadrado (1/n2). Em um determinado período de tempo, observando um número n de artigos, o número de autores que escrevem dois artigos seria igual a 1/4 (um sobre quatro) do número de autores que escreveram um artigo. A quantidade de autores que escreveram três artigos seria igual a 1/9 (um sobre nove) do número de autores que escreveram um, e assim sucessivamente (BORSCHIVER e GUEDES, 2005). Experimentos subsequentes revelaram que o expoente no denominador não é necessariamente sempre igual a dois, mas está no intervalo aproximado de dois a quatro (BELLIS, 2009). Portanto a Lei de Lotka pode ser expressa pela equação:

EQUAÇÃO 1 – REPRESENTAÇÃO MATEMÁTICA DA LEI DE LOTKA

𝑝(𝑛) = 𝐶

𝑛𝑎 (1)

Onde p é a quantidade de autores que produzem n contribuições, C é uma

constante característica do campo de pesquisa, e a, chamado de expoente de Lotka, é um parâmetro que também depende do campo de pesquisa.

2.1.7.2 Lei de Bradford

Samuel Bradford, bibliotecário chefe do London Science Museum, estava

insatisfeito com os serviços de indexação disponíveis à sua época. Ele observou o modo como os artigos científicos estavam dispersos nos periódicos a partir da análise e classificação em duas bibliografias de geofísica: Current Bibliography of

Applied Geophysics (referente ao período de 1928 a 1931) e o Quarterly

Bibliography of Lubrication (referente ao período de 1931 a 1933).

Com base em suas observações, Bradford enunciou sua teoria da seguinte forma:

[...] se periódicos científicos forem ordenados em ordem decrescente de produtividade de artigos sobre um determinado assunto, poderão ser divididos em um núcleo de periódicos mais particularmente dedicados ao assunto e em vários grupos ou zonas, contendo a mesma quantidade de artigos que o núcleo. O número de periódicos (n), no núcleo e zonas

subsequentes, variará na proporção 1:n:n2:... [...] (BORSCHIVER e

GUEDES, 2005, p. 4).

A teoria de Bradford é polêmica entre os cientistas da área. Diversos artigos foram publicados por autores como Brian Vickery, Ferdinand Leimkuhler, Bertram C. Brookes, Leo Egghe, Ronald Rousseau e Eugene Garfield, que discutem a teoria de Bradford. A razão da polêmica é que Bradford apresentou sua teoria na forma verbal e na forma gráfica sem, entretanto, apresentar uma equação matemática correspondente. Dentre os que demonstraram a que a forma verbal e a forma gráfica da lei de Bradford não são equivalentes estão Brian Vickery, em 1948, (BELLIS, 2009) e Leo Egghe (EGGHE, 1988).

2.1.7.3 Lei de Zipf

A Lei de Zipf, comparada às Leis de Lotka e Bradford, que tratam de produtividade de autores e de periódicos, respectivamente, parece estar fora de contexto, pois refere-se à frequência de ocorrência de palavras dentro de textos, enquanto Lotka e Bradford tratam de elementos externos ao conteúdo do texto (BELLIS, 2009).

Zipf observou que em um texto existe uma relação entre a frequência com que uma determinada palavra ocorre no texto e a sua posição, ordenada de modo decrescente, segundo sua frequência de ocorrência no texto (BORSCHIVER e GUEDES, 2005).

Zipf, em 1938, descreveu esta relação da seguinte forma:

EQUAÇÃO 2 – REPRESENTAÇÃO MATEMÁTICA DA PRIMEIRA LEI DE ZIPF

𝑟 × 𝑓 = 𝑐 (2)

Onde r é a posição da palavra, f é a frequência da palavra e c é uma constante específica do texto. Esta relação, entretanto, aplica-se apenas ao conjunto de palavras de maior frequência no texto. A segunda Lei de Zipf enuncia que, em um determinado texto, várias palavras de baixa frequência de ocorrência têm a mesma frequência.

Booth (1967) revisou e modificou a relação proposta por Zipf para as palavras de baixa frequência e propôs sob a forma:

EQUAÇÃO 3 – REPRESENTAÇÃO MATEMÁTICA DA SEGUNDA LEI DE ZIPF

𝐼1 𝐼𝑛 =

𝑛(𝑛 + 1)

2 (3)

Onde I1 é o número de palavras que ocorrem apenas uma vez (frequência igual a 1), In é o número de palavras com frequência n, e 2 é uma constante válida para o idioma inglês.