• Nenhum resultado encontrado

Thomas Kuhn (2007), um dos mais proeminentes autores em Filosofia da Ciência, propõe a Teoria das Revoluções científicas para explicar a evolução e mudança em ciência. Kuhn aponta como uma das características do período de evolução da ciência por ele chamado de pré-paradigmático, a falta de uma terminologia precisa e consensada. O discurso científico característico deste período necessitaria assim, de forma recorrente, de estabelecer de forma precisa o significado dos conceitos que utiliza a cada artigo publicado. Um indicador de que um domínio científico atingiu um estágio paradigmático é o estabelecimento de um sistema conceitual consensado, no qual conceitos utilizados para descrever resultados de pesquisa possuem um significado preciso e não precisam mais ser estabelecidos em cada artigo que se publica. Kuhn (2007, p. 149) ressalta que novos conceitos são necessários para lidar com mudanças de paradigma. Um novo paradigma vai requerer assim um novo sistema conceitual para descrevê-lo; novos conceitos implicam em novos termos para representá-los.

Descobertas científicas necessitam de um longo período de tempo para que sejam avaliadas, criticadas, reformuladas, aceitas ou rejeitadas pela comunidade de um domínio científico. Terminologias/ontologias biomédicas mantém o conhecimento consensado em

determinado domínio (e não o conhecimento “revolucionário” ou controverso resultante das novas descobertas que ainda não atingiram o consenso da comunidade científica), uma vez que seu principal objetivo tem sido indexar a literatura científica.

Terminologias/ontologias biomédicas, como a UMLS24 – Unifyed Medical Language System - ou o MeSH – Medical Subject Headings25 - usada nesta pesquisa, na medida que representam o conhecimento científico estabelecido na área, são iniciativas de grande complexidade organizacional, requerendo a mobilização de um grande número de especialistas, o estabelecimento de procedimentos padronizados, fóruns de discussão, reuniões e longos períodos de maturação para se chegar a decisões consensuais. Artigos científicos, por seu lado, trazem resultados imediatos de pesquisas recém realizadas, para os quais ainda não necessariamente se chegou a um consenso. Serão ainda objeto de debate, críticas, refutações e citações em outros artigos, até que, se chegue a um consenso sobre as afirmações/conclusões neles veiculadas. Artigos científicos biomédicos, ao serem publicados e incluídos em repositórios digitais como o PubMed, são registrados segundo conjuntos de metadados padronizados e indexados usando termos tirados do MeSH.

Altamente significativo para esta pesquisa é o fato observado de que existe um intervalo de tempo entre uma nova descoberta científica, sua integração ao sistema de conceitos de um domínio científico e a definição de um termo para representá-lo. Pode-se citar o caso da enzima telomerase, descoberta em 1985; um termo MeSH para representá-la foi estabelecido somente em 1995, dez anos após sua descoberta. Também é relatado o caso de um relatório de 1981 do Centers of Disease Control and Prevention, EUA (CDC 1981), relatando cinco casos de pneumocystis carinii pneumonia (PCP) entre homens jovens saudáveis em Los Angeles, uma doença que viria a ser conhecida como AIDS; de acordo como a National Library of Medicine26, um termo para a AIDS só foi estabelecido no MeSH em 1983. Mudanças científicas necessitam um novo sistema conceitual e de um intervalo de tempo para sua representação nas terminologias científicas. Os registros de termos no banco de dados do MeSH possuem um elemento, denominado “History note”, onde é informado o ano de ingresso do termo no MeSH; esta ano pode ser seguido de outro, entre parênteses, que especifica o ano de ingresso como termo provisório.

24 Ver em http://www.nlm.nih.gov/research/umls/. 25 Ver em http://www.nlm.nih.gov/research/umls/. 26 Ver em http://www.nlm.nih.gov/mesh/MBrowser.html.

É baseado nesta diferença de tempo entre termos cunhados em artigos científicos recém publicados e seu ingresso em terminologias biomédicas que se baseia a proposta de comparar os termos das conclusões de um artigos com os termos MeSH usados para indexar o artigo e utilizar uma medida desta comparação como indicador de novidades científicas trazidas pelo artigo.

Karl Hempel, discutindo as terminologias científicas, faz ainda outra distinção interessante, que não tem sido contemplada na construção destas terminologias, entre termos experimentais e termos teóricos. A descoberta de um novo fenômeno científico sempre se inicia pela sua descrição, até que sejam identificadas as relações causais que regem o fenômeno, que este seja enquadrado numa classificação científica e que seja formulada uma teoria genérica sobre o mesmo (MILLER, 1947). Assim, a utilização de termos experimentais poderia ser um indicador dos estágios iniciais de uma descoberta, enquanto a utilização de termos teóricos seria indicador de um estágio de consolidação teórica de uma descoberta.

Hegenberg (1974) faz distinção semelhante. Este autor afirma:

Nos estágios iniciais de uma investigação, as descrições e generalizações são enunciadas no vocabulário da linguagem comum. Quando a investigação atinge estágios mais avançados, porém, surgem conceitos mais abstratos e, consequentemente, termos de um vocabulário técnico” (HEGENBERG, 1974, p. 15).

Este autor distingue nos discursos científicos termos observacionais e termos teóricos. Desenvolvendo a proposta de Hempel, poder-se-ia distinguir ainda também termos metodológicos, aqueles que indicam ou são característicos de uma determinada metodologia.

Características relativas à forma a aos elementos semânticos chave presentes no texto de um artigo como objetivo, hipótese, metodologia ou conclusões também poderiam ser indicadores de indícios de novas descobertas científicas. Conforme vem sendo indicado por vários autores (GREY, 2009), métodos computacionais de processar grandes quantidades de dados estão modificando a própria metodologia científica, fazendo com que muitos artigos sejam do tipo denominado exploratório, não sendo orientados por nenhuma hipótese específica. A este respeito, Franklin (2004, p. 1) afirma:

… I’ll argue that modern biological techniques, like DNA microarrays and proteomics, allow scientists to experiment in an exploratory mode even in times of normal science. Exploratory experimentation is feasible, and desirable, as a result of “high throughput”i

data collection and analysis technologies, made available only in the past 10 years.

Neste caso a ausência de uma hipótese claramente formulada indicaria uma pesquisa ainda em fase exploratória.

Trabalhamos com artigos biomédicos publicados em formato digital e seus registros, disponibilizados no repositório PubMed. Neste repositório é possível acessar, além do texto completo de muitos artigos, um conjunto de metadados formados por campos bibliográficos descritivos, datas informando o ingresso do registro no repositório, agências e programas de fomento que apoiaram a pesquisa reportada no artigo, o conjunto de descritores MeSH, assinalados segundo metodologia de indexação sistemática e consagrada.

Os descritores MeSH são organizados segundo quatro tipos: Cabeçalhos (Headings), Subcabeçalhos (Subheadiungs), Conceitos suplementares (Suplementary concept records) e Publication types (tipos de publicações) que descrevem as características físicas e de forma de uma publicação, não o seu conteúdo (MEDICAL SUBJECT HEADINGS IN MEDLINE/PUBMED, [s.d]). Entre os tipos de publicação estão, por exemplo, os Ensaios Clínicos (Clinical Trials), testes padronizados de medicamentos ou terapias, que precedem a liberação para uso generalizado dos mesmos, funcionando assim como indicadores da fase de desenvolvimento de um medicamento ou terapia. Estão também disponíveis nos registros PubMed “links” para bases de dados de substâncias ou de drogas eventualmente relacionadas ao artigo.

Estes conteúdos, “links” e metadados formam um rico conjunto de elementos que, individualmente ou de forma combinada, podem servir como indicadores potenciais. Metodologicamente isto significa seguir as indicações de Brookes (1980, p. 128), de observar os registros do Mundo 3, agora disponibilizados e podendo ser coletados num espaço único, contínuo e ininterrupto, que é a Web.

So the practical work of library and Information scientists can now be said to collect and organize for use the records of World 3. And the theoretical task is to study the interactions between World 2 and 3, to describe and explain them if they can and so to help in organizing knowledge rather than documents for more effective use.

4 RESULTADOS

São apresentados a seguir resultados da pesquisa anterior, sintetizados, e resultados parciais da pesquisa atual, ainda em desenvolvimento.

Os artigos analisados na primeira fase da pesquisa foram as chamadas “key publications”, um conjunto de artigo indicadas e comentadas pelos os autores agraciados com o Prêmio Lasker de Medicina do ano de 200627. Esta premiação contemplou três pesquisadores - Elizabeth H. Blackburn, Carol W. Greider e Jack W. Szostak - pela

27

descoberta da enzima telomerase, importante nos processos de reprodução e envelhecimento celular, processos estes hoje reconhecidas como relacionados ao surgimento do câncer.

A análise de conteúdo das conclusões dos artigos indicados nas “key publications” teve como guia o artigo de revisão (BLACKBURN et al., 2006) que os pesquisadores escreveram para o periódico Nature Medicine por ocasião da cerimônia que os agraciou com o Prêmio Lasker 2006. Nesta revisão os pesquisadores ressaltam a trajetória da descoberta científica que fizeram e os artigos que consideravam mais importantes, destacando a contribuição de cada um deles. As “key publications” constituíam um grupo de 15 artigos. A estes foram acrescentados mais 14 artigos selecionados da ou revisão sobre telomerase de Cech (2004), uma revisão muito citada, ou que constavam da linha do tempo disponível na base de dados Telomerase28, formando um total de 29 artigos.

A pesquisa anterior criou também uma classificação para os artigos, baseada em suas características formais e como eram organizados em seu texto elementos formais chave como questões, objetivo, hipótese e conclusões, conforme se segue.

Artigos se dividiriam em Artigos teóricos e Artigos experimentais. Artigos teóricos

se caracterizam por discutirem questões de maior abrangência. Analisam criticamente diversas hipóteses anteriores, mostrando suas fragilidades e apontando novas teorias. O famoso artigo de Watson e Crick (1953) que propôs a estrutura helicoidal para a molécula do DNA seria um típico artigo deste tipo.

Artigos experimentais trazem necessariamente um experimento empírico. Dividem-se em exploratórios, dedutivos e indutivos. Caracterizam-Dividem-se por discutirem questões num escopo de abrangência limitado. Não propõe novas teorias nem discutem os rumos de uma teoria científica, mas se limitam a confirmá-la ou aperfeiçoá-la. Sempre trazem resultados experimentais. Subdividem-se nos seguintes subtipos.

Artigos experimentais-exploratórios tem um caráter exploratório ao desvendar um fenômeno ainda desconhecido pela ciência (FRANKLIN, 2004). Geralmente não são guiados por uma hipótese explícita e buscam descrever/caracterizar (MILLER, 1947) este novo fenômeno como primeiro estágio para integrá-lo/classificá-lo ao esquema de um domínio científico. Formulam e provam proposições que descrevem ou caracterizam este fenômeno. Este tipo de artigo pode vir a ganhar importância em função da emergência de ferramentas automatizas que permitem aos cientistas identificar padrões nos dados sem o auxílio de hipóteses prévias. (THE FOURTH PARADIGM, 2009).

28

Artigos experimentais-dedutivos trabalham a partir de hipóteses já formuladas anteriormente por outros artigos/autores, cujas referências veem citadas, aplicando-as, testando-as e validando-as em contextos específicos. Os artigosexperimentais-indutivos por sua vez se caracterizam por proporem e testarem novas hipóteses.

Os resultados obtidos em Malheiros (2010) a partir da análise dos 29 artigos que constam das “key publications” dos autores agraciados com o Prêmio Lasker de Medicina Básica de 2006, indicam os seguintes resultados.

Os artigos foram analisados cronologicamente, refletindo as etapas significativas da descoberta de enzima telomerase; o artigo mais antigo é de 1978 e o mais recente, de 2007. Os artigos mostraram um padrão característico de evolução de sua classificação, conforme estabelecida anteriormente, e do grau de mapeamento dos termos em suas conclusões nos descritores MeSH. Os artigos mais antigos são do tipo experimental-exploratório e têm os termos das suas conclusões não mapeados ou pouco mapeados nos descritores MeSH que indexaram cada artigo. Os artigos mais recentes são do tipo experimental-indutivo ou experimental-dedutivo e, na maior parte, têm os termos das suas conclusões mapeados nos descritores MeSH que indexam cada artigo. Estes resultados são expostos de forma detalhada em Malheiros e Marcondes (2013).

Na fase atual da pesquisa os resultados obtidos até o momento confirmam parcialmente, a exemplo da pesquisa anterior, que o grau de mapeamento dos termos das conclusões de um artigo nos descritores MeSH usados para a sua indexação pode ser um indicador de novas descobertas. O artigo analisado, o mais antigo do conjunto, Brunet et al. (1987), reporta claramente em seu título e na sua conclusão29 a identificação do CTLA-4, uma nova descoberta. Os descritores MeSH utilizandos para indexar o artigo não incluem o descritor “CTLA-4 antigen”, incluído provisoriamente na base de dados MeSH30

em 1991 e definitivamente, em 2012.

Além disso, no caso desta descoberta, que se refere ao desenvolvimento de medicamentos baseadas tanto no CTLA-4 quando no PD-1, que estimulam o sistema imunológico para combater o câncer, pode-se perceber o avanço nos testes dos medicamentos, pelo uso na indexação dos artigos, dos descritores tipo “check tags” do MeSH ao longo do

29

A conclusão afirma: “we came across cDNA clones defining a sequence, CTLA-4, which could encode a 223-amino-acid protein clearly belonging to the immunoglobulin superfamily.”

30

Ver no registro do descritor, no endereço: <http://www.nlm.nih.gov/cgi/mesh/2014/ MB_cgi?mode=&index=26437&field=all&HM=&II=&PA=&form=&input=>. Acesso em: 2 de jun. 2014.

tempo. Os “check tags” descrevem os sujeitos de uma pesquisa, ou seja, em quem esta sendo realizada a pesquisa; exemplos de “check tags” são “human”, “female”, “child”, “pregnancy”, mas também animais usados nas pesquisas como “mice”, “hamster”, “chick embryo”, etc. Ao longo do tempo os artigos têm, na etapa de inicial de teste de um medicamento, assinalados “check tag” como “mice”, indicando testes de medicamentos em camundongos; posteriormente encontram-se artigos nos quais é assinalado o “check tag” “human”, indicando que agora os testes começam a ser feitos em pessoas. O “check tag” “mice” seria indicador que o desenvolvimento de um medicamento ainda estaria em seus estágios iniciais, ao passo que o “check tag” “human” seria um indicador de um estágio avançado de teste deste medicamento, já em humanos, indicando um estágio de testes anterior somente à sua comercialização. Ou seja, diferentemente do conjunto de artigos analisados previamente, no atual conjunto a analise do conteúdo dos descritores MeSH poderia funcionar como um indicador. Planeja-se publicar resultados sistematizados da análise desta segunda fase da pesquisa em breve.