• Nenhum resultado encontrado

PARTE II RESULTADOS 76

4   Resultados da pesquisa na base PubMed 76

4.2   Organização hierárquica da rede 93

As redes estudadas apresentam uma estrutura hierárquica baseada nos tipos de relações que existem ou são construídas pelos pesquisadores ao longo de sua carreira científica. Quanto maior o número de publicações maior o número de colaborações de um autor, levando-se em consideração o número médio de colaboradores por artigo, que tem aumentado nos últimos anos. Com o crescimento gradativo do número de publicações e colaborações um pesquisador passa a exercer maior controle sobre sua rede de colaboração direta e indireta, uma vez que este se encontra exposto a uma diversidade maior de conhecimento e de parceiros de pesquisa.

Para entender as estruturas hierárquicas de pesquisadores influentes, faz-se necessário compreender as medidas de rede que podem contribuir com essa análise. Duas medidas importantes no sentido da formação de grupos são o coeficiente de clusterização e a assortatividade. O coeficiente de clusterização demonstra qual é a probabilidade média de que dois coautores também sejam coautores de um terceiro pesquisador, e a assortatividade, que é o coeficiente de correlação de Pearson, analisa a possibilidade de que dois pesquisadores com relacionamentos similares tenham relações entre si. Outras estatísticas dizem respeito ao número de colaboradores ou ao número de colaborações, a chamada centralidade de grau, onde no segundo caso são levadas em consideração as múltiplas colaborações com um mesmo autor.

Essas medidas demonstram que quanto mais colaborações um autor possui maior a chance de que novas colaborações se estabeleçam. Nesta análise não foi levado em consideração o ciclo de vida de um pesquisador, que no final da carreira tende a diminuir o número de publicações devido a fatores como aposentadoria ou mesmo ao aumento de atividades gerenciais em alguns casos.

Um dos elementos encontrados nas pesquisas e que corrobora estudos de coautoria (NEWMAN, 2004; BARABÁSI, 2002) é que a rede de pesquisadores em ciência tende a ser muito coesa e com muitos relacionamentos em todas as esferas. O fato de que a maioria dos cientistas não funciona de forma isolada da corrente principal da sua área de pesquisa é reconfortante. Contudo, é imprescindível uma análise mais aprofundada para perceber se esse forte relacionamento tende a ajudar ou não a evolução do conhecimento de áreas específicas.

Dando continuidade ao trabalho de análise da colaboração, foca-se na distribuição da centralidade de grau, que é uma propriedade quantitativa básica de redes que permite revelar se estas possuem características de interação em que um pequeno número de nós ou hubs

possui uma alta centralidade de grau enquanto a grande maioria da rede possui poucas colaborações. Esta propriedade é importante porque muitos comportamentos de sistemas em rede são dominados por seus hubs. Esses resultados definem uma hierarquia topológica em que os autores, ou hubs, com muitas relações com outros autores estão no topo da cadeia de conhecimento, influência e poder.

4.2.1 Medidas da rede leishmaniose

As estatísticas básicas e agregadas da rede LN são apresentadas na Tabela 5. Segundo os dados levantados, os pesquisadores conduzem atividades conjuntas sobre leishmaniose com uma média de 4,85 coautores por artigo. O maior componente, ou o conjunto máximo de cientistas ligados uns aos outros, preenche a maior parte da rede de coautores (86%), que é chamado de componente gigante. O coeficiente de clusterização, a medida da extensão em que os cientistas na rede tendem a agrupar-se em conjunto, é também elevado – cerca de 5.320 vezes superior ao de uma rede aleatória equivalente que normalmente é utilizada como referência. Além disso, 85% dos cientistas de LN já escreviam seus trabalhos em equipe durante o período de 1981 a 1984, com um número médio de 2,4 autores por artigo. No período de 2009 a 2012, apenas 3% dos pesquisadores de LN escreveram seus artigos individualmente, enquanto o tamanho da equipe média havia aumentado para 4,6, o que representa o dobro do tamanho médio da equipe ao longo do período de 32 anos. Outro elemento de análise é a média do caminho mais curto, muito lembrado quando se discutem os seis graus de separação. Essa medida analisa quantas conexões são necessárias para que um pesquisador da rede se conecte a qualquer outro pesquisador da mesma rede.

TABELA 5. Estatísticas agregadas básicas para a rede de colaboração em leishmaniose

Leishmaniose

Número total de autores 31.284

Número total de ligações entre autores 151.567

Número total de artigos 16.482

Artigos com um único autor 6%

Número máximo de artigos por autor 172 Número médio de colaboradores por autor 4,85 Número máximo de colaboradores por autor 413 Número médio de colaborações por autor 6,55 Número máximo de colaborações por autor 718 Tamanho do componente gigante (%) 86

Média do caminho mais curto 4,8

Coeficiente de clusterização 0,824

A Figura 22 mostra uma representação gráfica em escala logarítmica da distribuição de graus, ou número de coautores, que os pesquisadores possuem na rede LN. Embora a rede não siga um padrão da lei de potência para todos os valores de grau k, observa-se na parte inferior do grafo, ou na sua cauda, que esta adota a distribuição de uma lei de potência com p (k) = k-α para valores acima de kmin = 110 e com valor de p = 0,72 no teste de hipótese (CLAUSET; SHALIZI; NEWMAN, 2009).

FIGURA 22. Curva de distribuição de grau dos autores na rede sobre leishmaniose

Fonte: elaboração do autor

Legenda: o gráfico é a distribuição de grau dos autores em leishmaniose em escala logarítmica. O eixo esquerdo apresenta uma escala cumulativa onde 1e + 00 representa 100% dos autores, indicando que toda rede possui pelo menos uma colaboração, o que pode ser visto no eixo inferior. No outro extremo, apenas 1e - 04 ou 0,0001 dos pesquisadores possui mais de quatrocentas colaborações ou centralidade de grau. A linha vermelha no gráfico indica uma curva logarítmica verdadeira, também chamada de LogxLog, onde os pesquisadores com grau de centralidade acima de 110 estão alinhados com essa distribuição. A linha verde apresenta uma curva logarítmica normal, onde os pesquisadores com grau acima de 75 estão alinhados com essa distribuição. Esse resultado indica que a curva de distribuição de grau dos autores não segue na sua totalidade a distribuição de potência.

Foram encontrados 125 hubs que possuem a centralidade de grau acima do kmin. A primeira indicação da sua importância é que esses hubs, que representam apenas 0,47% de todos os pesquisadores do componente gigante, interagem com 39% dos demais pesquisadores da rede.

Para confirmar que os hubs desempenham um papel-chave na rede LN, investigou-se a correlação entre a centralidade de grau e a de intermediação (Figura 23). A centralidade de intermediação é considerada uma medida do quanto um agente pode influenciar ou controlar os outros. Cientistas com maior centralidade de grau possuem também uma alta centralidade de intermediação, o que implica que eles têm poder sobre a rede.

FIGURA 23. Correlação entre centralidade de grau e centralidade de intermediação

Fonte: elaboração do autor

Legenda: centralidade de intermediação do nó versus centralidade de grau para o período de 1981 a 2012. Nós com alta centralidade de grau também possuem alta centralidade de intermediação, tanto em sua comunidade quanto em outras comunidades. A linha reta representa uma avaliação linear dos dados, enquanto a linha pontilhada segue a tendência. Os valores de grau e de intermediação estão normalizados.

4.2.2 Medidas da rede tuberculose

Os dados de rede apresentados sobre a tuberculose possuem uma diferença perceptível quanto aos dados da rede leishmaniose. Isso se deve ao fato de o recorte feito na rede TB ter sido diferente, de muitas maneiras, do recorte realizado na rede LN. O primeiro fator diz respeito ao recorte temporal, que foi metade (16 anos) para TB em relação à LN (32 anos) devido ao grande número de artigos em TB. O segundo e mais importante fator para análise de redes foi o recorte quanto ao número de pesquisadores. O número total de autores para os 68.958 artigos em TB foi de 141.212. Devido a restrições na capacidade de processamento de redes com esse número de nós, resolveu-se analisar somente os pesquisadores com três ou mais publicações na área. Por essa razão, autores que publicaram somente uma ou duas vezes durante os últimos 16 anos foram retirados da análise. Esse recorte acabou por deixar a rede muito mais conectada e com menos autores na periferia.

As estatísticas básicas e agregadas da rede TB são apresentadas na Tabela 6. Um dos elementos que apresentaram uma diferença representativa em comparação à rede LN foi o componente gigante. Como agora todos os autores possuem três ou mais publicações, o percentual de autores não conectados na rede foi de apenas 2%, deixando o componente gigante com 98% da rede.

Outro elemento de destaque é a razão entre o número de autores e o número de linhas. Enquanto a LN tinha em média cinco vezes mais linhas do que autores, a TB possui cerca de 12 vezes mais linhas que autores, com 124.915 linhas de ligações e 9.577 pesquisadores na rede estudada. O número máximo de artigos por autor foi também maior que o da LN, com 250 publicações, mesmo com um menor recorte temporal. O número médio de colaboradores e colaborações ficou em 26 e 57 respectivamente. Esse número médio deveria ser bem menor caso os autores com uma e duas publicações tivessem sido incluídos na análise. O número máximo de colaboradores e colaborações não deve ter tido um impacto muito grande e ficou avaliado em 536 colaboradores e 1.357 colaborações. O número de colaboradores e colaborações está ligado diretamente à centralidade de grau. No entanto, na pesquisa de publicações científicas deve-se levar em consideração que alguns artigos possuem um número muito mais elevado de colaboradores que a média dos demais artigos. Se a análise de uma rede social se baseia no fato de os pesquisadores, quando colaboram em um mesmo artigo, criarem uma relação de trabalho, esse discurso deve ser avaliado quando isso não acontece em casos de artigos com centenas ou mais colaboradores.

TABELA 6. Estatísticas agregadas básicas para a rede de colaboração em tuberculose

Tuberculose

Número total de autores 9.577

Número total de ligações entre autores 124.915

Número total de artigos 68.958

Número máximo de artigos por autor 250 Número médio de colaboradores por autor 26 Número máximo de colaboradores por autor 536 Número médio de colaborações por autor 57 Número máximo de colaborações por autor 1.357 Tamanho do componente gigante (%) 98

Média do caminho mais curto 3,6

Coeficiente de clusterização 0,9182

Assortatividade 0,0835

Fonte: elaboração do autor

A Figura 24 exibe a representação gráfica em escala logarítmica da distribuição de graus, ou número de coautores, que os pesquisadores possuem na rede TB, assim como foi feito na rede LN. A alta coesão dos autores na rede descortina também uma diferença no limite mínimo para uma distribuição com características da lei de potência. No caso da rede TB, o recorte ficou com os autores com 64 colaboradores (grau) ou mais, que seguem uma escala logarítmica quanto a sua distribuição. Apesar desse recorte, kmin, na parte de menor grau no gráfico pode-se perceber, na outra ponta, uma divergência quanto aos autores com maior grau da linha de potência real demonstrada pela linha vermelha. A rede, portanto, segundo o algoritmo de Clauset, Shalizi e Newman (2009), atende em parte uma distribuição

logarítmica alinhada com outras redes de pesquisa já analisadas com p (k) = k-α para valores acima de kmin = 64 e com valor de p = 0,90 no teste de hipótese.

FIGURA 24. Curva de distribuição de grau dos autores na rede sobre tuberculose

Fonte: elaboração do autor

Legenda: o gráfico é a distribuição de grau dos autores em tuberculose em escala logarítmica. O eixo esquerdo apresenta uma escala cumulativa onde 1e + 00 representa 100% dos autores, indicando que toda rede possui pelo menos uma colaboração, o que pode ser visto no eixo inferior. No outro extremo, apenas 1e - 04 ou 0,0001 dos pesquisadores possui mais de quinhentas colaborações ou centralidade de grau. A linha vermelha no gráfico indica uma curva logarítmica verdadeira, também chamada de LogxLog, onde os pesquisadores com grau de centralidade acima de 64 estão alinhados com essa distribuição. Esse resultado indica que a curva de distribuição de grau dos autores segue em parte a distribuição de potência.