• Nenhum resultado encontrado

que a sua distribuição apresentava um padrão no qual 80% dos registros se concentravam nos primeiros 1.000 nomes de maior frequência. Portanto, diante dessa circunstância, ini- cialmente foi decidido inferir no MMD com apenas 1% dos nomes de maior frequência. O mesmo padrão se repetiu para os nomes de cidades, exigindo a mesma estratégia. Como resultado, tal técnica foi utilizada para otimizar a convergência das coordenadas, através da qual 93% dos registros da base Extrato de Localidades obtiveram suas coordenadas, e foram usados na análise de mobilidade do presente estudo.

Finalmente, com a obtenção, seleção, pré-processamento e tratamento dos dados foi pos- sível montar a base do MMP, que consiste no fluxo dos registros de cada pesquisador, em ordem cronológica de cada acontecimento, agrupados em um multigrafo.

4.5

Processamento e Interpretação dos dados

Diante da base MMP é possível acessar de modo ágil toda a mobilidade da amostra, de tal forma que a base que possuía dados no volume de GB passa ao tamanho de quase 10 MB em formato comprimido. Logo, a ideia nesta etapa consiste em realizar o processamento sobre os fluxos da amostra, no intuito de gerar informações importantes que não são aparentes na plataforma Lattes, devido ao formato como se apresentam os dados, ao seu grande volume e a estratégia de publicação com bloqueios via CAPTCHA.

O processamento gerou alguns artefatos que incluem alguns gráficos, como MFC, GM e MC, em função dos 797.486 deslocamentos entre quase 2.000 instituições distintas existentes nesta amostra. Também foi gerada uma análise estatística de todo o fluxo de deslocamento para se entender quais são os locais e instituições de destaque na mobilidade dos pesquisa- dores, além das métricas que permitem gerar os gráficos que ajudam nas interpretações dos dados. Coube também a esta etapa, identificar padrões relevantes na mobilidade nos vários estágios de formação da amostra, que são discutidos e analisados na última etapa do MMD e serão apresentados detalhadamente no próximo capítulo. Por fim, existe a possibilidade do MMD tornar os dados e artefatos gerados acessíveis futuramente em uma aplicação Web pública.

4.6 Considerações Finais 70

4.6

Considerações Finais

Neste capítulo foram apresentadas as etapas do MMD para gerar a base do MMP. A partir da utilização do método foram obtidos os dados sobre mobilidade de uma amostra de pesquisa- dores, na qual se ajustaram os dados para extrair um conjunto de variáveis e a estrutura de dados que representa a mobilidade.

Diante disso, o próximo capítulo será dedicado a avaliar as variáveis extraídas, junta- mente com as análises estatísticas. Além disso, também irá gerar as métricas e visualizações gráficas sobre os deslocamentos, que viabilizará as suas devidas interpretações.

Capítulo 5

Resultados e Discussões

No capítulo anterior foram apresentadas as etapas do Modelo de Mineração de Dados (MMD), para geração da mobilidade dos pesquisadores armazenadas na base Multigrafo de Mobilidade dos Pesquisadores (MMP). Dessa forma, este capítulo descreve o processa- mento e as análises realizadas nos deslocamentos, em todo o ciclo de formação da amostra selecionada, para exibir alguns dos padrões e dos resultados mais relevantes gerados pelo MMD.

Sendo assim, a Seção 5.1 apresenta os fluxos que acontecem a partir do nascimento até a primeira formação entre os pesquisadores, apontando quais instituições e locais se des- tacam nesses deslocamentos. Na Seção 5.2 é realizada a comparação dos fluxos entre as formações da amostra, começando da primeira titulação até a última, incluindo também as análises sobre os padrões desses deslocamentos, destacando a influência do poder público na evolução da comunidade científica, o que permitiu a ampliação e a distribuição da for- mação dos doutores no contexto nacional. Já a Seção 5.3 exibe as informações sobre os fluxos a partir da conclusão da formação acadêmica para algum local de atuação profissi- onal, também informando quais são os locais que se destacam nesses deslocamentos. Por fim, a Seção 5.4 discute a relação das métricas extraídas do grafo de mobilidade com alguns conceitos existentes, como a internacionalização e a associação com conceitos de qualidade das instituições.

5.1 Origem dos Doutores 72

5.1

Origem dos Doutores

Para analisar a origem da amostra coletada, foi preciso inicialmente filtrar os deslocamen- tos baseado nos Fluxo de Nascimento para a primeira Formação, os FNF, ocupando 24% do total. Diante dessa operação, foi possível perceber que a origem dos doutores é 95% de brasileiros, o que se aproxima da proporção global dos currículos na plataforma. Quanto à localização, a maioria distribui-se entre partes das regiões sul, sudeste e nordeste do Bra- sil, ao passo que no exterior, a maioria das origens advém da Europa e América do Norte, conforme apresenta a Figura 5.1a.

Também foi possível identificar que 40% das primeiras formações estão presentes nas cidades de origem do doutor, onde as cidades de São Paulo, Rio de Janeiro, Porto Alegre e Belo Horizonte sempre ocupam o posto entre as que mais ofereceram doutores e os retêm no início de carreira. Já a USP, UFRJ, UNICAMP, UNESP e UFRGS são as universidades que mais atraem os doutores no início de formação em termos absolutos ao longo dos anos, acumulando cerca de 24% dos doutores conforme ilustra a Figura 5.1b.

(a) MC no contexto do continente

(b) Proporção da escolha da primeira instituição na formação de doutores.

Figura 5.1: Informações sobre o FNF.

Coincidentemente, estas instituições estão localizadas em regiões de grande concentração habitacional em relação as demais, possuindo grande relevância no contexto da pesquisa nacional. Entretanto, caso se analise a origem das pessoas atraídas por essas instituições, percebe-se que nem todas elas vieram da cidade da instituição. Por exemplo, na USP 47% dos doutores que iniciaram sua formação lá vieram da cidade de São Paulo e 83% do estado