• Nenhum resultado encontrado

Esta tese não teve como objetivo trabalhar os dados abertos do governo, seu objetivo foi direcionado para dados científicos, ou seja, produzidos por pesquisas científicas. Assim, apesar dos dados abertos do governo serem, muitas vezes, fonte de dados secundários para pesquisas científicas, eles são coletados por entidades governamentais com o objetivo de avaliar programas de governos, gerar indicadores governamentais e prestar contas com a sociedade, portanto, fogem ao escopo da tese – qual seja, trabalhar dados oriundos da e-science, objeto da pesquisa colaborativa do Século XXI, coletados por sensores especializados e em grande escala (big data).

4 ANÁLISE DE DADOS

Neste capítulo são apresentados os resultados da terceira etapa da pesquisa que procurou mapear a situação da gestão de dados de pesquisa no Brasil, a qual corresponde aos objetivos específicos 499 e 5100, respectivamente. Ressalta-se que os objetivos específicos 1, 2 e 3 tiveram seus resultados alcançados e apresentados na análise bibliométrica sobre o estudo do termo e-

science nas bases de dados LISA e LISTA, bem como a segunda etapa da pesquisa que foi

realizada na School of Information da University of Michigan, conforme já descrito no Capítulo 3.2.3 – referente aos procedimentos operacionais da pesquisa.

Esta etapa da pesquisa foi conduzida com dois grupos de amostra, ambos selecionados de forma não probabilística e intencional. Cabe ressaltar que a compreensão do fenômeno exigiu que fosse observado o comportamento tanto de pesquisadores brasileiros envolvidos com o assunto, quanto de funcionários de agências de fomento e fundações de amparo à pesquisa no Brasil. Ao considerar-se o exposto, os dados obtidos nessa etapa indicam tendências e, uma vez que a amostra não foi probabilística, estes dados não devem ser extrapolados.

Os resultados são apresentados por grupo de entrevistados. No Capítulo 4.1 consta a análise dos dados referentes aos pesquisadores doutores envolvidos com questões inerentes aos dados científicos no Brasil, seguindo-se o Capítulo 4.2 referente à análise dos dados relativos às Agências de Fomento. No Capítulo 4.3 é apresentada a análise sobre o entendimento do termo curadoria de dados e gestão dos dados, bem como sobre a necessidade de uma política nacional de gestão de dados científicos. Ao final, no Capítulo 4.4, é apresentada a teoria fundamentada em dados, sintetizada na proposta de um framework que contém diretrizes para a elaboração de uma política de gestão de dados científicos. Esse framework foi elaborado a partir da reflexão da codificação das respostas qualitativas de ambos os instrumentos de coleta de dados, bem como da compreensão da literatura revisada sobre a gestão de dados científicos. A Figura 27 ilustra os diferentes instrumentos de pesquisa, com o número de respondentes para cada um deles.

99 OE 4 – Identificar a postura das agências de fomento no Brasil com relação ao tema. 100 OE 5 – Identificar o posicionamento dos pesquisadores brasileiros envolvidos com o tema.

Figura 27 – Instrumento de coleta de dados versus quantidade de resposta.

Fonte: a autora.

Para apoiar a análise qualitativa dos dados foi utilizado o software Nvivo versão 10. O objetivo de se utilizar o software foi construir as categorias de informações à luz da Teoria Fundamentada em Dados. Para tanto, as entrevistas dos doutores, bem como as respostas dos questionários das agências de fomento foram transcritas e posteriormente alimentadas em uma planilha em Excel. Essa planilha foi importada para o Nvivo10 com todas as respostas tanto das entrevistas, como dos questionários.

O software se mostrou de difícil utilização, pois a versão 10 é pouco amigável em relação à versão 11, além de não apresentar as mesmas opções de geração de gráficos, análise de cluster, construção de mapas mentais dentre outros recursos de análise. Assim, o uso do Nvivo10 nesta tese se restringiu à construção das categorias de informação no que o software denomina Fonte Interna de Dados, ou seja, na base empírica da pesquisa – entrevistas e questionários.

Há que se ressaltar que apesar do software vender uma facilidade no processo de codificação dos dados, o fato é que a codificação só ocorre quando o pesquisador consegue alcançar familiaridade com a sua massa de dados. E a familiaridade, por sua vez, é alcançada por meio da reflexão, independentemente do uso de softwares ou não. Nesse sentido, tudo que foi feito nesta tese com o uso do Nvivo10 poderia ter sido feito manualmente. Cabe ressaltar que a dificuldade de gerar gráficos levou a pesquisadora a exportar suas categorias de informação para o SPSS de forma a viabilizar a análise da frequência das categorias por resposta qualitativa, o que gerou uma estatística descritiva.

A experiência no uso do Nvivo10 permite afirmar que seu potencial se dá quando o pesquisador inicia sua utilização na categorização de fontes externas (literatura, documentos, etc.) e durante sua análise de dados na categorização de fontes internas, o que permitiu uma comparação entre ambas.

Nesta tese, as poucas questões que foram analisadas exclusivamente no Nvivo10 foram as referentes ao entendimento do conceito de curadoria de dados e gestão de dados científicos. Além dessas, analisou-se ainda a questão referente ao delineamento das características e do perfil profissional do cientista de dados. Porém, as saídas gráficas não se mostraram visualmente harmônicas, o que levou a pesquisadora a procurar o auxílio de um designer para redesenhar os gráficos com fundamento nos dados gerados pelo Nvivo.

Além do Nvivo10, foram utilizados nesta tese os softwares SPSS e Excel no processo de geração de análises descritivas e geração de gráficos. O SPSS se mostrou um facilitador no cruzamento de dados dos respondentes e permitiu a análise entre a área de formação do pesquisador, geração à qual pertence, versus comportamento das respostas, o que permitiu algumas inferências por parte da pesquisadora.

4.1 ANÁLISE DOS DADOS REFERENTES AOS PESQUISADORES DOUTORES