• Nenhum resultado encontrado

Fase III – Análise de Dados Comparação de Políticas

2.9. COLETA DE DADOS

2.9.3. Limites da coleta de dados

Desde a etapa de concepção do Projeto de Tese, já era possível prever dificuldades e incoerências na obtenção de dados gerais a respeito do Fies, especialmente quanto às rubricas empregadas e financiamentos concedidos. Na intenção de mitigar isso, definimos que a série histórica a ser investigada seria aquela cujos microdados estivessem disponíveis e os dados sociais e de perfil dos(as) contratantes pudessem ser triangulados.

No que se refere aos dados sociais e educacionais, embora o Fies esteja disponível à população desde 1999, seus microdados só foram disponibilizados a partir de 27 de dezembro de 2016 (FNDE, 2020a); o primeiro semestre publicado foi 2010/2, ou seja, a base anterior só está disponível nos Relatórios Anuais, com informações que mudam de nome, de formato e de característica a cada versão publicada. Como exemplo dessa trajetória, para os leitores e leitoras que se permitirem desafiar mais na análise dessa Política, sugiro extrema atenção aos Relatórios Anuais de Gestão do Fies, disponibilizados anualmente pelo FNDE até 2018, referentes ao exercício anterior, nos quais, desde então, nada novo foi divulgado. Esses documentos, de absoluta importância aos cientistas, economistas, e, sobretudo, à população em geral, foram, desde 1999, mudados ano após ano, o que obriga o(a) investigador(a) a um desafio para a formação de uma série temporal fiel.

Não obstante, os próprios microdados são um convite ao desafio. Mesmo com formação em análise de sistemas, entre encontrar os microdados, de fácil acesso e disponibilidade, e a construção de uma base possível de investigar longitudinalmente, foram necessários recursos avançados de bancos de dados. Isto ocorre pelo tamanho dos arquivos, imensos, como também pela ausência de uma chave de identificação inequívoca de um estudante, que só é possível pela combinação de chaves de inscrição e de contrato. Até mesmo os dicionários de dados, uma ferramenta indispensável para o público poder analisar as informações, não é atualizada há três anos, e oito novas colunas de dados já foram incluídas desde então. Entre a defesa do Projeto, em agosto do ano de 2018, até março de 2020, troquei sete e-mails com servidores do INEP, da SESu, e do MEC, na tentativa de acessar o BI-MEC, um sistema de informações consolidadas, e mais amigável, ou mais informações sobre os Relatórios Anuais dos anos de 2018 e 2019; não obtive qualquer retorno.

Outra dificuldade refere-se aos contratos concedidos, pois os totais dos Relatórios Anuais de Gestão divergem entre si, ano após ano, e, mais ainda, quando confrontados aos Microdados disponíveis, o que condicionou a criação de, praticamente, dois bancos de dados: um que filtra os(as) estudantes semestre a semestre, que chamei contratos Fies,, e um segundo, ano a ano, que chamados de inscritos Fies. Apenas para fins de exemplo, no ano de 2016, os

Relatórios Anuais apontam a existência de 2.185.038 financiamentos concedidos. Quando analisados os microdados do mesmo ano, identificamos 2.995.270 registros, para 1.712.552 inscritos. Mesmo quando somamos o ingresso das 287.367 pessoas que contraíram o Fies no ano, não conseguimos aproximar as informações, o que nos obrigou a analisar três totais, ano a ano.

Quanto aos dados do Fies, em especial, no ano de 2017 há uma importante perda de registros nos microdados, o que será observado durante toda etapa de análise de dados, na sequência.

Na contramão dos microdados do Fies, vêm os do Prouni, cujas informações são escassas, e só permitiram uma análise inicial do seu perfil. Somado a isso, diferentemente do Fies, que disponibiliza detalhadamente os financiamentos concedidos ano a ano, ou seja, de alunos(as) novos(as) e de exercícios anteriores, os do Prouni só publicam as bolsas concedidas no ano corrente, e sem estratos de tipos de curso, ou informações mais detalhadas do público- alvo; seria necessária também a triangulação com a base de dados do Enade, o que não foi possível esgotar nessa tese.

Ainda no Prouni, assim como os dados econômicos da educação superior brasileira, em que as bases de dados estão dispersas e divergentes, a maior dificuldade encontrada nessa etapa foi a de obtenção dos beneficiários acumulados em anos anteriores para o cálculo do valor de um aluno por ano. Se dividirmos o orçamento anual do Prouni pelo número de beneficiários registrados nos microdados, ignoramos que essa flutuação envolve, em média, entre quatro e cinco anos de um curso de graduação, ou seja, a maior parte da rubrica presta-se para a cobertura de bolsas de anos anteriores ao vigente.

Para obtermos o somatório de beneficiários do Prouni, longitudinalmente, consultamos os Relatórios Anuais do Gabinete da Presidência da República – desde 2010 até 2020 –, cujo formato muda completamente de um ano para o outro, e as informações consolidadas, quanto ao Programa são mais escassas a cada novo exercício.

A base Enade também foi um desafio à parte. O acesso é simples (INEP, 2020a), o download é rápido, e os dicionários de dados são fáceis e bem atualizados. Contudo, novas colunas foram introduzidas ano a ano, em meio às já existentes, o que exige trabalho adicional para a construção de séries temporais, que seria impossível de esgotar aqui, mas necessária, e realizada.

Expostas as principais dificuldades encontradas na obtenção dos dados educacionais e sociais, os dados econômicos também configuraram, especialmente para o constructo Fies, conhecimento, investigação e dias de trabalho para o preparo das bases, pois entre fontes primárias e secundárias, mais de 100 tipos de informações oficiais foram consultados. Ou

estavam dispersas, ou reunidas em locais de múltiplas informações, ou espalhadas, ou escondidas entre outras, a exemplo dos dados referentes à emissão de títulos CFT-E Tipo 5, explicada anteriormente. O agrupamento das informações econômicas do Fies em quatro grupos também não foi desinteressada, pois, para explicarmos o funcionamento da política sob múltiplos cenários, foi necessário decompor as rubricas em campos, do contrário, corríamos o risco de confundir valores, o que não foi incomum durante a coleta de dados.

Quanto ao orçamento da educação brasileira, identificamos que as bases são divergentes, quando não incoerentes entre si, o que exigiu o emprego de múltiplas combinações para o cálculo de despesa anual por aluno. A dispersão das informações revela-se manifesta quanto ao próprio entendimento do orçamento do ensino superior, que ora mistura valores de institutos federais (IFs), ora de Centros Federais Tecnológicos (CEFETs), ora das renúncias tributárias do Prouni, ou o orçamento empregado no Fies. Para tanto, observamos rigorosamente dois procedimentos: selecionar apenas o orçamento empregado nas universidades federais, ou seja, ignoramos as rubricas de IFs e CEFETs, e, quanto às matrículas/ano, decompor os registros dos vinte anos do Censo da Educação Superior em total de matrículas Brasil, total de matrículas públicas, e total de matrículas em universidades públicas federais, por estado, por região, e brasileira.

Nossa coleta de dados – econômicos e sociais – foi concluída em 21 de abril de 2020, abrigando os microdados Fies até o segundo semestre de 2019, disponibilizados em 11 de abril de 2020 (FNDE, 2019c), quando já estavam preparados todos os bancos de dados, visões, tabelas e gráficos sociais, o que terminou por refatorar as informações dessa fonte aos financiamentos concedidos.

As distorções nas informações, combinada à dificuldade de encontrar os dados completos anteriores ao segundo semestre de 2010, obrigou-me a tomar duas decisões. A primeira delas, definir que o intervalo de análise econômica da Política, cujos dados estavam espalhados, mas disponíveis desde a criação do Fies, seriam desde 1999 até 2020. Contudo, a discussão socioeconômica de seus(suas) estudantes, bem como os da educação superior brasileira e do Prouni, apenas a partir de 2011 – descartando o ano de 2010, cujo primeiro semestre também estava indisponível – e até o segundo semestre de 2019, ou seja, a análise de dados sociais e deste estudo referem-se ao intervalo fechado [2011→2019].

Expostas as limitações para a coleta de dados, a seção seguinte faz um Quadro-Resumo da coleta de informações e dos agrupamentos realizados para cada análise apresentada.