Silvia Viana Pannuti
ESCOLAS DE ENSINO MÉDIO PROFISSIONALIZANTE NO
CEARÁ: UMA ANÁLISE DE DESEMPENHO ACADÊMICO
Escolas de ensino médio profissionalizante no Ceará: uma análise
de desempenho acadêmico
Dissertação apresentada ao Programa de Mestrado Profissional em Administração do Insper Instituto de Ensino e Pesquisa, como parte dos requisitos para a obtenção do título de Mestre em Administração.
Área de concentração: Gestão de Educação Pública
Orientador: Prof. Dr. Eduardo de Carvalho Andrade – Insper
Co-orientador: Prof. Dr. Nilton Deodoro Moreira Cardoso Junior - Insper
Pannuti, Silvia Viana
Escolas de ensino médio profissionalizante no Ceará: uma análise de desempenho acadêmico / Silvia Viana Pannuti; orientador: Eduardo de Carvalho Andrade; co-orientador: Nilton Deodoro Moreira Cardoso Junior– São Paulo: Insper, 2014.
69 f.
Dissertação (Mestrado – Programa de Mestrado Profissional em Administração. Área de concentração: Gestão da Educação Pública Fundamental) – Insper Instituto de Ensino e Pesquisa.
FOLHA DE APROVAÇÃO
Silvia Viana Pannuti
Escolas de ensino médio profissionalizante no Ceará: uma análise de desempenho acadêmico
Dissertação apresentada ao Programa de Mestrado Profissional em Administração do Insper Instituto de Ensino e Pesquisa, como requisito parcial para obtenção do título de Mestre em Administração.
Área de concentração: Gestão de Educação Pública
Aprovado em: 22/07/2014
Banca Examinadora
Prof. Dr. Eduardo de Carvalho Andrade Orientador
Instituição: Insper Assinatura: _________________________
Prof. Dr. Nilton Deodoro Moreira Cardoso Junior Co-orientador
Instituição: Insper Assinatura: _________________________
Prof. Dr. Rodrigo Moita
Instituição: Insper Assinatura: _________________________
Profª Dra. Priscilla Albuquerque Tavares
Dedico este trabalho a meus pais, que sempre guiaram e incentivaram minha formação
acadêmica e são grandes exemplos de dedicação à educação, cada um em sua área.
Dedico-o também ao meu marido Alexandre, cujo apoio foi muito importante nessa fase, e
Agradeço aos professores Eduardo de Carvalho Andrade e Nilton Deodoro Moreira Cardoso
Junior pela ajuda na realização deste trabalho. A disponibilidade e suporte do Nilton na parte
quantitativa foram essenciais.
Agradeço a Pedro Villares pelas ideias e também pelo apoio na busca de possibilidades de
pesquisa e contatos.
Um agradecimento especial à Secretaria da Educação do Estado do Ceará, em especial ao
Professor Maurício Holanda Maia, Professor Daniel Lavor e Adriana Xavier de Santiago.
Sem seu apoio, presteza e competência eu não teria conseguido as informações fundamentais
PANNUTI, Silvia Viana. Escolas de ensino médio profissionalizante no Ceará: uma
análise de desempenho acadêmico. 2014. 69 f. Dissertação (Mestrado) – Insper Instituto de
Ensino e Pesquisa, São Paulo, 2014.
O objetivo desta dissertação é avaliar o programa de ensino médio profissionalizante em
tempo integral desenvolvido no Estado do Ceará, do ponto de vista de desempenho acadêmico
dos alunos. Através das metodologias de regressão com dados em painel de dois períodos e
pareamento foi comparada a variação no desempenho em testes padronizados de língua
portuguesa e matemática dos alunos que frequentaram escolas regulares e dos alunos que
frequentaram as escolas profissionalizantes em tempo integral. A comparação foi feita entre o
9o ano do ensino fundamental e 3o ano do ensino médio. Os resultados sugerem que, em geral,
os alunos que frequentaram as escolas profissionalizantes tiveram variação superior no
desempenho. No entanto, na presença da variável de controle relacionada aos pares o efeito
do tipo de escola se altera, possivelmente devido a um problema de endogeneidade na variável utilizada para mensurar as características dos pares.
PANNUTI, Silvia Viana. Ceará’s technical high schools: an academic performance
analysis. 2014. 69 f.. Dissertation (Mastership) – Insper Instituto de Ensino e Pesquisa, São
Paulo, 2014.
The presente study aims to evaluate the academic performance achieved by public school
students who took part in an educational programme developed by the State of Ceará, related
to full-time vocational education. The evolution in scores in standardized portuguese and
mathematics tests was evaluated using two different methods: two-period panel data analysis
and matching. The treated group was composed by students who attended the fulltime
vocational schools and the control group attended regular schools. The time frame of the
study was from 2008 (when students were in the last year of middle school) to 2011 (last year
of high school). Results suggest that the students who attended full-time vocational schools
present a better performance compared to students from regular schools, measured by the
evolution in scores. However, when a control variable related to peer effects is included in the
model the results change, probably due to an endogeneity problem in the variable used to
measure the peer effects.
TABELA 1 – ESCALA DO SPAECE ... 17
TABELA 2 -‐ DADOS 2008 ... 28
TABELA 3 -‐ DADOS 2011 ... 29
TABELA 4 -‐ DADOS 2008 E 2011 AGRUPADOS ... 30
TABELA 5 -‐ COMPARAÇÃO ÍNDICE SOCIOECONÔMICO ... 32
TABELA 6 -‐ CORRELAÇÕES ENTRE VARIÁVEIS (APENAS CONTÍNUAS) ... 34
TABELA 7 -‐ COMPARAÇÃO DAS NOTAS MÉDIAS DE LÍNGUA PORTUGUESA EM 2011 E 2008 ... 42
TABELA 8 -‐ COMPARAÇÃO DAS NOTAS MÉDIAS DE MATEMÁTICA EM 2011 E 2008 ... 43
TABELA 9 -‐ RESULTADOS DADOS EM PAINEL -‐ MATEMÁTICA ... 45
TABELA 10 -‐ RESULTADOS PAREAMENTO E DIFERENÇAS EM DIFERENÇAS -‐ MATEMÁTICA ... 49
TABELA 11 -‐ PAREAMENTO -‐ ESTATÍSTICAS DESCRITIVAS ... 50
TABELA 12 -‐ COMPARAÇÃO NOTAS MÉDIAS DE MATEMÁTICA -‐ PAREAMENTO ... 51
1 INTRODUÇÃO ... 11
2 AS ESCOLAS ESTADUAIS DE EDUCAÇÃO PROFISSIONAL – EEEPs ... 14
3 REVISÃO DA LITERATURA ... 17
4 HIPÓTESE E METODOLOGIA ... 22
4.1 Hipótese ... 22
4.2 Base de Dados ... 23
4.3 Descrição de Variáveis ... 24
4.3.1 Variável dependente ... 24
4.3.2 Variável independente de interesse ... 24
4.3.3 Variáveis independentes de controle ... 24
4.3.3.1 Variáveis individuais dos alunos ... 24
4.3.3.2 Variáveis familiares (socioeconômicas) dos alunos ... 25
4.3.3.3 Variável relativa aos pares ... 26
4.3.3.4 Variáveis relacionadas a escola e professores ... 26
4.4 Análise Descritiva ... 27
4.5 Os modelos utilizados ... 34
4.5.1 Modelo de Painel de Dois Períodos ... 36
4.5.2 Pareamento e Diferenças em Diferenças ... 39
4.5.3 Pareamento e Corte Transversal ... 40
5 RESULTADOS ... 41
5.1 Análise das médias ... 41
5.1.1 Língua Portuguesa ... 41
5.1.2 Matemática ... 43
5.2 Análise de Dados de Painel de Dois Períodos ... 44
5.2 Pareamento e Diferenças em Diferenças ... 47
5.4 Pareamento e Corte Transversal ... 49
1 INTRODUÇÃO
O nível de educação de um país é muito importante tanto do ponto de vista econômico como
social, impactando renda, taxas de criminalidade, saúde, empregabilidade, participação
democrática, além de crescimento econômico e produtividade do país. As pessoas com maior
grau de escolaridade têm maior acesso a empregos e maiores salários individuais.
Adicionalmente, a escolaridade contribui para a redução das diferenças sociais. (MENEZES
FILHO, 2007) (FELÍCIO & FERNANDES, 2003). No caso específico do Brasil, estudo
recente demonstrou a relação positiva entre as notas em exames de proficiência no final do
ensino médio e os salários obtidos pelos jovens no mercado de trabalho cinco anos depois da
conclusão do ensino médio (CURI & MENEZES FILHO, 2014).
No Brasil a necessidade de melhora na qualidade da educação pode ser expressa através da
posição do Brasil no ranking do exame PISA 2009, no qual a nota de proficiência em leitura
do Brasil foi de 401, comparado com média OECD de 493, colocando o país no 55o lugar no
ranking, atrás de vários países com renda per capita similar à brasileira (www.pisa.oecd.org).
(Anuário Brasileiro da Educação Básica, 2013).
Dado que esse esforço de melhora da qualidade da educação pública ocorre em nível mundial,
foram realizados muitos estudos na área de economia da educação, em vários países, visando
aprofundar o conhecimento a respeito do processo de educação (MIZALA, ROMAGUERA,
& FARREN, 2002) (MANCEBON & MOLINERO, 2000) (WORTHINGTON, 2001)
(MURNANE, 1981). O objetivo desses trabalhos é aprofundar o entendimento dos fatores
determinantes do desempenho escolar e estabelecer uma alocação ótima de recursos, visando
maximizar a eficiência dos investimentos públicos nessa área.
A função de produção em educação, que será descrita na revisão de literatura, tem como
produto o desempenho acadêmico dos alunos e como insumos variáveis relativas aos
indivíduos e suas famílias e relativas às características das escolas e seus professores
Diversos estudos mostraram que os atributos escolares têm menor influência no desempenho
acadêmico dos alunos do que os atributos familiares (MURNANE, 1981) (HANUSHEK,
1979). No entanto, apenas os insumos escolares podem ser controlados pelas políticas
educacionais e isso motivou a realização de diversos trabalhos acadêmicos visando
estabelecer quais a variáveis escolares mais relevantes para aumentar o desempenho
acadêmico dos alunos (BIONDI & FELICIO, 2007).
Dentre as diversas variáveis escolares, estados brasileiros como Pernambuco, Ceará, Rio de
Janeiro e São Paulo estão investindo no aumento da carga horária dos alunos na escola como
instrumento para melhorar o rendimento escolar (MAGALHÃES, 2008). A duração do
período escolar varia muito entre os países da OCDE e estudos anteriores mostraram que a
relação entre horas na escola e desempenho escolar é estatisticamente significante e positiva,
embora a magnitude do efeito seja relativamente pequena (BELLEI, 2009). Estudos
realizados no Brasil mostraram que o número de horas na escola é um dos poucos insumos
escolares que tem efeito positivo no desempenho (MENEZES FILHO, 2007).
O objetivo desse trabalho é testar a eficácia da política pública de um programa de ensino
médio profissionalizante em tempo integral no Estado do Ceará. A escolha do Ceará deve-se
ao fato desse estado ter se destacado dentre os outros estados brasileiros em termos de
execução de políticas educacionais nos últimos anos, com resultados refletidos na evolução no
IDEB12 . O Estado possui quase 100 escolas nesse modelo de tempo integral, todas com
ensino profissionalizante. Essas escolas de educação profissional são denominadas EEEPs.
A hipótese testada é se o tipo de escola de ensino médio frequentada pelos alunos (regular ou
EEEP) tem influência no desempenho acadêmico destes. O desempenho acadêmico é
mensurado através da variação das notas em provas padronizadas de língua portuguesa e
matemática e espera-se que essa relação seja positiva, ou seja, que os alunos das EEEPs
apresentem desempenho acadêmico superior. Apesar da carga horária de formação geral das
escolas regulares e EEEPs ser a mesma, espera-se que o desempenho acadêmico dos alunos
das EEEPs possa ser beneficiado pelas iniciativas de aperfeiçoamento gerencial e de
acompanhamento mais próximo de cada aluno. Adicionalmente, o fato desses alunos
1
Índice de Desenvolvimento da Educação Básica
2
permanecerem mais tempo no ambiente escolar também poderia trazer benefícios em termos
de desempenho acadêmico.
Murnane definiu alguns critérios relevantes para um estudo possibilitar uma análise acurada
de um sistema de ensino. Dentre eles estão a utilização do progresso dos alunos como medida
de desempenho acadêmico, ao invés do nível de desempenho em um momento específico, a
inclusão de características dos pares e dos professores, uso do indivíduo como unidade de
mensuração (ao invés de escolas ou cidades), entre outros (MURNANE, 1981). O presente
estudo busca atender a maior parte desses requisitos, como será descrito na seção de
metodologia.
Para testar a hipótese foi inicialmente escolhido um modelo estatístico amplamente utilizado
em estudos a respeito de análise de políticas públicas e mais especificamente de desempenho
acadêmico: dados em painel de dois períodos. O resultado do modelo indica que o tipo de
escola tem um impacto positivo na variação das notas dos alunos entre o 9o ano do ensino
fundamental e o 3o ano do ensino médio. Entretanto, na presença da variável de controle
relativa a nota média da escola nas provas padronizadas (utilizada como variável relacionada
aos pares) esse efeito passa a ser negativo. Uma possível endogeneidade dessa variável
relativa aos pares levou à utilização de mais dois modelos: pareamento associado a diferenças
em diferenças e pareamento como base para uma análise de corte transversal. Os resultados
dos modelos são muito semelhantes e indicam que o tipo de escola tem um impacto positivo
na variação das notas dos alunos entre o 9o ano do ensino fundamental e o 3o ano do ensino
médio, porém a presença da variável relativa aos pares altera o coeficiente.
Ao realizar a análise dessa política educacional do Estado do Ceará busca-se uma
contribuição prática, pois a mensuração da eficácia dessa política do ponto de vista de
desempenho acadêmico dos alunos poderá ser útil na discussão a respeito de uma ampliação
desse tipo de programa no Brasil.
No Capítulo 3 uma revisão da literatura indicará, com base nos estudos já realizados no Brasil
e no exterior, quais os fatores que afetam o desempenho acadêmico e quais abordagens já
foram utilizadas para mensurá-los.
O capítulo 4 descreverá a hipótese a ser testada e a metodologia utilizada, além de discorrer
sobre a base de dados e variáveis.
No capítulo 5 serão discutidos os resultados da análise estatística.
No capítulo 6 serão apresentadas as conclusões.
2 AS ESCOLAS ESTADUAIS DE EDUCAÇÃO PROFISSIONAL – EEEPs
Em 2008 o governo do Estado do Ceará criou a rede estadual de Escolas de Educação
Profissional (EEEPs), visando complementar a oferta do ensino médio com uma formação
profissional técnica. Os cursos ofertados foram inicialmente Informática, Enfermagem, Guia
de Turismo e Segurança do Trabalho e posteriormente se expandiram para incluir Edificações,
Comércio, Finanças, Produção de Moda, Estética, Massoterapia, Meio Ambiente,
Aquicultura, Agroindústria, Administração, Secretariado, Contabilidade, Hospedagem e
Modelagem do Vestuário. Em 2011 o Ceará possuía 361.733 alunos no ensino médio e 23.962
deles frequentavam EEEPs (6,6% do total). Para maiores detalhes ver Anexo 2.
As escolas funcionam em tempo integral e oferecem três refeições diárias aos alunos. A maior
parte das escolas possui laboratórios e biblioteca. No 3o ano do ensino médio os alunos fazem
estágios supervisionados obrigatórios em empresas e instituições, sem ônus para estas, pois o
governo arca com todos os custos (bolsa-estágio, vale-transporte, entre outros).3
Todos os cursos de ensino médio nas EEEPs têm um total de 5.400 horas (somando-se os três
anos) e estão divididos em 2.620 horas de formação geral (currículo padrão, igual ao das
escolas regulares, com disciplinas como matemática, português, história, entre outras) e 2.780
horas de formação profissional. A composição das horas de formação profissional depende do
3
curso. Elas incluem uma carga de aulas teóricas (variando de 800 a 1.200 horas, a depender
do curso) e horas do estágio curricular (que varia de 50% da carga horária para os cursos
ligados a saúde a 25% para os demais cursos). O restante das horas é preenchido com a parte
diversificada do currículo (horário de estudo e atividades como “Projeto de Vida,” “Formação
para a Cidadania”, “Mundo do Trabalho” e “Projetos Interdisciplinares”). No Anexo 3 temos
um exemplo de matriz detalhada de um dos cursos. A título de comparação, a carga horária
total do ensino médio regular diurno é de 3.000 horas e do ensino médio regular noturno é de
2.400 horas.
As EEEPs têm dois tipo de professores: de formação geral e de formação profissional. Os
professores de formação geral podem ser concursados ou temporários e sua seleção, avaliação
e remuneração são idênticas às dos professores das escolas regulares. A principal diferença
entre eles e os professores das escolas regulares é que os professores das EEEPs devem
obrigatoriamente trabalhar com exclusividade e em tempo integral nas escolas, permanecendo
nas escolas no mesmo período que os alunos (das 7 às 17 horas). De acordo com a Secretaria
da Educação do Estado do Ceará (SEDUC) essa permanência dos professores em tempo
integral nas escolas faz com que eles estejam mais presentes no dia a dia dos alunos e também
torna a coordenação e supervisão, por parte dos diretores e coordenadores, mais eficiente. Os
professores da formação profissional possuem um vínculo trabalhista diverso (contrato
regulado pela CLT4) e não são selecionados através de concurso público.5
Os diretores das EEEPs passam por um processo seletivo diferente dos outros diretores
escolares, podendo ou não ser originários dos quadros da SEDUC. As EEEPs também contam
com um núcleo gestor da escola, composto por três membros responsáveis pelo treinamento
dos professores. 6
O planejamento é feito em conjunto entre os professores de formação geral e formação
profissional, visando alcançar sinergias entre as áreas. Desse modo, durante o ensino técnico
os alunos utilizam conceitos da formação geral (por exemplo, alunos do curso técnico de
edificações usam muitos conceitos de geometria). Apesar de o número de horas-aula de língua
portuguesa e matemática ser o mesmo das escolas regulares, os alunos das EEEPs estão em
4
Consolidação das Leis do Trabalho
5
Informaçoes baseadas em conversas informais com a SEDUC
6
contato com os conceitos dessas disciplinas por um maior tempo dadas as demandas dos
cursos profissionalizantes. Esse fato poderia explicar um desempenho acadêmico diferente
dos alunos das EEEPs.7
O Estado do Ceará conta com o apoio do Instituto de Co-Responsabilidade pela Educação –
ICE – uma entidade privada sem fins lucrativos que desde 2000 desenvolve iniciativas
visando a melhoria na qualidade da educação pública em parceria com instituições
governamentais e privadas. O ICE contribui no processo de implantação da metodologia
pedagógica e de técnicas gerenciais nas escolas. No caso das EEEPs, as técnicas gerenciais
incluem estabelecimento de metas de desempenho claras e mensuráveis para a direção, alunos
e professores. Adicionalmente, é realizado um trabalho diferenciado com os alunos através do
desenvolvimento do que se chama de “Projeto de Vida”, aliado a um “Plano de Carreira”.
Com o auxílio dos educadores cada aluno define quais as suas aspirações
pessoais/profissionais (metas claras e objetivas), faz um diagnóstico pessoal (análise de seus
valores, qualidades e habilidades) e faz uma análise dos recursos que possui e os que deve
desenvolver para realizar suas metas, finalizando com um plano para cinco a dez anos
(MAGALHÃES, 2008).
Um fator importante na implementação das políticas educacionais é o desenvolvimento de
ferramentas de avaliação dos alunos e escolas. Desde 1992 o Governo do Estado do Ceará,
por meio da SEDUC, vem utilizando o Sistema Permanente de Avaliação da Educação Básica
do Ceará – SPAECE. O SPAECE é uma avaliação externa em larga escala que avalia as
competências e habilidades dos alunos do ensino fundamental e do ensino médio, em língua
portuguesa e matemática. As informações coletadas a cada avaliação identificam o nível de
proficiência e a evolução do desempenho acadêmico dos alunos. A avaliação é realizada de
forma censitária e universal, abrangendo as escolas estaduais e municipais. São utilizados
testes, com itens elaborados pelos professores da rede pública, tendo como orientação os
Parâmetros Curriculares Nacionais (PCN) do Ministério da Educação (MEC) e os
Referenciais Curriculares Básicos (RCB) da SEDUC. São aplicados também questionários
contextuais, investigando dados socioeconômicos e hábitos de estudo dos alunos e o perfil e
prática dos professores e diretores.
7
A partir de 2007 a abrangência do SPAECE foi ampliada, incorporando a avaliação da
alfabetização e expandindo a avaliação do ensino médio para as três séries de forma
censitária. A avaliação do ensino médio envolve todas as escolas da rede estadual de ensino,
localizadas nos 184 municípios cearenses.
Na Tabela 1 está descrita a escala do SPAECE, que é diferente para matemática e língua
portuguesa e também varia de acordo com o ano escolar avaliado. As notas variam de zero
(menor nota) a 500 (maior nota).
Tabela 1 – Escala do SPAECE
Fonte: Boletins SPAECE – Secretaria da Educação do Ceará (http://www.spaece.caedufjf.net)
A informação a respeito das notas de língua portuguesa e matemática será tratada através de
transformação linear devido a diferença de escalas decorrente da matéria (língua portuguesa
ou matemática) e do período (9o ano ensino fundamental ou 3o ano ensino médio). A
metodologia a esse respeito será detalhada na Seção 4.3.1.
Apesar da carga horária de formação geral das escolas regulares e EEEPs ser a mesma,
espera-se que o desempenho acadêmico dos alunos das EEEPs possa ser beneficiado pelas
inciativas de aperfeiçoamento gerencial e de acompanhamento mais próximo de cada aluno.
Adicionalmente, o fato desses alunos permanecerem mais tempo no ambiente escolar também
poderia trazer benefícios em termos de desempenho acadêmico.
A necessidade de melhoria da qualidade da educação globalmente fez com que muitos
acadêmicos se debruçassem nessa questão. No campo da economia da educação, buscou-se
definir uma relação entre o desempenho acadêmico dos alunos e os fatores que influenciam
esse desempenho, na forma de uma função de produção em educação, visando auxiliar na
alocação de recursos das políticas públicas (HANUSHEK, 1979) (BIONDI & FELICIO,
2007). O presente trabalho se baseia na literatura a respeito de função de produção em
educação para analisar a política pública de ensino profissionalizante em tempo integral do
Estado do Ceará.
Conceitualmente, uma função de produção deve determinar o maior produto possível dado
um conjunto de insumos (HANUSHEK, 1979). Algumas premissas da teoria da firma são
questionáveis no caso da educação, especialmente no que se refere à eficiência. Os indivíduos
responsáveis pelas decisões na área de educação não são guiados por incentivos para
maximizar lucros ou minimizar custos. Adicionalmente, eles não têm conhecimento completo
do processo de produção, como no caso de uma indústria, por exemplo, portanto não se pode
esperar que eles estejam na fronteira eficiente de produção (HANUSHEK, 1986). Diversos
estudos da função de produção em educação indicam que a função de produção não determina
exatamente a relação esperada entre variáveis definidas por políticas educacionais e o
desempenho acadêmico dos alunos. Dentre as razões encontradas na literatura para essa
distorção na relação de produção está a possibilidade de a premissa de eficiência no processo
não ser verdadeira.
Existe uma ampla discussão a respeito de qual seria o produto do processo de educação.
Como a educação tem o papel de transformar o indivíduo e deixá-lo mais apto para o mercado
de trabalho, participar na sociedade, consumir com maior consciência, entre outros elementos,
o produto da educação seria a medida de como ela afeta o futuro do indivíduo como um todo.
No entanto, é muito difícil fazer essa mensuração ampla, inclusive porque o resultado dos
estudos na vida futura do indivíduo não pode ser medido contemporaneamente ao processo de
educação. Portanto, a maior parte dos estudos define produto como os resultados de testes
padronizados (HANUSHEK, 1986) (FELÍCIO & FERNANDES, 2003) (PORTELA &
Idealmente as notas dos testes padronizados devem ser complementadas por medidas dos
efeitos de longo prazo da escolaridade, como a renda, que tem um impacto mais direto sobre o
bem-estar dos indivíduos. O fato de estudos terem mostrado uma correlação positiva entre
notas de testes de matemática e renda dos indivíduos reforça a possibilidade de usar as notas
como resultado do processo de educação (BETTS, 1996). No caso específico do Brasil,
estudo recente demonstrou a relação positiva entre as notas em exames de proficiência no
final do ensino médio e os salários obtidos pelos jovens no mercado de trabalho cinco anos
depois de concluírem o ensino médio (CURI & MENEZES FILHO, 2014). As pesquisas
anteriores mencionadas acima levaram à escolha do desempenho nos testes padronizados de
língua portuguesa e matemática como variável independente no presente trabalho.
A medida de desempenho acadêmico é aprimorada ao se utilizar a evolução das notas nos
testes padronizados ao longo do tempo ao invés de usar apenas um dado (MURNANE, 1981).
Isso será feito nesse estudo, que utilizará a evolução da nota entre o 9o ano do ensino
fundamental e 3o ano do ensino médio como medida de desempenho acadêmico.
Os insumos da função de produção em educação são diversos, alguns controláveis pelas
políticas públicas e outros não controláveis. Em educação, os insumos são “cumulativos”, ou
seja, insumos passados têm um efeito que se estende ao futuro. Eles podem ser agrupados em
(i) individuais, (ii) familiares, (iii) relativos aos pares, (iv) escolares e relativos aos
professores. Eles interagem entre eles e também com o potencial de aprendizado de cada
aluno, que é uma habilidade inata de difícil mensuração (HANUSHEK, 1986).
Insumos individuais se referem a características dos alunos como gênero e raça. Insumos
familiares estão relacionados às condições socioeconômicas das famílias (educação dos pais,
renda, entre outros). Os insumos relativos aos pares agregam características socioeconômicas,
dentre outras, dos outros alunos da escola. Os insumos escolares podem ser divididos em
características da escola (infraestrutura, tamanho das classes, nível de despesas
administrativas e educacionais) e características dos professores (formação escolar,
As variáveis socioeconômicas são as que mais afetam o desempenho acadêmico dos alunos.
Essa constatação ocorreu inicialmente a partir do Relatório Coleman, um estudo realizado nos
Estados Unidos nos anos 60 que visava analisar a segregação racial no sistema educacional
norte-americano e concluiu que a diferença de desempenho acadêmico entre alunos negros e
brancos devia-se mais às diferenças socioeconômicas de suas famílias e comunidades do que
às diferenças de qualidade das escolas. A principal conclusão do Relatório Coleman foi que os
insumos escolares têm fraca relação com desempenho dos alunos nos testes padronizados
(FELÍCIO & FERNANDES, 2003) (BETTS, 1996). Geralmente alunos de famílias mais
pobres tem desempenho acadêmico inferior aos de famílias mais ricas (MIZALA,
ROMAGUERA, & FARREN, 2002) (HANUSHEK, 1986) (MENEZES FILHO, 2007).
Adicionalmente, as famílias com maior nível de renda e educação tendem a valorizar mais a
educação e consequentemente buscar escolas de maior qualidade para seus filhos,
estabelecendo uma correlação positiva entre condição socioeconômica das famílias e
qualidade da escola frequentada pelos seus filhos (HANUSHEK & TAYLOR, 1990).
A análise das características dos pares vem sendo um foco relevante de estudos dada a
possibilidade da composição do grupo potencializar efeitos de algumas políticas públicas. A
composição do grupo pode implicar na probabilidade de um aluno poder ensinar outros e
também no comportamento dos professores perante os alunos. Entretanto deve-se destacar a
complexidade dessas análises, dado que os indivíduos são selecionados para o grupo em parte
devido às características não observáveis (como capacidade cognitiva) e adicionalmente
existe um problema de viés de seleção (como por exemplo o interesse dos pais que os filhos
estudem em determinada escola). Pode-se perguntar, por exemplo, se o desempenho de um
grupo é bom porque cada membro é bom individualmente ou porque o grupo é bom. O efeito
do grupo nas escolas, já amplamente estudado, tem esse viés de seleção destacado
(auto-seleção), pois as famílias dos bons alunos naturalmente procuram melhores escolas. Estudos
anteriores tendem a focar em variáveis como gênero (masculino ou feminino), raça, renda
familiar e desempenho escolar passado, entre outras, para analisar o efeito do grupo e
mostram que existe uma influência do grupo no desempenho escolar de seus membros
(HOXBY, 2000) (McEWAN, 2003) (MURNANE, 1981). Nesse estudo será utilizada como
variável para mensurar características dos pares o desempenho escolar médio da escola
frequentada pelo aluno, que de acordo com a literatura é positivamente relacionado ao
demonstraram que variáveis relacionadas ao nível de renda médio das famílias das crianças
que atendem a determinada escola também são utilizadas e indicam que a renda média das
famílias é positivamente relacionada ao desempenho dos alunos (MURNANE, 1981), porém
esses dados não estavam disponíveis para o presente estudo.
Como mencionado anteriormente, diversos estudos mostraram que os atributos escolares têm
menor influência no desempenho acadêmico dos alunos do que os atributos familiares. No
entanto, apenas os insumos escolares podem ser controlados pelas políticas educacionais e
isso motivou a realização de muitos trabalhos acadêmicos visando estabelecer quais as
variáveis escolares mais relevantes para aumentar o desempenho acadêmico dos alunos
(BIONDI & FELICIO, 2007).
Dentre as diversas variáveis escolares, o tempo de aprendizagem tem uma relação positiva e
estatisticamente significante com o desempenho acadêmico de acordo com estudos anteriores
(BELLEI, 2009) (MENEZES FILHO, 2007). É importante mencionar que existem diversas
definições para o tempo de aprendizagem, conforme análise de Berliner (1990): (i) tempo
alocado pela escola para aprendizado (comumente mensurado pelo número de horas que o
aluno passa na escola); (ii) tempo no qual o aluno está engajado em aprender (diferentemente
da definição acima, implica no tempo em que o aluno tem condições de focar, prestar atenção
na atividade escolar) - essa definição leva em conta o tempo de transição de uma atividade
para outra e o tempo que o aluno espera pelas instruções ou atenção dos professores; (iii)
tempo utilizado para realizar tarefas específicas pré-definidas como relevantes para o
aprendizado, entre outras definições. Em estudos de políticas públicas geralmente a definição
mais utilizada é de tempo alocado, pois as outras são de mensuração mais complexa e não
podem ser controladas pelos formuladores de políticas públicas (BERLINER, 1990). Essa
definição será adotada nesse estudo, apesar das limitações que esse critério apresenta por não
refletir com precisão o tempo realmente empregado na atividade de aprendizado
(MURNANE, 1981).
O presente trabalho pretende analisar uma função de produção em educação para o ensino
desempenho acadêmico dos alunos. Essa função de produção foi definida com base nos
artigos acima mencionados e será detalhada na seção de metodologia.
4 HIPÓTESE E METODOLOGIA
4.1 Hipótese
O objetivo desse estudo é testar a eficácia da política pública de ensino médio
profissionalizante em tempo integral do Estado do Ceará em relação ao desempenho
acadêmico dos alunos. Serão consideradas a proficiência em língua portuguesa e matemática
separadamente, visando “captar possíveis diferenças nos efeitos pelo campo de saber
avaliado” (FIRPO, GONZAGA, & MACHADO, 2013, p. 6).
A hipótese a seguir visa determinar se o desempenho acadêmico dos alunos que participam
desse programa é superior ao dos alunos que não participam.
Hipótese:
O tipo de escola de ensino médio (EEEP) frequentada pelos alunos tem influência no
desempenho acadêmico destes, mensurado através da variação das notas de língua portuguesa
e matemática? Espera-se que essa relação (ilustrada na Figura 1) seja positiva, ou seja, que os
alunos das EEEPs apresentem desempenho acadêmico superior.
Figura 1 - Hipótese
Escola
Profisionalizante em
Tempo Integral
(+)
Variação no Desempenho Acadêmico dos Alunos nos Testes Padronizados de
4.2 Base de Dados
Os dados utilizados nesse trabalho são relativos a alunos de escolas de ensino fundamental e
médio do Estado do Ceará, obtidos através de duas fontes de informações:
(i) Os microdados relativos aos alunos do ensino fundamental e médio do Ceará foram
disponibilizados pela Secretaria da Educação do Estado do Ceará.8 Eles incluem informações
relativas às notas obtidas pelos alunos no SPAECE nos anos de 2008 e 2011 e informações
contidas no questionário respondido pelos alunos durante a realização do teste padronizado
SPAECE do 3o ano ensino médio (em 2011).
(ii) Os dados relativos às escolas de ensino fundamental e médio do Ceará foram obtidos
através do conjunto dos microdados do Censo Escolar.9 Foram utilizados os dados referentes
aos anos de 2008 e 2011, obtidos através do endereço eletrônico
http://portal.inep.gov.br/basica-levantamentos-acessar (em 10/01/2014).
Em 2011, o Ceará possuía 361.733 alunos no ensino médio (considerando 1o, 2o e 3o anos) e
23.962 deles frequentavam EEEPs (6,6% do total). Embora todos os alunos devam realizar a
prova do SPAECE, nem todos comparecem. A base de dados fornecida pela SEDUC para
essa pesquisa tem 82.549 alunos do 3º ano do ensino médio com notas do SPAECE em 2011
e desse universo 23.888 tinham notas do 9o ano ensino fundamental disponíveis (2008),
informação crucial para realizar as análises desse trabalho. Durante a organização dessa base
de dados os indivíduos homônimos foram retirados devido à dificuldade de encontrar a nota
correspondente em 2008 e 2011. Na análise dos dados perdemos 1.374 observações devido a
falta de informações (ou rasuras) a respeito da cor e escolaridade da mãe dos alunos.
Os alunos incluídos na base de dados são provenientes de 1.533 escolas de ensino
fundamental e 383 escolas de ensino médio (33 EEEPs e o restante escolas regulares). Todas
as EEEPs em funcionamento em 2009 estão presentes na base de dados com exceção de 14
escolas, que não entraram devido à indisponibilidade de dados.
8
Disponíveis se solicitadas à autora
9
4.3 Descrição de Variáveis
4.3.1 Variável dependente
Com base na revisão de literatura realizada por Hanushek (1986), entre outros autores, a
variável dependente da hipótese em análise, que descreverá o desempenho escolar, será a
variação da nota dos alunos nos testes padronizados de português e matemática aplicados no
Estado do Ceará (SPAECE) entre o 9o ano do ensino fundamental (2008) e o 3o ano do ensino
médio (2011).
Foi realizada uma transformação linear nas notas dos alunos: elas foram padronizadas, através
da centragem (subtração da média) e redução (divisão pelo desvio padrão), nos anos e nas
áreas de conhecimento em questão. O objetivo dessa transformação é tornar as duas variáveis
(nota do 9o ano fundamental e 3o ano ensino médio) comparáveis, visando obter uma escala
coerente de comparação e evolução das notas. Ela foi necessária porque no SPAECE há
diferenças nas escalas de português e matemática e entre o ensino fundamental e ensino
médio, conforme ilustrado na Tabela 1 da Seção 2.
4.3.2 Variável independente de interesse
A variável independente da hipótese é uma variável dummy que define o tipo de escola
frequentada pelos alunos do ensino médio. Dado que o objetivo do estudo é averiguar se o
tipo de escola afeta o desempenho, as escolas foram divididas em dois grupos: EEEPs (1) e
escolas regulares (0).
4.3.3 Variáveis independentes de controle
4.3.3.1 Variáveis individuais dos alunos
- Cor
Foram criadas variáveis dummy para cada cor:
o Pardo (0 – branco, 1 – pardo)
o Preto (0 – branco, 1 – preto)
o Indígena (0 – branco, 1 – indígena)
- Gênero
Foi criada uma variável dummy (0 – masculino e 1 – feminino).
4.3.3.2 Variáveis familiares (socioeconômicas) dos alunos
As variáveis abaixo foram definidas como proxy para condição socioeconômica dos alunos e
as informações foram extraídas do questionário respondido durante a realização do SPAECE
pelos alunos do 3o ano ensino médio.
- Se a família é beneficiária do Programa Bolsa Família 10
Foi criada uma variável dummy (0 – não recebe e 1 – recebe).
- Nível de escolaridade das mães
Foram criadas variáveis dummy para cada nível de escolaridade ao invés de criar uma variável
com escala de 1 a 5, dado que o movimento entre cada nível de escolaridade pode ter um
efeito diferente e essa estrutura captura esse efeito.
o Entre a 1a e 4a série do Ensino Fundamental (0 – nunca estudou, 1 – entre 1a e
4a série)
o Entre a 5a e 8a série do Ensino Fundamental (0 – nunca estudou, 1 – entre 5a e
8a série)
o Entre a 1a e 3a série do Ensino Médio (0 – nunca estudou, 1 – entre 1a e 3a
série)
o Ensino superior (0 – nunca estudou, 1 – ensino superior)
o Não sabe informar (0 – nunca estudou, 1 – não sabe informar)
10
- Número de livros em casa
Foram criadas variáveis dummy para cada intervalo abaixo
o 1 a 20 livros (0 – nenhum livro, 1 – 1 a 20 livros)
o 21 a 100 livros (0 – nenhum livro, 1 – 21 a 100 livros)
o mais de 100 livros (0 – nenhum livro, 1 – mais de 100 livros)
- Índice Socioeconômico
Foi calculado um índice socioeconômico com base no Critério de Classificação
Econômica Brasil, desenvolvido pela Associação Brasileira de Empresas de Pesquisa
(Anexo 4). Esse índice utiliza informações como número de eletrodomésticos,
funcionários domésticos, escolaridade dos familiares, entre outros, atribuindo pontos
para cada informação. Através da soma dos pontos estima-se o poder de compra das
pessoas e famílias urbanas. Nesse trabalho foi utilizada a ponderação descrita acima
para os dados obtidos através do formulário do SPAECE de 2011.
4.3.3.3 Variável relativa aos pares
Foi utilizada a nota média obtida pelas escolas nos testes padronizados de língua portuguesa e
matemática (SPAECE). Como o critério de inclusão de indivíduos na amostra foi a
disponibilidade de notas de 2008 e 2011 dos alunos, a amostra não contem todos os alunos de
cada escola que participaram da prova padronizada. Portanto, para se obter a nota média de
cada escola recorreu-se ao banco de dados da SEDUC para os anos de 2008 (escolas de
ensino fundamental) e 2011 (escolas de ensino médio). Assim como no caso da variável
dependente, foi realizada padronização dos dados, através da subtração da média e divisão
pelo desvio padrão, com o mesmo objetivo.
4.3.3.4 Variáveis relacionadas a escola e professores
São os elementos discricionários, passíveis de mudanças através de políticas públicas. A
escolha das variáveis para representar os atributos escolares é bastante complexa dada a
dificuldade de mensuração de algumas delas. Uma medida comum de insumo escolar é o
gasto por aluno. No entanto, além de ser muito difícil auferir como esse gasto está sendo
alocado dentro das escolas (BETTS, 1996), no caso do Estado do Ceará esses dados não estão
Nesse trabalho serão utilizadas as variáveis abaixo, na forma de variáveis dummy, obtidas no
Questionário da Escola do Censo Escolar de 2008 e 2011:
- existência laboratório ciências (0 – não existe, 1 existe)
- existência laboratório informática (0 – não existe, 1 – existe)
- acesso a internet (0 – não existe, 1 – existe)
Cada característica foi mensurada para a escola que o aluno frequentou no 9o ano ensino
fundamental e 3o ano ensino médio e o interesse é verificar se a presença dos recursos acima
na escola frequentada por cada aluno se alterou.
As variáveis relacionadas aos professores foram obtidas através do questionário respondido
pelos professores no Censo Escolar no anos de 2008 e 2011:
- Nível médio de escolaridade dos professores, baseado na seguinte escala:
1 - Fundamental incompleto
2 - Fundamental completo
3 - Ensino médio
4- Superior completo
A partir dessa escala foi atribuída a cada escola uma escolaridade média de seus professores, variando de 1 a 4.
- Formação acadêmica dos professores:
Foi calculado o percentual dos professores com títulos de mestrado ou doutorado para cada
escola (ensino fundamental e ensino médio).
4.4 Análise Descritiva
A principal dimensão do estudo é o tipo de escola, existindo uma diferenciação entre as
ensino médio de grupo de tratamento e os que não frequentaram de grupo de controle. Nota-se
que no ensino fundamental todos os alunos frequentaram escolas regulares.
A análise descritiva tem dois blocos de informações: um relativo ao ano de 2008, quando os
alunos da amostra frequentavam o 9o ano do ensino fundamental (Tabela 2), e outro relativo a
2011, quando esses mesmos alunos estavam no 3o ano do ensino médio (Tabela 3). Os dados
relativos a 2011 incluem informações socioeconômicas dos alunos, não disponíveis em 2008.
Os dados agrupados também estão descritos (Tabela 4).
Tabela 2 - Dados 2008
Fonte: base de dados
Obs Média DP Min Max Obs Média DP Min Max
nota língua portuguesa 2217 240,58 39,72 105,66 358,27 21671 224,76 40,29 87,11 374,01
nota matemática 2217 249,52 42,55 114,36 382,48 21671 234,13 43,80 110,50 401,44
média dos pares - língua portuguesa 2217 240,58 39,72 105,66 358,27 21671 227,57 16,93 155,27 314,63
média dos pares - matemática 2217 249,52 42,55 114,36 382,48 21671 217,82 15,57 148,97 292,36
nota língua portuguesa (padron.) 2217 0,35 0,98 -2,98 3,26 21671 -0,04 0,99 -3,44 3,65
nota matemática (padron.) 2217 0,32 0,97 -2,76 3,35 21671 -0,03 1,00 -2,85 3,78
média dos pares - língua portuguesa padron.) 2217 0,20 0,82 -2,79 4,43 21671 -0,02 1,01 -4,51 4,84
média dos pares - matemática (padron.) 2217 0,18 0,82 -3,00 5,01 21671 -0,02 1,02 -4,35 5,20
escolaridade média professores 2217 3,87 0,18 3,00 4,00 21671 3,83 0,21 2,80 4,00
% professores com mestrado 2217 0,00 0,00 0,00 0,06 21671 0,00 0,00 0,00 0,06
% professores com doutorado 2217 0,02 0,07 0,00 0,82 21671 0,01 0,04 0,00 0,82
Obs Média DP Obs Média DP
INFRA-ESTRUTURA (%)
tem laboratório informática 2217 67% 47% 21671 56% 50%
tem laboratório ciências 2217 28% 45% 21671 19% 39%
tem internet 2217 74% 44% 21671 64% 48%
2008
Tratamento Controle
Tratamento Controle
Tabela 3 - Dados 2011
Fonte: base de dados
Obs Média
Desvio
Padrão Min Max Obs Média
Desvio
Padrão Min Max nota língua portuguesa 2217 289,35 42,88 142,54 384,75 21671 263,06 46,13 131,58 396,45 nota matemática 2217 299,36 52,76 160,76 433,31 21671 267,58 50,82 150,61 435,88 média dos pares - língua portuguesa 2217 299,35 17,29 266,70 330,50 21671 262,80 18,27 207,03 359,93 média dos pares - matemática 2217 288,94 13,85 263,65 311,78 21671 258,37 14,23 185,43 326,49 nota língua portuguesa (padron.) 2217 0,51 0,92 -2,65 2,57 21671 -0,05 0,99 -2,88 2,82 nota matemática (padron.) 2217 0,56 1,02 -2,12 3,14 21671 -0,06 0,98 -2,31 3,19 média dos pares - língua portuguesa padron.) 2217 1,66 0,83 0,15 3,02 21671 -0,17 0,85 -4,53 3,90 média dos pares - matemática (padron.) 2217 1,58 0,82 0,02 3,06 21671 -0,16 0,87 -2,81 4,45 escolaridade média professores 2217 3,95 0,10 3,60 4,00 21671 3,96 0,06 3,69 4,00 % professores com mestrado 2217 0,00 0,00 0,00 0,00 21671 0,00 0,01 0,00 0,07 % professores com doutorado 2217 0,02 0,05 0,00 0,21 21671 0,01 0,02 0,00 0,16 índice socioeconomico (pontos) 2095 20,21 3,75 19620 19,35 3,77
Obs Média DP Obs Média DP
INFRA-ESTRUTURA (%)
tem laboratório informática 2217 100% 0% 21671 98% 15% tem laboratório ciências 2217 100% 0% 21671 81% 40%
tem internet 1969 100% 0% 20545 100% 6%
CARACTERÍSTICAS INDIVIDUAIS E FAMILIARES GÊNERO (%)
feminino 2186 59% 49% 21194 59% 49%
masculino 2186 41% 21194 41%
COR (%)
branco 2178 21% 21091 20%
pardo 2178 62% 49% 21091 64% 48%
preto 2178 10% 31% 21091 8% 28%
amarelo 2178 5% 21% 21091 5% 21%
indígena 2178 2% 15% 21091 3% 17%
ESCOLARIDADE MÃE (%)
nunca estudou 2188 3% 21201 5%
primário 2188 28% 45% 21201 36% 48%
ginásio 2188 26% 44% 21201 25% 43%
ensino médio 2188 30% 46% 21201 21% 41%
superior 2188 8% 27% 21201 6% 23%
aluno não sabe 2188 4% 20% 21201 7% 26%
LIVROS EM CASA (%)
não tem 2184 15% 21146 22%
1 a 20 2184 64% 48% 21146 62% 49%
21 a 100 2184 19% 39% 21146 14% 34%
mais de 100 2184 3% 16% 21146 2% 15%
PROGRAMA BOLSA FAMÍLIA(%)
participa 2188 57% 49% 21184 66% 47%
2011
Tratamento Controle
2011
Tabela 4 - Dados 2008 e 2011 Agrupados
Fonte: base de dados
Os alunos incluídos na base de dados são provenientes de 1.533 escolas de ensino
fundamental e 383 escolas de ensino médio (33 EEEPs e a restantes regulares). Todas as
EEEPs em funcionamento em 2009 estão presentes na base de dados com exceção de 14
escolas, que não entraram devido à indisponibilidade de dados. Obs Média
Desvio
Padrão Min Max Obs Média
Desvio
Padrão Min Max nota língua portuguesa 23888 226,22 40,50 87,11 374,01 23888 265,50 46,47 131,58 396,45 nota matemática 23888 235,56 43,91 110,50 401,44 23888 270,53 51,83 150,61 435,88 média dos pares - língua portuguesa 23888 227,87 16,68 155,27 314,63 23888 266,19 21,05 207,03 359,93 média dos pares - matemática 23888 218,14 15,35 148,97 292,36 23888 261,21 16,74 185,43 326,49 nota língua portuguesa (padron.) 23888 0,00 1,00 -3,44 3,65 23888 0,00 1,00 -2,88 2,82 nota matemática (padron.) 23888 0,00 1,00 -2,85 3,78 23888 0,00 1,00 -2,31 3,19 média dos pares - língua portuguesa padron.) 23888 0,00 1,00 -4,51 4,84 23888 0,00 1,00 -4,53 3,90 média dos pares - matemática (padron.) 23888 0,00 1,00 -4,35 5,20 23888 0,00 1,00 -2,81 4,45 escolaridade média professores 23888 3,83 0,21 2,80 4,00 23888 3,96 0,07 3,60 4,00 % professores com mestrado 23888 0,01 0,04 0,00 0,82 23888 0,01 0,02 0,00 0,21 % professores com doutorado 23888 0,00 0,00 0,00 0,06 23888 0,00 0,00 0,00 0,69
Obs Média DP Obs Média DP
INFRA-ESTRUTURA (%)
tem laboratório informática 23888 57% 49% 23888 98% 15%
tem laboratório ciências 23888 20% 40% 23888 81% 40%
tem internet 23888 65% 48% 22514 100% 6%
CARACTERÍSTICAS INDIVIDUAIS E FAMILIARES GÊNERO (%)
feminino 23380 59% 49%
masculino 23380 41%
COR (%)
branco 23269 20%
pardo 23269 63% 48%
preto 23269 9% 28%
amarelo 23269 5% 21%
indígena 23269 3% 16%
ESCOLARIDADE MÃE (%)
nunca estudou 23389 4%
primário 23389 36% 48%
ginásio 23389 25% 43%
ensino médio 23389 22% 41%
superior 23389 6% 24%
aluno não sabe 23389 7% 25%
LIVROS EM CASA (%)
não tem 23330 22%
1 a 20 23330 62% 48%
21 a 100 23330 14% 35%
mais de 100 23330 2% 15%
PROGRAMA BOLSA FAMÍLIA(%)
participa 23372 65% 48%
Agrupados
2008 2011
Tratamento + Controle (agrupados)
Em termos de percentual dos alunos, 9,3% frequentam EEEPs e 90,7% frequentam escolas
regulares no 3º ano do ensino médio, comparado com uma proporção na população de 6,6% e
93,4%, respectivamente. Nota-se que esse dado da população é referente ao ensino médio
como um todo e não exclusivamente ao 3º ano. As escolas estão distribuídas em todas as
regiões do Estado do Ceará.
As informações referentes aos indivíduos e famílias estão disponíveis apenas para o ano de
2011. Como cor e gênero não se alteram com o tempo, essa limitação nos dados é irrelevante
para as características dos indivíduos. Percebe-se a predominância dos alunos pardos e
brancos na amostra agrupada (63,5% e 20,4%, respectivamente) e essa composição não muda
muito nos grupos de controle e tratamento, a não ser pela pequena redução em pardos no
grupo de tratamento, com aumento proporcional no número de alunos negros. A proporção de
alunos do sexo feminino é ligeiramente maior no grupo de tratamento comparado com o
grupo de controle (59,2% vs. 58.8%).
No caso das características familiares, dada a ausência de dados se assumirá que elas são
constantes durante o período de três anos do estudo. Essa premissa é razoável, dado que
dificilmente a escolaridade da mãe e número de livros em casa muda significativamente em
um período tão curto de tempo. Já o benefício do Bolsa Família poderia se alterar mais com o
tempo.
Em relação à escolaridade da mãe existem diferenças relevantes entre os dois grupos, com
maior nível de escolaridade no grupo de tratamento (30,1% de mães com ensino médio
comparado com 21,0% no grupo de controle, e 28,3% com ensino primário comparado com
36,3%, respectivamente). A proporção de mães com nível superior é baixa nos dois grupos,
porém mais elevada para o grupo de tratamento se comparado com o grupo de controle (7,9%
e 5,7%, respectivamente).
A maior parte dos alunos da amostra, tanto do grupo de tratamento como de controle, tem de
1 a 20 livros em casa (63,5% e 62,2%, respectivamente), porém existe um percentual mais
com 13,5% no grupo de controle). O número de alunos com mais de 100 livros em casa é
pouco expressivo em ambos os grupos.
O benefício do Bolsa Família é bastante difundido nas famílias da amostra, sendo superior nas
famílias do grupo de controle comparado com o grupo de tratamento (66,3% e 57,2%,
respectivamente).
A análise descritiva indica que o nível socioeconômico dos alunos do grupo de tratamento é
superior ao do grupo de controle, mas que ambos os grupos são compostos por membros de
famílias relativamente carentes, principalmente devido a variável Bolsa Família. O teste
descrito na Tabela 5 confirma que existe uma diferença de nível socioeconômico
estatisticamente significante entre grupos de tratamento e controle, no entanto a diferença é
pequena (0,86).
Tabela 5 - Comparação Índice Socioeconômico
Comparação do índice Socioeconômico - Tratamento e Controle
grupo n. de
observações
média e desvio padrão 2011
tratamento 2.095 20,215
(3,749)
controle 19.620 19,354
(3,769)
combinados 21.715 19,437
(3,775) diferença tratamento e controle (em pontos) 0,861 diferença tratamento e controle (%) 4,5%
estatística t -9,9455
Fonte: base de dados
As características escolares relativas a infraestrutura variam mais de um período para o outro,
dado que a maior parte dos alunos mudou de escola entre o ensino fundamental e ensino
médio e variáveis como presença de laboratórios e internet mudam significativamente.
Observando-se os dados agrupados, 20% dos alunos estudavam em escolas que possuíam
médio. Ao analisar apenas as escolas do ensino médio, constata-se que todas EEEPs possuem
internet e laboratórios de ciências e informática, enquanto no grupo de controle o percentual
de alunos que frequentam escolas com esses recursos é de 81% e 98%, respectivamente,
portanto a diferença mais relevante está na presença de laboratório de ciências. Todas as
escolas da amostra possuem acesso à internet.
A variável escolhida para descrever a formação acadêmica dos professores varia menos: a
escolaridade média tanto dos professores das escolas de ensino fundamental como ensino
médio é próxima de 4, que denota que eles têm em média ensino superior, nos dois casos.
Observa-se que esse nível de escolaridade varia pouco (mínimo de 3,60 e máximo de 4,0 para
os dados agrupados de 2011).
A quantidade de professores com títulos de mestrado e doutorado é muito pequena. Desse
modo, essas duas variáveis foram retiradas do modelo final e a variável “nível de escolaridade
dos professores” permaneceu como única medida de qualidade dos professores.
Com relação às notas médias dos alunos de cada grupo nas provas padronizadas de
matemática, existe uma diferença quando comparamos as notas do grupo de tratamento e de
controle tanto no 9o ano do ensino fundamental (249 vs. 234) como no ensino médio, quando
a diferença inclusive se amplia (299 vs. 268). Os resultados são similares para língua
portuguesa. Foi realizado um teste t para comparar essas médias, que será descrito na seção 5.
As notas dos pares, representada pela nota média das escolas frequentadas pelos alunos,
apresenta padrão similar ao das notas dos alunos, tanto para matemática como língua
portuguesa. No caso de matemática a nota média das escolas em 2008 era 249 no grupo de
tratamento e 218 no grupo de controle, enquanto em 2011 eram 289 e 258, respectivamente.
Portanto, percebe-se que as notas dos pares do grupo de tratamento são mais altas.
Foi calculada a correlação entre as variáveis contínuas, considerando as notas de língua
Tabela 6 - Correlações Entre Variáveis (apenas contínuas)
Correlações entre variáveis contínuas - Ano 2008
nota LP média dos
pares LP escolaridade média professores % professores com doutorado % professores com mestrado
nota LP 1,00
média dos pares LP 0,35 1,00
escolaridade média
professores 0,10 0,28 1,00
% professores com
doutorado 0,05 0,14 0,05 1,00
% professores com mestrado 0,03 0,08 0,10 0,06 1,00
Observações = 23.888
Correlações entre variáveis contínuas - Ano 2011
nota LP média dos
pares LP escolaridade média professores % professores com doutorado % professores com mestrado
nota LP 1,00
média dos pares LP 0,34 1,00 escolaridade média
professores 0,01 0,02 1,00
% professores com
doutorado 0,06 0,13 0,05 1,00
% professores com mestrado 0,05 0,14 0,08 0,17 1,00
Observações = 23.888
Fonte: base de dados
As correlações entre as variáveis não são significativas, com exceção da correlação entre a
nota do aluno e a média das notas dos outros alunos das escolas, que é de 35% e 34% em
2008 e 2009, respectivamente.
4.5 Os modelos utilizados
Murnane (1981) definiu alguns critérios relevantes para um estudo possibilitar uma análise
acurada de um sistema de ensino. Dentre eles estão a utilização do progresso dos alunos como
momento específico; a inclusão de características dos pares e dos professores, uso do
indivíduo como unidade de mensuração (ao invés de escolas ou cidades), entre outras
(MURNANE, 1981). A visão de que a variação no desempenho é mais relevante que seu
valor absoluto é corroborada por Hanushek (HANUSHEK, 1979). O presente estudo busca
atender a maior parte desses requisitos, como será descrito nessa seção.
Ao analisar uma política pública é sempre importante considerar o potencial problema de
auto-seleção. Nesse caso específico, a possibilidade de os indivíduos que frequentaram EEEPs
terem decidido por essa alternativa por razões não randômicas e sistematicamente
relacionadas com características familiares ou individuais. A regressão múltipla, ao incorporar
variáveis de controle, pode aliviar os efeitos do problema de auto-seleção. Entretanto, em
educação há fatores não observáveis que podem influenciar o desempenho e por serem não
observáveis não estão incorporados ao modelo. A análise de dados em painel é mais um passo
no sentido de mitigar o problema de auto-seleção (WOOLDRIDGE, 2006).
Inicialmente foi realizada uma análise de médias simples para comparar as notas dos dois
tipos de escola, seguida de um modelo de dados de painel de dois períodos. Como foi
identificada endogeneidade de uma das variáveis, que será discutida no capítulo 5, foram
utilizados também o pareamento com análise de diferenças em diferenças e uma análise de
corte transversal.
A forma funcional foi definida a partir da revisão de artigos relacionados a desempenho
acadêmico. Através da revisão de literatura percebe-se a ampla utilização de variáveis dummy
nos modelos para descrever as características dos alunos e das escolas, sendo que em alguns
casos não há nenhuma variável contínua. (BIONDI & FELICIO, 2007) (FELÍCIO &
FERNANDES, 2003) (BELLEI, 2009) (FIRPO, GONZAGA, & MACHADO, 2013) (CURI
& MENEZES FILHO, 2014) (EMERSON, PONCZEK, & SOUZA, 2013). O fato desses
estudos usarem muitas informações qualitativas (como raça, gênero, elegibilidade a
programas sociais e educacionais, etc.) e a dificuldade em obter dados quantitativos justifica
Os artigos utilizam variáveis de controle muito semelhantes: quantidade de livros em casa,
escolaridade dos pais, situação socioeconômica, raça, gênero, infraestrutura escolar,
escolaridade dos professores, etc. As fontes de informações também são comuns a vários
deles.
Em educação estão presentes diversos fatores não mensuráveis. A capacidade cognitiva do
aluno, por exemplo, não é mensurável e afeta o desempenho acadêmico. Características
familiares não mensuráveis afetam decisões dos pais e alunos a respeito do processo de
educação (como escolha de escola em tempo integral, decisão de evasão escolar, mudança de
escola, etc.). Outros fatores refletem as dificuldades implícitas na vida da criança, como
necessidade de trabalhar, falta de apoio dos pais, entre outros (FIRPO, GONZAGA, &
MACHADO, 2013) (EMERSON, PONCZEK, & SOUZA, 2013) (HANUSHEK, 1979).
Essas características não mensuráveis trazem uma constante preocupação dos autores com a
presença de endogeneidade, viés de seleção dos participantes de algum programa social ou
educacional, viés na implementação de politicas publicas e potencial viés dos estimadores. O
método de diferenças em diferenças é muito utilizado visando eliminar os efeitos das
variáveis não observadas e evitar viés dos estimadores (BELLEI, 2009) (EMERSON,
PONCZEK, & SOUZA, 2013) (FOGUEL, 2012). O fato de muitos insumos terem efeito
cumulativo também justifica a adoção desse método.
4.5.1 Modelo de Painel de Dois Períodos
Assumindo que existem fatores não observados que afetam o desempenho escolar dos alunos
da amostra, é realizada uma diferenciação de dois cortes transversais, visando eliminar os
fatores não observados constantes no tempo (WOOLDRIDGE, 2006). O seguinte modelo foi
formulado para testar a hipótese:
Corte transversal quando t = 2008 (ou t=1), onde i = 1 a 22.514:
𝑌𝑖! = 𝛽!+ 𝛽! (𝐸𝐸𝐸𝑃)𝑖! + 𝛽!(𝑓𝑎𝑡𝑜𝑟𝑒𝑠 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑖𝑠)𝑖!+ 𝛽! (𝑓𝑎𝑡𝑜𝑟𝑒𝑠 𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑟𝑒𝑠)𝑖!+
𝛽