3. A influência da qualidade da educação na renda do jovem
3.1. Especificação e Protocolo
A estimação do efeito da qualidade da educação na renda dos jovens partiu de um modelo em
2 estágios. O primeiro estágio consiste em estimar a probabilidade de um jovem ter estudado
na rede pública ou na rede privada quatro anos antes da data em que foi entrevistado. Essa
probabilidade é transformada numa distribuição binária: (0) estudou na rede pública e (1)
estudou na rede privada. Com base nessa informação imputou-se o valor da qualidade da
educação conforme a rede, a região e o grau de escolaridade do indivíduo quatro anos atrás
(2001). O segundo estágio consiste numa equação de determinação da renda que busca avaliar
se a qualidade da educação que este jovem teve afetou seu desempenho no mercado de
trabalho.
3.1.1. Primeiro estágio
Dado que a PNAD não informa se o jovem que trabalha estudou no ensino público ou privado
no passado, mas, apenas a rede de ensino para os jovens que estudavam na data de referência
da pesquisa, adotou-se uma variável como proxy dessa distribuição. A partir da PNAD de
2005, foram selecionados os jovens com idade entre 12 e 21 anos que estudavam na data de
referência. Para esse grupo da população, calculou-se a probabilidade de um jovem estudar
em escola da rede pública ou privada, dado o rendimento mensal familiar per capita, a raça, a
área de domicílio (urbana ou rural), o gênero, o curso que freqüenta, a idade, e a condição de
vida da mãe (viva ou morta), a condição de ocupação do jovem (ocupado ou não ocupado) e a
participação da renda do jovem na renda familiar. O procedimento de estimação pode ser
expresso pela equação a seguir:
j j
e
x
x
P
+
+
=
)
exp(
1
)
exp(
β
β
Dado o resultado de Pj, para cada indivíduo j, imputou-se a rede de ensino mais provável
deste indivíduo estudar. Se 0 < Pj ≤ 0,5, então se adotou o valor 0 (estudou na rede pública) e
3.1.2. Segundo estágio
O segundo estágio consiste no modelo de determinação da renda dos jovens que segue a
equação a seguir:
j
j
x
y
=
β+ε
ln
Cuja variável dependente é o logaritmo neperiano do rendimento por hora trabalhada do
indivíduo e x é o vetor de variáveis explicativas: anos de estudo, qualidade da educação, rede
de ensino onde provavelmente estudou, logaritmo neperiano da renda per capita familiar
(considerando apenas renda dos demais componentes do domicílio), tempo de experiência no
mercado de trabalho, tempo de experiência no emprego atual, raça, gênero, tipo de contrato de
trabalho, setor de atividade econômica e unidade da federação.
Para avaliar o comportamento do termo de erro, adotou-se três hipóteses alternativas:
(i) εn
~
N
(
0,σε2
)
;
(ii) εn
=νn
−un,
(
)
2
n
~
N
0,σν
ν
e un
~
HN
(
µ,σu2
)
;
(iii) εn
=νn
−un,
(
)
2
n
~
N
0,σν
ν
e un
~
TN
(
µ,σu2
)
;
(iv) εn
=νn
−un,
(
)
2
n
~
N
0,σν
ν
e un
~
E
(
µ,σu2
)
.
A primeira premissa corresponde ao modelo tradicional OLS. As duas premissas seguintes
correspondem a modelos de fronteira estocástica de salários, sendo que no caso de (ii) supõe-
se que o componente de ineficiência un tem distribuição normal truncada e no caso de (iii),
uma distribuição half-normal. O último caso apresenta uma distribuição exponencial para a
componente de ineficiência.
3.2. Dados
O banco de dados utilizado nesse trabalho está baseado na Pesquisa Nacional por
Amostragem Domiciliar (PNAD), para o ano 2005 e no Censo Escolar do INEP, do
Ministério da Educação, para o ano 2001.
3.2.1. Primeiro estágio
Os dados utilizados o primeiro estágio foram tirados na PNAD 2005, correspondendo a
50.627 jovens entre 12 e 21 anos que estudavam. A estratificação garantiu que fossem
incluídos jovens de todas os estados brasileiros e estudantes de todos os níveis de ensino das
redes pública e privada. A Tabela 11 resume as estatísticas descritivas do primeiro estágio.
Tabela 11. Estatísticas Descritivas – 1º estágio
Escala Mínimo Máximo Média Desvio Padrão
Probabilidade de estudar na rede de ensino privada binária 0.0000 1.0000 0.1544 0.3613
Ln da renda familiar per capita ln 0.1542 9.7220 5.3116 1.0234
Quadrado do Ln da renda per capita ln 0.0238 94.5166 29.2605 11.1921
Raça: (1) branco e (0) não branco binária 0.0000 1.0000 42.8% 49.5%
Urbano: (1) urbano e (0) rural binária 0.0000 1.0000 82.6% 37.9%
Ocupação: (1) trabalha e (0) não trabalha binária 0.0000 1.0000 23.4% 42.4%
Porcentagem da renda do indivíduo da renda familiar (%) 0% 100% 4.5% 12.6%
Número de observações válidas (listwise) 50,627
Fonte: elaboração própria
Além dessas variáveis utilizou-se como variável de controle o curso que freqüentava: ensino
Fundamental, Médio ou Superior.
3.2.2. Segundo estágio
Os dados utilizados no segundo estágio do modelo estão baseados na PNAD 2005,
correspondendo a 36.124 jovens entre 16 e 25 anos que trabalhavam. A variável dependente é
o logaritmo neperiano da renda por hora trabalhada na semana. O rendimento mensal dos
indivíduos da amostra variou de R$5,00 a R$25.000,00 mensais, com média de R$437,45. Já
as horas trabalhadas variaram entre 1 hora e 98 horas semanais, sendo que a média de jornada
de trabalho dos jovens entre 16 e 25 anos foi de 40 horas por semana. Os anos de estudo do
jovem, na amostra, variaram de um mínimo de 1, com a 1a série do ensino Fundamental, até
15 anos, que corresponde ao nível superior completo, sendo que a escolaridade média
amostral foi de 9,1 anos. A renda per capita familiar considera apenas a renda dos demais
componentes da família pelo número total de componentes da família.
Tabela 12. Estatísticas Descritivas – 2º estágio
Escala Mínimo Máximo Média Desvio Padrão
Rendimento do indivíduo R$ 5.00 25.000.00 437.4512 456.8705
Nº de horas trabalhadas horas 1 98 40.8200 12.6115
Ln da renda por hora trabalhada ln -2.4159 7.1954 2.1677 0.7403
Anos de estudo Anos 1 15 9.0594 3.0424
Estuda na rede privada Binário 0 1 44.5% 49.7%
IQE Escalar 0.1509 0.8855 0.6611 0.1366
Ln da renda per capita da família Ln -2.4849 9.5722 4.6524 2.1178
Tempo de experiência no mercado de trabalho Meses 0 240 74.1938 50.0158
Tempo de permanência no emprego atual Meses 0 240 24.1550 26.8791
Raça (1 branco , 0 demais) Binário 0 1 46.4% 49.9%
Gênero (1 feminino , 0 masculino) Binário 0 1 40.1% 49.0%
Número de observações válidas (listwise) 36,124