Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Rendimento Acadˆ
emico,
o que prediz (e o que n˜
ao prediz):
O caso dos alunos de Ciˆ
encias Econˆ
omicas da UnB
Lu´ıs Crist´ov˜ao Ferreira Lima Orientador: Mois´es Resende Filho
PET Economia Universidade de Bras´ılia 25 de Abril de 2012
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Motiva¸c˜
ao
Falta de trabalhos, principalmente no Brasil, que tivessem estudantes de universidades como objeto de estudo.
Curiosidade pessoal: o que determina o sucesso acadˆemico
(ou n˜ao) de um estudante?
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Introdu¸c˜
ao
Deseja-se descrever os aspectos socioeconˆomicos e
acadˆemicos dos estudantes de economia
Ap´os, estima-se modelos para encontrar causalidade entre caracter´ısticas e h´abitos desses estudantes e seu rendimento Ao fim, essas mesmas caracter´ısticas s˜ao usadas para estimarmos a probabilidade do aluno ter uma reprova¸c˜ao ou trancamento no curr´ıculo
O trabalho ´e muito mais um Estudo de Caso do que uma
tentativa de estimar uma Fun¸c˜ao de Produ¸c˜ao para a Educa¸c˜ao
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Base de Dados
Question´ario
Base de Dados
Base de dados in´edita proveniente de 240 question´arios aplicados entre os alunos de Ciˆencias Econˆomicas da UnB Question´arios aplicados em turmas representativas entre o 2o e 7o semestres
Data: fim de Agosto e in´ıcio de Setembro de 2011 Alunos eleg´ıveis: qualquer aluno de economia que estava
cursando no m´ınimo o 2o semestre no 2/2011
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Base de Dados
Question´ario
Question´
ario
Primeira parte pergunta aspectos socioeconˆomicos (sexo,
idade, renda...)
Depois disso, pedia-se a frequˆencia a lugares emblem´aticos da nossa universidade (RU, BCE, CA...) durante o 1/2011. Ao fim, o estudante deveria colocar todas as men¸c˜oes do seu semestre anterior (1/2011)
Essa op¸c˜ao ´e melhor, pois os alunos tendem a lembrar-se mais de suas notas imediatamente passadas do que do seu
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Base de Dados
Question´ario
Introdu¸c˜ao e Motiva¸c˜ao
Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Base de Dados
Question´ario
F´
ormula do IRA
O IRA foi calculado pela f´ormula da UnB:
IRA = [1 − (0, 6 ∗ DTb + 0, 4 ∗ DTp)
DC ] ∗
(ΣPi ∗ CRi ∗ Pei ) (ΣCRi ∗ Pei ) DTb indica o n´umero de disciplinas obrigat´orias trancadas, DTp o n´umero de disciplinas optativas trancadas, DC o n´umero de disciplinas matriculadas (incluindo as trancadas), Pi ´e o peso da
men¸c˜ao (SS=5, MS=4, MM=3, MI=2, II=1 e SR=0), CRi ´e o
n´umero de cr´editos da disciplina e Pei ´e o per´ıodo no fluxo. Como o IRA medido ´e de apenas um semestre, o Pei de todos ´e igual a 1.
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso
Homens vs. Mulheres Renda
Rela¸c˜ao do Aluno com a UnB Perfil Acadˆemico
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso
Homens vs. Mulheres
Renda
Rela¸c˜ao do Aluno com a UnB Perfil Acadˆemico
Homens vs. Mulheres
N´umero muito maior de homens: 152 (63,3%) contra 88
mulheres (36,7%)
IRA das mulheres ´e mais alto: 3,67 contra 3,49
A propor¸c˜ao de mulheres com reprova¸c˜ao ou trancamento no
per´ıodo ´e de 33%, a de homens, 46%.
A “supremacia” feminina ´e corroborada por outras pesquisas
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso Homens vs. Mulheres
Renda
Rela¸c˜ao do Aluno com a UnB Perfil Acadˆemico
Renda
Foi a vari´avel mais omitida, 21 omiss˜oes e 219 observa¸c˜oes v´alidas
Renda extremamente elevada. Mediana de R$ 12000!
A moda dos dados ´e de R$ 20000 ou mais (49 alunos - 22,4%)
Comparando: 15,5% dos estudantes das Federais brasileiras
s˜ao da classe A (ANDIFES, 2011). Na amostra,
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso Homens vs. Mulheres
Renda
Rela¸c˜ao do Aluno com a UnB Perfil Acadˆemico
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso Homens vs. Mulheres Renda
Rela¸c˜ao do Aluno com a UnB
Perfil Acadˆemico
Rela¸c˜
ao do Aluno com a UnB
18% dos alunos almo¸caram uma vez por semana no RU, 25% duas ou mais vezes e 57% n˜ao almo¸caram uma ´unica vez BCE: 39,2% n˜ao a frequentou, 23,3% foi de visitantes ocasionais e 37,5% a usou para estudar
53,3% dos alunos foi ao CA pelo menos uma vez por mˆes e
44,7% n˜ao o frequentou
Vida Noturna na UnB: 32% dos alunos n˜ao a frequentou.
Enquanto que 40,4% foi a dois ou mais eventos por mˆes.
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados
Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes Modelo Alternativo: Regress˜ao Log´ıstica
Modo de Ingresso Homens vs. Mulheres Renda
Rela¸c˜ao do Aluno com a UnB
Perfil Acadˆemico
Perfil Acadˆ
emico
Horas de estudo por semana: 6,87 em m´edia. Mediana de 5h.
Horas de estudo na v´espera de provas: 6,15
O estudo semanal ´e baixo comparado com as universidades americanas. Por quˆe?
Propor¸c˜ao m´edia de faltas: 16% 34,6% trabalhou ou estagiou IRA m´edio: 3,55
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao
Ressalvas Resultados Outros Modelos Exemplo
Podemos utilizar M´ınimos Quadrados Ordin´arios (MQO) para
estimar quais s˜ao os determinantes do Rendimento
Acadˆemico.
Modelo Simples
IRA = β0+ β1Centro Acadˆemico + β2Vida Noturna na UnB +
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo Modelo Completo
IRA = β0+ β1Centro Acadˆemico + β2Vida Noturna na UnB +
β3Estudo + β4Faltas em % + β5(Faltas em %)2+ β6Idade +
β7Disciplinas + β8Sexo Feminino + β9Cotas + β10PAS +
β11Transferˆencia + β12Outro + β133oAno + β14EM P ´ublico + β15Trabalho + β16Est´agio +
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Ressalvas
O IRA na regress˜ao est´a numa escala entre 0 e 100. ´E o IRA convencional multiplicado por 20.
O termo de erro n˜ao pode ser correlacionado com nenhuma
das vari´aveis independentes.
H´a rela¸c˜ao entre aptid˜ao e estudo? (Stinebrickner e Stinebrickner, 2004)
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Resultados
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Resultados
As horas de estudo semanal foram bastante significantes para o IRA. 1 hora a mais de estudo eleva o IRA(0-100) em 0,56 A propor¸c˜ao de faltas tamb´em foi relevante no modelo. A adi¸c˜ao do termo quadr´atico evidencia o efeito decrescente dessa vari´avel
Entre 0 e 1%, o efeito das faltas ´e de -0,46. Entre 24% e 25%, esse efeito ´e de apenas -0,2
A frequˆencia ao Centro Acadˆemico e `a Vida Noturna da UnB n˜ao foram significantes no rendimento (parˆametros pequenos
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Resultados
Rendimento 3,92 pontos maior das mulheres em rela¸c˜ao aos
homens
Cotistas apresentaram IRA(0-100) 8,3 pontos menor que os que ingressaram por vestibular comum
Pessoas que ingressaram por Transferˆencia tˆem rendimento menor em 7,6
Os que trabalharam tiveram rendimento 3,7 maior, contrariando artigos anteriores
As vari´aveis PAS, 3o Ano, EM P´ublico e Est´agio n˜ao foram significantes
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Outros Modelos
O modelo da coluna 4 inclui dummies de renda, todas elas n˜ao significantes. Reduz as observa¸c˜oes para 219
Segundo White(1982), a renda determina o rendimento entre
os alunos de diferentes escolas, mas n˜ao em uma mesma
institui¸c˜ao
O modelo da coluna 5 inclui ainda vari´aveis subjetivas. N´ıvel de motiva¸c˜ao e de ingest˜ao de bebida
Imposs´ıvel determinar uma rela¸c˜ao ceteris paribus com vari´aveis desse tipo.
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados
IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
Especifica¸c˜ao Ressalvas Resultados Outros Modelos Exemplo
Exemplo
De acordo com o 3o modelo, um t´ıpico aluno de Ciˆencias
Econˆomicas, homem de 20 anos, que n˜ao trabalha ou estagia,
que estuda 7 horas semanais, falta 10% das aulas, entrou pelo
vestibular (depois de concluir o Ensino M´edio em uma escola
privada), cursa 6 mat´erias e vai 5 vezes ao CA por mˆes e 3 `a festas, ter´a um IRA de 70,75 ou 3,5375 na escala convencional
J´a outra estudante, mulher de 20 anos que entrou pelo PAS,
vinda de escola p´ublica, que estuda 12 horas por semana e n˜ao falta aulas, al´em de n˜ao frequentar o CA ou festas, cursando
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
O Modelo
Resultados Exemplo
O Modelo
Objetivo: definir a probabilidade do aluno ter uma reprova¸c˜ao ou trancamento no per´ıodo
Como a vari´avel dependente ´e bin´aria, usa-se Regress˜ao Log´ıstica
Estimado por M´axima Verossimilhan¸ca, que consiste em maximizar a probabilidade da amostra coletada ser a mais representativa poss´ıvel
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
O Modelo Resultados Exemplo
O Modelo
Distribui¸c˜ao Log´ıstica: exp(z) 1 + exp(z) sendo z = β1x1+ β2x2+ ... + βkxkIntrodu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
O Modelo
Resultados
Exemplo
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
O Modelo
Resultados
Exemplo
Resultados
A vari´avel Estudo teve um parˆametro relativamente alto, mas apenas significante ao n´ıvel de 10%
Centro Acadˆemico e Vida Noturna na UnB seguem n˜ao
significantes
As mulheres tˆem menos reprova¸c˜oes e trancamentos, mas o coeficiente s´o ´e significante ao n´ıvel de 10%
As vari´aveis mais importantes e significantes foram Faltas e Disciplinas
Introdu¸c˜ao e Motiva¸c˜ao Obten¸c˜ao dos Dados Descri¸c˜ao dos Dados IRA: Modelos para Encontrar seus Determinantes
Modelo Alternativo: Regress˜ao Log´ıstica
O Modelo Resultados
Exemplo
Exemplo
Assim, de acordo com o modelo (z3), o t´ıpico aluno de ciˆencias econˆomicas teria probabilidade de 0,465 de reprovar ou trancar pelo menos uma disciplina. Mantendo as vari´aveis fixas, mas adicionando uma hora ao estudo semanal (de 7 para 8), a probabilidade passaria para 0,45, 1,5% menor. Faltar menos (de
10% para 9% das aulas) implicaria em uma redu¸c˜ao de 1,6%, de
0,465 para 0,449. Por fim, cursar uma disciplina a mais (7 ao inv´es de 6) eleva a probabilidade de reprova¸c˜ao para 0,56, 9,5% maior
que antes. Uma mulher com essas mesmas caracter´ısticas ter´a