• Nenhum resultado encontrado

Rendimento acadêmico dos aspirantes da Escola Naval: uma abordagem por regressão quantílica

N/A
N/A
Protected

Academic year: 2021

Share "Rendimento acadêmico dos aspirantes da Escola Naval: uma abordagem por regressão quantílica"

Copied!
68
0
0

Texto

(1)

Luciana Cavalcante Gualberto

Rendimento Acadˆ

emico dos Aspirantes da

Escola Naval: Uma Abordagem Por

Regress˜

ao Quant´ılica

Niter´oi - RJ, Brasil 06 de dezembro de 2017

(2)

Universidade Federal Fluminense

Luciana Cavalcante Gualberto

Rendimento Acadˆ

emico dos

Aspirantes da Escola Naval: Uma

Abordagem Por Regress˜

ao Quant´ılica

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Marcia Marques Carvalho

Niter´oi - RJ, Brasil 06 de dezembro de 2017

(3)

Universidade Federal Fluminense

Luciana Cavalcante Gualberto

Rendimento Acadˆ

emico dos Aspirantes da

Escola Naval: Uma Abordagem Por

Regress˜

ao Quant´ılica

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Rendi-mento Acadˆemico dos Aspirantes da Escola Naval: Uma Abor-dagem Por Regress˜ao Quant´ılica”, defendida por Luciana Ca-valcante Gualberto e aprovada em 06 de dezembro de 2017, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:

Profa. Dra. Marcia Marques Carvalho Departamento de Estat´ıstica - UFF

Prof. Dr. Waldir Jesus de Ara´ujo Lob˜ao Centro T´ecnico Cient´ıfico - Escola Naval Escola Nacional de Ciˆencias Estat´ısticas - ENCE

Profa. Dra. Danielle Carusi Machado Departamento de Economia - UFF

(4)

Ficha Catalográfica elaborada pela Biblioteca do Instituto de Matemática e Estatística da UFF

Resp. pela Unidade: Carlos R. S. de Lima – CRB7 5531

G899 Gualberto, Luciana Cavalcante

Rendimento acadêmico dos aspirantes da Escola Naval: uma abordagem por regressão quantílica / Luciana Cavalcante Gualberto. – Niterói,. RJ : [s.n.], 2017.

68f.

Orientador: Prof. Dra Márcia Marques Carvalho

Trabalho de Conclusão de Curso (Estatística) - Universidade Federal Fluminense, 2017.

1. Estatística Matemática. 2. Análise de regressão (Matemática). 3. Regressão quantílica. 4. Aspirantes. 5. Escola Naval. I. Título.

CDD 519.537

(5)

Resumo

O presente trabalho tem como objetivo analisar o desempenho acadˆemico dos Aspi-rantes da Escola Naval, uma vez que suas notas s˜ao fator de influˆencia na antiguidade que levam para o restante da carreira militar na Marinha do Brasil. O m´etodo escolhido foi a abordagem atrav´es do m´etodo de regress˜ao quant´ılica, pois assim ´e poss´ıvel verificar as diferen¸cas entre alunos com notas mais altas e mais baixas. Foram consideradas como vari´aveis de desempenho acadˆemico a m´edia final, equivalente ao coeficiente de rendi-mento, e as m´edias em cada Centro, englobando disciplinas de exatas, humanas e pr´aticas navais. Para analisar o desempenho acadˆemico foram utilizadas informa¸c˜oes do perfil socioeconˆomico dos ingressantes na Escola Naval no ano de 2016. Os resultados mostram que escolaridade dos pais e a idade do Aspirante s˜ao fatores de influˆencia em todos os quantis do desempenho acadˆemico. Entretanto, o tipo de escola do ensino b´asico e o fato do Aspirante residir no Rio de Janeiro foram significativos somente em alguns quantis e Centros.

Palavras-chaves: Aspirantes; Escola Naval; Regress˜ao Quant´ılica; Desempenho Acadˆemico; Perfil Socioeconˆomico

(6)

Dedicat´

oria

Dedico esse trabalho `a minha v´o Alice, meu anjo da guarda que sinto me proteger a cada dia; `a minha m˜ae, minha maior fonte de inspira¸c˜ao e `a minha filha, onde recarrego minhas for¸cas diariamente.

(7)

Agradecimentos

Acima de tudo, primeiramente, agrade¸co `a Deus pois mesmo sem entender Seus des´ıgnios, nunca me desamparou e me mostrou os melhores caminhos a seguir.

Agrade¸co a minha orientadora, que apesar de todos os contratempos rotineiros sempre me recebeu com um sorriso no rosto, teve enorme paciˆencia em cada etapa e me passou experiˆencias e ensinamentos ´unicos.

Agrade¸co aos meus amigos de Universidade que me ajudaram nos momentos mais dif´ıceis passando tardes me explicando diversas disciplinas, sem eles n˜ao chegaria a lugar nenhum.

Agrade¸co `a Marinha do Brasil, em Especial `a Escola Naval que em meio a diversas atribula¸c˜oes da vida militar me deu o privil´egio de por em pr´atica o in´edito tema deste trabalho.

Agrade¸co pela maravilhosa filha que Deus me deu, que em sua inocˆencia me encheu de for¸cas cada vez que me incentivava a estudar para ”ganhar mais dinheiro para comprar comida e brinquedos”, assim nunca me fez cogitar a hip´otese de desistir.

Agrade¸co `a minha m˜ae que abdicou muitas vezes de si mesma para que eu conseguisse seguir meu caminho e obtivesse ˆexito nas escolhas que fiz, por ter me apoiado em cada etapa da minha vida e por ter sido minha maior fonte de orgulho e inspira¸c˜ao.

Por ´ultimo, agrade¸co `a todos que em algum momento duvidaram de mim e de minha capacidade, pois foram os que mais me deram for¸cas pra seguir, pra trilhar meu caminho, concluir esse trabalho e atingir meu m´aximo potencial.

(8)

Sum´

ario

Lista de Figuras Lista de Tabelas 1 Introdu¸c˜ao p. 12 2 Objetivos p. 15 2.1 Gerais . . . p. 15 2.2 Espec´ıficos . . . p. 15 3 Materiais e M´etodos p. 16

3.1 Revis˜ao bibliogr´afica . . . p. 16 3.1.1 Modelos Aplicados da Educa¸c˜ao . . . p. 16 3.1.2 Aplica¸c˜oes do Modelo de Regress˜ao Quant´ılica . . . p. 18 3.2 Base de Dados . . . p. 20 3.3 Regress˜ao . . . p. 22 3.3.1 Sinal Esperado das Vari´aveis Regressoras . . . p. 22 3.3.2 Quantis . . . p. 23 3.3.3 A Regress˜ao Quant´ılica . . . p. 24 3.3.4 Estima¸c˜ao dos Parˆametros . . . p. 27 3.3.5 Intervalos de Confian¸ca . . . p. 28 3.3.6 Teste de Hip´otese Linear Geral . . . p. 29 3.3.7 Coeficientes de determina¸c˜ao . . . p. 30

(9)

3.4 Rela¸c˜ao e Correla¸c˜ao entre as Vari´aveis . . . p. 32 3.4.1 Teste Para Igualdade de Medianas . . . p. 32 3.4.2 Teste Para Distribui¸c˜ao . . . p. 33 3.4.3 Vari´aveis Ordinais . . . p. 33 3.4.4 Correla¸c˜ao Vari´aveis Dicotˆomicas . . . p. 34

4 An´alise dos Resultados p. 35

4.1 Perfil dos Aspirantes . . . p. 35 4.2 O Rendimento Acadˆemico . . . p. 36 4.3 Escolha das vari´aveis independentes do Modelo . . . p. 44 4.3.1 Correla¸c˜ao entre vari´aveis . . . p. 44 4.3.2 Ajuste da regress˜ao linear cl´assica . . . p. 46 4.4 Modelo de Regress˜ao Linear M´ultipla . . . p. 48 4.5 Modelo de Regress˜ao Quant´ılica . . . p. 49 4.5.1 Vari´avel dependente: M´edia Final . . . p. 52 4.5.2 Vari´avel dependente: CCS . . . p. 53 4.5.3 Vari´avel dependente:CTC . . . p. 54 4.5.4 Vari´avel dependente:CPN . . . p. 56

5 Conclus˜ao p. 58

Referˆencias p. 60

(10)

Lista de Figuras

1 Histograma da M´edia Final, curva de densidade da m´edia final e curva

normal . . . p. 38 2 Boxplot da m´edia dos Centros . . . p. 39 3 Histograma da M´edia Final, curva de densidade da distribui¸c˜ao Laplace

Assim´etrica com parˆametros estimados . . . p. 50 4 Histograma da M´edia no CCS, curva de densidade da distribui¸c˜ao

La-place Assim´etrica com parˆametros estimados . . . p. 50 5 Histograma da M´edia no CTC, curva de densidade da distribui¸c˜ao

La-place Assim´etrica com parˆametros estimados . . . p. 51 6 Histograma da M´edia no CPN, curva de densidade da distribui¸c˜ao

(11)

Lista de Tabelas

1 Vari´aveis presentes no banco de dados . . . p. 21 2 N´umero de Aspirantes segundo as caracter´ısticas individuais - 2016 . . p. 35 3 N´umero de Aspirantes segundo as caracter´ısticas familiares - 2016 . . . p. 36 4 Medidas resumo da m´edias por Centro e m´edia final . . . p. 37 5 Testes Para Mediana . . . p. 39 6 Medidas resumo do desempenho dos Aspirantes, segundo as caracter´ısticas

individuais e familiares - 2016 . . . p. 40 7 Matriz de Correla¸c˜ao de Phi para vari´aveis dummy . . . p. 44 8 Tabela de contingˆencia . . . p. 45 9 Tabela de contingˆencia Grau de Instru¸c˜ao do M˜ae x Renda . . . p. 45 10 Tabela de contingˆencia Grau de Instru¸c˜ao do pai x Renda . . . p. 45 11 Coeficientes de Determina¸c˜ao modelos de regress˜ao para vari´avel

depen-dente M´edia Final . . . p. 46 12 Coeficientes de Determina¸c˜ao modelos de regress˜ao para vari´avel

depen-dente m´edia CCS . . . p. 47 13 Coeficientes de Determina¸c˜ao modelos de regress˜ao para vari´avel

depen-dente m´edia CTC . . . p. 47 14 Coeficientes de Determina¸c˜ao modelos de regress˜ao para vari´avel

depen-dente m´edia CPN . . . p. 48 15 Ajuste do Modelo Quant´ılico . . . p. 52 16 Estimativa e P-valor para βi Regress˜ao Quant´ılica Para M´edia Final . . p. 53

17 Estimativa e P-valor para βi Regress˜ao Quant´ılica Para CCS . . . p. 54

(12)

19 Estimativa e P-valor Para βi Regress˜ao quant´ılica para CPN . . . p. 56

20 Intervalo de Confian¸ca de 90% para parˆametros da regress˜ao quant´ılica

com vari´avel dependente M´edia Final . . . p. 64 21 Intervalo de Confian¸ca de 90% para parˆametros da regress˜ao quant´ılica

com vari´avel dependente M´edia CCS . . . p. 65 22 Intervalo de Confian¸ca de 90% para parˆametros da regress˜ao quant´ılica

com vari´avel dependente M´edia CTC . . . p. 66 23 Intervalo de Confian¸ca de 90% para parˆametros da regress˜ao quant´ılica

(13)

12

1

Introdu¸

ao

A Escola Naval ´e a Institui¸c˜ao de Ensino Superior mais antiga do pa´ıs. Nela se formam os oficiais do Corpo da Armada, do Corpo de Fuzileiros Navais e do Corpo de Intendentes da Marinha. Sua origem se deu alguns s´eculos atr´as.

Em meados do s´eculo XVIII, em Portugal, se observou a necessidade de criar a Acade-mia Real de Guardas-Marinha, com objetivo de aprimorar os conhecimentos matem´aticos, f´ısicos, astronˆomicos e, claro, de navega¸c˜ao dos futuros oficiais de Marinha. Em 1808, por ocasi˜ao do Bloqueio Continental, fez-se necess´aria a mudan¸ca da Fam´ılia Real Portu-guesa para o Brasil, ent˜ao Colˆonia portuguesa. Nessa transi¸c˜ao a Corte trouxe consigo a Academia de Guardas-Marinha.

Anos depois, ap´os a Independˆencia do Brasil, alguns integrantes da Academia juraram fidelidade `a Dom Pedro I, outros retornaram `a Portugal e criaram por l´a a Escola Naval Portuguesa.

A Academia Real de Guardas-Marinha mudou de sede e de nome diversas vezes at´e encontrar seu porto seguro definitivo na Ilha de Villegagnon em 1938, j´a como Escola Naval.

A travessia do Atlˆantico, a mudan¸ca de Continente, de nome e de sede em nenhum momento alterou o verdadeiro objetivo da Institui¸c˜ao. Durante quatro anos os alunos da Escola Naval, chamados de Aspirantes, s˜ao submetidos a severo regime militar, intensos treinos e atividades f´ısicas al´em de uma rigorosa rotina de estudos.

A forma¸c˜ao dos Aspirantes tem duas principais vertentes, s˜ao estas: a forma¸c˜ao militar-naval e a forma¸c˜ao acadˆemica. Esta segunda se d´a atrav´es das disciplinas pr´aticas e te´oricas, as quais ´e atribu´ıda uma nota de zero `a dez em duas provas e dois testes. Para m´edia final ´e calculada a m´edia aritm´etica simples da m´edia de todas as disciplinas. Essa m´edia que serve de base para um c´alculo posterior da antiguidade dos futuros oficiais.

(14)

1 Introdu¸c˜ao 13

carreira, se faz importante entender quais as vari´aveis que podem influenciar na nota final. Aqui, optou-se pela escolha de diversas vari´aveis socioeconˆomicas para o ajuste de um modelo de regress˜ao para as mesmas. Por´em um modelo simples estimado por m´ınimos quadrados s´o cumpriria uma parte do desejado. Ent˜ao, foi verificado que um modelo ideal seria de regress˜ao quant´ılica, uma vez que nele consegue-se separar os quantis desejados e para cada um ajustar o modelo com as vari´aveis de interesse. A vantagem deste modelo em rela¸c˜ao ao anterior ´e que poss´ıveis outliers n˜ao influenciam nas estimativas pois a vari´avel dependente ´e condicionada em cada quantil e n˜ao apenas na m´edia da distribui¸c˜ao. Sendo assim h´a subs´ıdios para uma compara¸c˜ao e um melhor entendimento do que pode ter influenciado em cada fator.

As vari´aveis independentes a serem ajustadas no modelo s˜ao provenientes da pesquisa socioeconˆomica aplicada pela Divis˜ao de Avalia¸c˜ao da Escola Naval aos Aspirantes do primeiro ano em 2016, quando estes ainda eram adaptandos, ou seja, antes das aulas come¸carem e se tornarem efetivamente alunos. A base de dados gerada por tais respostas foi utilizada para tra¸car um resumido perfil apenas com estat´ısticas descritivas, algumas tabelas e gr´aficos. At´e ent˜ao, nunca se usou tais informa¸c˜oes para constru¸c˜ao de um modelo de regress˜ao, sendo este um trabalho in´edito.

Trata-se, portanto, de um trabalho oportuno, uma vez que a autora ´e militar e serve re-gularmente da Escola Naval no Servi¸co de Orienta¸c˜ao Educacional e Pedag´ogica (SOEP), sendo este setor o respons´avel por dar suporte acadˆemico aos discentes. Ter conhecimento pr´evio dos fatores socioeconˆomicos que tendem a diminuir o rendimento acadˆemico dos alunos pode ajudar no desenvolvimento de apoio especial para os mesmos, n˜ao deixando que problemas pessoais e familiares os prejudiquem em toda a carreira devido a uma baixa antiguidade. por exemplo, verificar se ter familiares militares aumenta o desempe-nho do aluno, ou ainda, se o grau de escolaridade dos pais ou a renda da fam´ılia ´e fator significativo no quantil dos alunos com maiores e com menores notas.

Al´em do interesse de apoio individual a cada aluno existem tamb´em diversos ques-tionamentos que desejam ser sanados por meio deste trabalho. No conv´ıvio di´ario com os Aspirantes observa-se um certo descontentamento dos alunos egressos do Concurso P´ublico de Admiss˜ao `a Escola Naval (CPAEN) nas disciplinas que envolvem algum co-nhecimento pr´evio sobre militarismo ou alguma pr´atica naval em rela¸c˜ao aos egressos do Col´egio Naval (CN). Verificar se alunos que vieram de institui¸c˜oes civis s˜ao realmente prejudicados, faz-se essencial para uma poss´ıvel mudan¸ca em algumas disciplinas ou um apoio espec´ıfico que nivele todos os alunos, acabando com qualquer tipo de vantagem que

(15)

1 Introdu¸c˜ao 14

um grupo tenha. Assim n˜ao haver´a fatores que causem tendˆencia a uma melhor ou pior antiguidade para a carreira dos futuros oficiais.

Este trabalho est´a subdividido em mais quatro cap´ıtulos al´em desta primeira se¸c˜ao introdut´oria. A segunda constitui-se pelos objetivos do trabalho. No terceiro cap´ıtulo s˜ao apresentados os materiais e m´etodos, a parte do referencial te´orico, a base de toda an´alise feita al´em da metodologia e revis˜ao bibliogr´afica. Em seguida, ´e apresentada a an´alise descritiva do banco de dados al´em de todos resultados obtidos, os modelos desenvolvidos, os teste realizados etc. E, finalmente, no ´ultimo cap´ıtulo, s˜ao feitas as conclus˜oes, sugest˜oes e ideias para estudos futuros que possam aprimorar os trabalhos de apoio educacional na Escola Naval ou em institui¸c˜oes similares.

Para o presente trabalho optou-se pelo uso do software R como ferramenta para re-alizar todas as inferˆencias sobre o modelo j´a citado, al´em das an´alises descritivas, trans-forma¸c˜ao de vari´aveis do banco de dados, estima¸c˜ao do modelo etc. Tal software se mostra eficiente, pois executa o modelo de regress˜ao quant´ılica da forma que ser´a apresentado posteriormente, al´em de testes de hip´oteses e estimadores que aqui ser˜ao realizados e estimados.

(16)

15

2

Objetivos

2.1

Gerais

Testar e selecionar, atrav´es da metodologia estat´ıstica de regress˜ao quant´ılica, quais as vari´aveis socioeconˆomicas que influenciaram nos quantis de rendimento acadˆemico dos Aspirantes da Escola Naval.

2.2

Espec´ıficos

• Tra¸car e comparar os perfis de todos os Aspirantes, tanto os egressos do CN como os egressos do CPAEN.

• Verificar se Aspirantes com familiares militares tendem a ter maior rendimento acadˆemico de forma geral.

• Testar se os Aspirantes vindos do Col´egio Naval tˆem notas estat´ısticamente mais altas nas mat´erias referentes `a conhecimentos navais.

• Identificar quais s˜ao os fatores que mais explicam ou relacionam com o pior desem-penho (quantil 0,25) e comparar com a curva estimada para as notas mais altas (quantil 0,75)

(17)

16

3

Materiais e M´

etodos

Como citado no cap´ıtulo anterior, este trabalho tem como principal objetivo estimar um modelo que explique os fatores de influˆencia no desenvolvimento acadˆemico dos Aspi-rantes de forma n˜ao centralizada, ou seja, levando em considera¸c˜ao poss´ıveis discrepˆancias nas notas, por isso optou-se pela metodologia de regress˜ao quant´ılica. Al´em disso, deseja-se verificar o rendimento entre os grupos de procedˆencia do Ensino M´edio no Col´egio Naval e de outras Institui¸c˜oes, influˆencia de familiares, dentre outros.

3.1

Revis˜

ao bibliogr´

afica

N˜ao h´a trabalhos anteriores que estudem a diferen¸ca do rendimento de aspirantes da Escola Naval usando modelos de regress˜ao. Existem alguns textos simples e pouco ex-pressivos que comentam, com Estat´ısticas descritivas, o rendimento dos grupos de modo gen´erico. Assim sendo, como base para o presente trabalho foram pesquisados artigos acadˆemicos na ´area de educa¸c˜ao para verificar quais as vari´aveis socioenconˆomicas comu-mente usadas em modelos de regress˜ao linear para explicar o rendimento acadˆemico em distintos grupos. Foram feitas tamb´em pesquisas sobre diversas aplica¸c˜oes do modelo de regress˜ao quant´ılica, comumente usada na ´area econom´etrica.

As citadas pesquisas se mostram essenciais para melhor defini¸c˜ao de quais vari´aveis escolher como regressoras do modelo de interesse e de qual m´etodo mais apropriado para realizar inferˆencia de tal modelo.

3.1.1

Modelos Aplicados da Educa¸

ao

Na ´area da educa¸c˜ao de forma geral, existem diversos tipos de artigos que comparam dois perfis diferentes de alunos, por exemplo, cotistas versus n˜ao cotistas, alunos da regi˜ao versus alunos vindos de fora, alunos de humanas versus exatas versus biol´ogicas etc. Al´em de compara¸c˜oes, h´a tamb´em diversos artigos que relacionam desempenho acadˆemico

(18)

3.1 Revis˜ao bibliogr´afica 17

com vari´aveis socioencˆomicas de forma similar ao proposto no presente trabalho.

Como exemplo, cita-se o artigo “Competi¸c˜ao Justa? A Rela¸c˜ao Entre Desempenho No Vestibular e o Perfil Socioeconˆomico” (QUEVEDO-SILVA; SAUER, 2012). Neste, os autores tinham como objetivo analisar a rela¸c˜ao entre o desempenho acadˆemico no vestibular da UFMS entre 2008 e 2009 e o perfil socioeconˆomico dos candidatos dispo-nibilizado pela Comiss˜ao Permanente de Vestibular [COPEVE]. Os autores escolheram como vari´aveis a serem testadas: Renda familiar(em sal´arios m´ınimos), Idade (em faixas et´arias), Modalidade de curso do Ensino M´edio, Tipo de escola que frequentou o Ensino M´edio, Local de Conclus˜ao (fora do Estado ou n˜ao), Fluˆencia em Inglˆes, Frequentou cursi-nho, Vezes que prestou Vestibular e Trabalhar (sim ou n˜ao). Ap´os definidas as vari´aveis, foram estimados modelos de regress˜ao linear simples para cada uma dessas vari´aveis. Ap´os, os autores fizeram an´alises acerca do modelo com objetivo de verificar os fatores socioeconˆomicos que influenciaram no desempenho acadˆemico. Como conclus˜ao do artigo, os autores verificaram que estudar em escola particular aumenta a nota do aluno, que o aumento da renda familiar gera efeito positivo na nota, que a escolaridade da m˜ae teve influencia pouco maior que a do pai, 0,19 e 0,20, respectivamente etc.

Um trabalho acadˆemico com intuito de verificar rela¸c˜ao entre desempenho no vesti-bular e rendimento acadˆemico encontra-se em Baccaro (2014). Neste, o autor estima um modelo de regress˜ao para 4 ´areas distintas de carreiras, Ciˆencias Exatas, Tecnol´ogicas, Ciˆencias Biol´ogicas e Humanidades. Em seus modelos tomou como vari´avel dependente o rendimento acadˆemico dos universit´arios, sua m´edia no curso de gradua¸c˜ao, e como vari´aveis independentes as que classificou entre categorias como: desempenho no vestibu-lar, caracter´ısticas individuais, caracter´ısticas de renda e domic´ılio, escolaridade e situa¸c˜ao profissional dos pais, ensino fundamental e ensino m´edio, prepara¸c˜ao para o vestibular e carreira. Novamente, neste trabalho, se viu a presen¸ca de vari´aveis regressoras tais como idade, renda familiar, sexo, grau de instru¸c˜ao do pai e da m˜ae, situa¸c˜ao de trabalho do pai e da m˜ae, tipo de escola que cursou ensino m´edio etc. Ao fim da disserta¸c˜ao, Baccaro (2014), concluiu que o fato do indiv´ıduo ser homem influencia negativamente no desem-penho, alunos de cor branca apresentam melhor desemdesem-penho, os estudantes que fizeram ensino m´edio em escola privada tiveram pior desempenho e alunos com maior quantidade de bens tamb´em apresentaram desempenho negativo, contrariando muitos autores.

Tem-se a estima¸c˜ao de modelos de regress˜ao linear m´ultipla e de regress˜ao log´ıstica para explicar evas˜ao e rendimento acadˆemico de estudantes da Universidade de Bras´ılia em Bonfim (2014). Dentre as vari´aveis escolhidas como regressoras encontram-se sexo, idade,

(19)

3.1 Revis˜ao bibliogr´afica 18

renda familiar (em sal´arios m´ınimos), exercer atividade remunerada, ´area de conhecimento etc. Tais vari´aveis prov´em dos dados relativos ao processo seletivo da Universidade de Bras´ılia. A vari´avel dependente foi criada atrav´es de uma f´ormula espec´ıfica com intuito de definir o rendimento acumulado at´e o segundo semestre de 2013.

Uma aplica¸c˜ao de modelo de regress˜ao quant´ılica na educa¸c˜ao ´e vista na disserta¸c˜ao de Cavalcante (2014). Neste, o autor, atrav´es de dados do Sistema de Avalia¸c˜ao da Educa¸c˜ao B´asica (Saeb) do ano de 2011, cria uma fun¸c˜ao de produ¸c˜ao educacional e toma esta me-dida como vari´avel dependente. Primeiro faz uma abordagem baseada em estima¸c˜ao por m´ınimos quadrados ordin´arios (MQO) e posteriormente estima um modelo de regress˜ao quant´ılica. Dentre as vari´aveis regressoras escolhidas em ambos os modelos, ressalta-se novamente as vari´aveis socioeconˆomicas como ensino dos pais, cor, quantidade de pessoas em casa, trabalhar etc. Ao aplicar o m´etodo de regress˜ao quant´ılica o autor identificou o quanto a infraestrutura das escolas influenciava no rendimento dos alunos. Nos alu-nos do 3o ano do ensino m´edio, por exemplo, verificou-se que quanto maior o quantil do

desempenho acadˆemico, maior a influˆencia da infraestrutura escolar para explic´a-lo.

3.1.2

Aplica¸

oes do Modelo de Regress˜

ao Quant´ılica

Como j´a exposto anteriormente, o m´etodo de regress˜ao quant´ılica consiste em separar os dados em quantis previamente especificados e em cada um criar um modelo de regress˜ao. Assim sendo, esta metodologia ´e comumente usada em Econometria para explicar vari´aveis como renda, sal´arios e demais fatores econˆomicos.

Um exemplo de tal aplica¸c˜ao na ´area econom´etrica ´e o artigo de Santos e Ribeiro (2006) onde os autores objetivavam verificar se existia um teto em que as mulheres dei-xassem de ganhar igual aos homens e tivessem sal´arios inferiores. Para isto foi seguido o modelo inicial proposto por Koenker e Bassett (1978) e estimados os parˆametros da forma introduzida por eles. No trabalho de Santos e Ribeiro foram estimadas duas regress˜oes, uma para sal´arios dos homens e outra para o das mulheres. Os dados foram divididos em decis possibilitando assim a aplica¸c˜ao do m´etodo de regress˜ao quant´ılica. Ap´os estimar ambos os modelos e fazer as devidas an´alises, os autores optaram por obter distribui¸c˜oes contrafactuais baseadas no trabalho de Machado e Mata (2005). Como resultado final conclu´ıram que existe um limite para os sal´arios das mulheres no Brasil, seguindo assim a mesma tendˆencia em outros pa´ıses do mundo conforme citado por eles em seu trabalho. O artigo de Wajnman e Menezes (2003) visava relacionar o envelhecimento da po-pula¸c˜ao, a melhoria dos n´ıveis educacionais e a desigualdade de rendimentos no Brasil.

(20)

3.1 Revis˜ao bibliogr´afica 19

O m´etodo utilizado foi a regress˜ao quant´ılica. Os autores constru´ıram regress˜oes para dois distintos anos e fizeram a compara¸c˜ao de ambos.Ao fim foi poss´ıvel tirar diversas conclus˜oes como o fato da for¸ca de trabalho estar envelhecendo e essa contribuir para desigualdade salarial, entre outras.

Outro exemplo de aplica¸c˜ao da metodologia de regress˜ao quant´ılica na ´area econˆomica ´e o artigo de Maciel et al. (2001). Neste os autores objetivam analisar as mudan¸cas ocorri-das nos anos de 1992 e 1999 sob a abordagem de regress˜ao quant´ılica. Aqui basearam-se, tamb´em, no referencial inicial de Koenker e Bassett (1978) e reafirmam as caracter´ısticas de tal modelo baseadas em Buchinsky (1998). Os autores enunciam tamb´em as suposi¸c˜oes feitas para que possibilite um estudo do comportamento assint´otico das estimativas. Nos resultados foi utilizado a aplica¸c˜ao do modelo linear introduzido por Mincer (1974), tendo como vari´avel dependente o logar´ıtmo do sal´ario. Assim os autores conseguem verificar os sal´arios ajustados para cada quantil de interesse e fazem uma an´alise completa. Como conclus˜oes tiveram que houve participa¸c˜ao crescente da mulher na for¸ca de trabalho, que o efeito da educa¸c˜ao n˜ao ´e o mesmo ao longo da distribui¸c˜ao etc.

Um importante trabalho acadˆemico que n˜ao trata da aplica¸c˜ao do m´etodo de regress˜ao quant´ılica e sim da introdu¸c˜ao dessa classe de modelos visando motivar discuss˜oes acerca do tema se d´a na disserta¸c˜ao de Santos (2012). O autor cita o m´etodo de minimiza¸c˜ao da soma dos quadrados dos erros como o mais utilizado para estima¸c˜ao dos parˆametros e d´a um detalhamento sobre este m´etodo. Ap´os definir quantis, exemplificar e expor os obje-tivos do trabalho entra no cap´ıtulo sobre Inferˆencia no Modelo de Regress˜ao Quant´ılica onde o autor explica o m´etodo de estima¸c˜ao dos parˆametros de forma te´orica, apresenta op¸c˜oes variadas sobre cria¸c˜ao de intervalos de confian¸ca, detalha o teste de hip´otese linear geral. Ap´os algumas simula¸c˜oes e um t´opico sobre robustez e equivariˆancia em modelos de regress˜ao quant´ılica o autor inicia o cap´ıtulo sobre An´alise da Qualidade do Ajuste no Modelo de Regress˜ao Quant´ılica. Neste importante cap´ıtulo s˜ao definidos coeficientes de determina¸c˜ao, teste da falta de ajuste e ainda uma an´alise gr´afica. Ap´os o cap´ıtulo de aplica¸c˜oes, o trabalho se encerra nas conclus˜oes. A disserta¸c˜ao de Santos foi o maior referencial para o presente trabalho uma vez que ´e um dos poucos trabalhos completos de um autor brasileiro acerca do tema de regress˜ao quant´ılica, servindo ent˜ao como base para muito da metodologia que se segue.

(21)

3.2 Base de Dados 20

3.2

Base de Dados

Anualmente, por ocasi˜ao do per´ıodo de adapta¸c˜ao dos Aspirantes, a Divis˜ao de Ava-lia¸c˜ao da Escola Naval, atrav´es de servidora civil e oficiais do setor, submete os adaptandos `

a um question´ario socioeconˆomico. Neste h´a perguntas como escolaridade do pai, da m˜ae, renda familiar, quantidade de irm˜aos, procedˆencia do Ensino Fundamental etc. As res-postas desse question´ario constituem um banco de dados com o perfil socioeconˆomicos dos Aspirantes.

O objetivo do citado banco ´e criar uma apresenta¸c˜ao s´ıntese do perfil geral dos Aspi-rantes para apresentar ao Comando da Escola Naval e `a Diretoria de Ensino da Marinha (DEnsM). Para tal, usam-se apenas estat´ısticas descritivas, dando ˆenfase na apresenta¸c˜ao de tabelas e gr´aficos de f´acil compreens˜ao. Ap´os uma an´alise observacional dos dados s˜ao feitas pequenas conclus˜oes de forma geral sobre os adaptandos. Esses dados muitas vezes n˜ao s˜ao aproveitados nem armazenados e acabam sendo descartados devido a falta de profissional habilitado para fazer an´alises mais aprofundadas.

No ano de 2016, percebeu-se a grandeza do banco de dados e surgiu a id´eia de apro-fundar a an´alise do mesmo. Ao final do ano acadˆemico foram coletadas as m´edias finais de cada estudante e anexou-as aos dados do perfil socioeconˆomico dos mesmos. Assim criou-se um banco com uma grande riqueza de informa¸c˜oes que podem ser usadas para criar modelos, testar hip´oteses, verificar correla¸c˜oes etc.

Tal banco de dados, ao final, se constituiu da popula¸c˜ao de Aspirantes ingressantes no primeiro ano da Escola Naval em 2016, com 247 observa¸c˜oes e 103 vari´aveis, algumas com pouca ou nenhuma observa¸c˜ao por serem condicionais ou por serem espec´ıficas para um seleto grupo.

Para o interesse do presente estudo definiu-se como vari´aveis regressoras para compor o modelo: origem (CN ou CPAEN), tipo de escola que cursou o ensino fundamental (militar, p´ublica, particular,outras), sexo (feminino, masculino), idade, grau de instru¸c˜ao do pai e grau de instru¸c˜ao da m˜ae (at´e fundamental, m´edio completo, superior incompleto, superior completo, p´os-gradua¸c˜ao), possui parente militar (sim ou n˜ao), renda familiar (at´e 7 sal´arios m´ınimos, de 8 a 10 ou acima de 10), Estado de origem (RJ ou outros) e soldo contribui ou contribuir´a para as despesas familiares (sim ou n˜ao). Tais vari´aveis foram escolhidas seguindo os mesmos padr˜oes de vari´aveis socioeconˆomicas regressoras quando se trata de educa¸c˜ao. A estas foram acrescentadas vari´aveis espec´ıficas de interesse para o presente trabalho. A Tabela 1 apresenta de forma mais simplificada as vari´aveis

(22)

3.2 Base de Dados 21

que comp˜oem o banco de dados e sua respectiva caracteriza¸c˜ao. Al´em das que ser˜ao usadas como regressoras tem-se tamb´em as m´edias dos seguintes Centros: Centro T´ecnico Cient´ıfico (CTC) com as disciplinas: C´alculo 1, Desenho, Fundamentos da Tecnologia e Informa¸c˜ao e F´ısica 1; Centro de Ciˆencias Sociais (CCS) englobando as disciplinas: Hist´oria do Pensamento Humano, Inglˆes 1 e Portuguˆes 1; e, o terceiro, Centro de Pr´aticas Navais (CPN) contendo as disciplinas: Fundamentos Navais e Navega¸c˜ao 1, al´em da m´edia final.

Tabela 1: Vari´aveis presentes no banco de dados

Vari´avel Caracteriza¸c˜ao

Origem CN, CPAEN

Cursou Esino Fundamental em

Escola Militar? Sim ou N˜ao

Sexo Feminino, Masculino

Idade De 18 `a 24 anos

Grau de instru¸c˜ao do pai

At´e Fundamental, M´edio completo, Superior incompleto, Superior completo, P´os-gradua¸c˜ao

Grau de instru¸c˜ao da m˜ae

At´e Fundamental, M´edio completo, Superior incompleto, Superior completo, P´os-gradua¸c˜ao

Possui parente militar? Sim, N˜ao

Renda familiar At´e 7, de 8 a 10

ou acima de 10 sal´arios m´ınimos

Estado de origem RJ ou outros

Soldo contribui ou contribuir´a

para as despesas familiares? Sim ou N˜ao

CTC M´edia das disciplinas C´alculo 1, Desenho,

Fundamentos da Tecnologia e Informa¸c˜ao e F´ısica 1

CCS M´edia das disciplinas Hist´oria do Pensamento Humano,

Inglˆes 1 e Portuguˆes 1

CPN M´edia das disciplinas Fundamentos Navais

e Navega¸c˜ao 1

M´edia Final M´edia aritm´etica simples das disciplinas de todos os Centros

NOTA: A vari´avel m´edia final inclui a disciplina Legislac¸˜ao Militar Naval que n˜ao pertence a nenhum dos trˆes Centros acima, pertence ao Comando do Corpo de Aspirantes.

(23)

3.3 Regress˜ao 22

destas 9 qualitativas, sendo idade a ´unica quantitativa. Essas ´ultimas s˜ao categ´oricas com diversas op¸c˜oes de respostas. Para as vari´aveis categ´oricas ´e necess´ario fazer algumas altera¸c˜oes no banco de dados. Estas precisam ser substitu´ıdas por vari´aveis dummy que assumem valores 0 ou 1 conforme presen¸ca da caracter´ıstica, da seguinte forma:

Di = 1, se afirmativo para a caracter´ıstica i;

Di = 0, caso contr´ario.

Para cada vari´avel com k categorias necessitam ser criadas k − 1 vari´aveis dummy. Como resultado, o banco de dados fica com 7 vari´aveis para o grau de instru¸c˜ao do pai e igualmente em rela¸c˜ao `a m˜ae; 2 em rela¸c˜ao ao gasto com o soldo; 3 sobre a renda familiar e sobre onde cursou o ensino m´edio e; Estado de origem, possuir parente militar, sexo e origem representaram apenas uma vari´avel; tamb´em encontra-se nos dados a vari´avel do n´umero interno do Aspirante apenas para identifica¸c˜ao, n˜ao sendo considerada no modelo. Para a constru¸c˜ao dos modelos de interesse ´e necess´ario analisar as vari´aveis e verificar possiveis recategoriza¸c˜oes das vari´aveis ou cria¸c˜ao de novas dummies.

3.3

Regress˜

ao

3.3.1

Sinal Esperado das Vari´

aveis Regressoras

As vari´aveis dependentes usadas nos modelos a serem estimados referem-se ao de-sempenho acadˆemico dos alunos. Segundo Souza (2008), renda familiar elevada resulta em rendimento acadˆemico melhor por diversos fatores que podem ser verificados em seu artigo. Espera-se que a vari´avel renda familiar, quanto mais alta, maior o valor do seu parˆametro estimado, logo, maior sua rela¸c˜ao com as vari´aveis dependentes e esta rela¸c˜ao seja positiva. Neste mesmo artigo, o autor estuda a liga¸c˜ao do grau de instru¸c˜ao dos pais com o rendimento acadˆemico e conclui que quanto maior a escolaridade dos pais, melhor o desempenho do filho.

Cardoso e Sampaio (1994) , mostrou que o fato de alunos terem que trabalhar para ajudar financeiramente a fam´ılia e concluem que estes tem baixo desempenho acadˆemico. Logo, a vari´avel que se refere a contribui¸c˜ao do soldo pelos Aspirantes deve exercer in-fluˆencia negativa nas vari´aveis dependentes.

Buckless, Lipe e Ravenscroft (1991) conclu´ıram que gˆenero n˜ao ´e um fator de influˆencia para o rendimento acadˆemico. Espera-se verificar se no universo de alunos militares este resultado repete-se ou diferencia-se.

(24)

3.3 Regress˜ao 23

Sobre a idade dos alunos, observam-se divergˆencias entre autores. Por exemplo entre Cohn (1972) e Koh e Koh (1999), o primeiro afirma que h´a melhora no desempenho de alunos mais velhos, enquanto o mais novo defende que os de menor idade tˆem notas mais altas. Para verificar este fato pode-se optar por criar um dummy e verificar se os mais novos tˆem influˆencia positiva ou negativa no desempenho acadˆemico.

Sobre o local de residˆencia do aluno, Guney (2009) realizou estudo e concluiu que a cidade de procedˆencia n˜ao influencia no rendimento do aluno. ´E de interesse verificar se o mesmo ocorre no ambiente militar.

V´arios autores, como Silva (2015), estudaram a influˆencia do tipo de escola de n´ıvel fundamental e m´edio no desempenho acadˆemico dos alunos de ensino superior. No pre-sente estudo, por´em, h´a diferen¸cas significativas uma vez que o interesse n˜ao ´e verificar somente o tipo de escola e sim o fato desta ser militar ou n˜ao. No caso do ensino m´edio, deseja-se verificar se a origem do Col´egio Naval ´e fator de influˆencia e no ensino funda-mental se vir de col´egio militar ´e fator relevante para o desempenho acadˆemico.

3.3.2

Quantis

Dada uma popula¸c˜ao ou amostra, tem-se definida uma medida de localiza¸c˜ao deno-minada quantil de ordem τ como sendo o valor m que deixa 100τ % de observa¸c˜oes abaixo dele e as restantes 100(1-τ )% maiores ou iguais a m, com 0 < τ < 1.

Uma forma alternativa de defini¸c˜ao para o caso populacional ´e usando a distribui¸c˜ao de probabilidade acumulada. Seja X uma vari´avel aleat´oria, tem-se que:

F (x) = P (X ≤ x). (3.1)

Utilizando a fun¸c˜ao inversa da distribui¸c˜ao acumulada no ponto τ , tem-se:

F−1(τ ) = inf {x : F (x) ≥ τ }. (3.2)

A nota¸c˜ao de ´ınfimo acima refere-se ao menor valor inteiro de x para F (x) maior ou igual a τ .

Tomando esta defini¸c˜ao e aplicando-a para uma vari´avel aleat´oria X, pode-se exem-plificar alguns dos quantis mais usados. F−1(0.5) ´e a mediana (ou segundo quartil) de X, o ponto que divide a distribui¸c˜ao ao meio; F−1(0.25) ´e o primeiro quartil, deixando

(25)

3.3 Regress˜ao 24

25% das observa¸c˜os abaixo do ponto; F−1(0.75) ´e o terceiro quartil, deixando 75% das oberserva¸c˜oes abaixo. Os quartis dividem as observa¸c˜oes em 4 (quatro) partes iguais e apresentam como pontos de corte os j´a citados quantis de 25%, 50% e 75%.

Outra forma de definir o quantil de ordem τ que se faz importante para o entendimento do modelo de regress˜ao que se propˆos ´e adotar uma fun¸c˜ao perda dada por:

ρτ(u) = u(τ − I(u < 0)), 0 < τ < 1, (3.3)

em que I ´e a fun¸c˜ao indicadora que vale um quando satisfeita a condi¸c˜ao e zero caso contr´ario. Ou seja, uma forma an´aloga de escrever 3.3 ´e:

ρτ(u) =        uτ, se u > 0, u(τ − 1), se u < 0, 0, se u = 0. (3.4)

Um caso particular dessa generaliza¸c˜ao pode ser dado pelo interesse de encontrar o valor m que minimiza E|Y − m|. Esse valor ´e a mediana de Y , como provado em Hao Naiman (2007).

3.3.3

A Regress˜

ao Quant´ılica

Uma vez entendido o conceito de quantil, pode-se entrar na defini¸c˜ao de regress˜ao quant´ılica.

Primeiro, faz-se necess´ario explicar o motivo de optar-se por tal modelo ao inv´es do modelo linear cl´assico com estima¸c˜ao por MQO. Na citada, a regress˜ao se concentra na medida de tendˆencia central, sendo menos eficaz para tratar a heterocedasticidade. No modelo de regress˜ao quant´ılico esse problema ´e incorporado e minimizado uma vez que n˜ao necessita da suposi¸c˜ao b´asica de erros homoced´asticos e faz uma an´alise em toda distribui¸c˜ao condicional da vari´avel resposta nos seus quantis, assim sendo, um dado porventura discrepante de alguma vari´avel dependente n˜ao altera a regress˜ao como um todo, tornando-a mais informativa.

O trecho de Mosteller e Tukey (1977) citado e traduzido para portuguˆes por Santos (2012) faz uma compara¸c˜ao entre um modelo de regress˜ao e m´edia, onde ambos passam uma vis˜ao incompleta da distribui¸c˜ao. Um modelo de regress˜ao quant´ılica, por´em, con-segue ser completo pois n˜ao resume apenas uma curva de regress˜ao e sim diversas curvas

(26)

3.3 Regress˜ao 25

em cada percentil da distribui¸c˜ao.

A introdu¸c˜ao do conceito de regress˜ao quant´ılica na forma descrita aqui foi dada por Koenker e Bassett (1978) como uma generaliza¸c˜ao do modelo de regress˜ao de M´ınimos Desvios Absolutos (MDA), onde poderia ser estimada a mediana da distribui¸c˜ao de Y condicionada ao valor de suas covari´aveis.

Partindo da defini¸c˜ao de quantil dada anteriormente deve-se ampliar essa ideia para a constru¸c˜ao de um modelo de regress˜ao quant´ılica. Inicialmente elabora-se uma fun¸c˜ao condicional quant´ılica(FCQ), como descrito por Cavalcante (2014). Tomando um quantil τ , com 0 < τ < 1, uma vari´avel aleat´oria cont´ınua yi com fun¸c˜ao de distribui¸c˜ao FY e um

dado vetor xi pode-se definir o FCQ no quantil τ como:

Qτ = (Yi|xi) = FY−1(τ |xi). (3.5)

Assim sendo, o modelo de regress˜ao quant´ılica que o presente trabalho visa construir ´e um modelo com uma vari´avel dependente e dez vari´aveis regressoras. Pode-se escrever este na seguinte forma:

yi = β0(τ ) + βori(τ )orii+ βf und(τ )f undi+ βsexo(τ )sexoi+ βid(τ )idi+ βpai(τ )paii+

βmae(τ )maei+ βmil(τ )mili+ βrenda(τ )rendai+ βRJ(τ )RJi+ βsoldo(τ )soldoi(τ ) + ui,

(3.6) onde:

i: aspirante i;

τ : quantil do desempenho acadˆemico pertencente ao aspirante i; yi: m´edia final do aspirante i no quantil τ ;

orii: dummy para origem do aspirante i no quantil τ ;

f undi: dummies para tipo de escola que o aspirante i cursou ensino fundamental no

quantil τ ;

sexoi: dummy para sexo do aspirante i no quantil τ ;

idi: idade do aspirante i no quantil τ ;

paii: dummies para grau de instru¸c˜ao do pai do aspirante i no quantil τ ;

maei: dummies para grau de instru¸c˜ao da m˜ae do aspirante i no quantil τ ;

mili: dummy para possuir parente militar, aspirante i no quantil τ ;

rendai: dummies para renda familiar do aspirante i no quantil τ ;

(27)

3.3 Regress˜ao 26

τ ;

soldoi: dummies para contribuir com seu soldo pelo aspirante i no quantil τ ;

ui: termo de erro aleat´orio i no quantil τ ;

β’s: parˆametros.

O modelo acima citado pode, ainda, ser escrito na forma matricial. Tomando Y como um vetor de tamanho n × 1, onde n ´e a quantidade de indiv´ıduos do banco de dados (neste trabalho se trata da popula¸c˜ao de estudo), pode-se reescrever o modelo 3.6 como:

Y = Xβ(τ ) + u, (3.7)

onde X ´e a matriz n × p de observa¸c˜oes conhecidas, em que p representa a quantidade de vari´aveis, β(τ ) ´e um vetor p × 1 de parˆametros desconhecidos e u, o vetor (n × 1) de erros aleat´orios.

Sobre u, o termo de erro ´e importante citar as suposi¸c˜oes acerca deste:

1. A distribui¸c˜ao dos erros ´e dada por uma densidade cont´ınua fu, sua distribui¸c˜ao

acumulada Fu ´e estritamente positiva e est´a no intervalo (0,1) e Fu−1(τ ) = 0, o que

equivale a Fu(0) = τ , portanto, Z 0 −∞ fu(ui)dui = τ ; 2. lim n→∞ X0X

n = M , onde M ´e uma matriz positiva definida.

Uma distribui¸c˜ao que satisfaz perfeitamente a suposi¸c˜ao 1, como citado por Yu e Moyeed (2001), ´e a Distribui¸c˜ao Laplace Assim´etrica (DLA).

Seja Z ∼ DLA(µ, σ, τ ), logo Z apresenta a seguinte fun¸c˜ao densidade de probabili-dade: f (Z|µ, σ, τ ) = τ (1 − τ ) σ exp  −ρτ z − µ σ  , (3.8)

em que z assume qualquer valor real, µ ´e parˆametro de localiza¸c˜ao, σ > 0 ´e parˆametro de escala, 0 < τ < 1 e ρτ ´e definida como em 3.3.

Para Z com distribui¸c˜ao Laplace Assim´etrica, tem-se a seguinte fun¸c˜ao de verossimi-lhan¸ca: L(βτ, σ|z) = τn(1 − τ )n σn exp ( − n X i=1 ρτ  zi − x0iβτ σ ) . (3.9)

(28)

3.3 Regress˜ao 27

Tomando µ = x0iβ, σ como a variˆancia do termo de erro e o quantil τ pode-se verificar em Yu e Moyeed (2001) que ui ∼ DLA(µ, σi, τ ).

A estima¸c˜ao pontual dos parˆametros (µ,σ,τ ) da DLA pode ser calculada conforme citado por Yu e Zhang (2005).

Para erros independentes e identicamente distribu´ıdos (i.i.d), Koenker e Bassett (1978) conclu´ıram que: √ n ˆβ(τ ) − β(τ )→ N (0, V ),d (3.10) onde Vτ = τ (1 − τ ) f2 τ(0) (X0X)−1. (3.11)

Sendo as suposi¸c˜oes do modelo satisfeitas, tem-se em 3.10 que os estimadores dos parˆametros da regress˜ao quant´ılica seguem uma distribui¸c˜ao normal assint´otica. Em Koenker (2005) ´e poss´ıvel verificar que, sob outras suposi¸c˜oes, o estimador ´e n˜ao viesado e consistente.

Tendo clara a defini¸c˜ao de regress˜ao quant´ılica pode-se partir para o entendimento de como ´e o processo de estima¸c˜ao dos parˆametros, quais inferˆencias podem ser feitas e os m´etodos comumente usados na literatura e na pr´atica.

3.3.4

Estima¸

ao dos Parˆ

ametros

Nos modelos de regress˜ao linear m´ultipla utilizados frequentemente, conforme Mont-gomery, Peck e Vining (2012), o estimador de MQO de ˆβ ´e dado por:

ˆ

β = (X0X)−1X0Y, (3.12)

com X e Y definidos da mesma forma que em 3.7.

Para que tal estimador seja v´alido s˜ao necess´arias que algumas suposi¸c˜oes sejam se-guidas, entre elas, posto completo da matriz X e erros homoced´asticos. Ainda que haja heterocedasticidade o estimador acima continua apresentando forma especificada.

No modelo de regress˜ao quant´ılica o mesmo n˜ao ocorre. N˜ao h´a uma forma direta de calcular o estimador ˆβ(τ ), sendo assim n˜ao h´a uma distribui¸c˜ao conhecida para o estimador. Quando se trata de modelo de regress˜ao quant´ılica, n˜ao interessa apenas estimar a esperan¸ca condicional do Yi, o que se deseja estimar ´e um quantil associado a

(29)

3.3 Regress˜ao 28

probabilidade τ .

J´a sendo definida a distribui¸c˜ao do termo de erro, pode-se calcular o estimador de m´axima verossimilhan¸ca para o vetor β(τ ) e chegar ao estimador proposto por Koenker e Bassett (1978). Este objetiva a minimiza¸c˜ao da soma dos desvios absolutos. Tem-se portanto o seguinte estimador:

min β∈<p n X i=1 ρτ(yi− x0iβ). (3.13)

Consegue-se estimar 3.13 usando met´odos num´ericos ou algum algoritmo de mini-miza¸c˜ao que estime o vetor de parˆametros β.

Com o avan¸co da tecnologia, houve possibilidade da implementa¸c˜ao de t´ecnicas de programa¸c˜ao linear para diversas resolu¸c˜oes. Baseado nisso, Koenker (2005) reformulou o problema anterior transformando-o em programa¸c˜ao linear para que fosse utilizado nos mais diversos softwares estat´ısticos. Assim sendo, o problema de minimiza¸c˜ao em 3.13 se transformou em:

min

(β,µ,ν)∈<px<2n +

(τ 10nµ + (1 − τ )10nν|Xβ + µ − ν = Y ) (3.14)

sendo 10n vetor transposto de tamanho 1 × n contendo apenas n´umeros 1’s e µ e ν s˜ao vetores n × 1 possuindo os respectivos termos µi = (yi − ˆyi)I ((yi− ˆyi) > 0) e ν = (ˆyi−

yi)I ((yi− ˆyi) < 0), com I sendo a fun¸c˜ao indicadora usual e ˆyi = x0iβˆi.

Para mais detalhes, consultar Koenker (2005). O presente trabalho n˜ao visa o apro-fundamento da t´ecnica citada e sim o conhecimento do m´etodo que ser´a usado nas an´alises posteriores.

Para fazer inferˆencia param´etrica, por´em, o estimador de β por si s´o nada representa, ´e necess´ario saber quem s˜ao seus erros padr˜oes possibilitando assim fazer inferˆencias. Por isso o modelo param´etrico far´a suposi¸c˜ao de que o erro segue a distribui¸c˜ao Laplace Assim´etrica.

3.3.5

Intervalos de Confian¸

ca

A disserta¸c˜ao de Santos (2012) apresenta trˆes distintos m´etodos de c´alculo de interva-los de confian¸ca para modelo de regress˜ao quant´ılica. Aqui, optou-se por usar o m´etodo baseado em resultados assint´oticos, pela simplicidade, por ter estimativas precisas e por estar facilmente dispon´ıvel em softwares estat´ısticos. O citado m´etodo foi introduzido

(30)

3.3 Regress˜ao 29

por Koenker e Bassett (1978) como uma generaliza¸c˜ao do m´etodo usado anterioremente para modelos de regress˜ao L1, onde a regress˜ao ´e feita condicionada na mediana, ou seja,

sendo hoje um caso particular da regress˜ao quant´ılica. O teorema provado por Koenker e Basset para o vetor β de parˆametros consistia em solucionar a minimiza¸c˜ao dos erros absolutos ponderados, ou seja, solucionar 3.13.

Um importante teorema demonstrado por Koenker e Basset (1978) ap´os fazer trˆes suposi¸c˜oes resulta que √n( ˆβ(τ1) − β(τ1), ..., ˆβ(τm) − β(τm))

D

→ Nn×m(0, V (τ1, ..., τm)).

Para estimar V (τ ) (3.11) ´e necess´ario uma estimativa para 1/f (0). Seguindo o pro-posto por Kocherginsky, He e Mu (2005) tem-se:

ˆ F−1(τ + hn) − ˆF−1(τ − hn) 2hn , (3.15) onde lim n→∞hn= 0.

Portanto, tendo em vista o resultado do estimador para V (τ ), ´e poss´ıvel criar interva-los de confian¸ca para β(τ ). Diversos softwares estat´ısticos fazem as estimativas conforme descritas acima, inclusive o software R, ferramenta usada no presente estudo.

3.3.6

Teste de Hip´

otese Linear Geral

Ap´os estimar as variˆancias e convariˆancias referentes ao estimadores de cada parˆametro, pode-se realizar testes de hip´oteses para verificar a equivalˆencia de qualquer par de coe-ficientes.

Conforme expresso por Santos (2012) , uma forma geral para se testar tais hip´oteses lineares ´e:

H0 : Cς = c, (3.16)

onde a matriz C ´e formada por constantes conhecidas e apresenta posto cheio e c ´e um vetor de constantes tamb´em conhecidas.Nesta hip´otese, ς ´e um vetor composto de parˆametros a serem testados.

Caso o interesse seja verificar se βi(τa) = βi(τb), onde τa e τb s˜ao quantis quaisquer, a

hip´otese nula seria:

(31)

3.3 Regress˜ao 30

ou seja, C = (1 − 1) e c = 0. ς nesse caso se refere `a βi(τa) − βi(τb).

Para a hip´otese, H0 : βi(τa) = k1 e βi(τb) = k2 (k1 e k2 constantes previamente

definidas), C = (1 1)’, c = (k1k2)0 e ς representa o vetor transposto dos parˆametros

testados.

Segundo Hao e Naiman (2007), ap´os serem estimadas as variˆancias e covariˆancias necess´arias, pode efetuar o teste de Wald, formulado por Koenker (2005) onde a estat´ıstica de teste para os citados exemplos seriam, respectivamente,

W = ( ˆβi(τa) − ˆβi(τb)) 2 ˆ σβˆia)− ˆβib) (3.18) e W = ˆ βi(τa) ˆ βi(τb) !0 ˆ Σ−1 ˆ βi(τa) ˆ βi(τb) ! . (3.19)

Na primeira estat´ıstica de teste, ˆσβˆia)− ˆβi

b)refere-se `a V ar( ˆβi(τa) − ˆβi(τb)), enquanto

na segunda Σ ´e a matriz de variˆancia e covariˆancia dos parˆametros testados (no caso da estat´ıstica acima esta matriz ´e transposta).

Sob H0, a estat´ıstica W , segue uma distribui¸c˜ao χ2q, onde q diz respeito ao tamanho

do vetor ς, ou seja, ao posto da matriz C.

Santos (2012) cita estat´ısticas de outros autores como forma alternativa ao teste de Wald, por´em estas n˜ao ser˜ao usadas no presente trabalho, sendo os testes posteriormente realizados baseados na estat´ıstica acima explicitada.

3.3.7

Coeficientes de determina¸

ao

No modelo de regress˜ao linear cl´assico ´e comum usar como medida de ajuste de quali-dade a estat´ıstica R2, com R2 ∈ [0, 1]. Esta ´e interpretada como o percentual de

variabil-diade da vari´avel explicativa que ´e explicado pelos seus regressores no modelo. Portanto quanto mais pr´oximo de 100%, ou seja, quanto mais pr´oximo do valor 1, mais as vari´aveis independentes explicam o modelo, o que implica que quanto mais perto de zero, menos estas explicam. Tomando a soma dos quadrados totais como SQT =

n

X

i=1

(32)

3.3 Regress˜ao 31

soma dos quadrados dos res´ıduos como SQE =

n

X

i=1

(Yi− bY )2, tˆem-se que R2 como:

R2 = SQT − SQE

SQT . (3.20)

Esta estat´ıstica tem importantes propriedades. S˜ao estas:

1. R2´e estat´ıstica usada como medida de qualidade do ajuste pois est´a ligada ao ajuste do modelo;

2. R2 aumenta com a introdu¸c˜ao de outras vari´aveis explicativas quando estas n˜ao

apresentam coeficiente nulo (sendo necess´ario realiza¸c˜ao de testes de hip´otese nesse caso);

3. R2deve ser adimensional e n˜ao deve se alterar com mudan¸ca de posi¸c˜oes das vari´aveis explicativas ou com varia¸c˜ao na escala das mesmas;

4. 0 ≤ R2 ≤ 1, sendo 1 o ajuste perfeito e o zero o pior ajuste poss´ıvel ou a falta de

ajuste;

5. Aumentando-se a quantidade de parˆametros, aumenta tamb´em o R2; 6. R2 ´e uma medida robusta.

A estat´ıstica acima ´e baseada no crit´erio de m´ınimos quadrados. No modelo de re-gress˜ao quant´ılica, tem-se como estimador tamb´em uma minimiza¸c˜ao (3.13). Sendo assim, de forma an´aloga, pode-se desenvolver uma estat´ıstica R2 para o citado modelo. A

su-gest˜ao de medir a qualidade do ajuste comparando a soma das distˆancias ponderadas para este modelo surgiu em Koenker e Machado (1999).

Aqui, por´em, ser˜ao seguidos os passos da mesma forma discutida por Santos (2012). Em sua disserta¸c˜ao, Santos utiliza a nota¸c˜ao de modelos encaixados para definir uma forma geral da estat´ıstica a ser usada. Para um modelo linear com p vari´aveis explicativas, pode-se escrever tal modelo para o quantil condicional τ como:

Qτ(Yi|x) = x0i1β1(τ ) + x0i2β2(τ ). (3.21)

Em 3.21 tem-se uma parti¸c˜ao de duas partes da vari´avel preditora xi, sendo

(33)

3.4 Rela¸c˜ao e Correla¸c˜ao entre as Vari´aveis 32

deve ser particionado. Primeiro ser´a definido ˆβ(τ ) como o estimador da forma descrita em 3.13 e eβ(τ ) para o seguinte modelo:

Qτ(Yi|x) = x0i1β1(τ ), (3.22)

Tendo entendido o intuito inicial da parti¸c˜ao acima, segue-se fazendo duas importantes defini¸c˜oes que ser˜ao usadas por conseguinte, s˜ao estas:

ˆ V (τ ) = n X i=1 ρτ(yi− x0iβ(τ )),ˆ (3.23) e V (τ ) = n X i=1 ρτ(yi− x0i1β(τ )).e (3.24)

Por fim, pode-se tomar como coeficiente de determina¸c˜ao da regress˜ao quant´ılica a estat´ıstica R1 da seguinte forma

R1 = 1 − ˆ V (τ ) e V (τ ) (3.25) ´

E f´acil verificar que 3.25 est´a dentro do mesmo intervalo que R2. Sabendo que eβ(τ )

´e uma restri¸c˜ao de ˆβ(τ ), portanto ˆV (τ ) ≤ eV (τ ), logo R1 ∈ [0, 1], sendo assim segue o mesmo que o item 4. das propriedades do R2.

Assim como no caso anterior, quanto mais pr´oximo de 1 estiver o R1, melhor o ajuste do modelo, maior o percentual de explica¸c˜ao da vari´avel dependente pelas vari´aveis re-gressoras.

3.4

Rela¸

ao e Correla¸

ao entre as Vari´

aveis

3.4.1

Teste Para Igualdade de Medianas

Em diversos momentos h´a interesse em testar se as m´edias de determinados grupos s˜ao iguais. Os testes param´etricos para tal exigem determinadas condi¸c˜oes como homo-cedasticidade e normalidade dos grupos. Quando um dos pressupostos ´e rejeitado, uma alternativa ´e optar por testes n˜ao param´etricos e verificar se h´a diferen¸cas entre as me-dianas. A hip´otese nula deste teste ´e a igualdade de medianas e a alternativa ´e pelo menos um par de medianas diferentes. O artigo de McKight e Najab (2010) descreve mais detalhadamente este teste.

(34)

3.4 Rela¸c˜ao e Correla¸c˜ao entre as Vari´aveis 33

Quando a hip´otese nula ´e rejeitada, conclui-se que h´a algum par de medianas di-ferentes. Portanto, como complemento deste teste ´e necess´ario realizar outro teste que verifique onde est´a esta diferen¸ca. O teste de Dunn (DUNN, 1961) ´e ideal quando se deseja testar os pares de grupos e verificar onde est´a a diferen¸ca das medianas. Este teste faz compara¸c˜oes 2x2 e gera um p-valor para cada par. A hip´otese nula dele ´e que as medianas s˜ao diferentes no par que se est´a testando.

3.4.2

Teste Para Distribui¸

ao

Para testar a distribui¸c˜ao de determinado grupo de dados, seja as vari´aveis num´ericas ou os erros dos modelos, ser´a utilizado o Teste de Kolmogorov-Smirnov, onde:

(

H0 : Os dados seguem a distribui¸c˜ao F (x)

H1 : Os dados n˜ao seguem a distribui¸c˜ao F (x).

(3.26)

F (x) em 3.26 ´e a distribui¸c˜ao acumulada que se deseja testar. Por exemplo, para verificar normalidade dos dados pode-se realizar este teste tendo como hip´otese nula que os dados seguem uma distribui¸c˜ao Normal, n˜ao rejeit´a-la significa que pode-se dizer que tais dados s˜ao normais, como pode ser visto mais detalhadamente em ¨Oztuna, Elhan e T¨uccar (2006).

Outra distribui¸c˜ao a ser testada diz respeito `a distribui¸c˜ao dos erros, verificar se estes seguem uma distribui¸c˜ao Laplace Assim´etrica (PUIG; STEPHENS, 2000), onde as hip´oteses tamb´em s˜ao conforme 3.26.

3.4.3

Vari´

aveis Ordinais

Vari´aveis ordinais s˜ao aquelas em que as categorias podem ser ordenadas como grau de instru¸c˜ao e renda. Para verificar a correla¸c˜ao entre elas pode-se optar por calcular a estat´ıstica χ2 e realizar um teste de hip´otese. No citado caso, um teste apropriado ´e o

Teste de Fisher que tem as seguintes hip´oteses:

(

H0 : N˜ao h´a rela¸c˜ao entre as vari´aveis

H1 : H´a rela¸c˜ao entre as vari´aveis .

(3.27)

Quando o p-valor deste teste encontra-se abaixo do n´ıvel de significˆancia rejeita-se H0,

(35)

3.4 Rela¸c˜ao e Correla¸c˜ao entre as Vari´aveis 34

podem ser vistos em Agresti (2002).

Outra forma de verificar a rela¸c˜ao entre as vari´aveis ´e calculando o V de Cramer. Este valor ´e uma medida de correla¸c˜ao que varia de 0 `a 1. Quanto mais pr´oximo de 1, maior a rela¸c˜ao.

3.4.4

Correla¸

ao Vari´

aveis Dicotˆ

omicas

Muitos coeficientes de correla¸c˜ao s˜ao derivados a partir do coeficiente linear de Pear-son. Um destes resulta na correla¸c˜ao de Phi. Esta ´e indicada para dados dicotˆomicos, onde h´a apenas duas alternativas de respostas e n˜ao h´a ordem entre estas. Por exemplo, vari´aveis como sexo, morar no RJ, ter parente Militar etc.

O coeficiente de Phi varia de -1 `a 1, sendo o valor 0, correla¸c˜ao nula entre as vari´aveis. Quanto mais pr´oximo as extremidades -1 e 1, maior a correla¸c˜ao. Mais detalhes acerca desta metodologia podem ser vistos em Lira e Neto (2006).

(36)

35

4

An´

alise dos Resultados

4.1

Perfil dos Aspirantes

As caracter´ısticas dos Aspirantes foram separadas entre individuais e familiares e foram verificadas as frequˆencias absolutas e relativas nos grupos de alunos provenientes do Col´egio Naval e do CPAEN. Nas caracter´ısticas individuais, como pode-se observar na Tabela 2, est˜ao informa¸c˜oes como tipo de escola que cursou o ensino fundamental, sexo do aluno, Estado de origem e se o soldo contribui nas despesas familiares. Nesta tabela, nota-se que n˜ao houveram dados faltantes em nenhuma das vari´aveis, n˜ao h´a mulheres vindas do Col´egio Naval, o que torna a maior parte dos alunos sendo do sexo masculino. Observa-se que 61,5% dos Aspirantes contribuem com as despesas familiares e que 82,6% s˜ao provenientes do Estado do Rio de Janeiro.

Tabela 2: N´umero de Aspirantes segundo as caracter´ısticas individuais - 2016

Vari´aveis Categorias Total (%) Ensino M´edio

CN (%) CPAEN (%)

Fundamental em Col´egio Militar?

Sim 39 (15,8) 32 (15,2) 7 (18,9) N˜ao 208 (84,2) 178 (84,8) 30 (81,1) Total 247 (100,0) 210 (100,0) 37 (100,0) Sexo Feminino 11 (4,5) 0 (0,0) 11 (29,7) Masculino 236 (95,5) 210 (100,0) 26 (70,3) Total 247 (100,0) 210 (100,0) 37 (100,0) Estado de Origem Rio de Janeiro 204 (82,6) 177 (84,3) 27 (73,0) Outros 43 (17,4) 33 (15,7) 10 (27,0) Total 247 (100,0) 210 (100,0) 37 (100,0) Soldo contribui nas despesas de casa? N˜ao 95 (38,5) 89 (42,4) 6 (16,2) Sim 152 (61,5) 121 (57,6) 31 (83,8) Total 247 (100,0) 210 (100,0) 37 (100,0)

Fonte: Elaborac¸˜ao pr´opria a partir dos dados coletados pelo SOEP.

Na tabela 3 encontram-se as frequˆencias nos mesmos moldes da tabela anterior refe-rente `as caracter´ısticas familiares. Nestas est˜ao o grau de instru¸c˜ao do pai e da m˜ae, a renda familiar informada e a informa¸c˜ao dada pelo aluno se tem ou n˜ao parente militar.

(37)

4.2 O Rendimento Acadˆemico 36

Neste grupo de vari´aveis nota-se que alguns alunos desconhecem o grau de instru¸c˜ao dos pais, o que fez a frequˆencia total das respostas diminuir para 242 e 246 sobre pai e m˜ae, respectivamente.

Tabela 3: N´umero de Aspirantes segundo as caracter´ısticas familiares - 2016

Vari´aveis Categorias Total (%) Ensino M´edio

CN (%) CPAEN (%) Grau de Instru¸c˜ao do pai At´e Ensino Fundamental 40 (16,5) 32 (15,6) 8 (21,6) M´edio Completo 89 (36,8) 75 (36,6) 14 (37,8) Superior Incompleto 18 (7,4) 14 (6,8) 4 (10,8) Superior Completo 68 (28,1) 62 (30,2) 6 (16,2) P´os Gradua¸c˜ao 27 (11,2) 22 (10,7) 5 (13,5) Total 242 (100,0) 205 (100,0) 37 (100,0) Grau de Instru¸c˜ao da m˜ae At´e Ensino Fundamental 39 (15,9) 29 (13,9) 10 (27,0) M´edio Completo 65 (26,4) 59 (28,2) 6 (16,2) Superior Incompleto 23 (9,3) 22 (10,5) 1 (2,7) Superior Completo 82 (33,3) 67 (32,1) 15 (40,5) P´os Gradua¸c˜ao 37 (15,0) 32 (15,3) 5 (13,5) Total 246 (100,0) 209 (100,0) 37 (100,0) Renda familiar (em sal´arios m´ınimos) At´e 7 156 (63,2) 130 (61,9) 26 (70,3) De 8 `a 10 50 (20,2) 45 (21,4) 5 (13,5) Acima de 10 41 (16,6) 35 (16,7)) 6 (16,2) Total 247 (100,0) 210 (100,0) 37 (100,0) Tem algum parente militar? N˜ao 122 (49,4) 106 (50,5) 16 (43,2) Sim 125 (50,6) 104 (49,5) 21 (56,8) Total 247 (100,0) 210 (100,0) 37 (100,0)

Fonte: Elaborac¸˜ao pr´opria a partir dos dados coletados pelo SOEP.

4.2

O Rendimento Acadˆ

emico

A vari´avel m´edia final refere-se a m´edia aritm´etica simples das notas dos Centros (CCS, CTC e CPN) al´em das disciplinas te´oricas relacionadas a forma¸c˜ao militar naval. A m´edia final ´e usada para o C´alculo da antiguidade dos futuros oficiais juntamente com Conceito, notas nas disciplinas f´ısicas, entre outras.

(38)

4.2 O Rendimento Acadˆemico 37

A m´edia dos Centros se constitui da seguinte forma:

1. CCS: m´edia das disciplinas Portuguˆes I, Inglˆes I e Hist´oria do Pensamento Humano; 2. CTC: m´edia das disciplinas C´alculo I, F´ısica I, Desenho e Fundamentos da

Tecno-logia da Informa¸c˜ao;

3. CPN: Navega¸c˜ao I e Fundamentos Navais.

A Tabela 4, apresenta algumas medidas resumo, como m´edia, mediana, desvio padr˜ao e alguns percentis acerca da m´edia final e m´edia em cada Centro.

Nota-se que o Centro com menor m´edia, maior desvio e que apresentou a menor nota foi o CTC, onde se encontram as notas da ´area de exatas. O contr´ario ocorre no CCS, este Centro apresenta menor desvio padr˜ao e maior m´edia.

Tabela 4: Medidas resumo da m´edias por Centro e m´edia final M´edia Final M´edia CCS M´edia CTC M´edia CPN

Min´ımo 4,42 5,50 2,09 4,00 P25 6,56 7,07 6,01 6,68 P33 6,80 7,24 6,19 6,86 P50 7,20 7,50 6,75 7,20 P66 7,50 7,80 7,25 7,55 P75 7,67 7,95 7,56 7,78 M´aximo 8,87 9,33 9,32 9,45 M´edia 7,14 7,49 6,72 7,17 Desvio Padr˜ao 0,80 0,69 1,16 0,95

A vari´avel m´edia final refere-se a m´edia aritm´etica de todas as disciplinas te´oricas que os alunos tem no 1o ano. Nela est˜ao inclusas todas as disciplinas dos trˆes Centros al´em

de uma disciplina ministrada por oficiais do Comando do Corpo de Aspirantes (LMN). Para melhor visualiza¸c˜ao da distribui¸c˜ao da m´edia final, foi constru´ıdo o gr´afico pre-sente da Figura 1. Nesta, encontra-se o histograma da distribui¸c˜ao das notas m´edias dos alunos. A linha vermelha refere-se a curva de uma distribui¸c˜ao Normal com m´edia e desvio padr˜ao iguais ao da vari´avel m´edia final. Em verde claro est´a a curva de distribui¸c˜ao da m´edia final. Nota-se no gr´afico que h´a uma boa aproxima¸c˜ao da curva dos dados `a curva da distribui¸c˜ao Normal. Parece haver um ind´ıcio forte de normalidade nesta vari´avel. O

(39)

4.2 O Rendimento Acadˆemico 38

Figura 1: Histograma da M´edia Final, curva de densidade da m´edia final e curva normal

teste de Kolmogorov-Smirnov foi utilizado e corroborou o ind´ıcio gr´afico resultado na n˜ao rejei¸c˜ao da hip´otese de normalidade ao n´ıvel de significˆancia de 10%.Ou seja, a m´edia final dos Aspirantes segue uma distribui¸c˜ao Normal.

A Figura 2 mostra os boxplots para as m´edias de cada Centro. Este gr´afico facilita a visualiza¸c˜ao, por exemplo, nota-se facilmente que CTC tem mediana abaixo dos outros centros. Uma vantagem deste gr´afico ´e a visualiza¸c˜ao dos outliers (dados discrepantes). O CTC ´e o Centro com maior quantidade de outliers, a maioria com notas baixas. O Centro com as mat´erias de exatas n˜ao apresentou notas altas que fossem consideradas discrepantes.

Ap´os an´alise gr´afica, ´e importante verificar a normalidade para os Centros, por meio do teste de Kolmogorov-Smirnov. Neste, os trˆes se mostraram normais da mesma forma que a m´edia final. Ap´os isso verificou-se por meio de outro teste de hip´otese que as variˆancias dos Centros eram diferentes. Sendo assim, o pressuposto de homocedasticidade foi rejeitado, portanto descartou-se a op¸c˜ao de realizar teste param´etrico para igualdade de m´edias. Ent˜ao , foi necess´ario realizar o teste n˜ao param´etrico de Kruskal-Wallis. Conforme a Tabela 5, a hip´otese nula deste teste foi rejeitada, portanto pode-se dizer que as medianas s˜ao diferentes. Este teste por si s´o n˜ao aponta onde encontra-se a diferen¸ca.

(40)

4.2 O Rendimento Acadˆemico 39

Figura 2: Boxplot da m´edia dos Centros

´

E aconselh´avel fazer um teste de compara¸c˜oes m´ultiplas para ver onde est´a a mediana diferente. O teste Dunn foi escolhido para essa finalidade. Este teste realiza compara¸c˜oes 2x2. Os resultados desse teste (estat´ıstica de teste e p-valor) encontram-se, tamb´em, na Tabela 5. Sendo o p-valor nos trˆes casos abaixo de 10%, conclui-se que os trˆes pares de vari´aveis testadas rejeitaram a hip´otese nula. Portanto as m´edias dos trˆes Centros apresentam medianas diferentes, logo, faz sentido estimar o modelo para os trˆes Centros separadamente.

Tabela 5: Testes Para Mediana Teste Dunn Teste de Kruskal-Wallis CCS CTC CTC 8, 058 <0,0001∗ χ22 = 64,984 CPN 3, 843 <0,0001∗ −4, 216 <0,0001∗ p-valor = <0,0001

(*) Vari´aveis significativas ao n´ıvel de significˆancia de 10%.

(41)

4.2 O Rendimento Acadˆemico 40

e da m´edia final em cada categoria das vari´aveis qualitativas.

Tabela 6: Medidas resumo do desempenho dos Aspirantes, segundo as caracter´ısticas individuais e familiares - 2016

Vari´aveis Categorias M´edia Final

M´edia Mediana Desvio Padr˜ao

Sexo Feminino 7,42 7,54 0,56 Masculino 7,13 7,16 0,81 Idade 18 e 19 anos 7,35 7,40 0,77 20 `a 24 anos 6,90 6,91 0,76 Origem CN 7,11 7,13 0,82 CPAEN 7,31 7,50 0,63 Rio de Janeiro N˜ao 7,53 7,62 0,75 Sim 7,06 7,11 0,79 Parente Militar N˜ao 7,13 7,19 0,83 Sim 7,15 7,22 0,78 Grau de Instru¸c˜ao do pai At´e Fundamental 7,01 6,99 0,69 M´edio Completo 7,11 7,15 0,70 Superior Incompleto 7,09 7,16 0,86 Superior Completo 7,09 7,19 0,90 P´os-Gradua¸c˜ao 7,53 7,68 0,83 Grau de Instru¸c˜ao da m˜ae At´e Fundamental 7,02 7,11 0,74 M´edio Completo 6,88 6,94 0,82 Superior Incompleto 6,87 6,78 0,73 Superior Completo 7,34 7,43 0,70 P´os-Gradua¸c˜ao 7,47 7,40 0,87 Renda (em sal´arios

m´ınimos) At´e 7 7,11 7,12 0,80 De 8 a 10 7,09 7,14 0,83 Acima de 10 7,33 7,23 0,77 Soldo contribui nas despesas da casa? N˜ao 7,18 7,22 0,88 Sim 7,12 7,14 0,75 Fundamental Militar? N˜ao 7,12 7,17 0,78 Sim 7,24 7,21 0,88

(42)

4.2 O Rendimento Acadˆemico 41 Tabela 6: Medidas resumo do desempenho dos Aspirantes, segundo as caracter´ısticas individuais e familiares - 2016 (continua¸c˜ao)

Vari´aveis Categorias M´edia CCS

M´edia Mediana Desvio Padr˜ao

Sexo Feminino 7,98 7,83 0,64 Masculino 7,47 7,50 0,69 Idade 18 e 19 anos 7,64 7,67 0,66 20 `a 24 anos 7,31 7,32 0,69 Origem CN 7,46 7,48 0,69 CPAEN 7,66 7,73 0,69 Rio de Janeiro N˜ao 7,77 7,73 0,64 Sim 7,43 7,47 0,69 Parente Militar N˜ao 7,45 7,52 0,70 Sim 7,53 7,50 0,68 Grau de Instru¸c˜ao do pai At´e Fundamental 7,38 7,37 0,60 M´edio Completo 7,42 7,43 0,70 Superior Incompleto 7,60 7,70 0,73 Superior Completo 7,51 7,62 0,75 P´os-Gradua¸c˜ao 7,72 7,83 0,60 Grau de Instru¸c˜ao da m˜ae At´e Fundamental 7,40 7,43 0,77 M´edio Completo 7,25 7,33 0,65 Superior Incompleto 7,59 7,67 0,52 Superior Completo 7,62 7,70 0,68 P´os-Gradua¸c˜ao 7,66 7,77 0,71 Renda (em sal´arios

m´ınimos) At´e 7 7,47 7,48 0,70 De 8 a 10 7,46 7,50 0,76 Acima de 10 7,60 7,63 0,56 Soldo contribui nas despesas da casa? N˜ao 7,57 7,63 0,76 Sim 7,44 7,47 0,65 Fundamental Militar? N˜ao 7,43 7,47 0,68 Sim 7,80 7,80 0,70

(43)

4.2 O Rendimento Acadˆemico 42 Tabela 6: Medidas resumo do desempenho dos Aspirantes, segundo as caracter´ısticas individuais e familiares - 2016 (continua¸c˜ao)

Vari´aveis Categorias M´edia CTC

M´edia Mediana Desvio Padr˜ao

Sexo Feminino 7,12 7,03 0,77 Masculino 6,70 6,72 1,17 Idade 18 e 19 anos 6,98 7,02 1,12 20 `a 24 anos 6,42 6,34 1,13 Origem CN 6,64 6,66 1,20 CPAEN 7,21 7,16 0,73 Rio de Janeiro N˜ao 7,23 7,30 1,09 Sim 6,61 6,67 1,14 Parente Militar N˜ao 6,73 6,73 1,17 Sim 6,72 6,80 1,15 Grau de Instru¸c˜ao do pai At´e fundamental 6,56 6,38 1,11 M´edio Completo 6,71 6,81 1,02 Superior Incompleto 6,71 6,82 1,17 Superior Completo 6,61 6,70 1,31 P´os-Gradua¸c˜ao 7,21 7,50 1,16 Grau de Instru¸c˜ao da m˜ae At´e fundamental 6,59 6,58 1,07 M´edio Completo 6,44 6,40 1,27 Superior Incompleto 6,13 6,15 0,95 Superior Completo 6,95 7,05 1,04 P´os-Gradua¸c˜ao 7,23 7,30 1,16 Renda (em sal´arios

m´ınimos) At´e 7 6,70 6,73 1,15 De 8 a 10 6,64 6,63 1,18 Acima de 10 6,91 6,93 1,16 Soldo contribui nas despesas da casa? N˜ao 6,63 6,67 1,28 Sim 6,78 6,83 1,07 Fundamental Militar? N˜ao 6,73 6,77 1,13 Sim 6,66 6,62 1,29

(44)

4.2 O Rendimento Acadˆemico 43 Tabela 6: Medidas resumo do desempenho dos Aspirantes, segundo as caracter´ısticas individuais e familiares - 2016 (continua¸c˜ao)

Vari´aveis Categorias M´edia CPN

M´edia Mediana Desvio Padr˜ao

Sexo Feminino 6,93 7,05 0,72 Masculino 7,18 7,25 0,96 Idade 18 e 19 anos 7,40 7,35 0,91 20 `a 24 anos 6,91 7,00 0,94 Origem CN 7,21 7,25 0,96 CPAEN 6,95 7,00 0,88 Rio de Janeiro N˜ao 7,50 7,50 1,02 Sim 7,10 7,15 0,93 Parente Militar N˜ao 7,19 7,20 0,99 Sim 7,16 7,25 0,92 Grau de Instru¸c˜ao do pai At´e fundamental 7,03 7,20 0,85 M´edio Completo 7,17 7,15 0,90 Superior Incompleto 6,86 6,97 1,03 Superior Completo 7,12 7,10 0,00 P´os-Gradua¸c˜ao 7,64 7,65 0,92 Grau de Instru¸c˜ao da m˜ae At´e fundamental 6,99 7,10 0,78 M´edio Completo 6,89 6,95 0,98 Superior Incompleto 6,87 6,90 1,07 Superior Completo 7,45 7,40 0,85 P´os-Gradua¸c˜ao 7,45 7,60 1,01 Renda (em sal´arios

m´ınimos) At´e 7 7,10 7,15 0,96 De 8 a 10 7,13 7,25 0,89 Acima de 10 7,48 7,40 0,96 Soldo contribui nas despesas da casa? N˜ao 7,34 7,30 0,96 Sim 7,07 7,10 0,94 Fundamental Militar? N˜ao 7,15 7,22 0,94 Sim 7,28 7,15 1,05

Referências

Documentos relacionados

Em decorrência dos referidos acordos de colaboração, foram tomados 19(dezenove) termos de colaboração de MÔNICA MOURA, 10(dez) de JOÃO SANTANA e 04(quatro) termos

- Público-alvo: 1º, 2º, 3º Ciclo e Ensino secundário - Duração média: 90 minutos. -

Um estudo comparou os efeitos da Melatonina (5 mg) com os do benzodiazepínico temazepam (10 mg) sobre a desempenho cognitiva. Enquanto o temazepam causou uma indução ao

Promover oficinas para confecção de bonecos gigantes e restauro dos já existentes, proporcionando ao cidadão a aprendizagem da técnica de papietagem, modelagem

A Sizmek MDX Analytics é projetada para fornecer acesso fácil aos dados de campanha, necessários para o monitoramento, otimização e análise de métricas para ajudar os

rela c~ ao causal entre duas vari aveis quando concebeu. que uma vari avel mudou devido  a a c~ ao

Consiste em entrevistar pai, mãe ou responsável para extrair o máximo de informações possíveis sobre o sujeito, realizando uma posterior Análise e levantamento do

TRAYENTA DUO é indicado como adjuvante da dieta e do exercício, para melhorar o controle glicêmico em pacientes com diabetes mellitus tipo 2 (DM2), em que a dose máxima tolerada