• Nenhum resultado encontrado

Na fase inicial de tratamento e análise de dados foi possível verificar a existência em ge- ral de uma correlação moderada negativa de DTC, e positiva de NFC, com as variáveis de input associadas ao desempenho académico do primeiro ou dos dois primeiros anos. Esta correlação revelou-se mais significativa para as variáveis das áreas científicas de Matemática e Química, o que pode eventualmente ser explicado pela forte componente destas duas áreas científicas, em particular a de Matemática, no curso em estudo. Em

4.2 Principais Resultados 107

geral, os alunos com um melhor desempenho nas componentes de Matemática e Quí- mica, ou seja, valores mais elevados das respectivas variáveis, apresentam um melhor desempenho global, isto é, valores mais elevados de NFC e mais baixos de DTC.

No estudo da correlação entre as variáveis, verificou-se também a existência de uma correlação moderada negativa entre DTC e NFC, isto é, uma maior probabilidade de valo- res mais baixo de NFC estarem associados a valores mais elevados de DTC, e vice-versa. A verificação desta característica deu origem a um cenário alternativo ao Cenário 3, o Ce- nário 4, onde se considerou uma variável de input adicional, a variável DTC (real).

No estudo da correlação entre a variável AING e as variáveis de output, na expec- tativa da existência de uma eventual tendência de mudança do desempenho académico global dos alunos ao longo do período dos vinte anos da amostra, constatou-se a exis- tência de uma clara variação NFC. Ao longo dos vinte anos de ingresso verificou-se um aumento da frequência das classificações mais baixas em detrimento de uma diminuição da frequência das classificações mais altas. A verificação desta tendência poderá even- tualmente indicar uma menor preparação dos alunos mais recentes em comparação aos mais antigos. Esta característica contribuiu para a procura de melhores resultados nos modelos alternativos ao Cenário 1, Cenário 2 e Cenário 3, com a inclusão da variável AING como input, especialmente motivante para o Cenário 3A na previsão de NFC, para o qual a correlação e tendência se verificaram mais evidentes.

A informação recolhida e analisada proveniente das variáveis de input e output servi- ram de base para a construção dos cenários de previsão de DTC e NFC. Foram testados sete cenários diferente, quatro para prever a variável DTC e três para a variável NFC.

Na previsão de DTC, os melhores resultados foram os obtidos com base no desempe- nho académico dos dois primeiros anos frequentados (Cenário 2). Este cenário permitiu prever correctamente DTC em cerca de 45% a 57% dos casos, o que comparado com os resultados anteriormente conseguidos na abordagem utilizada por Nunes com recurso a técnicas de simulação traduz-se num aumento de precisão de 40%. Comparando ainda as duas abordagens, se considerarmos aceitável a previsão de DTC com um erro abso- luto máximo de um ano, este cenário produz entre 92% e 97% de previsões “aceitáveis”, no conjunto das 297 observações de DTC, o que representa um aumento aproximado de 30% face aos resultados de Nunes [Nunes, 2007].

No entanto, considerando que é relevante prever com a maior antecedência possível, e se, consequentemente, pretendermos utilizar apenas o desempenho académico do pri- meiro ano frequentado (Cenário 1), os resultados continuam a ser bastante satisfatórios.

O Cenário 1 comparado com o Cenário 2 apresenta apenas uma perda na precisão de aproximadamente 6% nas previsões correctas, e 3% nas previsões “aceitáveis”, isto é, nas previsões com um erro absoluto máximo de um ano. Note-se que ainda assim, em comparação aos resultados obtidos para a técnica de simulação de Nunes, os resultados continuam a ser bastante superiores, com um aumento de precisão nas previsões correc- tas de aproximadamente 34% e nas previsões “aceitáveis” de aproximadamente 27%.

Para NFC o melhor cenário foi o Cenário 3, com uma percentagem de previsões cor- rectas entre 40% e 48% e de previsões incorrectas com erro igual a uma unidade entre 45% e 47%. Considerando previsões de NFC com uma margem de erro máxima de uma unidade obtém-se uma percentagem de previsões “aceitáveis” entre 87% e 95%. Novamente comparando abordagens, RNA e a simulação por Nunes [Nunes, 2007], veri- ficamos que o uso de RNA traduziu-se num acréscimo de previsões correctas de 13% e de previsões “aceitáveis”, com uma margem de erro máxima de uma unidade, de 17%, o que continua a ser bastante satisfatório.

Verificou-se ainda, que, de uma forma geral, os melhores resultados obtidos foram para RNA’s com estruturas mais simples, isto é, com um menor número de neurónios na camada escondida e na camada de input, ou seja, com apenas quatro variáveis de input. Podemos eventualmente explicar este facto pelo aumento do número de parâmetros a ajustar em consequência do aumento de neurónios, da camada de input ou na camada escondida, face à “reduzida” dimensão da amostra.

Conclui-se também que, de forma geral, a frequência de previsões correctas, em rela- ção às previsões incorrectas, condicionada pela classe de DTC ou NFC, é mais elevada para as classes de maior frequência absoluta de DTC ou NFC, respectivamente, em par- ticular para a classe modal. Comparados os Cenário 1 e 2, verificou-se que o aumento da precisão no Cenário 2 foi mais significativo para as classes de DTC de menor frequência, em particular classe de DTC igual cinco e oito (maior ou igual a oito), onde a percentagem de previsões correctas aumentou de 8% para 17%, ou seja, quase que duplicou, e de 0% para 20%, respectivamente.

O facto de se ter verificado uma diminuição na capacidade preditiva da rede com o aumento de variáveis e de, em geral, se verificar uma maior frequência de previsões correctas nas classes de maior frequência absoluta, leva-nos a esperar com alguma ex- pectativa e entusiasmo, uma melhoria relevante nos resultados num eventual contexto de ampliação da amostra.