4.2 Correlações e análise discriminante
4.2.2 Análise discriminante
Conforme descrito no delineamento metodológico da pesquisa, após as análises de correlação entre as variáveis componentes do estudo, propõe-se a utilização da análise discriminante para a elicitação de funções que possam classificar as predileções dos alunos em relação às áreas do conhecimento da Administração em duas categorias: alta e baixa predileção.
Para tanto, tomou-se por base os resultados das correlações entre as próprias predileções, de modo a evidenciar aquelas áreas de conhecimento que poderiam contribuir (complementar) para uma melhor discriminação dentre as predileções. Assim, para a definição das funções discriminantes de uma área, foram utilizadas apenas as contribuições daquelas áreas que apresentaram correlações positivas e própria predileção com a área. Por exemplo, para a área de produção considerou-se na construção da função discriminante o seu próprio valor de predileção e as predileções com as áreas de materiais, logística, finanças e SI.
Todas as sete áreas de conhecimento foram submetidas ao mesmo procedimento para determinação de funções discriminantes considerando a estruturação previamente explanada, procedimento este preconizado por autores como Lattin et al. (2011), Fávero et al. (2009) e Hair et al. (2009). Dentre as sete áreas de conhecimento do estudo, apenas a área de finanças não apresentou valores condizentes às premissas da análise discriminante (sig > 0,05 ao testar a hipótese de igualdade entre as matrizes de covariância da população) e, assim, não foi possível identificar uma função discriminante para a mesma. Os resultados inerentes às demais áreas e suas respectivas funções serão apresentados a seguir.
Para a efetiva construção das funções discriminantes, inicialmente as variáveis de predileção foram reinterpretadas, agora de maneira categórica. Para cada observação do estudo, aqueles valores de predileção que se sobressaíssem frente aos demais seriam considerados como “alta predileção”. Assim, os valores de predileção que estivessem acima da média de predileção para aquela área do conhecimento receberiam o valor 1 (um) para sua respectiva variável categórica. O valor 0 (zero) seria atribuído para o caso contrário.
De posse destas variáveis categóricas (utilizadas como variáveis de agrupamento), foi possível realizar a análise discriminante segundo Fávero et al. (2009), tomando como base as variáveis de predileção que apresentaram correlações positivas
entre si e já mencionadas no tópico anterior. As etapas iniciais associadas aos pressupostos da análise discriminante como a diferença de médias entre os grupos e matrizes de covariância são ilustradas nas tabelas a seguir.
As tabelas 14 a 19 apresentam os resultados do teste de igualdade de médias entre as variáveis de predileção na construção de suas respectivas funções discriminantes. A tabela 20, por sua vez, sumariza os resultados dos testes de hipótese para igualdade da matriz de covariância para o processo de discriminação em cada uma das predileções.
Tabela 41 - Teste de igualdade de médias dos grupos para a predileção com a área de produção
Fonte: Elaboração própria, 2016
Tabela 42 - Teste de igualdade de médias dos grupos para a predileção com a área de materiais
Fonte: Elaboração própria, 2016
Tabela 43 - Teste de igualdade de médias dos grupos para a predileção com a área de logística
Fonte: Elaboração própria, 2016
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Produção 0,344 584,464 1 306 0,000 Predileção com a área de
Materiais 0,709 125,560 1 306 0,000 Predileção com a área de
Finanças 0,937 20,455 1 306 0,000 Predileção com a área de
Logística 0,841 57,797 1 306 0,000 Predileção com a área de
Sistemas de Informação 0,982 5,564 1 306 0,019
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Produção 0,698 132,246 1 306 0,000 Predileção com a área de
Materiais 0,303 704,943 1 306 0,000 Predileção com a área de
Finanças 0,987 3,907 1 306 0,049 Predileção com a área de
Logística 0,756 98,820 1 306 0,000 Predileção com a área de
Sistemas de Informação 0,982 5,502 1 306 0,020
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Produção 0,835 60,426 1 306 0,000 Predileção com a área de
Materiais 0,750 102,239 1 306 0,000 Predileção com a área de
Finanças 0,994 1,959 1 306 0,163 Predileção com a área de
Logística 0,335 606,564 1 306 0,000 Predileção com a área de
Tabela 44 - Teste de igualdade de médias dos grupos para a predileção com a área de marketing
Fonte: Elaboração própria, 2016
Tabela 45 - Teste de igualdade de médias dos grupos para a predileção com a área de RH
Fonte: Elaboração própria, 2016
Tabela 46 - Teste de igualdade de médias dos grupos para a predileção com a área de SI
Fonte: Elaboração própria, 2016
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Marketing 0,357 551,817 1 306 0,000 Predileção com a área de
RH 0,982 5,493 1 306 0,020
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Marketing 0,985 4,688 1 306 0,031 Predileção com a área de
RH 0,340 594,415 1 306 0,000
Lambda
de Wilks F df1 df2 Sig. Predileção com a área de
Produção 0,981 5,797 1 306 0,017 Predileção com a área de
Materiais 0,975 7,997 1 306 0,005 Predileção com a área de
Finanças 0,989 3,467 1 306 0,064 Predileção com a área de
Logística 0,970 9,579 1 306 0,002 Predileção com a área de
Tabela 47 - Resultado dos testes de hipótese para igualdade das matrizes de covariância
Fonte: Elaboração própria, 2016
Percebe-se a partir das tabelas 16, 19 e 20 que a predileção com a área de finanças por vezes não apresenta resultados adequados aos testes inerentes aos pressupostos. Assim, conforme comentado previamente, não foi possível definir uma função discriminante para a sua predileção; contudo, a área foi considerada na função discriminante daquelas áreas que apresentaram correlação positiva com a mesma.
Como forma de demonstrar a adequação das funções discriminantes geradas, apresenta-se a tabela 21 a seguir que traz os autovalores de cada uma das funções discriminantes, seus percentuais de variância explicada e as respectivas correlações canônicas. De acordo com Fávero et al. (2009, p. 417), em se tratando de um estudo com apenas dois grupos a serem discriminados, a correlação canônica assume função semelhante ao coeficiente de determinação R² da regressão múltipla.
Desta feita, tem-se para o presente estudo um grupo de funções discriminantes com forte potencial de explicação. A título de exemplo, tome-se a função discriminante relacionada à área de produção. Esta função tem 100% da sua variância explicada e apresenta um poder de explicação de 81,2%. Seguindo a observação da tabela 21, tem-se na função de marketing o menor valor encontrado (80,2%) e na função associada à área de sistemas de informação, o maior valor (84,7%).
Tabela 48 - Autovalores, variância explicada e correlações canônicas
Fonte: Elaboração própria, 2016
Por fim, apresentam-se os coeficientes das funções discriminantes que tem por objetivo a “separação” das observações nos grupos de alta e baixa predileção para cada uma das áreas de conhecimento do curso de Administração estudadas. Ou seja,
Approx. df1 df2 Sig. Produção 77,906 5,102 15,000 357961,021 0,000 Materiais 57,792 2,694 21,000 330021,251 0,000 Finanças 21,011 1,376 15,000 332020,288 0,149 Logística 45,665 2,988 15,000 284112,406 0,000 Marketing 107,987 35,729 3,000 4894759,803 0,000 RH 107,343 35,525 3,000 262471360,129 0,000 SI 28,048 1,837 15,000 332020,288 0,025 Predileção Box's M F
Resultado do teste de hipóteses
Predileção Autovalor % da variância explicada Correlação Canônica Produção 1,938 100,0 0,812 Materiais 2,341 100,0 0,837 Logística 2,015 100,0 0,817 Marketing 1,806 100,0 0,802 RH 1,951 100,0 0,813 SI 2,529 100,0 0,847
para a verificação da categoria de predileção em relação a uma dada área deve-se utilizar tais coeficientes e aquela equação que levar ao maior valor indicará qual a categoria de predileção daquela observação. As tabelas 22 a 27 apresentam os coeficientes das funções de alta e baixa predileção das áreas de conhecimento.
Tabela 49 - Coeficientes para as funções discriminantes da área de produção
Fonte: Elaboração própria, 2016
Tabela 50 - Coeficientes para as funções discriminantes da área de materiais
Fonte: Elaboração própria, 2016 Baixa predileção pela área de PRODUÇÃO Alta predileção pela área de PRODUÇÃO Predileção com a área de
Produção -2,441 2,088
Predileção com a área de
Materiais -0,079 0,068
Predileção com a área de
Finanças -0,151 0,129
Predileção com a área de
Logística -0,068 0,058
Predileção com a área de
Sistemas de Informação -0,002 0,001 (Constante) -1,900 -1,442 Baixa predileção pela área de MATERIAIS Alta predileção pela área de MATERIAIS Predileção com a área de
Produção -0,143 0,124
Predileção com a área de
Materiais -2,994 2,595
Predileção com a área de
Finanças 0,115 -0,100
Predileção com a área de
Logística 0,092 -0,079
Predileção com a área de
Sistemas de Informação 0,127 -0,110
Tabela 51 - Coeficientes para as funções discriminantes da área de logística
Fonte: Elaboração própria, 2016
Tabela 52 - Coeficientes para as funções discriminantes da área de marketing
Fonte: Elaboração própria, 2016
Tabela 53 - Coeficientes para as funções discriminantes da área de RH
Fonte: Elaboração própria, 2016 Baixa predileção pela área de LOGÍSTICA Alta predileção pela área de LOGÍSTICA Predileção com a área de
Produção -0,225 0,154
Predileção com a área de
Materiais 0,090 -0,061
Predileção com a área de
Finanças 0,145 -0,099
Predileção com a área de
Logística -2,946 2,012
Predileção com a área de
Sistemas de Informação 0,075 -0,051 (Constante) -2,367 -1,204 Baixa predileção pela área de MARKETING Alta predileção pela área de MARKETING Predileção com a área de
Marketing -2,704 1,872
Predileção com a área de RH 0,066 -0,046
(Constante) -2,190 -1,147
Baixa predileção pela área de RH
Alta predileção pela área de RH Predileção com a área de
Marketing 0,103 -0,086
Predileção com a área de RH -2,634 2,195
Tabela 54 - Coeficientes para as funções discriminantes da área de SI
Fonte: Elaboração própria, 2016
Assim sendo, para verificar o grau de predileção (se alto ou baixo) de um aluno em relação à área de Sistemas de Informação, por exemplo, deve-se considerar os valores de predileção de cada uma das áreas que apresentam correlação com SI. Soma- se, então, o valor da constante aos produtos obtidos entre os coeficientes de predileção de cada área e os scores atribuídos pelo respondente. A função que apresentar o maior valor dentre as duas caracterizará o grau de predileção do aluno.