PROCEDIMENTO DE ANÁLISES MULTIVARIADAS DE DADOS

RESUL TADOS

5.12 PROCEDIMENTO DE ANÁLISES MULTIVARIADAS DE DADOS

As análises multivariadas de dados foram realizadas por intermédio do programa estatístico SPSS, versão 15.0.

Inicialmente, foi verificado o pressuposto de normalidade para cada variável métrica, por meio da análise do histograma com a curva normal e pelos valores de assimetria e curtose. As distribuições dos dados da variável critério e das antecedentes apresentaram assimetria negativa, exceto as variáveis tempo de banco e experiência na

função apresentaram assimetria positiva. Optou-se por não transformar as variáveis que

não atenderam aos critérios de normalidade e sim verificar as condições de normalidade dos resíduos das regressões, utilizando assim, as variáveis originais.

Com o intuito de diagnosticar problemas de multicolinearidade e singularidade, foi observado que os valores de tolerância não se aproximavam de zero e todos os valores VIF foram menores que cinco, sugerindo a ausência de colinearidade entre as variáveis antecedentes das cinco regressões múltiplas. Conforme indicado por Hair et al.

(2005), ao examinar as cinco Tabelas de diagnóstico de colinearidade das cinco regressões, não foi identificada proporção de variância maior que 0,90, o que também indica ausência de colinearidade nas cinco regressões.

Após a realização das regressões, foram analisados os pressupostos inerentes às regressões múltiplas por meio de inspeção visual dos gráficos dos resíduos (Y) versus valores preditos (X) e segundo os testes de normalidade de Kolmogorov-Smirnov e Shapiro-Wilk, apenas os resíduos da regressão múltipla cuja VD foi o Impacto Geral (em profundidade) apresentou distribuição normal. Quanto à homoscedasticidade, o teste de Levene indicou que havia heterocedasticidade em todas regressões múltiplas.

No Estudo 5, para testar as correlações entre resultados financeiros foram realizadas regressões múltiplas hierárquicas, a fim de identificar o poder preditivo das variáveis de impacto no treinamento e contexto (nível 2, conforme conjunto de variáveis testados nos modelos do Estudo 4), após controlar o efeito da variável Volume de Crédito da Região (CREDRG), que ficou no nível 1, sobre os resultados financeiros em nível mais abrangente, uma vez que os resultados não financeiros foram inseridos no nível hierárquico 3.

Considerando que os pressupostos não foram totalmente atendidos, foram realizadas regressões logísticas, uma vez que tal técnica possui maior robustez estatística em relação aos pressupostos. Sendo assim, foram realizadas regressões logísticas, utilizando-se as VDs anteriores de forma categorizada, ou seja, os primeiro e segundo quartis receberam a menção 0 (egressos que perceberam menor impacto ou carteiras de crédito PJ que obtiveram resultados menores) e os terceiro e quarto quartis receberam a menção 1 (egressos que perceberam maior impacto ou carteiras de crédito PJ que obtiveram resultados maiores) mantendo-se as mesmas variáveis independentes utilizadas nas regressões múltiplas.

Segundo Hair et al. (2005), diversos critérios podem ser empregados para orientar a entrada das variáveis independentes no modelo base de Regressão Logística: maior coeficiente de Wald, maior probabilidade condicional ou maior redução do valor de menos duas vezes o logaritmo da verossimilhança (-2LL). Neste procedimento foi utilizado o critério de redução do valor de -2LL, também denominado de procedimento de estimação dos coeficientes da regressão pela Máxima Verossimilhança, que tem o objetivo de descobrir a melhor combinação linear de preditores para maximizar a probabilidade de obtenção das frequências de resultados observadas. A estimação de Máxima Verossimilhança é um procedimento iterativo que começa com valores

arbitrários dos coeficientes da equação de Regressão Logística e determina a direção e o tamanho da mudança nos coeficientes com as entradas das variáveis preditoras na equação.

Segundo Miles e Shevlin (2001), a Regressão Logística é estimada de maneira análoga à Regressão Múltipla, uma vez que um modelo base é primeiramente estimado para fornecer um padrão para comparação. Na Regressão Múltipla, a média é usada no estabelecimento de um modelo base para calcular a soma total de quadrados, e, na Regressão Logística, a média é usada no modelo estimado para estabelecer o valor do logaritmo de verossimilhança. Nesta pesquisa, para quantificar a proporção de variação explicada no modelo de investigação, de maneira semelhante ao R2 do Modelo de Regressão Linear, utilizou-se o teste de Nagelkerke.

Outra estatística importante para análise do Modelo de Regressão Logística é o índice de Hosmer e Lemeshow. Hair (2005) afirma que esse índice mede se existe diferença estatisticamente significativa entre as classificações observadas e previstas para os grupos (nessa pesquisa, maior/menor impacto ou resultado obtido). Trata-se de uma medida do ajuste final do modelo, que mede a correspondência entre os valores observados e estimados pela Regressão Logística para a variável dependente.

Devido à característica exploratória dessa pesquisa, para analisar a contribuição das 13 variáveis independentes do modelo de investigação, utilizou-se o nível de significância (p) das variáveis no modelo segundo o teste de Wald. Segundo Kanso (2004), a estatística Wald é utilizada em Regressão Logística para verificar a significância das variáveis independentes no Modelo de Regressão Logística. Sua interpretação é semelhante aos valores F ou t usados para o teste dos coeficientes de Regressão Linear.

6 RESULTADOS

Nesta seção, serão apresentados os resultados dos estudos do método proposto no item anterior, quais sejam: Resultados do Estudo 1 – Modelo Lógico da Oficina; Resultados do Estudo 2 – Validação das Escalas; Resultados do Estudo 3 – Impactos da Oficina no Trabalho do Egresso; Resultados do Estudo 4 – Resultados Não Financeiros; e Resultados do Estudo 5 – Resultados Financeiros.

No documento Avaliação de treinamentos nos níveis de impacto no trabalho e resultados organizacionais (páginas 118-121)