Análise dos dados - F ASE 2: PESQUISA DE CAMPO

4.2 F ASE 2: PESQUISA DE CAMPO

4.2.4 Análise dos dados

Após a coleta de dados, estes, então, foram tratados e preparados para a análise. O detalhamento de cada método é apresentado nas subseções a seguir.

4.2.4.1 Tratamento dos dados

Antes do início das análises, foi realizada uma análise e tratamento dos dados, consistindo em algumas etapas:

a) Inspeção visual dos dados, a qual visou buscar dados faltantes, a ininteligibilidade de dados em campos abertos e erros do próprio software.

b) Estruturação e padronização dos nomes das IES, já que este foi o único campo não estruturado na segunda versão do instrumento.

c) Inserção de novos dados, dependentes das informações para categorização em classe econômica da ABEP (2021), da escola, da IES e do curso escolhidos pelo entrevistado, tais como: classe econômica, renda familiar, renda per capita, categoria administrativa da escola e da IES, grau e grande área de conhecimento do curso.

d) Análise e tratamento de outliers, os quais se utilizaram da distância e probabilidade de Mahalanobis em todas as 54 (cinquenta e quatro) variáveis. Conforme Malhotra (2001), considerou-se como um outlier, a amostra que obtivesse uma probabilidade de Mahalanobis abaixo de 0,001.

e) Testes psicométricos iniciais: consistência interna inicial da segunda versão do instrumento AI-EIES-EM, pelo Alfa de Cronbach:

Quando o número de respondentes chegou 270 (duzentos) entrevistados, o qual se atingiu com as quatro primeiras escolas que, efetivamente, permitiram a aplicação da pesquisa, foi realizado um teste de consistência interna do instrumento, visando a verificar sua confiabilidade geral.

Esta amostra corresponde à quantidade de questões sobre os fatores influenciados na escolha de IES (54 questões), multiplicada por, no mínimo, cinco respondentes, conforme orientações propostas por Hair Jr. et al. (2014) para a mensuração da consistência interna da escala, por meio do Alfa de Cronbach.

O coeficiente Alfa de Cronbach varia de 0 a 1, sendo 1 considerado um valor de total consistência interna da escala mensurada. Desta forma, foi adotado um valor mínimo de 0,81,

considerado pelos autores como bom, já que outras análises que exigem uma confiabilidade interna mais apurada foram utilizadas neste estudo, vistas mais adiante.

Após a coleta da amostra pré-teste, o Alfa de Cronbach resultou em 0,958, valor classificado como excelente por George e Mallery (2003), demonstrando que, pelo menos, inicialmente, o instrumento de pesquisa possuía consistência interna, o que permitiu a continuidade da pesquisa. Um detalhamento desta análise pode ser conferido na seção 5.2.1.2.

f) Testes psicométricos iniciais: teste de normalidade:

Para análise da normalidade dos dados, foram realizados os testes de Kolmogorov-Smirnov e Shapiro-Wilk em toda a amostra (744 respondentes) e em todas as 54 (cinquenta e quatro variáveis). Foram considerados, conforme Malhotra (2001), valores de significância, em ambos os testes, iguais ou menores que 0,05.

Os testes de normalidade foram conduzidos para se proporcionar mais transparência nas conduções dos testes, já que eram esperados dados sem distribuição normal, os quais são comuns em pesquisas sociais (PINO, 2014; HAIR JR. et al., 2014; BIDO, 2019; BIDO; SILVA, 2019).

4.2.4.2 Caracterizar os principais construtos influenciadores na escolha de IES

Para investigar e, potencialmente, reduzir as variáveis relativas às influências na escolha de IES, foi conduzida, inicialmente, uma análise de componentes principais exploratória (ACPE).

Diferentemente da análise fatorial exploratória (AFE), que é considerada um modelo reflexivo, a ACP é mais adequada a um modelo formativo, ou seja, as variáveis irão compor, de forma somativa, um determinado fator (MALHOTRA, 2001). Por conseguinte, a ACP apresenta a importância relativa de cada um dos componentes, quando considerada sua variância em comparação com as variâncias das variáveis que a compõe.

Assim, para este estudo, optou-se por uma ACPE, pois, as variáveis representativas dos fatores influenciadores poderiam estar ocultando um fator (componente) latente. Desta forma, pretendeu-se não apenas reduzir as variáveis em uma quantidade menor de dimensões, mas, também, revelar fatores influenciadores mais gerais, os quais foram utilizados para auxiliar no desenvolvimento dos demais objetivos específicos e do objetivo geral do estudo.

Ademais, como proposto por Bido e Silva (2019), como eram esperados dados sem distribuição normal, a condução de uma ACP é mais adequada nestes casos, pois trabalham com a variância total, ao invés de covariância, como em análises fatoriais stricto sensu.

Primeiramente, conforme orientações de Malhotra (2001), deve-se falsear a hipótese de que exista uma matriz identidade entre as variáveis, ou seja, só existe correlação apenas de uma variável com ela mesma e não existindo correlação com outras variáveis, o que invalidaria uma ACP.

Para tal, num primeiro momento, utilizou-se a prova de medida de adequacidade de Kaiser-Meyer-Olkin (KMO). Este teste verifica a adequação amostral para cada variável, a partir da mensuração da adequação amostral para cada variável no modelo e para o modelo completo.

A medida varia de zero a um, sendo que, quanto mais próximo de um, mais se afasta da hipótese de que exista uma matriz identidade, ideal para a continuidade da ACP. Malhotra (2001) aponta diversas faixas do teste de KMO que variam de 0 a 0,49 para um conjunto de dados inaceitável, perpassando por 0,7 a 0,79, como mediano, e 0,8 a 0,89, definido como meritório e, findando com 0,9 a 1, como totalmente adequado. Tratando-se de um estudo social, optou-se, como adequado, por um valor igual ou maior que 0,8, podendo ser reavaliadas e, em última instância, excluídas variáveis para se atingir esta faixa.

Conjuntamente ao teste de KMO, foi realizado e analisado o teste de esfericidade de Bartlett, o qual mede se a matriz de correlação entre as variáveis é uma matriz identidade ou não. A intenção é falsear a hipótese de identidade na matriz de correlação. Para tal, a indicação de Malhotra é de que sua medida de significância (p) seja igual ou menor que 0,05.

Após o falseamento do teste de matriz identidade, devem ser verificadas as comunalidades de cada variável, as quais demonstram, conforme explicam Hair Jr. et al. (2014), a quantidade total de variância que cada uma compartilha com todas as outras. Os autores sugerem, como aceitáveis, valores acima de 0,5, o qual foi adotado por este estudo.

Em seguida, são analisados o autovalor e as cargas fatoriais de cada variável dentro do construto encontrado. O autovalor consiste em demonstrar o quanto de variância e o número de variáveis que cada construto (componente) representa. Conforme Hair Jr. et al. (2014), é adequado o número de construtos que se obtenha, pelo menos, a explicação de uma variável (autovalor = 1), com variância acima de 0,6.

Após se definirem o número de construtos, verificam-se as cargas fatoriais de cada variável dentro de cada construto e fora dele. De acordo com Hair Jr. et al. (2014), são aceitas cargas fatoriais iguais ou acima de 0,5 dentro de um construto e abaixo de 0,5 fora dele. Estes foram os valores definidos para este estudo.

Por fim, após definidos os construtos e suas respectivas variáveis, foram analisadas o teor de cada variável dentro de seus construtos para se definir suas nomenclaturas e suas descrições, com auxílio da literatura.

4.2.4.3 Analisar a validade convergente e discriminante dos construtos do instrumento proposto

Após a definição dos construtos e variáveis da segunda versão o instrumento AI-EIES-EM, foram empreendidas análises para validações convergente e discriminante e de confiabilidade dos construtos e do instrumento como um todo.

Para as duas validações, optou-se por uma análise de modelagem estrutural, especificamente, sobre o modelo de mensuração, já que não há modelo completo explicativo-preditivo a ser verificado.

Segundo Bido, Silva e Ringle (2014), um modelo estrutural é constituído de um modelo de mensuração, denominado outer model (modelo externo), composto de variáveis observadas (VOs), as quais compõem seus construtos, denominados variáveis latentes (VLs); e de um modelo estrutural, denominado inner model (modelo interno), em que VLs buscam explicar uma variável dependente.

Para Bido e Silva (2019), a utilização de uma modelagem estrutural que se utilize variância total e seja baseada em análise de componentes principais (ACP), pode auxiliar na mitigação do problema da não normalidade de dados, como é o caso deste estudo. Desta forma, optou-se por uma modelagem baseada nos mínimos quadrados parciais (PLS – partial least square), utilizando-se do software SmartPLS, versão 4.

Bido, Silva e Ringle (2014) propõem um roteiro de procedimentos para utilização da modelagem estrutural a partir do SmartPLS (cf. seção 3.2). Como não há variável independente a ser explicada, propõem-se conectar todas as variáveis latentes a cada uma das demais. Este método já foi utilizado em outros estudos (SILVA et al., 2022; PITTA, 2021; BIDO, 2019).

Um esquema do modelo adotado pode ser visualizado na Figura 8 –.

Desta forma, para o modelo de mensuração, Bido, Silva e Ringle (2014) indicam, inicialmente, a condução de uma análise de componentes principais confirmatória (ACPC), a qual consiste em verificar as cargas fatoriais das variáveis (VLs), agora distribuídas, deliberadamente, em seus respectivos construtos (VOs). Os autores (idem, 2014) propõem, novamente, os testes de KMO e de esfericidade de Bartlett, com valores aceitáveis maiores que 0,9 e menores que 0,05, respectivamente; e cargas fatoriais, agora, com valores iguais ou superiores a 0,7. Estes valores foram adotados para esta fase do estudo.

Para a validação convergente, Bido, Silva e Ringle (2014) propõem a análise das variâncias médias extraídas (AVE – average variance extracted) das variáveis que compõem cada construto (variável latente), proposto por Fornell e Larcker (1981). Os valores aceitos devem ficar acima de 0,5, o qual foi adotado neste estudo.

Figura 8 – Roteiro para validação do modelo de mensuração deste estudo

Fonte: adaptado de Bido, Silva e Ringle (2014) e de Fernandes et al. (2017).

Em seguida, foi realizada uma análise de confiabilidade dos construtos e do instrumento de pesquisa. Para tal, Bido, Silva e Ringle (2014) propõem, para os construtos, a análise da Confiabilidade composta (CC), a qual se define como mais adequada a modelos estruturais do que o Alfa de Cronbach (AC).

Os valores aceitos devem ser superiores a 0,7, conforme os autores. Contudo, para este estudo foram analisados tanto o CC, quanto o AC, sendo este último aceitos valores acima de 0,7 (MALHOTRA, 2001). Para o instrumento de pesquisa como um todo, foi analisado o AC, já que a CC é calculada apenas para construtos dentro de um modelo estrutural, também com valor aceito acima de 0,7.

Por fim, para a realização da validação discriminante, diferentemente da análise de cargas cruzadas (cross loadings) proposta por Bido, Silva e Ringle (2014), conforme eficiência maior demonstrada por Henseler, Ringle e Sarstedt (2015), foi utilizado o método Heterotrait-Monotrait (HTMT), o qual consiste em obter a razão entre a média das correlações entre as variáveis observadas (VOs) de uma variável latente (VL) e a média das correlações das VOs de outra VL com a qual se está analisando.

Para Henseler, Ringle e Sarstedt (2015), são considerados valores conservadores aqueles abaixo de 0,85 e aceitos até 0,9, desde que tenham forte explicação na literatura para a manutenção do construto. Para este estudo, adotou-se valores iguais ou abaixo de 0,85.

4.2.4.4 Analisar a robustez do modelo de mensuração do instrumento proposto

Conforme apontado por Pino (2014), Hair Jr. et al. (2014), Bido (2019) e Bido e Silva (2019), uma das formas de se mitigar o problema da não distribuição normal dos dados e, ao mesmo tempo, realizar uma análise de componentes confirmatória (ACPC) se faz com a repetição dos testes de validação convergente e discriminante e de confiabilidade comparando-os acomparando-os testes obtidcomparando-os por meio da técnica de reamcomparando-ostragem (bootstraping).

Desta forma, para a análise da robustez do instrumento AI-EIES-EM, foi conduzida a realização de reamostragem com 10.000 subamostras, adotando-se o intervalo de confiança para todos os testes conduzidos, anteriormente, de 95%. Assim, foram comparados, por meio de Teste-t de Student, os resultados originais com os resultados médios das reamostragens das cargas fatoriais (CF), das variâncias médias extraídas (AVE), dos Alfas de Cronbachs (AC) e das Confiabilidades compostas (CC) e das razões Heterotrait-Monotrait (HTMT).

Conforme proposto por Bido, Silva e Ringle (2014), Bido (2019) e Bido e Silva (2019), são aceitos valores de t de Student acima de 1,96 ou valores de significância abaixo de 0,05.

Estes foram os valores adotados para este estudo.

No documento ELABORAÇÃO E VALIDAÇÃO DE UM INSTRUMENTO DE AVALIAÇÃO DAS INFLUÊNCIAS NA ESCOLHA DE INSTITUIÇÕES DE ENSINO SUPERIOR NA PERSPECTIVA DE ALUNOS DO ÚLTIMO ANO DO ENSINO MÉDIO (páginas 81-86)