• Nenhum resultado encontrado

3 MÉTODO

3.6 TRATAMENTO DE DADOS

O tratamento de dados é uma etapa fundamental, permitindo verificar a acurácia ou precisão dos dados, de modo a atender aos pressupostos de várias técnicas estatísticas, especialmente as multivariadas (HAIR et al., 2009). Para o tratamento dos dados, os 4.226

questionários coletados foram exportados do LimeSurvey® para o Excel® e, posteriormente, SPSS® versão 23, para as primeiras explorações de dados brutos, conforme Tabela 1.

Tabela 1. Procedimentos prévios à análise dos dados

Detecção Técnica ou Procedimento Resultado

Dados brutos - 4.226 sujeitos

Missing values Análise respostas (1.524)

Viés de discriminação axiológica Recomendação ESS (53) Outliers Z-Scores e D2 de Mahalanobis -

Teste das suposições N.A. -

Total de exclusões - (1.577)

Dados líquidos 2.649 sujeitos

Fonte: Autora

3.6.1 Missing values

Um missing value, ou caso omisso, é uma ausência de resposta e pode decorrer de vários fatores, como saturação de informações a serem processadas pelo respondente, inadequação da formulação do questionário, incapacidade do participante opinar sobre a asserção (PILATI; PORTO, 2001). Para Hair et al. (2009), a preocupação primária e desafiadora do pesquisador deve ser a identificação de padrões e relações entre os missing values, a fim de manter a distribuição original de valores quando qualquer ação corretiva pensar em ser aplicada. O autor recomenda que dados perdidos abaixo de 10% para um caso ou observação individual podem geralmente ser ignorados, exceto quando os casos acontecem de maneira não aleatória. Neste estudo foram identificados 1.524 missing values e a análise dos casos mostrou uma concentração de omissões no IST Bancários, atingindo praticamente 100% dos casos, sem dispersão randômica. Tabachnick e Fidell (2000) afirmam que o padrão de distribuição dos valores é mais importante do que o número de casos omissos detectados na amostra pesquisada. Desse modo, resolveu-se descartar todos os 1.524 sujeitos, pois não houve nenhum nível de aleatoriedade no processo de perda de dados, MAR ou MCAR (HAIR et al., 2009), impossibilitando qualquer o uso seguro de ações corretivas. Devido ao tamanho da amostra, considerou-se somente o conjunto de sujeitos com todas as respostas válidas, para facilitar o processo de preparação do banco de dados.

Analisando o padrão de distribuição dos missing values, deduz-se que tenha havido um cansaço por parte dos respondentes. De certo modo, esse comportamento reflete as percepções do pré-teste quanto à extensão do questionário global, guardando coerência com a previsão de os respondentes cansarem-se diante do número elevado de questões, isto é, 40 assertivas do IRVP e 69 assertivas do IST Bancários. No caso do IST Bancários, tendo em

vista a ativação de duas estruturas cognitivas diferentes para atribuir os dois escores de cada assertiva [um valorativo e um descritivo], considera-se, para o escopo desta avaliação de missing values, a duplicação da quantidade de questões nesse instrumento, o que totaliza 178 assertivas a serem avaliadas pelos sujeitos [69 itens valorativos, 69 itens descritivos e 40 itens do IRVP], fora o tempo de preenchimento prévio do bloco demográfico-funcional. A concentração das omissões predominantemente no IST é um indicativo desse cansaço dos respondentes, pois, como o IRVP precedeu o IST na ordem disposta no LimeSurvey®, acredita-se que tenha havido uma desmotivação à continuidade.

3.6.2 Viés de discriminação das prioridades axiológicas

A segunda etapa no tratamento dos dados seguiu as recomendações da European Social Survey Edunet (ESS, 2013, cap. 4), que consistem na exclusão de respondentes que em com baixa variabilidade de respostas, devendo-se adotar o critério de descarte o percentual aproximado de 77% das assertivas iguais [16 a cada 21], nos casos em que se mensura a percepção de valores pessoais com o uso do PVQ. Pressupõe-se que os sujeitos não tenham tentado discriminar os valores de forma séria e, por isso, é provável que as respostas não reflitam suas reais prioridades axiológicas.

A recomendação do ESS tem-se aplicado aos estudos com IRVP, uma vez que ele foi construído a partir do PQV-40. Nesta pesquisa, tal aspecto foi considerado, usando-se um limite de descarte de 31 questões com o mesmo escore para tal instrumento. Porto (2005) orienta que a recomendação do ESS também se estenda à mensuração de valores institucionais e organizacionais. Sendo assim, os atributos valorativos, que são valores do trabalho (BORGES, 1997) mensurados no IST Bancários poderiam ser examinados. Porém, optou-se por seguir os procedimentos recomendados por Borges, Alves-Filho e Tamayo (2008) e Borges e Barros (2015), que consistem em descartar sujeitos com mais de 10 respostas em branco [o que já havia sido feito na exclusão dos missing values] e com 100% dos itens com o mesmo escore, o que foi feito nesta etapa, a título de viés de discriminação para o IST Bancários. Foram excluídos 53 sujeitos nesta etapa.

3.6.3 Outliers univariados e multivariados

Os outliers são valores anômalos ou discrepantes com relação aos apresentados no restante da amostra (HAIR et al., 2009). De acordo com Hawkins (1980, p. 15), trata-se de “uma observação que se desvia tanto das outras observações, que levanta suspeitas de que

foram geradas por um mecanismo diferenciado”. Com relação ao tratamento dos casos que se enquadrem nessas características, Barnett e Lewis (1994) alertam para o perigo de se adotar uma abordagem simplista, sob o risco de descarte inapropriado, uma vez que a amostra pode apresentar meros casos marginais, que, não necessariamente são outliers. Segundo os autores, à parte dos erros grosseiros, especialmente quando há campos livres para preenchimento, os casos marginais devem ser avaliados por meio de gráficos ou outros testes específicos, como a análise de regressão. Para a detecção dos outliers neste estudo, foram realizadas técnicas univariadas e multivariadas, visualizando-se, também, distribuição dos dados nos gráficos plot. Quando identificadas discrepâncias nesses gráficos, era observado se os valores discrepantes daquele sujeito se apresentavam, simultaneamente, nas detecções uni e multivariadas. Em caso positivo, o sujeito era descartado. Para tanto, a identificação dos casos univariados foi realizada por meio da padronização das variáveis pela técnica Z-Scores. Para avaliar a questão do descarte, considerou-se a recomendação de Hawkins (1980) quanto ao fato de que em amostras superiores a 1.000 sujeitos, os outliers univariados têm importância diminuta. Dessa forma, partiu-se para a detecção multivariada, realizando-a por meio do cálculo da distância de Mahalanobis, definida por Tabachnick e Fidell (2000) como o afastamento de cada observação com relação à centroide, sendo esta um ponto criado pela intersecção de todas as variáveis consideradas. Assim, os potenciais outliers multivariados seriam resultado de uma combinação anômala de escores de dois ou mais indicadores (TABACHNICK; FIDELL, 2000). Nesse cálculo, foram consideram-se todas as variáveis que poderão ser relacionadas, o que nesta pesquisa incluiu a centralidade [medida pela importância do trabalho de 1 a 7], realização de valores pessoais no ambiente organizacional, atributos valorativos e atributos descritivos, resultando 223 casos, com medida D2 de Mahalanobis estatisticamente significante [menor que 0,001 no teste de significância, conforme recomenda Hair et al. (2009)].

Tendo em vista o cuidado que se deve ter com a exclusão de casos discrepantes (BARNETT; LEWIS, 1994), optou-se por calcular as médias dos bancos de dados com e sem a exclusão de outliers [BIDO, e-mail pessoal com essa recomendação], notando-se diferenças mínimas, levando à decisão de mantê-los. Dessa forma, o banco de dados definitivo constitui- se de 2.649 casos válidos.

3.6.4 Testes das suposições da análise multivariada

As etapas anteriores tentaram depurar o banco de dados para um formato mais adequado à análise multivariada. O último passo no exame de dados, de acordo com as recomendações de Hair et al. (2009), envolveu o teste das suposições inerentes às bases estatísticas da análise multivariada. Os autores consideram que o teste das suposições tem a ver com a fundamentação sobre a qual as técnicas fazem inferências estatísticas e obtêm resultados. Contudo, algumas técnicas são mais robustas, ou seja, menos afetadas pela violação de certas suposições. Os testes de suposição recomendados são normalidade, homoscedasticidade e linearidade. Neste estudo, tais testes não foram realizados pelos motivos que seguem. Quanto à normalidade, apesar de os gráficos plot terem sido observados na etapa anterior, uma análise mais completa não foi realizada. Segundo Hair et al. (2009), ainda que seja importante compreender a normalidade, o pesquisador deve considerar os efeitos do tamanho da amostra. Em amostras pequenas de 50 ou menos observações, desvios da normalidade têm um impacto significante, enquanto amostras com 200 ou mais observações podem ter seus efeitos negligenciados, o que é o caso deste estudo [N=2.649]. Adicionalmente, considerou-se o teorema central do limite, segundo o qual, à medida que tamanhos de amostras se tornam grandes, o pesquisador pode ficar menos preocupado com variáveis não normais, assumindo a normalidade da amostra, pois uma amostra elevada implica a tendência da média das médias amostrais de se igualar ao valor da média da população (DANCEY; REIDY, 2006; MARÔCO, 2007). Segundo Hair et al (2009), a exceção ao teorema seria o caso em que as variáveis pudessem conduzir a outras violações que tenham impacto na homoscedasticidade, por exemplo (HAIR et al., 2009), o que também não se aplica a este estudo. De qualquer forma, na avaliação dos outliers, foram avaliados os gráficos Q-Q plots, os quais evidenciaram a distribuição normal. No que diz respeito à homoscedasticidade e linearidade, também não foram realizados testes porque este estudo não envolve dependência entre variáveis latentes [que demanda esses dois testes de suposição] nem correlações, regressão múltipla, análise fatorial ou equações estruturais [técnicas que demandam o teste de linearidade] (HAIR et al., 2009). Sendo assim, o banco de dados continuou com 2.649 casos válidos, conforme apuração da etapa anterior a esta.