• Nenhum resultado encontrado

IV DELIMITAÇÃO DO PROBLEMA E OBJETIVOS DA PESQUISA Neste breve capítulo serão sumariadas as conclusões advindas da revisão de

6.1 Preparação do banco de dados

Após o download do banco de dados de respostas completas do sítio hospedeiro da pesquisa, foi realizada uma série de análises exploratórias e descritivas, visando sua inspeção e identificação de eventuais ajustes necessários. O foco neste primeiro momento foi a identificação de dados omissos e extremos, bem como a verificação das curvas de distribuição das variáveis.

O banco de dados era inicialmente composto de 878 sujeitos identificados pelo número, data e hora do acesso ao formulário eletrônico da pesquisa. Embora este banco devesse conter apenas respostas completas, de acordo com a empresa hospedeira, verificou-se a presença de dados incompletos. Portanto, foram excluídos onze casos que continham apenas a identificação da sessão, sete casos que abandonaram a pesquisa após o preenchimento da primeira página do formulário eletrônico e sete casos que responderam todas as partes da pesquisa sem, no entanto, atingir o mínimo estipulado de 90% de resposta aos setenta itens das duas medidas. Com a adoção desses critérios foram excluídos ao todo 25 casos, sendo que os remanescentes possuíam respostas para ao menos 56 dos 63 itens de estratégias para criar no trabalho (88%), e seis dos sete itens de auto-eficácia para criar no trabalho (85%).

Após a exclusão supracitada, houve a inspeção dos dados omissos por variável investigada. Nos setenta itens das medidas foi pequena a presença de dados omissos, havendo menos de 1,3% por variável. Para os itens sócio-demográficos, a presença de dados omissos foi discretamente maior, mas não ultrapassou 2,7% por variável, à exceção de duas questões. O item em que se indagava sobre a atuação na área de formação obteve 3,28% de respostas em branco, mas dada sua relevância para as análises posteriores, foi mantido. Já a última questão da pesquisa, sobre o número de subordinados, não foi respondida por 9,73% dos participantes sendo, portanto, desconsiderada no presente trabalho.

Para os demais dados omissos distribuídos aleatoriamente por itens e casos variados, optou-se pela eliminação seletiva dos dados via tratamento pairwise quando da realização das análises fatoriais da seção 6.2. Esta técnica foi utilizada por proporcionar melhor aproveitamento dos dados disponíveis, sendo adequado

seu uso em grande conjunto de dados com proporção pequena de omissos alastrados pelas variáveis, como no banco de dados usado neste estudo (Pasquali, 2004; Tabachnick & Fidell, 2001). A proporção sujeitos-variáveis de interesse, por sua vez, permitiu o uso do tratamento listwise para as análises fatoriais descritas na seção 6.3. Nos demais procedimentos — teste t-student e ANOVA — também foi adotada a eliminação seletiva, análise a análise.

Antes de prosseguir para a investigação de casos extremos foi realizada inspeção visual prévia das curvas de distribuição das variáveis contínuas para verificar sua normalidade, bem como apreciados seus índices de assimetria e curtose. Uma distribuição normal possui índices de assimetria e curtose iguais a zero, sendo desejável obter valores próximos de zero. Entretanto, Miles e Shevlin (2001) ponderam que índices de assimetria abaixo de |1| dificilmente representam algum problema para a análise de dados, enquanto índices maiores que |1| que não ultrapassem |2| sugerem atenção, mas oferecem pouco perigo real.

As variáveis componentes das duas medidas apresentaram em sua maioria leve assimetria negativa, como esperado em auto-relatos em que os itens expressam comportamentos desejáveis associados a escalas em que valores maiores representam maior freqüência. Os índices de assimetria para tais itens variaram de -1,25 a 0,46 e os de curtose variaram de -1,03 a 1,88. Apenas seis desses itens apresentaram índice de assimetria maior que |1|. Para as questões sócio-demográficas, por sua vez, os índices de assimetria variaram de -1,31 a 1,56 e os de curtose variaram de -1,67 a 1,88; dos quais apenas três apresentaram índice de assimetria maior que |1|.

Após a inspeção de dados omissos e das distribuições das variáveis, foi realizada a investigação de casos extremos univariados e multivariados,

adotando-se os critérios z escore e distância de Mahalanobis sugeridos por Tabachnick e Fidell (2001). Foram identificados 58 possíveis casos extremos univariados com z < 3,29 (p < 0,001) em respostas aos itens das escalas; e três casos com z > 3,29 (p < 0,001) no item tempo na função atual. A análise descritiva não apontou para especificidades em termos de padrão de resposta para os casos com z < 3,29. Foi realizada, então, sua exclusão do banco de dados. Os três casos extremos com z > 3,29 são casos leves, o maior deles não superando 3,84. Referem-se a sujeitos atuando há 32 anos ou mais em sua função corrente, característica esta que, no entendimento da pesquisadora, não justifica sua exclusão.

Para a investigação de casos extremos multivariados foi calculada a distância de Mahalanobis, o que possibilitou a identificação de 107 casos, também excluídos do banco de dados original. No total 165 casos extremos foram eliminados, restando 688 sujeitos no banco adotado neste estudo. Dado o elevado número de exclusões, houve o cuidado adicional de se repetir os primeiros passos das principais análises de validação de medidas para verificar se o banco de dados original produziria resultados distintos do banco adotado, o que não ocorreu. Vale destacar que foi retomada a inspeção dos índices de assimetria e curtose após a exclusão dos casos extremos, observando-se que as variáveis obtiveram ambos os índices menores que um, à exceção de tempo de empresa (assimetria de -0,07 e curtose de -1,67) e tempo de função (assimetria de 1,60 e curtose de 2,04), resultado coerente com a opção de não exclusão dos três casos extremos já mencionados. A pertinência desses índices para as análises aqui pretendidas será discutida nas seções subseqüentes, em especial nas verificações de pressupostos.