• Nenhum resultado encontrado

4. APRESENTAÇÃO E DISCUSSÃO DOS RESULTADOS

4.1. EXAME DA BASE DE DADOS

Conforme apresentado no capítulo 3, iniciou-se a análise dos dados pelo exame da base de dados, com o objetivo de preparar os dados para análise. Assim, nessa primeira etapa a base passou por uma avaliação com o objetivo de identificar missing values.

Como no total houveram 39 missing values, ou seja menos de 15% do total e menos de 5% em cada indicador optou-se pelo o que recomenda Hair et. al. (2017) e substituiu-se os valores faltantes pela média.

Na amostra final também foram excluidos dois casos (250 e 259), uma vez que os mesmos apresentavam um número alto de missing values concentrados em um único construto. A tabela 5 demonstra a distribuição de missing values após a exclusão dos dois casos citados acima.

Tabela 5. Distribuição de missing values

Variável Número de missing values

Oi2 2 Oi3 1 Cm2 1 Cm4 3 I4 4 I7 1 Fs2 2 Fs3 3 Fs4 2 Fs6 2 Fs7 2 Fs8 4 Ao1 1

Ao3 2 Ao5 2 Ao6 1 Ao7 2 Dom1 1 Dom4 1 Dom5 2

Fonte: Dados da pesquisa (2018)

Dado o fato que o enfoque da presente pesquisa são as PMEs deve-se também observar se os casos de fato atendem ao critério objetivo que define essas organizações. Conforme exposto no capítulo 2.5, o SEBRAE (2017), estabelece como critério para PMEs o número de funcionários. Dessa forma, empresas de serviços que apresentam até 100 funcionários podem ser consideradas dentro desse universo.

Assim, questionou-se no instrumento de pesquisa sobre o número de funcionários de sua unidade de negócio, onde verificou-se que 22 empresas apontaram valores acima de 100 funcionários, o que as caracterizaria como um grande negócio. Dessa forma, essas empresas foram excluídas da amostra, que passou então a possuir 228 casos. Conforme o capítulo 3 essa amostra se mostra acima do recomendado por Hair et. al. (2017) (100-150 casos), sendo inclusive superior à faixa de 200, o que a caracteriza como uma amostra relevante.

Outro passo necessário para examinar a base é a verificação dos outliers. Conforme descrito no capítulo 3, outliers correspondem a valores extremos que devem ser verificados pelo pesquisador.

Para avaliação em um conjunto multivariado (contendo mais de 2 variáveis, como é o caso da presente pesquisa) Hair et al. (2009) recomenda o uso da medida D² de Mahalanobilis. Este método mede a distância de cada observação em um espaço multidimensional a partir do centro médio das observações, fornecendo um único valor para cada observação, independentemente do número de variáveis analisadas (HAIR et. al., 2009 p. 78).

Para se interpretar esse dado, segundo Hair et. al. (2009), é necessário dividir o valor do D² pelo número de variáveis envolvidas (D²/df), sendo que caso

os valores excedam 2,5 em pequenas amostras, ou 3 e 4 em grandes amostras, pode-se inferir que se tratam de observações atípicas, ou seja, outliers.

A tabela 6 apresenta os valores da distância de malahanobilis (D²) e o valor da expressão D²/df nos 7 casos que foram identificados como outliers, os dados foram obtidos através do software IBMSPSS22:

Tabela 6. Outliers identificados

Id Distancia(D²) D²/df 108 138,4083 3,954523 76 105,4117 3,011763 274 100,3671 2,867632 199 98,62662 2,817903 85 92,58531 2,645295 90 88,91853 2,540529 280 87,91403 2,511829

Fonte: Dados da pesquisa (2018)

Dessa forma, pode-se observar um total de 7 casos identificados como outliers, verificando cada caso separadamente foi possível observar que de fato apresentavam um padrão de respostas muito diferente dos demais casos.

Além de se ter excluído as grandes empresas, conforme apontado anteriormente, também se observou a presença de microempresas dentro da amostra.

Dado o número considerável de casos desse tipo (42) optou-se por testar se existe ou não diferença significativa entre as respostas do grupo de PMEs e do grupo de microempresas. Dessa forma, é necessário um teste t independente, que verifica se a variância entre dois grupos é igual (FIELD, 2009). Porém, uma vez que esse teste exige uma distribuição normal deve-se utilizar outro teste que seja não paramétrico.

Assim, realizou-se o teste de Mann-Whitney, que é uma versão não paramétrica equivalente ao teste t, calculado a partir do software IBMSPSS 22, onde observou-se que nenhuma variável apresentou diferença significativa entre as médias dos dois grupos. Dessa forma, pode-se inferir que estatisticamente dentro da amostra não existe diferença significativa de média das respostas entre as PMEs

e microempresas. O que leva a entender que ambos se comportam de maneira semelhante. Assim, optou-se por não excluir as microempresas da amostra.

Bocconceli et. al. (2016), afirma que não existe um critério objetivo único para a definição de PMEs, inclusive destaca o critério da Comisão Europeia (2003), que não considera diferença entre micro e pequenas empresas, dessa forma, pode-se observar que não seria prejudicial para o presente trabalho manter dentro da amostra de PMEs as microempresas, estando inclusive alinhada com outros trabalhos que estudam PMEs como os de Bocconceli et. al. (2006), Gabrielli e Balboni (2010) e Esposito (2013) entre outros, que consideram esse mesmo critério da Comissão Europeia.

Tendo excluído outliers, examinando os missing values e analisado a questão do tamanho das empresas, conforme indicado no capítulo 3, foram realizados testes para verificar a distribuição dos dados, ressaltando que a amostra após esses processos se encontra em 219 casos, valor que permanece relevante.

Para observar a normalidade dos dados conforme apontado no capítulo 3, realizaram-se dois testes utilizando o software IBM SPSS 22, p teste de Shapiro- Wilks e o de Kolmogorov-Smirnov esses dois testes avaliam a distribuição dos dados e tem como hipótese nula uma distribuição normal dos dados. Uma vez que o resultado de ambos os testes teve um nível de significância abaixo de 0,05 rejeitou-se a hipótese nula e pode-se concluir que os dados não estão distribuídos de forma normal.

Hair et. al. (2017) afirmam que o PLS-SEM (método utilizado na presente pesquisa) não necessita de uma distribuição normal, porém, apontam a importância de verificar-se a distribuição dos dados, ressaltando especificamente a necessidade de se avaliar a curtose e a assimetria, conforme exposto no capítulo 3, essas medidas sinalizam se a distribuição está “achatada” ou “elevada” (curtose) ou se a distribuição se encontra deslocada para algum lado (assimetria).

Segundo Hair et. al. (2017), um valor 0 de curtose e assimetria indica uma distribuição normal, porém, conforme verificado anteriormente os dados desta pesquisa não se encontram nessa categoria, dessa forma os autores apontam como recomendáveis valores de curtose e assimetria entre -1 e 1. No capítulo 4.3. será realizada a análise descritiva das variáveis, onde serão destacados esses valores.