3 METODOLOGIA
3.2 DELIMITAÇÃO E DESIGN DA PESQUISA
3.2.4 Procedimentos de Tratamento e Análise dos Dados
A análise descritiva dos dados, provenientes dos questionários respondidos pelos clientes, foi realizada por meio de diagramas de caixa (box-plots) e de gráficos de colunas agrupadas, adequados para a apresentação de dados em escala Likert.
A análise quantitativa dos dados, por outro lado, foi feita utilizando-se estatística não paramétrica e a técnica de modelagem conhecida como regressão quantílica. Cada conceito estatístico utilizado está descrito brevemente a seguir. Foram utilizados os softwares SAS, R e Excel para a realização das análises.
3.2.4.1 Diagrama de caixa (box-plot)
O diagrama de caixa, ou box-plot, fornece informações a respeito da distribuição da variável de interesse, tais como: medidas de posição, dispersão, assimetria e observações discrepantes (outliers) (BUSSAB e MORETTIN, 2009).
Em um box-plot são apresentadas 5 estatísticas: o mínimo, o primeiro quartil (Q1), a mediana, o terceiro quartil (Q3) e o máximo. Caso seja necessário, pode-se apresentar também a média dos dados no gráfico.
O primeiro quartil é uma medida de posição no qual 25% das observações ficam abaixo dele e, consequentemente, 75% delas fica acima. O valor da mediana deixa 50% dos dados acima e 50% dos dados abaixo de si. Analogamente, o terceiro quartil deixa 75% dos dados abaixo de si e 25% acima. A figura 6 a seguir exemplifica esse tipo de gráfico:
Figura 6 - Diagrama de caixa (box-plot)
Fonte: Bussab e Morettin (2009)
O retângulo em azul, denominado amplitude interquartílica ou desvio interquartílico, contém 50% dos dados e é uma medida de dispersão referente à
distribuição dos dados. Quanto maior for o retângulo, e consequentemente a amplitude, maior a será a variação existente nos dados.
As observações discrepantes (outliers), quando existem, aparecem como pontos ou asteriscos fora das “linhas” desenhadas.
3.2.4.2 Análise de Variância (ANOVA) não paramétrica – Teste de Kruskal-Wallis O teste de Kruskal-Wallis (KW) é uma extensão do teste de Wilcoxon-Mann-Whitney. É um teste não paramétrico utilizado para comparar três ou mais populações. Sua hipótese nula enuncia que todas as populações possuem funções de distribuição iguais, enquanto a hipótese alternativa enuncia que ao menos uma das populações possui função de distribuição diferente (CONOVER, 1999).
Pode-se dizer que o teste de KW é análogo ao teste F utilizado na ANOVA 1 fator. Enquanto as análises de variância paramétricas dependem da hipótese de que todas as populações em confronto são independentes e normalmente distribuídas, o teste de Kruskal-Wallis não coloca nenhuma restrição sobre a comparação pareadas e baseia-se nos postos das diferenças entrapares (CONOVER, 1999).
Para seu cálculo, são gerados os valores numéricos da diferença entre cada par, sendo possíveis três condições: aumento, diminuição ou igualdade. Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, essas diferenças são ordenadas pelo seu valor absoluto (sem considerar o sinal), substituindo-se então os valores originais pelo posto que ocupem na escala ordenada. O teste da hipótese nula de igualdade entre os grupos é baseado na soma dos postos das diferenças negativas e positivas (CONOVER, 1999).
Trata-se de um dos testes não paramétricos mais poderosos, pois considera não só o sinal das diferenças entre os pares, como também o valor dessas diferenças.
3.2.4.4 Coeficiente de Goodman-Kruskal
O Coeficiente Gamma de Goodman e Kruskal permite avaliar a associação entre duas variáveis ordinais, tornando possível medir tanto o grau de associação entre elas quanto o seu sentido (positivo ou negativo). Pode-se dizer que existe correlação positiva quando, na medida em que o nível aumenta, cresce a chance de ocorrer níveis mais elevados na outra variável; correlação negativa ocorre quando, ao aumentar o nível de uma variável, diminui a chance de ocorrer níveis mais elevados na outra variável (BARBETTA, 2008).
O coeficiente de correlação em questão se baseia nos conceitos de concordância e discordância, onde dois indivíduos são considerados concordantes quando se posicionam em posições concordantes nas duas variáveis e são considerados discordantes quando eles trocam de posição ao mudar de variável.
Para ilustrar o conceito de pares concordantes, Barbetta (2008) propõe como exemplo a seguinte situação:
i. Joao é alto e pesado ii. Maria é baixa e leve
Pode-se dizer que João e Maria formam um par de concordante, pois, ao mudar de João para Maria, ambas as variáveis mudam para níveis inferiores (Estatura: alta ˧ baixa; Peso: pesado ˧ leve). E de Maria para João, ambas as variáveis mudam para níveis superiores (Estatura: baixa ˧ alta; Peso: leve ˧ pesado). Já para ilustrar os pares discordantes, o autor traz uma situação análoga:
i. Pedro é baixo e pesado ii. José é alto e leve
Tem-se um par discordante, pois, ao passar do Pedro para o José, a estatura
O valor do coeficiente estará sempre entre -1 e +1. Será +1 quando só houver concordâncias, e será -1 quando só houver discordâncias. Quando o coeficiente calculado estiver em próximo de zero, o número de concordâncias e o número de discordâncias são aproximadamente iguais (ausência de correlação). Quanto mais próximo de +1 for o valor calculado, mais o número de concordâncias estará superando o número de discordâncias (correlação forte). Simetricamente, quanto mais próximo de -1 estiver o coeficiente, mais o número de discordâncias estará superando o número de concordâncias (correlação negativa forte).
3.2.4.5 Regressão quantílica
A Regressão Quantílica pode ser entendida como uma extensão da Regressão Linear, sendo que estas duas técnicas se diferenciam basicamente pelo método de estimação dos seus parâmetros. Pode-se dizer que a Regressão Linear é baseada na média dos dados e que a Regressão Quantílica, por outro lado, é baseada em medidas separatrizes, em geral pela mediana dos dados (KOENKER e BASSETT, 1978).
O método utilizado para estimação dos parâmetros de um modelo de Regressão Quantílica é o de minimização do somatório dos desvios absolutos, diferentemente dos modelos clássicos de regressão que utilizam o método dos mínimos quadrados ordinários (MQO).
Essa característica torna a técnica de regressão quantílica mais vantajosa em alguns aspectos quando comparado ao MQO. No MQO, por exemplo, a distribuição
normal dos erros deve ser uma suposição, o que não é necessário quando utilizada a minimização dos erros absolutos.
Outra vantagem da Regressão Quantílica é sua robustez em relação à outliers, da mesma forma como a mediana o é.