Procedimentos de Tratamento e Análise dos Dados

3 METODOLOGIA

3.2 DELIMITAÇÃO E DESIGN DA PESQUISA

3.2.4 Procedimentos de Tratamento e Análise dos Dados

A análise descritiva dos dados, provenientes dos questionários respondidos pelos clientes, foi realizada por meio de diagramas de caixa (box-plots) e de gráficos de colunas agrupadas, adequados para a apresentação de dados em escala Likert.

A análise quantitativa dos dados, por outro lado, foi feita utilizando-se estatística não paramétrica e a técnica de modelagem conhecida como regressão quantílica. Cada conceito estatístico utilizado está descrito brevemente a seguir. Foram utilizados os softwares SAS, R e Excel para a realização das análises.

3.2.4.1 Diagrama de caixa (box-plot)

O diagrama de caixa, ou box-plot, fornece informações a respeito da distribuição da variável de interesse, tais como: medidas de posição, dispersão, assimetria e observações discrepantes (outliers) (BUSSAB e MORETTIN, 2009).

Em um box-plot são apresentadas 5 estatísticas: o mínimo, o primeiro quartil (Q1), a mediana, o terceiro quartil (Q3) e o máximo. Caso seja necessário, pode-se apresentar também a média dos dados no gráfico.

O primeiro quartil é uma medida de posição no qual 25% das observações ficam abaixo dele e, consequentemente, 75% delas fica acima. O valor da mediana deixa 50% dos dados acima e 50% dos dados abaixo de si. Analogamente, o terceiro quartil deixa 75% dos dados abaixo de si e 25% acima. A figura 6 a seguir exemplifica esse tipo de gráfico:

Figura 6 - Diagrama de caixa (box-plot)

Fonte: Bussab e Morettin (2009)

O retângulo em azul, denominado amplitude interquartílica ou desvio interquartílico, contém 50% dos dados e é uma medida de dispersão referente à

distribuição dos dados. Quanto maior for o retângulo, e consequentemente a amplitude, maior a será a variação existente nos dados.

As observações discrepantes (outliers), quando existem, aparecem como pontos ou asteriscos fora das “linhas” desenhadas.

3.2.4.2 Análise de Variância (ANOVA) não paramétrica – Teste de Kruskal-Wallis O teste de Kruskal-Wallis (KW) é uma extensão do teste de Wilcoxon-Mann-Whitney. É um teste não paramétrico utilizado para comparar três ou mais populações. Sua hipótese nula enuncia que todas as populações possuem funções de distribuição iguais, enquanto a hipótese alternativa enuncia que ao menos uma das populações possui função de distribuição diferente (CONOVER, 1999).

Pode-se dizer que o teste de KW é análogo ao teste F utilizado na ANOVA 1 fator. Enquanto as análises de variância paramétricas dependem da hipótese de que todas as populações em confronto são independentes e normalmente distribuídas, o teste de Kruskal-Wallis não coloca nenhuma restrição sobre a comparação pareadas e baseia-se nos postos das diferenças entrapares (CONOVER, 1999).

Para seu cálculo, são gerados os valores numéricos da diferença entre cada par, sendo possíveis três condições: aumento, diminuição ou igualdade. Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, essas diferenças são ordenadas pelo seu valor absoluto (sem considerar o sinal), substituindo-se então os valores originais pelo posto que ocupem na escala ordenada. O teste da hipótese nula de igualdade entre os grupos é baseado na soma dos postos das diferenças negativas e positivas (CONOVER, 1999).

Trata-se de um dos testes não paramétricos mais poderosos, pois considera não só o sinal das diferenças entre os pares, como também o valor dessas diferenças.

3.2.4.4 Coeficiente de Goodman-Kruskal

O Coeficiente Gamma de Goodman e Kruskal permite avaliar a associação entre duas variáveis ordinais, tornando possível medir tanto o grau de associação entre elas quanto o seu sentido (positivo ou negativo). Pode-se dizer que existe correlação positiva quando, na medida em que o nível aumenta, cresce a chance de ocorrer níveis mais elevados na outra variável; correlação negativa ocorre quando, ao aumentar o nível de uma variável, diminui a chance de ocorrer níveis mais elevados na outra variável (BARBETTA, 2008).

O coeficiente de correlação em questão se baseia nos conceitos de concordância e discordância, onde dois indivíduos são considerados concordantes quando se posicionam em posições concordantes nas duas variáveis e são considerados discordantes quando eles trocam de posição ao mudar de variável.

Para ilustrar o conceito de pares concordantes, Barbetta (2008) propõe como exemplo a seguinte situação:

i. Joao é alto e pesado ii. Maria é baixa e leve

Pode-se dizer que João e Maria formam um par de concordante, pois, ao mudar de João para Maria, ambas as variáveis mudam para níveis inferiores (Estatura: alta ˧ baixa; Peso: pesado ˧ leve). E de Maria para João, ambas as variáveis mudam para níveis superiores (Estatura: baixa ˧ alta; Peso: leve ˧ pesado). Já para ilustrar os pares discordantes, o autor traz uma situação análoga:

i. Pedro é baixo e pesado ii. José é alto e leve

Tem-se um par discordante, pois, ao passar do Pedro para o José, a estatura

O valor do coeficiente estará sempre entre -1 e +1. Será +1 quando só houver concordâncias, e será -1 quando só houver discordâncias. Quando o coeficiente calculado estiver em próximo de zero, o número de concordâncias e o número de discordâncias são aproximadamente iguais (ausência de correlação). Quanto mais próximo de +1 for o valor calculado, mais o número de concordâncias estará superando o número de discordâncias (correlação forte). Simetricamente, quanto mais próximo de -1 estiver o coeficiente, mais o número de discordâncias estará superando o número de concordâncias (correlação negativa forte).

3.2.4.5 Regressão quantílica

A Regressão Quantílica pode ser entendida como uma extensão da Regressão Linear, sendo que estas duas técnicas se diferenciam basicamente pelo método de estimação dos seus parâmetros. Pode-se dizer que a Regressão Linear é baseada na média dos dados e que a Regressão Quantílica, por outro lado, é baseada em medidas separatrizes, em geral pela mediana dos dados (KOENKER e BASSETT, 1978).

O método utilizado para estimação dos parâmetros de um modelo de Regressão Quantílica é o de minimização do somatório dos desvios absolutos, diferentemente dos modelos clássicos de regressão que utilizam o método dos mínimos quadrados ordinários (MQO).

Essa característica torna a técnica de regressão quantílica mais vantajosa em alguns aspectos quando comparado ao MQO. No MQO, por exemplo, a distribuição

normal dos erros deve ser uma suposição, o que não é necessário quando utilizada a minimização dos erros absolutos.

Outra vantagem da Regressão Quantílica é sua robustez em relação à outliers, da mesma forma como a mediana o é.

No documento ALDO JOSÉ WAGNER OS EFEITOS DA INOVAÇÃO NA FIDELIZAÇÃO DE CLIENTES (páginas 51-56)