• Nenhum resultado encontrado

Identificação de Relações em Dados de Fidelização de Clientes

N/A
N/A
Protected

Academic year: 2021

Share "Identificação de Relações em Dados de Fidelização de Clientes"

Copied!
106
0
0

Texto

(1)

Identificação de

Relações em Dados

de Fidelização de

Clientes

Sofia Girão Henriques

Dissertação de Mestrado apresentada à

Faculdade de Ciências da Universidade do Porto em Engenharia Matemática

2020

Ident if icação de R elaçõe s em D ad os de Fideli zaç ão de Cli ent es S o fia G ir ão Hen riqu es

MSc

FCUP 2020 2.º CICLO

(2)
(3)

Identificação de

Relações em Dados

de Fidelização de

Clientes

Sofia Girão Henriques

Mestrado em Engenharia Matemática

Departamento de Matemática 2020

Orientadora Externa

Sandra Ramos, Professora Adjunta, ISEP

Orientadora Interna

Maria João Rodrigues, Professora Auxiliar, FCUP

Supervisora de Estágio

(4)

O Presidente do Júri,

(5)

Agradecimentos

Quero começar por agradecer ao Grupo NORS e à FCUP por proporcionarem a realização deste estágio curricular.

À minha orientadora, professora Sandra Ramos, por todo o apoio, disponibilidade, simpatia e dedicação que me transmitiu ao longo deste ano.

À professora Maria João Rodrigues, por toda a disponibilidade, ajuda e sugestões.

A toda a equipa do Grupo NORS, em particular do LAB MI, por toda a disponibilidade e por me integrarem e receberem tão bem.

À minha família por todo o apoio ao longo dos anos e por acreditarem em mim.

À Sofia, por todo o amor, carinho e apoio. Obrigada por estares sempre ao meu lado e acreditares sempre em mim.

Aos melhores amigos que a faculdade me deu, Manel, Carmo e Sanona, por todas as aven-turas, memórias e gargalhadas. Por todas as tardes e noites passadas a estudar em conjunto, por todo o apoio e acima de tudo pela grande amizade que temos. Um obrigada em especial ao Carmo, pelo apoio na escrita desta dissertação.

Aos meus amigos de Aveiro, que cresceram comigo ao longo destes anos e me proporciona-ram momentos muito felizes. Obrigada pela vossa amizade e apoio.

À Cientuna e aos seus membros que marcaram o meu percurso académico e que, com cer-teza, permanecerão na minha vida por muitos mais anos. Obrigada por todas as memórias que criámos juntas.

A todos os que não especifiquei, mas que contribuíram igualmente para a conclusão desta etapa da minha vida.

(6)
(7)

Resumo

A satisfação de clientes tem-se revelado um fator determinante na compreensão e explicação da lealdade dos mesmos e, portanto, é de extrema importância a sua análise e avaliação. Com isso em mente, surge este trabalho, que resulta do estágio curricular realizado no Grupo NORS cujo foco é o estudo da satisfação dos clientes do grupo, através da análise de dados recolhidos em seis das suas empresas.

Após o pré-processamento dos dados relativos aos inquéritos de satisfação efetuados, foi executada uma análise descritiva e exploratória dos mesmos.

De seguida, através da regressão logística de odds proporcionais, procedeu-se à procura dos indicadores que exerciam mais influência na satisfação dos clientes, isto é, os aspetos avaliados nos inquéritos que, ao serem melhorados, levariam a um aumento da satisfação dos clientes NORS, designados por drivers de excelência. À exceção de uma empresa, os modelos obtidos apresentaram uma boa qualidade de ajuste aos dados.

Por fim, de modo a avaliar a existência de uma possível relação entre a satisfação dos clientes e a rentabilidade da empresa, esta última avaliada por componentes do indicador RFM, fez-se uso de um teste não paramétrico para testar a igualdade de distribuições de diferentes grupos, seguido de intervalos de confiança a 95% para a diferença entre medianas. O teste de hipóteses considerado revelou que não existe evidência estatística de que a variação da satisfação dos clientes produz repercussões na frequência de compras e no valor monetário gasto, sendo estas componentes do indicador RFM. No entanto, apesar de não existir significância estatística, os intervalos de confiança mencionados permitiram retirar conclusões importantes.

Palavras-chave: Satisfação de clientes, inquéritos de satisfação, modelação estatística, dri-vers de excelência, rentabilidade, negócio automóvel.

(8)
(9)

Abstract

Customer satisfaction has long been a determinant factor in comprehending and explaining their loyalty and so, its analysis and evaluation is of extreme importance. With this in mind, this project emerges as the result of a curricular internship carried out at the NORS Group in which the main focus is the study of the group’s customer satisfaction, through the analysis of data collected from six of its companies.

After the pre-processing of the data relative to the satisfaction surveys carried out, an explora-tory descriptive analysis was performed.

Then, through proportional odds logistic regression, the indicators that exercised the most influence on customer satisfaction were pursued, that is, the aspects evaluated in the surveys that, when improved, would lead to an increase in satisfaction of NORS customers, known as drivers of excellence. With the exception of one company, the models obtained showed a good quality of fit to the data.

Finally, in order to assess the existence of a possible relationship between customer satisfac-tion and the company’s profitability, the latter being evaluated by components of the RFM indi-cator, a non-parametric test was used to test the equality of the distributions of different groups, followed by 95% confidence intervals for the difference between medians. The hypothesis test considered revealed that there is no statistical evidence that the variation in customer satisfac-tion has any repercussions on the frequency of purchases and the monetary value spent, these being components of the RFM indicator. However, despite the lack of statistical significance, the mentioned confidence intervals made it possible to draw important conclusions on the matter.

Keywords: Costumer satisfaction, satisfaction surveys, statistical modeling, drivers of excel-lence, profitability, automotive business.

(10)
(11)

Conteúdo

1 Introdução 1

1.1 Enquadramento do problema . . . 1

1.2 Objetivos . . . 2

1.3 Metodologia . . . 3

1.3.1 Net Promoter Score® (NPS) . . . 4

1.3.2 Indicador RFM . . . 6

1.4 Linguagem e software utilizados . . . 7

1.5 Estrutura da dissertação . . . 8

2 Empresa e dados 9 2.1 Descrição da Empresa . . . 9

2.2 Descrição dos dados . . . 11

2.3 Resultados da análise descritiva . . . 14

2.3.1 Empresas A, B, C e D . . . 14

2.3.2 Empresas E e F . . . 17

2.3.3 Variável Recomendar . . . 20

3 Identificação de preditores independentes da satisfação do cliente NORS 27 3.1 Modelação do problema . . . 27

3.1.1 Seleção das variáveis . . . 28

3.1.2 Modelos Lineares Generalizados . . . 29

3.1.3 Família exponencial . . . 30

3.1.4 Modelo Logístico de Odds Proporcionais . . . 31

3.1.5 Qualidade do ajuste . . . 32 vii

(12)

3.2 Resultados . . . 33

3.3 Discussão . . . 37

4 Avaliação da relação entre a satisfação e a rentabilidade da empresa 41 4.1 Modelação do problema . . . 41

4.1.1 Teste de Kruskal-Wallis . . . 44

4.1.2 Intervalos de confiança Bootstrap . . . 45

4.2 Resultados . . . 46

4.3 Discussão . . . 49

(13)

Lista de Figuras

1.1 Categorização do NPS. Fonte: Documento interno: Net Promoter Score (2018). . 5

2.1 Empresas do Grupo NORS, por área de negócio. Fonte: Documento interno: Company Profile (2020). . . 10 2.2 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa

A. . . 15 2.3 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa A. . . 16 2.4 Gráficos Likert de todas as variáveis numa escala ordinal de 1 a 10, por ano, para

a empresa E1. . . 19 2.5 Gráficos Likert de todas as variáveis por categoria NPS, por ano, para a empresa

E1. . . 19 2.6 Boxplots da variável Recomendar, por mês do ano 2019, das empresas A, B, C e D. 20 2.7 Boxplots da variável Recomendar, por mês do ano 2019, das empresas E1, E2, F1

e F2. . . 20 2.8 Boxplot da variável Recomendar, por ano, da empresa E1. . . 21 2.9 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, para as

empresas A, B, C e D. . . 22 2.10 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, para as

empresas E1, E2, F1e F2. . . 22 2.11 Gráficos Likert da variável Recomendar por categoria NPS, para as empresas A,

B, C e D. . . 23 2.12 Gráficos Likert da variável Recomendar por categoria NPS, para as empresas E1,

E2, F1 e F2. . . 23 ix

(14)

2.13 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, por ano,

para a empresa E1. . . 24

2.14 Gráficos Likert da variável Recomendar por categoria NPS, por ano, para a em-presa E1. . . 24

4.1 Boxplot dos dados da variação da componente F do indicador RFM conforme a categoria correspondente da variação da variável Recomendar. . . 46

4.2 Boxplot dos dados da variação da componente M do indicador RFM conforme a categoria correspondente da variação da variável Recomendar. . . 47

4.3 Representação gráfica dos intervalos de confiança a 95% para a diferença entre medianas entre cada dois grupos referentes à variável V ar_Rec, para os dados da variação da componente F do indicador RFM. . . 48

4.4 Representação gráfica dos intervalos de confiança a 95% para a diferença entre medianas entre cada dois grupos referentes à variável V ar_Rec, para os dados da variação da componente M do indicador RFM. . . 48

A.1 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa B. . . 55

A.2 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa C. . . 56

A.3 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa D. . . 56

A.4 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa B. . . 57

A.5 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa C. . . 57

A.6 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa D. . . 58

B.1 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa E1. . . 59

B.2 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa E2. . . 60

(15)

FCUP xi Identificação de Relações em Dados de Fidelização de Clientes

B.3 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa

F1. . . 60

B.4 Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa F2. . . 61

B.5 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa E1. . . . 61

B.6 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa E2. . . . 62

B.7 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa F1. . . 62

B.8 Gráfico Likert de todas as variáveis por categoria NPS, para a empresa F2. . . 63

C.1 Gráficos Likert de todas as variáveis numa escala ordinal de 1 a 10, por ano, para a empresa E2. . . 65

C.2 Gráficos Likert de todas as variáveis numa escala ordinal de 1 a 10, por ano, para a empresa F1. . . 66

C.3 Gráficos Likert de todas as variáveis numa escala ordinal de 1 a 10, por ano, para a empresa F2. . . 66

C.4 Gráficos Likert de todas as variáveis por categoria NPS, por ano, para a empresa E2. . . 67

C.5 Gráficos Likert de todas as variáveis por categoria NPS, por ano (2016 a 2019), para a empresa F1. . . 67

C.6 Gráficos Likert de todas as variáveis por categoria NPS, por ano (2013 a 2015), para a empresa F1. . . 68

C.7 Gráficos Likert de todas as variáveis por categoria NPS, por ano (2016 a 2019), para a empresa F2. . . 68

C.8 Gráficos Likert de todas as variáveis por categoria NPS, por ano (2013 a 2015), para a empresa F2. . . 69

D.1 Boxplot da variável Recomendar, por ano, da empresa E2. . . 71

D.2 Boxplot da variável Recomendar, por ano, da empresa F1. . . 71

D.3 Boxplot da variável Recomendar, por ano, da empresa F2. . . 72

E.1 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, por ano, para a empresa E2. . . 73

(16)

E.2 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, por ano, para a empresa F1. . . 74 E.3 Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, por ano,

para a empresa F2. . . 74 E.4 Gráficos Likert da variável Recomendar por categoria NPS, por ano, para a

em-presa E2. . . 75 E.5 Gráficos Likert da variável Recomendar por categoria NPS, por ano, para a

em-presa F1. . . 75 E.6 Gráficos Likert da variável Recomendar por categoria NPS, por ano, para a

(17)

Lista de Tabelas

2.1 Resumo dos parâmetros dos inquéritos de satisfação. . . 13

2.2 Número total de valores "NA" nas respostas aos inquéritos de cada empresa. . . 14

2.3 Top 5 questões tendo em conta o score NPS, para as empresas A e B. . . 16

2.4 Top 5 questões tendo em conta o score NPS, para as empresas C e D. . . 16

2.5 Top 5 questões tendo em conta o score NPS, para as empresas E1 e E2. . . 17

2.6 Top 5 questões tendo em conta o score NPS, para as empresas F1 e F2. . . 17

3.1 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa B. . . 33

3.2 Lista de variáveis por passo do método de eliminação backward stepwise, para a empresa B. . . 35

3.3 Sumário do modelo de regressão logística de odds proporcionais contendo as variáveis selecionadas pelo método de eliminação backward stepwise, para a em-presa B. . . 36

3.4 Sumário do modelo de regressão logística de odds proporcionais para a empresa B. 37 3.5 Drivers de excelência das empresas B, C e D. . . 38

3.6 Drivers de excelência das empresas E1 e F1. . . 38

3.7 Drivers de excelência das empresas E2 e F2. . . 38

4.1 Resultados do Teste de Kruskal-Wallis . . . 48

F.1 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa A. . . 77

F.2 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa C. . . 78

(18)

F.3 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa D. . . 79 F.4 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa

E1. . . 79 F.5 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa

E2. . . 80 F.6 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa

F1. . . 80 F.7 Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa

F2. . . 81 G.1 Sumário do modelo de regressão logística de odds proporcionais para a empresa

A. . . 83 G.2 Sumário do modelo de regressão logística de odds proporcionais para a empresa

C. . . 84 G.3 Sumário do modelo de regressão logística de odds proporcionais para a empresa D. 85 G.4 Sumário do modelo de regressão logística de odds proporcionais para a empresa

E1. . . 86 G.5 Sumário do modelo de regressão logística de odds proporcionais para a empresa

E2. . . 86 G.6 Sumário do modelo de regressão logística de odds proporcionais para a empresa

F1. . . 87 G.7 Sumário do modelo de regressão logística de odds proporcionais para a empresa

(19)

Capítulo 1.

Introdução

Este primeiro capítulo está dividido em cinco secções e tem como propósito introduzir e con-textualizar o trabalho desenvolvido. O capítulo é iniciado com um enquadramento do problema, seguindo-se uma descrição dos objetivos do trabalho e a apresentação da metodologia de tra-balho seguida. O capítulo é encerrado com a descrição das linguagens e software usados e com a descrição da estrutura geral do documento.

1.1 Enquadramento do problema

O conteúdo desta secção tem por base What is Customer Satisfaction? | ASQ (2020) e Bilgin, Küçükosmano ˘glu e ¸Sensoy (2010).

O conceito de satisfação de clientes pode ser definido como uma medida que determina o quão agradados estes estão com os produtos/serviços/ofertas de uma empresa, mostrando, cada vez mais, um aumento de interesse e importância.

Tem sido comprovado que a satisfação de clientes afeta as suas escolhas e compras futuras. Mais ainda, vários estudos demonstram que clientes satisfeitos estão dispostos a gastar mais (demonstrando menos sensibilidade ao fator preço), recomendar o produto/serviço a outras pes-soas (isto é, propaganda "boca a boca") e voltar a comprar ou dispor dos serviços fornecidos pela empresa.

Para além das vantagens mencionadas, tem sido também demonstrado que os custos de atividades de retenção de clientes, isto é, uma aposta no aumento da satisfação dos clientes atuais, são menores que os custos associados a adquirir novos clientes.

Por outro lado, clientes insatisfeitos irão, com maior probabilidade, parar de comprar ou dispor 1

(20)

dos serviços da empresa, bem como tecer comentários negativos acerca da mesma, afastando potenciais clientes.

De facto, a satisfação de clientes tem-se revelado um fator determinante na compreensão e explicação da lealdade dos mesmos e, portanto, é de extrema importância a sua análise e avaliação, também de forma a evidenciar os aspetos a melhorar, dentro da empresa.

1.2 Objetivos

Esta dissertação tem como objetivo o estudo da satisfação de clientes do Grupo NORS e o impacto da mesma na rentabilidade das suas empresas. Assim, pretende-se que a análise seja realizada utilizando dados recolhidos em várias empresas do grupo, em particular, dados recolhidos via inquéritos por questionário de satisfação de clientes e dados relativos ao seu comportamento comercial. Deste modo, esta dissertação encontra-se dividida em duas fases.

Numa primeira fase, pretende-se identificar os aspetos que mais influenciam a satisfação dos clientes, de forma a que o Grupo NORS tenha um melhor entendimento dos fatores a consi-derar em decisões administrativas e, assim, possa prever o comportamento dos seus clientes, relativamente à compra de produtos/serviços. Estes indicadores são designados por drivers de excelência.

Já a segunda fase tem, então, como propósito compreender a dimensão do impacto da satis-fação dos clientes na rentabilidade das empresas do grupo, mais especificamente, na frequência das suas compras e no valor monetário gasto.

Note-se que as duas fases estão interligadas, uma vez que, primeiramente, se identificam os aspetos em que uma dada empresa se deve focar de forma a aumentar a satisfação dos seus clientes e, seguidamente, se estuda a dimensão das repercussões que esta causa na rentabilidade de uma empresa.

Pretende-se que os resultados desta análise sejam úteis e interessantes para o Grupo NORS e, ainda, que sejam tidos em conta aquando da tomada de decisões de negócio.

(21)

FCUP 3 Identificação de Relações em Dados de Fidelização de Clientes

1.3 Metodologia

O primeiro passo deste trabalho consistiu no pré-processamento dos dados provenientes dos inquéritos efetuados pelas várias empresas em estudo. Removeram-se colunas vazias ou contendo informação irrelevante no âmbito desta dissertação, cruzaram-se bases de dados e procederam-se a correções de erros de inserção de dados, entre outros métodos de limpeza e preparação dos mesmos.

Seguidamente, foram aplicadas técnicas de análise descritiva e exploratória de forma a per-mitir um melhor entendimento do comportamento dos dados em questão e a melhor definir as metodologias estatísticas a aplicar.

De forma a dar resposta à primeira fase desta dissertação, isto é, encontrar os indicadores com mais influência na satisfação dos clientes (drivers de excelência), recorreu-se à regressão logística de odds proporcionais. Para isso, considerou-se como variável resposta/objetivo a questão do inquérito relativa à recomendação a outrem dos serviços a si prestados, na empresa em causa. A escolha desta variável para representar a satisfação dos clientes foi feita com base no conceito de Net Promoter Score®, abordado mais à frente nesta secção. Para efeitos de simplificação e consistência, utilizar-se-á o termo "variável Recomendar " para se referir a esta questão. Em relação às variáveis explicativas do modelo, utilizaram-se métodos estatísticos bivariados a fim de reduzir o número de potenciais preditores a incluir no modelo (Coeficiente de Correlação Tau-b de Kendall). O modelo final foi obtido de acordo com a metodologia backward stepwise.

Relativamente à tentativa de relacionar a satisfação dos clientes com a rentabilidade da em-presa, considerou-se o indicador RFM (descrito mais adiante nesta secção) como representação da mesma. Neste estudo, foram utilizados o teste de Kruskal-Wallis e intervalos de confiança construídos através do método Bootstrap.

(22)

1.3.1 Net Promoter Score® (NPS)

O conteúdo aqui presente é proveniente das fontes Documento interno: Net Promoter Score (2018) (fornecido pela empresa) e Reichheld e Markey (2011).

O Net Promoter Score® (NPS) é um indicador utilizado para medir o grau de satisfação e lealdade dos clientes com a organização, através de uma pergunta única e que permite a com-parabilidade do nível da satisfação global com outras empresas do setor.

Parece simples, mas permite insights muito poderosos sobre o comportamento do cliente e quais as melhores ações a tomar pelo negócio, com vista à sua transformação.

A pergunta mencionada é a seguinte: "Utilizando uma escala de 1 a 10, em que 1 significa "Não recomendaria com toda a certeza" e 10 "Recomendaria com toda a certeza", em que medida recomendaria este(a) produto/serviço/empresa a outra pessoa?".

Em função da resposta obtida, é possível agrupar os clientes em 3 categorias, como ilustra a figura 1.1:

Promotores: grupo correspondente aos clientes que atribuíram uma classificação de 9 ou 10 à questão referida. Este nome deve-se ao facto de estes clientes serem responsáveis por promover a empresa junto de amigos e colegas, aumentando a sua reputação e tra-zendo, assim, novos clientes. Este grupo é leal e volta a dispor dos serviços da empresa com uma elevada probabilidade.

Neutros: categoria de clientes cuja resposta foi igual a 7 ou 8. Normalmente, estes clientes estão satisfeitos mas não são leais à marca, pelo que irão facilmente recorrer à concorrên-cia, caso seja mais vantajoso para eles.

Detratores: grupo de clientes que responderam à questão com um valor igual ou inferior a 6. Esta denominação é atribuída a este segmento uma vez que as críticas destes cli-entes diminuem a reputação da empresa e desencorajam novos clicli-entes. De facto, este grupo considera que teve uma má experiência e, por isso, irá reduzir as suas utilizações do serviço em causa, ou até mesmo cessá-las, passando para a concorrência. Além disso, é provável que desaconselhem os serviços a outras pessoas que conheçam, diminuindo o número de novos clientes.

(23)

FCUP 5 Identificação de Relações em Dados de Fidelização de Clientes

Figura 1.1: Categorização do NPS. Fonte: Documento interno: Net Promoter Score (2018).

Obtendo as percentagens de cada grupo, o cálculo do NPS é efetuado da seguinte forma:

%P romotores − %Detratores = N P S

Assim, esta medida varia entre -100 (todos os clientes são detratores) e 100 (todos os clientes são promotores), sendo desejável o maior valor possível.

Este indicador é considerado um bom preditor do desempenho de uma empresa no contexto da satisfação e lealdade dos seus clientes. De facto, a pesquisa efetuada por Reichheld e Markey (2011) revela que as empresas com um rácio elevado de promotores face aos detratores demonstram um bom crescimento económico, dentro do seu setor.

A utilização do NPS apresenta, ainda, várias vantagens. Entre elas, permite: • Fazer sempre a mesma questão;

• Usar sempre a mesma escala de resposta; • Garantir que os resultados geram ações;

• Aferir de forma objetiva o grau de satisfação dos clientes.

Para compreender os motivos que justificam os resultados obtidos com o NPS, é possível a sua utilização conjunta com outras questões. É ainda possível aferir os graus de correlação existentes entre a probabilidade de o cliente recomendar a empresa e os tópicos abordados nas restantes questões do inquérito. Dessa forma, consegue-se prever quais as dimensões que mais influenciam o cliente a tornar-se um promotor e, consequentemente, repensar estrategicamente as prioridades de atuação.

(24)

1.3.2 Indicador RFM

O conteúdo desta subsecção tem por base Birant (2011) e Blattberg, Kim e Neslin (2008), que devem ser consultados para mais detalhes neste tema.

A análise do RFM é uma técnica de marketing utilizada para analisar o comportamento de compra de clientes de forma a dividi-los em grupos e, assim, permitir uma prestação de serviços mais personalizada.

A segmentação dos clientes é então feita através das três variáveis:

• Recência (R): intervalo de tempo entre a última transação comercial por parte do cliente e o presente (medido em dias, semanas, meses ou anos);

• Frequência (F): número de transações efetuadas durante o período de tempo estabelecido para a análise;

• Valor Monetário (M): valor total gasto pelo cliente no período em análise.

Estas medidas são usadas com base no pressuposto de que clientes com um valor de Re-cência menor, Frequência maior e Valor Monetário maior são mais prováveis de voltar a efetuar uma transação, quando comparados com clientes com um valor de Recência maior, Frequência menor e Valor Monetário menor, respetivamente.

De forma a analisar o comportamento de compra dos clientes, é comum discretizar os valores das três variáveis, ou seja, as variáveis contínuas do indicador RFM passam a estar divididas numa escala de 1 a 5. Os "melhores" clientes terão a classificação de 5 e os "piores" terão classificação de 1.

A segmentação é efetuada tendo em conta cada componente do indicador RFM, separada-mente. Assim, esta começa por considerar a Recência, seguindo-se a Frequência e, por fim, o Valor Monetário. Deste modo, o primeiro passo corresponde à ordenação dos clientes por or-dem crescente segundo a sua Recência, ficando, portanto, com os clientes que compraram mais recentemente no topo. De seguida, os clientes são divididos em quintiles, isto é, cinco grupos com o mesmo número de clientes. Os 20% primeiros recebem a classificação 5, os seguintes 20% terão classificação 4, e assim sucessivamente.

(25)

FCUP 7 Identificação de Relações em Dados de Fidelização de Clientes

Seguidamente, os clientes são classificados de igual forma, desta vez tendo em conta a sua Frequência. Assim, os clientes que compram com maior Frequência terão classificação máxima de 5 e os menos frequentes terão classificação de 1. Por fim, os clientes são, de forma análoga, classificados segundo o seu Valor Monetário gasto.

A classificação de um cliente pode variar entre 111 e 555, sendo estes o valor mais baixo e alto, respetivamente. A transformação das variáveis originais do indicador RFM para três códigos discretos resulta em 125 segmentos com o mesmo número de clientes, o que torna esta análise mais simples e fácil de entender.

Esta técnica tem-se mostrado bastante eficaz e pode ser aplicada em diversas áreas.

Nesta dissertação, não será tida em conta a segmentação dos clientes segundo o indicador RFM, mas sim as componentes do mesmo.

1.4 Linguagem e software utilizados

A componente prática desta dissertação foi realizada utilizando a versão 3.6.1 da linguagem R, através do software RStudio (versão 1.2.5001).

Esta secção contém informação recolhida em R: What is R?, R (linguagem de programação) (2020) e RStudio - RStudio.

O R é uma linguagem e um ambiente direcionado para a computação estatística e gráfica, criado originalmente por Ross Ihaka e Robert Gentleman no departamento de Estatística da Universidade de Auckland, Nova Zelândia.

A linguagem R é largamente usada entre estatísticos e analistas de dados para desenvolver software de estatística e análise de dados.

Um dos pontos fortes do R é a facilidade com que permite produzir representações gráficas com uma elevada qualidade.

Pesquisas e inquéritos junto de profissionais da área mostram que a popularidade do R au-mentou substancialmente nos últimos anos.

Por sua vez, o RStudio consiste num ambiente de desenvolvimento integrado (IDE) para o R. Inclui uma consola, um editor de texto com realce de sintaxe que suporta a execução direta

(26)

de código, bem como ferramentas para representação gráfica, histórico, depuração e gestão do ambiente de trabalho.

1.5 Estrutura da dissertação

Esta dissertação é composta por cinco capítulos: Introdução, Empresa e dados, Identifica-ção de preditores independentes da satisfaIdentifica-ção do cliente NORS, AvaliaIdentifica-ção da relaIdentifica-ção entre a satisfação e a rentabilidade da empresa e, por fim, a Conclusão. Inclui, ainda, as referências utilizadas e sete anexos.

O primeiro capítulo consiste numa introdução, onde é feito um enquadramento do problema, são expostos os objetivos do trabalho, a metodologia utilizada, a linguagem e software usados e, ainda, a presente descrição. No segundo capítulo, tal como o nome indica, apresentam-se o grupo NORS e os dados relativos aos inquéritos de satisfação recolhidos, bem como a sua análise descritiva. No capítulo seguinte, encontra-se uma descrição do problema relativo à procura dos indicadores com efeito significativo nos níveis de satisfação dos clientes, bem como a apresentação de alguns conceitos fundamentais utilizados para obter os resultados também aí apresentados. Mais ainda, são também discutidos esses mesmos resultados. Segue-se o capítulo 4, com uma estrutura semelhante à do anterior, tratando o tema da relação entre a satisfação dos clientes e a rentabilidade da empresa. Por fim, o quinto capítulo contém as conclusões finais a serem retiradas deste trabalho, seguindo-se as referências utilizadas na elaboração desta dissertação e, ainda, sete anexos.

(27)

Capítulo 2.

Empresa e dados

Este capítulo está dividido em três secções, iniciando-se com uma breve apresentação do Grupo NORS, seguindo-se uma descrição dos dados utilizados na produção deste trabalho e terminando com a exposição dos resultados da análise descritiva efetuada.

2.1 Descrição da Empresa

O conteúdo da presente secção tem por base o Documento interno: Company Profile (2020), fornecido pelo grupo.

O Grupo NORS é um grupo português, criado em 2013, cuja visão é ser um dos líderes mundiais em soluções de transporte, equipamentos de construção e equipamentos agrícolas. A sua atividade em Portugal foi iniciada com a representação da marca VOLVO®, em 1933.

Assumindo integralmente a sua vocação multinacional, o Grupo NORS rege-se hoje por uma estratégia assente em princípios e políticas transversais e por uma cultura de Grupo global, direcionada para um crescimento sustentado, suportado por produtos, serviços e Recursos Hu-manos de excelência.

Assim, o Grupo Nors é constituído por seis áreas operacionais: NORS Ibéria (Portugal e Es-panha), NORS Angola (Angola), NORS Brasil (Brasil), NORS África (Botswana, Namíbia e Mo-çambique), NORS Ventures (Portugal) e Grupo Ascendum (Portugal, Espanha, E.U.A., México, Turquia e Europa Central).

Historicamente associado à sua liderança no setor automóvel, o Grupo NORS é hoje uma multinacional com um âmbito de atuação alargado, que desenvolve as suas atividades em qua-tro grandes áreas de negócio: Original Equipment Solutions, Integrated Aftermarket Solutions,

(28)

Recycling Solutions e Safekeeping Solutions.

Figura 2.1:Empresas do Grupo NORS, por área de negócio. Fonte: Documento interno: Company Profile (2020).

Nesta dissertação, foram considerados dados de apenas seis empresas do Grupo, pertencen-tes às duas primeiras áreas de negócio atrás referidas. Assim, segue-se uma breve exposição acerca das mesmas, com referência às empresas utilizadas na realização deste trabalho.

• Original Equipment Solutions: Consiste na venda e após-venda de camiões, autocarros, máquinas de construção, equipamentos agrícolas, automóveis, motores marítimos e in-dustriais, geradores e componentes originais. Engloba diversas empresas, de onde se destacam:

– Auto Sueco: Empresa-mãe do Grupo, distribuidora exclusiva de camiões, autocarros e motores marítimos VOLVO® para Portugal. Além disso, é também distribuidora ex-clusiva de grupos geradores KOHLER-SDMO para Portugal;

– Galius: Distribuidor exclusivo de camiões Renault Trucks para Portugal, com ativida-des de venda e após-venda.

• Integrated Aftermarket Solutions: Conjunto de empresas de após-venda, que inclui a impor-tação e distribuição de peças O.E.M. (Original Equipment Manufacturer ) multimarca para camiões e automóveis e vidro de construção e decoração através das marcas Civiparts, AS Parts, ONEDRIVE e Vitrum. Destas, destacam-se as seguintes:

(29)

FCUP 11 Identificação de Relações em Dados de Fidelização de Clientes

multimarca. Foi adquirida pelo Grupo em 2003 e está presente em Portugal, Espanha e Angola;

– AS Parts: Integrada na empresa Newonedrive, é responsável pela distribuição de pe-ças e acessórios multimarca para veículos ligeiros em Portugal;

– ONEDRIVE: Responsável pelo retalho de peças para automóveis ligeiros em Portugal e Angola.

2.2 Descrição dos dados

Nesta secção, apresenta-se um breve resumo dos dados referentes aos inquéritos por questi-onário de satisfação de clientes, selecionados de forma aleatória, realizados em seis empresas do grupo NORS. Foi atribuída uma letra (de A a F) a cada uma das empresas, de modo a ga-rantir a confidencialidade das mesmas. Duas das empresas (E e F) são constituídas por dois setores, sendo estes Sales (parte comercial/vendas) e Workshop (parte da oficina/após-venda), representados pelos algarismos 1 e 2, respetivamente, e que serão analisados separadamente. Na tabela 2.1, podem ser consultadas as variáveis dos inquéritos, correspondentes às ques-tões cujas respostas se encontram numa escala ordinal com 10 níveis, bem como o período em estudo e o tamanho amostral, para cada uma das empresas.

Assim, todas as questões aqui consideradas foram concebidas de forma a que o cliente res-pondesse com um número de 1 a 10, sendo "1" correspondente ao caso em que considerasse que o aspeto representado na questão tinha sido nada satisfatório e "10" se extremamente sa-tisfatório. A uma escala desta natureza dá-se o nome de escala Likert (Agresti (2010)).

(30)

Empresa Variáveis do inquérito Período em estudo Tamanho amostral

A

Satisfação (Desempenho geral) (q1); Cumprimento de Prazos (q2);

Eficácia da entrega (q3); Condições da entrega (q4); Resolução de garantias (q5); Tratamento das devoluções (q6);

Diversidade da oferta (q7); Atualização da oferta (q8); Recompra (q9); Ferramentas online (q10); Satisfação (Tangíveis) (q11); Satisfação (Fiabilidade) (q12); Satisfação (Capacidade de resposta) (q13);

Satisfação (Confiança) (q14); Satisfação (Empatia) (q15); Recomendação de produtos/serviços (q16). 06-03-2019 a 19-12-2019 188 B Iguais às da empresa A 06-03-2019 a 20-12-2019 171 C Iguais às da empresa A 04-03-2019 a 18-12-2019 277 D

Satisfação (Desempenho geral) (q1); Satisfação (Tangíveis) (q2); Satisfação (Fiabilidade) (q3); Satisfação (Capacidade de resposta) (q4);

Satisfação (Confiança) (q5); Satisfação (Empatia) (q6); Cumprimento de prazos (q7); Eficácia da entrega (q8); Condições da entrega (q9); Resolução de garantias (q10); Tratamento das devoluções (q11);

Diversidade da oferta (q12); Atualização da oferta (q13); Suporte técnico (q14); Recomendação (q15); Recompra (q16). 06-03-2019 a 20-12-2019 230

(31)

FCUP 13 Identificação de Relações em Dados de Fidelização de Clientes

E1 Satisfação global (q1); Recomendar (q2); Comprar novamente (q3); Cortesia e prestabilidade (q4); Conhecimentos e competências (q5);

Relações a longo prazo (q6); Solução geral (q7);

Cumprimento do prazo de entrega acordado (q8); Comunicação sobre o prazo de entrega (q9); Estado do camião aquando da entrega (q10); Informações fornecidas durante a entrega (q11); Contacto/acompanhamento após a entrega (q12);

Contacto com a pessoa certa (q13).

06-03-2015 a 16-09-2019 154 E2 Satisfação global (q1); Recomendar (q2); Comprar novamente (q3); Cortesia e prestabilidade (q4); Disponibilidade da oficina (q5);

Informação/orçamento sobre a manutenção/reparação (q6); Conclusão da manutenção/reparação acordada (q7);

Explicação do trabalho executado (q8); Informação sobre trabalhos adicionais (q9);

Relações a longo prazo (q10); Qualidade da manutenção/reparação (q11);

Resolução do problema à primeira (q12); Disponibilidade das peças (q13); Contacto com a pessoa certa (q14).

27-01-2015 a 20-09-2019 1608

F1 Iguais às da empresa E1 15-10-2013 a 26-09-2019 533

F2 Iguais às da empresa E2 15-10-2013 a 26-09-2019 3010 Tabela 2.1:Resumo dos parâmetros dos inquéritos de satisfação.

(32)

Alguns dos clientes não responderam a todas as questões do inquérito, pelo que existem algumas entradas "NA" (missing values) nas bases de dados. Apresenta-se, por isso, na tabela 2.2, o respetivo número total, para cada empresa.

Empresa Total"NA"

A 0 B 0 C 0 D 0 E1 15 E2 369 F1 84 F2 653

Tabela 2.2:Número total de valores"NA"nas respostas aos inquéritos de cada empresa.

Tendo em conta o número de clientes que responderam aos inquéritos e o número de questões dos mesmos, constata-se que o total de entradas "NA" é baixo.

2.3 Resultados da análise descritiva

Esta secção foi dividida em três subsecções. As duas primeiras consistem numa análise geral de todas as variáveis dos inquéritos. Esta análise foi feita separando as empresas em dois grupos, conforme as suas semelhanças, nomeadamente, as questões dos inquéritos e o período de recolha dos mesmos. No primeiro grupo (empresas A, B, C e D), este período corresponde apenas ao ano de 2019, enquanto que o segundo grupo (empresas E1, E2, F1 e F2) engloba dados de vários anos.

Já a terceira secção, consiste numa análise mais pormenorizada, considerando apenas a variável Recomendar, comparando todas as empresas simultaneamente.

2.3.1 Empresas A, B, C e D

Ao trabalhar com escalas ordinais, como é o caso, é importante compreender que, embora exista uma clara ordenação dos diversos níveis, não é possível quantificar a distância entre

(33)

FCUP 15 Identificação de Relações em Dados de Fidelização de Clientes

eles. De facto, um cliente que atribua uma classificação igual a 7 a uma questão, está mais satisfeito do que se tivesse atribuído um 6, no entanto, é impossível quantificar exatamente a diferença entre esses dois níveis (Agresti (2010)). Assim, de forma a obter uma noção geral das respostas dos clientes a cada questão do inquérito, foram produzidos gráficos Likert, tanto numa escala ordinal de 1 a 10, como por categorias de NPS, para este grupo de empresas. Estes gráficos permitem uma fácil visualização de dados pertencentes a uma escala Likert, uma vez que agrupam as respostas de cada questão conforme a ordem dos diversos níveis. No entanto, por uma questão de síntese, apesar de ser feita uma análise a todas as empresas referidas, apenas serão aqui apresentados os gráficos relativos à empresa A, encontrando-se os restantes no Anexo A.

Figura 2.2: Gráfico Likert de todas as variáveis numa escala ordinal de 1 a 10, para a empresa A.

(34)

Figura 2.3:Gráfico Likert de todas as variáveis por categoria NPS, para a empresa A.

De modo a perceber quais as questões com melhor classificação, calcularam-se os scores NPS para todas as questões de cada empresa, apresentando-se nas tabelas 2.3 e 2.4 as cinco melhores de cada, por ordem decrescente de score, e com o respetivo valor. Este score foi considerado um bom indicador do desempenho da questão, uma vez que tem em conta, simul-taneamente, as suas percentagens de detratores e promotores.

Empresa A Empresa B Recompra (q9) - 61,7%; Satisfação (Tangíveis) (q11) - 58%; Ferramentas Online (q10) - 37,8%; Recomendação de produtos/serviços (q16) - 23,9%; Diversidade da oferta (q7) - 21,8%. Recompra (q9) - 79,5%; Satisfação (Tangíveis) (q11) - 60,2%; Ferramentas Online (q10) - 50,9%;

Satisfação (Capacidade de resposta) (q13) - 50,9%; Satisfação (Confiança) (q14) - 50,8%. Tabela 2.3:Top 5 questões tendo em conta o score NPS, para as empresas A e B.

Empresa C Empresa D Recompra (q9) - 73,6%; Condições da entrega (q4) - 63,6%; Satisfação (Tangíveis) (q11) - 60,3%; Cumprimento de Prazos (q2) - 51,6%; Eficácia da entrega (q3) - 48,4%. Recompra (q16) - 57,8%; Condições da entrega (q9) - 57%;

Satisfação (Capacidade de resposta) (q4) - 52,6%; Satisfação (Confiança) (q5) - 47,9%;

Recomendação (q15) - 47,9%. Tabela 2.4:Top 5 questões tendo em conta o score NPS, para as empresas C e D.

(35)

FCUP 17 Identificação de Relações em Dados de Fidelização de Clientes

Analisando as tabelas 2.3 e 2.4, verifica-se que a questão "Recompra" obteve o maior score NPS, nas quatro empresas: 61,7% na empresa A, 79,5% na empresa B, 73,6% na empresa C e 57,8% na empresa D. Assim, pode-se concluir que esta questão corresponde à melhor classifi-cada pelos clientes, nas quatro empresas consideradas, tendo em conta as suas percentagens de detratores e promotores.

Destaca-se, ainda, a questão "Satisfação (Tangíveis)", que se encontra em segundo lugar no conjunto das questões mais bem classificadas das empresas A e B, com um score NPS igual a 58% e 60,2%, respetivamente, e e em terceiro lugar no caso da empresa C, com um score de 63,6%. Deste modo, pode também ser considerada uma questão com um bom desempenho.

Em geral, com exceção da empresa A, as cinco questões mais bem classificadas pelos clientes apresentam um score NPS a partir de cerca de 50%.

2.3.2 Empresas E e F

Foram também produzidos os gráficos da secção anterior para este grupo de empresas, encontrando-se os mesmos, novamente, no Anexo B. Do mesmo modo, foram elaboradas as tabelas com os cinco melhores scores NPS, para cada empresa.

Empresa E1 Empresa E2

Estado do camião aquando da entrega (q10) - 78,4%; Relações a longo prazo (q6) - 72,8%;

Conhecimentos e competências (q5) - 69,9%; Informações fornecidas durante a entrega (q11) - 69,6%;

Cortesia e prestabilidade (q4) - 69,2%.

Comprar novamente (q3) - 72,1%; Relações a longo prazo (q10) - 70,2%; Cortesia e prestabilidade (q4) - 65,5%; Explicação do trabalho executado (q8) - 62,3%;

Conclusão da manutenção/ reparação acordada (q7) - 62,1%. Tabela 2.5:Top 5 questões tendo em conta o score NPS, para as empresas E1e E2.

Empresa F1 Empresa F2

Estado do camião aquando da entrega (q10) - 74,2%; Relações a longo prazo (q6) - 64,4%;

Informações fornecidas durante a entrega (q11) - 62,3%; Conhecimentos e competências (q5) - 61,5%;

Cortesia e prestabilidade (q4) - 58%.

Relações a longo prazo (q10) - 63%; Cortesia e prestabilidade (q4) - 60,3%;

Comprar novamente (q3) - 57,9%; Contacto com a pessoa certa (q14) - 56,5%; Qualidade da manutenção/reparação (q11) - 52,6%. Tabela 2.6:Top 5 questões tendo em conta o score NPS, para as empresas F1e F2.

(36)

Pode-se observar, a partir das tabelas 2.5 e 2.6, que a questão "Relações a longo prazo" obteve um dos melhores resultados, em todas as empresas. De facto, esta encontra-se em primeiro lugar no conjunto das questões mais bem classificadas da empresa F2, com um score NPS de 63%, e em segundo lugar nas restantes empresas, com um score igual a 72,8%, 70,2% e 64,4%, nas empresas E1, E2 e F1, respetivamente.

Sendo que os dois setores das empresas E e F possuem questionários com algumas pergun-tas distinpergun-tas, torna-se difícil comparar os quatro setores (dois de cada empresa) em simultâneo. No entanto, é de notar que os setores 1 de ambas as empresas contêm as mesmas cinco melho-res questões: "Estado do camião aquando da entrega", "Relações a longo prazo", "Informações fornecidas durante a entrega", "Conhecimentos e competências" e "Cortesia e prestabilidade". No caso deste setor, a questão "Estado do camião aquando da entrega" obteve o score mais elevado em ambas as empresas (78,4% na empresa E1 e 74,2% na empresa F1).

No caso do setor 2, também é possível destacar as questões "Comprar novamente" e "Cortesia e prestabilidade", uma vez que possuem scores elevados, tanto no caso da empresa E2 como no da empresa F2: 72,1% e 65,5% para a primeira empresa, e 57,9% e 60,3% para a segunda empresa, respetivamente.

Para este conjunto de empresas, as cinco questões mais bem classificadas pelos clientes apresentam sempre um score NPS de, pelo menos, 50%.

Comparando este conjunto de empresas (E1, E2, F1e F2) com o anterior (A, B, C e D), verifica-se que, em geral, as questões mais bem classificadas deste conjunto de empresas possuem um score NPS mais elevado.

Seguidamente, apresentam-se gráficos semelhantes aos anteriores, agora divididos por ano de execução dos inquéritos. Mais uma vez, por uma questão de síntese, estão apenas disponí-veis, nesta secção, os gráficos relativos à empresa E1, encontrando-se os restantes no Anexo C.

(37)

FCUP 19 Identificação de Relações em Dados de Fidelização de Clientes

Figura 2.4:Gráficos Likert de todas as variáveis numa escala ordinal de 1 a 10, por ano,

para a empresa E1.

Figura 2.5: Gráficos Likert de todas as variáveis por categoria NPS, por ano, para a

empresa E1.

Relativamente à empresa E1, os primeiros anos de inquéritos aparentam possuir poucas res-postas negativas, em comparação com os anos mais recentes, em que surgem mais resres-postas com classificação 1 e 2. No entanto, todos os anos apresentam elevadas percentagens de pro-motores.

(38)

ao longo dos anos. No entanto, tal como na empresa E1, verifica-se uma grande percentagem de promotores em todos os casos, sendo a categoria "neutros" a segunda mais frequente e, consequentemente, a percentagem de detratores a mais baixa.

2.3.3 Variável Recomendar

De modo a conseguir comparar todas as empresas, foram gerados boxplots da variável Reco-mendar apenas para o ano 2019, por mês, para cada uma.

Figura 2.6:Boxplots da variável Recomendar, por mês do ano 2019, das empresas A, B, C e D.

Figura 2.7: Boxplots da variável Recomendar, por mês do ano 2019, das empresas E1,

(39)

FCUP 21 Identificação de Relações em Dados de Fidelização de Clientes

Ao comparar estes boxplots, verifica-se que a mediana da variável Recomendar se situa entre 8 e 10, para todas as empresas. De facto, em grande parte dos casos, 75% dos valores das respostas à questão relativa à variável Recomendar são iguais ou superiores a 8. Assim, pode dizer-se que não existe uma grande dispersão destas respostas, estando estas bastante con-centradas nas classificações superiores. Existem, no entanto, alguns outliers, maioritariamente na empresa F1. Deste modo, a variável Recomendar tem um comportamento semelhante em todas as empresas.

Relativamente aos meses do ano 2019, não se verifica, numa análise superficial, a existência de um mês que se destaque, quer pela positiva, quer pela negativa, aquando da comparação de todas as empresas, em simultâneo.

De seguida, produziram-se gráficos semelhantes para as empresas E1, E2, F1 e F2, por ano. Destes, apenas se apresenta o referente à empresa E1, estando os restantes presentes no Anexo D.

Figura 2.8:Boxplot da variável Recomendar, por ano, da empresa E1.

Observando os vários boxplots relativos à variável Recomendar, por ano, para as empresas E1, E2, F1 e F2, verifica-se que as medianas são sempre iguais ou superiores a 9. Mais ainda, constata-se que, para todos os anos considerados e para todas as empresas mencionadas, 75% dos valores das repostas à questão em causa são iguais ou superiores a 8. Assim, à semelhança do caso do ano 2019, analisado anteriormente, pode dizer-se que não existe uma grande

(40)

dis-persão destas respostas, estando estas bastante concentradas nas classificações superiores. Novamente, existem alguns outliers, sendo que, neste caso, são mais numerosos no boxplot da empresa F2. Deste modo, pode-se concluir que a variável Recomendar tem um comportamento semelhante em todas as empresas, assim como em todos os anos considerados.

Apresentam-se, também, os gráficos Likert da variável Recomendar, novamente para cada empresa.

Figura 2.9:Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, para as empresas A, B, C e D.

Figura 2.10:Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, para

(41)

FCUP 23 Identificação de Relações em Dados de Fidelização de Clientes

Figura 2.11:Gráficos Likert da variável Recomendar por categoria NPS, para as empre-sas A, B, C e D.

Figura 2.12:Gráficos Likert da variável Recomendar por categoria NPS, para as

empre-sas E1, E2, F1e F2.

Em todos os casos, verifica-se que a categoria mais frequente das respostas à questão re-lativa à variável Recomendar é a "promotores", com percentagens que variam entre 44,1% e 63,4%. Em segundo lugar, encontram-se os clientes neutros, com percentagens entre 25,7% e 35,7% e, por fim, os detratores, com percentagens a variar entre 5,5% e 20,2% e, em geral, a rondar os 10%. Pode-se ainda observar que a empresa A possui a maior percentagem de

(42)

detra-tores (20,2%), relativamente à variável Recomendar, e que, por sua vez, a empresa F2possui a percentagem mais elevada de promotores (63,4%).

Por fim, apresentam-se os mesmos gráficos Likert, agora separando os dados por ano de execução de inquéritos, para a empresa E1, encontrando-se os restantes (relativos às empresas E2, F1 e F2) no Anexo E.

Figura 2.13:Gráficos Likert da variável Recomendar numa escala ordinal de 1 a 10, por

ano, para a empresa E1.

Figura 2.14:Gráficos Likert da variável Recomendar por categoria NPS, por ano, para a

(43)

FCUP 25 Identificação de Relações em Dados de Fidelização de Clientes

Relativamente à empresa E1, verifica-se um aumento da percentagem de "Detratores" no úl-timo ano (2019) para quase o triplo (11,4%), em comparação com os anos anteriores. Já na empresa F2, este mesmo valor desce para cerca de metade (5,5%), também no último ano. As restantes empresas não verificam, em geral, oscilações significativas.

No que diz respeito à categoria "promotores", constata-se que os valores oscilam, para todas as empresas, entre 51,7% e 72,8%, sendo esta a categoria mais frequente, em todos os anos. Seguem-se os clientes neutros, com percentagens a variar entre 22,5% e 38,2% e, finalmente, a categoria "detratores" como menos frequente, com percentagens que variam entre 3% e 12,9%.

(44)
(45)

Capítulo 3.

Identificação de preditores independentes

da satisfação do cliente NORS

Este capítulo está dividido em três secções e diz respeito à procura dos drivers de excelên-cia. Na primeira secção, são apresentados os objetivos e metodologias utilizadas nesta fase do trabalho, seguindo-se a exposição dos resultados. O capítulo é encerrado com a discussão dos resultados obtidos.

3.1 Modelação do problema

Nesta fase do trabalho, um dos objetivos é identificar os aspetos que exercem maior influência na satisfação dos clientes, avaliada através da variável Recomendar, de modo a que estes sejam tidos em conta em termos empresariais.

Para isso, utilizou-se um modelo logístico de odds proporcionais (um caso particular dos mo-delos lineares generalizados), sendo a variável Recomendar a variável resposta e as restantes questões dos inquéritos as variáveis explicativas do referido modelo, considerando as respostas das questões divididas por categoria do indicador NPS.

Numa primeira fase, com o objetivo de reduzir o grande número de variáveis existentes, foi obtido o Coeficiente de Correlação Tau-b de Kendall entre a variável resposta (Recomendar ) e cada uma das variáveis explicativas e, também, um intervalo de confiança a 95% para este valor (toda a inferência executada nesta dissertação será feita considerando um nível de significância de 0,05). Com o mesmo fim, executou-se, ainda, o método de eliminação backward stepwise.

De forma a verificar a qualidade do ajuste do modelo, realizou-se o teste de χ2 de Pearson. 27

(46)

Não foram calculadas nenhumas medidas de desempenho preditivo do modelo, uma vez que, dado o elevado número de questões/variáveis em comparação com o número de casos, não pareceu razoável dividir a base de dados para efetuar tais análises.

Além disso, não foram calculados odds ratios, apesar de possível, uma vez que esse não era o foco do trabalho e não seria vantajoso para a empresa.

A análise aqui descrita foi executada para todas as empresas.

As metodologias utilizadas e aqui mencionadas serão apresentadas de seguida e ao longo desta secção.

3.1.1 Seleção das variáveis

A presente subsecção tem por base o trabalho de Kendall (1948) e Agresti (2010).

O Coeficiente de Correlação Tau-b de Kendall foi usado para verificar, individualmente, se existia uma associação (correlação) entre a variável resposta (Recomendar ) e cada uma das variáveis explicativas, na tentativa de reduzir o número de covariáveis a introduzir no modelo.

Este coeficiente é usado no caso em que ambas as variáveis são ordinais. Como qualquer coeficiente de correlação, este varia entre -1 e 1, sendo que quando se aproxima de 0, indica que as variáveis em causa não apresentam uma correlação entre si.

Considerando (x1, y1), (x2, y2), . . . , (xn, yn) um conjunto de observações das variáveis X e Y , respetivamente, Agresti (2010) define o coeficiente referido da seguinte forma:

τb =

C − D

p(n(n − 1)/2 − TX)(n(n − 1)/2 − TY)

onde

• C corresponde ao número de pares concordantes; • D corresponde ao número de pares discordantes; • n é o número de observações;

• TX representa o número de pares empatados na variável X;

(47)

FCUP 29 Identificação de Relações em Dados de Fidelização de Clientes

Um par de observações (xi, yi) e (xj, yj), em que i 6= j, diz-se concordante se xi > xj e yi > yj ou se xi < xj e yi < yj e diz-se discordante se xi > xj e yi < yj ou se xi < xj e yi > yj. No caso de xi = xj ou yi = yj o par não é concordante nem discordante. De facto, tem-se um empate na variável X no primeiro caso e um empate na variável Y no segundo.

3.1.2 Modelos Lineares Generalizados

O conteúdo teórico presente nesta subsecção tem por base Turkman e Silva (2000).

A fim de se abordar o tema Modelos Lineares Generalizados (MLG), é necessária uma breve introdução de notação. Assim, considere-se Y , uma variável aleatória a que se dá o nome de variável resposta, e um vetor x = (x1, . . . , xp)T de p variáveis explicativas, ou covariáveis. A variável resposta Y pode ser contínua, discreta ou dicotómica. As covariáveis podem também ser de qualquer natureza. Assume-se, ainda, que se tem dados da forma (yi, xi), para i = 1, . . . , n, resultantes da realização de (Y, x) em n indivíduos, sendo as componentes Yi do vetor aleatório Y = (Y1, . . . , Yn)T independentes.

Os modelos lineares generalizados pressupõem que a variável resposta tenha uma distribui-ção pertencente à família exponencial (apresentada na subsecdistribui-ção seguinte) e são uma extensão do modelo linear clássico, sendo traduzidos, na forma matricial, pela expressão

Y = Zβ + ,

onde:

• Z é uma matriz de dimensão n × s de especificação do modelo, com s = p + 1;

• β = (β1, . . . , βs)T é um vetor de parâmetros (ou coeficientes), sendo β1 o coeficiente inde-pendente (intercept);

•  é um vetor de erros aleatórios com distribuição que se supõe Nn(0, σ2I).

Assim, os MLG correspondem a uma síntese de vários modelos, como por exemplo: • Modelo de regressão linear clássico;

(48)

• Modelo de regressão logística; • Modelo de regressão de Poisson;

• Modelos log-lineares para tabelas de contingência multidimensionais; • Modelo probit para estudos de proporções.

A escolha do modelo é feita com base no tipo de resposta e no estudo particular em causa. McCullagh e Nelder (1989) e O’Connell (2006) sugerem que, no caso em que a variável resposta é ordinal e apresenta mais de duas categorias (situação em estudo nesta dissertação), deve-se aplicar o modelo logístico de odds proporcionais (uma extensão do modelo de regressão logística). Deste modo, adotou-se o referido modelo. Para mais detalhes sobre este tópico, poderão ser consultadas as referências supramencionadas.

3.1.3 Família exponencial

O conteúdo teórico presente nesta subsecção tem por base Turkman e Silva (2000).

Como referido anteriormente, os modelos lineares generalizados pressupõem que a variável resposta tenha uma distribuição pertencente à família exponencial. Diz-se que uma variável aleatória Y tem distribuição pertencente à família exponencial de dispersão (ou simplesmente família exponencial) se a sua função densidade de probabilidade ou função massa de probabili-dade se puder escrever na forma:

f (y|θ, φ) = exp yθ − b(θ)

a(φ) + c(y, φ) 

, (3.1)

onde θ e φ são parâmetros escalares, a(·), b(·) e c(·) são funções reais conhecidas.

Na definição anterior, θ é a forma canónica do parâmetro de localização e φ é um parâmetro de dispersão suposto, em geral, conhecido. Neste caso, a distribuição descrita em (3.1) faz parte da família exponencial uniparamétrica (diz-se que a distribuição de Y está na forma canónica). Quando o parâmetro φ é desconhecido, a distribuição pode ou não fazer parte da família expo-nencial bi-paramétrica, tal como é geralmente definida. Admite-se, ainda, que a função b(·) é diferenciável e que o suporte da distribuição não depende dos parâmetros. Neste caso, prova-se que a família em consideração obedece às condições habituais de regularidade.

(49)

FCUP 31 Identificação de Relações em Dados de Fidelização de Clientes

3.1.4 Modelo Logístico de Odds Proporcionais

A presente subsecção foi redigida de acordo com O’Connell (2006), Silva João (2012) e Mc-Cullagh e Nelder (1989).

Considerando uma variável resposta com k categorias, o modelo logístico de odds proporcio-nais considera (k − 1) pontos de corte, sendo o j-ésimo ponto de corte baseado na comparação de probabilidades acumuladas através do logit, isto é, o logaritmo natural das odds.

As odds de um evento correspondem ao quociente que compara a probabilidade desse evento ocorrer (designado por "sucesso") com a probabilidade de não ocorrer, isto é, insucesso. Quando a probabilidade de sucesso é maior que a probabilidade de insucesso, o valor de odds é superior a 1; se as duas probabilidades são iguais, então tem-se odds igual a 1; finalmente, caso a probabilidade de sucesso seja menor que a probabilidade de insucesso, o valor de odds será menor que 1, porém superior a 0.

Para estimar o log(odds) de estar numa dada categoria ou abaixo dela, o modelo referido pode ser escrito da seguinte forma:

log  πj(x) 1 − πj(x)  = αj+ (−β1x1− β2x2· · · − βpxp) onde

• πj(x) = π(Y ≤ j|x1, . . . , xp) representa, precisamente, a probabilidade de estar na cate-goria j ou abaixo dela (distribuição cumulativa de probabilidades, dadas p variáveis expli-cativas);

• αj corresponde aos parâmetros desconhecidos de interseção (intercepts) que satisfazem a condição α1 ≤ α2 ≤ · · · ≤ αk−1;

• β = (β1, . . . , βp) é o vetor dos coeficientes de regressão desconhecidos correspondentes a cada variável explicativa.

Os parâmetros de um MLG podem ser estimados usando o método da máxima verosimilhança (MMV), porém, nesta dissertação, não se farão considerações acerca deste método. Para mais detalhes, pode consultar-se Hosmer e Lemeshow (2000).

(50)

O modelo final foi obtido por aplicação do método de eliminação backward stepwise, um pro-cedimento que começa por testar o modelo completo, isto é, com todas as covariáveis existentes e, passo-a-passo, remove a variável com o pior desempenho (Han, Kamber e Pei (2012)). Ideal-mente, este método identifica o menor conjunto de variáveis explicativas a serem consideradas no modelo em causa.

3.1.5 Qualidade do ajuste

Esta subsecção baseia-se no trabalho de Pulkstenis e Robinson (2004).

A qualidade de ajuste de um modelo de regressão logística de odds proporcionais é comum-mente mensurada através do teste χ2de Pearson. Assim, este foi o teste utilizado neste trabalho.

Para isso, definem-se as hipóteses:

H0: o modelo é adequado vs H1: o modelo não é adequado

De seguida, dados uma resposta ordinal (com k níveis) para n observações e um modelo de regressão logística de odds proporcionais com p variáveis explicativas categóricas, é cons-truída uma tabela de contingência. Esta tabela contém os valores observados, Oij (número de indivíduos, obtidos através da base de dados), onde cada linha i corresponde a cada uma das possíveis combinações de categorias das covariáveis (num total de I) e cada coluna j re-presenta uma categoria da variável resposta. Tem-se ainda Eij que representa o número de indivíduos previsto pelo modelo, dados i e j definidos anteriormente.

Assim, a estatística de teste é dada pela seguinte fórmula:

χ2 = I X i=1 k X j=1 (Oij − Eij)2 Eij

Esta estatística de teste segue, aproximadamente, uma distribuição χ2com (I − 1)(k − 1) − p graus de liberdade.

(51)

FCUP 33 Identificação de Relações em Dados de Fidelização de Clientes

3.2 Resultados

Tendo sido calculado o Coeficiente de Correlação Tau-b de Kendall e o respetivo intervalo de confiança a 95% entre a variável Recomendar e cada covariável, verificou-se que, em nenhum caso, este intervalo continha o valor 0. A tabela seguinte contém os valores referidos, para o caso da empresa B, sendo que as tabelas relativas às restantes empresas do grupo podem ser consultadas no Anexo F.

Variável explicativa Coeficiente de Correlação Tau-b de Kendall

Intervalo de confiança a 95% Satisfação (Desempenho geral) 0,621 [0,527;0,714]

Cumprimento de prazos 0,418 [0,302;0,534] Eficácia da entrega 0,364 [0,238;0,490] Condições da entrega 0,415 [0,287;0,543] Resolução de garantias 0,292 [0,166;0,418] Tratamento das devoluções 0,406 [0,289;0,522] Diversidade da oferta 0,529 [0,411;0,647] Atualização da oferta 0,474 [0,358;0,591] Recompra 0,385 [0,233;0,536] Ferramentas online 0,359 [0,226;0,493] Satisfação (Tangíveis) 0,315 [0,171;0,459] Satisfação (Fiabilidade) 0,585 [0,491;0,678] Satisfação (Capacidade de resposta) 0,509 [0,388;0,630] Satisfação (Confiança) 0,583 [0,473;0,693] Satisfação (Empatia) 0,562 [0,452;0,671]

Tabela 3.1: Coeficiente de Correlação Tau-b de Kendall e respetivo IC a 95%, para a empresa B.

Assim, não houve evidência, a nível de 5%, de que os pares de variáveis mencionados não estavam correlacionados, pelo que não foi excluída, à partida, nenhuma variável a ser utilizada no modelo estatístico, para nenhuma empresa.

De seguida, estimaram-se os modelos estatísticos para todas as empresas de acordo com o método da máxima verosimilhança. Como referido anteriormente, os modelos finais foram obti-dos com base no método de eliminação backward stepwise, aplicado através da linguagem R.

(52)

De modo a exemplificar este processo, encontram-se na tabela 3.2 as listas de variáveis seleci-onadas pelo método referido, em cada passo da sua execução, no caso da empresa B. Note-se que, em cada passo, é removida uma variável, até que seja encontrado o menor conjunto de variáveis significativas a serem consideradas no modelo.

Passo Variáveis do modelo

Início

Condições da entrega;

Satisfação (Capacidade de resposta); Satisfação (Tangíveis); Resolução de garantias; Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Satisfação (Fiabilidade); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

Satisfação (Capacidade de resposta); Satisfação (Tangíveis); Resolução de garantias; Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Satisfação (Fiabilidade); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

2º Satisfação (Tangíveis); Resolução de garantias; Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Satisfação (Fiabilidade); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

3º Satisfação (Tangíveis); Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Satisfação (Fiabilidade); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

(53)

FCUP 35 Identificação de Relações em Dados de Fidelização de Clientes

4º Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Satisfação (Fiabilidade); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

5º Satisfação (Confiança); Eficácia da entrega; Ferramentas online; Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

6º Satisfação (Confiança); Eficácia da entrega; Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções.

7º Satisfação (Confiança); Recompra; Satisfação (Empatia); Atualização da oferta; Diversidade da oferta; Satisfação (Desempenho geral);

Cumprimento de prazos; Tratamento das devoluções. 8º

Satisfação (Confiança); Satisfação (Empatia); Atualização da oferta; Diversidade da oferta;

Satisfação (Desempenho geral); Cumprimento de prazos; Tratamento das devoluções. 9º

Satisfação (Empatia); Atualização da oferta; Diversidade da oferta;

Satisfação (Desempenho geral); Cumprimento de prazos; Tratamento das devoluções. Tabela 3.2: Lista de variáveis por passo do método de eliminação backward stepwise, para a empresa B.

Seguidamente, os modelos estatísticos foram novamente estimados para todas as empresas, agora contendo, apenas, as variáveis selecionadas através do método de eliminação backward stepwise. No entanto, como se constata na tabela 3.3, correspondente ao resumo dos resul-tados do modelo de regressão logística de odds proporcionais para a empresa B (estimativa dos coeficientes, erro padrão, estatística de teste e valor-p), conforme o resultado do método referido, este revelou-se ineficaz na seleção das variáveis explicativas a serem consideradas no

(54)

modelo mencionado, uma vez que algumas delas apresentam um valor-p superior a 0,05. De facto, o mesmo ocorreu em algumas das restantes empresas.

Note-se que foi utilizada a seguinte notação na construção da tabela mencionada, bem como nas tabelas apresentadas de seguida:

• P: Promotores • N: Neutros • D: Detratores

Variável Estimativa Erro Padrão Estatística de Teste Valor-p (Intercept D|N) 2,678 0,846 3,166 0,002 (Intercept N|P) 6,910 1,151 6,003 < 0,001 Satisfação (Desempenho geral) - N 2,212 0,717 3,087 0,002 Satisfação (Desempenho geral) - P 3,598 0,948 3,793 < 0,001

Cumprimento de prazos - N 1,894 0,593 3,191 0,001 Cumprimento de prazos - P 1,282 0,674 1,903 0,057 Tratamento das devoluções - N 1,032 0,488 2,117 0,034 Tratamento das devoluções - P 2,319 0,675 3,437 < 0,001

Diversidade da oferta - N 0,875 0,675 1,296 0,195 Diversidade da oferta - P 2,196 0,826 2,659 0,007 Atualização da oferta - N 0,043 0,670 0,064 0,949 Atualização da oferta - P 1,311 0,786 1,669 0.095 Satisfação (Empatia) - N 0,104 0,893 0,116 0,907 Satisfação (Empatia) - P 1,274 0,984 1,294 0,195

Tabela 3.3: Sumário do modelo de regressão logística de odds proporcionais contendo as variáveis selecionadas pelo método de eliminação backward stepwise, para a empresa B.

Esta situação deve-se, provavelmente, a motivos de multicolinearidade, isto é, uma elevada associação entre as várias variáveis explicativas, um problema comum em modelos de regres-são. Assim, a fim de contornar esta adversidade, foram removidas do modelo final todas as variáveis problemáticas, isto é, todas as variáveis que apresentaram um valor-p superior a 0,05 e estimados, novamente, os modelos referidos, para cada uma das empresas.

A tabela 3.4 reúne os resultados do modelo logístico de odds proporcionais produzido (estima-tiva dos coeficientes, erro padrão, estatística de teste e valor-p), bem como os da qualidade do seu ajuste (AIC e valor-p do teste χ2), para a empresa B. As tabelas análogas, para as restantes empresas, podem ser encontradas no Anexo G.

Referências

Documentos relacionados

dois gestores, pelo fato deles serem os mais indicados para avaliarem administrativamente a articulação entre o ensino médio e a educação profissional, bem como a estruturação

Fita 1 Lado A - O entrevistado faz um resumo sobre o histórico da relação entre sua família e a região na qual está localizada a Fazenda Santo Inácio; diz que a Fazenda

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

There a case in Brazil, in an appeal judged by the 36ª Câmara Cível do Tribunal de Justiça do Estado de São Paulo (São Paulo’s Civil Tribunal, 36th Chamber), recognized

Neste estudo foram estipulados os seguintes objec- tivos: (a) identifi car as dimensões do desenvolvimento vocacional (convicção vocacional, cooperação vocacio- nal,

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das