• Nenhum resultado encontrado

7 Modelos Recomendados

7.4 Modelo Final – RFMP

7.5.2 Dos Resultados

De um modo geral, é apresentada na Tabela 7.7 uma compilação dos resultados obtidos neste capítulo da tese.

Tabela 7.7: Resumo dos resultados da avaliação final dos modelos.

Análise Métrica Qtd. Clusters Menor Cluster Maior Cluster Taxa Média Acertos Clusters Taxa Acertos RFM / P RFM Modelo Sugerido 20 (0,09%) 2 registros (11,56%) 270 registros 76,00% 88,23% Modelo Final 17 (0,94%) 22 registros (11,56%) 270 registros 81,00% 88,23% RFMP Modelo Sugerido 20 (0,09%) 2 registros (16,10%) 376 registros 59,33% 73,24% Modelo Final 20 (0,94%) 22 registros (13,27%) 310 registros 75,07% 88,74% Conforme observado, a primeira análise (Modelo Sugerido – RFM) gerou um total de 20 clusters ao utilizar a Taxa de Acertos RFM Modelo como métrica para a busca do melhor valor de K, no qual o maior agrupamento ficou com 270 registros e o menor com apenas 2 registros (0,09% do conjunto de dados). Esta quantidade de clusters ficou

semelhante às obtidas pelas análises RFM anteriores. Entretanto, os resultados das taxas qualitativas que mensuram o modelo ficaram maiores, já que a taxa média de acertos dos clusters ficou em 76% e a taxa de acertos RFM do modelo ficou em 88,23%.

Contudo, como o menor cluster ficou com menos de 1% dos registros, assim como outros quatro, o resultado final do modelo não atendeu ao critério inicial estabelecido. Por isso, a pesquisa recomendou um ajuste no modelo para que fosse reduzida a quantidade de grupos com menos de 1%. Assim, os clusters com menos de 1% foram consolidados de acordo com as suas respectivas classificações RFM, ou seja, a regra para que um cluster fosse unificado a outro levou em conta a classificação RFM atribuída a cada agrupamento.

Com estas premissas o estudo deu início aos ajustes necessários que produziram a segunda análise (Modelo Final – RFM). Desta forma, com este modelo a quantidade total de clusters ficou em 17, com o maior contendo os mesmos 270 registros (11,56%) do modelo sugerido e o menor com um total de 22 registros (0,94%), um valor um pouco abaixo do estabelecido, já que por uma diferença mínima de registros (apenas 1,36) este cluster não ficou com 1%.

Neste ponto, vale destacar que o estudo poderia ter manualmente realocado 2 registros de um cluster qualquer para compor o menor agrupamento. Assim, faria com que o critério de performance estabelecido fosse atendido. Porém, a tese cairia no problema de overfitting para o modelo, o que poderia se mostrar ineficaz para efeito de comparação em alguma análise futura. Por isso, o estudo optou por acolher o resultado com o menor cluster com apenas 0,94%, já que ficou dentro de um limite de tolerância aceitável e justificável pela tese.

Com isso, o Modelo Final RFM ficou com apenas 1 cluster com menos de 1%, enquanto que o Modelo Sugerido RFM ficou com cinco. Além disso, a taxa média de acertos dos clusters ficou um pouco maior, variando dos 76% do Modelo Sugerido RFM para 81% no Modelo Final RFM, enquanto que a taxa de acertos RFM do modelo permaneceu nos 88,23%.

Já em relação aos critérios de separação dos clusters, foi possível observar que todos os atributos R, F e M foram utilizados, com destaque para o atributo F, que obteve uma taxa de acerto melhor do que os demais. Entretanto, os clusters classificados como

F+ ficaram com suas taxas de acertos RFM comprometidas, pois ao agrupar os clientes mais frequentes, o modelo teve que colocar em um mesmo cluster clientes com muitas variações nos conteúdos de R e M, o que de certo modo é uma distorção do atributo F.

Ainda assim, vale destacar que o modelo poderia ter sua performance aperfeiçoada se os registros não correspondentes às classificações RFM fossem separados em novos clusters ou inseridos em algum outro com a classificação correlata a dos registros. Mas esta execução ficou para um estudo futuro, já que o objetivo da pesquisa era comparar os modelos RFM com os modelos RMFP.

De todo modo, fica o registro de que as soluções recomendadas no tópico 0 e a reorganização dos dados descritas no tópico 6.4 geraram um efeito positivo nos resultados dos modelos RFM produzidos nesta análise, uma vez que as taxas encontradas ficaram acima daquelas que foram apresentadas nas análises anteriores.

Já em relação aos modelos RFMP, o primeiro deles (Modelo Sugerido RFMP) obteve um total de 20 clusters, com taxa de acertos RFMP em 73,24%, acima dos 61,30% da análise RFMP (Z-Score). Enquanto que a taxa média de acertos dos clusters ficou em 59,33%, resultado ligeiramente maior do que o encontrado na análise RFMP (Z-Score), que foi de 51,81%. Contudo, estes valores ficaram menores dos que os encontrados pelo Modelo RFM Final.

De todo modo, o maior agrupamento ficou com 376 registros (16,10%) e o menor com 2 registros (0,09%), sendo que outros 6 clusters ficaram com menos de 1% do total de clientes, ou seja, uma performance que não atendia ao critério estabelecido pelo estudo. Por isso, da mesma maneira que na análise RFM, a pesquisa recomendou que o modelo fosse reajustado para reduzir a quantidade de grupos com menos de 1%, ao agrupá-los em clusters maiores. Além disso, os ajustes sugeridos também tiveram por objetivo buscar um aumento nas taxas produzidas pelo modelo, o que acabou por produzir o quarto e último modelo (Modelo RFMP – Final).

Sendo assim, uma série de adaptações foram realizadas, não só para que os clusters com menos de 1% fossem consolidados em um único grupo, mas também para que o modelo tivesse um melhor resultado. E isto foi feito a partir de um conjunto de operações, que permitiram ajustar os dados classificados erroneamente para a produção de clusters mais precisos através das classificações RFMP atribuídas aos clusters.

Todos estes ajustes fizeram com que a taxa de acertos RFMP subisse para 88,74%, e a taxa média de acertos dos clusters subisse para 75,07%, ou seja, valores superiores aos que foram encontrados pelo Modelo Sugerido. Entretanto, se comparado ao modelo RFM final, este modelo levou ligeira vantagem já que a taxa de acertos RFM ficou em 88,23%. Porém, vale ressaltar que nenhum ajuste foi feito para aumentar a qualidade do modelo RFM.

Entretanto, apesar de todas as mudanças realizadas, o Modelo Final – RFMP continuou com um total de 20 clusters, de modo que o maior ficou com 310 registros (13,27%) e o menor com apenas de 22 registros (0,94%). Novamente, um valor abaixo do que foi estabelecido, mas dentro de um limite aceitável pela tese. Além disso, vale notar que a variedade de classificações encontradas neste modelo foi maior do que a dos demais.

Já em relação aos atributos R, F, M e P, todos foram utilizados como critério de separação pelo modelo, sendo que os atributos F e P foram os mais estáveis em relação à classificação RFMP. Entretanto, a inclusão do atributo P continuou a trazer uma dificuldade a mais para o modelo, pois durante todas estas transformações foi possível observar que os clusters com classificação positiva ou negativa do atributo P obtiveram taxas de acertos mais baixas. Porém, isto não foi ocasionado pela assertividade deste atributo, mas sim pelo fato de que para acertar as taxas de P, o modelo teve que sacrificar a assertividade dos demais atributos, em especial os atributos R e M.

Por fim, destaca-se que as sugestões recomendadas nos tópicos 0 e 6.4 também melhoram o resultado do modelo RFMP, já que que as taxas obtidas foram superiores àquelas encontradas nas análises RFMP anteriores.