• Nenhum resultado encontrado

LIMPEZA CODIFICAÇÃO

2.7 A mineração de dados

2.7.2 Categorias de mineração de dados

As técnicas de mineração de dados, com aplicação mais direcionada ao marketing e às estratégias de relacionamento com clientes, podem ser agrupadas em seis grandes categorias de análise (DAVIDSON E SOUKUP, 2002; BERRY E LINOFF, 2004), conforme mostra a Figura 11:

Figura 11 - Categorias de mineração de dados Fonte: Elaborada pelo autor

Mineração de dados

Classificação Estimação Predição Associação Segmentação Descrição

Conforme destaca a Figura 11, as três primeiras categorias (classificação, estimação e predição, destacadas em linhas verticais) são referidas por Berry e Linoff (2004) como mineração de dados direcionada, pois seu objetivo é obter um valor para uma determinada variável alvo. As duas categorias seguintes (associação e agrupamento, destacadas em linhas horizontais) são classificadas como mineração de dados não direcionada, pois o objetivo é igualmente descobrir padrões nos dados, porém sem se remeter a uma determinada variável alvo. A última categoria assinalada pelos autores, a descrição (destacada em linhas diagonais), pode ser tanto direcionada, quanto não direcionada. O termo “direcionada” é também encontrado na literatura como “supervisionada”. Pyle (2003) explica que o termo “supervisionada” é uma terminologia americana, enquanto que o termo “direcionada” é uma terminologia européia para referir-se ao modo como a mineração de dados é conduzida. Quando a mineração de dados é “direcionada” ou “supervisionada”, pressupõe-se a realização da modelagem do comportamento de uma determinada variável resposta, enquanto para a mineração de dados “não direcionada” ou “não supervisionada”, não se pressupõe a existência de tal variável resposta (PYLE, 2003). Cada uma das categorias de análise podem ser assim descritas:

- Classificação: Consiste em examinar as características de um objeto e atribuí-lo a um

conjunto pré-definido de classes. De acordo com Berry e Linoff (2004), objetos a serem classificados normalmente são representados por registros em uma base de dados. O processo de classificação se caracteriza por uma especificação das classes e um conjunto de registros já classificados. O propósito deste tipo de análise é construir um modelo que possa ser aplicado a dados não classificados, de modo a classificá-los. Por exemplo, para a aplicação de uma estratégia de cross-selling com o objetivo de elevar o valor que cada cliente traz para a empresa, pode ser necessário o conhecimento sobre quem são os clientes com maior potencial a adquirir um determinado produto ou serviço. A empresa pode utilizar este conhecimento criado a partir da aplicação de técnicas de mineração de dados para direcionar as campanhas que suportem suas estratégia de vendas (BERRY e LINOFF, 2004).

Davidson e Soukup (2002) comentam que a utilização de atividades de classificação de clientes em empresas do setor de serviços é intensa, destacando que empresas de serviços financeiros freqüentemente categorizam pedidos de empréstimo como aceitável ou não aceitável (em função de uma série de critérios como risco e rentabilidade), empresas de seguros decidem se um cliente têm ou não propensão a adquirir um determinado tipo de

seguro e empresas de internet determinam que tipo de propaganda é mais provável de obter uma resposta de um determinado tipo de cliente.

As tarefas de classificação de clientes, baseadas em dados a seu respeito, tornam-se possíveis com a aplicação de técnicas de mineração de dados que exploram as bases de dados de clientes e procuram descobrir padrões e similaridades no comportamento dos clientes, de forma a classificá-los em determinadas categorias de interesse da empresa.

- Estimação: o objetivo das técnicas alocadas a esta categoria é atribuir um valor a cada cliente, valor este que é contínuo. Davidson e Soukup (2002) destacam a semelhança entre técnicas de estimação e técnicas de classificação, diferença que recai basicamente ao formato da variável alvo ou variável dependente, que no caso da classificação é discreta (formada por um conjunto limitado de categorias) e no caso da estimação, tende a ser uma variável de natureza contínua (com uma quantidade ilimitada de possíveis valores) . Uma estratégia de aquisição de clientes pode necessitar do conhecimento de quem são os prospects (ou potenciais clientes) com maior propensão de gerarem receita no primeiro ano de relacionamento com a empresa. Este conhecimento pode orientar a empresa na escolha dos clientes potencialmente mais rentáveis e alavancar a receita da empresa.

- Predição: Há uma grande semelhança entre as três categorias de análise, classificação, estimação e predição. Todas utilizam um conjunto de variáveis ou inputs (na linguagem estatística, variáveis independentes) para gerar o resultado de um output (na linguagem estatística, uma variável dependente). Conforme destacam Berry e Linoff (2004), a diferença é que na predição, o objetivo é estimar o comportamento futuro de uma determinada variável. Muitas aplicações envolvendo relacionamento com clientes utilizam técnicas de predição para estimar o valor vitalício do cliente (do inglês, LTV - lifetime value), de modo a gerar conhecimento sobre quais clientes gerarão receita para a empresa nos próximos períodos de tempo. Este conhecimento subsidia as estratégias de retenção de clientes, focalizando esforços nos clientes com maior potencial de receita, baseado em seu histórico comportamental de utilização de produtos e serviços oferecidos pela empresa.

- Associação: Diferentemente das três categorias anteriores, o propósito das técnicas de associação não é estimar nem gerar qualquer output específico, mas sim estabelecer o grau de correlação ou afinidade entre duas ocorrências. Conforme mencionam Davidson e Soukup (2002), a associação está preocupada em identificar quais entidades ou itens são mais prováveis de coexistirem na mesma situação. As técnicas de associação têm o potencial de gerar regras a partir de dados e subsidiar estratégias de relacionamento com clientes quando

geram o conhecimento de qual a tendência de um cliente adquirir um produto ou serviço, dado que possuem outro.

- Segmentação: Envolve o processo de dividir uma população heterogênea em um número de subgrupos ou clusters mais homogêneos ou semelhantes entre si. A segmentação pode ser prelúdio de outras formas de mineração de dados (DAVIDSON e SOUKUP, 2002; BERRY e LINOFF, 2004) por fornecer subsídios que permitam a utilização de técnicas pertencentes a outras categorias de mineração de dados. A base de dados de clientes pode ser segmentada com base em seu perfil demográfico e os clusters ou subgrupos encontrados podem ser utilizados para o desenvolvimento de modelos de propensão ao cancelamento, específicos para cada cluster, que subsidiem o desenvolvimento de estratégias segmentadas de retenção de clientes.

- Descrição: Conforme apresentado na Figura 11, pode ser utilizada tanto como técnica de mineração direcionada, quanto não direcionada. O objetivo do negócio, bem como do estudo em questão, indicará o tipo de técnica a ser utilizada. Berry e Linoff (2004) citam que determinadas técnicas podem ser utilizadas para obter o perfil de clientes, com relação a uma determinada variável alvo (ou variável dependente), assim como outras podem ser utilizadas para a obtenção de perfis descritivos não diretamente relacionados a uma variável específica. Peacock (1998) considera úteis as técnicas de descrição na tarefa de compreender a estrutura dos dados, para identificar problemas de conteúdo dos dados e interpretações erradas que possam surgir em decorrência da análise.A Figura 12 mostra as principais técnicas de mineração de dados observadas na literatura, aplicadas ao relacionamento com clientes:

Figura 12 - Técnicas de mineração de dados identificadas na literatura Fonte: Elaborada pelo autor

Classificação Árvores de Decisão Análise Discriminante Estimação Predição Segmentação Associação Descrição Séries Temporais Árvores de Decisão Árvores de Decisão Redes Neurais Redes Neurais Redes Neurais Análise de Cestas de Mercado Análise de Sobrevivência Análise Exploratória de Dados Regressão

Linear Múltipla Regressão Logística

Visualização de Dados Árvores de Decisão Redes Neurais Análise de Agrupamentos Análise de Componentes Principais Classificação Árvores de Decisão Análise Discriminante Estimação Predição Segmentação Associação Descrição Séries Temporais Árvores de Decisão Árvores de Decisão Redes Neurais Redes Neurais Redes Neurais Análise de Cestas de Mercado Análise de Sobrevivência Análise Exploratória de Dados Regressão

Linear Múltipla Regressão Logística

Visualização de Dados Árvores de Decisão Redes Neurais Análise de Agrupamentos Análise de Componentes Principais

A Figura 12 apresenta as técnicas identificadas na literatura sobre mineração de dados, sobretudo aquelas com aplicação específica na área de marketing e gestão de relacionamento com clientes. Algumas técnicas como árvores de decisão e redes neurais estão presentes em mais de uma categoria de mineração, em função de sua amplitude de uso a partir dos dados. A seção 2.7.3 descreve as técnicas de mineração de dados identificadas na literatura para o subsídio à criação de estratégias de relacionamento com clientes.