• Nenhum resultado encontrado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

N/A
N/A
Protected

Academic year: 2021

Share "Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado"

Copied!
5
0
0

Texto

(1)

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Alessandro Ferreira Brito1, Rodrigo Augusto R. S. Baluz1, Jean Carlo Galvão Mourão1, Francisco das Chagas Rocha2

1Bacharelado em Sistemas de Informação – Faculdade Piauiense – FAP/Parnaíba CEP 64.202-260 – Parnaíba – PI – Brasil

2Bacharelado em Ciência da Computação - Universidade Estadual do Piauí – UESPI CEP 64.200-200 – Parnaíba – PI – Brasil

{alekaue.brito, rodrigobaluz, rochaphb, jcgmourao}@gmail.com

Abstract. The information has been playing a key role in the development and success of large organizations, assisting managers in making a decision.

Database for Knowledge Discovery is the science that aims to extract knowledge from large data repository industries, governments and corporations. This paper aims to contribute to the strategic decision making in supermarkets through data mining techniques, finding the main associations between products. Using WEKA tool, applied the Apriori algorithm, such as association rule in a database of a supermarket. The results may be used to draw strategic marketing, such as: organizing products on the shelves and develop attractive promotions in order to attract more customers to the company..

Resumo. A informação vem desempenhando um papel fundamental no desenvolvimento e sucesso das grandes organizações, auxiliando os gestores numa tomada de decisão. Descoberta de Conhecimento em Banco de Dados é a ciência que tem como objetivo extrair conhecimento de grande repositório de dados de indústrias, governos e corporações. Esse trabalho tem como objetivo contribuir para a tomada de decisão estratégica em supermercados por meio das técnicas de mineração de dados, encontrando as principais associações entre produtos. Utilizando a ferramenta WEKA, aplicou-se o algoritmo Apriori, como regra de associação em uma base de dados de um supermercado. Os resultados obtidos poderão ser usados para traçar estratégicas de marketing, como: organizar os produtos nas gôndolas e elaborar promoções atrativas, a fim de atrair mais clientes para a empresa.

1. Introdução

Com os avanços da tecnologia da informação e da comunicação as organizações estão inovando, melhorando a forma de armazenar suas informações, assim como aumentando a capacidade de guardar mais dados. Com isso, as empresas têm a falsa impressão de que estão bem informadas. Mas a enorme quantidade de dados guardados nos bancos de dados não traz conhecimento, sem que antes seja feita uma análise ou se use uma técnica para descobrir padrões de comportamento nesses dados. Processar e analisar as

(2)

informações geradas pelas enormes quantidades de dados atuais de forma correta está entre os requisitos essenciais para uma boa tomada de decisão.

O presente trabalho tem como objetivo contribuir para a tomada de decisão estratégica em um supermercado por meio das técnicas de data mining (Regra de Associação), encontrando as principais associações entre produtos. Seus objetivos específicos são verificar quais produtos estão associados a outro através da associação de compra por segmento de produtos, contribuir com uma melhor disposição de produtos na área de venda, auxiliar na oferta de itens que sejam atrativos para o público da região e analisar os resultados obtidos com a aplicação de data mining. A ferramenta usada na pesquisa foi o sistema WEKA (Waikato Environment for Knowledge Analysis) que auxiliou na obtenção dos resultados.

Este artigo está organizado em seis seções, incluindo esta Introdução. Na seção 2, abordamos o conceito da importância da gestão do conhecimento em grandes volumes de dados. A inteligência de negócios através do uso da técnica de Data Mining foi o abordado na seção 3. Na seção quatro, foram apresentados matérias e métodos utilizados para desenvolvimento da pesquisa, com destaques para a ferramenta WEKA e o algoritmo Apriori. Já na seção 5 apresentamos e discutimos alguns dos resultados obtidos na pesquisa. Finalizando, com a seção das considerações finais e trabalhos futuros.

2. Gestão do Conhecimento

Atualmente, o grande volume de dados gerados pelas organizações vem crescendo bastante. Porém, a grande dificuldade é extrair informação útil dessa enorme quantidade de dados. Entretanto, isso vem se tornando algo desafiador. Avanços nos estudos de técnicas para transformar esses dados em conhecimento vêm trazendo resultados satisfatórios para os empresários.

As ferramentas e técnicas empregadas para análise automática e inteligente destes dados são os objetivos tratados pelo campo, emergentes da Descoberta de Conhecimento em Banco de Dados (DCBD), da expressão em inglês Knowledge Discovery in Databases (KDD) (SILVA, 2004).

3. Inteligência de Negócios com Data Mining

As técnicas de Data Mining podem ser aplicadas em diversas áreas do conhecimento, como no caso dos supermercados. A sua principal característica é a aplicação dos algoritmos aos dados pré-processados, com o objetivo de ajudar as empresas a gerarem indicadores numéricos, indicadores gráficos, relatórios onde o analista defina o que deseja obter no momento da consulta, através de aplicações que possam servir de apoio à decisão nos diferentes níveis, sejam eles estratégicos, táticos ou operacionais (GOUVEIA, 2009).

Antes de chegar à mineração dos dados temos que passar por vários passos, seleção dos dados, pré-processamento, transformação e depois de minerar vem o pós- processamento que é a análise dos resultados (TAN, STEINBACH e KUMAR, 2009).

O pré-processamento é transformar os dados de entrada brutos em um formato apropriado para as análises seguintes. Esse processo envolve a fusão de dados de

(3)

múltiplas fontes, a limpeza dos dados, verificação de campos duplicados e seleção dos registros. Esta etapa é a mais trabalhosa e demorada no processo de descoberta do conhecimento.

Data Mining é o núcleo do processo de descoberta de conhecimento onde são aplicados os algoritmos de mineração para extração dos conhecimentos dos dados pré- processados.

O pós-processamento é a avaliação e interpretação das descobertas, ordenação das descobertas interessantes e mapeamento de representações de conhecimento. Trata- se da etapa que assegura que os resultados obtidos são válidos e úteis para apoiar as decisões. Geralmente são apresentados em forma de gráficos ou relatórios.

4. Materiais e Métodos

Para a realização do trabalho, primeiro foi essencial obter uma base de dados que pudesse servir de estudo de caso para o projeto. Com a aquisição do banco de dados o próximo passo foi fazer um backup do banco para outra máquina, para ser usada como base de teste, permitindo assim o estudo sobre o mesmo, verificando suas tabelas e seus relacionamentos assim como também realizando o levantamento do universo de registros das vendas correspondentes ao período de janeiro de 2012 até dezembro de 2013, totalizando 117.537 transações no período analisado. Para essa pesquisa foi considerada venda toda a operação iniciada no caixa com abertura de Cupom Fiscal (CF) e finalizada pelo mesmo.

Uma prática na execução do projeto é tentar extrair padrões interessantes, utilizando técnicas de mineração de dados em uma base de dados de um determinado supermercado. Padrões estes que podem auxiliar na gestão de venda de empresas desse ramo. Com isso, foram pautadas algumas etapas para se chegar ao resultado esperado.

Essas etapas foram realizadas de acordo com o processo de KDD. Todo processo de KDD que está relacionado às etapas de pré-processamento, limpeza, transformação dos dados, aplicação de DM, utilização do algoritmo de regra de associação, Apriori e resultados finais, foram baseados nos princípios apresentados até aqui.

Para que acontecesse a conexão do WEKA com o BD, foi necessário o driver

“mysql-connector-java-5.1.31-bin.jar”, a configuração do arquivo “DatabaseUtils.props”

que fica dentro de weka.jar e do SGBD MySql. Depois da conclusão da conexão WEKA com o BD, o usuário pode fazer consultas direto no BD usando o ambiente WEKA.

Somente a partir daí que os dados serão enviados para o ambiente de pré- processamento, para que alguma técnica de DM seja utilizada.

Nesse trabalho, a tarefa realizada foi associar produtos em transações de venda, para uma análise de cesta de compra. Para esta tarefa, foi utilizada uma regra de associação com o algoritmo Apriori, utilizando a ferramenta WEKA.

Para a realização da regra de associação, o primeiro passo foi fazer a conexão com o BD, trazendo para o ambiente WEKA os produtos a serem minerados. Logo em seguida, esses produtos são transferidos para o ambiente Exploder para pré- processamento, através do comando Select da linguagem SQL.

(4)

Na área de pré-processamento, o WEKA fornece a opção de escolher os atributos a serem trabalhados e, se necessário, pode-se aplicar algum filtro para adequar as técnicas a serem utilizadas. No trabalho em questão não foi necessário utilizar essas funcionalidades da ferramenta, pois todo o processo de adequação dos itens foi feito antes, via programação SQL utilizando o SGBD Firebird e a ferramenta IBExpert.

Como o WEKA possibilita trabalhar com consulta, programação SQL, dentro do próprio ambiente, após a conexão com o BD, pode-se fazer a seleção dos atributos antes de enviá-los para o ambiente Exploder.

5. Análise dos Resultados

Foram realizados cinco experimentos, cada um com vários testes alterando as métricas de suporte mínimo que determina a porcentagem mínima exigida em que os produtos estejam contidos nas transações e também a confiança que determina a porcentagem das transações que, contendo um produto ou mais de um, tenha outro associado.

A maior associação encontrada foi entre açúcar_docevida e café_staclara250g_alm, a qual aconteceu 9.422 vezes no período analisado. O interessante dessa associação, açúcar_docevida e café_staclara250g_alm, é a sua confiança, que foi de 100%. Indicando que a cada 100 transações com produtos açúcar_docevida é possível que o consumidor adquira 100 vezes o café_staclara250g_alm.

Nesta primeira mineração, o ponto de corte estabelecido para o algoritmo Apriori foi para as compras com suporte acima de 760 e confiança de 45% a 100%. Para a análise foram selecionados 37.864 registros e 112 produtos. Agora, o ponto de corte estabelecido foi com o suporte maior que 300 e confiança de 45% a 100%, para os dados de janeiro até março de 2013. Assim, buscam-se as maiores frequências de compra no comportamento do consumidor.

A compra associada dos produtos lanche_friella e queijo_muss na mesma transação ocorreram 646 vezes (suporte) no período indicado. Desta forma, 646 vezes por 25 dias em média que um supermercado trabalha no mês, esta compra ocorreu em média 6,46 vezes ao dia. A confiança da associação lanche_friella e queijo_muss foi 87%. Podemos dizer que a cada 100 vezes que o produto lanche_friella é registrado, o produto queijo_muss está em 87 vezes. Com essa associação, podemos observar o comportamento dos clientes em relação às marcas que são vendidas.

No período de outubro até dezembro de 2013, nota-se que a maior associação foi entre sabão_lavabembaj_azul1kg e sals_hotdog. A compra associada dos produtos sabão_lavabembaj_azul1kg e sals_hotdog na mesma transação somaram 310 vezes (suporte) no período. Contudo, no cálculo de divisão do suporte 310 vezes, pelos dias (26) trabalhados no mês, essa compra ocorreu em média 3,97 vezes ao dia. A confiança da associação sabão_lavabembaj_azul1kg e sals_hotdog foi de 100%.

6. Considerações Finais

Verificou-se com a pesquisa que, com a técnica de Data Mining, podemos extrair informações que muitas vezes encontram-se escondidas nos bancos de dados das empresas e não são aproveitadas para gerar conhecimento. Assim, o Data Mining pode descobrir índices de suporte e confiança no banco de dados que podem facilitar decisões

(5)

dos gestores, possibilitando a conclusão de que as regras de associação tendem a facilitar o processo de tomada de decisão, fornecendo dados que vão auxiliar num plano de marketing, na exposição do mix de produtos no ponto de venda, bem como na melhoria do layout de distribuição dos produtos na gôndola.

Com relação às associações das transações estudadas, é interessante a forma como alguns produtos aparecem associados a outros. Os produtos açúcar_docevida e cafe_staclara250g_alm aparecem associados praticamente a todas as operações e com valores de suporte e confiança consideráveis. Juntos eles somaram 9.422 transações, indicando a importância desses produtos perante os consumidores.

Para a elaboração de promoções, o sugerido é a criação e implantação de combos num supermercado, onde o resultado da regra de associação pode indicar períodos melhores para determinadas ofertas como, por exemplo, períodos festivos do ano e feriados.

Dentre algumas dificuldades encontradas durante o trabalho, uma delas foi o processo de obtenção da base de dados. Devido a não normalização dos dados contidos na base de dados em estudo, o trabalho ficou limitado a analisar as associações de produtos entre períodos e desprezando o quesito associação entre categorias.

Como trabalhos futuros propomos um estudo sobre o perfil de clientes que compram num determinado supermercado (faixa etária, estado civil, etc.), classe social, forma de pagamento. Para a realização desta tarefa seria necessária a relação cliente  saída, ou seja, o cliente cadastrado no banco teria que está associado ao registro de venda.

Referências

BRITO, Alessandro Ferreira (2014) “Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado”, Trabalho de Conclusão de Curso, Faculdade Maurício de Nassau, Parnaíba, PI.

GOUVEIA, Roberta Macêdo Marques (2009) “Mineração de dados em Data Warehouse para Sistema de Abastecimento de Água”. Dissertação (Mestrado em Informática).

Centro de Ciências Exatas e da Natureza Departamento de Informática. Universidade Federal da Paraíba: João Pessoa.

SILVA, Macelino Pereira dos Santos (2014) “Mineração de Dados – Conceitos, Aplicações e Experimentos com Weka”.

TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin (2009) “Introdução ao Data Mining”. Rio de Janeiro: Ciência Moderna.

Referências

Documentos relacionados

Como pontos fortes, destacam-se a existência de iniciativas já em- preendidas em torno da aprovação de um Código de classificação e uma Ta- bela de temporalidade e destinação

A interação treinamento de natação aeróbico e dieta rica em carboidratos simples mostraram que só treinamento não é totalmente eficiente para manter abundância de

Atualmente os currículos em ensino de ciências sinalizam que os conteúdos difundidos em sala de aula devem proporcionar ao educando o desenvolvimento de competências e habilidades

 Ao clicar no botão Congurar Apresentação de Slides , uma caixa de diálogo será aberta (gura 59), para que congurações sejam estabelecidas, tais como tipo

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar

BARHAM, 1982 (2), define as diferenças conceituais e campos de ação, tanto para en­ sino como investigação, entre Biomecânica e Cinesiologia Mecânica. Não trataremos

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

Principais fontes de financiamento disponíveis: Autofinanciamento: (corresponde aos fundos Principais fontes de financiamento disponíveis: Autofinanciamento: (corresponde aos