DESENVOLVIMENTO DE MINERAÇÃO DE DADOS QUE AJUDA A MELHORAR OS ÍNDICES DE OCUPAÇÃO NO SETOR HOTELEIRO. Desenvolvimento de Data Mining para ajudar a melhorar as taxas de ocupação no setor hoteleiro.
CONTEXTUALIZAÇÃO
A mineração de dados é uma descoberta eficiente de informações válidas e não óbvias a partir de uma grande coleção de dados (BIGUS, 1996). Outro fator que contribuiu muito para o aumento do interesse pela mineração de dados foi o desenvolvimento de técnicas de aprendizado de máquina – incluindo redes neurais artificiais e algoritmos genéticos – que tornaram mais atrativa a descoberta de relações interessantes em bancos de dados.
PROBLEMA
A proposta de extrair conhecimento de bases de dados surgiu devido à explosão na quantidade de dados armazenados em meios magnéticos e à necessidade de explorá-los, motivada pela “fome de conhecimento”. Quando falamos em mineração de dados, não estamos considerando apenas consultas complexas e extensas que visam ratificar uma hipótese gerada por um usuário com base nas relações existentes entre os dados, mas sim a descoberta de novos fatos, regularidades, restrições, padrões e relacionamentos.
OBJETIVOS
Objetivo geral
Objetivos específicos
Escopo e delimitação do trabalho
JUSTIFICATIVA
ASPECTOS METODOLÓGICOS
Após esta coleta de dados, o sistema foi modelado em UML (Unified Modeling Language), levando em consideração os dados que seriam importados, os dados do armazém que seriam registrados e os relatórios que seriam gerados, com suas respectivas interfaces.
CRM
A técnica de mineração de dados de classificação vem do uso de dados passados (conjunto de treinamento) para classificar dados futuros (conjunto de execução do modelo de classificação ou simplesmente conjunto de execução). RNE.04 – Para salvar os dados, o sistema verifica se todos os dados estão preenchidos e os salva no banco de dados.
O CICLO DE NEGÓCIO DE CRM
Entenda e diferencie
É fundamental para o sucesso do CRM conhecer cada cliente e poder reconhecê-lo em todas as formas de contato feitas com ele, evitando erros como o cliente relatar a mesma coisa mais de uma vez (BUCCI, 2000, p. 5). . Estabeleça um perfil inicial de cada cliente, que deverá ser apurado ao longo do tempo e acrescentado a novas informações, de forma a tratar cada vez melhor cada cliente, fazendo-o sentir-se único e exclusivo, garantindo assim a sua satisfação.
Desenvolva e Personalize
Além de tudo isso, deve-se também tentar coletar e armazenar informações que em algum momento foram negligenciadas pelos operadores do sistema. A personalização tende a desenvolver um tratamento para cada cliente baseado na percepção de valor de cada um.
Interaja e Entregue
Embora não seja o único canal de relacionamento do cliente com a empresa, o Suporte ao Cliente é um dos pontos de contato mais poderosos. Infelizmente, em geral, esta valiosa oportunidade raramente é aproveitada, pois as principais preocupações atuais são a informação a transmitir, o tempo médio de atendimento, o tempo médio de espera, o número de chamadas ou vendas, entre outras que mesmo na visão de CRM podem ser sem importância.
Adquira e Retenha
CRM ANALÍTICO e CRM OPERACIONAL
PERFIL DO CRM NO BRASIL
O CRM NO SETOR TURÍSTICO
DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS
Modelo de DCBD segundo Paula(2004)
Seleção: Devido ao grande volume de dados armazenados, esta etapa é fundamental para o processo, pois determina qual conjunto de dados utilizar, definindo quais tabelas, atributos, relacionamentos e conteúdos serão utilizados. Pré-processamento: Uma vez selecionado o conjunto de dados a ser utilizado, pode ser necessário realizar atividades de pré-processamento para viabilizar as etapas anteriores.
DATA MINING
Como o número de relacionamentos possíveis no banco de dados é muito grande, encontrar os relacionamentos corretos simplesmente verificando cada um deles é proibitivo. E com o aumento significativo no poder de processamento necessário, este se torna um dos primeiros problemas na mineração de dados.
Objetivos primários da mineração de dados
Quando tratamos de mineração de dados, não estamos considerando apenas consultas complexas e elaboradas que visam ratificar hipóteses geradas pelos usuários com base nas relações existentes entre os dados, mas sim a descoberta de fatos, simetrias, restrições e padrões e relações de novos (PACHECO , VELLASCO e LOPES, 1999). Quando devido a tal problema, técnicas estatísticas devem ser aplicadas para avaliar a confiabilidade das relações encontradas (AMARAL, 2001).
Técnicas utilizadas no processo de mineração de dados
- Associação
- Seqüência
- Agrupamentos
- Classificação
Nesse exemplo, pode-se demonstrar como extrair padrões de associações em bancos de dados, o que é um dos pontos essenciais do Data Mining. A técnica Sequence Data Mining é a técnica de associação que adiciona o fator tempo devido ao qual os dados de uma sequência podem ser transformados de forma que permita a aplicação dos algoritmos de associação. Esta descoberta de conhecimento pode então ser usada para prever se um cliente do banco de dados da editora comprará o novo livro.
Técnicas de Auxílio a Mineração de Dados
- Redes Neurais
- Algoritmos Genéticos
- Métodos Estatísticos
- Métodos Lineares
Para Pacheco, Vellasca e Lopes (1999), algoritmos genéticos são modelos estocásticos e probabilísticos de busca e otimização inspirados na evolução natural e. Segundo Pacheco, Vellasco e Lopes (1999, pp. 30–31), alguns dos principais métodos estatísticos são brevemente discutidos conforme descrito abaixo. Segundo, os nós e arcos de um RB treinado geralmente correspondem a diferenças entre variáveis e relações causais, facilitando a interpretação e compreensão do conhecimento codificado na representação (PACHECO, VELLASCO, & LOPES, 1999, pp. 30-31).
A RELEVÂNCIA DO DATA MINING PARA O CRM
Suas interações com eles devem evoluir para campanhas de marketing altamente segmentadas que atinjam desejos e necessidades individuais. O CRM gerencia as interações entre a empresa e o cliente e, quando essa função é executada, coleta as informações coletadas nos bancos de dados, porém, tal armazenamento impede que o setor de marketing consiga filtrar manualmente quais das informações armazenadas são valiosas, por poder para usá-lo de maneiras diferentes. Esses relacionamentos, que são de grande valor e uma vez compreendidos, são utilizados pelos usuários de marketing para focar com precisão suas campanhas de marketing, para chegar o mais próximo possível das necessidades, desejos e atitudes de seus clientes (TREARLING, 2000).
DM NO CONTEXTO DO CRM
Utilizando recursos de informação, a empresa poderá capturar dados sobre seus clientes e armazená-los em bancos de dados gerenciais (data warehouses e data marts - passo 2). Há feedback no processo, pois a empresa tentará aprender e conhecer o cliente a partir do processo de DM (etapa 4) ao coletar os dados do cliente (etapa 3).
Benefícios da Utilização da Técnica
Exemplos de Utilização de CRM e DM
Rede de lojas
Companhia Telefônica
TURISMO
Fatores determinantes da Demanda Turística
Desta forma, segundo Sancho & Pérez (1995, apud FERNANDES, 2000), os fatores determinantes da demanda turística podem ser agrupados como. Fatores relacionados às unidades exigentes: incluem fatores motivacionais, sociológicos, psicológicos, formas de estilo de vida, momentos de lazer, níveis culturais, costumes, crenças e fatores demográficos. Fatores relacionados com os sistemas de marketing e produção: incluem fatores relacionados com os próprios sistemas de marketing (conhecimento e implementação do produto, comunicação global realizada, investimento em publicidade, tecnologias disponíveis para alcançar vendas imediatas, marketing, etc.); factores relacionados com a produção (satisfação de necessidades concretas, qualidade técnica dos produtos, relação qualidade/preço, meios de transporte para distribuição, distância a percorrer até aos mercados de origem, segurança civil e política, higiene) e factores relacionados com a produção competitiva (possibilidade de substituição real em relação aos próprios projetos.
Inventário Turístico
Serviços turísticos: operadora, agência de viagens, transporte turístico, balcão de informações, locadora imobiliária, locadora de veículos, locadora de vídeo, casa de câmbio, banco, espaços para congressos e exposições e loja de artesanato. Assistência médica: maternidade, pronto-socorro, farmácia, hospital, laboratório de análises, centro médico, clínica odontológica, clínica pediátrica e clínica veterinária.
Softwares Analizados
Ferramenta de CRM
TFA – Automação de Força Técnica: Sistema móvel que permite cadastro automático de procedimentos relacionados à assistência técnica. SFA – Sales Force Automation: Permite a comunicação com o ERP por meio de dispositivos portáteis, possibilitando que equipes de vendas externas realizem suas atividades de vendas online ou offline, com tecnologia wireless; A escolha da melhor ferramenta de CRM varia muito dependendo do negócio e também do porte da empresa.
Ferramentas DM
DataEngine do MIT GmbH: usa lógica difusa e algoritmos de rede neural para realizar mineração de dados para ajudar a analisar e monitorar processos técnicos em tempo real. Aira da Hycones: Gera regras IF..THEN, possui QUERY WINDOWS, detecta erros de banco de dados e apresenta conhecimento em forma gráfica e relatórios. Seu software utiliza os princípios da inteligência artificial, que tenta descobrir regras de negócio em um banco de dados que será utilizado em campanhas de marketing.
FERRAMENTA WEKA
A Go Digital é uma empresa especializada em Marketing de Precisão, que possui o primeiro software de Data Mining desenvolvido na América Latina, o Go Mining, que tem como objetivo transformar dados em conhecimento para gerar mais valor no relacionamento com os clientes. Interface) para condução de experimentos de mineração utilizando uma API (Application Program Interface) desenvolvida de forma independente, que pode ser utilizada em aplicações Java (BRAGA et al, 2004). Também pode ser utilizado com instruções de linha de comando e a partir de uma interface gráfica também desenvolvida em JAVA.
Descrição dos pacotes Weka
62. Interface) para realizar experimentos de mineração utilizando uma API (Application Program Interface) desenvolvida de forma independente, que pode ser utilizada em aplicações Java (BRAGA et al, 2004). Classificadores – Implementa diversos tipos de classificadores: árvores de decisão, redes neurais, tabelas de decisão, algoritmos bayesianos, bagging, boosting. Calcula, por ex. o número de atributos com um determinado valor e o número de ocorrências com alguns valores ausentes.
Arquivos de Entrada
Algoritmos WEKA
Associação
Cluster
Classificadores
Interface do WEKA
Na Figura 20 você pode ver a tela do explorador WEKA onde você pode realizar vários experimentos. Na Figura 21 com o arquivo .CSV aberto, você pode ver os atributos que se aplicam ao arquivo na seção Atributos, onde você pode escolher com quais trabalhar. Após selecionar o algoritmo clicando no botão Iniciar, você poderá ver alguns resultados referentes à mineração realizada.
DIFICULDADE DE INTERAÇÃO INVENTÁRIO TURÍSTICO E
Porém, de todos os softwares analisados, esta técnica não pode ser observada, pois o software faz pouco ou nenhum uso dos dados que compõem o inventário turístico. Devido a este fator, a solução a ser desenvolvida irá analisar, através de técnicas de mineração de dados, dados do inventário turístico e da base de dados do hotel, gerar relatórios que auxiliam na tomada de decisão, auxiliando também na utilização do CRM. Este capítulo apresentará as etapas de desenvolvimento deste sistema: coleta de dados (entrevistas); análise de tabelas do sistema Desbravador, criação de tabelas suplementares; modelagem de sistemas; mineração de dados.
ENTREVISTAS JUNTO AOS PROFISSIONAIS DE HOTELARIA
O número de apartamentos em cada hotel também é diferente, por isso foi feito um agrupamento conforme mostrado na Tabela 5. Também foi questionado o tipo de público que visita o hotel, com diferenças entre os resultados conforme mostrado na Tabela 6. A faixa etária dos os proprietários dos hotéis do projeto também variam, portanto as faixas etárias foram criadas conforme mostrado na Tabela 7.
SELEÇÃO DOS DADOS
Tabelas Suplementares
Com base no questionário onde as respostas diziam respeito à necessidade de conhecimento de eventos regionais, como festas, reuniões, congressos, entre outros. Com base no questionário onde as respostas se referiam aos atrativos regionais, como atrações infantis, opções de lazer, atrativos regionais e outros.
PRÉ-PROCESSAMENTO
TRANSFORMAÇÃO
Alterar data e hora: Para gerar o arquivo .csv, o campo datahora foi eliminado para que fossem utilizadas apenas as datas armazenadas no banco de dados. Alteração de campos numéricos: Para gerar o arquivo foi criado um critério onde foram colocados os campos com valores numéricos _0_, uma restrição do WEKA. Alteração na string: Como o algoritmo ARPRIORI não funciona com valores numéricos, os campos contendo datas e valores numéricos receberam o símbolo _ antes e depois do valor.
MINERAÇÃO DE DADOS
Interpretação e Validação
Assim como acontece com a descoberta de conhecimento em bancos de dados, esta etapa da mineração requer a participação de especialistas, mas poucas comparações entre os resultados das pesquisas de especialistas na área e as regras geradas pelo algoritmo têm sido feitas para interpretar os resultados. Após várias sessões de mineração de dados, o resultado obtido foi significativo, mas os dados onde a mineração foi realizada poderiam distorcer muito o resultado, devido ao grande problema que muitos registros foram descartados por incompletude e assim a interpretação dos resultados e seus credibilidade, se preenchidos corretamente seriam diferentes. As regras criadas confirmam a credibilidade das entrevistas com profissionais da área, onde o estado do Paraná ficou em segundo lugar em termos de emprego (23%), e 83% dos entrevistados indicaram que as férias melhoram o emprego. b) Estas regras também podem ser utilizadas para identificar o motivo do melhor emprego em determinados períodos do ano, no caso de feriados em cidade próxima.
MODELAGEM DO SISTEMA
- Requisitos Funcionais dos Sistema
- Requisitos não Funcionais do Sistema
- Regras de Negócio
- Use Cases
RNE.01 - Para acessar o sistema é necessário cadastrar no banco de dados o nome de usuário e senha. RNE.03 – O sistema acessa o banco de dados e verifica qual código está disponível para inserção na tela de cadastro. O gerente do sistema possui mais funções que o operador do sistema, como pode ser visto no caso de uso da Figura 28.
DATA MINING
- Arquivos do Sistema
- Mineração dos Dados
- Protótipo
- Escolha do Algoritmo
CIDADE: Tipo String, contém a cidade do hóspede e se estiver vazia, possui o valor de. OCUPAÇÃO: Tipo String, contém a ocupação do hóspede. Se estiver vazio, o sistema irá preenchê-lo. HOSP_DATAOUT: Tipo de data “aaaa-MM-dd”, contém a data final da hospedagem do hóspede;