• Nenhum resultado encontrado

universidade do vale do itajaí - IIS Windows Server

N/A
N/A
Protected

Academic year: 2023

Share "universidade do vale do itajaí - IIS Windows Server"

Copied!
120
0
0

Texto

DESENVOLVIMENTO DE MINERAÇÃO DE DADOS QUE AJUDA A MELHORAR OS ÍNDICES DE OCUPAÇÃO NO SETOR HOTELEIRO. Desenvolvimento de Data Mining para ajudar a melhorar as taxas de ocupação no setor hoteleiro.

CONTEXTUALIZAÇÃO

A mineração de dados é uma descoberta eficiente de informações válidas e não óbvias a partir de uma grande coleção de dados (BIGUS, 1996). Outro fator que contribuiu muito para o aumento do interesse pela mineração de dados foi o desenvolvimento de técnicas de aprendizado de máquina – incluindo redes neurais artificiais e algoritmos genéticos – que tornaram mais atrativa a descoberta de relações interessantes em bancos de dados.

PROBLEMA

A proposta de extrair conhecimento de bases de dados surgiu devido à explosão na quantidade de dados armazenados em meios magnéticos e à necessidade de explorá-los, motivada pela “fome de conhecimento”. Quando falamos em mineração de dados, não estamos considerando apenas consultas complexas e extensas que visam ratificar uma hipótese gerada por um usuário com base nas relações existentes entre os dados, mas sim a descoberta de novos fatos, regularidades, restrições, padrões e relacionamentos.

OBJETIVOS

Objetivo geral

Objetivos específicos

Escopo e delimitação do trabalho

JUSTIFICATIVA

ASPECTOS METODOLÓGICOS

Após esta coleta de dados, o sistema foi modelado em UML (Unified Modeling Language), levando em consideração os dados que seriam importados, os dados do armazém que seriam registrados e os relatórios que seriam gerados, com suas respectivas interfaces.

CRM

A técnica de mineração de dados de classificação vem do uso de dados passados ​​(conjunto de treinamento) para classificar dados futuros (conjunto de execução do modelo de classificação ou simplesmente conjunto de execução). RNE.04 – Para salvar os dados, o sistema verifica se todos os dados estão preenchidos e os salva no banco de dados.

Figura 1.Tempo de vendas. MANUAL x CRM  FONTE Adaptado de Valente (2002).
Figura 1.Tempo de vendas. MANUAL x CRM FONTE Adaptado de Valente (2002).

O CICLO DE NEGÓCIO DE CRM

Entenda e diferencie

É fundamental para o sucesso do CRM conhecer cada cliente e poder reconhecê-lo em todas as formas de contato feitas com ele, evitando erros como o cliente relatar a mesma coisa mais de uma vez (BUCCI, 2000, p. 5). . Estabeleça um perfil inicial de cada cliente, que deverá ser apurado ao longo do tempo e acrescentado a novas informações, de forma a tratar cada vez melhor cada cliente, fazendo-o sentir-se único e exclusivo, garantindo assim a sua satisfação.

Desenvolva e Personalize

Além de tudo isso, deve-se também tentar coletar e armazenar informações que em algum momento foram negligenciadas pelos operadores do sistema. A personalização tende a desenvolver um tratamento para cada cliente baseado na percepção de valor de cada um.

Interaja e Entregue

Embora não seja o único canal de relacionamento do cliente com a empresa, o Suporte ao Cliente é um dos pontos de contato mais poderosos. Infelizmente, em geral, esta valiosa oportunidade raramente é aproveitada, pois as principais preocupações atuais são a informação a transmitir, o tempo médio de atendimento, o tempo médio de espera, o número de chamadas ou vendas, entre outras que mesmo na visão de CRM podem ser sem importância.

Adquira e Retenha

CRM ANALÍTICO e CRM OPERACIONAL

PERFIL DO CRM NO BRASIL

O CRM NO SETOR TURÍSTICO

DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS

Modelo de DCBD segundo Paula(2004)

Seleção: Devido ao grande volume de dados armazenados, esta etapa é fundamental para o processo, pois determina qual conjunto de dados utilizar, definindo quais tabelas, atributos, relacionamentos e conteúdos serão utilizados. Pré-processamento: Uma vez selecionado o conjunto de dados a ser utilizado, pode ser necessário realizar atividades de pré-processamento para viabilizar as etapas anteriores.

DATA MINING

Como o número de relacionamentos possíveis no banco de dados é muito grande, encontrar os relacionamentos corretos simplesmente verificando cada um deles é proibitivo. E com o aumento significativo no poder de processamento necessário, este se torna um dos primeiros problemas na mineração de dados.

Objetivos primários da mineração de dados

Quando tratamos de mineração de dados, não estamos considerando apenas consultas complexas e elaboradas que visam ratificar hipóteses geradas pelos usuários com base nas relações existentes entre os dados, mas sim a descoberta de fatos, simetrias, restrições e padrões e relações de novos (PACHECO , VELLASCO e LOPES, 1999). Quando devido a tal problema, técnicas estatísticas devem ser aplicadas para avaliar a confiabilidade das relações encontradas (AMARAL, 2001).

Técnicas utilizadas no processo de mineração de dados

  • Associação
  • Seqüência
  • Agrupamentos
  • Classificação

Nesse exemplo, pode-se demonstrar como extrair padrões de associações em bancos de dados, o que é um dos pontos essenciais do Data Mining. A técnica Sequence Data Mining é a técnica de associação que adiciona o fator tempo devido ao qual os dados de uma sequência podem ser transformados de forma que permita a aplicação dos algoritmos de associação. Esta descoberta de conhecimento pode então ser usada para prever se um cliente do banco de dados da editora comprará o novo livro.

Tabela 2. Exemplo de Regra de Classificação
Tabela 2. Exemplo de Regra de Classificação

Técnicas de Auxílio a Mineração de Dados

  • Redes Neurais
  • Algoritmos Genéticos
  • Métodos Estatísticos
  • Métodos Lineares

Para Pacheco, Vellasca e Lopes (1999), algoritmos genéticos são modelos estocásticos e probabilísticos de busca e otimização inspirados na evolução natural e. Segundo Pacheco, Vellasco e Lopes (1999, pp. 30–31), alguns dos principais métodos estatísticos são brevemente discutidos conforme descrito abaixo. Segundo, os nós e arcos de um RB treinado geralmente correspondem a diferenças entre variáveis ​​e relações causais, facilitando a interpretação e compreensão do conhecimento codificado na representação (PACHECO, VELLASCO, & LOPES, 1999, pp. 30-31).

Figura 15 Árvore de Decisão  Fonte: Adaptado Sanches (2003).
Figura 15 Árvore de Decisão Fonte: Adaptado Sanches (2003).

A RELEVÂNCIA DO DATA MINING PARA O CRM

Suas interações com eles devem evoluir para campanhas de marketing altamente segmentadas que atinjam desejos e necessidades individuais. O CRM gerencia as interações entre a empresa e o cliente e, quando essa função é executada, coleta as informações coletadas nos bancos de dados, porém, tal armazenamento impede que o setor de marketing consiga filtrar manualmente quais das informações armazenadas são valiosas, por poder para usá-lo de maneiras diferentes. Esses relacionamentos, que são de grande valor e uma vez compreendidos, são utilizados pelos usuários de marketing para focar com precisão suas campanhas de marketing, para chegar o mais próximo possível das necessidades, desejos e atitudes de seus clientes (TREARLING, 2000).

DM NO CONTEXTO DO CRM

Utilizando recursos de informação, a empresa poderá capturar dados sobre seus clientes e armazená-los em bancos de dados gerenciais (data warehouses e data marts - passo 2). Há feedback no processo, pois a empresa tentará aprender e conhecer o cliente a partir do processo de DM (etapa 4) ao coletar os dados do cliente (etapa 3).

Benefícios da Utilização da Técnica

Exemplos de Utilização de CRM e DM

Rede de lojas

Companhia Telefônica

TURISMO

Fatores determinantes da Demanda Turística

Desta forma, segundo Sancho & Pérez (1995, apud FERNANDES, 2000), os fatores determinantes da demanda turística podem ser agrupados como. Fatores relacionados às unidades exigentes: incluem fatores motivacionais, sociológicos, psicológicos, formas de estilo de vida, momentos de lazer, níveis culturais, costumes, crenças e fatores demográficos. Fatores relacionados com os sistemas de marketing e produção: incluem fatores relacionados com os próprios sistemas de marketing (conhecimento e implementação do produto, comunicação global realizada, investimento em publicidade, tecnologias disponíveis para alcançar vendas imediatas, marketing, etc.); factores relacionados com a produção (satisfação de necessidades concretas, qualidade técnica dos produtos, relação qualidade/preço, meios de transporte para distribuição, distância a percorrer até aos mercados de origem, segurança civil e política, higiene) e factores relacionados com a produção competitiva (possibilidade de substituição real em relação aos próprios projetos.

Inventário Turístico

Serviços turísticos: operadora, agência de viagens, transporte turístico, balcão de informações, locadora imobiliária, locadora de veículos, locadora de vídeo, casa de câmbio, banco, espaços para congressos e exposições e loja de artesanato. Assistência médica: maternidade, pronto-socorro, farmácia, hospital, laboratório de análises, centro médico, clínica odontológica, clínica pediátrica e clínica veterinária.

Softwares Analizados

Ferramenta de CRM

TFA – Automação de Força Técnica: Sistema móvel que permite cadastro automático de procedimentos relacionados à assistência técnica. SFA – Sales Force Automation: Permite a comunicação com o ERP por meio de dispositivos portáteis, possibilitando que equipes de vendas externas realizem suas atividades de vendas online ou offline, com tecnologia wireless; A escolha da melhor ferramenta de CRM varia muito dependendo do negócio e também do porte da empresa.

Ferramentas DM

DataEngine do MIT GmbH: usa lógica difusa e algoritmos de rede neural para realizar mineração de dados para ajudar a analisar e monitorar processos técnicos em tempo real. Aira da Hycones: Gera regras IF..THEN, possui QUERY WINDOWS, detecta erros de banco de dados e apresenta conhecimento em forma gráfica e relatórios. Seu software utiliza os princípios da inteligência artificial, que tenta descobrir regras de negócio em um banco de dados que será utilizado em campanhas de marketing.

FERRAMENTA WEKA

A Go Digital é uma empresa especializada em Marketing de Precisão, que possui o primeiro software de Data Mining desenvolvido na América Latina, o Go Mining, que tem como objetivo transformar dados em conhecimento para gerar mais valor no relacionamento com os clientes. Interface) para condução de experimentos de mineração utilizando uma API (Application Program Interface) desenvolvida de forma independente, que pode ser utilizada em aplicações Java (BRAGA et al, 2004). Também pode ser utilizado com instruções de linha de comando e a partir de uma interface gráfica também desenvolvida em JAVA.

Descrição dos pacotes Weka

62. Interface) para realizar experimentos de mineração utilizando uma API (Application Program Interface) desenvolvida de forma independente, que pode ser utilizada em aplicações Java (BRAGA et al, 2004). Classificadores – Implementa diversos tipos de classificadores: árvores de decisão, redes neurais, tabelas de decisão, algoritmos bayesianos, bagging, boosting. Calcula, por ex. o número de atributos com um determinado valor e o número de ocorrências com alguns valores ausentes.

Arquivos de Entrada

Algoritmos WEKA

Associação

Cluster

Classificadores

Interface do WEKA

Na Figura 20 você pode ver a tela do explorador WEKA onde você pode realizar vários experimentos. Na Figura 21 com o arquivo .CSV aberto, você pode ver os atributos que se aplicam ao arquivo na seção Atributos, onde você pode escolher com quais trabalhar. Após selecionar o algoritmo clicando no botão Iniciar, você poderá ver alguns resultados referentes à mineração realizada.

DIFICULDADE DE INTERAÇÃO INVENTÁRIO TURÍSTICO E

Porém, de todos os softwares analisados, esta técnica não pode ser observada, pois o software faz pouco ou nenhum uso dos dados que compõem o inventário turístico. Devido a este fator, a solução a ser desenvolvida irá analisar, através de técnicas de mineração de dados, dados do inventário turístico e da base de dados do hotel, gerar relatórios que auxiliam na tomada de decisão, auxiliando também na utilização do CRM. Este capítulo apresentará as etapas de desenvolvimento deste sistema: coleta de dados (entrevistas); análise de tabelas do sistema Desbravador, criação de tabelas suplementares; modelagem de sistemas; mineração de dados.

ENTREVISTAS JUNTO AOS PROFISSIONAIS DE HOTELARIA

O número de apartamentos em cada hotel também é diferente, por isso foi feito um agrupamento conforme mostrado na Tabela 5. Também foi questionado o tipo de público que visita o hotel, com diferenças entre os resultados conforme mostrado na Tabela 6. A faixa etária dos os proprietários dos hotéis do projeto também variam, portanto as faixas etárias foram criadas conforme mostrado na Tabela 7.

Tabela 5: Número de Apartamentos
Tabela 5: Número de Apartamentos

SELEÇÃO DOS DADOS

Tabelas Suplementares

Com base no questionário onde as respostas diziam respeito à necessidade de conhecimento de eventos regionais, como festas, reuniões, congressos, entre outros. Com base no questionário onde as respostas se referiam aos atrativos regionais, como atrações infantis, opções de lazer, atrativos regionais e outros.

PRÉ-PROCESSAMENTO

TRANSFORMAÇÃO

Alterar data e hora: Para gerar o arquivo .csv, o campo datahora foi eliminado para que fossem utilizadas apenas as datas armazenadas no banco de dados. Alteração de campos numéricos: Para gerar o arquivo foi criado um critério onde foram colocados os campos com valores numéricos _0_, uma restrição do WEKA. Alteração na string: Como o algoritmo ARPRIORI não funciona com valores numéricos, os campos contendo datas e valores numéricos receberam o símbolo _ antes e depois do valor.

MINERAÇÃO DE DADOS

Interpretação e Validação

Assim como acontece com a descoberta de conhecimento em bancos de dados, esta etapa da mineração requer a participação de especialistas, mas poucas comparações entre os resultados das pesquisas de especialistas na área e as regras geradas pelo algoritmo têm sido feitas para interpretar os resultados. Após várias sessões de mineração de dados, o resultado obtido foi significativo, mas os dados onde a mineração foi realizada poderiam distorcer muito o resultado, devido ao grande problema que muitos registros foram descartados por incompletude e assim a interpretação dos resultados e seus credibilidade, se preenchidos corretamente seriam diferentes. As regras criadas confirmam a credibilidade das entrevistas com profissionais da área, onde o estado do Paraná ficou em segundo lugar em termos de emprego (23%), e 83% dos entrevistados indicaram que as férias melhoram o emprego. b) Estas regras também podem ser utilizadas para identificar o motivo do melhor emprego em determinados períodos do ano, no caso de feriados em cidade próxima.

Figura 27 Teste Algoritmo Apriori
Figura 27 Teste Algoritmo Apriori

MODELAGEM DO SISTEMA

  • Requisitos Funcionais dos Sistema
  • Requisitos não Funcionais do Sistema
  • Regras de Negócio
  • Use Cases

RNE.01 - Para acessar o sistema é necessário cadastrar no banco de dados o nome de usuário e senha. RNE.03 – O sistema acessa o banco de dados e verifica qual código está disponível para inserção na tela de cadastro. O gerente do sistema possui mais funções que o operador do sistema, como pode ser visto no caso de uso da Figura 28.

Figura 28 Use Case Operador
Figura 28 Use Case Operador

DATA MINING

  • Arquivos do Sistema
  • Mineração dos Dados
  • Protótipo
  • Escolha do Algoritmo

CIDADE: Tipo String, contém a cidade do hóspede e se estiver vazia, possui o valor de. OCUPAÇÃO: Tipo String, contém a ocupação do hóspede. Se estiver vazio, o sistema irá preenchê-lo. HOSP_DATAOUT: Tipo de data “aaaa-MM-dd”, contém a data final da hospedagem do hóspede;

Figura 31. Tela de Login do Sistema
Figura 31. Tela de Login do Sistema

Imagem

Figura 1.Tempo de vendas. MANUAL x CRM  FONTE Adaptado de Valente (2002).
Figura 3. Custos dos Clientes
Figura 4 CRM Operacional, Analítico e Colaborativo.
Figura 5. CRM do Brasil   Fonte: adaptado ABEND 2002).
+7

Referências

Documentos relacionados

4.1 Banco de dados e Oracle Text Para o funcionamento correto da biblioteca virtual algumas alterações foram feitas na base de dados do Elis II: a criação de dois novos campos nas