• Nenhum resultado encontrado

2. DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS

2.3. Aplicações de KDD

A disponibilidade de grandes quantidades de dados e a eminente necessidade de transformar estes dados em conhecimento útil têm sido os principais motivos pelos quais KDD tem atraído tanta atenção da indústria da informação nos últimos anos. O conhecimento descoberto pode ser usado em aplicações que vão desde o gerenciamento de negócios, controle de produção e análise de mercado, até projetos de engenharia e pesquisas científicas [Han & Kamber 2001].

A seguir são destacadas algumas das principais áreas de aplicação de KDD. Além das aplicações citadas, novas estão constantemente sendo descobertas [Monteiro 1999].

2.3.1. Lojas de Varejo

As lojas de varejo vendem uma grande variedade de produtos. Neste setor, são indesejáveis custos excessivos de transporte e estoque, e a impossibilidade da venda de um produto por falta no estoque. A aplicação de KDD para previsão de vendas é muito importante para este setor, pois permite a otimização de dois pontos fundamentais do negócio: as vendas e o estoque [Monteiro 1999].

Outra aplicação bastante usual é a análise market-basket, que descobre associações entre produtos que são comprados em conjunto ou seqüência [Fayyad et al. 1996a].

2.3.2. Segmentação de Mercado

A segmentação de mercado baseia-se na idéia de que um produto não pode satisfazer as necessidades e desejos de todos os consumidores, pois eles estão dispersos em inúmeras regiões, têm hábitos de compras variados e divergem em suas necessidades e preferências. Por esta razão, a

prática moderna de Marketing sugere dividir o mercado em segmentos, avaliá-los, selecionar alguns como alvo e definir a posição da empresa em relação a cada um deles. Esta segmentação ajuda a empresa a compreender melhor o perfil de seus clientes e realizar um marketing dirigido que proporciona um maior retorno financeiro para empresa e maior satisfação para os clientes [Witten & Frank 2000].

2.3.3. Setor Financeiro

Na maioria dos ambientes de decisão financeira utilizam-se informações provenientes de diversas fontes. Os gerentes financeiros analisam essas informações de forma subjetiva e dificilmente conseguem formalizar seus processos de decisão. Além disso, esses ambientes são dinâmicos e as decisões devem ser tomadas rapidamente. Este cenário tem requerido a utilização de tecnologias mais sofisticadas para satisfazer usuários cada vez mais exigentes. Assim, o mercado financeiro está buscando a utilização de novas técnicas computacionais, entre elas as técnicas inteligentes.

KDD tem sido aplicado com bastante sucesso no setor financeiro [Bigus 1996]. Análise de propostas de cartões de crédito, previsão de índices de bolsas de valores, desenvolvimento de modelos de fidelização de consumidores, detecção de fraudes e tendências estão entre as aplicações mais usuais [Monteiro 1999].

2.3.4. Setores Químico e Farmacêutico

Dois domínios bastante promissores para aplicação de KDD são os setores químico e farmacêutico. As atividades inerentes a estes setores requerem processamento intenso nas bases de dados. Tal processamento pode ser realizado de forma mais eficiente através da incorporação de técnicas de mineração de dados.

Atualmente, os setores químico e farmacêutico estão aplicando KDD em grandes bases de dados de componentes químicos para descobrir novas substâncias e inter-relações entre componentes químicos, e aprimorar fórmulas e componentes já desenvolvidos. Os resultados do processo de KDD podem ser úteis em diversas aplicações, como por exemplo, tratamento de doenças e produção de produtos agrícolas [Two Crows 1999].

2.3.5. Análise de Dados de DNA

Pesquisas recentes em análise de dados de DNA têm sido conduzidas para prevenção e tratamento de doenças, descoberta de medicamentos e métodos para diagnóstico, e identificação das causas genéticas de doenças.

Os seres humanos possuem em torno de 100.000 genes, que normalmente são compostos de centenas de nucleotídeos. Existe quase um número ilimitado de formas de ordenação e seqüenciamento dos nucleotídeos. Devido a esta complexidade, é um desafio identificar padrões específicos de seqüências de genes que têm alguma relação com uma determinada doença. Com o desenvolvimento de técnicas de mineração para análise de padrões seqüenciais e busca por similaridade, KDD tem se tornado bastante promissor nesta área, podendo contribuir substancialmente em atividades como análise de associação (identificação de seqüências de genes co-relacionadas),

análise de caminho (influência dos genes nos diversos estágios da doença), busca por similaridade e comparação entre seqüências de DNA [Han & Kamber 2001].

2.3.6. Análise na Web

A World Wide Web vem despertando muito interesse para aplicação de KDD [Witten & Frank 2000]. Os

sites e bases de dados associadas aos sistemas web possuem grande quantidade de dados que pode

ser minerada. Dados sobre os acessos a um site, por exemplo, podem ser armazenados automaticamente em arquivos log. Tais arquivos podem ser utilizados num processo de KDD para descobrir comportamentos padrões dos visitantes. No caso do comércio eletrônico, onde os consumidores são altamente móveis e demonstram uma lealdade mais vulnerável do que no comércio tradicional, o principal desafio é identificar e entender essa nova base de consumidores. Com a aplicação do processo de KDD, comportamentos e preferências dos consumidores podem ser descobertos, tornando as empresas virtuais mais competitivas.

2.3.7. Medicina

Os centros médicos estão investindo cada vez mais na integração de equipamentos de monitoramento e coleta de dados com os sistemas de informação. Como resultado, grandes quantidades de dados estão sendo armazenadas nas bases de dados médicas [Lavraè 1999].

As bases de dados médicas possuem dados históricos de doenças contraídas, exames laboratoriais e clínicos. Estes dados são caracterizados por incompletude, incorretude, registros não representativos e falta de exatidão. Além disso, os dados coletados pelos equipamentos de monitoramento envolvem valores medidos em intervalos distintos e, conseqüentemente, requerem que

o as pecto temporal s eja cons iderado durante a análise dos dados [Lavraè 1999].

O aumento no volume das bases de dados médicas e as características inerentes a este domínio têm dificultado a extração de conhecimento útil para tomada de decisões, requerendo ferramentas efetivas para gerenciamento e análise dos dados. Portanto, as tecnologias provenientes da área de KDD são bastante úteis à Medicina. Estudos epidemiológicos; predição de quais pacientes têm maior probabilidade de contrair determinada doença, em função de dados históricos; predição da efetividade de procedimentos cirúrgicos, teste médicos e medicamentos são alguns exemplos de aplicações em que KDD pode ser empregado [Two Crows 1999].