• Nenhum resultado encontrado

Aula06- Data-Mining

N/A
N/A
Protected

Academic year: 2021

Share "Aula06- Data-Mining"

Copied!
19
0
0

Texto

(1)

1 R IO PEIX OT O

DATA MINING

(2)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 2

Data Mining (Mineração de Dados)

Qual a motivação?

• “Temos tudo informatizado na empresa, mas sinto que faltam mais informações. Falta conhecimento. Parece que morro de sede (conhecimento) num oceano de dados”

O Data Warehouse não consegue ter insigths durante as análises de dados

(3)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 3

Exemplo do Wall-Mart

O que fraldas tem a ver com cerveja?

Premissas dos gerentes das lojas:

• Mães compram fraldas  seção feminina e de bebês.

• Homens compram cervejas  seção masculina e bebidas.

O Terada Warehouse Miner fez a seguinte sugestão:

• Coloquem a seção de fraldas ao lado da seção de cervejas.

Resultado:

• As vendas de cerveja cresceram 30%.

• As vendas de fraldas cresceram 40%.

Porque?

• Homens casados, entre 25 e 30 anos, compram fraldas e/ou cervejas no final das tardes de sexta-feira no retorno do

(4)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 4

Descoberta de conhecimento em DB

“Um processo não trivial de identificação de padrões válidos,

novos, úteis e implicitamente presentes em grandes volumes de

dados.” (Knowledge Discovery in Database - KDD - Fayyad

et al. 1996)

• Usa várias técnicas para descobrir modelos e relações ocultas em grandes bancos de dados

• Isto permite inferir regras de comportamento futuros e orientar a tomada de decisões

(5)

Márcio

Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 5

Etapas do processo de KDD

Paradigmas de Data Mining:

Árvores de decisão

Regras de inferência

Baseado em instâncias (exemplos, fatos passados)

Redes neurais, algoritmos estatísticos e genéticos

(6)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 6

KDD x Data Mining

Data Mining é o passo do processo de KDD que produz

um conjunto de padrões (conhecimento) sob um custo

computacional aceitável

Incorpora tarefas de escolha do algoritmo adequado,

processamento e amostragem de dados e interpretação

de resultados

O Data Mining fornece os “insights” para gerenciar

oportunidades e problemas existentes ou potenciais

(7)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 7

Tipos de Informações do Data Mining

Associações

Detecta eventos relacionados. Ex: Wall-Mart.

Seqüências

Comportamento de compras de usuários de cartões.

Classificação

Quais produtos são mais rentáveis.

Aglomeração

Identifica agrupamentos nos dados. Ex: locais de crimes.

Prognósticos

(8)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 8

Tarefas básicas - Previsão

Fixa n variáveis e calcula outras k:

• Cálculo de variáveis de interesse a partir dos valores de um conjunto de variáveis de explicação

Normalmente é usada no aprendizado de máquina ou

estatística

(9)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 9

Exemplo de Previsão - Análise de Crédito

renda déb it o

x

x

x

x

x

x

x

o

o

o

o

o

o

o

o

o

t

sem

crédito

o

Legenda: x: crédito

recusado

o: crédito

concedido

• Plano paralelo: • Fácil interpretação:

• Se renda < t  sem crédito • Exemplo: • árvores de decisão indução de regras renda déb it o

x

x

x

x

x

x

x

o

o

o

o

o

o

o

o

o

t

sem

crédito

o

Plano oblíquo:

melhor separação

Exemplos:

regressão linear

perceptron

(10)

U ni dade 4 D ec isõe s str u tu radas Data Mi n in g S li de 10

Exemplo de Previsão - Análise de Crédito

Legenda: x: crédito

recusado

o: crédito

concedido

• Superfície não linear:

renda déb it o

x

x

x

x

x

x

x

o

o

o

o

o

o

o

o

o

t

sem

crédito

o

renda déb it o

x

x

x

x

x

x

x

o

o

o

o

o

o

o

o

o

t

sem

crédito

o

(11)

Márcio

Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 11

Exemplo de Árvore de Decisão

Sexo País Idade Compra

M França 25 Sim M Inglaterra 21 Sim F França 23 Sim F Inglaterra 34 Sim F França 30 Não M Alemanha 21 Não M Alemanha 20 Não F Alemanha 18 Não F França 34 Não M França 55 Não

País

Idade

Não

Sim

Sim

Não

Alemanha

Inglaterra

França

> 25

< 25

Dados das vendas por mala direta do livro:

“Um guia para restaurantes franceses na Inglaterra”. Fonte: Aurélio, Vellasco e Lopes (1999)

(12)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 12

Tarefas básicas - Descrição

Reportar relações entre as variáveis do modelo de forma

simétrica

À princípio, está mais relacionada ao processo de KDD

Exemplos: agrupamento, sumarização (inclusive de

(13)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 13

Exemplo de Descrição

renda d éb it o

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

t

+

+: exemplo

Análise de crédito

Agrupamento

Exemplo:

Vector quantization

Web Mining:

Data Mining aplicado à

servidores web

Prevê padrões de acesso

a servidores

(14)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 14

Data Mining - Cases

American Express:

• Software analisa bilhões de compras para:

• Criar campanhas de marketing individuais

Detectar fraudes e roubos de cartões de crédito

Lojas Brasileiras:

• Reduziu mix de produtos de 51000 para 14000

• Otimizou a organização das gôndolas

• Exemplo de anomalias detectadas:

Roupas de inverno e guarda chuvas encalhadas no nordeste Batedeiras 110V a venda em SC (lá só tem 220V)

(15)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 15

Data Mining - Cases

Bank of America:

Selecionou entre seus 36 milhões de clientes

Aqueles com menor risco de dar calotes

Tinham filhos com idades entre 18 e 21 anos

Resultado:

• Em três anos o banco lucrou 30 milhões de dólares com a

carteira de empréstimos

NASA:

Cataloga imagem de satélites classifica eventos similares

Empresas de Telecom:

(16)

U ni dade 4 D ec isõe s tu radas Data Mi n in g S li de 16

Data Mining - Produtos

Fabricantes:

• Líderes: Oracle, SPSS e SAS

• Grandes: IBM e CA

Produtos:

• Oracle Data Mining

• SPSS

• SAS – Enterprise Miner

• IBM DB2 Inteligent Miner

• PolyAnalist

(17)

Márci o Morei ra U ni dade 4 D ec isõe s E str u tu radas Data Mi n in g S li de 17

(18)

E X E R C Í C I O S

R IO PEIX OT O

• Porque o saneamento numa base de dados para iniciar o processo de data-mining é fundamental para seu sucesso real?

• Quem “nasceu” primeiro? – KDD ou DM ? E o que pode-se dizer da evolução do DM neste sentido ?

• Quais tipos de informação um DM pode trazer ?

• Posso afirmar que o DM possibilita uma melhor organização lógica e organizacional dos dados para facilitar a tomada de decisão? Porque?

• Porque posso considerar que o DM é situado como um banco de dados relacional ?

(19)

FIM

R IO PEIX OT O 19

Referências

Documentos relacionados

Considerando a importância dos tratores agrícolas e características dos seus rodados pneumáticos em desenvolver força de tração e flutuação no solo, o presente trabalho

A simple experimental arrangement consisting of a mechanical system of colliding balls and an electrical circuit containing a crystal oscillator and an electronic counter is used

Considerando que a criminalização do aborto voluntário no primeiro trimestre da gravidez é uma grave intervenção em diversos direitos fundamentais da mulher e que essa

A turma deverá formar uma comissão de formatura e elaborar uma ata, com a data da eleição, o nome do curso, turnos e a matrícula dos componentes com seus devidos cargos, além

Cursos Conteúdos Administração e Recursos Humanos 10 questões de conhecimentos gerais 15 questões de matemática 10 questões de português Direito 20 questões de

Havia, igualmente, atenienses (entre outros gregos) que apreciavam o modo espartano de ser e estar, como Sócrates (e Platão), que seria um desses laconizantes 6 , afirmando que

As rimas, aliterações e assonâncias associadas ao discurso indirecto livre, às frases curtas e simples, ao diálogo engastado na narração, às interjeições, às

Os instrutores tiveram oportunidade de interagir com os vídeos, e a apreciação que recolhemos foi sobretudo sobre a percepção da utilidade que estes atribuem aos vídeos, bem como