Ferramenta Weka
Waikato Environment for Knowledge Analysis
Prof. MSc Pablo Freire Matos
Informática - Instituto Federal da Bahia (IFBA)
pablofmatos@gmail.com
II Semana de Tecnologia da Informação
IFBA Campus Vitória da Conquista
27 a 30 de maio de 2014
WEKA: The bird
2
Mineração de Dados com a Ferramenta Weka
Ambiente WEKA
Java API
Linha de Comando
Explorer
Experimento
Workflow
3Mineração de Dados com a Ferramenta Weka
Explorer
Java API
Linha de Comando
Explorer
Experimento
Workflow
4Mineração de Dados com a Ferramenta Weka
Explorer
5
Mineração de Dados com a Ferramenta Weka
Explorer
6
Pré-processamento
Discretização
Normalização
Seleção de atributos
Transformação e combinação de atributos, ...
7
Mineração de Dados com a Ferramenta Weka Mineração de Dados com a Ferramenta Weka 8
Pré-processamento
Arquivos de entrada:
ARFF
, CSV, C4.5, binário
URL ou de um
banco de dados SQL
(usando
JDBC)
Pré-processamento no WEKA são chamados
de "
filtros
"
WEKA contém filtros para
Discretização, normalização, seleção de atributos,
transformação e combinação de atributos, ...
9
Mineração de Dados com a Ferramenta Weka
Arquivo ARFF
Attribute-Relation File Format
@relation
<nome-relação>
@relation tempo
@attribute
<nome-atributo> <tipo-de-dados>
Tipo de dados pode ser numeric, nominal, string ou date
@attribute temperatura numeric
@attribute ventoso {verdadeiro, falso}
@attribute jogar {sim, não}
@data
Valores perdidos são representados por?
@data
25,falso,sim
10
Mineração de Dados com a Ferramenta Weka
Formato .ARFF
Aparência
Temperatura
Umidade
Vento
Jogo
Sol
Quente
Alta
Falso
Não
Sol
Quente
Alta
Verdadeiro
Não
Encoberto
Quente
Alta
Falso
Sim
Chuvoso
Agradavel
Alta
Falso
Sim
Chuvoso
Frio
Normal
Falso
Sim
Chuvoso
Frio
Normal
Verdadeiro
Não
Encoberto
Frio
Normal
Verdadeiro
Sim
Sol
Agradavel
Alta
Falso
Não
Sol
Frio
Normal
Falso
Sim
Chuvoso
Agradavel
Normal
Falso
Sim
Sol
Agradavel
Normal
Verdadeiro
Sim
Encoberto
Agradavel
Alta
Verdadeiro
Sim
Encoberto
Quente
Normal
Falso
Sim
Chuvoso
Agradavel
Alta
Verdadeiro
Não
Formato .CSV
13
.CSV (Comma-separated values)
Mineração de Dados com a Ferramenta Weka
ARFF Viewer
14
Mineração de Dados com a Ferramenta Weka
Pré-processamento
Atributo: the
15
Mineração de Dados com a Ferramenta Weka
Pré-processamento
Atributo: class
16
Mineração de Dados com a Ferramenta Weka
Pré-processamento
17
Mineração de Dados com a Ferramenta Weka
Pré-processamento
18
Antes
19
Mineração de Dados com a Ferramenta Weka
Depois
20
Mineração de Dados com a Ferramenta Weka
Discretizar
21
Mineração de Dados com a Ferramenta Weka
22
Explorer
25
Mineração de Dados com a Ferramenta Weka
Categorização
26
Mineração de Dados com a Ferramenta Weka
Naive Bayes
27
Mineração de Dados com a Ferramenta Weka
Cross-validation
28
Mineração de Dados com a Ferramenta Weka
Percentagem
29
Mineração de Dados com a Ferramenta Weka
J48
30
31
Mineração de Dados com a Ferramenta Weka Mineração de Dados com a Ferramenta Weka 32
33
Mineração de Dados com a Ferramenta Weka
34
Mineração de Dados com a Ferramenta Weka
Iris
37
Mineração de Dados com a Ferramenta Weka
Dados Iris
38
Mineração de Dados com a Ferramenta Weka
k-Means
39
Mineração de Dados com a Ferramenta Weka
40
Mineração de Dados com a Ferramenta Weka
Cluster = 2
41
Mineração de Dados com a Ferramenta Weka
42
Cluster = 3
43
Mineração de Dados com a Ferramenta Weka Mineração de Dados com a Ferramenta Weka 44
45
Mineração de Dados com a Ferramenta Weka
Explorer
46