Distribuição de Energia II 5º ano da LEEC - ramo de Energia
(FEUP)
Reconhecimento de padrões
Cláudio Monteiro
Reconhecimento de padrões
Fases do processo
Identificação das características a agrupar Cada diagrama representa um pontos a agrupar
A cada instante de tempo do diagrama corresponderá uma dimensão do ponto
Um grupo de diagramas (cluster) representará uma classe de consumo O ponto central de um grupo representa o diagrama típico de uma
classe de consumo Algoritmo de agrupamento
Medida de proximidade, quantifica a similaridade entre pontos. Se não se pretender dominância entre dimensões será necessário proceder à normalização dos diagramas
Critério de agrupamento, é o processo de valorização da medida de proximidade.
Validação de resultados
baseada e índices que avaliam a melhor/pior separação dos pontos em grupos.
Classificações de Algoritmos
Agrupamento por partição (k-means, k-mode, PAM, CLARA, FCM)
Faz uma partição directa em agrupamentos disjunto
Agrupamento hierárquico (BIRCH, CURE, ROCK)
Agrupamento sucessivo de grupos mais pequenos em grupos maiores
(dendograma)
Agrupamento por densidade (DBSCAN, DENCLUE)
Agrupa pontos próximos centrado em zonas de maior densidade
Agrupamento estatístico (k-mean)
Baseia-se em conceitos estatísticos de similaridade (variância, correlação, etc.)
Agrupamentos conceptuais (k-mode)
Baseia-se em agrupamentos de dados com critérios categóricos (não numéricos)
Agrupamento difusos (Fuzzy C-means, Fuzzy ISODATA)
Existe possibilidade de sobreposição de agrupamentos (um diagrama pode pertencer a várias classes diferentes)
Reconhecimento de padrões
Classificações de Algoritmos (hierárquicos)
Reconhecimento de padrões
Conceito do Fuzzy C-means
Consiste em minimizar a seguinte função objectivo:
Os dados de entrada são n pontos Xp (diagrama). Cada ponto é caracterizado por um conjunto de dimensões h, Xp={x1, x3, …,xh} (discretização do diagrama em horas). O número de agrupamentos k também é especificado como dado de entrada. Vc é o centro de cada agrupamento c (diagrama típico da classe)
Upc é a função de pertença do ponto Xppao conjunto c
d2(Xp,Vc) é a distância entre o ponto p e o centro do agrupamento c, medida segundo uma determinada métrica
m é o peso atribuído à pertença, quanto maior o m menor será a contribuição dos
(
)
(
p c)
k c n p m pc mU
V
U
d
X
V
J
,
2,
1 1⋅
=
∑∑
= =Processo do Fuzzy C-means
Escolher o numero de agrupamentos c e o peso atribuído à pertença m Definir uma matriz inicial de pertenças Upc, que somem 1 para cada um
dos pontos
Encontrar os centros Vc usando a fórmula:
Recalcular as funções de pertença Upc usando a fórmula:
O processo repete-se até que o somatório da variação da pertença entre iterações seja inferior ao erro
.