Agrupamento em Subespaços: Abordagens e Algoritmos

Random Sample Consensus (RANSAC) é um algoritmo robusto introduzido por FIS- CHLER; BOLLES (1981). O algoritmo é aplicado a uma ampla gama de problemas como estimativa de parâmetros, visão computacional e detecção de primitivas geométricas. RANSAC possui duas principais limitações: Em primeiro lugar, a complexidade cresce exponencialmente com a quantidade e a dimensionalidade dos subespaços; Por fim, ele requer que o número de subespaços seja previamente conhecido.

3.3. AGRUPAMENTO EM SUBESPAÇOS: ABORDAGENS E ALGORITMOS 45

GAYA; KANATANI, 2004). Baseia-se na fatoração do método de Coast e Kanade (CK) e o método de Separação de Subespaços (SS). Como a maioria dos algoritmos baseados em Expectation-Maximization (EM), o método MSL sofre na convergência para um mínimo local. Assim, se a inicialização não é adequada, muitas vezes acontece do modelo tomar muito tempo ao convergir para um ótimo global.

Generalized Principal Component Analysis (GPCA) é um método de agrupamento algébrico introduzido porVIDAL; MA; SASTRY(2005). A principal idéia por trás do GPCA é que você pode ajustar a união de n subespaços em um conjunto de polinômios de grau n, onde suas respectivas derivadas de um ponto resultam em um vetor normal ao subespaço contendo este ponto. O GPCA é computacionalmente barato e permite que cada subespaço seja representado por um hiperplano, logo, interseções de subespaços podem ocorrer. Finalmente, o GPCA lida bem com dados faltantes. A principal desvantagem do GPCA é que a sua complexidade aumenta exponencialmente quando o número de subespaços e dimensões aumenta.

O algoritmo The Agglomerative Lossy Compression (ALC) introduzido em (MA et al., 2007) assume que os dados são extraídos a partir de uma mistura de distribuições gaussianas degeneradas. O ALC lida bem com ruído e valores extremos nos dados. O modelo não requer que o número de subespaços e as suas dimensões sejam conhecidas previamente. No entanto, ajustar seu principal parâmetro δ provoca um aumento significativo na complexidade computacional.

Sparse Subspace Clustering (SSC) (ELHAMIFAR; VIDAL,2009a), Local Subspace Affinity (LSA) (YAN; POLLEFEYS,2006) e Spectral Curvature Clustering (SCC) (CHEN; LERMAN,2008) baseiam-se no princípio da construção de um ponto (xj) como uma combinação afim ou linear de seus pontos vizinhos nos dados. SSC utiliza o princípio da esparsidade ao escolher qualquer um dos pontos de dados restantes como um possível vizinho. SSC apresenta robustez quando existem dados faltantes e valores discrepantes quando aplicado a problemas de visão computacional, tais como a segmentação movimentos e agrupamento de faces. A principal desvantagem do SCC e LSA é que eles exigem que o número de subespaços sejam conhecidos. Já o SSC pode cair na armadilha de um ponto pertencente a um conjunto de dados ruidosos ser escrito como uma combinação linear de outros pontos ruidosos (VIDAL; FAVARO,2014). Model-based Method for Projective Clustering (MPC) (CHEN; JIANG; WANG,2012) é um modelo Gaussiano estendido que atende aos requisitos gerais do agrupamento projetado. No entanto, se o MPC não é inicializado adequadamente, degrada o desempenho do agrupamento consideravelmente.

Attributes-Weighting Algorithm (AWA) (CHAN et al.,2004), Fuzzy Weighting K-means (FWKM) (JING et al., 2005), Entropy Weighting K-means (EWKM) (JING; NG; HUANG, 2007), Locally Adaptative Metrics for Clustering (LAC) (DOMENICONI et al.,2004) e Fuzzy Subspace Clustering (FSC) (GAN; WU,2008) são modelos do tipo K- means que realizam a ponderação de variáveis. Um passo adicional em cada iteração é introduzido para calcular os valores dos pesos, permitindo o agrupamento em subespaços. A principal diferença entre estes algoritmos reside nas fórmulas de atribuição de pesos que resultam em diferentes funções

46 CAPÍTULO 3. AGRUPAMENTO EM SUBESPAÇOS PARA DIFERENTES CASOS DE PROBLEMAS

objetivo a serem minimizadas no processo de agrupamento.

No que diz respeito ao AWA, se todas as amostras em um agrupamento têm os mesmos valores ou um valor não existir em um determinada dimensão, isso acarretará numa dispersão nula nos respectivos atributos, tornando assim o peso correspondente infinito. Além disso, LAC, FWKM e EWKM não levam em conta propriedades de volume e forma que não são considerados ou distinguíveis entre os aglomerados, pois esses causam atribuições erradas em regiões de fronteira.

Dois algoritmos de agrupamento suave em subespaços, Entropy Weighting Fuzzy Cluste- ring in Composite Kernel Space for Kernel Space (CKS-EWFC-K) e Entropy Weighting Fuzzy Clustering in Composite Kernel Space for Feature Space (CKS-EWFC-F) propostos porWANG et al.(2016) têm um mecanismo de aprendizagem métrica de distância, onde a distância entre os padrões de entrada com respeito a cada atributo pode ser aprendida de forma adaptativa através de uma combinação linear de um conjunto de mapeamentos de bases kernel. Embora ter apresentado resultados promissores, o modelo não foi testado com dados esparsos.

Automatic Feature Grouping K-means (AFG-K-means) proposto porGAN; NG(2015) é um dos algoritmos mais recentes que supera o Feature Groups K-means (AFG-K-means) (CHEN et al.,2012). Ele estende o K-means incorporando seleção de grupos por caracterizaçao automática. Apesar dos bons resultados, o modelo requer conhecimento prévio sobre o número de aglomerados que não é adequado, dependendo da aplicação.

Outro grupo distinto de métodos de aprendizagem não supervisionada foi projetado para lidar com o agrupamento em subespaços. Dimension Selective Self-Organizing Map (DSSOM) (BASSANI; ARAUJO, 2012) tem uma topologia fixa, na qual é preciso ter conhecimento prévio sobre o número de categorias dos dados e não representaram adequadamente aglomerados pertencentes a diferentes subespaços. Local Adaptive Receptive Field Self-Organizing Map (LARFSOM) (ARAUJO; COSTA,2009) possui nodos com campos receptivos adapta- dos durante o processo de auto-organização, tornando-se uma estrutura variável no tempo. LARFSOM também possui um limiar de ativação na etapa de inserção do nodo. Com base nestes dois modelos, Local Adaptive Receptive Field Dimension Selective Self-Organizing Map (LARFDSSOM) (BASSANI; ARAUJO,2015) tenta melhorar o desempenho do agrupamento através do agrupamento suave em subespaços.

47 47 47

4

LARFDSSOM2

Self-Organizing Maps (SOM), proposto por (KOHONEN, 1988) pretende extrair e visualizar estruturas essenciais em dados de alta dimensão através de um mapa. A topologia deste mapa é o resultado de um processo de aprendizagem nao supervisionado que segue a distribuição de dados no espaço de entrada.

SOM tem uma topologia fixa que limita os mapeamentos produzidos (ARAUJO; REGO, 2013), isso porque o número de conexões e nodos precisam ser definidos com antecedência, uma tarefa complexa que exige conhecimento do espaço de dados. Isto induziu pesquisadores a melhorar o modelo com uma estrutura construída de forma dinâmica para eliminar a vizinhança e o número máximo de nodos predefinidos (ARAUJO; REGO,2013).

Um arcabouço que descreve qualquer mapa auto-organizável de estrutura variável no tempo foi proposta porARAUJO; REGO(2013). LARFDSSOM2 será introduzido seguindo os principais procedimentos deste arcabouço. Sua principal diferença em relação ao LARFDSSOM original (BASSANI; ARAUJO, 2015) está em sua nova fórmula de relevância, que captura a variância nos valores de cada dimensão. Anteriormente, uma alteração brusca no valor de um atributo com relação a todos os outros atributos de um padrão de entrada. Com isso, o modelo apresenta uma melhor sensibilidade na variação inter/intra classes. Por fim, a Figura 4.1 apresenta a visão geral deste arcabouço.

Figura 4.1: Visão geral do arcabouço que descreve qualquer mapa auto-organizável de estrutura variante no tempo.

48 CAPÍTULO 4. LARFDSSOM2

4.1 Processo de Crescimento

Este procedimento geralmente começa com um pequeno número de nodos, e em seguida, insere e apaga nodos durante o processo de formação. Em tal dinâmica, duas questões são consideradas: quando os nodos devem ser inseridos ou eliminados, e onde um novo nodo deve ser inserido (o cálculo do seu vetor de peso).

Quando um nodo é criado, o seu centro cjé inicializado com o último padrão de entrada apresentado ao mapa x. A relevância do vetor ωjé inicializada com 1s, e finalmente o vetor de distância δj é inicializado com 0s.

No LARFDSSOM2, cada nodo j no mapa armazena uma variável winsj que representa o número de vitórias deste nodo desde a última reinicialização. Uma reinicialização ocorre depois de maxcomp competições. Este é o momento em que se remove do mapa os nodos que possuem uma sequência de vitórias abaixo do limiar l p × maxcomp, onde l p é um parâmetro que representa o menor percentual de vitórias determinado para um nodo continuar no mapa. Por exemplo, se l p é ajustado para 0,01, um nó deve vencer pelo menos 1% das competições; caso contrário, ele será removido do mapa na próxima reinicialização. Após a remoção, o número de vitórias dos nodos restantes é novamente zero. Finalmente, para evitar a remoção dos nodos recentemente criados, quando um nodo é criado, seus números de vitórias é definido como l p× nwins, onde nwins é o número de competições que ocorreram desde a última reinicialização.

No documento Mapas auto-organizáveis com topologioa variante no tempo para categorização em subespaços em dados de alta dimensionalidade e vistas múltiplas (páginas 36-40)