T´ ecnicas de Agrupamento - Metodos de Agrupamento de Dados Simbolicos Baseados em funções de

na forma de uma tabela relacional, ou uma matriz n × p (n indiv´ıduos e p atributos) (BEZDEK et al., 1999):          x11 . . . x1z . . . x1p . . . . xi1 . . . xiz . . . xip . . . . xn1 . . . xnz . . . xnp          (3.1)

• Matriz de Dissimilaridades (ou estrutura indiv´ıduo por indiv´ıduo): Esta matriz armazena um conjunto de proximidades entre pares de indiv´ıduos. Normalmente, ´e representada por uma matriz n × n:

          0 d21 0 d31 d32 0 .. . ... ... ... ... dn1 dn2 . . . 0           (3.2)

onde dij ´e a medida de dissemelhan¸ca ou dissimilaridade entre i e j. Diversos al-

goritmos de agrupamento têm como entrada uma matriz de dissimilaridades, tais dissimilaridades são conhecidas como dados relacionais. Nesse caso, se os indiv´ıduos forem apresentados na forma de matriz de dados, eles deverão primeiramente ser transformados em uma matriz de dissimilaridades antes da execu¸cão do agrupamento. Medidas de dissimilaridade serão discutidas no Cap´ıtulo 4.

3.6 T´ecnicas de Agrupamento

Os algoritmos de agrupamento de dados podem ser classificados sob diversos critérios. Utilizando uma classifica¸cão mais geral, os algoritmos de agrupamento podem ser divididos em hierárquicos e particionais. Os algoritmos hierárquicos produzem uma série de parti¸cões aninhadas, enquanto os particionais produzem apenas uma parti¸cão (JAIN; DUBES, 1988). A Figura 2 (a) e (b) apresentam, respectivamente, um exemplo de agrupamento hierárquico e um exemplo de agrupamento particional.

3.6 T´ecnicas de Agrupamento 19

Figura 2: Exemplos de agrupamento (a) hier´arquico e (b) particional.

3.6.1 M´etodos de Agrupamento Hier´arquico

Os algoritmos hierárquicos constroem uma hierarquia em forma de árvore, como por exemplo, um dendograma. Eles estão divididos em duas categorias: divisivos e aglomerativos. A diferen¸ca entre as categorias está relacionada com a maneira como a árvore é constru´ıda (WITTEN; FRANK, 2000).

Os algoritmos divisivos iniciam com os padrões em um único grupo e sucessivamente dividem os padrões em grupos menores. Nos algoritmos aglomerativos cada padrão ini- cialmente representa um grupo e esses grupos são fundidos a cada itera¸cão, de maneira que ao final da execu¸cão do algoritmo, exista um único grupo contendo todos os objetos (BERKHIN, 2002).

Os métodos divisivos são menos comuns entre os algoritmos hierárquicos devido sua ineficiência e por exigirem capacidade computacional maior que os algoritmos aglomerativos (BERKHIN, 2002).

Apesar dos algoritmos hierárquicos não retornarem parti¸cões, estas podem ser obtidas, por exemplo, cortando o dendograma gerado em um certo n´ıvel.

As vantagens dos métodos hierárquicos são (BERKHIN, 2002):

• Flexibilidade do n´umero de grupos;

• Ajusta-se facilmente à qualquer medida de similaridade ou distância; • Capacidade de lidar com vários tipos de variáveis.

3.6 T´ecnicas de Agrupamento 20

As desvantagens do agrupamento hier´arquico est˜ao relacionadas a (BERKHIN, 2002):

• Crit´erio de termina¸c˜ao vago;

• O fato dos grupos não serem corrigidos, ou seja, os padrões associados a determinado grupo permanecerão nesse grupo até o final da execu¸cão do algoritmo;

• Custo computacional alto: os algoritmos hier´arquicos requerem bastante espa¸co de mem´oria e um alto custo de processamento.

3.6.2 M´etodos de Agrupamento Particionais

O particionamento de um conjunto de dados em um número pré-definido de grupos é um importante tópico da análise de dados, reconhecimento de padrões e processamento de imagens (JAIN; MURTY; FLYNN, 1999).

Os métodos particionais são baseados na minimiza¸cão de uma fun¸cão objetivo, em que os objetos são agrupados em um número k de grupos escolhido previamente. Essa fun¸cão pode ser definida localmente (em um subconjunto de objetos) ou globalmente (sobre todos os objetos), então, cada objeto é associado a um grupo de maneira que minimize a fun¸cão objetivo (KAUFMAN; ROUSSEEUW, 1990). A busca de um valor ótimo para a fun¸cão objetivo no conjunto de parti¸cões poss´ıveis é computacionalmente proibitiva. Na prática, o algoritmo é executado várias vezes com diferentes estados iniciais e a melhor configura¸cão obtida é usada como sa´ıda do algoritmo (JAIN; DUBES, 1988).

Uma das principais vantagens dos algoritmos particionais em rela¸cão aos algoritmos hierárquicos é o fato dos padrões poderem mudar de grupo durante a execu¸cão do algoritmo e a possibilidade de trabalhar com bases de dados maiores. Os métodos particionais são extremamente mais rápidos que os hierárquicos.

As principais desvantagens dos algoritmos particionais residem no fato de que o número de grupos deve ser escolhido a priori e no fato de que a maioria dos algoritmos são sens´ıveis às condi¸cões iniciais, gerando resultados diferentes a cada execu¸cão.

Além do número de grupos, é preciso escolher também o critério de parada do algoritmo. Uma op¸cão para o critério de parada pode ser o número de itera¸cões que o algoritmo deve executar. Outro critério de parada bastante utilizado é parar quando os padrões não mais forem realocados a outros grupos.

3.6 T´ecnicas de Agrupamento 21

cutidos a seguir.

Os algoritmos de particionamento exclusivos ou r´ıgidos ( do inglês, hard ) associam cada indiv´ıduo do conjunto de dados a um único cluster (grupo). Os algoritmos de particionamento exclusivos mais utilizados são (KAUFMAN; ROUSSEEUW, 1990) : k -médias, PAM (Partitioning Around Medoids) e CLARA (Clustering Large Applications).

As abordagens de agrupamento tradicionais geram parti¸cões; nas parti¸cões, cada indiv´ıduo está associado a um e somente um cluster. Assim, os clusters nesses tipos de abordagens são disjuntos. Os métodos de agrupamento não-exclusivos, também conhe- cidos como fuzzy, estendem essa no¸cão para permitir associar os indiv´ıduos com todos os clusters utilizando uma fun¸cão de pertinência (ZADEH, 1965). Os indiv´ıduos terão pertinência definida no intervalo [0, 1] para cada cluster.

O agrupamento fuzzy é uma generaliza¸cão do método de parti¸cão (KAUFMAN; ROUS- SEEUW, 1990). Durante a execu¸cão de um algoritmo de particionamento, muitas vezes é

d´ıficil decidir a qual grupo um determinado indiv´ıduo deve ser atribu´ıdo. Uma t´ecnica de agrupamento fuzzy lida melhor com tal situa¸c˜ao.

A principal vantagem do agrupamento fuzzy é a produ¸cão de informa¸cões mais de- talhadas acerca dos dados. Além disso, a partir do agrupamento fuzzy é possivel obter parti¸cões hard ao atribuir cada indiv´ıduo ao grupo ao qual esse indiv´ıduo apresenta maior grau de pertinência (KAUFMAN; ROUSSEEUW, 1990).

Uma desvantagem apresentada pelos métodos fuzzy é o rápido crescimento da quan- tidade de sa´ıdas com o aumento do número de indiv´ıduos e grupos, tornando dif´ıcil a interpreta¸cão dos resultados. Além disso, os algoritmos de agrupamento fuzzy geralmente utilizam tempo computacional consideravelmente alto (KAUFMAN; ROUSSEEUW, 1990).

A seguir, uma breve exposi¸c˜ao sobre o particionamento fuzzy.

Seja k um n´umero inteiro com 1 < k < n e seja E = {x1, . . . , xn} o conjunto de n

indiv´ıduos n˜ao rotulados no <p_{. Pode-se dizer que k subconjuntos fuzzy {u}

c: E → [0, 1]}

s˜ao uma k parti¸c˜ao fuzzy de E se os k × n valores {uci = uc(xi), 1 ≤ i ≤ n, 1 ≤ c ≤ k}

satisfazem as seguintes condi¸c˜oes:

0 ≤ uci≤ 1, ∀c, i (3.3)

uci= 1, ∀i (3.4)

No documento Metodos de Agrupamento de Dados Simbolicos Baseados em funções de Dissimilaridades (páginas 34-38)