Definição automática do número de classes k

Metodologia de Agrupamento de Dados

3.3 Definição automática do número de classes k

!

A literatura de visão computacional apresenta como métodos não-supervisionados algoritmos que necessitam de um parâmetro k, que representa o número de regiões que se deseja descrever. Neste trabalho, consideram-se estes métodos como não- supervisionados no sentido estrito. A suposição destas técnicas não-supervisionadas no sentido estrito é que não se conhecem as características das texturas que fazem parte da segmentação. Logo, o número de regiões é um parâmetro cognitivo dependente da aplicação.

! Considera-se como método não-supervisionado no sentido amplo qualquer método de segmentação de imagens baseado em texturas que não necessite de nenhum parâmetro externo, inferindo-se automaticamente o número de classes que melhor representa o conjunto de dados. No entanto, determinar automaticamente o número de partições é em si um problema difícil de resolver. Para solucionar o problema do número de partições, usam-se três abordagens:

a) analisar os dados submetidos ao agrupamento no início;

b) analisar os resultados parciais do agrupamento durante o processo; c) analisar os resultados finais do processo de agrupamento.

! A análise dos dados no início do agrupamento parte do princípio que é possível obter informações dos dados de entrada que possibilitem inferir o número de partições. Um exemplo de análise no início do processo de agrupamento é a regra de ouro [47], que estabelece o número de partições como dependente do número de pontos pertencentes ao conjunto de dados, através da relação k ≈ √(n/2), onde n é o número de pontos. A regra de ouro é útil quando a nuvem de dados é muito dispersa ou para fazer uma estimativa do teto do número de classes k.

Figura 3.3 - Fluxograma da análise dos dados de entrada em um método de agrupamento

! O problema é que em segmentação de imagens o valor obtido pela regra de ouro não reflete a realidade. Por exemplo, ao considerar uma imagem com 256x256 pixels, têm-se 65536 pontos para agrupar e, a partir da regra de ouro, obtém-se k ≈ 181, mesmo que a imagem seja composta por somente duas texturas distintas.

! Outros autores também propõem métodos de determinação automática do número de regiões da imagem na fase inicial do agrupamento. Zhou, Yang e Jiang [48] propõem um método em que se calcula a distância média entre os descritores de textura no espaço de atributos e usa-se cada ponto no espaço de atributos como centro de uma região esférica de raio igual a distância média calculada anteriormente; em seguida, determina-se a região que possui mais pontos, remove-se do espaço de

atributos os pontos que se localizam dentro de cada região. Repete-se o procedimento até que não haja mais nenhum ponto no espaço de atributos. Usam-se então os k pontos que corresponderam aos centros mais populados como centróides iniciais para o método k-means.

! Analisar os resultados parciais do processo de agrupamento consiste em analisar os resultados parciais e avaliar a necessidade de alterar os grupos, realizando sub-divisões dos grupos, fundir grupos ou melhorar a atribuição dos pontos a cada grupo através de uma medida. Um exemplo típico desta abordagem é o método k- means iterative fisher, descrito por Clausi [49], onde o autor realiza uma partição binária através de um k-means clássico fixando-se o parâmetro k em 2 e, através da medida de separabilidade de Fisher, também conhecida como discriminante linear, determina-se o quão separável são os dois grupos obtidos. Caso o valor obtido no discriminante linear seja maior que um dado limiar, o método infere que a divisão do espaço obtida adequa- se aos dados. Em seguida repete-se o procedimento para cada partição obtida, até que os discriminantes lineares obtidos não superem mais o limiar.

Figura 3.4 - Fluxograma da análise dos resultados parcias de um método de agrupamento

! Neste caso específico, a desvantagem desta abordagem está em segmentar conjunto de dados que se representa por um k impar. Toma-se como exemplo o caso de um conjunto de dados que apresenta três nuvens distintas, com mostrado na Figura 3.5. Neste caso o método de partição binária acaba dividindo um grupo legítimo e, como só se particionam os grupos já obtidos, perde-se o grupo dividido definitivamente. Na Figura 3.5, a linha que representa a partição binária do espaço divide no meio a

classe representada por quadrados. Como não há um método de fusão de partições, a classe que se representa pelos quadrados ficará dividida ao meio. Poder-se-ia propor uma metodologia de fusão de partições, mas haveria uma adição proibitiva de complexidade no algoritmo de agrupamento.

! Outra desvantagem deste método é a necessidade de um limiar de separabilidade, que pode variar com a classe de dados que se deseja segmentar.

Figura 3.5 - Problema do agrupamento do método K-means Iterative Fisher para conjunto de dados representados por número ímpar de regiões

! Finalmente, analisar os resultados finais do processo de agrupamento parte da idéia de se repetir o processo para vários valores de k e avaliar os resultados obtidos através de uma métrica. A partir dos valores obtidos na métrica, define-se qual o k que melhor representa aquele conjunto de dados.

! Neste caso, existem dois problemas principais: especificar uma métrica de qualidade e caracterizar o que é um k ótimo. Para solucionar o primeiro problema, propõem-se medidas de qualidade de classificação em [50] [51] [52] [53] [54]. Todas baseiam-se em executar o algoritmo k-means para valores crescentes de k e analisar os resultados. A notação que se adota nestas medidas é:

x dado classificado pelo algoritmo Ci Classe de dados i

ci centróide da classe i

x∈Ci

∑

somatório em todos os dados petencentes a classe Ci i=1

∑

somatório em todas as classes obtidas pelo algoritmo k-means, executando-se

com parâmetro k

j=i+1 k

∑

somatório em todas as classes obtidas pelo algoritmo k-means, exceto as definidas por um valor menor ou igual a variável iterada i.

C

_i número de elementos pertencentes a classe Ci

• Soma das distâncias intra-classes

m

=

x− c

i x∈Ci

∑

i=1 k

∑

(3.1)

! Esta medida mede o quão compacta estão as classes obtidas pelo algoritmo k- means. Parte-se da suposição que as classes caracterizam-se por nuvens muito compactas no espaço de atributos e, por isso, define-se uma boa classificação por um valor mínimo nessa medida intra-classes.

• Razão das distâncias intra-classes e inter-classes

m

=

x− c

_i x∈Ci

∑

i=1 k

∑

c

− c

_j j=i+1 k

∑

i=1 k

∑

(3.2)

!

Expressa-se por esta métrica a relação entre a compacidade das classes e o afastamento entre elas. A idéia que move esta medida é a que além de compactas, as classes devem ser distantes no espaço de atributos. Quanto maior esta métrica pior se espera que seja a classificação

• Razão ponderada das distâncias intra-classes e inter-classes.

m

=

1 C

_i x∈Ci

x

− c

∑

i=1 k

∑

c

− c

_j j=i+1 k

∑

i=1 k

∑

(3.3)

!

A objetivo desta métrica é, além de priorizar classes compactas internamente e separadas entre si, valorizar as classes que possuam grande volume de dados. Dessa forma, evitam-se as distorções na distância intra-classes quando se tem uma classe com poucos membros, levando a um valor baixo e deturpando o sentido da métrica.

!

Para automatizar o processo de obtenção do melhor parâmetro k que descreve a distribuição das classes, executa-se o método k-means para vários valores de k e obtêm-se as métricas de qualidade. O que define o k que melhor se adequa ao conjunto de dados é a variação das medidas de qualidade. Espera-se que no ponto de maior variação comece uma tendência de estabilização nas medidas. !

! Um dispositivo prático que se usa é a “regra do cotovelo”, assim chamada porque busca localizar o ponto de maior variação da métrica em função do número k. Ilustra-se o conceito de cotovelo na Figura 3.7, denotando-se pelo ponto sobre a curva. Esta escolha deve localizar o valor de k onde aumentar a quantidade de regiões não adiciona uma grande contribuição na melhoria da métrica de qualidade. Porém, localizar o cotovelo da função é uma tarefa usualmente visual.

Figura 3.7 - Ilustração do cotovelo, descrito pelo ponto.

! Buscando automatizar o processo de se buscar o cotovelo da função, procura-se o maior valor da segunda derivada da função que descreve as medidas calculadas para vários k. Na Figura 3.8, o valor ótimo de k é 4, marcado pela estrela. Ao se buscar o

máximo da segunda derivada da função, o que se busca é o ponto onde se tem a maior variação da taxa de crescimento da função, que é equivalente ao cotovelo da função. ! O uso da segunda derivada é válido pois enquanto a primeira derivada dá o crescimento da função, a segunda derivada informa o quão rápido o crescimento aumenta ou diminui. Um análogo pode ser traçado entre deslocamento, velocidade e aceleração. Enquanto a velocidade fornece o quanto de espaço se cobre em um tempo infinitesimal, a aceleração define o quão rápido a velocidade cresce ou decresce. No entanto, devem-se fazer algumas considerações ao se aplicar o método do cotovelo. Primeiramente, a função não deve ter seu domínio limitado. Segundo, que o domínio deve ser o conjunto dos números inteiros; desta forma, substitui-se a operação derivada pela diferença finita. Terceiro, os pontos no começo e no fim do domínio devem ser descartados, pois ao se fazer a diferença finita, pode levar a obtenção de uma função infinitamente grande, chamada impulso.

Considerações Finais

Neste capítulo, buscou-se definir a metodologia de agrupamento de dados empregada para resolver o problema da divisão da imagem que se deseja segmentar em regiões. Mostrou-se o procedimento k-means, e exibiram-se as dificuldades existentes na escolha do parâmetro k. Apesar do procedimento k-means ser simples, viu-se que existem várias dificuldades no método, como por exemplo sensibilidade à condições iniciais. Mostraram-se também as abordagens adotadas para a automatização da escolha do parâmetro k. Cabe notar que a escolha da abordagem de análise dos resultados finais do processo de agrupamento, adotada para a parte experimental deste trabalho, depende de métricas de qualidade adequadas. Espera-se averiguar experimentalmente a pertinência da métrica para o conjunto de imagens escolhidas para este trabalho de dissertação.

Capítulo 4

Implementação

Introdução

Após estudar as formas de representação de texturas e as técnicas de agrupamento de dados, procede-se para a fase experimental do trabalho. Nesta fase, especifica-se como se deve implementar os métodos necessários para a segmentação não-supervisionada de imagens baseadas em texturas, especificando-se os procedimentos de escolha dos parâmetros de cada algoritmo.

! Este capítulo aborda a implementação da metodologia empregada na segmentação de imagens, com detalhes sobre os algoritmos, escolha de parâmetros e método de janelamento da imagem.

No documento Avaliação de descritores de textura para segmentação não-supervisionada de imagens (páginas 62-71)