Segmenta¸c˜ ao de Imagens - M´ etodos que utilizam modelagem imagem/grafo em processamento de i

Grafos e redes complexas em imagens

3.2 M´ etodos que utilizam modelagem imagem/grafo em processamento de imagens

3.2.1 Segmenta¸c˜ ao de Imagens

Em visão computacional, segmenta¸cão se refere ao processo de dividir uma imagem digital em múltiplas regiões (conjunto de pixeis) ou objetos, com o objetivo de simplificar e/ou mudar a representa¸cão de uma imagem para facilitar a sua análise. O resultado da segmenta¸cão de imagens é um conjunto de regiões/objetos da imagem onde cada um dos pixeis em uma mesma região é similar com referência a alguma caracter´ıstica ou propriedade computacional, tais como cor, intensidade, textura ou continuidade. Regiões adjacentes devem possuir diferen¸cas significativas com respeito a(s) mesma(s) caracter´ıstica(s).

3.2.1.1 Segmenta¸c˜ao com lattices 4 ou 8-conectadas

A primeira forma de segmenta¸cão, e provavelmente a mais difundida, utiliza o sistema de vizinhan¸ca 4 ou 8 para definir as conexões entre os vértices. Uma aresta é adicionada a dois vértices se estes representam pixeis vizinhos de 4 ou 8 na imagem original. Tal tipo de adjacência enfatiza propriedades locais do grafo.

3.2 M´etodos que utilizam modelagem imagem/grafo em processamento de imagens 57

Nele o peso da aresta no sistema de vizinhos 8-adjacentes é tido como a diferen¸ca absoluta da intensidade de cinza entre os pixeis. Uma árvore geradora m´ınima então é obtida do modelo e uma segmenta¸cão da imagem em r regiões distintas é obtida pelo simples corte das r arestas com maior peso. Morris et al. (26) também propõe algumas formas de melhorar o resultado da segmenta¸cão, entre elas o cálculo da árvore geradora m´ınima de forma recursiva. Xu e Uberbacher (27) acrescentam algumas heur´ısticas ao método para tornar o processo de corte mais preciso e eficiente computacionalmente, e Vlachos e Constantinides (28) estende o trabalho de (26) para imagens coloridas, considerando a informa¸cão de cor no cálculo do peso da aresta. Uma abordagem hierárquica, utilizando wavelets na determina¸cão dos pesos da aresta e das imagens multi-escala, é realiza no trabalho (29). Outra abordagem hierárquica utilizando pirâmides é dada por (30). Outros métodos não baseados em grafos também podem ser utilizados após segmenta¸cão por árvore geradora m´ınima com objetivo de melhorar a qualidade final da segmenta¸cão e diminuir a super segmenta¸cão obtida (31).

Wu e Leahy (32, 33) também definem o peso da aresta como uma fun¸cão de similaridade entre os pixeis adjacentes. No entanto a segmenta¸cão é obtida pelo particionamento do grafo em subgrafos via corte de grafos. Esse particionamento é obtido removendo-se os arcos em G que correspondem ao corte m´ınimo com menor peso entre todos os cortes m´ınimos de todos os pares de vértices em G. O autor argumenta que o corte com baixo valor correspondem à contornos fechados com bordas evidentes e, consequentemente, bordas isoladas não produzem regiões na imagem, um vez que há um alto custo associado à inclusão das arestas com baixo valor necessárias para formar um contorno fechado. Dessa forma buracos no contorno são penalizados ao passo que grandes regiões não sofrem nenhum tipo de restri¸cão. Para tal particionamento o algoritmo de Gomory-Hu (34, 35) é inicialmente utilizado em (36). No entanto esse método apresenta um alto custo computacional e também apresenta uma super segmenta¸cão para algumas imagens. Em trabalhos subsequentes Wu e Leahy (33) calculam o corte m´ınimo com o algoritmo de Gomory-Hu modificado e otimizado visando minimizar o custo e tentar evitar a super segmenta¸cão. Cox et al. (37, 38) sugerem então outra forma de implementa¸cão muito similar utilizando chamada corte proporcional. Nesse método a fun¸cão de custo é uma propor¸cão do peso total das arestas podadas, normalizadas pelo tamanho das parti¸cões criadas (39).

Utilizando uma representa¸cão da imagem por d´ıgrafo, Jermyn e Ishikawa (40) apresentam uma outra forma de segmentar imagens. Nessa representa¸cão o peso e a dire¸cão da aresta é determinada pelo produto do gradiente entre os pixeis vizinhos. A segmenta¸cão é obtida por encontrar um ciclo/borda fechada que isola um objeto da imagem, utilizando para isso a solu¸cão do ciclo de peso m´ınimo normalizado.

58 3 Grafos e redes complexas em imagens

3.2.1.2 Segmenta¸c˜ao com conectividade por raio ou knn

Embora se obtenham bons resultados de segmenta¸cão com os métodos de conectividade limitada (i.e. árvore geradora m´ınima e corte de grafos com vizinhan¸ca 4-8), esses utilizam um critério de segmenta¸cão baseado em propriedades locais do grafo. Outra forma bastante utilizada para se determinar a adjacência entre os vértices é utilizar a conexão de k-vizinhos mais próximos, ou seja, mapear cada pixel para um espa¸co de caracter´ısticas e então agregar os pixeis mais similares com uma aresta. Nesse tipo de adjacência uma aresta e ∈ E e um peso wi,j, representando o relacionamento e similaridade entre pixeis i e j, são adicionados ao grafo se estes pixeis estão próximo no espa¸co de caracter´ısticas.

De fato há diversas formas para se determinar tais caracter´ısticas, sendo a mais comum conectar todos os pixeis vizinhos que estão a um raio r. De fato se apenas a caracter´ıstica de distância entre pixeis for utilizada para a conectividade knn, essa se reduz à conectividade por um raio apresentada anteriormente. O parâmetro r é, portanto, chave nesse tipo de modelagem.

Essa representa¸cão pode ou não gerar grafos planares, dependendo da fun¸cão de distância utilizada. O trabalho de Cour et al. (41) apresenta uma boa discussão nesse sentido e (42, 43) apresentam estudos de caso de segmenta¸cão para conectividade limitada e conectividade knn com diversas fun¸cões de distância.

O estudo realizado por Cour et al. (41) demostra que grandes valores de r melhoram a representa¸cão da imagem e sua subsequente segmenta¸cão. Entretanto há o problema do custo computacional envolvido. Para resolver (41) propõe modelar o grafo com um valor de r grande, em conjunto com uma metodologia baseada no particionamento do grafo em sub-grafos, obtendo assim uma segmenta¸cão eficiente tempo O(N ) com algoritmo de corte normalizado ótimo.

Ainda dentro desse contexto muitas são as solu¸cões de corte empregadas com objetivo de segmentar a imagem modelada. Os trabalhos de Shi e Malik (44), por exemplo, propõem uma fun¸cão de custo normalizada, chamada de corte normalizado, onde o fator de normaliza¸cão é a conectividade total dos nós em cada parti¸cão para todos os nós do grafo. Outras fun¸cões de custo para corte incluem os trabalhos (45, 46). Solu¸cões mais eficientes também podem ser alcan¸cadas com utiliza¸cão de versões recursivas (44), implementa¸cões hierárquicas (multi- escala) (41, 46) e outras abordagens (43, 47, 48).

Outra forma para segmenta¸cão de imagens é dada por Costa (7) que utiliza um grafo hierárquico de G′

3.2 M´etodos que utilizam modelagem imagem/grafo em processamento de imagens 59

conectados a este hub são adicionados à região segmentada.

3.2.1.3 Segmenta¸c˜ao via IFT

Outro modo utilizado para se determinar a rela¸cão de adjacência dos vértices no grafo é escolher, com base em alguma heur´ıstica, quais vértices serão conectados. Tal forma difere da conectividade Knn pelo fato de não haver um rela¸cão direta de similaridade (ou dissimilaridade) entre dois vértices adjacentes, ou seja, dado apenas os dois vértices é imposs´ıvel saber se esses serão adjacentes ou não no grafo.

Um recente trabalho muito interessante nessa linha é apresentado por Fal¸cão et al. (25). Nele a chamada image foresting transform (IFT) é utilizada em aplica¸cões de segmenta¸cão de imagens, deteçcão de bordas e esqueletoniza¸cão via transformada da distância. A IFT é dada pelo simples cálculo dos caminhos m´ınimos entre os vértices e alguns pontos de controle. O grafo resultante é uma floresta de caminhos ótimos.

A medida de distância, escolha dos pontos e a fun¸cão de custo utilizada são diversas e estão fortemente dependentes da aplica¸cão. Para realizar a transformada da distância, por exemplo, as sementes correspondem aos pixeis do contorno da imagem. Já para aplica¸cões de segmenta¸cão essas sementes podem ser escolhidas manualmente (segmenta¸cão dirigida) ou através de algum heur´ıstica. Diversos trabalhos exploram e propõem formas de melhorar a qualidade das aplica¸cões utilizando IFT (49, 50).

3.2.1.4 Segmenta¸c˜ao com sementes

Este tipo modelagem trata de segmenta¸cão dirigida, onde o fundo e objeto(s) de interesse são explicitamente pré-identificados manualmente. Semelhantemente à lattice 4 conectada apresentada anteriormente, esta modelagem atribui um vértices v ∈ V para cada pixel, uma aresta (direcionada ou não) e ∈ E e um peso wi,j, representando o relacionamento e similaridade entre pixeis i e j. A essas arestas dá-se o nome de n-links. Vértices especiais (chamados sementes ou terminais) são então adicionados ao grafo. No contexto de visão, estas sementes são rótulos atribu´ıdos a determinados pixeis da imagem, representando que aquele pixel per- tence ao fundo ou ao objeto(s) de interesse (51). Cada semente criada é então é conectada com uma aresta (t-links) a todos os vértices correspondentes aos pixeis da imagem.

Vários são os trabalhos ((51, 52)) que utilizam esta modelagem para realizar segmenta¸cão dirigida (onde o usuário indica quais são as sementes). Alguns trabalhos recentes focam esfor¸cos em determinar automaticamente quais são as sementes (regiões e objetos de inte-

60 3 Grafos e redes complexas em imagens

resse) através de uma pré-segmenta¸cão grosseira da imagem (53, 54), ficando a cargo da segmenta¸cão baseada em grafos obter um resultado mais refinado e preciso.

3.2.1.5 Segmenta¸c˜ao por regi˜oes

Nesse tipo de modelagem cada vértice vi ∈ V representa uma região distinta da imagem. Essas regiões são determinadas por uma pré-segmenta¸cão grosseira, muitas vezes apresentado uma imagem over-segmentada. Uma aresta (direcionada ou não) é então adicionada entre os vértices vi e vj se as regiões representadas por esses vértices forem vizinhas. Esse tipo de abordagem diminui o numero de vértices e arestas necessários para representar a imagem, diminuindo assim no custo computacional dos algoritmos de particionamento empregados, fato este que leva muitos trabalhos a empregarem tal metodologia (55, 56).

Várias são os métodos utilizados para se obter essa pré-segmenta¸cão, desde simples limi- ares, split-and-merge (36) e métodos mais refinados como Manford-Shah (57) e watershed (58). O objetivo, em geral, é agrupar pixeis semelhantes em pequenas regiões, obtendo uma imagem super segmentada, e após obter um refinamento desta segmenta¸cão utilizando modelagem em grafos.

No documento Redes complexas em visão computacional com aplicações em bioinformática (páginas 58-62)