Transformações de imagens baseadas em morfologia matematica

(1)

Transforma¸

c˜

oes de imagens baseadas em Morfologia

Matem´

atica

Este exemplar corresponde `a reda¸c˜ao final da Tese devidamente corrigida e defendida por Leyza Elmeri Baldo Dorini e aprovada pela Banca Examinadora.

Campinas, 16 de fevereiro de 2009.

Tese apresentada ao Instituto de Computa¸cão, unicamp, como requisito parcial para a ob-ten¸cão do t´ıtulo de Doutora em Ciência da Computa¸cão.

(2)

Dorini, Leyza Elmeri Baldo

D734t Transformações de imagens baseadas em morfologia matemática/ Leyza Elmeri Baldo Dorini -- Campinas, [S.P. :s.n.], 2009.

Orientador : Neucimar Jerônimo Leite

Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação.

1. Morfologia matemática. 2. Processamento de imagens. 3. Análise de imagens. I. Leite, Neucimar Jerônimo. II. Universidade Estadual de Campinas. Instituto de Computação. III. Título.

Título em inglês: Image transformations based on mathematical morphology operations.. Palavras-chave em inglês (Keywords): 1. Mathematical morphology. 2. Image processing. 3. Image analysis.

Área de concentração: Processamento de imagens. Titulação: Doutora em Ciência da Computação

Banca examinadora: Prof. Dr. Neucimar Jerônimo Leite (IC-UNICAMP) Prof. Dr. Aparecido Nilceu Marana (DCo-UNESP)

Prof. Dr. Roberto Hirata Júnior (IME-USP) Prof. Dr. Alexandre Xavier Falcão (IC-UNICAMP) Prof. Dr. Hélio Pedrini (IC-UNICAMP)

Data da defesa: 16/02/2009

Programa de Pós-Graduação: Doutorado em Ciência da Computação

(3)

(4)

Transforma¸

c˜

oes de imagens baseadas em Morfologia

Matem´

atica

Leyza Elmeri Baldo Dorini

1

Janeiro de 2009

Banca Examinadora:

• Prof. Dr. Neucimar Jerˆonimo Leite (Orientador) • Prof. Dr. Aparecido Nilceu Marana - DCo/UNESP • Prof. Dr. Roberto Hirata J´unior - IME/USP

• Prof. Dr. Alexandre Xavier Falc˜ao - IC/UNICAMP • Prof. Dr. H´elio Pedrini - IC/UNICAMP

• Prof. Dr. Arnaldo de Albuquerque Ara´ujo - DCC/UFMG (suplente) • Profa. Dra. Anamaria Gomide - IC/UNICAMP (suplente)

1_{Suporte financeiro de: bolsa FAPESP (processo 2005/4462-2).}

(5)

Resumo

Este trabalho apresenta um novo conjunto de transforma¸cões de imagens que podem ser utilizadas como uma etapa adicional em diversas aplica¸cões, tal como segmenta¸cão, de modo a evitar o uso de opera¸cões com custo computacional mais alto. Tais trans-forma¸cões utilizam como base opera¸cões de morfologia matemática e possuem a forma de um operador do tipo toggle. Inicialmente, foi definida uma nova opera¸cão com pro-priedades espa¸co-escala, através da qual pode-se obter uma simplifica¸cão bem controlada da imagem em que máximos e m´ınimos interagem ao mesmo tempo, uma vantagem em rela¸cão a outras abordagens que consideram transforma¸cões de extremos separadamente. A análise de diferentes n´ıveis de representa¸cão traz inúmeras vantagens, possibilitando lidar adequadamente com a natureza multi-escala das images e permitindo a extra¸cão das caracter´ısticas espec´ıficas que se tornam expl´ıcitas a cada escala. A partir de varia¸cões na formula¸cão e na forma de aplica¸cão do operador proposto, foi poss´ıvel definir uma nova opera¸cão de limiariza¸cão adaptativa multi-escala e um método de filtragem de ru´ıdo. Fo-ram realizados diversos experimentos que comprovaFo-ram as vantagens da utiliza¸cão das abordagens propostas.

(6)

In this work, we present a new set of image transformations that can be used as an additio-nal step in several applications, such as segmentation, to avoid the need of operations with a higher computational cost. These transformations are based on mathematical morpho-logy operations and have the format of a toggle operator. The first proposed operation has scale-space properties, which conduce to a well-controlled simplification of the image where minima and maxima interact at the same time, an advantage when compared to other approaches. Through the analysis of different representation levels, it is possible to deal with the multiscale nature of images, as well as to extract the specific features that become explicit at each scale. By changing the primitives the form of application of the proposed operator, we also define an adaptative multiscale thresholding operation and a noise filtering method. We show the results of several computational experiments, which demonstrate the advantages of the proposed approaches.

(7)

Agradecimentos

Ao meu marido Fabio, por estar sempre ao meu lado, compartilhando momentos alegres e dif´ıceis e, acima de tudo, me incentivando a sempre acreditar em mim mesma.

Ao meu orientador, Prof. Neucimar Leite, pelo incentivo e apoio prestados.

Ao Prof. Farhad Jafari, University of Wyoming, pelo apoio e incentivo durante a rea-liza¸c˜ao do Programa de Est´agio no Exterior.

Ao Instituto de Computa¸c˜ao e `a UNICAMP, pela estrutura e ambiente.

A todos que de alguma forma contribu´ıram para este trabalho: fam´ılia, professores, colegas e funcion´arios do IC.

`

A FAPESP pelo suporte financeiro.

(8)

Resumo vii

Abstract ix

Agradecimentos xi

1 Introdu¸c˜ao 1

1.1 Principais contribui¸c˜oes . . . 2

1.2 Organiza¸c˜ao da tese . . . 3

2 Princ´ıpios básicos de processamento de imagens e morfologia matemática 7 2.1 Defini¸cões básicas de processamento de imagens . . . 7

2.2 Transforma¸c˜oes de imagens e operadores . . . 9

2.3 Elementos e fun¸c˜oes estruturantes . . . 12

2.4 Opera¸cões básicas de morfologia matemática . . . 14

2.5 Outras transforma¸c˜oes morfol´ogicas . . . 18

2.6 Operadores do tipo toggle . . . 22

2.7 Transformada de watershed . . . 23

2.8 Conclus˜oes . . . 25

3 Teoria espa¸co-escala 27 3.1 Introdu¸c˜ao . . . 27

3.2 Vis˜ao geral da teoria espa¸co-escala . . . 29

3.3 Abordagem linear . . . 30

3.4 Espa¸cos-escala em duas dimens˜oes . . . 33

3.5 Abordagens n˜ao-lineares . . . 34

3.6 Espa¸cos-escala morfol´ogicos . . . 36

3.6.1 Erosão/Dilata¸cão Morfológica Multi-escala . . . 36

3.6.2 Espa¸cos-escala baseados em aberturas e fechamentos . . . 37

3.6.3 Espa¸cos-escala baseados em operadores conexos . . . 39 xiii

(9)

4 Operador SMMT: Self-dual Multiscale Morphological Toggle 41 4.1 Propriedades espa¸co-escala . . . 42

4.2 Varia¸cão no número de itera¸cões do operador SMMT . . . 47

4.3 Testes experimentais . . . 50

5 Exemplos de segmenta¸c˜ao de imagens com o operador SMMT 53 5.1 Segmenta¸c˜ao de imagens em n´ıveis de cinza . . . 54

5.2 Aplica¸cão: segmenta¸cão de células . . . 58

5.2.1 Abordagem proposta . . . 59

5.2.2 Resultados . . . 62

6 Abordagem toggle para binariza¸c˜ao multi-escala de imagens 67 6.1 Trabalhos relacionados . . . 69

6.2 Binariza¸c˜ao de imagens com problemas de ilumina¸c˜ao . . . 71

6.3 Binariza¸c˜ao de imagens de documentos . . . 72

6.3.1 Resultados experimentais . . . 73

6.3.2 Abordagem multi-escala para binariza¸c˜ao autom´atica . . . 80

6.4 Segmenta¸c˜ao de movimento em v´ıdeo . . . 81

6.4.1 Abordagem proposta . . . 82

6.5 Resultados . . . 83

7 Um operador de filtragem auto-dual 87 7.1 Operador de filtragem proposto e suas propriedades . . . 89

7.2 Filtragem de ru´ıdos do tipo gaussiano e impulsivo . . . 92

7.3 Filtragem de ru´ıdo do tipo speckle . . . 95

7.3.1 Trabalhos relacionados . . . 96

7.3.2 Resultados . . . 97

7.3.3 Filtragem e segmenta¸c˜ao de imagens SAR . . . 104

8 Conclus˜oes e trabalhos futuros 107 8.1 Trabalhos futuros . . . 108

8.2 Trabalhos publicados . . . 109

(10)

5.1 Medida F-score ao considerar um ´unico segmento que melhor se ajusta ao

objeto a ser segmentado. . . 56

5.2 Medida F-score ao considerar a uni˜ao de segmentos que melhor correspon-dem (se sobrep˜oem) ao objeto a ser segmentado. . . 56

5.3 Conjuntos de caracter´ısticas e taxas de classifica¸c˜ao. . . 65

6.1 Índices de Precisão e Revoca¸cão. . . 80

7.1 Primitivas consideradas nos testes. . . 92

7.2 RMSE considerando o filtro toggle (ru´ıdo gaussiano). . . 94

7.3 RMSE considerando o centro morfol´ogico (ru´ıdo gaussiano). . . 94

7.4 RMSE considerando o filtro toggle (ru´ıdo do tipo impulsivo). . . 94

7.5 RMSE considerando o centro morfol´ogico (ru´ıdo do tipo impulsivo). . . 95

7.6 RMSE médio dos resultados de filtragem das imagens da Figura 7.2 para o filtro toggle (ru´ıdo speckle). O RMSE médio das imagens com ru´ıdo é 27.22. . . 98

7.7 Valores médios da média e desvio padrão dos n´ıveis de cinza calculados nas regiões homogêneas para as cinco versões corrompidas da imagem da Figura 7.3(a). . . 100

7.8 Valores médios das medidas calculadas com base nas regiões homogêneas para as cinco versões corrompidas da imagem da Figura 7.3(a). . . 100

7.9 Valores médios da média e desvio padrão dos n´ıveis de cinza calculados nas regiões homogêneas para as cinco versões corrompidas da imagem da Figura 7.3(b). . . 101

7.10 Valores médios das medidas calculadas com base nas regiões homogêneas para as cinco versões corrompidas da imagem da Figura 7.3(b). . . 101

7.11 Valores médios da média e desvio padrão dos n´ıveis de cinza calculados nas regiões homogêneas para as cinco versões corrompidas da imagem da Figura 7.3(c). . . 102

(11)

7.12 Valores médios das medidas calculadas com base nas regiões homogêneas da imagem para as cinco versões corrompidas da imagem da Figura 7.3(c). 102 7.13 Valores médios da média e desvio padrão das regiões homogêneas para

versões com ru´ıdo da Figura 7.3(a-c). . . 103 7.14 Média das medidas para as versões com ru´ıdo da Figura 7.3(a-c). . . 103

(12)

2.1 Diferentes formas de representa¸cão de uma imagem: (a) binária, (b) em n´ıveis de cinza e (c) superf´ıcie topográfica. . . 9 2.2 Exemplos de elementos estruturantes planares abrangendo uma vizinhan¸ca

3 × 3. O ponto branco denota o centro do elemento estruturante. . . 13 2.3 Exemplos de fun¸cões estruturantes não-planares: (a) parabólica (b) cônica

e (c) pirâmide. . . 14 2.4 Exemplo de dilata¸cão binária: (a) imagem original, (b) aplica¸cão do

ele-mento estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na cor cinza foram criados). . . 15 2.5 Exemplo de erosão binária: (a) imagem original, (b) aplica¸cão do elemento

estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza foram eliminados). . . 16 2.6 (a) Imagem original, (b) dilata¸c˜ao e (c) eros˜ao de (a) utilizando um

ele-mento estruturante quadrado de tamanho 3 × 3. . . 17 2.7 Exemplo de filtragem morfol´ogica de uma imagem com ru´ıdo sal e pimenta:

(a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido de abertura. Todos os exemplo utilizaram um elemento estruturante circu-lar de raio 3. . . 19 2.8 Exemplo de fechamento por reconstru¸c˜ao: (a) imagem original, (b)

di-lata¸cão com elemento estruturante circular de raio 20 e (c) reconstru¸cão geodésica por erosão utilizando (b) como imagem marcadora. . . 22 2.9 Ilustra¸cão da transformada de watershed [5]: (a) imagem em n´ıveis de

cinza, (b) representa¸cão de (a) como uma superf´ıcie topográfica e (c)-(e) processo de inunda¸cão e constru¸cão de diques. . . 24 2.10 Transformada de watershed : (a) imagem original, (b) máximos regionais,

(c) segmenta¸cão utilizando máximos como marcadores, (d) pontos que pos-suem um contraste maior que 15 (e) segmenta¸cão resultante ao considerar pontos selecionados em (d) como marcadores. . . 24 3.1 Representa¸cão multi-escala de um sinal. . . 28

(13)

3.2 Exemplo de espa¸co-escala gaussiano: (a) sinal unidimensional aleatório, (b)-(e) representa¸cão espa¸co-escala para escalas crescentes e (f) fingerprint considerando máximos locais como caracter´ısticas. . . 31 3.3 Exemplo ilustrando a cria¸cão de um novo máximo local ao gerar um

espa¸co-escala gaussiano em duas dimens˜oes [52]. . . 33 3.4 Espa¸co-escala gaussiano bidimensional utilizando as escalas (desvio padr˜ao

do núcleo): (a) 1, (b) 2 e (c) 4. . . 34 3.5 Difusão anisotrópica de uma imagem considerando diferentes coeficientes

de difus˜ao: c1 = 20, c1 = 50 e c1 = 100. . . 35

3.6 Representa¸cão do espa¸co-escala MMDE. Erosão nas escalas (a) -0.5 e (b) -0.05, (c) imagem original, dilata¸cão nas escalas (d) 0.05 e (e) 0.5. . . 37 3.7 Representa¸cão do espa¸co-escala baseado na opera¸cão de abertura: (a)

ima-gem original e abertura utilizando uma fun¸c˜ao estruturante compacta e anti-convexa de tamanhos (b) 3 e (c) 5. . . 38 3.8 Espa¸co-escala baseado no filtro alternado sequencial [γφφγ]B(f ) utilizando

fun¸cões estruturantes de tamanho (a) 3, (b) 5 e (c) 7. . . 39 3.9 Espa¸co-escala gerado pela abertura por reconstru¸cão. . . 39 4.1 Transforma¸cão realizada pelo SMMT para diferentes quantidades de itera¸cões

das primitivas: (a) 10, (b) 50 e (c) 64. . . 48 4.2 Transforma¸c˜ao realizada pelo SMMT para diferentes quantidades de itera¸c˜oes

das primitivas: (a) 10, (b) 50 e (c) 64. . . 48 4.3 Transforma¸c˜ao realizada pelo SMMT para diferentes quantidades de itera¸c˜oes

das primitivas: (a) 10, (b) 50 e (c) 64. . . 49 4.4 Simplifica¸c˜ao obtida pelo operador ao considerar sucessivas aplica¸c˜oes (k =

1, 3 e 5) das primitivas na escala σ = 1. . . 49 4.5 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 5 e k = (a)

1, (b) 5, (c) 10 e (d) 15. . . 50 4.6 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 1 e k = (a)

1, (b) 5, (c) 10 e (d) 15. . . 51 4.7 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = (a) 15, (b)

10, (c) 5 e (d) 1 com k = 1. . . 51 4.8 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = (a) 15, (b)

10, (c) 5 e (d) 1 com k = 5. . . 52 4.9 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 15 com (a)

k = 1, (b) k = 5 e σ−1 = 1 com (c) k = 1, (d) k = 5, . . . 52 5.1 (a) Imagem original e simplifica¸c˜oes quando utilizando (b) operador SMMT

e (c) abertura por reconstru¸c˜ao (com idempotˆencia dos operadores). . . 53 xviii

(14)

5.3 Resultados para uma imagem com ilumina¸cão não-uniforme (varia¸cão gaus-siana): (a) imagem original, usando imagens transformadas (b) σ−1 = 60 e k = 1, com h = 2; (c) σ−1 = 60 e k = 1, com h = 10, e (d) com base na imagem original e h = 10. . . 55 5.4 Resultados de segmenta¸cão para uma imagem com ilumina¸cão não-uniforme

(varia¸c˜ao linear) (a) imagem original, (b) usando imagem transformada σ−1 = 10 e k = 5, com h = 45, e (c) com base na imagem original usando h = 45. . . 55 5.5 (a) imagens originais, (b) segmenta¸c˜ao manual e resultados obtidos com

marcadores extra´ıdos (c) da imagem processada pelo SMMT e (d) da ima-gem original. . . 57 5.6 Melhoria na imagem gradiente ap´os aplica¸c˜ao do operador SMMT: (a,d)

versões original e processada, (b,e) imagens gradiente e (c,f) resultados da segmenta¸cão. . . 60 5.7 Esquema de segmenta¸cão do citoplasma: (a) imagem original, (b)

limi-ariza¸cão para elimina¸cão do fundo, (c) abertura utilizando um elemento estruturante de tamanho maior que a distribui¸cão de tamanho das RBC e (d) contorno de (c) sobreposto na imagem original. . . 61 5.8 Células da linha celular granuloc´ıtica: (a) mieloblasto, (b) promielócito, (c)

mielócito, (d) metamielócito, (e) neutrófilo bastonete e (f) segmentado [53]. 62 5.9 Segmenta¸cão do núcleo de WBC em imagens com um único núcleo. . . 62 5.10 Segmenta¸cão do núcleo de WBC em imagens com múltiplas células. . . 63 5.11 Exemplo de segmenta¸cão onde o vazamento pode ser evitado com a

uti-liza¸cão do operador SMMT. Resultados utilizando como marcador externo a imagem gradiente (Sobel) da imagem (a,c) original e (b,d) processada pelo SMMT. . . 63 5.12 Resultados de segmenta¸cão de citoplasma. . . 63 5.13 Segmenta¸cão com Normalized Cuts: (a) imagem original e resultados

con-siderando a imagem (b) processada pelo SMMT (σ−1 = 5, k = 15) e (c) a partir da original. . . 64 5.14 Resultados com Mean Shift. (a) imagem de entrada (primeira linha:

origi-nal e segunda linha: processada pelo SMMT, (b) Segmenta¸cão e (c) bordas da segmenta¸cão. . . 64 6.1 Efeito da altera¸cão dos parâmetros no operador de binariza¸cão: (a) imagem

original, (b) σ−1 = 1 e k = 25 e (c) σ−1 = 40 e k = 5. . . 68 xix

(15)

6.2 Resultados de binariza¸cão para imagens com diferentes condi¸cões de ilu-mina¸cão: (a) imagens originais, (b) Otsu, (c) Niblack, (d) Gatos Gatos et al. e (e) médias deslizantes. . . 71 6.3 Resultados do operador de binariza¸cão proposto utilizando imagens com

diferentes condi¸cões de ilumina¸cão considerando como parâmetros (a) k = 50 e σ−1 = 1, (b) k = 50 e σ−1 = 2, (c) k = 10 e σ−1 = 1, (d) k = 2 e σ−1 = 8, (e) k = 2 e σ−1 = 25) e (f) k = 5 e σ−1 = 20. . . 72 6.4 Influência dos parâmetros escala e número de itera¸cões na binariza¸cão:

(a) imagem original e imagens processadas pelo operador utilizando (b) σ−1 = 1 e k = 1, (c) σ−1 = 10 e k = 1, (d) σ−1 = 1 e k = 10 e (e) σ−1 = 5 e k = 10. . . 73 6.5 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b)

m´edias deslizantes, (c) Niblack, (d) Sauvola, (e) Gatos et al. e (f) aborda-gem proposta utilizando σ−1 = 20 e k = 5. . . 74 6.6 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b)

algo-ritmo de médias deslizantes (c) método de Gatos et al. e (d) abordagem proposta utilizando σ−1 = 15 e k = 5. . . 75 6.7 Resultados de binariza¸cão. (a) imagem original e resultados para (b)

médias deslizantes, (c) método de Gatos et al. e (d) abordagem proposta utilizando σ−1 = 30 e k = 5. . . 76 6.8 Resultados de binariza¸cão. (a) imagem original e resultados para (b) Otsu,

(c) Sauvola, (d) m´edias deslizantes e (e) abordagem proposta para σ−1 = 20 e k = 2. . . 76 6.9 Observe que as componentes brancas no resultado de (a) m´edias deslizantes

n˜ao aparecem na (b) abordagem proposta. . . 77 6.10 Resultados para um procedimento de OCR utilizando o software Abby [2].

(a) Imagem original e textos extra´ıdos a partir dos resultados de (b) médias deslizantes (Figura 6.8(d)) e (c) abordagem proposta (Figura 6.8(e)). . . . 77 6.11 Imagens utilizadas para testes de OCR: (a) Doc 01, (b) Doc 02 e (c) Doc 03. 78 6.12 Resultados para o algoritmo de Sauvola. . . 78 6.13 Resultados para a abordagem proposta. . . 79 6.14 Resultados de binariza¸cão para o algoritmo de Gatos et al.. . . 79 6.15 Resultados de binariza¸cão para o algoritmo de Gatos et al. em que o

algoritmo de Sauvola é substitu´ıdo pelo operador proposto na obten¸cão da estimativa inicial do texto. . . 80 6.16 Abordagem multi-escala para binariza¸cão automática. (a) imagem original

e resultados ao considerar (b) 5 escalas e (c) apenas a escala mais baixa. . 81 xx

(16)

6.18 Resultados de segmenta¸cão para as diferentes abordagens. (a) imagem original, (b) diferen¸ca entre dois quadros, (c) subtra¸cão de fundo, (d) utili-zando morfologia matemática, (e) utilizando o procedimento proposto com σ−1 = 11 e k = 5, (f) utilizando o procedimento proposto com σ−1 = 11 e k = 2. . . 85 7.1 Imagens utilizadas nos experimentos: (a) original e corrompidas por ru´ıdo

do tipo (b) gaussiano e (c) impulsivo. . . 92 7.2 Testes em imagens com ru´ıdo speckle: (a) imagem original e vers˜oes com

ru´ıdo. O RMSE ´e (b) 16.74, (c) 27.43 e (d) 37.51. . . 98 7.3 Imagens originais a partir das quais foram geradas as vers˜oes com ru´ıdo

utilizadas para avalia¸c˜ao das abordagens de filtragem. . . 99 7.4 An´alise da qualidade dos contornos: (a) imagem original e contornos

es-timados a partir da filtragem obtida (b,c) com o algoritmo SRAD e (d,e) com o filtro toggle combinado com difus˜ao anisotr´opica. . . 104

(17)

Cap´ıtulo 1

Introdu¸

c˜

ao

A área de análise e processamento de imagens abrange um grande número de aplica¸cões, que envolvem desde tarefas de mais baixo n´ıvel, como deteçcão de pontos caracter´ısticos, até tarefas mais especializadas, tais como segmenta¸cão e classifica¸cão.

Grande parte destas aplica¸cões possui etapas em comum. Por exemplo, como em geral as imagens possuem um ru´ıdo inerente, frequentemente associado ao processo de aquisi¸cão, é comum a aplica¸cão de uma etapa de pré-processamento na imagem original antes de qualquer transforma¸cão. Muitas vezes tal etapa não visa somente filtrar o ru´ıdo, mas também simplificar a imagem a fim de eliminar detalhes não significativos que possam prejudicar o resultado final.

Este trabalho tem como principal objetivo definir um conjunto de transforma¸cões de imagens que possam ser utilizadas como uma etapa adicional em diversas aplica¸cões, de modo a evitar o uso de opera¸cões com custo computacional mais alto. Estas trans-forma¸cões utilizam como base opera¸cões de morfologia matemática, uma abordagem n˜ ao-linear de processamento de imagens que fundamenta-se em áreas tais como teoria dos conjuntos e geometria integral. Essencialmente, são exploradas as diferentes formas de aplica¸cão de um operador toggle, cuja idéia chave consiste em associar uma imagem com (a) um conjunto de poss´ıveis transforma¸cões (denominadas primitivas) ϕi, e (b) uma

re-gra de decis˜ao que determina em cada pixel x o melhor valor entre os candidatos ϕi e

f (x) [74, 75]. Aqui, a seguinte classe de operador toggle foi utilizada:

T (x) =    ϕ1, se ψ(x) − f (x) < f (x) − φ(x), f (x), se ψ(x) − f (x) = f (x) − φ(x), ϕ2, em outros casos. (1.1)

Como pode-se facilmente observar, tal operador envolve duas primitivas, ϕ1 e ϕ2, as

quais podem ou não consistir em transforma¸cões agindo na imagem original. A regra de decisão, por sua vez, compara em cada pixel a similaridade entre duas transforma¸cões morfológicas, ψ e φ, com o valor original deste.

(18)

1.1 Principais contribui¸

c˜

oes

As principais contribui¸c˜oes deste trabalho s˜ao as seguintes:

• Abordagens multi-escala vêm sendo amplamente utilizadas em diversas aplica¸cões de análise e processamento de sinais, sendo fundamentais em casos onde não existem informa¸cões preliminares sobre a escala de observa¸cão apropriada. A idéia básica consiste em criar uma fam´ılia de sinais derivados, permitindo assim a análise de diferentes n´ıveis de representa¸cão.

A teoria espa¸co-escala é uma destas abordagens. A partir dela, podem ser estabele-cidas as condi¸cões necessárias para a defini¸cão de transforma¸cões que possibilitem a manipula¸cão de caracter´ısticas presentes em diferentes n´ıveis de maneira consistente. Este trabalho propõe um novo operador com propriedades espa¸co-escala, o qual conduz a uma simplifica¸cão da imagem em que detalhes indesejados são elimi-nados sem comprometer de forma significativa as caracter´ısticas de interesse. Desse modo, é poss´ıvel identificar estruturas importantes utilizando opera¸cões simples, bem como obter bons resultados de segmenta¸cão e filtragem mesmo em imagens com problemas de ilumina¸cão. Além disso, o operador é auto-dual, ou seja, o fundo e a forma da imagem são transformados de forma simétrica.

• Diferentemente de outras abordagens, o operador espa¸co-escala proposto transforma máximos e m´ınimos da imagem ao mesmo tempo, conduzindo a uma fusão de regiões que a simplifica de tal forma que estruturas significativas podem ser identificadas mesmo quando da existência de varia¸cões nas condi¸cões de ilumina¸cão.

Estas propriedades são exploradas para definir uma nova opera¸cão de limia-riza¸cão adaptativa multi-escala, na qual o conceito de escala está relacionado à intensidade da transforma¸cão realizada nos n´ıveis de cinza da imagem.

• No entanto, nenhuma destas abordagens consegue lidar adequadamente com ima-gens que possuem ru´ıdo distribu´ıdo de maneira uniforme, assim como é o caso para os ru´ıdos do tipo impulsivo ou speckle, por exemplo. Neste contexto, foi proposto um novo método de filtragem que explora a combina¸cão de primitivas mais adequada ao ru´ıdo sendo considerado, tornando a abordagem adaptativa.

Além da formaliza¸cão das transforma¸cões propostas, também são discutidos diversos exemplos em que as mesmas mostraram-se de fundamental importância para obten¸cão de resultados de boa qualidade.

(19)

1.2. Organiza¸c˜ao da tese 3

1.2 Organiza¸

c˜

ao da tese

O texto desta tese está organizado de modo a apresentar tanto os principais resultados da pesquisa realizada quanto a fundamenta¸cão teórica associada. Esta se¸cão descreve brevemente o conteúdo de cada cap´ıtulo.

Cap´ıtulo 2:

Princ´ıpios b´asicos de processamento de imagens e morfologia matem´atica

Este cap´ıtulo traz uma breve introdu¸cão aos conceitos que se fazem necessários para a compreensão adequada do restante do texto. Inicialmente, são apresentadas algumas defini¸cões básicas, bem como os operadores utilizados para definir transforma¸cões de ima-gens e suas principais propriedades.

O foco principal são as opera¸cões de morfologia matemática, uma teoria de processa-mento não-linear de imagens introduzida na década de 60. Originalmente desenvolvida para análise de dados geológicos, mais especificamente da estrutura de meios porosos, esta teoria envolve atualmente um conjunto de técnicas utilizadas na formaliza¸cão e solu¸cão de diversos problemas práticos e teóricos de processamento e análise de imagens [57, 71, 72].

Cap´ıtulo 3:

Teoria espa¸co-escala

Os principais problemas referentes ao uso de métodos multi-escala se devem à di-ficuldade de relacionar informa¸cões significativas do sinal através dos diferentes n´ıveis. Visando evitá-los, Witkin [84] propôs uma nova abordagem, denominada espa¸co-escala, que formaliza um conjunto de propriedades que possibilitam a manipula¸cão de estru-turas da imagem presentes em diferentes escalas de maneira consistente. Como nesta representa¸cão uma caracter´ıstica de interesse descreve um caminho cont´ınuo, é poss´ıvel relacionar informa¸cões obtidas em diferentes n´ıveis de observa¸cão, bem como determinar sua localiza¸cão precisa no sinal original.

Uma das principais propriedades desta abordagem é que a transforma¸cão para um n´ıvel mais grosseiro não introduz novas estruturas, ou seja, caracter´ısticas pertencentes a uma escala espec´ıfica também estão presentes em todas as escalas mais finas. Tais fatos conduzem a uma simplifica¸cão do sinal original, pois a quantidade de caracter´ısticas diminui e as remanescentes em um dado n´ıvel correspondem a simplifica¸cões daquelas existentes inicialmente. Este cap´ıtulo discute as principais propriedades que caracterizam um método espa¸co-escala. Além disso, é apresentada uma breve revisão da literatura, abrangendo desde os primeiros métodos propostos, baseados em opera¸cões lineares, até aqueles formalizados recentemente [7].

(20)

Cap´ıtulo 4:

Um novo operador espa¸co-escala

Este cap´ıtulo define um novo operador com propriedades espa¸co-escala, denominado Self-dual Multiscale Morphological Toggle (SMMT):

Defini¸c˜ao 1.1. (Operador Self-dual Multiscale Morphological Toggle) Seja φk 1(x) =

[δBσ(f )]

k_{(x), isto ´}_{e, a dilata¸}_c˜_{ao de f (x) com a fun¸}_c˜_{ao estruturante n˜}_{ao-planar B}

σ k vezes.

De forma an´aloga, φk

2(x) = [εBσ(f )]

k_{(x). Denomina-se operador SMMT a fun¸}_c˜_ao:

(f gσ)k(x) =    φk 1(x), se φk1(x) − f (x) < f (x) − φk2(x), f (x), se φk 1(x) − f (x) = f (x) − φk2(x), φk₂(x), em outros casos. (1.2)

Como pode-se observar, as primitivas consistem nas transforma¸cões básicas da mor-fologia matemática, erosão e dilata¸cão, utilizando fun¸cões estruturantes não-planares. Desse modo, é poss´ıvel introduzir o conceito de escala, a qual determina a intensidade das modifica¸cões realizadas na imagem. A regra de decisão analisa pontualmente qual valor transformado está mais próximo do original e é calculada uma única vez.

Note também que as primitivas são aplicadas de forma iterativa. Como discutido em mais detalhes posteriormente, o aumento no número de itera¸cões é equivalente a considerar uma região de maior dimensão para cálculo do valor transformado de um pixel. Com isso, estruturas mais significativas podem ser identificadas [13].

Cap´ıtulo 5:

Resultados de segmenta¸c˜ao

Este cap´ıtulo ilustra alguns exemplos em que a utiliza¸cão do operador SMMT mostrou-se de fundamental importância para a obten¸cão de bons resultados na segmenta¸cão de imagens em n´ıveis de cinza. Isso se deve principalmente às suas propriedades, as quais conduzem a uma simplifica¸cão mais significativa quando comparada àquelas derivadas de métodos tradicionais tais como os filtros por reconstru¸cão [15, 16].

Com o objetivo de comprovar as vantagens da utiliza¸cão do operador proposto, os re-sultados obtidos a partir da imagem transformada e da original foram comparados entre si e também com uma base segmentada manualmente. Visando uma análise mais completa, foram consideradas inclusive imagens com ilumina¸cão não-uniforme, fator este que com-promete o desempenho de muitos algoritmos [12]. Além disso, a aplica¸cão do SMMT é inserida como uma etapa adicional em um método não-supervisionado de segmenta¸cão de células, ilustrando a importância da análise multi-escala para simplifica¸cão e regulariza¸cão dos contornos da imagem [17].

(21)

1.2. Organiza¸c˜ao da tese 5

Cap´ıtulo 6:

Um operador de binariza¸c˜ao multi-escala

Na transforma¸cão realizada pelo operador SMMT, máximos e m´ınimos da imagem interagem ao mesmo tempo, conduzindo a uma fusão de regiões que a simplifica de tal forma que estruturas significativas podem ser identificadas mesmo na presen¸ca de varia¸cões nas condi¸cões de ilumina¸cão e alguns tipos de ru´ıdo.

Este fato, aliado às propriedades multi-escala, é explorado para defini¸cão de uma nova opera¸cão de limiariza¸cão adaptativa multi-escala [45]. Em resumo, as primitivas do SMMT são substitu´ıdas pelos valores zero e um. Assim, se o valor de um pixel está mais próximo do seu valor erodido atribui-se a ele zero (preto). Caso contrário, atribui-se o valor um (branco), inclusive se a diferen¸ca entre o seu valor erodido e dilatado for a mesma.

Defini¸c˜ao 1.2. (Operador de binariza¸c˜ao adaptativo multi-escala) Seja φk 1(x) =

[δBσ(f )]

k_{(x), isto ´}_{e, a dilata¸}_c˜_{ao de f (x) com a fun¸}_c˜_{ao estruturante dependente de escala}

Bσ k vezes. De forma an´aloga, φk2(x) = [εBσ(f )]

k_{(x). O novo operador de binariza¸}_c˜_{ao ´}_e

dado pela fun¸c˜ao:

(f gσ)k(x) =

1, se φk

1(x) − f (x) ≤ f (x) − φk2(x),

0, em outros casos. (1.3)

Tal opera¸cão explora principalmente o fato que diferentes estruturas são afetadas de-pendendo da escala utilizada. Quanto menor a escala, por exemplo, maior deve ser a diferen¸ca entre os n´ıveis de cinza de pixels vizinhos para que os mesmos sejam alterados por uma das primitivas. Esta caracter´ıstica é útil nas aplica¸cões em que é necessário extrair informa¸cões relacionadas a regiões em que há uma maior varia¸cão, tais como con-tornos (os quais tipicamente correspondem aos limites f´ısicos dos objetos).

Dependendo do objetivo espec´ıfico, diferentes combina¸cões de parâmetros devem ser consideradas. Enquanto escalas maiores tendem a criar regiões, escalas menores as de-limitam, identificando regiões de contorno. Este cap´ıtulo também apresenta aplica¸cões envolvendo a binariza¸cão de imagens de documentos [45] e a segmenta¸cão de movimento em v´ıdeo [18].

Cap´ıtulo 7:

Um operador de filtragem auto-dual

Embora consiga lidar com problemas de ilumina¸cão e alguns tipos de ru´ıdo, o operador SMMT não é robusto quando o ru´ıdo está distribu´ıdo de maneira uniforme na imagem, tal

(22)

como na presen¸ca de ru´ıdo aditivo, por exemplo. Este fato motivou o desenvolvimento de uma nova varia¸cão do operador toggle (Equa¸cão 1.1) que possua propriedades de filtragem. Em suma, este cap´ıtulo propõe uma maneira alternativa de constru¸cão de filtros mor-fológicos auto-duais, estendendo os resultados válidos ao considerar centros morfológicos para uma classe diferente de operadores toggle [14]. A nova transforma¸cão é aplicada de forma iterativa (não mais as primitivas) e considera um conjunto mais abrangente de transforma¸cões (que sejam apropriadas para tratar o ru´ıdo em questão). Para evitar problemas tais como oscila¸cões, por exemplo, as primitivas precisam ter determinadas propriedades, que serão discutidas com maiores detalhes no momento apropriado.

Defini¸c˜ao 1.3. (Filtro toggle) Seja φ1 um sup-filtro e φ2 um inf-filtro. Denomina-se filtro

toggle a seguinte transforma¸c˜ao

fk+1(x) =    [φ1(fk)](x), se [φ1(fk)](x) − fk(x) < fk(x) − [φ2(fk)](x), fk_(x), _{se [φ} 1(fk)](x) − fk(x) = fk(x) − [φ2(fk)](x), [φ2(fk)](x), em outros casos, (1.4)

em que k denota a itera¸c˜ao.

Para avaliar a abordagem proposta, foram realizados testes com diferentes tipos de ru´ıdo e conjuntos de primitivas. De forma geral, os resultados obtidos s˜ao superiores `

aqueles definidos por filtros freq¨uentemente utilizados com esta finalidade.

Cap´ıtulo 8:

Conclus˜oes

Por fim, s˜ao apresentadas as conclus˜oes deste trabalho de pesquisa, bem como as perspectivas de trabalhos futuros.

(23)

Cap´ıtulo 2

Princ´ıpios b´

asicos de processamento

de imagens e morfologia matem´

atica

A morfologia matemática consiste em uma abordagem não-linear de processamento de imagens que se fundamenta em áreas tais como teoria dos conjuntos e geometria integral. Seu principal objetivo é extrair informa¸cões significativas de uma imagem com base na análise da sua geometria e da forma de seus objetos. Introduzida na década de 60, foi originalmente desenvolvida para análise de dados geológicos, mais especificamente da estrutura de meios porosos, representados utilizando imagens binárias. Atualmente, envolve um conjunto de técnicas utilizadas na formaliza¸cão e solu¸cão de diversos problemas práticos e teóricos de processamento e análise de imagens [57, 71, 72].

Este cap´ıtulo descreve conceitos relacionados às áreas de morfologia matemática e processamento de imagens necessários à compreensão deste trabalho. Inicialmente, são apresentadas algumas defini¸cões básicas sobre imagens. Na Se¸cão 2.2, são discutidos os operadores utilizados para definir transforma¸cões de imagens e suas principais proprie-dades. Na sequência, a Se¸cão 2.3 descreve algumas fun¸cões/elementos estruturantes. A Se¸cão 2.4 apresenta as opera¸cões fundamentais de morfologia matemática e algumas de suas propriedades, e a Se¸cão 2.5 define outras opera¸cões derivadas. Por fim, a Se¸cão 2.6 trata dos operadores do tipo toggle e a Se¸cão 2.7 do operador de watershed.

2.1 Defini¸

c˜

oes b´

asicas de processamento de imagens

O processamento e análise de imagens é uma área que aborda um grande número de aplica¸cões práticas, tais como reconhecimento de padrões e segmenta¸cão. Tem como prin-cipais objetivos a representa¸cão de uma imagem de maneira mais apropriada (reduzindo o seu n´ıvel de ru´ıdo, por exemplo) e a extra¸cão de caracter´ısticas significativas para o problema espec´ıfico sendo considerado (tais como marcadores dos objetos de interesse).

(24)

Uma imagem cont´ınua é definida como o mapeamento de um subconjunto dos números reais, Df, denominado suporte ou dom´ınio de defini¸cão de f , em um espa¸co de cores C [25]:

f : Df ⊂ R2 → C, (2.1)

em que f é denominada fun¸cão imagem e f (Df) é o conjunto (ou gamute) de cores de f .

De forma geral, C ∈ Rn, com n determinando a dimensionalidade da imagem.

No entanto, para fins de processamento computacional, é preciso utilizar uma re-presenta¸cão discreta. Uma imagem digital pode ser definida como sendo uma imagem cont´ınua que foi discretizada em termos de coordenadas espaciais e valor da intensidade no ponto, denominado pixel (picture element ) [26]. Dependendo do conjunto de valores associados a um determinado pixel, a imagem pode ser classificada de diferentes formas. Neste trabalho, serão utilizadas apenas imagens binárias e em tons de cinza e as aplica¸cões serão restritas aos casos uni- e bidimensional.

Em uma imagem binária, os pixels assumem os valores zero, quando pertencem ao seu fundo, ou um, caso contrário. Mais precisamente, uma imagem binária n-dimensional é um mapeamento de um subconjunto dos números inteiros, Df, denominado dom´ınio de

defini¸c˜ao de f , no conjunto {0, 1} [75]:

f : Df ⊂ Zn→ {0, 1}. (2.2)

No contexto de morfologia matemática, os objetos que compõem tais imagens são inter-pretados como conjuntos. A imagem ilustrada na Figura 2.1(a), por exemplo, pode ser analisada considerando apenas o conjunto dos pixels de valor um (brancos).

Por outro lado, para imagens em n´ıveis de cinza o intervalo dos valores que podem ser atribu´ıdos a um pixel é estendido ao conjunto dos inteiros não-negativos. Formalmente, uma imagem em n´ıveis de cinza é o mapeamento de um subconjunto dos números inteiros, Df, denominado dom´ınio de defini¸cão de f , em um conjunto finito e limitado dos inteiros

n˜ao-negativos [75]:

f : Df ⊂ Zn→ {0, 1, . . . , tmax}, (2.3)

em que tmax, representando o valor m´aximo que pode ser associado a um pixel, depende

do tipo de dados utilizado e ´e dado por tmax = 2n− 1, com n representando o n´umero

de bits. Uma imagem de 8 bits, por exemplo, possui valores variando de 0 a 255. A Figura 2.1(b) mostra um exemplo.

Na defini¸cão de determinadas transforma¸cões de morfologia matemática, uma imagem em n´ıveis de cinza é interpretada como uma superf´ıcie topográfica, onde o valor de um pixel representa a sua altura [75]. Tal representa¸cão, ilustrada na Figura 2.1(c), utiliza conceitos como pico (ponto de máximo), vale (ponto de m´ınimo), platô (zona plana) e watershed (contorno de uma região) da fun¸cão imagem.

(25)

2.2. Transforma¸c˜oes de imagens e operadores 9

(a) (b) (c)

Figura 2.1: Diferentes formas de representa¸cão de uma imagem: (a) binária, (b) em n´ıveis de cinza e (c) superf´ıcie topográfica.

2.2 Transforma¸

c˜

oes de imagens e operadores

Uma transforma¸cão é classificada como de “imagem para imagem” se ela preserva o mesmo dom´ınio de defini¸cão que a imagem inicial e se mantém um mapeamento deste no conjunto dos números inteiros não-negativos [75]. O exemplo mais trivial é o operador identidade, I, o qual não altera os valores iniciais dos pixels:

I(f ) = f. (2.4)

Outra transforma¸cão amplamente utilizada é a limiariza¸cão. Ela consiste, por exemplo, em alterar o valor de um determinado pixel para um, caso seu n´ıvel de cinza perten¸ca a um determinado intervalo de valores, ou para zero, caso contrário. Formalmente:

[T[ti,tj](f )](x) =

1, se ti ≤ f (x) ≤ tj,

0, em outros casos. (2.5)

Observe que, neste caso, o resultado depende apenas do pixel sobre análise. As trans-forma¸cões morfológicas, por outro lado, embora também sejam classificadas como sendo de “imagem para imagem”, consideram os valores dos n´ıveis de cinza na vizinhan¸ca do pixel em questão para cálculo do seu valor transformado. Portanto, faz-se necessário um conjunto de operadores que possam ser utilizados na defini¸cão de tais transforma¸cões.

Conforme mencionado anteriormente, uma das bases da morfologia matemática é a teoria de conjuntos, onde as opera¸cões básicas são a união, ∪, e a interseçcão, ∩. Quando imagens em n´ıveis de cinza são consideradas, tais opera¸cões são representadas pelos ope-radores de máximo e m´ınimo pontual, respectivamente [35, 72].

(26)

Dadas duas imagens, f e g, com o mesmo dom´ınio de defini¸cão, as opera¸cões de máximo e m´ınimo pontual são dadas por:

(f ∨ g)(x) = max{f (x), g(x)},

(f ∧ g)(x) = min{f (x), g(x)}. (2.6)

O complemento, por sua vez, ´e definido da seguinte forma [75]:

fc(x) = tmax− f (x), (2.7)

em que tmax representa o valor m´aximo que pode ser atribu´ıdo a um pixel de acordo com

o tipo de dados da aplica¸cão. O negativo de uma transforma¸cão, denotada aqui por Ψ, é dado por:

Ψ∗(f ) = [Ψ(fc)]c. (2.8)

A transla¸c˜ao horizontal de uma imagem f por um vetor b, denotada por fb, substitui o

valor original do pixel na posi¸cão x pelo valor existente na posi¸cão transladada horizon-talmente pelo vetor, isto é:

fb(x) = f (x + b). (2.9)

De forma geral, as transforma¸cões morfológicas podem ser definidas utilizando com-bina¸cões das opera¸cões de máximo e m´ınimo pontual, complemento e transla¸cão.

As rela¸cões de ordem da teoria de conjuntos (representadas pela opera¸cão de inclusão) também são estendidas para imagens em n´ıveis de cinza. Dadas duas imagens, f e g, com o mesmo dom´ınio de defini¸cão, f é dita menor que g se, considerando posi¸cões correspondentes, os valores dos pixels de f são menores que os de g [75]:

f ≤ g ⇔ f (x) ≤ g(x). (2.10)

Esta rela¸cão de ordem é definida para transforma¸cões de maneira análoga. Uma trans-forma¸cão Ψ é menor ou igual a uma transforma¸cão Φ se, e somente se, para qualquer imagem f , o valor transformado Ψ(f ) é menor ou igual a Φ(f ):

Ψ ≤ Φ ⇔ Ψ(f ) ≤ Φ(f ). (2.11)

Propriedades das transforma¸c˜oes de imagens

Transforma¸cões de imagens podem ser caracterizadas através de propriedades algébricas e topológicas, as quais permitem definir aspectos do seu comportamento que são funda-mentais para determinar sua aplicabilidade em um problema espec´ıfico. A seguir, serão apresentadas brevemente algumas das propriedades básicas que podem ser associadas às transforma¸cões (inclusive morfológicas) de imagens [29, 72, 75].

(27)

2.2. Transforma¸c˜oes de imagens e operadores 11

1. Idempotência: Uma transforma¸cão Ψ é dita idempotente se, ao repeti-la mais de uma vez na mesma imagem, o resultado permanece inalterado, ou seja, é equivalente aplicá-la uma ou n vezes:

Ψ(n) = Ψ, (2.12)

em que Ψ(n) denota a n-ésima itera¸cão da transforma¸cão, Ψ(n)= Ψ(n−1)Ψ. Quando aplicadas iterativamente, algumas transforma¸cões morfológicas utilizam esta propri-edade como critério de parada. Outras dependem dela para evitar problemas tais como oscila¸cões.

2. Extensividade: Uma transforma¸cão Ψ é extensiva se a imagem transformada é maior ou igual à imagem original:

Ψ(f ) ≥ f. (2.13)

3. Anti-extensividade: De maneira análoga, uma transforma¸cão Ψ é anti-extensiva se a imagem transformada é menor ou igual à imagem original:

Ψ(f ) ≤ f. (2.14)

4. Crescente: Uma transforma¸cão Ψ é dita crescente se ela preserva a rela¸cão de ordem entre imagens:

f ≤ g ⇒ Ψ(f ) ≤ Ψ(g). (2.15)

5. Dualidade: Duas transforma¸c˜oes Ψ e Φ s˜ao duais se:

Ψ(f ) = Φ∗(f ) ⇒ Ψ(f ) = [Φ(fc)]c, (2.16) em que c denota o operador complemento e ∗ o negativo. Em outras palavras, duas opera¸cões Ψ e Φ são duais se aplicar Ψ em uma imagem f é equivalente a tomar o complemento da aplica¸cão de Φ no complemento de f . Algumas propriedades de transforma¸cões duais podem ser herdadas, tais como:

• Ψ idempotente ⇒ Φ idempotente; • Ψ crescente ⇒ Φ crescente;

• Ψ anti-extensiva ⇒ Φ extensiva; • Ψ extensiva ⇒ Φ anti-extensiva.

6. Auto-dualidade: Uma transforma¸c˜ao Ψ ´e auto-dual se:

(28)

em que, novamente, o s´ımbolo ∗ denota o negativo. Observe que, neste caso, há um tratamento simétrico do fundo e da forma, considerando que aplicar a transforma¸cão auto-dual Ψ em uma imagem f é equivalente a realizar o complemento da aplica¸cão de Ψ no complemento de f , Ψ(f ) = [Ψ(fc)]c.

7. Complementaridade: Duas transforma¸cões Ψ e Φ são complementares se aplicar Ψ em uma imagem é equivalente a aplicar Φ no complemento desta imagem:

Ψ(f ) = Φ(fc), (2.18)

em que o s´ımbolo c denota o complemento. Por outro lado, uma transforma¸c˜ao Ψ ´e dita auto-complementar se

Ψ(f ) = Ψ(fc), (2.19)

ou seja, se a transforma¸cão Ψ consiste no seu próprio operador complementar. 8. Homotopia: Duas transforma¸cões Ψ e Φ são homotópicas se ambas possuem a

mesma árvore homotópica, o que equivale a possuir a mesma estrutura geométrica.

2.3 Elementos e fun¸

c˜

oes estruturantes

Para se extrair informa¸cões relativas aos objetos de uma imagem de forma precisa, é fundamental determinar adequadamente a vizinhan¸ca que será considerada no cálculo do valor transformado de cada pixel. Isso depende da escolha apropriada de um elemento de base - um elemento estruturante no caso binário, ou fun¸cão estruturante para imagens em n´ıveis de cinza - o qual, de maneira simplificada, define o tamanho e a forma da região a ser considerada por uma transforma¸cão morfológica.

Tais elementos podem ser classificadas em duas categorias: planares, onde todas as posi¸cões possuem o valor zero, ou não-planares, quando os valores associados podem ser distintos, definindo uma altura para a fun¸cão estruturante. Tais valores podem ser interpretados como “pesos” dados às diferentes dire¸cões consideradas [36].

A Figura 2.2 ilustra alguns elementos estruturantes planares abrangendo uma vizi-nhan¸ca 3 × 3, sendo que a escolha do mais apropriado depende da informa¸c˜ao que se deseja extrair. Estruturas diagonais, por exemplo, podem ser exploradas atrav´es por meio do elemento estruturante ilustrado na Figura 2.2(c).

Embora amplamente utilizadas, devido principalmente à facilidade de implementa¸cão e resultados satisfatórios em muitos casos, as fun¸cões estruturantes planares não conseguem extrair algumas propriedades espec´ıficas das imagens. Por exemplo, seu uso transforma as regiões em torno de máximos e m´ınimos locais em regiões planas, podendo causar o deslocamento da sua posi¸cão e constituindo um problema para diversas aplica¸cões [35].

(29)

2.3. Elementos e fun¸c˜oes estruturantes 13

(a) (b) (c)

Figura 2.2: Exemplos de elementos estruturantes planares abrangendo uma vizinhan¸ca 3 × 3. O ponto branco denota o centro do elemento estruturante.

Nestes casos, pode-se utilizar as fun¸c˜oes estruturantes n˜ao-planares, denotadas aqui por Bσ, as quais possuem o seguinte formato:

Bσ(x) = |σ|B|(|σ|−1x) x ∈ Bσ, ∀ σ 6= 0. (2.20)

Para garantir um comportamento de escala condizente, Bσ deve satisfazer a determinadas

condi¸c˜oes [36]. |σ| → 0 ⇒ Bσ(x) → 0, se x = 0, −∞, em outros casos. 0 < |σ1| < |σ2| ⇒ Bσ1(x) ≤ Bσ2(x) ∀ x ∈ Bσ1. (2.21) |σ| → ∞ ⇒ Bσ(x) → 0.

Tais condi¸c˜oes exigem que Bσ seja uma fun¸c˜ao monotonicamente decrescente ao longo

de qualquer dire¸cão radial a partir da origem (ou seja, anti-convexa). Para evitar des-locamento de n´ıveis e transla¸cão horizontal, as seguintes condi¸cões também devem ser observadas [36]:

sup

t∈Bσ

{Bσ(t)} = 0 e Bσ(0) = 0. (2.22)

As fun¸cões estruturantes não-planares podem ser utilizadas na defini¸cão de trans-forma¸cões morfológicas dependentes de escala, as quais permitem a análise de diferentes n´ıveis de representa¸cão, fator essencial para lidar adequadamente com a natureza multi-escala das imagens. Devido à sua importância para este trabalho, tais aspectos serão discutidos com mais detalhes no próximo cap´ıtulo.

Uma classe importante de tais fun¸cões discutida na literatura é representada pelas fun¸cões estruturantes quadráticas [79]. Os parabolóides, por exemplo, possuem boas pro-priedades de segunda derivada e separabilidade, possibilitando uma implementa¸cão com-putacionalmente eficiente [35]. Pode-se mostrar que uma fun¸cão estruturante não-planar

(30)

pode ser derivada a partir de qualquer fun¸cão estruturante côncava [70]. A Figura 2.3 ilustra três exemplos.

(a) (b) (c)

Figura 2.3: Exemplos de fun¸cões estruturantes não-planares: (a) parabólica (b) cônica e (c) pirâmide.

Neste trabalho, foram utilizadas as fun¸cões estruturantes parabólica e pirâmide, sendo esta última definida por:

Bσ(x, y) = −|σ|−1max{|x|, |y|}. (2.23)

Esta fun¸cão gera um elemento estruturante em que cada posi¸cão é associada à sua distância do centro. Tal caracter´ıstica facilita a visualiza¸cão e/ou descri¸cão de alguns dos resultados teóricos deste trabalho.

2.4 Opera¸

c˜

oes b´

asicas de morfologia matem´

atica

A erosão e a dilata¸cão são as opera¸cões fundamentais da morfologia matemática, consti-tuindo a base para a defini¸cão de transforma¸cões mais complexas [29, 57, 72, 75]. Para imagens binárias, a dilata¸cão dos pontos da forma, X, por um elemento estruturante B, denotada por δB(X), é definida como o conjunto de pontos x tal que B intercepta X

quando sua origem est´a centrada em x:

δB(X) = {x | Bx∩ X 6= ∅}, (2.24)

em que Bx denota a transla¸c˜ao do centro do elemento estruturante B para a posi¸c˜ao

x. Tal formula¸cão corresponde à pergunta “o elemento estruturante toca o conjunto?”, e é ilustrada na Figura 2.4. Esta equa¸cão deriva da opera¸cão de teoria dos conjuntos denominada soma de Minkowski:

(X ⊕ B) = {x + b : x ∈ X, b ∈ B} = [

b∈B

(31)

2.4. Opera¸cões básicas de morfologia matemática 15

(a) (b) (c)

Figura 2.4: Exemplo de dilata¸cão binária: (a) imagem original, (b) aplica¸cão do elemento estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na cor cinza foram criados).

a qual possui interessantes propriedades, tais como comutatividade e invariância à transla¸cão. De maneira análoga, a erosão de um conjunto X por um elemento estruturante B, εB(X), é definida como o conjunto de pontos x tal que B está inclu´ıdo em X quando sua

origem est´a centrada em x:

εB(X) = {x | Bx⊆ X}, (2.26)

em que, novamente, Bx denota a transla¸c˜ao do centro do elemento estruturante B para

a posi¸cão x. Esta formula¸cão, ilustrada na Figura 2.5, equivale à pergunta “o elemento estruturante cabe no conjunto?” e deriva da subtra¸cão de Minkowski, definida como:

(X B) = \

b∈B

X−b. (2.27)

As opera¸cões de soma e subtra¸cão de Minkowski (Equa¸cões 2.25 e 2.27) podem ser estendidas para imagens em n´ıveis de cinza utilizando as defini¸cões de máximo e m´ınimo pontual, apresentadas anteriormente na Se¸cão 2.2:

(f ⊕ B) = _ b∈B f−b (2.28) e (f B) = ^ b∈B f−b. (2.29)

Em resumo, o resultado das opera¸cões é dado pelo valor máximo (m´ınimo) encontrado nas posi¸cões de f transladadas pelos vetores −b.

Portanto, as opera¸cões de dilata¸cão e erosão para imagens em n´ıveis de cinza po-dem ser definidas em termos do máximo e m´ınimo na vizinhan¸ca definida pelo elemento estruturante transladado:

(32)

(a) (b) (c)

Figura 2.5: Exemplo de erosão binária: (a) imagem original, (b) aplica¸cão do elemento estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza foram elimi-nados).

Defini¸cão 2.1. (Dilata¸cão) A dilata¸cão de uma imagem f pela fun¸cão estruturante planar B, [δB(f )](x), é dada por [75]:

[δB(f )](x) = max

b∈B{f (x + b)}, (2.30)

ou seja, o valor dilatado de um pixel x ´e o m´aximo na vizinhan¸ca definida por B.

Defini¸cão 2.2. (Erosão) A erosão de uma imagem f pela fun¸cão estruturante planar B, [εB(f )](x), é dada por [75]:

[εB(f )](x) = min

b∈B{f (x + b)}, (2.31)

ou seja, o valor erodido de um pixel x ´e o m´ınimo na vizinhan¸ca definida por B.

A Figura 2.6 mostra as vers˜oes dilatada e erodida de uma imagem utilizando o elemento estruturante ilustrado na Figura 2.2(b).

Quando fun¸cões estruturantes não-planares são utilizadas, as opera¸cões de erosão e dilata¸cão são definidas da seguinte forma:

Defini¸cão 2.3. (Dilata¸cão) A dilata¸cão de uma imagem f pela fun¸cão estruturante Bσ(x),

[εBσ(f )](x), ´e dada por [75]:

[δBσ(f )](x) = max

b∈Bσ

{f (x + b) + Bσ(b)}. (2.32)

Defini¸cão 2.4. (Erosão) A erosão de uma imagem f pela fun¸cão estruturante Bσ(x),

[δBσ(f )](x), ´e dada por [75]:

[εBσ(f )](x) = min

b∈Bσ

(33)

2.4. Opera¸cões básicas de morfologia matemática 17

(a) (b) (c)

Figura 2.6: (a) Imagem original, (b) dilata¸c˜ao e (c) eros˜ao de (a) utilizando um elemento estruturante quadrado de tamanho 3 × 3.

As opera¸cões de dilata¸cão e erosão também podem ser definidas através do conceito de adjun¸cão [29], levando a uma abordagem matemática mais consistente em termos de opera¸cões algébricas. Uma discussão detalhada desta abordagem pode ser encontrada em [29, 72].

As principais propriedades da dilata¸c˜ao s˜ao sumarizadas a seguir [27, 29, 35]: 1. Comutatividade: δb(X) = δx(B);

2. Associatividade: δδC(B)(A) = δC(δB(A));

3. Extensiva: δb(X) ⊇ X se o elemento estruturante cont´em sua origem;

4. Decomposi¸c˜ao: δb∪c(X) = δb(X) ∪ δc(X) e δb∩c(X) = δb(X) ∩ δc(X).

A eros˜ao, por sua vez, satisfaz as seguintes propriedades: 1. N˜ao-comutatividade: εb(X) 6= εx(B);

2. Não-associatividade: No entanto, a seguinte rela¸cão é verdadeira: εC(εB(A)) =

εδC(B)(A);

3. Anti-extensiva: εb(X) ⊆ X se o elemento estruturante cont´em sua origem;

4. Decomposi¸c˜ao: εb∪c(X) = εb(X) ∩ εc(X) e εb∩c(X) = εb(X) ∪ εc(X).

Juntamente com a associatividade, as propriedades relacionadas à decomposi¸cão per-mitem a defini¸cão de formas de implementa¸cão eficientes, explorando conceitos tais como separabilidade. Além disso, as duas transforma¸cões são invariantes à transla¸cão e pre-servam a homotopia da imagem original. Ambas também são crescentes, implicando

(34)

assim que, se X ⊆ Y , ent˜ao δb(X) ⊆ δb(Y ) e εb(X) ⊆ εb(Y ). Pode-se tamb´em verificar

facilmente que as opera¸cões de erosão e dilata¸cão são duais, ou seja:

δB(X) = [εB(Xc)]c, (2.34)

em que c denota o complemento. Entretanto, elas não são auto-duais nem consistem em transforma¸cões inversas uma da outra, isto é, X 6= δB[εB(X)].

Algumas destas propriedades podem ser visualizadas na Figura 2.6. Observe que, enquanto a erosão diminui as regiões escuras da imagem e expande as claras, a dilata¸cão faz o contrário (anti-extensividade e extensividade). Este comportamento também mostra o efeito dual das transforma¸cões.

´

E importante ressaltar que as propriedades apresentadas podem ser estendidas para imagens em n´ıveis de cinza de forma direta, substituindo-se os operadores de teoria dos conjuntos pelos seus equivalentes para fun¸c˜oes. Uma discuss˜ao mais detalhada sobre tais aspectos pode ser encontrada em [27, 29, 71, 75].

2.5 Outras transforma¸

c˜

oes morfol´

ogicas

As opera¸cões de erosão e dilata¸cão possuem algumas limita¸cões mas, se combinadas de modo apropriado, resultam em transforma¸cões morfológicas mais robustas. A erosão, por exemplo, além de eliminar pequenas estruturas, também causa a redu¸cão de todas as outras. No entanto, se uma dilata¸cão for aplicada na imagem erodida, parte das estruturas perdidas será recuperada. Tal procedimento, de aplicar uma erosão seguida de uma dilata¸cão, define uma nova transforma¸cão denominada abertura [75]:

γB(f ) = δ_B˘[εB(f )], (2.35)

em que ˘B denota o transposto de B, ˘B = {−b | b ∈ B}. O uso de ˘B torna o resultado da transforma¸cão independente da posi¸cão de origem do elemento estruturante, mesmo quando este não é simétrico.

O fechamento, que consiste em uma dilata¸c˜ao seguida de uma eros˜ao, tende a recuperar de maneira aproximada a forma inicial das estruturas da imagem que foram dilatadas [75]:

φB(f ) = ε_B˘[δB(f )], (2.36)

em que, novamente, ˘B denota o transposto de B.

As opera¸cões de abertura e fechamento são duais e ambas são crescentes e idempoten-tes. Além disso, a abertura é anti-extensiva e atua sobre as estruturas claras, enquanto que o fechamento é extensivo e em termos visuais atua sobre as estruturas escuras da

(35)

2.5. Outras transforma¸c˜oes morfol´ogicas 19

imagem. Ambas não preservam a homotopia da imagem original e podem usar tanto fun¸cões estruturantes planares quanto não-planares.

Transforma¸cões crescentes e idempotentes caracterizam os denominados filtros mor-fológicos, uma abordagem não-linear que conduz tanto a recupera¸cão de imagens com ru´ıdo quanto a remo¸cão de estruturas ou objetos espec´ıficos de uma imagem segundo critérios tais como geometria ou contraste [75]. Por ser uma transforma¸cão crescente, a rela¸cão de ordem das imagens filtradas é preservada, possibilitando assim a sua com-para¸cão. A idempotência garante a estabilidade da opera¸cão, evitando problemas como a oscila¸cão, por exemplo.

Desde a sua introdu¸cão em 1988, a teoria de filtragem morfológica vem sendo ampla-mente explorada, envolvendo desde a defini¸cão de diferentes formas de constru¸cão com propriedades adicionais, tais como auto-dualidade, até a utiliza¸cão de filtros em que a condi¸cão de idempotência é apenas parcialmente satisfeita. Tais filtros, denominados filtros derivados [29], serão abordados com mais detalhes no Cap´ıtulo 7.

A Figura 2.7 ilustra a aplica¸cão das opera¸cões de abertura e fechamento (que con-sistem nos filtros morfológicos mais básicos) em uma imagem com ru´ıdo do tipo sal-e-pimenta (Figura 2.7(a)). Observe que, como nenhuma delas satisfaz a propriedade de auto-dualidade, não há um tratamento simétrico das estruturas claras e escuras da ima-gem (Figuras 2.7(b) e (c)). Este problema pode ser minimizado combinando-se as duas opera¸cões (Figura 2.7(d)).

(a) (b) (c) (d)

Figura 2.7: Exemplo de filtragem morfol´ogica de uma imagem com ru´ıdo sal e pimenta: (a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido de abertura. Todos os exemplo utilizaram um elemento estruturante circular de raio 3.

Observe que, dependendo do n´ıvel de ru´ıdo presente na imagem, apenas uma itera¸cão pode não ser suficiente para uma filtragem adequada, considerando-se a presen¸ca de ru´ıdos de diferentes escalas. Neste caso, mesmo a utiliza¸cão de um elemento estruturante de maior dimensão pode prejudicar o resultado final, eliminando estruturas importantes.

(36)

Uma solu¸c˜ao consiste em aplicar aberturas e fechamentos de forma alternada usando ele-mentos estruturantes de tamanho crescente. Tal procedimento define um filtro alternado sequencial.

Defini¸cão 2.5. (Filtro alternado sequencial) Seja (f ◦ Bi) uma abertura com elemento estruturante de tamanho i e (f • Bi) um fechamento de tamanho i. Considere também as seguintes combina¸cões, as quais constituem filtros morfológicos [75]:

mi = (f • Bi) ◦ Bi, ri = ((f • Bi) ◦ Bi) • Bi,

ni = (f ◦ Bi) • Bi, si = ((f ◦ Bi) • Bi) ◦ Bi.

Um filtro alternado sequencial de tamanho i é definido como a combina¸cão de um destes filtros, com o tamanho do elemento estruturante variando de um até i:

Mi = mi. . . m2m1, Ri = ri. . . r2r1,

Ni = ni. . . n2n1, Si = si. . . s2s1.

Embora não sejam necessariamente auto-duais, os filtros alternados sequenciais con-duzem a um tratamento mais simétrico das estruturas da imagem do que quando as opera¸cões de abertura e fechamento são utilizadas individualmente. Outra desvantagem de tais opera¸cões é que elas causam o deslocamento dos contornos [33, 72], o que pode prejudicar o desempenho de tarefas de mais alto n´ıvel que dependem da localiza¸cão exata destes.

Para evitar este problema, pode-se considerar filtros por reconstru¸cão, os quais recu-peram apenas a estrutura das componentes não eliminadas na etapa inicial de filtragem, preservando assim sua informa¸cão de contorno. Dois destes filtros frequentemente utili-zados são apresentados a seguir [75].

A abertura por reconstru¸cão consiste em uma erosão seguida por uma reconstru¸cão morfológica por dilata¸cão, ou seja [75]:

γ_R(n)(f ) = Rf[ε(f )], (2.37)

em que ε(f ) denota a eros˜ao de f com um elemento estruturante de tamanho n e Rf([ε(f )]) = δ

(i)

f ([ε(f )]) (2.38)

´

e a reconstru¸cão morfológica por dilata¸cão, em que δ_f(i)([ε(f )]) representa a i-ésima di-lata¸cão geodésica da imagem marcadora [ε(f )] utilizando f como imagem máscara:

(37)

2.5. Outras transforma¸c˜oes morfol´ogicas 21

ou seja, é o m´ınimo pontual entre a imagem máscara e a i-ésima dilata¸cão de tamanho n da imagem marcadora. O ´ındice i representa a itera¸cão onde a idempotência é atingida, isto é, δ(i)_{([ε(f )]) = δ}(i+1)_{([ε(f )]).}

Em resumo, pode-se afirmar que a reconstru¸cão por dilata¸cão de [ε(f )] com rela¸cão a f , tal que D[ε(f )] = Df e [ε(f )] ≤ f , é definida como a dilata¸cão geodésica de [ε(f )] com

rela¸cão à f até a estabilidade.

O fechamento por reconstru¸cão, que consiste em uma dilata¸cão seguida por uma re-constru¸cão morfológica por erosão, é definido por dualidade [75]:

φ(n)_R (f ) = R?_f[δ(f )], (2.40)

em que δ(f ) denota a dilata¸c˜ao de f com um elemento estruturante de tamanho n e

R?_f[δ(f )] = ε(i)_f ([δ(f )]) (2.41)

é a reconstru¸cão morfológica por erosão em que ε(i)_f ([δ(f )]) representa a i-ésima erosão geodésica de f utilizando [δ(f )] como imagem marcadora:

ε(i)_f ([δ(f )]) = ε(i)([δ(f )]) ∨ f, (2.42) ou seja, é o máximo pontual entre a imagem máscara e a i-ésima dilata¸cão de tamanho n da imagem marcadora. O ´ındice i representa novamente a itera¸cão onde a idempotência é atingida, isto é, ε(i+1)_{([δ(f )]) = ε}(i)_{([δ(f )]).}

De maneira análoga ao caso anterior, ε(i)_f ([δ(f )]) representa a erosão geodésica de [δ(f )] utilizando f com imagem máscara e i representa a itera¸cão onde a idempotência é atingida, isto é, ε([δ(i)(f )]) = ε(i+1)([δ(f )]).

A Figura 2.8 ilustra um exemplo de fechamento por reconstru¸cão. Observe na Fi-gura 2.8(c) que apenas as componentes que não foram eliminadas pela dilata¸cão (Fi-gura 2.8(b)) foram reconstru´ıdas.

Em alguns casos espec´ıficos, a aplica¸cão de uma mesma opera¸cão em todos os pixels de uma imagem pode não conduzir a resultados satisfatórios. Nestas situa¸cões, pode-se utilizar as transforma¸cões adaptativas, que modificam os pixels de diferentes formas, segundo critérios pré-estabelecidos que levam em considera¸cão informa¸cões tais como os valores dos n´ıveis de cinza na vizinhan¸ca definida pelo elemento estruturante, por exemplo. Tais transforma¸cões podem ser definidas através de operadores do tipo toggle, discutidos na próxima se¸cão.

(38)

(a) (b) (c)

Figura 2.8: Exemplo de fechamento por reconstru¸cão: (a) imagem original, (b) dilata¸cão com elemento estruturante circular de raio 20 e (c) reconstru¸cão geodésica por erosão utilizando (b) como imagem marcadora.

2.6 Operadores do tipo toggle

Em transforma¸cões do tipo toggle, a idéia central consiste em associar uma imagem com (a) um conjunto de poss´ıveis transforma¸cões (primitivas) ϕi, e (b) uma regra de decisão

que determina em cada pixel x o melhor valor entre os candidatos ϕi [74, 75].

Defini¸c˜ao 2.6. [74] Denomina-se mapeamento toggle das primitivas (ϕi) qualquer

ma-peamento ω tal que:

1. em cada ponto x, ωx ´e igual a ϕi ou f (x),

2. no mapeamento toggle ω, o crit´erio que transforma uma das primitivas ϕi em um

dado ponto x depende somente das primitivas ϕi, no valor num´erico f (x) e em

poss´ıveis constantes,

3. se no ponto x ao menos uma das primitivas ϕi coincide com o mapeamento

identi-dade f (x), ent˜ao

ωx = f (x). (2.43)

Um exemplo simples de operador do tipo toggle é a limiariza¸cão binária, em que a regra de decisão envolve, no ponto x, o valor f (x) e um limiar. Neste caso, as primitivas são o branco e o preto, ambas independentes de f (x).

Contudo, primitivas também podem consistir em transforma¸cões agindo na imagem original, como ocorre nos centros morfológicos, por exemplo. A defini¸cão de centro mor-fológico, γ, para uma fam´ılia de primitivas ϕi deriva de [74]:

(39)

2.7. Transformada de watershed 23

com η = ∨ϕi e ζ = ∧ϕi, onde ∨ representa o m´aximo pontual e ∧ representa o m´ınimo.

Ao considerar apenas duas primitivas, o centro morfológico é equivalente à medi-ana [74], uma transforma¸cão não-linear freqüentemente utilizada para filtragem de ru´ıdo devido a suas propriedades de preserva¸cão de bordas. No entanto, além de não ser idem-potente, sua aplica¸cão consecutiva pode desfazer mudan¸cas e causar oscila¸cões [30]. Heij-mans [31] utilizou o centro morfológico para construir operadores auto-duais e, subseq¨ uen-temente, filtros auto-duais.

Outro exemplo de operador do tipo toggle ´e dado a seguir. Dadas duas primitivas, ϕ1

e ϕ2, a regra de decis˜ao escolhe como valor transformado aquele que mais se aproxima do

valor original do pixel sendo analisado.

T (x) =    ϕ1(x), se ϕ1(x) − f (x) < f (x) − ϕ2(x), f (x), se ϕ1(x) − f (x) = f (x) − ϕ2(x), ϕ2(x), em outros casos. (2.45)

Neste trabalho, esta classe de operadores é explorada para a defini¸cão de diferentes trans-forma¸cões, com aplica¸cões em segmenta¸cão, filtragem e análise multi-escala de imagens. Nos cap´ıtulos 3-7 os resultados obtidos são apresentados de forma mais detalhada.

2.7 Transformada de watershed

Basicamente, um procedimento de segmenta¸cão consiste em particionar uma imagem em um conjunto de regiões homogêneas e não-sobrepostas, as quais devem corresponder a objetos da imagem significativos para uma certa aplica¸cão. Uma segmenta¸cão precisa é essencial para um grande número de aplica¸cões de processamento de imagens, tais como reconhecimento e representa¸cão.

No contexto de morfologia matemática, a segmenta¸cão de imagens em n´ıveis de cinza é tipicamente realizada da seguinte forma. Primeiramente, são extra´ıdos marcadores das estruturas significativas da imagem, e então a transformada denominada wastershed (Linha Divisora de Águas) [6, 75] é utilizada para obter os contornos de tais estruturas da forma mais precisa poss´ıvel. A seguir, são apresentadas as idéias principais do método.

Considere uma imagem em tons de cinza representada como uma superf´ıcie topográfica, assim como ilustrado anteriormente na Figura 2.1(c). Assuma que cada m´ınimo desta su-perf´ıcie corresponda a uma perfura¸cão e que ela é colocada na água verticalmente a uma velocidade constante. Iniciando no m´ınimo de menor altitude, a água irá progressiva-mente preencher as bacias da imagem (Figura 2.9). O conjunto de diques constru´ıdos nos lugares em que dois fluxos de água distintos se encontram, representando a parti¸cão das bacias da imagem original, é denominado watershed.

(40)

(a) (b) (c) (d) (e)

Figura 2.9: Ilustra¸cão da transformada de watershed [5]: (a) imagem em n´ıveis de cinza, (b) representa¸cão de (a) como uma superf´ıcie topográfica e (c)-(e) processo de inunda¸cão e constru¸cão de diques.

Os limites das bacias de uma imagem em n´ıveis de cinza também podem ser interpre-tados como as zonas de influência dos seus m´ınimos regionais. Neste sentido, a transfor-mada de watershed é o esqueleto por zonas de influência dos m´ınimos da imagem [75]. No entanto, extremos (freqüentemente utilizados como marcadores) podem corresponder a estruturas não-significativas ou ru´ıdo, causando super-segmenta¸cão.

Para evitar este problema, uma alternativa é selecionar os extremos segundo algum critério, tal como contraste, área das regiões e assim por diante. A Figura 2.10 ilustra um exemplo. A utiliza¸cão de todos os máximos locais como marcadores provoca uma super-segmenta¸cão (Figura 2.10(c)). Se somente pontos que possuem um contraste maior que 15 forem utilizados como marcadores, um resultado mais preciso é obtido (Figura 2.10(e)).

(a) (b) (c) (d) (e)

Figura 2.10: Transformada de watershed : (a) imagem original, (b) máximos regionais, (c) segmenta¸cão utilizando máximos como marcadores, (d) pontos que possuem um contraste maior que 15 (e) segmenta¸cão resultante ao considerar pontos selecionados em (d) como marcadores.

(41)

2.8. Conclus˜oes 25

2.8 Conclus˜

oes

Transforma¸cões de imagens são amplamente utilizadas em diversas aplica¸cões, consis-tindo desde etapas de pré-processamento até procedimentos completos. Este cap´ıtulo apresentou alguns exemplos, bem como uma breve revisão de conceitos necessários ao en-tendimento do restante do texto. Uma maior ênfase foi dada às opera¸cões de morfologia matemática, as quais constituem a base das transforma¸cões propostas neste trabalho.

No entanto, é preciso considerar também a análise de diferentes n´ıveis de representa¸cão, a qual vem sendo amplamente utilizada para lidar com a natureza multi-escala das ima-gens. Através de tais abordagens, é poss´ıvel extrair as caracter´ısticas de interesse que se tornam expl´ıcitas em cada n´ıvel. Diversas formula¸cões foram propostas, tais como wave-lets, decomposi¸cão piramidal e espa¸co-escala, esta última o foco principal deste trabalho. O próximo cap´ıtulo discute em detalhes suas principais propriedades.