• Nenhum resultado encontrado

Transformações de imagens baseadas em morfologia matematica

N/A
N/A
Protected

Academic year: 2021

Share "Transformações de imagens baseadas em morfologia matematica"

Copied!
131
0
0

Texto

(1)

Transforma¸

oes de imagens baseadas em Morfologia

Matem´

atica

Este exemplar corresponde `a reda¸c˜ao final da Tese devidamente corrigida e defendida por Leyza Elmeri Baldo Dorini e aprovada pela Banca Examinadora.

Campinas, 16 de fevereiro de 2009.

Tese apresentada ao Instituto de Computa¸c˜ao, unicamp, como requisito parcial para a ob-ten¸c˜ao do t´ıtulo de Doutora em Ciˆencia da Computa¸c˜ao.

(2)

Dorini, Leyza Elmeri Baldo

D734t Transformações de imagens baseadas em morfologia matemática/ Leyza Elmeri Baldo Dorini -- Campinas, [S.P. :s.n.], 2009.

Orientador : Neucimar Jerônimo Leite

Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação.

1. Morfologia matemática. 2. Processamento de imagens. 3. Análise de imagens. I. Leite, Neucimar Jerônimo. II. Universidade Estadual de Campinas. Instituto de Computação. III. Título.

Título em inglês: Image transformations based on mathematical morphology operations.. Palavras-chave em inglês (Keywords): 1. Mathematical morphology. 2. Image processing. 3. Image analysis.

Área de concentração: Processamento de imagens. Titulação: Doutora em Ciência da Computação

Banca examinadora: Prof. Dr. Neucimar Jerônimo Leite (IC-UNICAMP) Prof. Dr. Aparecido Nilceu Marana (DCo-UNESP)

Prof. Dr. Roberto Hirata Júnior (IME-USP) Prof. Dr. Alexandre Xavier Falcão (IC-UNICAMP) Prof. Dr. Hélio Pedrini (IC-UNICAMP)

Data da defesa: 16/02/2009

Programa de Pós-Graduação: Doutorado em Ciência da Computação

(3)
(4)

Transforma¸

oes de imagens baseadas em Morfologia

Matem´

atica

Leyza Elmeri Baldo Dorini

1

Janeiro de 2009

Banca Examinadora:

• Prof. Dr. Neucimar Jerˆonimo Leite (Orientador) • Prof. Dr. Aparecido Nilceu Marana - DCo/UNESP • Prof. Dr. Roberto Hirata J´unior - IME/USP

• Prof. Dr. Alexandre Xavier Falc˜ao - IC/UNICAMP • Prof. Dr. H´elio Pedrini - IC/UNICAMP

• Prof. Dr. Arnaldo de Albuquerque Ara´ujo - DCC/UFMG (suplente) • Profa. Dra. Anamaria Gomide - IC/UNICAMP (suplente)

1Suporte financeiro de: bolsa FAPESP (processo 2005/4462-2).

(5)

Resumo

Este trabalho apresenta um novo conjunto de transforma¸c˜oes de imagens que podem ser utilizadas como uma etapa adicional em diversas aplica¸c˜oes, tal como segmenta¸c˜ao, de modo a evitar o uso de opera¸c˜oes com custo computacional mais alto. Tais trans-forma¸c˜oes utilizam como base opera¸c˜oes de morfologia matem´atica e possuem a forma de um operador do tipo toggle. Inicialmente, foi definida uma nova opera¸c˜ao com pro-priedades espa¸co-escala, atrav´es da qual pode-se obter uma simplifica¸c˜ao bem controlada da imagem em que m´aximos e m´ınimos interagem ao mesmo tempo, uma vantagem em rela¸c˜ao a outras abordagens que consideram transforma¸c˜oes de extremos separadamente. A an´alise de diferentes n´ıveis de representa¸c˜ao traz in´umeras vantagens, possibilitando lidar adequadamente com a natureza multi-escala das images e permitindo a extra¸c˜ao das caracter´ısticas espec´ıficas que se tornam expl´ıcitas a cada escala. A partir de varia¸c˜oes na formula¸c˜ao e na forma de aplica¸c˜ao do operador proposto, foi poss´ıvel definir uma nova opera¸c˜ao de limiariza¸c˜ao adaptativa multi-escala e um m´etodo de filtragem de ru´ıdo. Fo-ram realizados diversos experimentos que comprovaFo-ram as vantagens da utiliza¸c˜ao das abordagens propostas.

(6)

In this work, we present a new set of image transformations that can be used as an additio-nal step in several applications, such as segmentation, to avoid the need of operations with a higher computational cost. These transformations are based on mathematical morpho-logy operations and have the format of a toggle operator. The first proposed operation has scale-space properties, which conduce to a well-controlled simplification of the image where minima and maxima interact at the same time, an advantage when compared to other approaches. Through the analysis of different representation levels, it is possible to deal with the multiscale nature of images, as well as to extract the specific features that become explicit at each scale. By changing the primitives the form of application of the proposed operator, we also define an adaptative multiscale thresholding operation and a noise filtering method. We show the results of several computational experiments, which demonstrate the advantages of the proposed approaches.

(7)

Agradecimentos

Ao meu marido Fabio, por estar sempre ao meu lado, compartilhando momentos alegres e dif´ıceis e, acima de tudo, me incentivando a sempre acreditar em mim mesma.

Ao meu orientador, Prof. Neucimar Leite, pelo incentivo e apoio prestados.

Ao Prof. Farhad Jafari, University of Wyoming, pelo apoio e incentivo durante a rea-liza¸c˜ao do Programa de Est´agio no Exterior.

Ao Instituto de Computa¸c˜ao e `a UNICAMP, pela estrutura e ambiente.

A todos que de alguma forma contribu´ıram para este trabalho: fam´ılia, professores, colegas e funcion´arios do IC.

`

A FAPESP pelo suporte financeiro.

(8)

Resumo vii

Abstract ix

Agradecimentos xi

1 Introdu¸c˜ao 1

1.1 Principais contribui¸c˜oes . . . 2

1.2 Organiza¸c˜ao da tese . . . 3

2 Princ´ıpios b´asicos de processamento de imagens e morfologia matem´atica 7 2.1 Defini¸c˜oes b´asicas de processamento de imagens . . . 7

2.2 Transforma¸c˜oes de imagens e operadores . . . 9

2.3 Elementos e fun¸c˜oes estruturantes . . . 12

2.4 Opera¸c˜oes b´asicas de morfologia matem´atica . . . 14

2.5 Outras transforma¸c˜oes morfol´ogicas . . . 18

2.6 Operadores do tipo toggle . . . 22

2.7 Transformada de watershed . . . 23

2.8 Conclus˜oes . . . 25

3 Teoria espa¸co-escala 27 3.1 Introdu¸c˜ao . . . 27

3.2 Vis˜ao geral da teoria espa¸co-escala . . . 29

3.3 Abordagem linear . . . 30

3.4 Espa¸cos-escala em duas dimens˜oes . . . 33

3.5 Abordagens n˜ao-lineares . . . 34

3.6 Espa¸cos-escala morfol´ogicos . . . 36

3.6.1 Eros˜ao/Dilata¸c˜ao Morfol´ogica Multi-escala . . . 36

3.6.2 Espa¸cos-escala baseados em aberturas e fechamentos . . . 37

3.6.3 Espa¸cos-escala baseados em operadores conexos . . . 39 xiii

(9)

3.7 Conclus˜oes . . . 40

4 Operador SMMT: Self-dual Multiscale Morphological Toggle 41 4.1 Propriedades espa¸co-escala . . . 42

4.2 Varia¸c˜ao no n´umero de itera¸c˜oes do operador SMMT . . . 47

4.3 Testes experimentais . . . 50

4.4 Conclus˜oes . . . 52

5 Exemplos de segmenta¸c˜ao de imagens com o operador SMMT 53 5.1 Segmenta¸c˜ao de imagens em n´ıveis de cinza . . . 54

5.2 Aplica¸c˜ao: segmenta¸c˜ao de c´elulas . . . 58

5.2.1 Abordagem proposta . . . 59

5.2.2 Resultados . . . 62

5.3 Conclus˜oes . . . 66

6 Abordagem toggle para binariza¸c˜ao multi-escala de imagens 67 6.1 Trabalhos relacionados . . . 69

6.2 Binariza¸c˜ao de imagens com problemas de ilumina¸c˜ao . . . 71

6.3 Binariza¸c˜ao de imagens de documentos . . . 72

6.3.1 Resultados experimentais . . . 73

6.3.2 Abordagem multi-escala para binariza¸c˜ao autom´atica . . . 80

6.4 Segmenta¸c˜ao de movimento em v´ıdeo . . . 81

6.4.1 Abordagem proposta . . . 82

6.5 Resultados . . . 83

6.6 Conclus˜oes . . . 85

7 Um operador de filtragem auto-dual 87 7.1 Operador de filtragem proposto e suas propriedades . . . 89

7.2 Filtragem de ru´ıdos do tipo gaussiano e impulsivo . . . 92

7.3 Filtragem de ru´ıdo do tipo speckle . . . 95

7.3.1 Trabalhos relacionados . . . 96

7.3.2 Resultados . . . 97

7.3.3 Filtragem e segmenta¸c˜ao de imagens SAR . . . 104

7.4 Conclus˜oes . . . 105

8 Conclus˜oes e trabalhos futuros 107 8.1 Trabalhos futuros . . . 108

8.2 Trabalhos publicados . . . 109

(10)

5.1 Medida F-score ao considerar um ´unico segmento que melhor se ajusta ao

objeto a ser segmentado. . . 56

5.2 Medida F-score ao considerar a uni˜ao de segmentos que melhor correspon-dem (se sobrep˜oem) ao objeto a ser segmentado. . . 56

5.3 Conjuntos de caracter´ısticas e taxas de classifica¸c˜ao. . . 65

6.1 ´Indices de Precis˜ao e Revoca¸c˜ao. . . 80

7.1 Primitivas consideradas nos testes. . . 92

7.2 RMSE considerando o filtro toggle (ru´ıdo gaussiano). . . 94

7.3 RMSE considerando o centro morfol´ogico (ru´ıdo gaussiano). . . 94

7.4 RMSE considerando o filtro toggle (ru´ıdo do tipo impulsivo). . . 94

7.5 RMSE considerando o centro morfol´ogico (ru´ıdo do tipo impulsivo). . . 95

7.6 RMSE m´edio dos resultados de filtragem das imagens da Figura 7.2 para o filtro toggle (ru´ıdo speckle). O RMSE m´edio das imagens com ru´ıdo ´e 27.22. . . 98

7.7 Valores m´edios da m´edia e desvio padr˜ao dos n´ıveis de cinza calculados nas regi˜oes homogˆeneas para as cinco vers˜oes corrompidas da imagem da Figura 7.3(a). . . 100

7.8 Valores m´edios das medidas calculadas com base nas regi˜oes homogˆeneas para as cinco vers˜oes corrompidas da imagem da Figura 7.3(a). . . 100

7.9 Valores m´edios da m´edia e desvio padr˜ao dos n´ıveis de cinza calculados nas regi˜oes homogˆeneas para as cinco vers˜oes corrompidas da imagem da Figura 7.3(b). . . 101

7.10 Valores m´edios das medidas calculadas com base nas regi˜oes homogˆeneas para as cinco vers˜oes corrompidas da imagem da Figura 7.3(b). . . 101

7.11 Valores m´edios da m´edia e desvio padr˜ao dos n´ıveis de cinza calculados nas regi˜oes homogˆeneas para as cinco vers˜oes corrompidas da imagem da Figura 7.3(c). . . 102

(11)

7.12 Valores m´edios das medidas calculadas com base nas regi˜oes homogˆeneas da imagem para as cinco vers˜oes corrompidas da imagem da Figura 7.3(c). 102 7.13 Valores m´edios da m´edia e desvio padr˜ao das regi˜oes homogˆeneas para

vers˜oes com ru´ıdo da Figura 7.3(a-c). . . 103 7.14 M´edia das medidas para as vers˜oes com ru´ıdo da Figura 7.3(a-c). . . 103

(12)

2.1 Diferentes formas de representa¸c˜ao de uma imagem: (a) bin´aria, (b) em n´ıveis de cinza e (c) superf´ıcie topogr´afica. . . 9 2.2 Exemplos de elementos estruturantes planares abrangendo uma vizinhan¸ca

3 × 3. O ponto branco denota o centro do elemento estruturante. . . 13 2.3 Exemplos de fun¸c˜oes estruturantes n˜ao-planares: (a) parab´olica (b) cˆonica

e (c) pirˆamide. . . 14 2.4 Exemplo de dilata¸c˜ao bin´aria: (a) imagem original, (b) aplica¸c˜ao do

ele-mento estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na cor cinza foram criados). . . 15 2.5 Exemplo de eros˜ao bin´aria: (a) imagem original, (b) aplica¸c˜ao do elemento

estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza foram eliminados). . . 16 2.6 (a) Imagem original, (b) dilata¸c˜ao e (c) eros˜ao de (a) utilizando um

ele-mento estruturante quadrado de tamanho 3 × 3. . . 17 2.7 Exemplo de filtragem morfol´ogica de uma imagem com ru´ıdo sal e pimenta:

(a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido de abertura. Todos os exemplo utilizaram um elemento estruturante circu-lar de raio 3. . . 19 2.8 Exemplo de fechamento por reconstru¸c˜ao: (a) imagem original, (b)

di-lata¸c˜ao com elemento estruturante circular de raio 20 e (c) reconstru¸c˜ao geod´esica por eros˜ao utilizando (b) como imagem marcadora. . . 22 2.9 Ilustra¸c˜ao da transformada de watershed [5]: (a) imagem em n´ıveis de

cinza, (b) representa¸c˜ao de (a) como uma superf´ıcie topogr´afica e (c)-(e) processo de inunda¸c˜ao e constru¸c˜ao de diques. . . 24 2.10 Transformada de watershed : (a) imagem original, (b) m´aximos regionais,

(c) segmenta¸c˜ao utilizando m´aximos como marcadores, (d) pontos que pos-suem um contraste maior que 15 (e) segmenta¸c˜ao resultante ao considerar pontos selecionados em (d) como marcadores. . . 24 3.1 Representa¸c˜ao multi-escala de um sinal. . . 28

(13)

3.2 Exemplo de espa¸co-escala gaussiano: (a) sinal unidimensional aleat´orio, (b)-(e) representa¸c˜ao espa¸co-escala para escalas crescentes e (f) fingerprint considerando m´aximos locais como caracter´ısticas. . . 31 3.3 Exemplo ilustrando a cria¸c˜ao de um novo m´aximo local ao gerar um

espa¸co-escala gaussiano em duas dimens˜oes [52]. . . 33 3.4 Espa¸co-escala gaussiano bidimensional utilizando as escalas (desvio padr˜ao

do n´ucleo): (a) 1, (b) 2 e (c) 4. . . 34 3.5 Difus˜ao anisotr´opica de uma imagem considerando diferentes coeficientes

de difus˜ao: c1 = 20, c1 = 50 e c1 = 100. . . 35

3.6 Representa¸c˜ao do espa¸co-escala MMDE. Eros˜ao nas escalas (a) -0.5 e (b) -0.05, (c) imagem original, dilata¸c˜ao nas escalas (d) 0.05 e (e) 0.5. . . 37 3.7 Representa¸c˜ao do espa¸co-escala baseado na opera¸c˜ao de abertura: (a)

ima-gem original e abertura utilizando uma fun¸c˜ao estruturante compacta e anti-convexa de tamanhos (b) 3 e (c) 5. . . 38 3.8 Espa¸co-escala baseado no filtro alternado sequencial [γφφγ]B(f ) utilizando

fun¸c˜oes estruturantes de tamanho (a) 3, (b) 5 e (c) 7. . . 39 3.9 Espa¸co-escala gerado pela abertura por reconstru¸c˜ao. . . 39 4.1 Transforma¸c˜ao realizada pelo SMMT para diferentes quantidades de itera¸c˜oes

das primitivas: (a) 10, (b) 50 e (c) 64. . . 48 4.2 Transforma¸c˜ao realizada pelo SMMT para diferentes quantidades de itera¸c˜oes

das primitivas: (a) 10, (b) 50 e (c) 64. . . 48 4.3 Transforma¸c˜ao realizada pelo SMMT para diferentes quantidades de itera¸c˜oes

das primitivas: (a) 10, (b) 50 e (c) 64. . . 49 4.4 Simplifica¸c˜ao obtida pelo operador ao considerar sucessivas aplica¸c˜oes (k =

1, 3 e 5) das primitivas na escala σ = 1. . . 49 4.5 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 5 e k = (a)

1, (b) 5, (c) 10 e (d) 15. . . 50 4.6 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 1 e k = (a)

1, (b) 5, (c) 10 e (d) 15. . . 51 4.7 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = (a) 15, (b)

10, (c) 5 e (d) 1 com k = 1. . . 51 4.8 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = (a) 15, (b)

10, (c) 5 e (d) 1 com k = 5. . . 52 4.9 Transforma¸c˜ao do SMMT ao considerar os parˆametros σ−1 = 15 com (a)

k = 1, (b) k = 5 e σ−1 = 1 com (c) k = 1, (d) k = 5, . . . 52 5.1 (a) Imagem original e simplifica¸c˜oes quando utilizando (b) operador SMMT

e (c) abertura por reconstru¸c˜ao (com idempotˆencia dos operadores). . . 53 xviii

(14)

5.3 Resultados para uma imagem com ilumina¸c˜ao n˜ao-uniforme (varia¸c˜ao gaus-siana): (a) imagem original, usando imagens transformadas (b) σ−1 = 60 e k = 1, com h = 2; (c) σ−1 = 60 e k = 1, com h = 10, e (d) com base na imagem original e h = 10. . . 55 5.4 Resultados de segmenta¸c˜ao para uma imagem com ilumina¸c˜ao n˜ao-uniforme

(varia¸c˜ao linear) (a) imagem original, (b) usando imagem transformada σ−1 = 10 e k = 5, com h = 45, e (c) com base na imagem original usando h = 45. . . 55 5.5 (a) imagens originais, (b) segmenta¸c˜ao manual e resultados obtidos com

marcadores extra´ıdos (c) da imagem processada pelo SMMT e (d) da ima-gem original. . . 57 5.6 Melhoria na imagem gradiente ap´os aplica¸c˜ao do operador SMMT: (a,d)

vers˜oes original e processada, (b,e) imagens gradiente e (c,f) resultados da segmenta¸c˜ao. . . 60 5.7 Esquema de segmenta¸c˜ao do citoplasma: (a) imagem original, (b)

limi-ariza¸c˜ao para elimina¸c˜ao do fundo, (c) abertura utilizando um elemento estruturante de tamanho maior que a distribui¸c˜ao de tamanho das RBC e (d) contorno de (c) sobreposto na imagem original. . . 61 5.8 C´elulas da linha celular granuloc´ıtica: (a) mieloblasto, (b) promiel´ocito, (c)

miel´ocito, (d) metamiel´ocito, (e) neutr´ofilo bastonete e (f) segmentado [53]. 62 5.9 Segmenta¸c˜ao do n´ucleo de WBC em imagens com um ´unico n´ucleo. . . 62 5.10 Segmenta¸c˜ao do n´ucleo de WBC em imagens com m´ultiplas c´elulas. . . 63 5.11 Exemplo de segmenta¸c˜ao onde o vazamento pode ser evitado com a

uti-liza¸c˜ao do operador SMMT. Resultados utilizando como marcador externo a imagem gradiente (Sobel) da imagem (a,c) original e (b,d) processada pelo SMMT. . . 63 5.12 Resultados de segmenta¸c˜ao de citoplasma. . . 63 5.13 Segmenta¸c˜ao com Normalized Cuts: (a) imagem original e resultados

con-siderando a imagem (b) processada pelo SMMT (σ−1 = 5, k = 15) e (c) a partir da original. . . 64 5.14 Resultados com Mean Shift. (a) imagem de entrada (primeira linha:

origi-nal e segunda linha: processada pelo SMMT, (b) Segmenta¸c˜ao e (c) bordas da segmenta¸c˜ao. . . 64 6.1 Efeito da altera¸c˜ao dos parˆametros no operador de binariza¸c˜ao: (a) imagem

original, (b) σ−1 = 1 e k = 25 e (c) σ−1 = 40 e k = 5. . . 68 xix

(15)

6.2 Resultados de binariza¸c˜ao para imagens com diferentes condi¸c˜oes de ilu-mina¸c˜ao: (a) imagens originais, (b) Otsu, (c) Niblack, (d) Gatos Gatos et al. e (e) m´edias deslizantes. . . 71 6.3 Resultados do operador de binariza¸c˜ao proposto utilizando imagens com

diferentes condi¸c˜oes de ilumina¸c˜ao considerando como parˆametros (a) k = 50 e σ−1 = 1, (b) k = 50 e σ−1 = 2, (c) k = 10 e σ−1 = 1, (d) k = 2 e σ−1 = 8, (e) k = 2 e σ−1 = 25) e (f) k = 5 e σ−1 = 20. . . 72 6.4 Influˆencia dos parˆametros escala e n´umero de itera¸c˜oes na binariza¸c˜ao:

(a) imagem original e imagens processadas pelo operador utilizando (b) σ−1 = 1 e k = 1, (c) σ−1 = 10 e k = 1, (d) σ−1 = 1 e k = 10 e (e) σ−1 = 5 e k = 10. . . 73 6.5 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b)

m´edias deslizantes, (c) Niblack, (d) Sauvola, (e) Gatos et al. e (f) aborda-gem proposta utilizando σ−1 = 20 e k = 5. . . 74 6.6 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b)

algo-ritmo de m´edias deslizantes (c) m´etodo de Gatos et al. e (d) abordagem proposta utilizando σ−1 = 15 e k = 5. . . 75 6.7 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b)

m´edias deslizantes, (c) m´etodo de Gatos et al. e (d) abordagem proposta utilizando σ−1 = 30 e k = 5. . . 76 6.8 Resultados de binariza¸c˜ao. (a) imagem original e resultados para (b) Otsu,

(c) Sauvola, (d) m´edias deslizantes e (e) abordagem proposta para σ−1 = 20 e k = 2. . . 76 6.9 Observe que as componentes brancas no resultado de (a) m´edias deslizantes

n˜ao aparecem na (b) abordagem proposta. . . 77 6.10 Resultados para um procedimento de OCR utilizando o software Abby [2].

(a) Imagem original e textos extra´ıdos a partir dos resultados de (b) m´edias deslizantes (Figura 6.8(d)) e (c) abordagem proposta (Figura 6.8(e)). . . . 77 6.11 Imagens utilizadas para testes de OCR: (a) Doc 01, (b) Doc 02 e (c) Doc 03. 78 6.12 Resultados para o algoritmo de Sauvola. . . 78 6.13 Resultados para a abordagem proposta. . . 79 6.14 Resultados de binariza¸c˜ao para o algoritmo de Gatos et al.. . . 79 6.15 Resultados de binariza¸c˜ao para o algoritmo de Gatos et al. em que o

algoritmo de Sauvola ´e substitu´ıdo pelo operador proposto na obten¸c˜ao da estimativa inicial do texto. . . 80 6.16 Abordagem multi-escala para binariza¸c˜ao autom´atica. (a) imagem original

e resultados ao considerar (b) 5 escalas e (c) apenas a escala mais baixa. . 81 xx

(16)

6.18 Resultados de segmenta¸c˜ao para as diferentes abordagens. (a) imagem original, (b) diferen¸ca entre dois quadros, (c) subtra¸c˜ao de fundo, (d) utili-zando morfologia matem´atica, (e) utilizando o procedimento proposto com σ−1 = 11 e k = 5, (f) utilizando o procedimento proposto com σ−1 = 11 e k = 2. . . 85 7.1 Imagens utilizadas nos experimentos: (a) original e corrompidas por ru´ıdo

do tipo (b) gaussiano e (c) impulsivo. . . 92 7.2 Testes em imagens com ru´ıdo speckle: (a) imagem original e vers˜oes com

ru´ıdo. O RMSE ´e (b) 16.74, (c) 27.43 e (d) 37.51. . . 98 7.3 Imagens originais a partir das quais foram geradas as vers˜oes com ru´ıdo

utilizadas para avalia¸c˜ao das abordagens de filtragem. . . 99 7.4 An´alise da qualidade dos contornos: (a) imagem original e contornos

es-timados a partir da filtragem obtida (b,c) com o algoritmo SRAD e (d,e) com o filtro toggle combinado com difus˜ao anisotr´opica. . . 104

(17)

Cap´ıtulo 1

Introdu¸

ao

A ´area de an´alise e processamento de imagens abrange um grande n´umero de aplica¸c˜oes, que envolvem desde tarefas de mais baixo n´ıvel, como detec¸c˜ao de pontos caracter´ısticos, at´e tarefas mais especializadas, tais como segmenta¸c˜ao e classifica¸c˜ao.

Grande parte destas aplica¸c˜oes possui etapas em comum. Por exemplo, como em geral as imagens possuem um ru´ıdo inerente, frequentemente associado ao processo de aquisi¸c˜ao, ´e comum a aplica¸c˜ao de uma etapa de pr´e-processamento na imagem original antes de qualquer transforma¸c˜ao. Muitas vezes tal etapa n˜ao visa somente filtrar o ru´ıdo, mas tamb´em simplificar a imagem a fim de eliminar detalhes n˜ao significativos que possam prejudicar o resultado final.

Este trabalho tem como principal objetivo definir um conjunto de transforma¸c˜oes de imagens que possam ser utilizadas como uma etapa adicional em diversas aplica¸c˜oes, de modo a evitar o uso de opera¸c˜oes com custo computacional mais alto. Estas trans-forma¸c˜oes utilizam como base opera¸c˜oes de morfologia matem´atica, uma abordagem n˜ ao-linear de processamento de imagens que fundamenta-se em ´areas tais como teoria dos conjuntos e geometria integral. Essencialmente, s˜ao exploradas as diferentes formas de aplica¸c˜ao de um operador toggle, cuja id´eia chave consiste em associar uma imagem com (a) um conjunto de poss´ıveis transforma¸c˜oes (denominadas primitivas) ϕi, e (b) uma

re-gra de decis˜ao que determina em cada pixel x o melhor valor entre os candidatos ϕi e

f (x) [74, 75]. Aqui, a seguinte classe de operador toggle foi utilizada:

T (x) =    ϕ1, se ψ(x) − f (x) < f (x) − φ(x), f (x), se ψ(x) − f (x) = f (x) − φ(x), ϕ2, em outros casos. (1.1)

Como pode-se facilmente observar, tal operador envolve duas primitivas, ϕ1 e ϕ2, as

quais podem ou n˜ao consistir em transforma¸c˜oes agindo na imagem original. A regra de decis˜ao, por sua vez, compara em cada pixel a similaridade entre duas transforma¸c˜oes morfol´ogicas, ψ e φ, com o valor original deste.

(18)

1.1

Principais contribui¸

oes

As principais contribui¸c˜oes deste trabalho s˜ao as seguintes:

• Abordagens multi-escala vˆem sendo amplamente utilizadas em diversas aplica¸c˜oes de an´alise e processamento de sinais, sendo fundamentais em casos onde n˜ao existem informa¸c˜oes preliminares sobre a escala de observa¸c˜ao apropriada. A id´eia b´asica consiste em criar uma fam´ılia de sinais derivados, permitindo assim a an´alise de diferentes n´ıveis de representa¸c˜ao.

A teoria espa¸co-escala ´e uma destas abordagens. A partir dela, podem ser estabele-cidas as condi¸c˜oes necess´arias para a defini¸c˜ao de transforma¸c˜oes que possibilitem a manipula¸c˜ao de caracter´ısticas presentes em diferentes n´ıveis de maneira consistente. Este trabalho prop˜oe um novo operador com propriedades espa¸co-escala, o qual conduz a uma simplifica¸c˜ao da imagem em que detalhes indesejados s˜ao elimi-nados sem comprometer de forma significativa as caracter´ısticas de interesse. Desse modo, ´e poss´ıvel identificar estruturas importantes utilizando opera¸c˜oes simples, bem como obter bons resultados de segmenta¸c˜ao e filtragem mesmo em imagens com problemas de ilumina¸c˜ao. Al´em disso, o operador ´e auto-dual, ou seja, o fundo e a forma da imagem s˜ao transformados de forma sim´etrica.

• Diferentemente de outras abordagens, o operador espa¸co-escala proposto transforma m´aximos e m´ınimos da imagem ao mesmo tempo, conduzindo a uma fus˜ao de regi˜oes que a simplifica de tal forma que estruturas significativas podem ser identificadas mesmo quando da existˆencia de varia¸c˜oes nas condi¸c˜oes de ilumina¸c˜ao.

Estas propriedades s˜ao exploradas para definir uma nova opera¸c˜ao de limia-riza¸c˜ao adaptativa multi-escala, na qual o conceito de escala est´a relacionado `a intensidade da transforma¸c˜ao realizada nos n´ıveis de cinza da imagem.

• No entanto, nenhuma destas abordagens consegue lidar adequadamente com ima-gens que possuem ru´ıdo distribu´ıdo de maneira uniforme, assim como ´e o caso para os ru´ıdos do tipo impulsivo ou speckle, por exemplo. Neste contexto, foi proposto um novo m´etodo de filtragem que explora a combina¸c˜ao de primitivas mais adequada ao ru´ıdo sendo considerado, tornando a abordagem adaptativa.

Al´em da formaliza¸c˜ao das transforma¸c˜oes propostas, tamb´em s˜ao discutidos diversos exemplos em que as mesmas mostraram-se de fundamental importˆancia para obten¸c˜ao de resultados de boa qualidade.

(19)

1.2. Organiza¸c˜ao da tese 3

1.2

Organiza¸

ao da tese

O texto desta tese est´a organizado de modo a apresentar tanto os principais resultados da pesquisa realizada quanto a fundamenta¸c˜ao te´orica associada. Esta se¸c˜ao descreve brevemente o conte´udo de cada cap´ıtulo.

Cap´ıtulo 2:

Princ´ıpios b´asicos de processamento de imagens e morfologia matem´atica

Este cap´ıtulo traz uma breve introdu¸c˜ao aos conceitos que se fazem necess´arios para a compreens˜ao adequada do restante do texto. Inicialmente, s˜ao apresentadas algumas defini¸c˜oes b´asicas, bem como os operadores utilizados para definir transforma¸c˜oes de ima-gens e suas principais propriedades.

O foco principal s˜ao as opera¸c˜oes de morfologia matem´atica, uma teoria de processa-mento n˜ao-linear de imagens introduzida na d´ecada de 60. Originalmente desenvolvida para an´alise de dados geol´ogicos, mais especificamente da estrutura de meios porosos, esta teoria envolve atualmente um conjunto de t´ecnicas utilizadas na formaliza¸c˜ao e solu¸c˜ao de diversos problemas pr´aticos e te´oricos de processamento e an´alise de imagens [57, 71, 72].

Cap´ıtulo 3:

Teoria espa¸co-escala

Os principais problemas referentes ao uso de m´etodos multi-escala se devem `a di-ficuldade de relacionar informa¸c˜oes significativas do sinal atrav´es dos diferentes n´ıveis. Visando evit´a-los, Witkin [84] propˆos uma nova abordagem, denominada espa¸co-escala, que formaliza um conjunto de propriedades que possibilitam a manipula¸c˜ao de estru-turas da imagem presentes em diferentes escalas de maneira consistente. Como nesta representa¸c˜ao uma caracter´ıstica de interesse descreve um caminho cont´ınuo, ´e poss´ıvel relacionar informa¸c˜oes obtidas em diferentes n´ıveis de observa¸c˜ao, bem como determinar sua localiza¸c˜ao precisa no sinal original.

Uma das principais propriedades desta abordagem ´e que a transforma¸c˜ao para um n´ıvel mais grosseiro n˜ao introduz novas estruturas, ou seja, caracter´ısticas pertencentes a uma escala espec´ıfica tamb´em est˜ao presentes em todas as escalas mais finas. Tais fatos conduzem a uma simplifica¸c˜ao do sinal original, pois a quantidade de caracter´ısticas diminui e as remanescentes em um dado n´ıvel correspondem a simplifica¸c˜oes daquelas existentes inicialmente. Este cap´ıtulo discute as principais propriedades que caracterizam um m´etodo espa¸co-escala. Al´em disso, ´e apresentada uma breve revis˜ao da literatura, abrangendo desde os primeiros m´etodos propostos, baseados em opera¸c˜oes lineares, at´e aqueles formalizados recentemente [7].

(20)

Cap´ıtulo 4:

Um novo operador espa¸co-escala

Este cap´ıtulo define um novo operador com propriedades espa¸co-escala, denominado Self-dual Multiscale Morphological Toggle (SMMT):

Defini¸c˜ao 1.1. (Operador Self-dual Multiscale Morphological Toggle) Seja φk 1(x) =

[δBσ(f )]

k(x), isto ´e, a dilata¸ao de f (x) com a fun¸ao estruturante n˜ao-planar B

σ k vezes.

De forma an´aloga, φk

2(x) = [εBσ(f )]

k(x). Denomina-se operador SMMT a fun¸ao:

(f gσ)k(x) =    φk 1(x), se φk1(x) − f (x) < f (x) − φk2(x), f (x), se φk 1(x) − f (x) = f (x) − φk2(x), φk2(x), em outros casos. (1.2)

Como pode-se observar, as primitivas consistem nas transforma¸c˜oes b´asicas da mor-fologia matem´atica, eros˜ao e dilata¸c˜ao, utilizando fun¸c˜oes estruturantes n˜ao-planares. Desse modo, ´e poss´ıvel introduzir o conceito de escala, a qual determina a intensidade das modifica¸c˜oes realizadas na imagem. A regra de decis˜ao analisa pontualmente qual valor transformado est´a mais pr´oximo do original e ´e calculada uma ´unica vez.

Note tamb´em que as primitivas s˜ao aplicadas de forma iterativa. Como discutido em mais detalhes posteriormente, o aumento no n´umero de itera¸c˜oes ´e equivalente a considerar uma regi˜ao de maior dimens˜ao para c´alculo do valor transformado de um pixel. Com isso, estruturas mais significativas podem ser identificadas [13].

Cap´ıtulo 5:

Resultados de segmenta¸c˜ao

Este cap´ıtulo ilustra alguns exemplos em que a utiliza¸c˜ao do operador SMMT mostrou-se de fundamental importˆancia para a obten¸c˜ao de bons resultados na segmenta¸c˜ao de imagens em n´ıveis de cinza. Isso se deve principalmente `as suas propriedades, as quais conduzem a uma simplifica¸c˜ao mais significativa quando comparada `aquelas derivadas de m´etodos tradicionais tais como os filtros por reconstru¸c˜ao [15, 16].

Com o objetivo de comprovar as vantagens da utiliza¸c˜ao do operador proposto, os re-sultados obtidos a partir da imagem transformada e da original foram comparados entre si e tamb´em com uma base segmentada manualmente. Visando uma an´alise mais completa, foram consideradas inclusive imagens com ilumina¸c˜ao n˜ao-uniforme, fator este que com-promete o desempenho de muitos algoritmos [12]. Al´em disso, a aplica¸c˜ao do SMMT ´e inserida como uma etapa adicional em um m´etodo n˜ao-supervisionado de segmenta¸c˜ao de c´elulas, ilustrando a importˆancia da an´alise multi-escala para simplifica¸c˜ao e regulariza¸c˜ao dos contornos da imagem [17].

(21)

1.2. Organiza¸c˜ao da tese 5

Cap´ıtulo 6:

Um operador de binariza¸c˜ao multi-escala

Na transforma¸c˜ao realizada pelo operador SMMT, m´aximos e m´ınimos da imagem interagem ao mesmo tempo, conduzindo a uma fus˜ao de regi˜oes que a simplifica de tal forma que estruturas significativas podem ser identificadas mesmo na presen¸ca de varia¸c˜oes nas condi¸c˜oes de ilumina¸c˜ao e alguns tipos de ru´ıdo.

Este fato, aliado `as propriedades multi-escala, ´e explorado para defini¸c˜ao de uma nova opera¸c˜ao de limiariza¸c˜ao adaptativa multi-escala [45]. Em resumo, as primitivas do SMMT s˜ao substitu´ıdas pelos valores zero e um. Assim, se o valor de um pixel est´a mais pr´oximo do seu valor erodido atribui-se a ele zero (preto). Caso contr´ario, atribui-se o valor um (branco), inclusive se a diferen¸ca entre o seu valor erodido e dilatado for a mesma.

Defini¸c˜ao 1.2. (Operador de binariza¸c˜ao adaptativo multi-escala) Seja φk 1(x) =

[δBσ(f )]

k(x), isto ´e, a dilata¸ao de f (x) com a fun¸ao estruturante dependente de escala

Bσ k vezes. De forma an´aloga, φk2(x) = [εBσ(f )]

k(x). O novo operador de binariza¸ao ´e

dado pela fun¸c˜ao:

(f gσ)k(x) =

 1, se φk

1(x) − f (x) ≤ f (x) − φk2(x),

0, em outros casos. (1.3)

Tal opera¸c˜ao explora principalmente o fato que diferentes estruturas s˜ao afetadas de-pendendo da escala utilizada. Quanto menor a escala, por exemplo, maior deve ser a diferen¸ca entre os n´ıveis de cinza de pixels vizinhos para que os mesmos sejam alterados por uma das primitivas. Esta caracter´ıstica ´e ´util nas aplica¸c˜oes em que ´e necess´ario extrair informa¸c˜oes relacionadas a regi˜oes em que h´a uma maior varia¸c˜ao, tais como con-tornos (os quais tipicamente correspondem aos limites f´ısicos dos objetos).

Dependendo do objetivo espec´ıfico, diferentes combina¸c˜oes de parˆametros devem ser consideradas. Enquanto escalas maiores tendem a criar regi˜oes, escalas menores as de-limitam, identificando regi˜oes de contorno. Este cap´ıtulo tamb´em apresenta aplica¸c˜oes envolvendo a binariza¸c˜ao de imagens de documentos [45] e a segmenta¸c˜ao de movimento em v´ıdeo [18].

Cap´ıtulo 7:

Um operador de filtragem auto-dual

Embora consiga lidar com problemas de ilumina¸c˜ao e alguns tipos de ru´ıdo, o operador SMMT n˜ao ´e robusto quando o ru´ıdo est´a distribu´ıdo de maneira uniforme na imagem, tal

(22)

como na presen¸ca de ru´ıdo aditivo, por exemplo. Este fato motivou o desenvolvimento de uma nova varia¸c˜ao do operador toggle (Equa¸c˜ao 1.1) que possua propriedades de filtragem. Em suma, este cap´ıtulo prop˜oe uma maneira alternativa de constru¸c˜ao de filtros mor-fol´ogicos auto-duais, estendendo os resultados v´alidos ao considerar centros morfol´ogicos para uma classe diferente de operadores toggle [14]. A nova transforma¸c˜ao ´e aplicada de forma iterativa (n˜ao mais as primitivas) e considera um conjunto mais abrangente de transforma¸c˜oes (que sejam apropriadas para tratar o ru´ıdo em quest˜ao). Para evitar problemas tais como oscila¸c˜oes, por exemplo, as primitivas precisam ter determinadas propriedades, que ser˜ao discutidas com maiores detalhes no momento apropriado.

Defini¸c˜ao 1.3. (Filtro toggle) Seja φ1 um sup-filtro e φ2 um inf-filtro. Denomina-se filtro

toggle a seguinte transforma¸c˜ao

fk+1(x) =    [φ1(fk)](x), se [φ1(fk)](x) − fk(x) < fk(x) − [φ2(fk)](x), fk(x), se [φ 1(fk)](x) − fk(x) = fk(x) − [φ2(fk)](x), [φ2(fk)](x), em outros casos, (1.4)

em que k denota a itera¸c˜ao.

Para avaliar a abordagem proposta, foram realizados testes com diferentes tipos de ru´ıdo e conjuntos de primitivas. De forma geral, os resultados obtidos s˜ao superiores `

aqueles definidos por filtros freq¨uentemente utilizados com esta finalidade.

Cap´ıtulo 8:

Conclus˜oes

Por fim, s˜ao apresentadas as conclus˜oes deste trabalho de pesquisa, bem como as perspectivas de trabalhos futuros.

(23)

Cap´ıtulo 2

Princ´ıpios b´

asicos de processamento

de imagens e morfologia matem´

atica

A morfologia matem´atica consiste em uma abordagem n˜ao-linear de processamento de imagens que se fundamenta em ´areas tais como teoria dos conjuntos e geometria integral. Seu principal objetivo ´e extrair informa¸c˜oes significativas de uma imagem com base na an´alise da sua geometria e da forma de seus objetos. Introduzida na d´ecada de 60, foi originalmente desenvolvida para an´alise de dados geol´ogicos, mais especificamente da estrutura de meios porosos, representados utilizando imagens bin´arias. Atualmente, envolve um conjunto de t´ecnicas utilizadas na formaliza¸c˜ao e solu¸c˜ao de diversos problemas pr´aticos e te´oricos de processamento e an´alise de imagens [57, 71, 72].

Este cap´ıtulo descreve conceitos relacionados `as ´areas de morfologia matem´atica e processamento de imagens necess´arios `a compreens˜ao deste trabalho. Inicialmente, s˜ao apresentadas algumas defini¸c˜oes b´asicas sobre imagens. Na Se¸c˜ao 2.2, s˜ao discutidos os operadores utilizados para definir transforma¸c˜oes de imagens e suas principais proprie-dades. Na sequˆencia, a Se¸c˜ao 2.3 descreve algumas fun¸c˜oes/elementos estruturantes. A Se¸c˜ao 2.4 apresenta as opera¸c˜oes fundamentais de morfologia matem´atica e algumas de suas propriedades, e a Se¸c˜ao 2.5 define outras opera¸c˜oes derivadas. Por fim, a Se¸c˜ao 2.6 trata dos operadores do tipo toggle e a Se¸c˜ao 2.7 do operador de watershed.

2.1

Defini¸

oes b´

asicas de processamento de imagens

O processamento e an´alise de imagens ´e uma ´area que aborda um grande n´umero de aplica¸c˜oes pr´aticas, tais como reconhecimento de padr˜oes e segmenta¸c˜ao. Tem como prin-cipais objetivos a representa¸c˜ao de uma imagem de maneira mais apropriada (reduzindo o seu n´ıvel de ru´ıdo, por exemplo) e a extra¸c˜ao de caracter´ısticas significativas para o problema espec´ıfico sendo considerado (tais como marcadores dos objetos de interesse).

(24)

Uma imagem cont´ınua ´e definida como o mapeamento de um subconjunto dos n´umeros reais, Df, denominado suporte ou dom´ınio de defini¸c˜ao de f , em um espa¸co de cores C [25]:

f : Df ⊂ R2 → C, (2.1)

em que f ´e denominada fun¸c˜ao imagem e f (Df) ´e o conjunto (ou gamute) de cores de f .

De forma geral, C ∈ Rn, com n determinando a dimensionalidade da imagem.

No entanto, para fins de processamento computacional, ´e preciso utilizar uma re-presenta¸c˜ao discreta. Uma imagem digital pode ser definida como sendo uma imagem cont´ınua que foi discretizada em termos de coordenadas espaciais e valor da intensidade no ponto, denominado pixel (picture element ) [26]. Dependendo do conjunto de valores associados a um determinado pixel, a imagem pode ser classificada de diferentes formas. Neste trabalho, ser˜ao utilizadas apenas imagens bin´arias e em tons de cinza e as aplica¸c˜oes ser˜ao restritas aos casos uni- e bidimensional.

Em uma imagem bin´aria, os pixels assumem os valores zero, quando pertencem ao seu fundo, ou um, caso contr´ario. Mais precisamente, uma imagem bin´aria n-dimensional ´e um mapeamento de um subconjunto dos n´umeros inteiros, Df, denominado dom´ınio de

defini¸c˜ao de f , no conjunto {0, 1} [75]:

f : Df ⊂ Zn→ {0, 1}. (2.2)

No contexto de morfologia matem´atica, os objetos que comp˜oem tais imagens s˜ao inter-pretados como conjuntos. A imagem ilustrada na Figura 2.1(a), por exemplo, pode ser analisada considerando apenas o conjunto dos pixels de valor um (brancos).

Por outro lado, para imagens em n´ıveis de cinza o intervalo dos valores que podem ser atribu´ıdos a um pixel ´e estendido ao conjunto dos inteiros n˜ao-negativos. Formalmente, uma imagem em n´ıveis de cinza ´e o mapeamento de um subconjunto dos n´umeros inteiros, Df, denominado dom´ınio de defini¸c˜ao de f , em um conjunto finito e limitado dos inteiros

n˜ao-negativos [75]:

f : Df ⊂ Zn→ {0, 1, . . . , tmax}, (2.3)

em que tmax, representando o valor m´aximo que pode ser associado a um pixel, depende

do tipo de dados utilizado e ´e dado por tmax = 2n− 1, com n representando o n´umero

de bits. Uma imagem de 8 bits, por exemplo, possui valores variando de 0 a 255. A Figura 2.1(b) mostra um exemplo.

Na defini¸c˜ao de determinadas transforma¸c˜oes de morfologia matem´atica, uma imagem em n´ıveis de cinza ´e interpretada como uma superf´ıcie topogr´afica, onde o valor de um pixel representa a sua altura [75]. Tal representa¸c˜ao, ilustrada na Figura 2.1(c), utiliza conceitos como pico (ponto de m´aximo), vale (ponto de m´ınimo), platˆo (zona plana) e watershed (contorno de uma regi˜ao) da fun¸c˜ao imagem.

(25)

2.2. Transforma¸c˜oes de imagens e operadores 9

(a) (b) (c)

Figura 2.1: Diferentes formas de representa¸c˜ao de uma imagem: (a) bin´aria, (b) em n´ıveis de cinza e (c) superf´ıcie topogr´afica.

2.2

Transforma¸

oes de imagens e operadores

Uma transforma¸c˜ao ´e classificada como de “imagem para imagem” se ela preserva o mesmo dom´ınio de defini¸c˜ao que a imagem inicial e se mant´em um mapeamento deste no conjunto dos n´umeros inteiros n˜ao-negativos [75]. O exemplo mais trivial ´e o operador identidade, I, o qual n˜ao altera os valores iniciais dos pixels:

I(f ) = f. (2.4)

Outra transforma¸c˜ao amplamente utilizada ´e a limiariza¸c˜ao. Ela consiste, por exemplo, em alterar o valor de um determinado pixel para um, caso seu n´ıvel de cinza perten¸ca a um determinado intervalo de valores, ou para zero, caso contr´ario. Formalmente:

[T[ti,tj](f )](x) =

 1, se ti ≤ f (x) ≤ tj,

0, em outros casos. (2.5)

Observe que, neste caso, o resultado depende apenas do pixel sobre an´alise. As trans-forma¸c˜oes morfol´ogicas, por outro lado, embora tamb´em sejam classificadas como sendo de “imagem para imagem”, consideram os valores dos n´ıveis de cinza na vizinhan¸ca do pixel em quest˜ao para c´alculo do seu valor transformado. Portanto, faz-se necess´ario um conjunto de operadores que possam ser utilizados na defini¸c˜ao de tais transforma¸c˜oes.

Conforme mencionado anteriormente, uma das bases da morfologia matem´atica ´e a teoria de conjuntos, onde as opera¸c˜oes b´asicas s˜ao a uni˜ao, ∪, e a intersec¸c˜ao, ∩. Quando imagens em n´ıveis de cinza s˜ao consideradas, tais opera¸c˜oes s˜ao representadas pelos ope-radores de m´aximo e m´ınimo pontual, respectivamente [35, 72].

(26)

Dadas duas imagens, f e g, com o mesmo dom´ınio de defini¸c˜ao, as opera¸c˜oes de m´aximo e m´ınimo pontual s˜ao dadas por:

 (f ∨ g)(x) = max{f (x), g(x)},

(f ∧ g)(x) = min{f (x), g(x)}. (2.6)

O complemento, por sua vez, ´e definido da seguinte forma [75]:

fc(x) = tmax− f (x), (2.7)

em que tmax representa o valor m´aximo que pode ser atribu´ıdo a um pixel de acordo com

o tipo de dados da aplica¸c˜ao. O negativo de uma transforma¸c˜ao, denotada aqui por Ψ, ´e dado por:

Ψ∗(f ) = [Ψ(fc)]c. (2.8)

A transla¸c˜ao horizontal de uma imagem f por um vetor b, denotada por fb, substitui o

valor original do pixel na posi¸c˜ao x pelo valor existente na posi¸c˜ao transladada horizon-talmente pelo vetor, isto ´e:

fb(x) = f (x + b). (2.9)

De forma geral, as transforma¸c˜oes morfol´ogicas podem ser definidas utilizando com-bina¸c˜oes das opera¸c˜oes de m´aximo e m´ınimo pontual, complemento e transla¸c˜ao.

As rela¸c˜oes de ordem da teoria de conjuntos (representadas pela opera¸c˜ao de inclus˜ao) tamb´em s˜ao estendidas para imagens em n´ıveis de cinza. Dadas duas imagens, f e g, com o mesmo dom´ınio de defini¸c˜ao, f ´e dita menor que g se, considerando posi¸c˜oes correspondentes, os valores dos pixels de f s˜ao menores que os de g [75]:

f ≤ g ⇔ f (x) ≤ g(x). (2.10)

Esta rela¸c˜ao de ordem ´e definida para transforma¸c˜oes de maneira an´aloga. Uma trans-forma¸c˜ao Ψ ´e menor ou igual a uma transforma¸c˜ao Φ se, e somente se, para qualquer imagem f , o valor transformado Ψ(f ) ´e menor ou igual a Φ(f ):

Ψ ≤ Φ ⇔ Ψ(f ) ≤ Φ(f ). (2.11)

Propriedades das transforma¸c˜oes de imagens

Transforma¸c˜oes de imagens podem ser caracterizadas atrav´es de propriedades alg´ebricas e topol´ogicas, as quais permitem definir aspectos do seu comportamento que s˜ao funda-mentais para determinar sua aplicabilidade em um problema espec´ıfico. A seguir, ser˜ao apresentadas brevemente algumas das propriedades b´asicas que podem ser associadas `as transforma¸c˜oes (inclusive morfol´ogicas) de imagens [29, 72, 75].

(27)

2.2. Transforma¸c˜oes de imagens e operadores 11

1. Idempotˆencia: Uma transforma¸c˜ao Ψ ´e dita idempotente se, ao repeti-la mais de uma vez na mesma imagem, o resultado permanece inalterado, ou seja, ´e equivalente aplic´a-la uma ou n vezes:

Ψ(n) = Ψ, (2.12)

em que Ψ(n) denota a n-´esima itera¸c˜ao da transforma¸c˜ao, Ψ(n)= Ψ(n−1)Ψ. Quando aplicadas iterativamente, algumas transforma¸c˜oes morfol´ogicas utilizam esta propri-edade como crit´erio de parada. Outras dependem dela para evitar problemas tais como oscila¸c˜oes.

2. Extensividade: Uma transforma¸c˜ao Ψ ´e extensiva se a imagem transformada ´e maior ou igual `a imagem original:

Ψ(f ) ≥ f. (2.13)

3. Anti-extensividade: De maneira an´aloga, uma transforma¸c˜ao Ψ ´e anti-extensiva se a imagem transformada ´e menor ou igual `a imagem original:

Ψ(f ) ≤ f. (2.14)

4. Crescente: Uma transforma¸c˜ao Ψ ´e dita crescente se ela preserva a rela¸c˜ao de ordem entre imagens:

f ≤ g ⇒ Ψ(f ) ≤ Ψ(g). (2.15)

5. Dualidade: Duas transforma¸c˜oes Ψ e Φ s˜ao duais se:

Ψ(f ) = Φ∗(f ) ⇒ Ψ(f ) = [Φ(fc)]c, (2.16) em que c denota o operador complemento e ∗ o negativo. Em outras palavras, duas opera¸c˜oes Ψ e Φ s˜ao duais se aplicar Ψ em uma imagem f ´e equivalente a tomar o complemento da aplica¸c˜ao de Φ no complemento de f . Algumas propriedades de transforma¸c˜oes duais podem ser herdadas, tais como:

• Ψ idempotente ⇒ Φ idempotente; • Ψ crescente ⇒ Φ crescente;

• Ψ anti-extensiva ⇒ Φ extensiva; • Ψ extensiva ⇒ Φ anti-extensiva.

6. Auto-dualidade: Uma transforma¸c˜ao Ψ ´e auto-dual se:

(28)

em que, novamente, o s´ımbolo ∗ denota o negativo. Observe que, neste caso, h´a um tratamento sim´etrico do fundo e da forma, considerando que aplicar a transforma¸c˜ao auto-dual Ψ em uma imagem f ´e equivalente a realizar o complemento da aplica¸c˜ao de Ψ no complemento de f , Ψ(f ) = [Ψ(fc)]c.

7. Complementaridade: Duas transforma¸c˜oes Ψ e Φ s˜ao complementares se aplicar Ψ em uma imagem ´e equivalente a aplicar Φ no complemento desta imagem:

Ψ(f ) = Φ(fc), (2.18)

em que o s´ımbolo c denota o complemento. Por outro lado, uma transforma¸c˜ao Ψ ´e dita auto-complementar se

Ψ(f ) = Ψ(fc), (2.19)

ou seja, se a transforma¸c˜ao Ψ consiste no seu pr´oprio operador complementar. 8. Homotopia: Duas transforma¸c˜oes Ψ e Φ s˜ao homot´opicas se ambas possuem a

mesma ´arvore homot´opica, o que equivale a possuir a mesma estrutura geom´etrica.

2.3

Elementos e fun¸

oes estruturantes

Para se extrair informa¸c˜oes relativas aos objetos de uma imagem de forma precisa, ´e fundamental determinar adequadamente a vizinhan¸ca que ser´a considerada no c´alculo do valor transformado de cada pixel. Isso depende da escolha apropriada de um elemento de base - um elemento estruturante no caso bin´ario, ou fun¸c˜ao estruturante para imagens em n´ıveis de cinza - o qual, de maneira simplificada, define o tamanho e a forma da regi˜ao a ser considerada por uma transforma¸c˜ao morfol´ogica.

Tais elementos podem ser classificadas em duas categorias: planares, onde todas as posi¸c˜oes possuem o valor zero, ou n˜ao-planares, quando os valores associados podem ser distintos, definindo uma altura para a fun¸c˜ao estruturante. Tais valores podem ser interpretados como “pesos” dados `as diferentes dire¸c˜oes consideradas [36].

A Figura 2.2 ilustra alguns elementos estruturantes planares abrangendo uma vizi-nhan¸ca 3 × 3, sendo que a escolha do mais apropriado depende da informa¸c˜ao que se deseja extrair. Estruturas diagonais, por exemplo, podem ser exploradas atrav´es por meio do elemento estruturante ilustrado na Figura 2.2(c).

Embora amplamente utilizadas, devido principalmente `a facilidade de implementa¸c˜ao e resultados satisfat´orios em muitos casos, as fun¸c˜oes estruturantes planares n˜ao conseguem extrair algumas propriedades espec´ıficas das imagens. Por exemplo, seu uso transforma as regi˜oes em torno de m´aximos e m´ınimos locais em regi˜oes planas, podendo causar o deslocamento da sua posi¸c˜ao e constituindo um problema para diversas aplica¸c˜oes [35].

(29)

2.3. Elementos e fun¸c˜oes estruturantes 13

(a) (b) (c)

Figura 2.2: Exemplos de elementos estruturantes planares abrangendo uma vizinhan¸ca 3 × 3. O ponto branco denota o centro do elemento estruturante.

Nestes casos, pode-se utilizar as fun¸c˜oes estruturantes n˜ao-planares, denotadas aqui por Bσ, as quais possuem o seguinte formato:

Bσ(x) = |σ|B|(|σ|−1x) x ∈ Bσ, ∀ σ 6= 0. (2.20)

Para garantir um comportamento de escala condizente, Bσ deve satisfazer a determinadas

condi¸c˜oes [36]. |σ| → 0 ⇒ Bσ(x) →  0, se x = 0, −∞, em outros casos. 0 < |σ1| < |σ2| ⇒ Bσ1(x) ≤ Bσ2(x) ∀ x ∈ Bσ1. (2.21) |σ| → ∞ ⇒ Bσ(x) → 0.

Tais condi¸c˜oes exigem que Bσ seja uma fun¸c˜ao monotonicamente decrescente ao longo

de qualquer dire¸c˜ao radial a partir da origem (ou seja, anti-convexa). Para evitar des-locamento de n´ıveis e transla¸c˜ao horizontal, as seguintes condi¸c˜oes tamb´em devem ser observadas [36]:

sup

t∈Bσ

{Bσ(t)} = 0 e Bσ(0) = 0. (2.22)

As fun¸c˜oes estruturantes n˜ao-planares podem ser utilizadas na defini¸c˜ao de trans-forma¸c˜oes morfol´ogicas dependentes de escala, as quais permitem a an´alise de diferentes n´ıveis de representa¸c˜ao, fator essencial para lidar adequadamente com a natureza multi-escala das imagens. Devido `a sua importˆancia para este trabalho, tais aspectos ser˜ao discutidos com mais detalhes no pr´oximo cap´ıtulo.

Uma classe importante de tais fun¸c˜oes discutida na literatura ´e representada pelas fun¸c˜oes estruturantes quadr´aticas [79]. Os parabol´oides, por exemplo, possuem boas pro-priedades de segunda derivada e separabilidade, possibilitando uma implementa¸c˜ao com-putacionalmente eficiente [35]. Pode-se mostrar que uma fun¸c˜ao estruturante n˜ao-planar

(30)

pode ser derivada a partir de qualquer fun¸c˜ao estruturante cˆoncava [70]. A Figura 2.3 ilustra trˆes exemplos.

(a) (b) (c)

Figura 2.3: Exemplos de fun¸c˜oes estruturantes n˜ao-planares: (a) parab´olica (b) cˆonica e (c) pirˆamide.

Neste trabalho, foram utilizadas as fun¸c˜oes estruturantes parab´olica e pirˆamide, sendo esta ´ultima definida por:

Bσ(x, y) = −|σ|−1max{|x|, |y|}. (2.23)

Esta fun¸c˜ao gera um elemento estruturante em que cada posi¸c˜ao ´e associada `a sua distˆancia do centro. Tal caracter´ıstica facilita a visualiza¸c˜ao e/ou descri¸c˜ao de alguns dos resultados te´oricos deste trabalho.

2.4

Opera¸

oes b´

asicas de morfologia matem´

atica

A eros˜ao e a dilata¸c˜ao s˜ao as opera¸c˜oes fundamentais da morfologia matem´atica, consti-tuindo a base para a defini¸c˜ao de transforma¸c˜oes mais complexas [29, 57, 72, 75]. Para imagens bin´arias, a dilata¸c˜ao dos pontos da forma, X, por um elemento estruturante B, denotada por δB(X), ´e definida como o conjunto de pontos x tal que B intercepta X

quando sua origem est´a centrada em x:

δB(X) = {x | Bx∩ X 6= ∅}, (2.24)

em que Bx denota a transla¸c˜ao do centro do elemento estruturante B para a posi¸c˜ao

x. Tal formula¸c˜ao corresponde `a pergunta “o elemento estruturante toca o conjunto?”, e ´e ilustrada na Figura 2.4. Esta equa¸c˜ao deriva da opera¸c˜ao de teoria dos conjuntos denominada soma de Minkowski:

(X ⊕ B) = {x + b : x ∈ X, b ∈ B} = [

b∈B

(31)

2.4. Opera¸c˜oes b´asicas de morfologia matem´atica 15

(a) (b) (c)

Figura 2.4: Exemplo de dilata¸c˜ao bin´aria: (a) imagem original, (b) aplica¸c˜ao do elemento estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na cor cinza foram criados).

a qual possui interessantes propriedades, tais como comutatividade e invariˆancia `a transla¸c˜ao. De maneira an´aloga, a eros˜ao de um conjunto X por um elemento estruturante B, εB(X), ´e definida como o conjunto de pontos x tal que B est´a inclu´ıdo em X quando sua

origem est´a centrada em x:

εB(X) = {x | Bx⊆ X}, (2.26)

em que, novamente, Bx denota a transla¸c˜ao do centro do elemento estruturante B para

a posi¸c˜ao x. Esta formula¸c˜ao, ilustrada na Figura 2.5, equivale `a pergunta “o elemento estruturante cabe no conjunto?” e deriva da subtra¸c˜ao de Minkowski, definida como:

(X B) = \

b∈B

X−b. (2.27)

As opera¸c˜oes de soma e subtra¸c˜ao de Minkowski (Equa¸c˜oes 2.25 e 2.27) podem ser estendidas para imagens em n´ıveis de cinza utilizando as defini¸c˜oes de m´aximo e m´ınimo pontual, apresentadas anteriormente na Se¸c˜ao 2.2:

(f ⊕ B) = _ b∈B f−b (2.28) e (f B) = ^ b∈B f−b. (2.29)

Em resumo, o resultado das opera¸c˜oes ´e dado pelo valor m´aximo (m´ınimo) encontrado nas posi¸c˜oes de f transladadas pelos vetores −b.

Portanto, as opera¸c˜oes de dilata¸c˜ao e eros˜ao para imagens em n´ıveis de cinza po-dem ser definidas em termos do m´aximo e m´ınimo na vizinhan¸ca definida pelo elemento estruturante transladado:

(32)

(a) (b) (c)

Figura 2.5: Exemplo de eros˜ao bin´aria: (a) imagem original, (b) aplica¸c˜ao do elemento estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza foram elimi-nados).

Defini¸c˜ao 2.1. (Dilata¸c˜ao) A dilata¸c˜ao de uma imagem f pela fun¸c˜ao estruturante planar B, [δB(f )](x), ´e dada por [75]:

[δB(f )](x) = max

b∈B{f (x + b)}, (2.30)

ou seja, o valor dilatado de um pixel x ´e o m´aximo na vizinhan¸ca definida por B.

Defini¸c˜ao 2.2. (Eros˜ao) A eros˜ao de uma imagem f pela fun¸c˜ao estruturante planar B, [εB(f )](x), ´e dada por [75]:

[εB(f )](x) = min

b∈B{f (x + b)}, (2.31)

ou seja, o valor erodido de um pixel x ´e o m´ınimo na vizinhan¸ca definida por B.

A Figura 2.6 mostra as vers˜oes dilatada e erodida de uma imagem utilizando o elemento estruturante ilustrado na Figura 2.2(b).

Quando fun¸c˜oes estruturantes n˜ao-planares s˜ao utilizadas, as opera¸c˜oes de eros˜ao e dilata¸c˜ao s˜ao definidas da seguinte forma:

Defini¸c˜ao 2.3. (Dilata¸c˜ao) A dilata¸c˜ao de uma imagem f pela fun¸c˜ao estruturante Bσ(x),

[εBσ(f )](x), ´e dada por [75]:

[δBσ(f )](x) = max

b∈Bσ

{f (x + b) + Bσ(b)}. (2.32)

Defini¸c˜ao 2.4. (Eros˜ao) A eros˜ao de uma imagem f pela fun¸c˜ao estruturante Bσ(x),

[δBσ(f )](x), ´e dada por [75]:

[εBσ(f )](x) = min

b∈Bσ

(33)

2.4. Opera¸c˜oes b´asicas de morfologia matem´atica 17

(a) (b) (c)

Figura 2.6: (a) Imagem original, (b) dilata¸c˜ao e (c) eros˜ao de (a) utilizando um elemento estruturante quadrado de tamanho 3 × 3.

As opera¸c˜oes de dilata¸c˜ao e eros˜ao tamb´em podem ser definidas atrav´es do conceito de adjun¸c˜ao [29], levando a uma abordagem matem´atica mais consistente em termos de opera¸c˜oes alg´ebricas. Uma discuss˜ao detalhada desta abordagem pode ser encontrada em [29, 72].

As principais propriedades da dilata¸c˜ao s˜ao sumarizadas a seguir [27, 29, 35]: 1. Comutatividade: δb(X) = δx(B);

2. Associatividade: δδC(B)(A) = δC(δB(A));

3. Extensiva: δb(X) ⊇ X se o elemento estruturante cont´em sua origem;

4. Decomposi¸c˜ao: δb∪c(X) = δb(X) ∪ δc(X) e δb∩c(X) = δb(X) ∩ δc(X).

A eros˜ao, por sua vez, satisfaz as seguintes propriedades: 1. N˜ao-comutatividade: εb(X) 6= εx(B);

2. N˜ao-associatividade: No entanto, a seguinte rela¸c˜ao ´e verdadeira: εC(εB(A)) =

εδC(B)(A);

3. Anti-extensiva: εb(X) ⊆ X se o elemento estruturante cont´em sua origem;

4. Decomposi¸c˜ao: εb∪c(X) = εb(X) ∩ εc(X) e εb∩c(X) = εb(X) ∪ εc(X).

Juntamente com a associatividade, as propriedades relacionadas `a decomposi¸c˜ao per-mitem a defini¸c˜ao de formas de implementa¸c˜ao eficientes, explorando conceitos tais como separabilidade. Al´em disso, as duas transforma¸c˜oes s˜ao invariantes `a transla¸c˜ao e pre-servam a homotopia da imagem original. Ambas tamb´em s˜ao crescentes, implicando

(34)

assim que, se X ⊆ Y , ent˜ao δb(X) ⊆ δb(Y ) e εb(X) ⊆ εb(Y ). Pode-se tamb´em verificar

facilmente que as opera¸c˜oes de eros˜ao e dilata¸c˜ao s˜ao duais, ou seja:

δB(X) = [εB(Xc)]c, (2.34)

em que c denota o complemento. Entretanto, elas n˜ao s˜ao auto-duais nem consistem em transforma¸c˜oes inversas uma da outra, isto ´e, X 6= δB[εB(X)].

Algumas destas propriedades podem ser visualizadas na Figura 2.6. Observe que, enquanto a eros˜ao diminui as regi˜oes escuras da imagem e expande as claras, a dilata¸c˜ao faz o contr´ario (anti-extensividade e extensividade). Este comportamento tamb´em mostra o efeito dual das transforma¸c˜oes.

´

E importante ressaltar que as propriedades apresentadas podem ser estendidas para imagens em n´ıveis de cinza de forma direta, substituindo-se os operadores de teoria dos conjuntos pelos seus equivalentes para fun¸c˜oes. Uma discuss˜ao mais detalhada sobre tais aspectos pode ser encontrada em [27, 29, 71, 75].

2.5

Outras transforma¸

oes morfol´

ogicas

As opera¸c˜oes de eros˜ao e dilata¸c˜ao possuem algumas limita¸c˜oes mas, se combinadas de modo apropriado, resultam em transforma¸c˜oes morfol´ogicas mais robustas. A eros˜ao, por exemplo, al´em de eliminar pequenas estruturas, tamb´em causa a redu¸c˜ao de todas as outras. No entanto, se uma dilata¸c˜ao for aplicada na imagem erodida, parte das estruturas perdidas ser´a recuperada. Tal procedimento, de aplicar uma eros˜ao seguida de uma dilata¸c˜ao, define uma nova transforma¸c˜ao denominada abertura [75]:

γB(f ) = δB˘[εB(f )], (2.35)

em que ˘B denota o transposto de B, ˘B = {−b | b ∈ B}. O uso de ˘B torna o resultado da transforma¸c˜ao independente da posi¸c˜ao de origem do elemento estruturante, mesmo quando este n˜ao ´e sim´etrico.

O fechamento, que consiste em uma dilata¸c˜ao seguida de uma eros˜ao, tende a recuperar de maneira aproximada a forma inicial das estruturas da imagem que foram dilatadas [75]:

φB(f ) = εB˘[δB(f )], (2.36)

em que, novamente, ˘B denota o transposto de B.

As opera¸c˜oes de abertura e fechamento s˜ao duais e ambas s˜ao crescentes e idempoten-tes. Al´em disso, a abertura ´e anti-extensiva e atua sobre as estruturas claras, enquanto que o fechamento ´e extensivo e em termos visuais atua sobre as estruturas escuras da

(35)

2.5. Outras transforma¸c˜oes morfol´ogicas 19

imagem. Ambas n˜ao preservam a homotopia da imagem original e podem usar tanto fun¸c˜oes estruturantes planares quanto n˜ao-planares.

Transforma¸c˜oes crescentes e idempotentes caracterizam os denominados filtros mor-fol´ogicos, uma abordagem n˜ao-linear que conduz tanto a recupera¸c˜ao de imagens com ru´ıdo quanto a remo¸c˜ao de estruturas ou objetos espec´ıficos de uma imagem segundo crit´erios tais como geometria ou contraste [75]. Por ser uma transforma¸c˜ao crescente, a rela¸c˜ao de ordem das imagens filtradas ´e preservada, possibilitando assim a sua com-para¸c˜ao. A idempotˆencia garante a estabilidade da opera¸c˜ao, evitando problemas como a oscila¸c˜ao, por exemplo.

Desde a sua introdu¸c˜ao em 1988, a teoria de filtragem morfol´ogica vem sendo ampla-mente explorada, envolvendo desde a defini¸c˜ao de diferentes formas de constru¸c˜ao com propriedades adicionais, tais como auto-dualidade, at´e a utiliza¸c˜ao de filtros em que a condi¸c˜ao de idempotˆencia ´e apenas parcialmente satisfeita. Tais filtros, denominados filtros derivados [29], ser˜ao abordados com mais detalhes no Cap´ıtulo 7.

A Figura 2.7 ilustra a aplica¸c˜ao das opera¸c˜oes de abertura e fechamento (que con-sistem nos filtros morfol´ogicos mais b´asicos) em uma imagem com ru´ıdo do tipo sal-e-pimenta (Figura 2.7(a)). Observe que, como nenhuma delas satisfaz a propriedade de auto-dualidade, n˜ao h´a um tratamento sim´etrico das estruturas claras e escuras da ima-gem (Figuras 2.7(b) e (c)). Este problema pode ser minimizado combinando-se as duas opera¸c˜oes (Figura 2.7(d)).

(a) (b) (c) (d)

Figura 2.7: Exemplo de filtragem morfol´ogica de uma imagem com ru´ıdo sal e pimenta: (a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido de abertura. Todos os exemplo utilizaram um elemento estruturante circular de raio 3.

Observe que, dependendo do n´ıvel de ru´ıdo presente na imagem, apenas uma itera¸c˜ao pode n˜ao ser suficiente para uma filtragem adequada, considerando-se a presen¸ca de ru´ıdos de diferentes escalas. Neste caso, mesmo a utiliza¸c˜ao de um elemento estruturante de maior dimens˜ao pode prejudicar o resultado final, eliminando estruturas importantes.

(36)

Uma solu¸c˜ao consiste em aplicar aberturas e fechamentos de forma alternada usando ele-mentos estruturantes de tamanho crescente. Tal procedimento define um filtro alternado sequencial.

Defini¸c˜ao 2.5. (Filtro alternado sequencial) Seja (f ◦ Bi) uma abertura com elemento estruturante de tamanho i e (f • Bi) um fechamento de tamanho i. Considere tamb´em as seguintes combina¸c˜oes, as quais constituem filtros morfol´ogicos [75]:

mi = (f • Bi) ◦ Bi, ri = ((f • Bi) ◦ Bi) • Bi,

ni = (f ◦ Bi) • Bi, si = ((f ◦ Bi) • Bi) ◦ Bi.

Um filtro alternado sequencial de tamanho i ´e definido como a combina¸c˜ao de um destes filtros, com o tamanho do elemento estruturante variando de um at´e i:

Mi = mi. . . m2m1, Ri = ri. . . r2r1,

Ni = ni. . . n2n1, Si = si. . . s2s1.

Embora n˜ao sejam necessariamente auto-duais, os filtros alternados sequenciais con-duzem a um tratamento mais sim´etrico das estruturas da imagem do que quando as opera¸c˜oes de abertura e fechamento s˜ao utilizadas individualmente. Outra desvantagem de tais opera¸c˜oes ´e que elas causam o deslocamento dos contornos [33, 72], o que pode prejudicar o desempenho de tarefas de mais alto n´ıvel que dependem da localiza¸c˜ao exata destes.

Para evitar este problema, pode-se considerar filtros por reconstru¸c˜ao, os quais recu-peram apenas a estrutura das componentes n˜ao eliminadas na etapa inicial de filtragem, preservando assim sua informa¸c˜ao de contorno. Dois destes filtros frequentemente utili-zados s˜ao apresentados a seguir [75].

A abertura por reconstru¸c˜ao consiste em uma eros˜ao seguida por uma reconstru¸c˜ao morfol´ogica por dilata¸c˜ao, ou seja [75]:

γR(n)(f ) = Rf[ε(f )], (2.37)

em que ε(f ) denota a eros˜ao de f com um elemento estruturante de tamanho n e Rf([ε(f )]) = δ

(i)

f ([ε(f )]) (2.38)

´

e a reconstru¸c˜ao morfol´ogica por dilata¸c˜ao, em que δf(i)([ε(f )]) representa a i-´esima di-lata¸c˜ao geod´esica da imagem marcadora [ε(f )] utilizando f como imagem m´ascara:

(37)

2.5. Outras transforma¸c˜oes morfol´ogicas 21

ou seja, ´e o m´ınimo pontual entre a imagem m´ascara e a i-´esima dilata¸c˜ao de tamanho n da imagem marcadora. O ´ındice i representa a itera¸c˜ao onde a idempotˆencia ´e atingida, isto ´e, δ(i)([ε(f )]) = δ(i+1)([ε(f )]).

Em resumo, pode-se afirmar que a reconstru¸c˜ao por dilata¸c˜ao de [ε(f )] com rela¸c˜ao a f , tal que D[ε(f )] = Df e [ε(f )] ≤ f , ´e definida como a dilata¸c˜ao geod´esica de [ε(f )] com

rela¸c˜ao `a f at´e a estabilidade.

O fechamento por reconstru¸c˜ao, que consiste em uma dilata¸c˜ao seguida por uma re-constru¸c˜ao morfol´ogica por eros˜ao, ´e definido por dualidade [75]:

φ(n)R (f ) = R?f[δ(f )], (2.40)

em que δ(f ) denota a dilata¸c˜ao de f com um elemento estruturante de tamanho n e

R?f[δ(f )] = ε(i)f ([δ(f )]) (2.41)

´e a reconstru¸c˜ao morfol´ogica por eros˜ao em que ε(i)f ([δ(f )]) representa a i-´esima eros˜ao geod´esica de f utilizando [δ(f )] como imagem marcadora:

ε(i)f ([δ(f )]) = ε(i)([δ(f )]) ∨ f, (2.42) ou seja, ´e o m´aximo pontual entre a imagem m´ascara e a i-´esima dilata¸c˜ao de tamanho n da imagem marcadora. O ´ındice i representa novamente a itera¸c˜ao onde a idempotˆencia ´e atingida, isto ´e, ε(i+1)([δ(f )]) = ε(i)([δ(f )]).

De maneira an´aloga ao caso anterior, ε(i)f ([δ(f )]) representa a eros˜ao geod´esica de [δ(f )] utilizando f com imagem m´ascara e i representa a itera¸c˜ao onde a idempotˆencia ´e atingida, isto ´e, ε([δ(i)(f )]) = ε(i+1)([δ(f )]).

A Figura 2.8 ilustra um exemplo de fechamento por reconstru¸c˜ao. Observe na Fi-gura 2.8(c) que apenas as componentes que n˜ao foram eliminadas pela dilata¸c˜ao (Fi-gura 2.8(b)) foram reconstru´ıdas.

Em alguns casos espec´ıficos, a aplica¸c˜ao de uma mesma opera¸c˜ao em todos os pixels de uma imagem pode n˜ao conduzir a resultados satisfat´orios. Nestas situa¸c˜oes, pode-se utilizar as transforma¸c˜oes adaptativas, que modificam os pixels de diferentes formas, segundo crit´erios pr´e-estabelecidos que levam em considera¸c˜ao informa¸c˜oes tais como os valores dos n´ıveis de cinza na vizinhan¸ca definida pelo elemento estruturante, por exemplo. Tais transforma¸c˜oes podem ser definidas atrav´es de operadores do tipo toggle, discutidos na pr´oxima se¸c˜ao.

(38)

(a) (b) (c)

Figura 2.8: Exemplo de fechamento por reconstru¸c˜ao: (a) imagem original, (b) dilata¸c˜ao com elemento estruturante circular de raio 20 e (c) reconstru¸c˜ao geod´esica por eros˜ao utilizando (b) como imagem marcadora.

2.6

Operadores do tipo toggle

Em transforma¸c˜oes do tipo toggle, a id´eia central consiste em associar uma imagem com (a) um conjunto de poss´ıveis transforma¸c˜oes (primitivas) ϕi, e (b) uma regra de decis˜ao

que determina em cada pixel x o melhor valor entre os candidatos ϕi [74, 75].

Defini¸c˜ao 2.6. [74] Denomina-se mapeamento toggle das primitivas (ϕi) qualquer

ma-peamento ω tal que:

1. em cada ponto x, ωx ´e igual a ϕi ou f (x),

2. no mapeamento toggle ω, o crit´erio que transforma uma das primitivas ϕi em um

dado ponto x depende somente das primitivas ϕi, no valor num´erico f (x) e em

poss´ıveis constantes,

3. se no ponto x ao menos uma das primitivas ϕi coincide com o mapeamento

identi-dade f (x), ent˜ao

ωx = f (x). (2.43)

Um exemplo simples de operador do tipo toggle ´e a limiariza¸c˜ao bin´aria, em que a regra de decis˜ao envolve, no ponto x, o valor f (x) e um limiar. Neste caso, as primitivas s˜ao o branco e o preto, ambas independentes de f (x).

Contudo, primitivas tamb´em podem consistir em transforma¸c˜oes agindo na imagem original, como ocorre nos centros morfol´ogicos, por exemplo. A defini¸c˜ao de centro mor-fol´ogico, γ, para uma fam´ılia de primitivas ϕi deriva de [74]:

(39)

2.7. Transformada de watershed 23

com η = ∨ϕi e ζ = ∧ϕi, onde ∨ representa o m´aximo pontual e ∧ representa o m´ınimo.

Ao considerar apenas duas primitivas, o centro morfol´ogico ´e equivalente `a medi-ana [74], uma transforma¸c˜ao n˜ao-linear freq¨uentemente utilizada para filtragem de ru´ıdo devido a suas propriedades de preserva¸c˜ao de bordas. No entanto, al´em de n˜ao ser idem-potente, sua aplica¸c˜ao consecutiva pode desfazer mudan¸cas e causar oscila¸c˜oes [30]. Heij-mans [31] utilizou o centro morfol´ogico para construir operadores auto-duais e, subseq¨ uen-temente, filtros auto-duais.

Outro exemplo de operador do tipo toggle ´e dado a seguir. Dadas duas primitivas, ϕ1

e ϕ2, a regra de decis˜ao escolhe como valor transformado aquele que mais se aproxima do

valor original do pixel sendo analisado.

T (x) =    ϕ1(x), se ϕ1(x) − f (x) < f (x) − ϕ2(x), f (x), se ϕ1(x) − f (x) = f (x) − ϕ2(x), ϕ2(x), em outros casos. (2.45)

Neste trabalho, esta classe de operadores ´e explorada para a defini¸c˜ao de diferentes trans-forma¸c˜oes, com aplica¸c˜oes em segmenta¸c˜ao, filtragem e an´alise multi-escala de imagens. Nos cap´ıtulos 3-7 os resultados obtidos s˜ao apresentados de forma mais detalhada.

2.7

Transformada de watershed

Basicamente, um procedimento de segmenta¸c˜ao consiste em particionar uma imagem em um conjunto de regi˜oes homogˆeneas e n˜ao-sobrepostas, as quais devem corresponder a objetos da imagem significativos para uma certa aplica¸c˜ao. Uma segmenta¸c˜ao precisa ´e essencial para um grande n´umero de aplica¸c˜oes de processamento de imagens, tais como reconhecimento e representa¸c˜ao.

No contexto de morfologia matem´atica, a segmenta¸c˜ao de imagens em n´ıveis de cinza ´e tipicamente realizada da seguinte forma. Primeiramente, s˜ao extra´ıdos marcadores das estruturas significativas da imagem, e ent˜ao a transformada denominada wastershed (Linha Divisora de ´Aguas) [6, 75] ´e utilizada para obter os contornos de tais estruturas da forma mais precisa poss´ıvel. A seguir, s˜ao apresentadas as id´eias principais do m´etodo.

Considere uma imagem em tons de cinza representada como uma superf´ıcie topogr´afica, assim como ilustrado anteriormente na Figura 2.1(c). Assuma que cada m´ınimo desta su-perf´ıcie corresponda a uma perfura¸c˜ao e que ela ´e colocada na ´agua verticalmente a uma velocidade constante. Iniciando no m´ınimo de menor altitude, a ´agua ir´a progressiva-mente preencher as bacias da imagem (Figura 2.9). O conjunto de diques constru´ıdos nos lugares em que dois fluxos de ´agua distintos se encontram, representando a parti¸c˜ao das bacias da imagem original, ´e denominado watershed.

(40)

(a) (b) (c) (d) (e)

Figura 2.9: Ilustra¸c˜ao da transformada de watershed [5]: (a) imagem em n´ıveis de cinza, (b) representa¸c˜ao de (a) como uma superf´ıcie topogr´afica e (c)-(e) processo de inunda¸c˜ao e constru¸c˜ao de diques.

Os limites das bacias de uma imagem em n´ıveis de cinza tamb´em podem ser interpre-tados como as zonas de influˆencia dos seus m´ınimos regionais. Neste sentido, a transfor-mada de watershed ´e o esqueleto por zonas de influˆencia dos m´ınimos da imagem [75]. No entanto, extremos (freq¨uentemente utilizados como marcadores) podem corresponder a estruturas n˜ao-significativas ou ru´ıdo, causando super-segmenta¸c˜ao.

Para evitar este problema, uma alternativa ´e selecionar os extremos segundo algum crit´erio, tal como contraste, ´area das regi˜oes e assim por diante. A Figura 2.10 ilustra um exemplo. A utiliza¸c˜ao de todos os m´aximos locais como marcadores provoca uma super-segmenta¸c˜ao (Figura 2.10(c)). Se somente pontos que possuem um contraste maior que 15 forem utilizados como marcadores, um resultado mais preciso ´e obtido (Figura 2.10(e)).

(a) (b) (c) (d) (e)

Figura 2.10: Transformada de watershed : (a) imagem original, (b) m´aximos regionais, (c) segmenta¸c˜ao utilizando m´aximos como marcadores, (d) pontos que possuem um contraste maior que 15 (e) segmenta¸c˜ao resultante ao considerar pontos selecionados em (d) como marcadores.

(41)

2.8. Conclus˜oes 25

2.8

Conclus˜

oes

Transforma¸c˜oes de imagens s˜ao amplamente utilizadas em diversas aplica¸c˜oes, consis-tindo desde etapas de pr´e-processamento at´e procedimentos completos. Este cap´ıtulo apresentou alguns exemplos, bem como uma breve revis˜ao de conceitos necess´arios ao en-tendimento do restante do texto. Uma maior ˆenfase foi dada `as opera¸c˜oes de morfologia matem´atica, as quais constituem a base das transforma¸c˜oes propostas neste trabalho.

No entanto, ´e preciso considerar tamb´em a an´alise de diferentes n´ıveis de representa¸c˜ao, a qual vem sendo amplamente utilizada para lidar com a natureza multi-escala das ima-gens. Atrav´es de tais abordagens, ´e poss´ıvel extrair as caracter´ısticas de interesse que se tornam expl´ıcitas em cada n´ıvel. Diversas formula¸c˜oes foram propostas, tais como wave-lets, decomposi¸c˜ao piramidal e espa¸co-escala, esta ´ultima o foco principal deste trabalho. O pr´oximo cap´ıtulo discute em detalhes suas principais propriedades.

Referências

Documentos relacionados

Os citˆometros de fluxo atuais utilizam um fluido l´ıquido para conduzir a c´elula at´e a regi˜ao de medi¸c˜ao e baseiam-se no princ´ıpio da focaliza¸c˜ao

Ora, j´ a vimos que as ´ unicas solu¸c˜ oes da equa¸c˜ ao de Legendre usual que permanecem limitadas nos extremos ±1 (assim como suas derivadas) s˜ao os polinˆ omios de Legendre P

Por´em, como veremos no exemplo discutido em detalhe ` a p´ agina 1205, n˜ ao basta que um grupo de Lie seja conexo para que todos os seus elementos possam ser escritos

Vamos na presente se¸c˜ ao (cuja leitura ´e dispens´ avel para o desenvolvimento da teoria de integra¸c˜ ao de Lebesgue que se lhe segue) aprofundar um pouco mais a teoria

Reunindo as defini¸c˜ oes acima de derivada de uma distribui¸c˜ ao e produto de uma distribui¸c˜ ao com uma fun¸c˜ ao infinitamente diferenci´ avel, podemos introduzir a no¸c˜

Os resultados obtidos indicaram que o Método do Ganho de Massa é viável para a obtenção do percentual de absorção de CO2; todas as mostras submetidas à cura por

Exerc´ıcio 41: Mostre que se dois lados de um triˆangulo n˜ao s˜ao congru- entes, ent˜ao os dois ˆangulos opostos a estes lados tamb´em n˜ao s˜ao congru- entes.. Mostre que o

No relatório Controle da Margem de Contribuição - Família Solventes (anexo 4) verifica-se qual o volume total de faturamento gerado e a rentabilidade da Família Solventes.