SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

(1)

UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO

EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO

Luiz Carlos Ferreira Rodrigues

SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS

S˜ ao Paulo

2017

(2)

UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO

EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO

Luiz Carlos Ferreira Rodrigues

SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS

Tese apresentada ao Programa de P´ os-Gradua¸c˜ ao em Engenharia El´ etrica e Computa¸c˜ ao da Universidade Presbiteriana Mackenzie, como requisito parcial ` a obten¸c˜ ao do t´ıtulo de Doutor em Engenharia El´ etrica na ´ Area de Concentra¸c˜ ao em Engenharia de Computa¸c˜ ao.

Orientador: Prof. Dr. Maur´ıcio Marengoni S˜ ao Paulo

2017

(3)

R685 Rodrigues, Luiz Carlos Ferreira.

Segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos em ima- gens retinais usando Wavelets, Morfologia Matem´ atica e Fil- tragem Multiescalas baseada em Hessianas / Luiz Carlos Ferreira Rodrigues. - S˜ ao Paulo 2017

75 f. : il., 30 cm.

Bibliografia: f. 70-75.

Tese (Doutorado em Engenharia El´ etrica e Computa¸c˜ ao)- Universidade Presbiteriana Mackenzie, S˜ ao Paulo, 2017.

Prof. Dr. Maur´ıcio Marengoni

1. Imagens retinais. 2. Morfologia Matem´ atica. 3. Wa- velets. 4. Filtros Multiescala. i.T´ıtulo.

CDD 621.3

(4)

(5)

Aos meus pais, Antonio e Al- tamira (in memorian).

A minha esposa Eunice, pelo

carinho e paciˆ encia .

em todos esses anos.

(6)

AGRADECIMENTOS

Ao Prof. Dr. Maur´ıcio Marengoni, minha profunda gratid˜ ao pela orienta¸c˜ ao no de-

senvolvimento deste trabalho e tamb´ em por suas contribui¸c˜ oes, paciˆ encia e corre¸c˜ oes no

decorrer do trabalho. A todo o corpo docente do Programa de P´ os Gradua¸c˜ ao em En-

genharia El´ etrica e de Computa¸c˜ ao da Universidade Presbiteriano Mackenzie. Foi um

grande privil´ egio tˆ e-los como mestres. Aos meus queridos irm˜ aos, Zeca, F´ atima, Carlito

e M´ ario pelo carinho e amizade por toda uma vida. A todos aqueles que , ainda que n˜ ao

citados aqui, contribu´ıram de forma direta ou indireta na elabora¸c˜ ao desta tese com seu

apoio e inspira¸c˜ ao.

(7)

RESUMO

A importˆ ancia de um acurado e precoce diagn´ ostico de doen¸cas retinais tem motivado o desenvolvimento de t´ ecnicas de vis˜ ao computacional necess´ arias para uma completa ava- lia¸c˜ ao autom´ atica das condi¸c˜ oes do sistema retinal. Nesta tese, apresentamos um novo algoritmo que aplica transformadas wavelets e morfologia matem´ atica na detec¸c˜ ao do disco

´

otico e exploramos as caracter´ısticas tubulares dos vasos sangu´ıneos em espa¸co de escalas Gaussianas para segmentar veias e art´ erias. O disco ´ otico e a estrutura vascular s˜ ao essen- ciais para a an´ alise da imagem retinal. Em vez de usar tentativas emp´ıricas para escolher os melhores parˆ ametros para segmenta¸c˜ ao de vasos, foi utilizado algoritmo gen´ etico (GA) e suas sequˆ encias de gera¸c˜ oes e cruzamentos. Entretanto, a t´ ecnica de explorar as carac- ter´ısticas tubulares dos vasos chega ao seu limite quando os vasos s˜ ao representados por sequˆ encias curvil´ıneas e n˜ ao cont´ınuas de 1 pixel de largura. Para superar essa limita¸c˜ ao, foi criada uma nova metodologia baseada no algoritmo de Steger para segmentar uma estrutura curvil´ınea de duas dimens˜ oes que n˜ ao s˜ ao alcan¸cadas pelo detector de vasos em espa¸co de escalas. O detector de estrutura curvil´ınea ir´ a identificar e anexar as linhas aos vasos principais usando o algoritmo de caminho mais curto de Dijkstra, completando a segmenta¸c˜ ao de vasos grossos e finos. O m´ etodo proposto foi desenvolvido e testado sobre duas bases de imagens abertas e gratuitamente dispon´ıveis: DRIVE (Digital Retinal Images for Vessel Extraction) que cont´ em 40 imagens retinais anotadas e sobre HRF-DB (High Resolution Fundus Image Database ) que cont´ em 45 imagens anotadas. Os resulta- dos experimentais do m´ etodo s˜ ao demonstrados e exibem uma acur´ acia m´ edia de 0.9503 no banco de imagens DRIVE e 0.9445 no HRF-DB. Tais n´ıveis de acur´ acia est˜ ao pr´ oximos ao estado da arte, que s˜ ao mais complexos e requerem um, ocasionalmente dois, m´ odulos de pr´ e-processamento, enquanto este m´ etodo n˜ ao requer pr´ e ou p´ os processamento. O m´ etodo desenvolvido possui um tempo m´ edio de processamento, para cada imagem, de 35 segundos e for desenvolvido em um processador Intel Core i5-3320, CPU de 2.60 GHz com 8 GB de RAM.

Palavras-chave: Imagens Retinais, Morfologia Matem´ atica, Wavelets, Filtros

Multiescala.

(8)

ABSTRACT

The importance of an accurate and early diagnosis of retinal diseases has motivated the development of vision techniques necessary for a complete automatic evaluation of the retinal system conditions. In this thesis, we present a new algorithm that applies wavelet transform and mathematical morphology for optical disc detection and explore the blood vessels tubular characteristics in Gaussian scale space to segment veins and arteries. Optic disc and the vascular structure are essential for the analysis of the retinal image. Instead of using empirical attempts to choose the best parameters for vessel detection, genetic algorithm (GA) and its sequences of generations and intersections are used. However, the technique of exploring vessel tubular characteristics reaches its limit when vessels are represented by curvilinear sequences and not continuous 1 pixel wide. To overcome this limitation, a new methodology based on the Steger algorithm for segmenting curvilinear structure was created for the vessels not reached by the detector in scale space. The curvilinear detector will identify and attach the lines to the main vessels using the shortest path algorithm developed by Dijkstra, completing the segmentation of wide and thin vessels. The proposed method was developed and tested on two freely available open image databases: DRIVE (Digital Retinal Images for Vessel Extraction) containing 40 annotated retinal images and HRF-DB (High Resolution Fundus Image Database ) that contains 45 annotated images. The experimental results of the method are demonstrated and exhibit an average accuracy of 0.9503 in the DRIVE image database and 0.9445 in the HRF-DB. Such levels of accuracy are close to the state of the art, which are more complex and require one, occasionally two, preprocessing modules, while this method does not require pre or post processing. The developed method has an average processing time, for each image, of 35 seconds and was implemented in a Intel Core i5-3320 processor, 2.60 GHz CPU with 8 GB of RAM.

Keywords: Retinal Images, Mathematical Morphology, Wavelets, Multiscale Filter.

(9)

LISTA DE FIGURAS

1 Esquema simplificado do olho humano. Adaptado de (UFRJ, 2013) . . . . 23

2 Exemplo de imagem de fundo do olho, ou imagem retinal. Adaptado de (UFRJ, 2013). . . . 24

3 Fun¸c˜ ao Wavelet de Morlet. . . . . 29

4 Diagramas de plano tempo-frequˆ encia de STFT e wavelets . . . . 31

5 Ilustra¸c˜ ao das imagens A e B . . . . 32

6 Exemplo de Dilata¸c˜ ao . . . . 33

7 Exemplo esquem´ atico de aplica¸c˜ ao de morfologia matem´ atica. Em A vˆ e-se a imagem original, com ru´ıdo. O resultado da eros˜ ao est´ a em B. E C mostra a imagem ap´ os a aplica¸c˜ ao de dilata¸c˜ ao . . . . 34

8 Esquema da elipsoide de segunda ordem e seus autovalores λ _x (FRANGI et al., 1998) . . . . 36

9 Fluxograma de algoritmo gen´ etico simples. . . . 40

10 Quatro exemplos de segmenta¸c˜ ao bem sucedidas. Extraido de (GIACHETTI; BALLERINI; TRUCCO, 2014) . . . . 43

11 Dois exemplos de falha na segmenta¸c˜ ao. Extraido de (GIACHETTI; BAL- LERINI; TRUCCO, 2014) . . . . 44

12 Ilustra¸c˜ ao do processo de segmenta¸c˜ ao proposto por Joshi et al. Extra´ıdo de (JOSHI; SIVASWAMY; KRISHNADAS, 2011) . . . . 44

13 Ilustra¸c˜ ao dos resultados obtidos pelo m´ etodo de Welfer et al. Extra´ıdo de (WELFER; SCHARCANSKI; MARINHO, 2013) . . . . 45

14 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Fathi et al. A) Imagem original. B) Imagem segmentada. Extra´ıdo de (FATHI; NAGHSH- NILCHI, 2013) . . . . 47

15 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Li et al. Ex- tra´ıdo de (LI et al., 2016) . . . . 48

16 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Chen et al. Extra´ıdo de (CHEN; HUANG; TIAN, 2015) . . . . 48

17 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Zhu et al. Extra´ıdo de (ZHU et al., 2016) . . . . 49

18 Fluxograma da segmenta¸c˜ ao do disco ´ otico. . . . 51

(10)

19 Bandas RGB do primeiro registro (acima) e do segundo registro(abaixo). . 51 20 Imagem decomposta e reconstru´ıda em 7 n´ıveis. A) Imagem original. De

B a F) Reconstru¸c˜ ao das imagens por transformada wavelet Haar. G) Quinto n´ıvel de reconstru¸c˜ ao, onde o DO mais se destaca. H) Sexto n´ıvel de reconstru¸c˜ ao onde n˜ ao se distingue mais o DO. . . . 53 21 Exemplos de distribui¸c˜ ao de pixels de registros do DRIVE. . . . 54 22 Diagrama esquem´ atico mostrando as etapas da segmenta¸c˜ ao de vasos retinais. 55 23 Imagem original(A). Segmenta¸c˜ ao pelo especialista humano(B) Segmenta¸c˜ ao

com poucos Falsos Positivos(C). Segmenta¸c˜ ao com muitos Falsos Positi- vos(D). . . . 56 24 Resultado da esqueletoniza¸c˜ ao pelo algoritmo de Steger. . . . 56 25 Resultado da Rotulagem de Componentes Conexos. . . . 57 26 Ilustra¸c˜ ao da montagem do grafo tendo Pixels como v´ ertices, seus valores

na escala de cinza e as arestas que os conectam. . . . 58 27 Ilustra¸c˜ ao do Caminho mais Curto de Dijkstra. O caminho ´ e percorrido do

ponto A para o ponto B . . . . 59 28 Resultado da concatena¸c˜ ao de imagens. Em A, a imagem com poucos falsos

positivos. Em B, o resultado da lineariza¸c˜ ao pelo algoritmo de Steger. Em C, imagem resultante da concatena¸c˜ ao das imagens A e B. . . . 59 29 Dois exemplos de DO corretamente determinados. . . . 62 30 Imagem de DO patol´ ogico n˜ ao identificado pelo algoritmo. . . . 62 31 (a) Exemplo de cores rotuladas mostrando as estruturas curvilineares dos

vasos retinais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro ver- melho em(a) . . . . 63 32 (a) Justaposi¸c˜ ao da segmenta¸c˜ ao curvilinear e do filtro baseado em Hessi-

ana. Note os vasos desconectados. (b) Imagem ampliada da regi˜ ao deline- ada pelo quadro vermelho em(a) . . . . 64 33 (a) Resultado final da segmenta¸c˜ ao ap´ os aplica¸c˜ ao de caminho mais curto

para conectar os segmentos aos vasos principais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro vermelho em(a) . . . . 64 34 (a) Registro 8 do banco de imagens HRF. (b) Resultado da segmenta¸c˜ ao

na cor verde, sobreposta a segmenta¸c˜ ao manual em vermelho. . . . . 65

(11)

LISTA DE TABELAS

1 Poss´ıveis padr˜ oes em 2D para autovalores λ _k (FRANGI et al., 1998). . . . 37

2 Tabela of parˆ ametros de filtro baseado em Hessianas. . . . 38

3 Representa¸c˜ ao de genoma. . . . 39

4 Valores de parˆ ametros para imagens de DRIVE e HRF-DB. . . . 41

5 Parˆ ametros fornecidos pelo Algoritmo Gen´ etico. . . . 54

6 Resultados do M´ etodo na Segmenta¸c˜ ao do DRIVE . . . . 65

7 Compara¸c˜ ao de desempenho com m´ etodos estado da arte no DRIVE. . . . 66

8 Resultados do M´ etodo na Segmenta¸c˜ ao do HRF-DB . . . . 66

9 Compara¸c˜ ao de desempenho com estado da arte no HRF-DB. . . . . 66

10 Compara¸c˜ ao de tempo de computa¸c˜ ao de segmenta¸c˜ ao retinal no DRIVE. . 67

(12)

LISTA DE SIGLAS

AVC Acidente Vascular Cerebral AVR Atrial Venular Ratio

CHT Circular Hough Transform CWT Continuous Wavelet Transform

DO Disco ´ Otico

DR Diabetic Retinopathy

DRIVE Digital Retinal Images for Vessel Extraction DWT Discrete Wavelet Transform

FN False Negative FOV Field of Vision FP False Positive

GA Genetic Algorithm

GPU Graphics Processing Unit

HRF-DB High Resolution Fundus Image Database

MA Microaneurisma

ROC Retinopathy On Line Challenge ROI Region Of Interest

SLIC Simple Linear Iterative Clustering STFT Short Time Fourier Transform SVM Support Vector Machine

TCA Total Classification Accuracy

TN True Negative

(13)

TP True Positive

WT Wavelet Transform

(14)

LISTA DE S´ IMBOLOS

f(t) fun¸c˜ ao real cont´ınua da vari´ avel t, p´ agina 24

µ componente de frequˆ encia na transformada de Fourier, p´ agina 24 f(x, y) fun¸c˜ ao real cont´ınua das vari´ aveis x e y, p´ agina 24

F{f (t)} transformada de Fourier de f (t), p´ agina 24 F{f (x, y)} transformada de Fourier de f (x, y), p´ agina 24

F (µ) transformada de Fourier em fun¸c˜ ao da frequˆ encia µ, p´ agina 24 F ⁻¹ {F (µ)} transformada Inversa de Fourier de F (µ), p´ agina 24

ψ fun¸c˜ ao base wavelet, p´ agina 27 π 3,141592653589793, p´ agina 28 e 2,718281828459045, p´ agina 28

W (a, b) transformada wavelet cont´ınua, p´ agina 28

ψ ^∗ complexo conjugado da fun¸c˜ ao wavelet ψ, p´ agina 28

x conjunto de N amostras de um sinal x[m](m = 0, 1.., N − 1) , p´ agina 29 j n´ıvel (´ındice) para escalas de wavelet, p´ agina 29

W _ϕ [j ₀ , k] transformada discreta wavelet para fun¸c˜ ao base ϕ , p´ agina 29 W _ψ [j, k] transformada discreta wavelet para fun¸c˜ ao base ψ , p´ agina 29 A ⊕ B dilata¸c˜ ao de A por B, p´ agina 31

A B eros˜ ao de A por B, p´ agina 32 A B abertura de A por B, p´ agina 32 A B fechamento de A por B, p´ agina 32

x ₀ localiza¸c˜ ao de um ponto em uma imagem, p´ agina 34

(15)

s n´ıvel (´ındice) para escalas Gaussianas, p´ agina 34

∆ _0,s vetor gradiente computado no ponto x ₀ na escala s, p´ agina 34 H(x, y) matriz Hessiana, p´ agina 34

I(x, y) representa¸c˜ ao de imagem 2D, p´ agina 34 σ desvio padr˜ ao, p´ agina 34

G(x, y) filtro Gaussiano bidimensional, p´ agina 34

∗ s´ımbolo matem´ atico da opera¸c˜ ao de convolu¸c˜ ao, p´ agina 35 λ ₁ , λ ₂ autovalores da matriz Hessiana, p´ agina 35

∂, ∂ ² primeira e segunda derivadas, p´ agina 35 u ₁ , u ₂ autovetores da matriz Hessiana, p´ agina 35

R a , R b limiares de sensibilidade do filtro Frangi, p´ agina 36

α parˆ ametro alpha no algoritmo de Frangi, p´ agina 37

β parˆ ametro beta no algoritmo de Frangi, p´ agina 37

(16)

Sum´ ario

1 INTRODUC ¸ ˜ AO 18

1.1 Caracteriza¸c˜ ao do Problema . . . . 18

1.2 Motiva¸c˜ ao . . . . 18

1.3 Objetivos e Contribui¸c˜ oes . . . . 19

1.4 Organiza¸c˜ ao do Texto . . . . 21

2 CONCEITOS RELACIONADOS E FUNDAMENTOS TE ´ ORICOS 22 2.1 Fisiologia do Olho Humano . . . . 22

2.2 A Retina Humana . . . . 22

2.3 Transformadas Wavelets . . . . 23

2.3.1 A Transformada de Fourier . . . . 24

2.3.2 A Transformada de Fourier de Tempo-Curto . . . . 26

2.3.3 A Transformada Wavelet . . . . 27

2.3.4 A Transformada Discreta Wavelet . . . . 29

2.4 Morfologia Matem´ atica . . . . 31

2.5 Espa¸cos de Escalas e Filtragem com Hessianas . . . . 34

2.6 Algoritmos Gen´ eticos . . . . 38

3 TRABALHOS RELACIONADOS 42 3.1 Trabalhos sobre a Segmenta¸c˜ ao do Disco ´ Otico . . . . 42

3.2 Trabalhos sobre a Segmenta¸c˜ ao do Vasos Sangu´ıneos . . . . 46

4 MATERIAL E M´ ETODOS 50 4.1 Segmenta¸c˜ ao do Disco ´ Otico . . . . 50

4.2 Segmenta¸c˜ ao de Vasos Sangu´ıneos . . . . 53

5 TESTES E RESULTADOS OBTIDOS 60 5.1 M´ etodo de Avalia¸c˜ ao de Desempenho dos Algoritmos. . . . 60

5.2 Avalia¸c˜ ao da Segmenta¸c˜ ao de Disco ´ Otico. . . . 61

5.3 Avalia¸c˜ ao da Segmenta¸c˜ ao de Vasos Sangu´ıneos . . . . 63

6 CONCLUS ˜ OES FINAIS E TRABALHOS FUTUROS 68

(17)

REFERˆ ENCIAS BIBLIOGR ´ AFICAS 75

(18)

1 INTRODUC ¸ ˜ AO

1.1 Caracteriza¸ c˜ ao do Problema

A Organiza¸c˜ ao Mundial da Sa´ ude (OMS), estima que existam 285 milh˜ oes de pessoas com alguma deficiˆ encia visual em todo o mundo: entre essas pessoas, 39 milh˜ oes s˜ ao cegas e 246 milh˜ oes tˆ em, de alguma forma e em algum grau, a sua capacidade visual reduzida.

Cerca de 90% dos deficientes visuais, em todo o mundo, vivem em pa´ıses de baixa renda, sendo que 82% das pessoas cegas est˜ ao em idade acima dos 50 anos e 80% de toda inca- pacidade visual pode ser prevenida ou curada (World Health Organization, 2017). Dessas estat´ısticas citadas acima, depreende-se claramente a importˆ ancia de um diagn´ ostico pre- coce e acurado na preven¸c˜ ao e tratamento de doen¸cas que afetam a capacidade visual e que pode salvar a vis˜ ao, e at´ e mesmo a vida, de milh˜ oes de pessoas.

Entretanto, para que sejam desenvolvidas aplica¸c˜ oes que auxiliem no diagn´ ostico, an- tes, ´ e fundamental o desenvolvimento de eficientes e acurados m´ etodos de an´ alise das imagens retinais, com aplica¸c˜ ao de t´ ecnicas matem´ aticas e computacionais que segmen- tem as imagens do disco ´ otico e dos vasos e art´ erias retinais, para posterior an´ alise por aplica¸c˜ oes de diagn´ ostico. Dada a natureza da imagem retinal, essa tarefa de segmenta¸c˜ ao das imagens ainda ´ e um desafio para cientistas e pesquisadores.

1.2 Motiva¸ c˜ ao

O crescente desenvolvimento de t´ ecnicas de an´ alise de imagens retinais e a mais recente compreens˜ ao dos significados cl´ınicos das altera¸c˜ oes retinais impelem o desenvolvimento de medi¸c˜ ao do calibre vascular retinal para associa¸c˜ ao com patologias vasculares (IKRAM et al., 2013). Durante anos recentes, a an´ alise automatizada de imagens retinais tem se tornado um largo campo de pesquisa devido aos avan¸cos nas t´ ecnicas de vis˜ ao computacio- nal, e a aquisi¸c˜ ao de imagens tˆ em aberto grandes possibilidades para estudar a patogˆ enese de um grande n´ umero de doen¸cas. O crescente interesse ´ e devido, mas n˜ ao exclusivamente, a v´ arios fatores delineados abaixo (ROSSANT et al., 2011):

1. O fundo do olho ´ e a ´ unica regi˜ ao do corpo humano onde se pode visualizar os vasos sangu´ıneos de uma maneira natural e n˜ ao-invasiva.

2. Imagens retinais n˜ ao s˜ ao dispendiosas para produzir, distribuir e processar.

(19)

3. Mudan¸cas no diˆ ametro e tortuosidade de veias e art´ erias da retina s˜ ao fortes e confi´ aveis indicadores de patologias tais como diabetes, hipertens˜ ao arterial e altos n´ıveis de coles- terol.

Adicionalmente, m´ etodos autom´ aticos de an´ alise de imagem retinal podem ter um impacto econˆ omico e social por possibilitar que exames sejam executados rapidamente em um grande n´ umero de imagens, tornando os exames mais baratos, poupando tempo e recursos humanos e ainda oferecendo mais m´ etricas quantitativas que as t´ ecnicas que envolvem exclusivamente observa¸c˜ oes por humanos.

1.3 Objetivos e Contribui¸ c˜ oes

Ambos, disco ´ otico e estrutura vascular, s˜ ao referˆ encias para registro de imagem e s˜ ao essenciais para qualquer m´ etodo de an´ alise de imagens retinais. Nesta tese ´ e proposto um novo algoritmo baseado em wavelets e morfologia matem´ atica para detec¸c˜ ao do disco

´

otico. Tamb´ em s˜ ao exploradas as caracter´ısticas tubulares dos vasos sangu´ıneos para segmentar vasos e art´ erias retinais (HUANG; ZENG, 2015). Para efetuar a segmenta¸c˜ ao de vasos e art´ erias retinais ´ e utilizado o filtro descrito por Frangi et al. (FRANGI et al., 1998).

Quando aplicada sobre uma imagem decomposta em espa¸co de escalas, o filtro requer cinco parˆ ametros: um desvio padr˜ ao inicial (σ), um valor de incremento para este desvio padr˜ ao, o n´ umero de escalas e dois limiares para a sensibilidade do filtro. Estes cinco parˆ ametros controlam a resposta do filtro; portanto, devem ser selecionados parˆ ametros adequados para a obten¸c˜ ao da maior acur´ acia poss´ıvel. Em vez de executar tentativas emp´ıricas para obter os melhores parˆ ametros, foi utilizado um algoritmo gen´ etico (GA) e suas sequˆ encias de gera¸c˜ oes e cruzamentos de genomas para determinar os melhores valores de parˆ ametros.

Entretanto, a t´ ecnica de explora¸c˜ ao das caracter´ısticas tubulares dos vasos atinge

seu limite quando esses vasos s˜ ao representados por linhas sinuosas e n˜ ao-cont´ınuas que

possuem apenas 1 pixel de largura. Para superar essa limita¸c˜ ao, adotamos o algoritmo

proposto por Steger para segmentar estruturas curvilineares de duas dimens˜ oes (STEGER,

1998). O objetivo deste detector curvilinear ´ e de segmentar as linhas sinuosas, que ser˜ ao

anexadas aos vasos principais atrav´ es do algoritmo de caminho mais curto, proposto

(20)

por Dijkstra (DIJKSTRA, 1959), que far´ a a integra¸c˜ ao dos vasos de maior e de menor diˆ ametro.

O desempenho e a robustez do m´ etodo desenvolvido nesta tese foram testados em dois bancos de imagens retinais disponibilizados de forma p´ ublica e gratuita:

1. DRIVE (Digital Retinal Images for Vessel Extraction) ´ e um banco de imagens publica- mente dispon´ıvel que cont´ em 40 imagens anotadas de fundo de olho, dividida igualmente em subconjuntos de treinamento e testes (STAAL et al., 2004). Uma segmenta¸c˜ ao ma- nual da estrutura vascular, feita por um especialista, est´ a dispon´ıvel para cada imagem do conjunto de treinamento, enquanto para o conjunto de testes est˜ ao dispon´ıveis duas seg- menta¸c˜ oes feitas por dois especialistas: a primeira segmenta¸c˜ ao deve ser usada como gold standard e a segunda pode ser usada como marca de referˆ encia para os algoritmos pro- postos, comparando-os com aqueles anotados por um observador humano independente.

Para cada imagem ´ e fornecida uma imagem bin´ aria representando a regi˜ ao de interesse, com um diˆ ametro de 650 pixels.

2. HRF-DB (High-Resolution Fundus Image Database) ´ e um banco de imagens publi- camente dispon´ıvel que cont´ em 45 imagens retinais (ODSTRCILIK et al., 2013). Para cada imagem, uma segmenta¸c˜ ao manual est´ a dispon´ıvel, assim como uma imagem bin´ aria representando a regi˜ ao de interesse, com um diˆ ametro de 1015 pixels. As imagens est˜ ao igualmente agrupadas em sub-conjuntos de imagens: saud´ aveis, com retinopatia diab´ etica e com glaucoma.

A fotografia retinal exige a utiliza¸c˜ ao de um sistema ´ otico, chamado cˆ amera de fundo,

uma luz de baixa potˆ encia anexada a uma cˆ amara capaz de simultaneamente iluminar

e capturar a imagem do fundo do globo ocular, chamada de retina. Os resultados apre-

sentados nesta tese demonstram uma melhora no desempenho, e acur´ acia muito pr´ oxima

aos m´ etodos estado da arte recentemente publicados. Comparado a outros trabalhos, o

modelo proposto tem v´ arias vantagens: reduzida complexidade e ausˆ encia de exigˆ encia de

pr´ e-processamento ou pr´ e-tratamento de imagens. Adicionalmente, o tempo de proces-

samento do sistema ´ e consideravelmente menor que aqueles demonstrados em trabalhos

recentemente publicados como, por exemplo em (LI et al., 2016) e (Qian Zhao et al.,

2014).

(21)

1.4 Organiza¸ c˜ ao do Texto

O Cap´ıtulo 1 cont´ em uma apresenta¸c˜ ao inicial, onde se descreve o problema que o trabalho desenvolvido nesta tese se prop˜ oe a resolver, bem como as premissas, sociais e econˆ omicas, que motivam o desenvolvimento de um trabalho desta natureza. Tamb´ em descrevemos as contribui¸c˜ oes deixadas pelo desenvolvimento do algoritmo que criamos para a segmenta¸c˜ ao de vasos e art´ erias retinais, quando comparado a outros trabalhos, no estado da arte, recentemente publicados.

O Cap´ıtulo 2 traz os conceitos relacionados aos fundamentos desta tese. Neste cap´ıtulo s˜ ao apresentados detalhes sobre o olho humano, objeto de estudo desta tese, e as t´ ecnicas matem´ aticas e computacionais utilizadas na segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos.

S˜ ao apresentadas as ferramentas matem´ aticas como transformadas wavelets, transformada de Fourier, morfologia matem´ atica, espa¸co de escalas e filtragem por Hessianas e algorit- mos gen´ eticos.

O Cap´ıtulo 3 apresenta um panorama do est´ agio atual de pesquisa na ´ area de seg- menta¸c˜ ao de imagens retinais. Neste cap´ıtulo apresentamos trabalhos considerados estado da arte, publicados na ´ area de segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos, as metodo- logias adotadas por seus autores e resultados obtidos nesses trabalhos Resultados esses, que juntamente com outros listados na bibliografia, servem de referˆ encia aos fundamentos e objetivos da tese aqui apresentada.

O Cap´ıtulo 4 descreve em detalhes as atividades do desenvolvimento do projeto, dis- correndo sobre a etapa de pr´ e-processamento de imagens para a segmenta¸c˜ ao de disco

´

otico e a segmenta¸c˜ ao de vasos sangu´ıneos.

No Cap´ıtulo 5 s˜ ao apresentadas as m´ etricas utilizadas na avalia¸c˜ ao do algoritmos proposto e na compara¸c˜ ao com outros trabalhos referenciados. ´ E feita uma avalia¸c˜ ao qualitativa da segmenta¸c˜ ao do disco ´ otico, uma vez que n˜ ao est´ a dispon´ıvel uma base de imagens anotadas. O desempenho da segmenta¸c˜ ao dos vasos sangu´ıneos ´ e quantitativa- mente avaliado e comparado com outros trabalhos publicados.

O Cap´ıtulo 6 apresenta as considera¸c˜ oes finais e as possibilidades de extens˜ ao desta pesquisa para aprimoramento e aux´ılio no diagn´ ostico de doen¸cas retinais, atrav´ es do desenvolvimento de trabalhos futuros .

Referˆ encias Bibliogr´ aficas cont´ em a listagem da bibliografia utilizada nesta tese.

(22)

2 CONCEITOS RELACIONADOS E FUNDAMEN- TOS TE ´ ORICOS

Est cap´ıtulo descreve algoritmos e t´ ecnicas matem´ aticas e computacionais que tem como objetivo a segmenta¸c˜ ao de vasos e art´ erias representados em imagens retinais. Para melhor compreens˜ ao do objeto do estudo, as imagens retinais, neste cap´ıtulo descreve- mos, de forma sucinta, a estrutura do interior do globo ocular humano, sua arquitetura, funcionalidade, caracter´ısticas deste importante ´ org˜ ao do corpo humano e que motivam o desenvolvimento de pesquisas sobre imagens extra´ıdas de fundo do olho por estudantes, pesquisadores e cientistas em todo o mundo. Continuando no cap´ıtulo, s˜ ao discutidas as teorias matem´ aticas que fundamentam o estudo desenvolvido nesta tese. Aqui ser˜ ao expostos, de forma resumida, os conceitos matem´ aticos das transformadas wavelets e de Fourier, morfologia matem´ atica, espa¸co de escalas Gaussianas e algoritmos gen´ eticos.

Dada a extens˜ ao dos assuntos abordados, mais detalhes podem ser obtidos na bibliografia referenciada.

2.1 Fisiologia do Olho Humano

O olho humano ´ e uma esfera cheia de fluido envolvida por trˆ es camadas de tecido.

O tecido mais externo ´ e composto pela escler´ otica e a c´ ornea. A camada do meio inclui a ´ıris, o corpo ciliar e a coroide. A ´ıris cont´ em dois conjuntos de m´ usculos controlando o diˆ ametro da pupila. O corpo ciliar envolve as lentes e cont´ em uma musculatura que ajusta seu poder refrativo. A cor´ oide ´ e um leito capilar que suporta os fotoreceptores. A camada mais interior ´ e a retina contendo os fotoreceptores (DAVSON, 1980).

A caminho da retina a luz, sucessivamente, atravessa a c´ ornea, o humor aquoso, um l´ıquido claro e aguado dentro da cˆ amara anterior que regula a press˜ ao intraocular, as lentes e o humor vitreous, uma substancia gelatinosa que d´ a forma e tamanho ao globo ocular (DAVSON, 1980).

2.2 A Retina Humana

A retina ´ e a parte do olho sens´ıvel ` a luz, tamb´ em chamada de fundo de olho, que

cont´ em milh˜ oes de c´ elulas fotossens´ıveis chamadas de cones e de bastonetes. Os cones

(23)

Figura 1: Esquema simplificado do olho humano. Adaptado de (UFRJ, 2013) .

e bastonetes transformam energia luminosa em impulsos nervosos que, atrav´ es do nervo

´

otico, s˜ ao interpretados pelo c´ erebro (RECORDS, 1979).

No fundo do olho, pr´ oximo ao centro, h´ a uma pequena depress˜ ao, onde existem apenas cones, que ´ e chamada de f´ ovea, vis´ıvel nas Figuras 1 e 2 . ´ E na f´ ovea que a imagem se forma com maior nitidez. O eixo que liga a pupila ` a f´ ovea ´ e conhecido como eixo ´ otico.

Os impulsos nervosos s˜ ao transmitidos para o c´ erebro atrav´ es do nervo ´ otico. Como a regi˜ ao por onde ele sai da retina n˜ ao possui cones ou bastonetes, nenhuma imagem ´ e processada ali. Por este motivo, essa regi˜ ao ´ e conhecida como ponto cego. Este ponto pode ser visto na Figura 2, como a regi˜ ao mais clara da imagem que ´ e conhecida como disco ´ otico. Por essa regi˜ ao, entram no disco ´ otico os vasos sangu´ıneos que abastecem a retina (RECORDS, 1979).

O padr˜ ao de distribui¸c˜ ao desses vasos ´ e ´ unico para cada pessoa, sendo t˜ ao complexo que at´ e gˆ emeos idˆ enticos n˜ ao possuem a mesma configura¸c˜ ao. Al´ em disso, ele n˜ ao muda durante toda vida do indiv´ıduo, exceto em caso de mutila¸c˜ ao ou condi¸c˜ oes m´ edicas que alterem o olho de alguma forma. Na Figura 2, s˜ ao vis´ıveis a distribui¸c˜ ao dos vasos sangu´ıneos, a f´ ovea e o nervo ´ otico circundado pelo disco ´ otico (RECORDS, 1979).

2.3 Transformadas Wavelets

Em termos matem´ aticos, uma transformada ´ e uma t´ ecnica de mapeamento entre o con-

junto dom´ınio e o conjunto imagem de uma fun¸c˜ ao. As transformadas possuem um papel

de grande importˆ ancia no processamento de sinais, de modo geral, e de imagens de modo

(24)

Figura 2: Exemplo de imagem de fundo do olho, ou imagem retinal. Adaptado de (UFRJ, 2013).

particular. Frequentemente, esses sinais e imagens s˜ ao melhor analisados quando observa- dos em diferentes dom´ınios. Existe um grande n´ umero de t´ ecnicas de transforma¸c˜ ao, que podem ser aplicadas a diversas finalidades. Entre elas podemos citar as transformadas de Fourier, de Hartley, do Cosseno, do Seno, de Fourier-Mellin, de Karhunen-Lo` eve e as wavelets (PEDRINI; SCHWARTZ, 2007) Entre os diversos m´ etodos de transforma¸c˜ oes matem´ aticas dispon´ıveis e aplicados ao processamento de imagens, a transformada de Fourier ´ e uma das mais conhecidas. Para que sua utiliza¸c˜ ao seja vi´ avel, ´ e fundamental que uma transformada seja revers´ıvel, por isso as transformadas de Fourier e wavelets foram desenvolvidas sobre fun¸c˜ oes bases ortogonais, permitindo a decomposi¸c˜ ao e a re- constru¸c˜ ao da imagem (FRAZIER, 1999)

A transformada de Fourier utiliza como bases duas fun¸c˜ oes ortogonais (seno e cosseno) para decompor e reconstruir um sinal ou imagem. Nesta se¸c˜ ao, fazemos uma exposi¸c˜ ao das transformadas wavelets, ` a luz da transformada de Fourier e demonstramos que na aplica¸c˜ ao desta tese a transformada de Fourier possui algumas desvantagens, raz˜ oes pelas quais optamos pela aplica¸c˜ ao da transformada aavelet.

2.3.1 A Transformada de Fourier

No s´ eculo XIX, o matem´ atico francˆ es Joseph Fourier demonstrou que qualquer fun¸c˜ ao

peri´ odica pode ser expressa como uma soma de senos e cossenos de diferentes frequˆ encias,

(25)

cada soma multiplicada por um diferente coeficiente, no que ´ e hoje conhecido como S´ erie de Fourier. A despeito da complexidade da fun¸c˜ ao, se ela ´ e peri´ odica e satisfaz algumas condi¸c˜ oes matem´ aticas, ela pode ser representada por uma S´ erie de Fourier (BRIGHAM, 1988).

Mesmo fun¸c˜ oes n˜ ao peri´ odicas, mas que tenham uma energia finita, podem ser ex- pressas como uma integral de senos ou cossenos multiplicados por uma fun¸c˜ ao ponderada assumindo o formato de transformada de Fourier. Como uma importante caracter´ıstica, em ambas express˜ oes a fun¸c˜ ao original pode ser completamente reconstru´ıda atrav´ es de um processo inverso, sem perda de informa¸c˜ ao (GONZALEZ; WOODS, 2006). A transfor- mada de Fourier mapeia uma fun¸c˜ ao do dom´ınio do tempo para o dom´ınio da frequˆ encia, onde seu espectro pode ser analisado. O sentido inverso desse processo ´ e chamado trans- forma¸c˜ ao inversa de Fourier, recuperando-se os valores da fun¸c˜ ao no dom´ınio do tempo.

Seja f (t) uma fun¸c˜ ao real cont´ınua da vari´ avel t, a transformada de Fourier de f (t), aqui denotada por F{f (t)}, conforme demonstrado em (GONZALEZ; WOODS, 2006), pode ser expressa por

F{f(t)} = Z +∞

−∞

f (t)e ^−j2πµt dt, (2.1) onde t representa o tempo, µ a frequˆ encia e j corresponde ` a unidade imagin´ aria √

−1 Como t ´ e integrado, F{f (t)} ´ e uma fun¸c˜ ao apenas de µ e, por praticidade, ela pode ser expressa na forma F{f (t)} = F (µ) o que nos permite reescrevˆ e-la como:

F (µ) = Z +∞

−∞

f (t)e ^−j2πµt dt. (2.2)

Usando a f´ ormula de Euler, pode-se expandir a Equa¸c˜ ao 2.1 e observar que ela ´ e com- posta pelo produto interno da fun¸c˜ ao f(t) com um conjunto de exponenciais complexas que comp˜ oem uma base ortonormal:

F (µ) = Z +∞

−∞

f (t)[cos(2πµt) − jsen(2πµt)]dt. (2.3) Inversamente, dado F (µ) pode-se obter a transformada inversa de Fourier, expressa por f (t) = F ⁻¹ {F (µ)} :

f (t) = Z +∞

−∞

F (µ)e ^j2πµt dµ. (2.4)

(26)

Do acima exposto, pode-se observar que se f (t) pertence aos reais, ent˜ ao a transformada resultante ´ e complexa e que, como mostra a Equa¸c˜ ao 2.3, a transformada de Fourier ´ e uma expans˜ ao de f (t) multiplicada por termos senoidais cujas frequˆ encias s˜ ao determinadas pelos valores de µ, sendo a vari´ avel t apenas integrada. Como a ´ unica vari´ avel al´ em da integra¸c˜ ao ´ e a frequˆ encia, dizemos que a transformada de Fourier mapeia uma fun¸c˜ ao a partir do dom´ınio do tempo t para o dom´ınio da frequˆ encia µ (GONZALEZ; WOODS, 2006).

No campo do processamento de imagens, a transformada de Fourier pode ser apli- cada em sinais bidimensionais, como uma fun¸c˜ ao de duas vari´ aveis f (x, y). Sendo f(x, y) cont´ınua e integr´ avel, ent˜ ao F (u, v) ´ e integr´ avel e a transformada de Fourier e sua respec- tiva inversa podem ser expressas, respectivamente, por :

F (µ, v) =

Z Z +∞

−∞

f(x, y) e ^{−j2π(µx+vy} ) dx dy, e (2.5)

F (x, y) =

Z Z +∞

−∞

F (µ, v) e ^j2π(µx+vy ) dµ dv, (2.6) onde µ e v s˜ ao as vari´ aveis de frequˆ encia e, quando essas equa¸c˜ oes s˜ ao aplicadas a imagens, x e y s˜ ao interpretadas como vari´ aveis cont´ınuas espaciais. Como no caso 1-D, o dom´ınio das vari´ aveis µ e v define o dom´ınio de frequˆ encia cont´ınua (GONZALEZ; WOODS, 2006).

A extens˜ ao da aplica¸c˜ ao da transformada bidirecional sobre imagens digitais pode ser aplicadas sem a necessidade de converter os dados de entrada em um vetor antes da obten¸c˜ ao dos coeficientes de Fourier. A transformada de Fourier e sua inversa s˜ ao mostradas, respectivamente(PEDRINI; SCHWARTZ, 2007):

F (µ, v) = 1 N ²

N −1

X

x=0 N−1

X

y=0

f (x, y) e ⁽

−i2π(µx+vy)

N

) + 3x, e (2.7)

f (x, y) = 1 N ²

N−1

X

v=0 N −1

X

µ=0

F (µ, v) e ⁽

^i2π(µx+vy)^N

⁾ (2.8)

2.3.2 A Transformada de Fourier de Tempo-Curto

As fun¸c˜ oes senoidais possuem um suporte infinito e s˜ ao adequadas para a an´ alise de si- nais cujo conte´ udo de frequˆ encia ´ e invari´ avel no tempo, os chamados sinais estacion´ arios.

Entretanto, quando se trata da an´ alise de sinais cuja resposta em frequˆ encia varia no

(27)

tempo, os chamados sinais n˜ ao-estacion´ arios, ou ainda sinais transientes, essas fun¸c˜ oes n˜ ao apresentam a mesma conveniˆ encia. Quando no dom´ınio do tempo, n˜ ao dispomos de nenhuma informa¸c˜ ao relativa a frequˆ encia, e quando no dom´ınio da frequˆ encia n˜ ao dis- pomos de nenhuma informa¸c˜ ao a respeito do tempo. A transformada de Fourier possui m´ axima resolu¸c˜ ao em frequˆ encia por´ em nenhuma resolu¸c˜ ao no tempo, o que quer dizer que nos ´ e poss´ıvel determinar todas as frequˆ encias do espectro de um sinal, por´ em nos ´ e im- poss´ıvel determinar o momento em que uma determinada frequˆ encia acontece(FRAZIER, 1999).

A transformada de Fourier de tempo-curto (em inglˆ es, Short-time Fourier Transform - STFT), ´ e uma vers˜ ao da transformada de Fourier que utiliza janelas na escala de tempo, e seus respectivos deslocamentos, como bases para o c´ alculo da transforma¸c˜ ao. Existe diversas escolhas poss´ıveis para a sele¸c˜ ao da janela g(t), a maioria delas com suporte compacto e uma razo´ avel regularidade. A transformada de Gabor ´ e uma STFT que usa a fun¸c˜ ao Gaussiana como janela.

A STFT de um sinal f (t) pode ser definida como na Equa¸c˜ ao 2.9

F (τ, w) = Z +∞

−∞

[f(t)w(t − τ )] e ^{−j2πf t} dt. (2.9) Pelo princ´ıpio da incerteza de Heisenberg, um conceito da f´ısica quˆ antica, ´ e esta- belecido que ´ e imposs´ıvel obtermos a informa¸c˜ ao exata da frequˆ encia de um sinal e o instante/local no tempo/espa¸co onde essa frequˆ encia ocorreu. Mas ´ e poss´ıvel saber o in- tervalo de tempo nos quais certas bandas de frequˆ encia ocorrem. Da´ı se conclui que n˜ ao

´ e poss´ıvel obter alta resolu¸c˜ ao em tempo e frequˆ encia simultaneamente, ou seja, um sinal n˜ ao pode ser representado como um ponto no plano tempo-frequˆ encia (MALLAT, 2008).

No STFT, uma vez que a mesma janela ´ e usada para todas as frequˆ encias, a resolu¸c˜ ao espectral ´ e a mesma em todas as localiza¸c˜ oes do plano tempo-frequˆ encia. Na transformada wavelet, diferentemente da STFT que tem uma janela de dimens˜ ao constante, a dimens˜ ao da janela ´ e vari´ avel, usando assim fun¸c˜ oes bases curtas para an´ alise de alta frequˆ encia e fun¸c˜ oes base longas para an´ alise de baixa frequˆ encia.

2.3.3 A Transformada Wavelet

A transformada wavelet ´ e uma poderosa ferramenta que permite a decomposi¸c˜ ao de

um sinal em seus diferentes componentes de frequˆ encia, permitindo a an´ alise de seus com-

(28)

ponentes separadamente em sua correspondente escala. O termo inglˆ es wavelet significa

”pequena onda”, fazendo referˆ encia ao suporte compacto da sua fun¸c˜ ao base.

Em termos matem´ aticos, wavelets s˜ ao fun¸c˜ oes e como tais precisam satisfazer certas condi¸c˜ oes (PERCIVAL; WALDEN, 2000). A primeira condi¸c˜ ao ´ e que a sua integral seja igual a zero. Isto significa que, para cada ´ area da fun¸c˜ ao wavelet acima do eixo dos x, deve haver uma ´ area equivalente abaixo deste eixo. Assim a fun¸c˜ ao wavelet tem que ter ondas acima e abaixo do eixo x, da´ı a origem do seu nome, ”wave”, onda em inglˆ es. Este requisito a uma fun¸c˜ ao wavelet ψ ´ e expresso matematicamente por:

Z +∞

−∞

ψ (t) dt = 0. (2.10)

O segundo requisito ´ e que uma fun¸c˜ ao wavelet ψ seja localizada no espa¸co, ou seja, possua suporte compacto, provindo da´ı seu nome ”wavelet”, pequena onda em inglˆ es.

Esta condi¸c˜ ao estabelece que a integral do quadrado da wavelet tem que existir, ou seja sua energia seja finita, de modo que ela seja localizada em um intervalo finito e sua energia seja zero, ou quase zero, fora desse intervalo:

Z +∞

−∞

| ψ (t) | ² dt < ∞. (2.11) Infinitas fun¸c˜ oes satisfazem esses dois requisitos acima descritos e algumas delas tˆ em sido pesquisadas e s˜ ao mais comumente usadas em transformadas wavelets. A Equa¸c˜ ao 2.12 mostra a fun¸c˜ ao wavelet de Morlet:

ψ(t) = e ^−t

²

cos πt r 2

ln2

!

. (2.12)

A fun¸c˜ ao wavelet Morlet ´ e uma curva cosseno que tem suas oscila¸c˜ oes amortecidas por um fator exponencial e possui suporte compacto, pois 99% da sua energia est´ a concentrada no intervalo −2, 5 ≤ t ≤ 2, 5. Sua forma gr´ afica est´ a mostrada na Figura 3.

Uma vez selecionada uma wavelet ψ (t), a transformada wavelet Cont´ınua (CWT) de uma fun¸c˜ ao quadr´ atica integr´ avel f (t) ´ e definida, conforme (SALOMON, 2007), como:

W (a, b) = Z +∞

−∞

f(t) 1 p |a| ψ ^∗

t − b a

dt. (2.13)

A transformada W ´ e uma fun¸c˜ ao de dois parˆ ametros reais a e b, e ∗ denota o complexo

(29)

Figura 3: Fun¸c˜ ao Wavelet de Morlet.

conjugado de ψ. O valor de ^√ ¹ _a ´ e um fator de normaliza¸c˜ ao que garante que a energia de ψ _a,b permane¸ca independente de a e de b.

Se definirmos a fun¸c˜ ao

ψ _a,b (t) = 1 p |a| ψ

t − b a

. (2.14)

se pode re-escrever a Equa¸c˜ ao 2.13 na seguinte forma:

W (a, b) = Z +∞

−∞

f (t)ψ _a,b (t)dt. (2.15)

Em termos matem´ aticos, a transformada wavelet ´ e formada pelo produto interno das duas fun¸c˜ oes: f(t) e ψ _a,b (t). Para qualquer a, ψ _a,b (t) ´ e uma c´ opia de ψ _a,0 (t) deslocada b unidades ao longo do eixo dos x. Assim, b ´ e um parˆ ametro de transla¸c˜ ao da fun¸c˜ ao. Se assumirmos b = 0 na Equa¸c˜ ao 2.14, teremos como resultado:

ψ _a,b (t) = 1 p |a| ψ

t a

. (2.16)

Isto demonstra que a ´ e um parˆ ametro de escalonamento, ou dilata¸c˜ ao, da fun¸c˜ ao. Para valores de a maiores que 1, a wavelet ser´ a expandida, enquanto para valores de a entre 0 e 1, ela ser´ a comprimida (SALOMON, 2007).

2.3.4 A Transformada Discreta Wavelet

Como expans˜ ao das s´ eries de Fourier, as expans˜ oes das s´ eries de wavelets das fun¸c˜ oes

cont´ınuas mapeiam uma fun¸c˜ ao de uma vari´ avel cont´ınua em uma sequˆ encia de coeficien-

tes. Se a fun¸c˜ ao sendo expandida ´ e discreta os coeficientes resultantes s˜ ao chamados de

(30)

transformada wavelet discreta (GONZALEZ; WOODS, 2006). Diferentemente da trans- formada de Fourier, a transformada wavelet n˜ ao possui um ´ unico conjunto de fun¸c˜ oes base, mas infinitos conjuntos poss´ıveis de fun¸c˜ oes bases, as wavelets. A transformada discreta wavelet (em inglˆ es, discrete wavelet transform (DWT)),´ e uma fun¸c˜ ao ortogonal que pode ser aplicada a um conjunto finito de dados. Ao contr´ ario das fun¸c˜ oes seno e cossenos da transformada de Fourier as wavelets n˜ ao necessariamente tˆ em dura¸c˜ ao infinita. O suporte compacto da wavelet permite a transforma¸c˜ ao de uma fun¸c˜ ao do dom´ınio do tempo para representa¸c˜ ao localizada pela frequˆ encia e pelo tempo (JENSEN; COUR-HARBO, 2001) O sinal discreto x = [x[0], · · · , x[N − 1]] ^T ´ e um conjunto de N amostras tomadas de um sinal cont´ınuo

x[m] = x(t ₀ + m4t), (m = 0, 1, · · · , N − 1) para algum per´ıodo inicial t ₀ e per´ıodo de amostragem 4t.

As fun¸c˜ oes base ϕ = [ϕ[0], · · · , ϕ[N − 1]] ^T e ψ = [ψ[0], · · · , ψ[N − 1]] ^T tamb´ em s˜ ao vetores contendo N elementos.

Seja j ₀ = 0 , N = 2 ^J , j = 0, 1, · · · , J − 1 e k = 0, 1, · · · , 2 ^j − 1 ent˜ ao a expans˜ ao da wavelet se torna a transformada discreta wavelet. A fun¸c˜ ao discreta ´ e representada pela soma ponderada no espa¸co expandido pelas bases ϕ e ψ. A transformada wavelet inversa, onde a somat´ oria sobre j ´ e feita para diferentes n´ıveis de escala e a somat´ oria sobre k ´ e feita para diferentes transla¸c˜ oes em cada n´ıvel de escala e os coeficientes, tamb´ em chamados de pesos, s˜ ao proje¸c˜ oes da fun¸c˜ ao em cada uma das fun¸c˜ oes bases (GONZALEZ; WOODS, 2006).

As Equa¸c˜ oes 2.17 e 2.18 representam a transformada discreta wavelet direta (GON- ZALEZ; WOODS, 2006):

W _ϕ [j ₀ , k] = (x, ϕ _j

₀

_,k ) = 1

√ N

N −1

X

m=0

x[m]ϕ _j

₀

_,k [m], (for all k) e (2.17)

W _ψ [j, k] = (x, ψ _j,k ) = 1

√ N

N −1

X

m=0

x[m]ψ _j,k [m], (for all k and all j > j ₀ ) (2.18)

onde W _ϕ [j, k] ´ e chamado de coeficiente de aproxima¸c˜ ao e W _ψ [j, k] ´ e chamado de coeficiente

de detalhe.

(31)

A transformada discreta wavelet inversa, que reconstituir´ a a fun¸c˜ ao original, ´ e:

x[m] = 1

√ N X

k

W _ϕ [j ₀ , k]ϕ _j

₀

_,k [m] + 1

√ N

∞

X

j=j

0

X

k

W _ψ [j, k]ψ _j,k [m], (m = 0, · · · , N − 1).

(2.19) Para efeito de compara¸c˜ ao, na Figura 4 est˜ ao ilustradas as bases das fun¸c˜ oes de Fourier e wavelets. Nela podemos observar que, enquanto na STFT as janelas s˜ ao constantes, no plano tempo-frequˆ encia das wavelets as baixas frequˆ encias possuem as alturas dos retˆ angulos mais baixas, o que corresponde a uma melhor resolu¸c˜ ao em frequˆ encia, por´ em, em rela¸c˜ ao ao tempo possui um comprimento mais longo, correspondendo a uma resolu¸c˜ ao menor. O inverso acontece para as altas frequˆ encias, que possuem uma resolu¸c˜ ao menor na frequˆ encia e maior no tempo. Esta caracter´ıstica ´ e importante no estudo de sinais, uma vez que os sinais de baixa frequˆ encia caracterizam o comportamento deste sinal, enquanto os sinais de alta frequˆ encia nos fornecem seus detalhes(PERCIVAL; WALDEN, 2000). Nesta tese optamos pelo uso das transformadas wavelets para a segmenta¸c˜ ao do disco ´ otico (DO) devido a sua melhor separa¸c˜ ao de altas e baixas frequˆ encias, pois nosso objetivo era uma melhor an´ alise nas baixas frequˆ encias que distinguem a regi˜ ao do DO.

Figura 4: Diagramas de plano tempo-frequˆ encia de STFT e wavelets .

2.4 Morfologia Matem´ atica

A palavra morfologia ´ e um termo relacionado ` a forma e estrutura. Em vis˜ ao com-

putacional, o termo morfologia pode ser usado para se referir a forma de uma regi˜ ao

da imagem. As opera¸c˜ oes de morfologia matem´ atica foram originalmente definidas como

opera¸c˜ oes de conjuntos e se mostraram ´ uteis no processamento de conjuntos de pontos em

duas dimens˜ oes, como s˜ ao representadas as imagens (SHAPIRO; STOCKMAN, 2001).

(32)

Morfologia Matem´ atica fornece uma estrat´ egia para o processamento de imagens ba- seado em formas e contornos. Suas opera¸c˜ oes tˆ em a propriedade de, quando utilizada apropriadamente, simplificar os dados da imagem preservando as caracter´ısticas essenci- ais de sua forma e eliminando irrelevˆ ancias.

A linguagem da morfologia matem´ atica ´ e baseada na Teoria de Conjuntos. Conjun- tos em morfologia matem´ atica representam as formas que s˜ ao representadas em formato bin´ ario ou tons de cinza. O conjunto de todos os pixels pretos em uma imagem em preto e branco (ou imagem bin´ aria) constitui uma completa descri¸c˜ ao dessa imagem bin´ aria (HA- RALICK; STERNBERG, 1987).

Os exemplos demonstrados a seguir, mais geom´ etricos, foram extra´ıdos de (SNY- DER; QI, 2010). Abordagens apresentando morfologia matem´ atica, com maior rigor matem´ atico, podem ser encontradas em (PEDRINI; SCHWARTZ, 2007) e (GONZALEZ;

WOODS, 2006).

1. Dilata¸c˜ ao. Consideremos duas imagens f _A e f _B e sejam A e B os conjuntos de pares ordenados, consistindo das coordenadas de cada pixel em primeiro plano em f A e f B , respectivamente. Considere um pixel em f _B , e seu correspondente par ordenado de B, que chamamos de elemento b ∈ B . Assim podemos definir Dilata¸c˜ ao de A por B como A ⊕ B = {a + b|(a ∈ A, b ∈ B} que vem a ser o mesmo que a uni˜ ao de todas as transla¸c˜ oes de A. Esta opera¸c˜ ao pode ser expressa pela Equa¸c˜ ao 2.20.

A ⊕ B = [

b∈B

A _b (2.20)

Figura 5: Ilustra¸c˜ ao das imagens A e B

(33)

Figura 6: Exemplo de Dilata¸c˜ ao

2. Eros˜ ao. A Eros˜ ao pode ser definida como o inverso da Dilata¸c˜ ao na forma de:

A B = {a|(a + b) ∈ A para cada (a ∈ A, b ∈ B}. (2.21)

A Equa¸c˜ ao 2.21 pode ser expressa em termo de transla¸c˜ oes:

A B = \

b∈B

A b . (2.22)

3. Abertura e Fechamento. Derivadas das opera¸c˜ oes de Dilata¸c˜ ao e Eros˜ ao, acima men- cionadas, existem duas outras opera¸c˜ oes importantes na an´ alise de imagens. A abertura de A por B ´ e definida em (PEDRINI; SCHWARTZ, 2007) por

A B = (A B) ⊕ B, (2.23)

que pode ser interpretado geometricamente como a uni˜ ao de todas as transla¸c˜ oes de B que est˜ ao contidas na imagem A.

O fechamento de A por B, expresso por

A B = (A ⊕ B) B, (2.24)

que pode ser interpretada geometricamente como a uni˜ ao de todas as transla¸c˜ oes de B que n˜ ao est˜ ao contidas em A.

Analisando as equa¸c˜ oes 2.23 e 2.24 se pode perceber que a abertura de A por B ´ e

(34)

simplesmente a eros˜ ao de A por B, seguida de uma dilata¸c˜ ao do resultado por B, enquanto o fechamento de A por B ´ e a dilata¸c˜ ao de A por B, seguida por uma eros˜ ao do resultado por B .

Na pr´ atica, dilata¸c˜ oes e eros˜ oes s˜ ao frequentemente aplicados ao pares. Seja a di- lata¸c˜ ao de uma imagem seguida pela eros˜ ao do resultado dilatado , ou a eros˜ ao de uma imagem seguida pela dilata¸c˜ ao. Em qualquer caso, o resultado de dilata¸c˜ oes e eros˜ oes sequencialmente aplicadas ´ e a elimina¸c˜ ao de um detalhe espec´ıfico da imagem, menor que o elemento estruturante sem a distor¸c˜ ao global das caracter´ısticas remanescentes. Por exemplo, aplicando uma abertura em uma imagem com um elemento estruturante em forma de disco suaviza os contornos ou picos e elimina pequenas ilhas. Por outro lado, aplicando fechamento em uma imagem com um elemento estruturante em forma de disco suaviza os contornos

Para ilustrar a aplica¸c˜ ao de morfologia matem´ atica e suas opera¸c˜ oes de dilata¸c˜ ao e eros˜ ao como foi utilizada neste trabalho, demonstramos de forma esquem´ atica a remo¸c˜ ao de componentes indesej´ aveis em uma imagem. Suponhamos que as imagens mostradas na Figura 7 sejam dois vasos pr´ oximos, quase paralelos, dos quais desejamos remover a

´

area indesej´ avel de ru´ıdo que os une. Em A vemos a imagem original com o ru´ıdo. Em B a imagem ap´ os a execu¸c˜ ao de eros˜ ao, quando foi removido o ru´ıdo. E finalmente em C a imagem ´ e reconstitu´ıda, agora sem o ru´ıdo, atrav´ es de uma dilata¸c˜ ao.

Figura 7: Exemplo esquem´ atico de aplica¸c˜ ao de morfologia matem´ atica. Em A vˆ e-se a imagem original, com ru´ıdo. O resultado da eros˜ ao est´ a em B. E C mostra a imagem ap´ os a aplica¸c˜ ao de dilata¸c˜ ao

2.5 Espa¸ cos de Escalas e Filtragem com Hessianas

No mundo f´ısico, uma propriedade inerente a todos os objetos ´ e que eles apenas fazem

sentido, enquanto uma entidade, quando analisados dentro de uma determinada faixa de

escalas. Um exemplo did´ atico cl´ assico ´ e o do galho de uma ´ arvore, cuja observa¸c˜ ao faz

sentido apenas em uma escala entre poucos cent´ımetros a, no m´ aximo, alguns metros.

(35)

A an´ alise desse objeto perderia completamente o sentido a uma escala em n´ıveis de, por exemplo, nanˆ ometros ou quilˆ ometros. No n´ıvel de escala de nanˆ ometros faria mais sentido analisar as mol´ eculas que comp˜ oem o caule e as folhas da ´ arvore, enquanto na escala de quilˆ ometros ´ e poss´ıvel apenas a an´ alise da floresta em que a ´ arvore se localiza (LINDE- BERG, 1998).

A teoria do Espa¸co de Escalas ´ e um arcabou¸co concebido para a representa¸c˜ ao de uma imagem, ou um sinal, em m´ ultiplas escalas, ou aberturas (WITKIN, 1983). Sua motiva¸c˜ ao vem da semelhan¸ca com os campos receptores do sistema visual humano e tem como objetivo a representa¸c˜ ao de um objeto em m´ ultiplas escalas simultaneamente, obe- decendo certos axiomas como linearidade, invariˆ ancia de deslocamento espacial, isotropia e invariˆ ancia de escala (FLORACK et al., 1992).

Com base na teoria do espa¸co de escalas (KOENDERINK, 1984) e (FRANGI et al., 1998) desenvolveram uma abordagem multiescala para o uso dos autovalores da matriz Hessiana para determinar localmente a probabilidade de um pixel ser considerado, ou n˜ ao, parte de um vaso sangu´ıneo. Esta abordagem concebe o realce dos vasos como um processo de filtragem que busca estruturas geom´ etricas que possam ser consideradas de formato tubular.

O princ´ıpio ´ e que, dado um ponto x 0 em uma imagem, se expande a aproxima¸c˜ ao na vizinhan¸ca da estrutura, at´ e a segunda ordem, em uma S´ erie de Taylor como mostrado na Equa¸c˜ ao 2.25:

L(x ₀ + δx ₀ , s) ≈ L(x ₀ + x ₀ , s) + δx ^T ₀ ∆ _0,s + δx ^T ₀ H _0,s δx ₀ (2.25) onde ∆ _0,s ´ e o vetor gradiente, computado em x ₀ na escala s e H representa a matriz Hessiana, uma matrix 2x2 contendo a segunda derivada parcial de uma fun¸c˜ ao, aqui re- presentada pela Equa¸c˜ ao (2.26), neste caso aplicada em uma imagem 2D I (x, y). A matriz Hessiana cont´ em tamb´ em toda a informa¸c˜ ao necess´ aria para extrair contraste e dire¸c˜ ao de um pixel da imagem pela obten¸c˜ ao de seus autovalores e dire¸c˜ ao dos autovetores.

H(x, y) =







∂ ² I

∂x ²

∂ ² I

∂x∂y

∂ ² I

∂x∂y

∂ ² I

∂y ²







(2.26)

Assim como uma matriz representando uma imagem I , a Hessiana tamb´ em ´ e uma

(36)

fun¸c˜ ao discreta e pode ser aproximada por uma fun¸c˜ ao cont´ınua usando o filtro Gaussiano bidimensional, expresso por

G(x, y) = e

− 1 2 ⁽

x ² σ ₁ ² ⁺

y ²

σ ₂ ² ⁾ (2.27)

onde σ 1 e σ 2 correspondem aos valores de desvio padr˜ ao de x e y na imagem I(x, y), res- pectivamente e tamb´ em atrav´ es da propriedade de diferencia¸c˜ ao de convolu¸c˜ ao conforme

H(x, y) ≈ G ∗







∂ ² I

∂x ²

∂ ² I

∂x∂y

∂ ² I

∂x∂y

∂ ² I

∂y ²







=







∂ ² G

∂x ²

∂ ² G

∂x∂y

∂ ² G

∂x∂y

∂ ² G

∂y ²







∗ I(x, y), (2.28)

onde G ´ e o filtro Gaussiano da Equa¸c˜ ao (2.27), ∗ ´ e o s´ımbolo matem´ atico da opera¸c˜ ao de convolu¸c˜ ao, ∂ e ∂ ² correspondem a primeira e segunda derivadas de x e y na imagem I(x, y).

A decomposi¸c˜ ao dos autovalores da Hessiana nos fornece trˆ es eixos ortonormais que s˜ ao invariantes a um fator de escala quando mapeado pela matriz Hessiana. Neste caso, uma vizinhan¸ca esf´ erica centrada em x ₀ , com raio 1, ser´ a mapeada pela Hessiana H ₀ em um elipsoide cujos eixos correspondem ` as dire¸c˜ oes dadas pelos autovetores da Hessiana e os correspondentes semi-eixos s˜ ao as magnitudes dos respectivos autovalores. Localmente, esta elipsoide descreve a estrutura de segunda ordem e por isso ´ e aqui chamada de elipsoide de segunda ordem e est´ a esquematizada na Figura 8.

Figura 8: Esquema da elipsoide de segunda ordem e seus autovalores λ _x (FRANGI et al.,

1998)

(37)

Sejam |λ ₁ | ≤ |λ ₂ | dois autovalores calculados da matriz Hessiana e sejam u ₁ e u ₂ os correspondentes autovetores.

Uma vez que |λ ₁ | ´ e o valor de menor magnitude, ele corresponde ao vetor u ₁ apontando na dire¸c˜ ao de menor curvatura, e |λ 2 | corresponde ao autovetor u 2 apontando na dire¸c˜ ao de maior curvatura.

Em termos de vasos sangu´ıneos, de formato tubular, isto significa que u 1 ´ e paralelo ao eixo longitudinal do vaso, e |λ ₁ | ∼ = 0 enquanto u ₂ ´ e paralelo ao eixo radial.

Com a obten¸c˜ ao desses valores, duas medidas foram criadas para avaliar a anisotropia e o contraste do pixel, s˜ ao baseados na elipsoide de segunda ordem. Essas medidas s˜ ao calculadas pelas seguintes equa¸c˜ oes:

R a = Maior Se¸c˜ ao Transversal/π

(Maior Semi-Eixo ) ² = |λ ₁ |

|λ ₂ | e (2.29)

R _b = Volume/(4π / 3)

(Maior Se¸c˜ ao Transversal / π)

³²

= p

|λ ₁ | ² + |λ ₂ | ² . (2.30)

Na Equa¸c˜ ao (2.29), R _a ´ e a medida de limiar do filtro que indica estruturas planas, mas n˜ ao distingue entre estruturas lineares e estruturas em forma de disco, enquanto na Equa¸c˜ ao 2.30, o valor de R _b ´ e essencial para distinguir as estruturas em forma de disco das estruturas em forma de linha (FRANGI et al., 1998).

A Tabela 1 mostra os poss´ıveis padr˜ oes assumidos pela combina¸c˜ ao dos valores ordena- dos dos autovalores ordenados pelos valores absolutos ( |λ ₁ | < |λ ₂ |) para uma imagem 2D, como considerada neste trabalho. Cada autovalor pode assumir um valor mais alto (Alto, na tabela), mais baixo ( Baixo, na tabela) ou ru´ıdos randˆ omicos infinitesimais (Ru´ıdo).

Os sinais + e − indicam o sinal dos autovalor.

Tabela 1: Poss´ıveis padr˜ oes em 2D para autovalores λ _k (FRANGI et al., 1998).

Autovalores

λ ₁ λ ₂ Padr˜ ao de Orienta¸c˜ ao

Ru´ıdo Ru´ıdo Ruido, sem uma dire¸c˜ ao preferida Baixo Alto- Estrutura tubular clara em rela¸c˜ ao ao fundo Baixo Alto+ Estrutura tubular escura em rela¸c˜ ao ao fundo Alto- Alto- Estrutura de um blob claro em rela¸c˜ ao ao fundo Alto+ Alto+ Estrutura de um blob escuro em rela¸c˜ ao ao fundo

Durante o processo de classifica¸c˜ ao de um dado pixel, quanto menor R _a maior a

(38)

probabilidade deste pixel ser considerado parte de um vaso. R _b ser´ a baixo se ambos autovalores s˜ ao pequenos pela falta de contraste, de forma que quanto maior for R b maior ser´ a a probabilidade do pixel ser considerado parte de um vaso uma vez que esta rela¸c˜ ao denota uma maior se¸c˜ ao transversal do elipsoide.

Para imagens em que os vasos tˆ em uma tonalidade mais clara que o fundo da imagem, o que significa que esses vasos s˜ ao representados como vales, a curvatura ser´ a negativa e, portanto, obteremos λ ₂ < 0, como mostrada na Tabela 1.

Essas conclus˜ oes conduziram ao desenvolvimento de uma fun¸c˜ ao de probabilidade

tamb´ em conhecida com vesselness equation em cada escala s, mostrada na Equa¸c˜ ao (2.31) (FRANGI et al., 1998):

V ₀ (s) =



 

 

0 se λ ₂ > 0 exp

− R ² _a

2α ² 1 − exp

− R ² _b 2β ²

caso contr´ ario (2.31) onde α e β s˜ ao limiares que controlam a sensibilidade do filtro de linha para as medidas R _a e R _b .

Neste documento, λ _k representa o autovalor de k-´ esima menor magnitude ( |λ ₁ | <

|λ ₂ | < |λ ₃ |).

2.6 Algoritmos Gen´ eticos

Como descrito na se¸c˜ ao 2.5, o algoritmo de filtro Gaussiano em escalas baseado em Hessianas requer pelo menos cinco parˆ ametros, como sumarizado a Tabela 2.

Tabela 2: Tabela of parˆ ametros de filtro baseado em Hessianas.

Parˆ ametro Descri¸c˜ ao do Parˆ ametro

Sigma Inicial Desvio Padr˜ ao Inicial σ

Incremento de Sigma Valor do incremento ao σ em cada escala Quantidade de Incrementos de Sigmas N´ umero de escalas

Frangi Alpha ( α ) Limiar para Sensibilidade do filtro Frangi Beta ( β ) Limiar para Sensibilidade do filtro

Uma pesquisa emp´ırica, buscando a melhor combina¸c˜ ao de parˆ ametros para aplicar no

algoritmo para segmentar imagens retinais seria uma tarefa tediosa e consumiria muito

tempo. Para superar este problema foi utilizado um algoritmo gen´ etico (GA, do inglˆ es

(39)

Genetic Algorithm), que ´ e uma classe de estrat´ egia de busca estoc´ astica modelada nos princ´ıpios de mecanismo evolucion´ ario encontrado na natureza. GA ´ e largamente utilizada em muitas aplica¸c˜ oes, tais como Sistemas de Classifica¸c˜ ao, Teoria dos Jogos, Escalona- mento e Grade Hor´ aria, para citar alguns (ROWE, 2007).

GAs s˜ ao bem conhecidas por serem largamente utilizadas como t´ ecnicas de otimiza¸c˜ ao de problemas que possuam um largo espa¸co de solu¸c˜ oes (MITCHELL, 1998) e muito utilizadas onde uma busca exaustiva por solu¸c˜ oes tˆ em um alto custo computacional.

De forma geral, s˜ ao necess´ arios trˆ es etapas para se executar uma otimiza¸c˜ ao de pro- blema utilizando GA:

1. Definir uma representa¸c˜ ao do genoma. Cada instˆ ancia de um genoma representa uma

´

unica solu¸c˜ ao para o problema. Nesta tese, o genoma foi modelado como uma estrutura de dados composto por uma matriz de n´ umeros inteiros e reais, com suas faixas de valores m´ aximos e m´ınimos. A Tabela 3 mostra os dados atribu´ıdos aos componentes do genoma, o tipo computacional desses dados e a faixa de valores poss´ıveis para cada item do genoma.

Essas faixas de valores foram empiricamente definidas.

Tabela 3: Representa¸c˜ ao de genoma.

Parˆ ametro Tipo de Dado Faixa de valores poss´ıveis

Sigma Inicial Real 0.01 - 1

Incremento de Sigma Real 0.01 - 0.9

Quantidade de Escalas Inteiro 1 - 15

Frangi Alpha ( α ) Inteiro 1 - 32

Frangi Beta ( β ) Inteiro 1 - 32

2. Definir os operadores gen´ eticos. Cada genoma possui pelo menos quatro opera¸c˜ oes b´ asicas: inicializa¸c˜ ao, muta¸c˜ ao, cruzamento e elitismo (MITCHELL, 1998). A inicia- liza¸c˜ ao determina como o genoma ´ e inicializado. Nesta tese, foi definida uma popula¸c˜ ao de 10 indiv´ıduos e vinte gera¸c˜ oes para limitar o processo de evolu¸c˜ ao. H´ a diferentes tipos de GA, tais como simples, estado fixo e incremental, para citar as mais conhecidas, que definem o comportamento do GA durante o processo de evolu¸c˜ ao (GOLDBERG, 1989).

Nesta tese foi adotado o m´ etodo simples, onde a popula¸c˜ ao ´ e aleatoriamente criada e

ent˜ ao, como resultado da sele¸c˜ ao dos indiv´ıduos mais aptos da gera¸c˜ ao pr´ evia, popula¸c˜ oes

inteiramente novas s˜ ao sequencialmente criadas, constituindo as novas gera¸c˜ oes. Durante

o processo, indiv´ıduos s˜ ao acasalados para produzir descendentes para a pr´ oxima gera¸c˜ ao.

(40)

A cada gera¸c˜ ao s˜ ao criados indiv´ıduos que compor˜ ao a pr´ oxima popula¸c˜ ao e os indiv´ıduos menos aptos ser˜ ao retirados de modo a fazer com que a popula¸c˜ ao retorne ao seu tamanho previsto.

A taxa de sobreposi¸c˜ ao das popula¸c˜ oes ´ e definida por uma constante, que representa o percentual de substitui¸c˜ ao a cada gera¸c˜ ao. Os novos indiv´ıduos s˜ ao inseridos antes da exclus˜ ao para garantir que os mais fracos da totalidade sejam eliminados.

A opera¸c˜ ao de elitismo, consiste na passagem de um n´ umero de indiv´ıduos bem adap- tados de uma gera¸c˜ ao para a pr´ oxima, mantendo-os sem modifica¸c˜ oes. Esta opera¸c˜ ao pode causar um impacto positivo no desempenho do GA por garantir que o algoritmo n˜ ao desperdi¸ca tempo buscando solu¸c˜ oes que foram previamente comprovadas como in´ uteis.

Esta tese faz aplica¸c˜ ao dessa funcionalidade.

3. Definir a fun¸c˜ ao objetivo. A fun¸c˜ ao objetivo ϕ(x), ´ e a fun¸c˜ ao que queremos otimizar.

Nesta tese a fun¸c˜ ao objetivo consiste na compara¸c˜ ao entre a segmenta¸c˜ ao manual da imagem retinal e o resultado da segmenta¸c˜ ao obtida pelo filtro Gaussiano em espa¸co de escalas. O resultado desta fun¸c˜ ao ´ e retornado em termos de acur´ acia que queremos otimizar. Para detalhes da determina¸c˜ ao da acur´ acia, por favor referir ` a se¸c˜ ao 5.1

Uma forma esquem´ atica e simplificada do algoritmo (PAULINAS, 2007) ´ e mostrado na Figura. 9.

Iniciar otimiza¸c˜ ao 1.Gerar popula¸c˜ ao aleat´ oria

2.Calcular adapta¸c˜ ao ϕ(x) 3.Selecionar par de cromossomos

4.Formar uma descendˆ encia y

_i

Completo

?

Fim ? 5.Substituir popula¸c˜ ao anterior

Fim de otimiza¸c˜ ao

N˜ ao

Sim N˜ ao

Sim

Figura 9: Fluxograma de algoritmo gen´ etico simples.

(41)

1. A primeira etapa consiste em criar aleatoriamente uma popula¸c˜ ao inicial.

2. Cada elemento da popula¸c˜ ao obtida ´ e submetido como parˆ ametro de entrada para a obten¸c˜ ao da fun¸c˜ ao de adapta¸c˜ ao que, neste caso, corresponde a acur´ acia na segmenta¸c˜ ao dos vasos sangu´ıneos na imagem retinal.

3. Uma vez calculada a fun¸c˜ ao de adapta¸c˜ ao para todos os elementos da popula¸c˜ ao s˜ ao selecionados os dois elementos que obtiveram os melhores resultados, ou seja, uma acur´ acia mais alta na segmenta¸c˜ ao.

4. Os dois elementos mais aptos s˜ ao selecionados para a cria¸c˜ ao de uma nova gera¸c˜ ao que passar´ a pelo mesmo processo, substituindo a gera¸c˜ ao anterior.

5. O processo se repete durante um tempo considerado aceit´ avel, que nesta tese foi de- finida empiricamente como 30 minutos. Ap´ os esse tempo o processo ´ e encerrado e o elemento com melhor resultado na fun¸c˜ ao de adapta¸c˜ ao ´ e selecionado.

Nesta tese, o genoma foi modelado como uma estrutura de cinco vari´ aveis, com uma popula¸c˜ ao de 30 indiv´ıduos e 100 gera¸c˜ oes e uma taxa de cruzamento de 0,6. O resultado da aplica¸c˜ ao do GA foram os parˆ ametros otimizados para imagens do DRIVE e do HRF- DB que s˜ ao mostrados na Tabela 4.

Tabela 4: Valores de parˆ ametros para imagens de DRIVE e HRF-DB.

Parˆ ametro DRIVE HRF-DB

Sigma Inicial 0.957 0.913

Incremento de Sigma 0.413 0.614

Quantidade de Incrementos de Sigmas 10 12

Frangi Alpha ( α ) 3 2

Frangi Beta ( β ) 8 10

SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO

EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO

Luiz Carlos Ferreira Rodrigues

SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS

S˜ ao Paulo

2017

UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO

EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO

Luiz Carlos Ferreira Rodrigues

SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO

WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS

Tese apresentada ao Programa de P´ os-Gradua¸c˜ ao em Engenharia El´ etrica e Computa¸c˜ ao da Universidade Presbiteriana Mackenzie, como requisito parcial ` a obten¸c˜ ao do t´ıtulo de Doutor em Engenharia El´ etrica na ´ Area de Concentra¸c˜ ao em Engenharia de Computa¸c˜ ao.

Orientador: Prof. Dr. Maur´ıcio Marengoni S˜ ao Paulo

2017

R685 Rodrigues, Luiz Carlos Ferreira.

Segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos em ima- gens retinais usando Wavelets, Morfologia Matem´ atica e Fil- tragem Multiescalas baseada em Hessianas / Luiz Carlos Ferreira Rodrigues. - S˜ ao Paulo 2017

75 f. : il., 30 cm.

Bibliografia: f. 70-75.

Tese (Doutorado em Engenharia El´ etrica e Computa¸c˜ ao)- Universidade Presbiteriana Mackenzie, S˜ ao Paulo, 2017.

Prof. Dr. Maur´ıcio Marengoni

1. Imagens retinais. 2. Morfologia Matem´ atica. 3. Wa- velets. 4. Filtros Multiescala. i.T´ıtulo.

CDD 621.3

Aos meus pais, Antonio e Al- tamira (in memorian).

A minha esposa Eunice, pelo

carinho e paciˆ encia .

em todos esses anos.

AGRADECIMENTOS

Ao Prof. Dr. Maur´ıcio Marengoni, minha profunda gratid˜ ao pela orienta¸c˜ ao no de-

senvolvimento deste trabalho e tamb´ em por suas contribui¸c˜ oes, paciˆ encia e corre¸c˜ oes no

decorrer do trabalho. A todo o corpo docente do Programa de P´ os Gradua¸c˜ ao em En-

genharia El´ etrica e de Computa¸c˜ ao da Universidade Presbiteriano Mackenzie. Foi um

grande privil´ egio tˆ e-los como mestres. Aos meus queridos irm˜ aos, Zeca, F´ atima, Carlito

e M´ ario pelo carinho e amizade por toda uma vida. A todos aqueles que , ainda que n˜ ao

citados aqui, contribu´ıram de forma direta ou indireta na elabora¸c˜ ao desta tese com seu

apoio e inspira¸c˜ ao.

RESUMO

´

Palavras-chave: Imagens Retinais, Morfologia Matem´ atica, Wavelets, Filtros

Multiescala.

ABSTRACT

Keywords: Retinal Images, Mathematical Morphology, Wavelets, Multiscale Filter.

LISTA DE FIGURAS

1 Esquema simplificado do olho humano. Adaptado de (UFRJ, 2013) . . . . 23

2 Exemplo de imagem de fundo do olho, ou imagem retinal. Adaptado de (UFRJ, 2013). . . . 24

3 Fun¸c˜ ao Wavelet de Morlet. . . . . 29

4 Diagramas de plano tempo-frequˆ encia de STFT e wavelets . . . . 31

5 Ilustra¸c˜ ao das imagens A e B . . . . 32

6 Exemplo de Dilata¸c˜ ao . . . . 33

7 Exemplo esquem´ atico de aplica¸c˜ ao de morfologia matem´ atica. Em A vˆ e-se a imagem original, com ru´ıdo. O resultado da eros˜ ao est´ a em B. E C mostra a imagem ap´ os a aplica¸c˜ ao de dilata¸c˜ ao . . . . 34

8 Esquema da elipsoide de segunda ordem e seus autovalores λ x (FRANGI et al., 1998) . . . . 36

9 Fluxograma de algoritmo gen´ etico simples. . . . 40

10 Quatro exemplos de segmenta¸c˜ ao bem sucedidas. Extraido de (GIACHETTI; BALLERINI; TRUCCO, 2014) . . . . 43

11 Dois exemplos de falha na segmenta¸c˜ ao. Extraido de (GIACHETTI; BAL- LERINI; TRUCCO, 2014) . . . . 44

12 Ilustra¸c˜ ao do processo de segmenta¸c˜ ao proposto por Joshi et al. Extra´ıdo de (JOSHI; SIVASWAMY; KRISHNADAS, 2011) . . . . 44

13 Ilustra¸c˜ ao dos resultados obtidos pelo m´ etodo de Welfer et al. Extra´ıdo de (WELFER; SCHARCANSKI; MARINHO, 2013) . . . . 45

14 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Fathi et al. A) Imagem original. B) Imagem segmentada. Extra´ıdo de (FATHI; NAGHSH- NILCHI, 2013) . . . . 47

15 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Li et al. Ex- tra´ıdo de (LI et al., 2016) . . . . 48

16 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Chen et al. Extra´ıdo de (CHEN; HUANG; TIAN, 2015) . . . . 48

17 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Zhu et al. Extra´ıdo de (ZHU et al., 2016) . . . . 49

18 Fluxograma da segmenta¸c˜ ao do disco ´ otico. . . . 51

19 Bandas RGB do primeiro registro (acima) e do segundo registro(abaixo). . 51 20 Imagem decomposta e reconstru´ıda em 7 n´ıveis. A) Imagem original. De

na escala de cinza e as arestas que os conectam. . . . 58 27 Ilustra¸c˜ ao do Caminho mais Curto de Dijkstra. O caminho ´ e percorrido do

ponto A para o ponto B . . . . 59 28 Resultado da concatena¸c˜ ao de imagens. Em A, a imagem com poucos falsos

vasos retinais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro ver- melho em(a) . . . . 63 32 (a) Justaposi¸c˜ ao da segmenta¸c˜ ao curvilinear e do filtro baseado em Hessi-

ana. Note os vasos desconectados. (b) Imagem ampliada da regi˜ ao deline- ada pelo quadro vermelho em(a) . . . . 64 33 (a) Resultado final da segmenta¸c˜ ao ap´ os aplica¸c˜ ao de caminho mais curto

para conectar os segmentos aos vasos principais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro vermelho em(a) . . . . 64 34 (a) Registro 8 do banco de imagens HRF. (b) Resultado da segmenta¸c˜ ao

na cor verde, sobreposta a segmenta¸c˜ ao manual em vermelho. . . . . 65

LISTA DE TABELAS

1 Poss´ıveis padr˜ oes em 2D para autovalores λ k (FRANGI et al., 1998). . . . 37

2 Tabela of parˆ ametros de filtro baseado em Hessianas. . . . 38

3 Representa¸c˜ ao de genoma. . . . 39

4 Valores de parˆ ametros para imagens de DRIVE e HRF-DB. . . . 41

5 Parˆ ametros fornecidos pelo Algoritmo Gen´ etico. . . . 54

6 Resultados do M´ etodo na Segmenta¸c˜ ao do DRIVE . . . . 65

7 Compara¸c˜ ao de desempenho com m´ etodos estado da arte no DRIVE. . . . 66

8 Resultados do M´ etodo na Segmenta¸c˜ ao do HRF-DB . . . . 66

9 Compara¸c˜ ao de desempenho com estado da arte no HRF-DB. . . . . 66

10 Compara¸c˜ ao de tempo de computa¸c˜ ao de segmenta¸c˜ ao retinal no DRIVE. . 67

8 Esquema da elipsoide de segunda ordem e seus autovalores λ _x (FRANGI et al., 1998) . . . . 36

1 Poss´ıveis padr˜ oes em 2D para autovalores λ _k (FRANGI et al., 1998). . . . 37

F (µ) transformada de Fourier em fun¸c˜ ao da frequˆ encia µ, p´ agina 24 F ⁻¹ {F (µ)} transformada Inversa de Fourier de F (µ), p´ agina 24

ψ ^∗ complexo conjugado da fun¸c˜ ao wavelet ψ, p´ agina 28

W _ϕ [j ₀ , k] transformada discreta wavelet para fun¸c˜ ao base ϕ , p´ agina 29 W _ψ [j, k] transformada discreta wavelet para fun¸c˜ ao base ψ , p´ agina 29 A ⊕ B dilata¸c˜ ao de A por B, p´ agina 31

x ₀ localiza¸c˜ ao de um ponto em uma imagem, p´ agina 34

∆ _0,s vetor gradiente computado no ponto x ₀ na escala s, p´ agina 34 H(x, y) matriz Hessiana, p´ agina 34

∗ s´ımbolo matem´ atico da opera¸c˜ ao de convolu¸c˜ ao, p´ agina 35 λ ₁ , λ ₂ autovalores da matriz Hessiana, p´ agina 35

∂, ∂ ² primeira e segunda derivadas, p´ agina 35 u ₁ , u ₂ autovetores da matriz Hessiana, p´ agina 35