UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO
EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO
Luiz Carlos Ferreira Rodrigues
SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO
WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS
S˜ ao Paulo
2017
UNIVERSIDADE PRESBITERIANA MACKENZIE PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO
EM ENGENHARIA EL´ ETRICA E COMPUTAC ¸ ˜ AO
Luiz Carlos Ferreira Rodrigues
SEGMENTAC ¸ ˜ AO DE DISCO ´ OTICO E VASOS SANGU´ INEOS EM IMAGENS RETINAIS USANDO
WAVELETS, MORFOLOGIA MATEM ´ ATICA E FILTRAGEM MULTIESCALAS BASEADA EM HESSIANAS
Tese apresentada ao Programa de P´ os-Gradua¸c˜ ao em Engenharia El´ etrica e Computa¸c˜ ao da Universidade Presbiteriana Mackenzie, como requisito parcial ` a obten¸c˜ ao do t´ıtulo de Doutor em Engenharia El´ etrica na ´ Area de Concentra¸c˜ ao em Engenharia de Computa¸c˜ ao.
Orientador: Prof. Dr. Maur´ıcio Marengoni S˜ ao Paulo
2017
R685 Rodrigues, Luiz Carlos Ferreira.
Segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos em ima- gens retinais usando Wavelets, Morfologia Matem´ atica e Fil- tragem Multiescalas baseada em Hessianas / Luiz Carlos Ferreira Rodrigues. - S˜ ao Paulo 2017
75 f. : il., 30 cm.
Bibliografia: f. 70-75.
Tese (Doutorado em Engenharia El´ etrica e Computa¸c˜ ao)- Universidade Presbiteriana Mackenzie, S˜ ao Paulo, 2017.
Prof. Dr. Maur´ıcio Marengoni
1. Imagens retinais. 2. Morfologia Matem´ atica. 3. Wa- velets. 4. Filtros Multiescala. i.T´ıtulo.
CDD 621.3
Aos meus pais, Antonio e Al- tamira (in memorian).
A minha esposa Eunice, pelo
carinho e paciˆ encia .
em todos esses anos.
AGRADECIMENTOS
Ao Prof. Dr. Maur´ıcio Marengoni, minha profunda gratid˜ ao pela orienta¸c˜ ao no de-
senvolvimento deste trabalho e tamb´ em por suas contribui¸c˜ oes, paciˆ encia e corre¸c˜ oes no
decorrer do trabalho. A todo o corpo docente do Programa de P´ os Gradua¸c˜ ao em En-
genharia El´ etrica e de Computa¸c˜ ao da Universidade Presbiteriano Mackenzie. Foi um
grande privil´ egio tˆ e-los como mestres. Aos meus queridos irm˜ aos, Zeca, F´ atima, Carlito
e M´ ario pelo carinho e amizade por toda uma vida. A todos aqueles que , ainda que n˜ ao
citados aqui, contribu´ıram de forma direta ou indireta na elabora¸c˜ ao desta tese com seu
apoio e inspira¸c˜ ao.
RESUMO
A importˆ ancia de um acurado e precoce diagn´ ostico de doen¸cas retinais tem motivado o desenvolvimento de t´ ecnicas de vis˜ ao computacional necess´ arias para uma completa ava- lia¸c˜ ao autom´ atica das condi¸c˜ oes do sistema retinal. Nesta tese, apresentamos um novo algoritmo que aplica transformadas wavelets e morfologia matem´ atica na detec¸c˜ ao do disco
´
otico e exploramos as caracter´ısticas tubulares dos vasos sangu´ıneos em espa¸co de escalas Gaussianas para segmentar veias e art´ erias. O disco ´ otico e a estrutura vascular s˜ ao essen- ciais para a an´ alise da imagem retinal. Em vez de usar tentativas emp´ıricas para escolher os melhores parˆ ametros para segmenta¸c˜ ao de vasos, foi utilizado algoritmo gen´ etico (GA) e suas sequˆ encias de gera¸c˜ oes e cruzamentos. Entretanto, a t´ ecnica de explorar as carac- ter´ısticas tubulares dos vasos chega ao seu limite quando os vasos s˜ ao representados por sequˆ encias curvil´ıneas e n˜ ao cont´ınuas de 1 pixel de largura. Para superar essa limita¸c˜ ao, foi criada uma nova metodologia baseada no algoritmo de Steger para segmentar uma estrutura curvil´ınea de duas dimens˜ oes que n˜ ao s˜ ao alcan¸cadas pelo detector de vasos em espa¸co de escalas. O detector de estrutura curvil´ınea ir´ a identificar e anexar as linhas aos vasos principais usando o algoritmo de caminho mais curto de Dijkstra, completando a segmenta¸c˜ ao de vasos grossos e finos. O m´ etodo proposto foi desenvolvido e testado sobre duas bases de imagens abertas e gratuitamente dispon´ıveis: DRIVE (Digital Retinal Images for Vessel Extraction) que cont´ em 40 imagens retinais anotadas e sobre HRF-DB (High Resolution Fundus Image Database ) que cont´ em 45 imagens anotadas. Os resulta- dos experimentais do m´ etodo s˜ ao demonstrados e exibem uma acur´ acia m´ edia de 0.9503 no banco de imagens DRIVE e 0.9445 no HRF-DB. Tais n´ıveis de acur´ acia est˜ ao pr´ oximos ao estado da arte, que s˜ ao mais complexos e requerem um, ocasionalmente dois, m´ odulos de pr´ e-processamento, enquanto este m´ etodo n˜ ao requer pr´ e ou p´ os processamento. O m´ etodo desenvolvido possui um tempo m´ edio de processamento, para cada imagem, de 35 segundos e for desenvolvido em um processador Intel Core i5-3320, CPU de 2.60 GHz com 8 GB de RAM.
Palavras-chave: Imagens Retinais, Morfologia Matem´ atica, Wavelets, Filtros
Multiescala.
ABSTRACT
The importance of an accurate and early diagnosis of retinal diseases has motivated the development of vision techniques necessary for a complete automatic evaluation of the retinal system conditions. In this thesis, we present a new algorithm that applies wavelet transform and mathematical morphology for optical disc detection and explore the blood vessels tubular characteristics in Gaussian scale space to segment veins and arteries. Optic disc and the vascular structure are essential for the analysis of the retinal image. Instead of using empirical attempts to choose the best parameters for vessel detection, genetic algorithm (GA) and its sequences of generations and intersections are used. However, the technique of exploring vessel tubular characteristics reaches its limit when vessels are represented by curvilinear sequences and not continuous 1 pixel wide. To overcome this limitation, a new methodology based on the Steger algorithm for segmenting curvilinear structure was created for the vessels not reached by the detector in scale space. The curvilinear detector will identify and attach the lines to the main vessels using the shortest path algorithm developed by Dijkstra, completing the segmentation of wide and thin vessels. The proposed method was developed and tested on two freely available open image databases: DRIVE (Digital Retinal Images for Vessel Extraction) containing 40 annotated retinal images and HRF-DB (High Resolution Fundus Image Database ) that contains 45 annotated images. The experimental results of the method are demonstrated and exhibit an average accuracy of 0.9503 in the DRIVE image database and 0.9445 in the HRF-DB. Such levels of accuracy are close to the state of the art, which are more complex and require one, occasionally two, preprocessing modules, while this method does not require pre or post processing. The developed method has an average processing time, for each image, of 35 seconds and was implemented in a Intel Core i5-3320 processor, 2.60 GHz CPU with 8 GB of RAM.
Keywords: Retinal Images, Mathematical Morphology, Wavelets, Multiscale Filter.
LISTA DE FIGURAS
1 Esquema simplificado do olho humano. Adaptado de (UFRJ, 2013) . . . . 23
2 Exemplo de imagem de fundo do olho, ou imagem retinal. Adaptado de (UFRJ, 2013). . . . 24
3 Fun¸c˜ ao Wavelet de Morlet. . . . . 29
4 Diagramas de plano tempo-frequˆ encia de STFT e wavelets . . . . 31
5 Ilustra¸c˜ ao das imagens A e B . . . . 32
6 Exemplo de Dilata¸c˜ ao . . . . 33
7 Exemplo esquem´ atico de aplica¸c˜ ao de morfologia matem´ atica. Em A vˆ e-se a imagem original, com ru´ıdo. O resultado da eros˜ ao est´ a em B. E C mostra a imagem ap´ os a aplica¸c˜ ao de dilata¸c˜ ao . . . . 34
8 Esquema da elipsoide de segunda ordem e seus autovalores λ x (FRANGI et al., 1998) . . . . 36
9 Fluxograma de algoritmo gen´ etico simples. . . . 40
10 Quatro exemplos de segmenta¸c˜ ao bem sucedidas. Extraido de (GIACHETTI; BALLERINI; TRUCCO, 2014) . . . . 43
11 Dois exemplos de falha na segmenta¸c˜ ao. Extraido de (GIACHETTI; BAL- LERINI; TRUCCO, 2014) . . . . 44
12 Ilustra¸c˜ ao do processo de segmenta¸c˜ ao proposto por Joshi et al. Extra´ıdo de (JOSHI; SIVASWAMY; KRISHNADAS, 2011) . . . . 44
13 Ilustra¸c˜ ao dos resultados obtidos pelo m´ etodo de Welfer et al. Extra´ıdo de (WELFER; SCHARCANSKI; MARINHO, 2013) . . . . 45
14 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Fathi et al. A) Imagem original. B) Imagem segmentada. Extra´ıdo de (FATHI; NAGHSH- NILCHI, 2013) . . . . 47
15 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Li et al. Ex- tra´ıdo de (LI et al., 2016) . . . . 48
16 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Chen et al. Extra´ıdo de (CHEN; HUANG; TIAN, 2015) . . . . 48
17 Resultado da segmenta¸c˜ ao obtido pelo m´ etodo proposto por Zhu et al. Extra´ıdo de (ZHU et al., 2016) . . . . 49
18 Fluxograma da segmenta¸c˜ ao do disco ´ otico. . . . 51
19 Bandas RGB do primeiro registro (acima) e do segundo registro(abaixo). . 51 20 Imagem decomposta e reconstru´ıda em 7 n´ıveis. A) Imagem original. De
B a F) Reconstru¸c˜ ao das imagens por transformada wavelet Haar. G) Quinto n´ıvel de reconstru¸c˜ ao, onde o DO mais se destaca. H) Sexto n´ıvel de reconstru¸c˜ ao onde n˜ ao se distingue mais o DO. . . . 53 21 Exemplos de distribui¸c˜ ao de pixels de registros do DRIVE. . . . 54 22 Diagrama esquem´ atico mostrando as etapas da segmenta¸c˜ ao de vasos retinais. 55 23 Imagem original(A). Segmenta¸c˜ ao pelo especialista humano(B) Segmenta¸c˜ ao
com poucos Falsos Positivos(C). Segmenta¸c˜ ao com muitos Falsos Positi- vos(D). . . . 56 24 Resultado da esqueletoniza¸c˜ ao pelo algoritmo de Steger. . . . 56 25 Resultado da Rotulagem de Componentes Conexos. . . . 57 26 Ilustra¸c˜ ao da montagem do grafo tendo Pixels como v´ ertices, seus valores
na escala de cinza e as arestas que os conectam. . . . 58 27 Ilustra¸c˜ ao do Caminho mais Curto de Dijkstra. O caminho ´ e percorrido do
ponto A para o ponto B . . . . 59 28 Resultado da concatena¸c˜ ao de imagens. Em A, a imagem com poucos falsos
positivos. Em B, o resultado da lineariza¸c˜ ao pelo algoritmo de Steger. Em C, imagem resultante da concatena¸c˜ ao das imagens A e B. . . . 59 29 Dois exemplos de DO corretamente determinados. . . . 62 30 Imagem de DO patol´ ogico n˜ ao identificado pelo algoritmo. . . . 62 31 (a) Exemplo de cores rotuladas mostrando as estruturas curvilineares dos
vasos retinais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro ver- melho em(a) . . . . 63 32 (a) Justaposi¸c˜ ao da segmenta¸c˜ ao curvilinear e do filtro baseado em Hessi-
ana. Note os vasos desconectados. (b) Imagem ampliada da regi˜ ao deline- ada pelo quadro vermelho em(a) . . . . 64 33 (a) Resultado final da segmenta¸c˜ ao ap´ os aplica¸c˜ ao de caminho mais curto
para conectar os segmentos aos vasos principais. (b) Imagem ampliada da regi˜ ao delineada pelo quadro vermelho em(a) . . . . 64 34 (a) Registro 8 do banco de imagens HRF. (b) Resultado da segmenta¸c˜ ao
na cor verde, sobreposta a segmenta¸c˜ ao manual em vermelho. . . . . 65
LISTA DE TABELAS
1 Poss´ıveis padr˜ oes em 2D para autovalores λ k (FRANGI et al., 1998). . . . 37
2 Tabela of parˆ ametros de filtro baseado em Hessianas. . . . 38
3 Representa¸c˜ ao de genoma. . . . 39
4 Valores de parˆ ametros para imagens de DRIVE e HRF-DB. . . . 41
5 Parˆ ametros fornecidos pelo Algoritmo Gen´ etico. . . . 54
6 Resultados do M´ etodo na Segmenta¸c˜ ao do DRIVE . . . . 65
7 Compara¸c˜ ao de desempenho com m´ etodos estado da arte no DRIVE. . . . 66
8 Resultados do M´ etodo na Segmenta¸c˜ ao do HRF-DB . . . . 66
9 Compara¸c˜ ao de desempenho com estado da arte no HRF-DB. . . . . 66
10 Compara¸c˜ ao de tempo de computa¸c˜ ao de segmenta¸c˜ ao retinal no DRIVE. . 67
LISTA DE SIGLAS
AVC Acidente Vascular Cerebral AVR Atrial Venular Ratio
CHT Circular Hough Transform CWT Continuous Wavelet Transform
DO Disco ´ Otico
DR Diabetic Retinopathy
DRIVE Digital Retinal Images for Vessel Extraction DWT Discrete Wavelet Transform
FN False Negative FOV Field of Vision FP False Positive
GA Genetic Algorithm
GPU Graphics Processing Unit
HRF-DB High Resolution Fundus Image Database
MA Microaneurisma
ROC Retinopathy On Line Challenge ROI Region Of Interest
SLIC Simple Linear Iterative Clustering STFT Short Time Fourier Transform SVM Support Vector Machine
TCA Total Classification Accuracy
TN True Negative
TP True Positive
WT Wavelet Transform
LISTA DE S´ IMBOLOS
f(t) fun¸c˜ ao real cont´ınua da vari´ avel t, p´ agina 24
µ componente de frequˆ encia na transformada de Fourier, p´ agina 24 f(x, y) fun¸c˜ ao real cont´ınua das vari´ aveis x e y, p´ agina 24
F{f (t)} transformada de Fourier de f (t), p´ agina 24 F{f (x, y)} transformada de Fourier de f (x, y), p´ agina 24
F (µ) transformada de Fourier em fun¸c˜ ao da frequˆ encia µ, p´ agina 24 F −1 {F (µ)} transformada Inversa de Fourier de F (µ), p´ agina 24
ψ fun¸c˜ ao base wavelet, p´ agina 27 π 3,141592653589793, p´ agina 28 e 2,718281828459045, p´ agina 28
W (a, b) transformada wavelet cont´ınua, p´ agina 28
ψ ∗ complexo conjugado da fun¸c˜ ao wavelet ψ, p´ agina 28
x conjunto de N amostras de um sinal x[m](m = 0, 1.., N − 1) , p´ agina 29 j n´ıvel (´ındice) para escalas de wavelet, p´ agina 29
W ϕ [j 0 , k] transformada discreta wavelet para fun¸c˜ ao base ϕ , p´ agina 29 W ψ [j, k] transformada discreta wavelet para fun¸c˜ ao base ψ , p´ agina 29 A ⊕ B dilata¸c˜ ao de A por B, p´ agina 31
A B eros˜ ao de A por B, p´ agina 32 A B abertura de A por B, p´ agina 32 A B fechamento de A por B, p´ agina 32
x 0 localiza¸c˜ ao de um ponto em uma imagem, p´ agina 34
s n´ıvel (´ındice) para escalas Gaussianas, p´ agina 34
∆ 0,s vetor gradiente computado no ponto x 0 na escala s, p´ agina 34 H(x, y) matriz Hessiana, p´ agina 34
I(x, y) representa¸c˜ ao de imagem 2D, p´ agina 34 σ desvio padr˜ ao, p´ agina 34
G(x, y) filtro Gaussiano bidimensional, p´ agina 34
∗ s´ımbolo matem´ atico da opera¸c˜ ao de convolu¸c˜ ao, p´ agina 35 λ 1 , λ 2 autovalores da matriz Hessiana, p´ agina 35
∂, ∂ 2 primeira e segunda derivadas, p´ agina 35 u 1 , u 2 autovetores da matriz Hessiana, p´ agina 35
R a , R b limiares de sensibilidade do filtro Frangi, p´ agina 36
α parˆ ametro alpha no algoritmo de Frangi, p´ agina 37
β parˆ ametro beta no algoritmo de Frangi, p´ agina 37
Sum´ ario
1 INTRODUC ¸ ˜ AO 18
1.1 Caracteriza¸c˜ ao do Problema . . . . 18
1.2 Motiva¸c˜ ao . . . . 18
1.3 Objetivos e Contribui¸c˜ oes . . . . 19
1.4 Organiza¸c˜ ao do Texto . . . . 21
2 CONCEITOS RELACIONADOS E FUNDAMENTOS TE ´ ORICOS 22 2.1 Fisiologia do Olho Humano . . . . 22
2.2 A Retina Humana . . . . 22
2.3 Transformadas Wavelets . . . . 23
2.3.1 A Transformada de Fourier . . . . 24
2.3.2 A Transformada de Fourier de Tempo-Curto . . . . 26
2.3.3 A Transformada Wavelet . . . . 27
2.3.4 A Transformada Discreta Wavelet . . . . 29
2.4 Morfologia Matem´ atica . . . . 31
2.5 Espa¸cos de Escalas e Filtragem com Hessianas . . . . 34
2.6 Algoritmos Gen´ eticos . . . . 38
3 TRABALHOS RELACIONADOS 42 3.1 Trabalhos sobre a Segmenta¸c˜ ao do Disco ´ Otico . . . . 42
3.2 Trabalhos sobre a Segmenta¸c˜ ao do Vasos Sangu´ıneos . . . . 46
4 MATERIAL E M´ ETODOS 50 4.1 Segmenta¸c˜ ao do Disco ´ Otico . . . . 50
4.2 Segmenta¸c˜ ao de Vasos Sangu´ıneos . . . . 53
5 TESTES E RESULTADOS OBTIDOS 60 5.1 M´ etodo de Avalia¸c˜ ao de Desempenho dos Algoritmos. . . . 60
5.2 Avalia¸c˜ ao da Segmenta¸c˜ ao de Disco ´ Otico. . . . 61
5.3 Avalia¸c˜ ao da Segmenta¸c˜ ao de Vasos Sangu´ıneos . . . . 63
6 CONCLUS ˜ OES FINAIS E TRABALHOS FUTUROS 68
REFERˆ ENCIAS BIBLIOGR ´ AFICAS 75
1 INTRODUC ¸ ˜ AO
1.1 Caracteriza¸ c˜ ao do Problema
A Organiza¸c˜ ao Mundial da Sa´ ude (OMS), estima que existam 285 milh˜ oes de pessoas com alguma deficiˆ encia visual em todo o mundo: entre essas pessoas, 39 milh˜ oes s˜ ao cegas e 246 milh˜ oes tˆ em, de alguma forma e em algum grau, a sua capacidade visual reduzida.
Cerca de 90% dos deficientes visuais, em todo o mundo, vivem em pa´ıses de baixa renda, sendo que 82% das pessoas cegas est˜ ao em idade acima dos 50 anos e 80% de toda inca- pacidade visual pode ser prevenida ou curada (World Health Organization, 2017). Dessas estat´ısticas citadas acima, depreende-se claramente a importˆ ancia de um diagn´ ostico pre- coce e acurado na preven¸c˜ ao e tratamento de doen¸cas que afetam a capacidade visual e que pode salvar a vis˜ ao, e at´ e mesmo a vida, de milh˜ oes de pessoas.
Entretanto, para que sejam desenvolvidas aplica¸c˜ oes que auxiliem no diagn´ ostico, an- tes, ´ e fundamental o desenvolvimento de eficientes e acurados m´ etodos de an´ alise das imagens retinais, com aplica¸c˜ ao de t´ ecnicas matem´ aticas e computacionais que segmen- tem as imagens do disco ´ otico e dos vasos e art´ erias retinais, para posterior an´ alise por aplica¸c˜ oes de diagn´ ostico. Dada a natureza da imagem retinal, essa tarefa de segmenta¸c˜ ao das imagens ainda ´ e um desafio para cientistas e pesquisadores.
1.2 Motiva¸ c˜ ao
O crescente desenvolvimento de t´ ecnicas de an´ alise de imagens retinais e a mais recente compreens˜ ao dos significados cl´ınicos das altera¸c˜ oes retinais impelem o desenvolvimento de medi¸c˜ ao do calibre vascular retinal para associa¸c˜ ao com patologias vasculares (IKRAM et al., 2013). Durante anos recentes, a an´ alise automatizada de imagens retinais tem se tornado um largo campo de pesquisa devido aos avan¸cos nas t´ ecnicas de vis˜ ao computacio- nal, e a aquisi¸c˜ ao de imagens tˆ em aberto grandes possibilidades para estudar a patogˆ enese de um grande n´ umero de doen¸cas. O crescente interesse ´ e devido, mas n˜ ao exclusivamente, a v´ arios fatores delineados abaixo (ROSSANT et al., 2011):
1. O fundo do olho ´ e a ´ unica regi˜ ao do corpo humano onde se pode visualizar os vasos sangu´ıneos de uma maneira natural e n˜ ao-invasiva.
2. Imagens retinais n˜ ao s˜ ao dispendiosas para produzir, distribuir e processar.
3. Mudan¸cas no diˆ ametro e tortuosidade de veias e art´ erias da retina s˜ ao fortes e confi´ aveis indicadores de patologias tais como diabetes, hipertens˜ ao arterial e altos n´ıveis de coles- terol.
Adicionalmente, m´ etodos autom´ aticos de an´ alise de imagem retinal podem ter um impacto econˆ omico e social por possibilitar que exames sejam executados rapidamente em um grande n´ umero de imagens, tornando os exames mais baratos, poupando tempo e recursos humanos e ainda oferecendo mais m´ etricas quantitativas que as t´ ecnicas que envolvem exclusivamente observa¸c˜ oes por humanos.
1.3 Objetivos e Contribui¸ c˜ oes
Ambos, disco ´ otico e estrutura vascular, s˜ ao referˆ encias para registro de imagem e s˜ ao essenciais para qualquer m´ etodo de an´ alise de imagens retinais. Nesta tese ´ e proposto um novo algoritmo baseado em wavelets e morfologia matem´ atica para detec¸c˜ ao do disco
´
otico. Tamb´ em s˜ ao exploradas as caracter´ısticas tubulares dos vasos sangu´ıneos para segmentar vasos e art´ erias retinais (HUANG; ZENG, 2015). Para efetuar a segmenta¸c˜ ao de vasos e art´ erias retinais ´ e utilizado o filtro descrito por Frangi et al. (FRANGI et al., 1998).
Quando aplicada sobre uma imagem decomposta em espa¸co de escalas, o filtro requer cinco parˆ ametros: um desvio padr˜ ao inicial (σ), um valor de incremento para este desvio padr˜ ao, o n´ umero de escalas e dois limiares para a sensibilidade do filtro. Estes cinco parˆ ametros controlam a resposta do filtro; portanto, devem ser selecionados parˆ ametros adequados para a obten¸c˜ ao da maior acur´ acia poss´ıvel. Em vez de executar tentativas emp´ıricas para obter os melhores parˆ ametros, foi utilizado um algoritmo gen´ etico (GA) e suas sequˆ encias de gera¸c˜ oes e cruzamentos de genomas para determinar os melhores valores de parˆ ametros.
Entretanto, a t´ ecnica de explora¸c˜ ao das caracter´ısticas tubulares dos vasos atinge
seu limite quando esses vasos s˜ ao representados por linhas sinuosas e n˜ ao-cont´ınuas que
possuem apenas 1 pixel de largura. Para superar essa limita¸c˜ ao, adotamos o algoritmo
proposto por Steger para segmentar estruturas curvilineares de duas dimens˜ oes (STEGER,
1998). O objetivo deste detector curvilinear ´ e de segmentar as linhas sinuosas, que ser˜ ao
anexadas aos vasos principais atrav´ es do algoritmo de caminho mais curto, proposto
por Dijkstra (DIJKSTRA, 1959), que far´ a a integra¸c˜ ao dos vasos de maior e de menor diˆ ametro.
O desempenho e a robustez do m´ etodo desenvolvido nesta tese foram testados em dois bancos de imagens retinais disponibilizados de forma p´ ublica e gratuita:
1. DRIVE (Digital Retinal Images for Vessel Extraction) ´ e um banco de imagens publica- mente dispon´ıvel que cont´ em 40 imagens anotadas de fundo de olho, dividida igualmente em subconjuntos de treinamento e testes (STAAL et al., 2004). Uma segmenta¸c˜ ao ma- nual da estrutura vascular, feita por um especialista, est´ a dispon´ıvel para cada imagem do conjunto de treinamento, enquanto para o conjunto de testes est˜ ao dispon´ıveis duas seg- menta¸c˜ oes feitas por dois especialistas: a primeira segmenta¸c˜ ao deve ser usada como gold standard e a segunda pode ser usada como marca de referˆ encia para os algoritmos pro- postos, comparando-os com aqueles anotados por um observador humano independente.
Para cada imagem ´ e fornecida uma imagem bin´ aria representando a regi˜ ao de interesse, com um diˆ ametro de 650 pixels.
2. HRF-DB (High-Resolution Fundus Image Database) ´ e um banco de imagens publi- camente dispon´ıvel que cont´ em 45 imagens retinais (ODSTRCILIK et al., 2013). Para cada imagem, uma segmenta¸c˜ ao manual est´ a dispon´ıvel, assim como uma imagem bin´ aria representando a regi˜ ao de interesse, com um diˆ ametro de 1015 pixels. As imagens est˜ ao igualmente agrupadas em sub-conjuntos de imagens: saud´ aveis, com retinopatia diab´ etica e com glaucoma.
A fotografia retinal exige a utiliza¸c˜ ao de um sistema ´ otico, chamado cˆ amera de fundo,
uma luz de baixa potˆ encia anexada a uma cˆ amara capaz de simultaneamente iluminar
e capturar a imagem do fundo do globo ocular, chamada de retina. Os resultados apre-
sentados nesta tese demonstram uma melhora no desempenho, e acur´ acia muito pr´ oxima
aos m´ etodos estado da arte recentemente publicados. Comparado a outros trabalhos, o
modelo proposto tem v´ arias vantagens: reduzida complexidade e ausˆ encia de exigˆ encia de
pr´ e-processamento ou pr´ e-tratamento de imagens. Adicionalmente, o tempo de proces-
samento do sistema ´ e consideravelmente menor que aqueles demonstrados em trabalhos
recentemente publicados como, por exemplo em (LI et al., 2016) e (Qian Zhao et al.,
2014).
1.4 Organiza¸ c˜ ao do Texto
O Cap´ıtulo 1 cont´ em uma apresenta¸c˜ ao inicial, onde se descreve o problema que o trabalho desenvolvido nesta tese se prop˜ oe a resolver, bem como as premissas, sociais e econˆ omicas, que motivam o desenvolvimento de um trabalho desta natureza. Tamb´ em descrevemos as contribui¸c˜ oes deixadas pelo desenvolvimento do algoritmo que criamos para a segmenta¸c˜ ao de vasos e art´ erias retinais, quando comparado a outros trabalhos, no estado da arte, recentemente publicados.
O Cap´ıtulo 2 traz os conceitos relacionados aos fundamentos desta tese. Neste cap´ıtulo s˜ ao apresentados detalhes sobre o olho humano, objeto de estudo desta tese, e as t´ ecnicas matem´ aticas e computacionais utilizadas na segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos.
S˜ ao apresentadas as ferramentas matem´ aticas como transformadas wavelets, transformada de Fourier, morfologia matem´ atica, espa¸co de escalas e filtragem por Hessianas e algorit- mos gen´ eticos.
O Cap´ıtulo 3 apresenta um panorama do est´ agio atual de pesquisa na ´ area de seg- menta¸c˜ ao de imagens retinais. Neste cap´ıtulo apresentamos trabalhos considerados estado da arte, publicados na ´ area de segmenta¸c˜ ao de disco ´ otico e vasos sangu´ıneos, as metodo- logias adotadas por seus autores e resultados obtidos nesses trabalhos Resultados esses, que juntamente com outros listados na bibliografia, servem de referˆ encia aos fundamentos e objetivos da tese aqui apresentada.
O Cap´ıtulo 4 descreve em detalhes as atividades do desenvolvimento do projeto, dis- correndo sobre a etapa de pr´ e-processamento de imagens para a segmenta¸c˜ ao de disco
´
otico e a segmenta¸c˜ ao de vasos sangu´ıneos.
No Cap´ıtulo 5 s˜ ao apresentadas as m´ etricas utilizadas na avalia¸c˜ ao do algoritmos proposto e na compara¸c˜ ao com outros trabalhos referenciados. ´ E feita uma avalia¸c˜ ao qualitativa da segmenta¸c˜ ao do disco ´ otico, uma vez que n˜ ao est´ a dispon´ıvel uma base de imagens anotadas. O desempenho da segmenta¸c˜ ao dos vasos sangu´ıneos ´ e quantitativa- mente avaliado e comparado com outros trabalhos publicados.
O Cap´ıtulo 6 apresenta as considera¸c˜ oes finais e as possibilidades de extens˜ ao desta pesquisa para aprimoramento e aux´ılio no diagn´ ostico de doen¸cas retinais, atrav´ es do desenvolvimento de trabalhos futuros .
Referˆ encias Bibliogr´ aficas cont´ em a listagem da bibliografia utilizada nesta tese.
2 CONCEITOS RELACIONADOS E FUNDAMEN- TOS TE ´ ORICOS
Est cap´ıtulo descreve algoritmos e t´ ecnicas matem´ aticas e computacionais que tem como objetivo a segmenta¸c˜ ao de vasos e art´ erias representados em imagens retinais. Para melhor compreens˜ ao do objeto do estudo, as imagens retinais, neste cap´ıtulo descreve- mos, de forma sucinta, a estrutura do interior do globo ocular humano, sua arquitetura, funcionalidade, caracter´ısticas deste importante ´ org˜ ao do corpo humano e que motivam o desenvolvimento de pesquisas sobre imagens extra´ıdas de fundo do olho por estudantes, pesquisadores e cientistas em todo o mundo. Continuando no cap´ıtulo, s˜ ao discutidas as teorias matem´ aticas que fundamentam o estudo desenvolvido nesta tese. Aqui ser˜ ao expostos, de forma resumida, os conceitos matem´ aticos das transformadas wavelets e de Fourier, morfologia matem´ atica, espa¸co de escalas Gaussianas e algoritmos gen´ eticos.
Dada a extens˜ ao dos assuntos abordados, mais detalhes podem ser obtidos na bibliografia referenciada.
2.1 Fisiologia do Olho Humano
O olho humano ´ e uma esfera cheia de fluido envolvida por trˆ es camadas de tecido.
O tecido mais externo ´ e composto pela escler´ otica e a c´ ornea. A camada do meio inclui a ´ıris, o corpo ciliar e a coroide. A ´ıris cont´ em dois conjuntos de m´ usculos controlando o diˆ ametro da pupila. O corpo ciliar envolve as lentes e cont´ em uma musculatura que ajusta seu poder refrativo. A cor´ oide ´ e um leito capilar que suporta os fotoreceptores. A camada mais interior ´ e a retina contendo os fotoreceptores (DAVSON, 1980).
A caminho da retina a luz, sucessivamente, atravessa a c´ ornea, o humor aquoso, um l´ıquido claro e aguado dentro da cˆ amara anterior que regula a press˜ ao intraocular, as lentes e o humor vitreous, uma substancia gelatinosa que d´ a forma e tamanho ao globo ocular (DAVSON, 1980).
2.2 A Retina Humana
A retina ´ e a parte do olho sens´ıvel ` a luz, tamb´ em chamada de fundo de olho, que
cont´ em milh˜ oes de c´ elulas fotossens´ıveis chamadas de cones e de bastonetes. Os cones
Figura 1: Esquema simplificado do olho humano. Adaptado de (UFRJ, 2013) .
e bastonetes transformam energia luminosa em impulsos nervosos que, atrav´ es do nervo
´
otico, s˜ ao interpretados pelo c´ erebro (RECORDS, 1979).
No fundo do olho, pr´ oximo ao centro, h´ a uma pequena depress˜ ao, onde existem apenas cones, que ´ e chamada de f´ ovea, vis´ıvel nas Figuras 1 e 2 . ´ E na f´ ovea que a imagem se forma com maior nitidez. O eixo que liga a pupila ` a f´ ovea ´ e conhecido como eixo ´ otico.
Os impulsos nervosos s˜ ao transmitidos para o c´ erebro atrav´ es do nervo ´ otico. Como a regi˜ ao por onde ele sai da retina n˜ ao possui cones ou bastonetes, nenhuma imagem ´ e processada ali. Por este motivo, essa regi˜ ao ´ e conhecida como ponto cego. Este ponto pode ser visto na Figura 2, como a regi˜ ao mais clara da imagem que ´ e conhecida como disco ´ otico. Por essa regi˜ ao, entram no disco ´ otico os vasos sangu´ıneos que abastecem a retina (RECORDS, 1979).
O padr˜ ao de distribui¸c˜ ao desses vasos ´ e ´ unico para cada pessoa, sendo t˜ ao complexo que at´ e gˆ emeos idˆ enticos n˜ ao possuem a mesma configura¸c˜ ao. Al´ em disso, ele n˜ ao muda durante toda vida do indiv´ıduo, exceto em caso de mutila¸c˜ ao ou condi¸c˜ oes m´ edicas que alterem o olho de alguma forma. Na Figura 2, s˜ ao vis´ıveis a distribui¸c˜ ao dos vasos sangu´ıneos, a f´ ovea e o nervo ´ otico circundado pelo disco ´ otico (RECORDS, 1979).
2.3 Transformadas Wavelets
Em termos matem´ aticos, uma transformada ´ e uma t´ ecnica de mapeamento entre o con-
junto dom´ınio e o conjunto imagem de uma fun¸c˜ ao. As transformadas possuem um papel
de grande importˆ ancia no processamento de sinais, de modo geral, e de imagens de modo
Figura 2: Exemplo de imagem de fundo do olho, ou imagem retinal. Adaptado de (UFRJ, 2013).
particular. Frequentemente, esses sinais e imagens s˜ ao melhor analisados quando observa- dos em diferentes dom´ınios. Existe um grande n´ umero de t´ ecnicas de transforma¸c˜ ao, que podem ser aplicadas a diversas finalidades. Entre elas podemos citar as transformadas de Fourier, de Hartley, do Cosseno, do Seno, de Fourier-Mellin, de Karhunen-Lo` eve e as wavelets (PEDRINI; SCHWARTZ, 2007) Entre os diversos m´ etodos de transforma¸c˜ oes matem´ aticas dispon´ıveis e aplicados ao processamento de imagens, a transformada de Fourier ´ e uma das mais conhecidas. Para que sua utiliza¸c˜ ao seja vi´ avel, ´ e fundamental que uma transformada seja revers´ıvel, por isso as transformadas de Fourier e wavelets foram desenvolvidas sobre fun¸c˜ oes bases ortogonais, permitindo a decomposi¸c˜ ao e a re- constru¸c˜ ao da imagem (FRAZIER, 1999)
A transformada de Fourier utiliza como bases duas fun¸c˜ oes ortogonais (seno e cosseno) para decompor e reconstruir um sinal ou imagem. Nesta se¸c˜ ao, fazemos uma exposi¸c˜ ao das transformadas wavelets, ` a luz da transformada de Fourier e demonstramos que na aplica¸c˜ ao desta tese a transformada de Fourier possui algumas desvantagens, raz˜ oes pelas quais optamos pela aplica¸c˜ ao da transformada aavelet.
2.3.1 A Transformada de Fourier
No s´ eculo XIX, o matem´ atico francˆ es Joseph Fourier demonstrou que qualquer fun¸c˜ ao
peri´ odica pode ser expressa como uma soma de senos e cossenos de diferentes frequˆ encias,
cada soma multiplicada por um diferente coeficiente, no que ´ e hoje conhecido como S´ erie de Fourier. A despeito da complexidade da fun¸c˜ ao, se ela ´ e peri´ odica e satisfaz algumas condi¸c˜ oes matem´ aticas, ela pode ser representada por uma S´ erie de Fourier (BRIGHAM, 1988).
Mesmo fun¸c˜ oes n˜ ao peri´ odicas, mas que tenham uma energia finita, podem ser ex- pressas como uma integral de senos ou cossenos multiplicados por uma fun¸c˜ ao ponderada assumindo o formato de transformada de Fourier. Como uma importante caracter´ıstica, em ambas express˜ oes a fun¸c˜ ao original pode ser completamente reconstru´ıda atrav´ es de um processo inverso, sem perda de informa¸c˜ ao (GONZALEZ; WOODS, 2006). A transfor- mada de Fourier mapeia uma fun¸c˜ ao do dom´ınio do tempo para o dom´ınio da frequˆ encia, onde seu espectro pode ser analisado. O sentido inverso desse processo ´ e chamado trans- forma¸c˜ ao inversa de Fourier, recuperando-se os valores da fun¸c˜ ao no dom´ınio do tempo.
Seja f (t) uma fun¸c˜ ao real cont´ınua da vari´ avel t, a transformada de Fourier de f (t), aqui denotada por F{f (t)}, conforme demonstrado em (GONZALEZ; WOODS, 2006), pode ser expressa por
F{f(t)} = Z +∞
−∞
f (t)e −j2πµt dt, (2.1) onde t representa o tempo, µ a frequˆ encia e j corresponde ` a unidade imagin´ aria √
−1 Como t ´ e integrado, F{f (t)} ´ e uma fun¸c˜ ao apenas de µ e, por praticidade, ela pode ser expressa na forma F{f (t)} = F (µ) o que nos permite reescrevˆ e-la como:
F (µ) = Z +∞
−∞
f (t)e −j2πµt dt. (2.2)
Usando a f´ ormula de Euler, pode-se expandir a Equa¸c˜ ao 2.1 e observar que ela ´ e com- posta pelo produto interno da fun¸c˜ ao f(t) com um conjunto de exponenciais complexas que comp˜ oem uma base ortonormal:
F (µ) = Z +∞
−∞
f (t)[cos(2πµt) − jsen(2πµt)]dt. (2.3) Inversamente, dado F (µ) pode-se obter a transformada inversa de Fourier, expressa por f (t) = F −1 {F (µ)} :
f (t) = Z +∞
−∞
F (µ)e j2πµt dµ. (2.4)
Do acima exposto, pode-se observar que se f (t) pertence aos reais, ent˜ ao a transformada resultante ´ e complexa e que, como mostra a Equa¸c˜ ao 2.3, a transformada de Fourier ´ e uma expans˜ ao de f (t) multiplicada por termos senoidais cujas frequˆ encias s˜ ao determinadas pelos valores de µ, sendo a vari´ avel t apenas integrada. Como a ´ unica vari´ avel al´ em da integra¸c˜ ao ´ e a frequˆ encia, dizemos que a transformada de Fourier mapeia uma fun¸c˜ ao a partir do dom´ınio do tempo t para o dom´ınio da frequˆ encia µ (GONZALEZ; WOODS, 2006).
No campo do processamento de imagens, a transformada de Fourier pode ser apli- cada em sinais bidimensionais, como uma fun¸c˜ ao de duas vari´ aveis f (x, y). Sendo f(x, y) cont´ınua e integr´ avel, ent˜ ao F (u, v) ´ e integr´ avel e a transformada de Fourier e sua respec- tiva inversa podem ser expressas, respectivamente, por :
F (µ, v) =
Z Z +∞
−∞
f(x, y) e −j2π(µx+vy ) dx dy, e (2.5)
F (x, y) =
Z Z +∞
−∞
F (µ, v) e j2π(µx+vy ) dµ dv, (2.6) onde µ e v s˜ ao as vari´ aveis de frequˆ encia e, quando essas equa¸c˜ oes s˜ ao aplicadas a imagens, x e y s˜ ao interpretadas como vari´ aveis cont´ınuas espaciais. Como no caso 1-D, o dom´ınio das vari´ aveis µ e v define o dom´ınio de frequˆ encia cont´ınua (GONZALEZ; WOODS, 2006).
A extens˜ ao da aplica¸c˜ ao da transformada bidirecional sobre imagens digitais pode ser aplicadas sem a necessidade de converter os dados de entrada em um vetor antes da obten¸c˜ ao dos coeficientes de Fourier. A transformada de Fourier e sua inversa s˜ ao mostradas, respectivamente(PEDRINI; SCHWARTZ, 2007):
F (µ, v) = 1 N 2
N −1
X
x=0 N−1
X
y=0
f (x, y) e (
−i2π(µx+vy)N