• Nenhum resultado encontrado

Comparative study on Otsu, EICAMM and level set techniques to automatic segmentation of breast lesions in digital mammography

N/A
N/A
Protected

Academic year: 2021

Share "Comparative study on Otsu, EICAMM and level set techniques to automatic segmentation of breast lesions in digital mammography"

Copied!
5
0
0

Texto

(1)

Comparative study on Otsu, EICAMM and level set

techniques to automatic segmentation of breast

lesions in digital mammography

Karem D. Marcomini

Departamento de Engenharia Elétrica Universidade de São Paulo

São Carlos, Brasil karem.dm@gmail.com

Homero Schiabel

Departamento de Engenharia Elétrica Universidade de São Paulo

São Carlos, Brasil homero@sc.usp.br

Abstract—Mammography is the primary screening technique for early detection of breast malignant neoplastic disease. Computational procedures have been developed to increase the reliability of diagnosis. Segmentation is the step that can result in the success or failure in these systems. In order to study automatic techniques with the highest accurate results, we propose the use of Otsu, level set and Enhanced Independent Component Analysis Mixture Model (EICAMM) segmentation techniques. The evaluation of these techniques occurred through comparative analysis of the image delineated manually by the specialist with those that were automatically obtained by segmentation techniques. The method that proved to be more effective for this database was the level set with the highest overlap rates in relation the image delimited by the specialist, low rates of under-segmentation and over-segmentation. Furthermore, the level set was practically invariant using pre-processing and post-pre-processing.

Keywords—Breast cancer, mammography, image segmentation, Computer Aided-Detection.

I. INTRODUÇÃO

A mamografia é a técnica mais comum usada por radiologistas na análise e diagnóstico de câncer de mama [1]. Devido à alta taxa de incidência dessa anomalia entre as mulheres em todo o mundo e na tentativa de se obter a detecção precoce, a mamografia é recomendada até mesmo para mulheres assintomáticas, pois é capaz de detectar a doença de 3 a 4 anos antes da manifestação dos sintomas, tornando-se o instrumento mais efetivo no diagnóstico precoce.

No entanto, nem todos os cânceres são detectados pela mamografia e alguns são detectados clinicamente após um escaneamento mamográfico negativo. A detecção nesse “intervalo” tem sido associada com diversos fatores incluindo idade mais jovem, status pré-menopausa, alta densidade mamográfica e terapia hormonal [2]. Além disso, distorções na interpretação de lesões suspeitas pelos especialistas resultam em um elevado número de biópsias desnecessárias. Em outras palavras, 65-85% de biópsias na mama são realizadas em massas benignas [3].

Com a finalidade de minimizar esses erros e ajudar na detecção precoce do câncer de mama, sistemas computacionais vêm sendo desenvolvidos como uma ferramenta de auxílio ao diagnóstico [4]. Um sistema de diagnóstico auxiliado por computador (CAD – do inglês: Computer-aided Diagnosis) consiste de um conjunto de ferramentas automáticas ou semi-automáticas desenvolvidas para auxiliar radiologistas na detecção e/ou classificação de anormalidades na mamografia [1].

Intensivos estudos têm sido realizados na área de segmentação de imagens mamográficas, principalmente na identificação de lesões em mamas densas. A segmentação é o estágio mais crítico do processamento dos dados, pois erros ou distorções na representação da lesão podem ocasionar um diagnóstico incorreto. Dessa forma, a precisão do nódulo tende a determinar o sucesso ou fracasso durante a análise – classificação dos dados [5].

Baseado nessas características, propomos nesse trabalho investigar a eficiência de alguns métodos de segmentação propostos na literatura. Para tal finalidade, utilizamos Otsu [6] por ser uma técnica clássica e que é aplicada em diversas finalidades há um longo tempo; EICAMM (Enhanced

Independent Component Analysis Mixture Model) que foi

recentemente proposta por [7] e teve sua aplicação em mamografias estudada por [5]; e, por fim, utilizamos o level set [8], o qual vem sendo amplamente utilizado em alguns estudos atuais na área de segmentação.

II. BASE DE IMAGENS

A base de imagens INbreast foi adquirida no Centro de Mama pertencente ao Centro Hospitalar de São João (CHSJ) em Porto, Portugal, com permissão do Comitê de Ética do Hospital e Comitê Nacional de Proteção de Dados. Para a aquisição das imagens, foi utilizado o equipamento MammoNovation Siemens FFDM (full-field digital mammography), com tamanho de pixel de 70μm e 14 bits de

resolução de contraste. As imagens foram armazenadas em arquivo DICOM. Todas as informações médicas confidenciais foram removidas do arquivo correspondente [9].

(2)

Essa base possui um total de 115 casos de imagens de triagem, diagnóstico e acompanhamento. Porém, foram selecionados apenas imagens que continham algum tipo de lesão e que já tivessem seu contorno delimitado manualmente pelo especialista, cujos dados são fornecidos pela própria INbreast. Assim, foram separadas 51 mamografias, sendo 26 em projeção CC e 25 em MLO. Um especialista definiu as regiões de interesse (ROIs), e como alguns casos continham mais de uma lesão por imagem, obteve-se um total de 58 ROIs para os testes.

III. PROCESSAMENTO DE IMAGENS

Os algoritmos descritos a seguir foram desenvolvidos utilizando o software MATLAB (Matrix Laboratory) versão 8.2 (R2014b). Os testes computacionais foram executados em um computador com processador Intel Core I7-3770, 3.40GHz, 16GB.

A. Pré-Processamento

Um pré-processamento foi desenvolvido para expandir o contraste, principalmente quando os níveis de cinza estão limitados a uma pequena faixa de valores, como é o caso de mamas radiograficamente densas. De acordo com [5], 8 bits são suficientes para representar cada pixel. Além disso, ao reduzir essa faixa de valores, o processamento das etapas seguintes torna-se mais ágil e não interfere na qualidade final da segmentação. Assim, a resolução de contraste foi reduzida de 14 bits para apenas 8 bits. Em seguida, foi realizado um alargamento de contraste de forma que toda a faixa de níveis de cinza fosse abrangida, ou seja, compreender os valores de zero a 255 – conforme a Eq. 1.

Im255(Im_Emin)/(maxmin)

em que, Im_E, min, max e Im representam a imagem de entrada, o valor mínimo e máximo da intensidade de cinza e a imagem final, respectivamente.

E por fim, a equalização da imagem [10] foi aplicada para atenuar ainda mais as diferentes intensidades de níveis de cinza.

B. Segmentação

O principal objetivo do processo de segmentação é particionar uma imagem em regiões que são homogêneas com relação a uma ou mais características. É uma importante ferramenta no processamento de imagens médicas e tem sido útil em muitas aplicações, tornando-se um importante passo para a extração de características e determinação de medidas da imagem [11].

1) Otsu: é um tipo de limiarização global que depende

apenas do valor do nível de cinza da imagem. Esse método é amplamente utilizado por ser simples e efetivo em diversos casos de segmentação. Esse método possui a peculiaridade de se basear inteiramente em cáculos realizados sobre o histograma da imagem e não em propriedades locais de cada

imagem. Além disso, um limiar adequado é selecionado de forma automática e estável por meio de um processo simples e de baixo custo computacional [6].

2) EICAMM: Esse modelo foi desenvolvido por [11] e

aplicado em mamografias por [5]. Essa técnica surgiu com o objetivo de superar algumas limitações do método

Independent Component Analysis Mixture Model (ICAMM).

Trata-se de um algoritmo de agrupamento em que os pontos a serem agrupados são gerados por um processo matemático descrito como uma mistura de classes de densidades de probabilidade k. Desse modo, o objetivo do agrupamento é encontrar os parâmetros de distribuição de cada classe e atribuir a amostra de acordo com a mais alta probabilidade. Nos experimentos com a EICAMM, k = 2 e o número máximo de iterações foi de 400 com limite de erro igual a 0,0001 [5].

3) Level set: foi introduzido para rastrear interfaces e

formas. A ideia central é representar o contorno implícito como o nível zero da função e, assim, minimizar a energia dessa função (Eq. 2).

)) ( ( . ) ( .. ) , 2 , 1

(c c C LenghtC AreainsideC

F  



0(x,y)c12dxdy

0(x,y)c22dxdy (2) em que, o primeiro termo representa a energia dentro de C e o segundo termo a energia fora de C. Também, µ≥0, v≥0, λ1, λ2≥0 são parâmetros fixos, preferencialmente com os seguintes valores v=0, λ1=λ2=1, objetivando a suavidade das bordas.

O level set aplicado nessa pesquisa baseou-se no algoritmo proposto por [12] com a redefinição de alguns parâmetros iniciais, que são: contorno inicial e a quantidade de iterações. O contorno inicial foi definido como sendo um retângulo posicionado na região central da imagem e com dimensão de 60% da quantidade de pixels correspondentes à altura e largura – razão de aspecto. A convergência dos dados varia de acordo com a dimensão da ROI, sendo assim, a quantidade de iterações foi estabelecida a partir do valor médio obtido com a soma da quantidade de pixels referentes a altura e largura da ROI com um fator de ponderação de 0,75 (como exposto na Eq. 3).

Iteracoes0.75(la)/2 (3)

em que, l refere-se a largura da ROI e a à sua altura.

O valor de ponderação foi definido de forma arbitrária, de modo que possibilitasse a convergência mais rápida do mapa de bordas da imagem e revelasse resultado mais preciso no conjunto de imagem em uso.

C. Pós-Processamento

O pós-processamento para a remoção de artefatos e ruídos após a segmentação foi realizado em duas etapas. A primeira (Fase 1 do PP – pós-processamento) delas decorreu do uso de operadores morfológicos de abertura e fechamento [13]. A

(3)

segunda etapa (Fase 2 do PP – pós-processamento) visou a uniformização do objeto segmentado, proveniente da remoção dos pixels desconexos ao objeto de interesse (região com maior área segmentada) e união dos vales internos a região segmentada [14].

D. Extração de Medidas

A fim de fornecer dados quantitativos referente à cada técnica de segmentação utilizada, cada uma delas foi comparada com área resultante da segmentação manual proporcionada por um radiologista, cujos dados de borda estão disponibilizados na base de imagens utilizada. Para isso, foram extraídas as seguintes medidas: medida da área sobreposta

(AOM - area overlap measure), de falta na segmentação (AUM – undersegmentation measure), segmentação excessiva (AVM – oversegmentation measure) e medida combinada (CM – combination measure) [15].

IV. RESULTADOS E DISCUSSÕES

O objetivo desse experimento é avaliar as técnicas de segmentação apresentadas na seção III, assim como verificar se técnicas de pré-processamento e pós-processamento forneceriam dados mais precisos quando comparada a imagem segmentada automaticamente com a delimitada pelo radiologista. Na Fig. 1 são exibidos alguns exemplos de ROIs segmentadas pelas técnicas abordadas.

Fig. 1. Imagens segmentadas automaticamente pela técnica EICAMM. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d) segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento, segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

Fig. 2. Imagens segmentadas automaticamente pela técnica level set. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d) segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento, segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

(a) (b) (c) (d) (e) (f) (g) (h)

(4)

Fig. 3. Imagens segmentadas automaticamente pela técnica de Otsu. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d) segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento, segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

Quanto ao uso do pré-processamento, podemos notar que é imprescindível sua aplicação antecedente a segmentação pela técnica EICAMM, principalmente se tratando de mamas radiograficamente densas. Quando o mesmo não é adotado, o objeto segmentado é apresentado por pontos e não como um objeto que possui contorno contínuo e uniforme. No momento em que as informações adicionais são removidas durante a etapa de pós-processamento a região segmentada desaparece e se mantém na imagem apenas alguns poucos pontos. Esse fato é destacado na Fig. 1 (a-d).

Já quando a segmentação é aplicada sobre a imagem e não há o uso do pós-processamento da informação, pode ocasionar casos mais ruidosos. Isso ocorre tanto no uso da técnica de Otsu quanto na EICAMM (Fig. 1 e Fig. 3 casos (a) e (e)).

Na segmentação por level set, podemos destacar a produção de único e uniforme em todos os casos (Fig. 2).

Para avaliar precisamente as técnicas de segmentação, dados quantitativos foram levantados e os valores médios percentuais obtidos estão apresentados na Tabela 1.

TABLE I. MEDIDAS PARA A AVALIAÇÃO DAS TÉCNICAS AUTOMÁTICAS DE SEGMENTAÇÃO

Processamento Sem pré-processamento

Com pré-processamento

AOM AUM AVM CM AOM AUM AVM CM

EICAMM

Segmentação 64,14 15,43 26,51 74,06 63,74 14,4 27,12 74,07 Segmentação + Fase 2 do PP 68,17 13,29 23,32 77,19 68,24 12,38 22,61 77,75 Segmentação + Fase 1 do PP 60,79 24,97 24,76 70,35 65,3 16,07 24,02 75,07 Segmentada + Fase 1 do PP + Fase 2 do PP 63,41 24,84 21,38 72,40 69,5 14,35 19,33 78,61

Level Set

Segmentação 74,99 6,70 19,96 82,78 74,52 11,76 15,8 82,32 Segmentação + Fase 2 do PP 75,11 6,65 19,86 82,87 74,74 11,68 15,65 82,47 Segmentação + Fase 1 do PP 75,10 6,74 19,79 82,86 74,68 11,87 15,52 82,43 Segmentada + Fase 1 do PP + Fase 2 do PP 75,21 6,71 19,69 82,94 74,85 11,9 15,38 82,55

Otsu

Segmentação 67,18 13,41 23,44 76,78 63,12 13,97 27,39 73,92 Segmentação + Fase 2 do PP 70,21 12,71 19,85 79,22 67,41 12,73 23,26 77,14 Segmentação + Fase 1 do PP 67,45 18,26 18,09 77,04 65,74 18,81 19,98 75,65 Segmentada + Fase 1 do PP + Fase 2 do PP 69,02 18,10 15,67 78,42 68,95 18,57 15,64 78,24

Valor Ideal 100 100 0 0 100 100 0 0

(5)

A técnica EICAMM produziu praticamente os mesmos resultados para a imagem segmentada e limpa com e sem pré-processamento. Porém, quando o pré-processamento, a segmentação e o pós-processamento, o valor de precisão aumentou em torno de 5%, revelando seu melhor resultado após a realização da limpeza do fundo, removendo artefatos e a junção de vales internos – CM igual a 78,61% e menor índice de segmentação excessiva 19,33% (AVM).

Já a segmentação utilizando o método de Otsu foi minimamente superior (valores inferiores a 1%) na ausência de pré-processamento.

E por fim, o level set garantiu maior precisão em relação aos outros dois segmentadores. As medidas permanecem praticamente inalteradas quando utilizamos ou não pré-processamento e pós-pré-processamento. A única diferença é que ao utilizar pré-processamento, o valor percentual de AUM é mais elevado do que quando o mesmo está ausente. Porém, a medida AVM se eleva com a ausência de processamento. Dessa forma, as medidas finais passam a ser equivalentes – CM praticamente constante.

V. CONCLUSÕES

Dentre os segmentadores apresentados, a técnica EICAMM produziu resultados próximos ao método de Otsu. No entanto, o custo computacional da primeira é muito superior, levando em média 4 minutos para processar cada ROI. Esse valor aumenta expressivamente em ROIs de dimensões maiores, podendo atingir um tempo superior a 10 minutos. Esse fator, inviabiliza o uso do método em sistemas computacionais que requerem respostas rápidas.

O algoritmo level set proporcionou maior custo computacional que o de Otsu – o primeiro leva menos de 1 minuto, em média, para processar cada ROI, porém seu valor foi bem inferior a EICAMM. Além disso, foi o método que proporcionou maior precisão na determinação do contorno da lesão, sendo indiferente o uso de pré ou pós-processamento por produzir contornos únicos e suaves. Dessa forma, não há distorção nos limites da lesão. Sendo, portanto, considerado o método mais eficaz na segmentação imagens mamográficas.

AGRADECIMENTOS

À FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) pelo apoio financeiro.

REFERÊNCIAS

[1] A. Oliver, J. Freixenet, J. Martí, E. Pérez, E. Pont, E. R. E. Denton, R. Zwiggelaar, “A review of automatic mass detection and segmentation in mammographic images”, Medical Image Analysis, v. 14, p. 87–110, 2010.

[2] N. F. Boyd, E. Huszti, O. Melnichouk, L. J. Martin, G. Hislop, A. Chiarelli, M. J. Yaffe, S. Minkin, “Mammographic features associated with interval breast cancers in screening programs”, Breast Cancer Research, v. 16, p. 1-9, 2014.

[3] J. L. Jesneck, J. Y. Lo, J. A. Baker, “Breast mass lesions: computer-aided diagnosis models with mammographic and sonographic descriptors”, Radiology, v. 244, n. 2, p. 390-398, 2007.

[4] A. T. Stavros, “New advances in breast ultrasound: computer-aided detection”, Ultrasound Clinics, v. 4, n. 3, p. 285-290, 2009.

[5] P. B. Ribeiro, R. A. F. Romero, P. R. Oliveira, H. Schiabel, L. B. Verços, “Automatic segmentation of breast masses using enhanced ICA mixture model”. Neurocomputing, v. 120, p. 61-71, 2013.

[6] N. Otsu, “A threshold selection method from gray-level histograms”, IEEE Tansaction on System, Man, and Cybernetics, v. 9, n. 1, p. 62-66, jan. 1979.

[7] P. R. Oliveira, R. A. F. Romero, “Improvements on ICA Mixture Models for Image Pre-processing and Segmentation”. Neurocomputing, v. 71, p. 2180-2193, 2008.

[8] S. Osher, J. A. Sethian, “Fronts propagating with curvature dependent speed: algorithms based on Hamilton-Jacobi formulations”, Journal of Computational Physics, v. 79, p. 12-49, 1988.

[9] I. C. Moreira, I. Amaral, I. Domingues, A. Cardoso, M. J. Cardoso, J. S. Cardoso, “INbreast: Toward a full-field digital mammographic database”, Academic Radiology, v. 19, n. 2, p. 236-248, 2012.

[10] E. D. Pisano, S. Zong, B. M. Hemminger, M. Deluca, R. E. Johnston, K. Muller, M. P. Braeuning, S. M. Pizer, “Contrast limited adaptive histogram equalization image processing to improve the detection of simulated spiculations in dense mammograms”. Journal of Digital Imaging, v. 11, n. 4, p. 193-200, nov. 1998.

[11] I. N. Bankman (Ed.), “Handbook of medical image: processing and analysis”, 2 ed. Londres: Academic Press, 2009.

[12] S. Lankton, A. Tannenbaum, “Localizing region-based active contours”, IEEE Transactions on Image Processing, v. 17, n. 11, p. 2029-2039, nov. 2008.

[13] A. F. C. Infantosi, L. M. S. Luz, W. C. A. Pereira, A. V. Alvarenga, “Breast Ultrasound Segmentation Using Morphologic Operators and a Gaussian Function Constraint”. Proc. IFMBE, v. 20, p. 520-523, 2008. [14] K. D. Marcomini, H. Schiabel, “Nodules segmentation in breast

ultrasound using the artificial neural network Self-Organizing Map”. World Congress on Engineering, London, v. 2, p. 1152-1155, 2012. [15] C. Pei, C. Wang, S. Xu, “Segmentation of the breast region in

mammograms using marker-controlled watershed transform”, 2nd International Conference on Information Science and Engineering, Hangzhou, China, Proc. ICISE’2010, p. 2371-2374, dez. 2010.

Referências

Documentos relacionados

A pesquisa pode ser caracterizada como exploratória e experimental em uma primeira etapa (estudo piloto), na qual foram geradas hipóteses e um conjunto de observáveis, variáveis

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Lernaea cyprinacea of Steindachnerina insculpta from Taquari River, municipality of Taquarituba, São Paulo State, Brazil.. Note the hemorrhagic area around the insertion point of

Effects of the bite splint 15-day treatment termination in patients with temporomandibular disorder with a clinical history of sleep bruxism: a longitudinal single-cohort

DATA: 17/out PERÍODO: MATUTINO ( ) VESPERTINO ( X ) NOTURNO ( ) LOCAL: Bloco XXIB - sala 11. Horário Nº Trabalho Título do trabalho

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar

O pressuposto teórico à desconstrução da paisagem, no caso da cidade de Altinópolis, define que os exemplares para essa análise, quer sejam eles materiais e/ou imateriais,

Diante das consequências provocadas pelas intempé- ries climáticas sobre a oferta de cana-de-açúcar para a indústria, a tendência natural é que a produção seja inferior