• Nenhum resultado encontrado

2011.1 TCC JAIZO

N/A
N/A
Protected

Academic year: 2021

Share "2011.1 TCC JAIZO"

Copied!
59
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA – UEFS

Jaízo Araújo Santos Júnior

DESENVOLVIMENTO DE UM SOFTWARE PARA PROCESSAMENTO

DE IMAGENS MAMOGRÁFICAS DIGITALIZADAS PARA DETECÇÃO

DE MICROCALCIFICAÇÕES

FEIRA DE SANTANA 2011

(2)

UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA – UEFS

Jaízo Araújo Santos Júnior

DESENVOLVIMENTO DE UM SOFTWARE PARA PROCESSAMENTO

DE IMAGENS MAMOGRÁFICAS DIGITALIZADAS PARA DETECÇÃO

DE MICROCALCIFICAÇÕES

Orientador: Prof. Dr. Claudio Eduardo Goes

FEIRA DE SANTANA 2011

Trabalho de Conclusão de Curso apresentado ao Colegiado de Engenharia de Computação da Universidade Estadual de Feira de Santana, como parte dos requisitos para obtenção do título de graduação em Engenharia de Computação.

(3)

DEDICATÓRIA

Dedico este trabalho, principalmente, a Jaízo e Ivone, pessoas nas quais tenho o imenso orgulho de chamá-los de pai e mãe e que em nenhum momento mediram esforços para realização dos meus sonhos. Nos momentos difíceis me incentivaram, sempre me mostraram o caminho correto. São vocês que me trazem alegria e inspiração para nunca desistir. Muito obrigado por serem meus pais. Tudo de bom que sou/tenho e um dia vou ter/ser devo e dedico a vocês. AMO VOCÊS.

Dedico também ao meu irmão que sempre me apoio em todos os momentos e sabe mais do que ninguém das dificuldades que passei. Obrigado por todos os momentos ao seu lado, pela amizade sincera, pelo apoio, pelo abraço, por tudo. Tenho muito orgulho de ser seu irmão e amigo.

Dedico a minha namorada Diane, pelo incentivo e por sempre acreditar em mim, por me trazer a felicidade na qual me faz sentir completo, obrigado por todo amor, compreensão e carinho durante todo esse tempo.

Dedico ao grande parceiro, primo e irmão Nilton, pelas conversas, descontrações e pelos sonhos de um futuro bom, acredite que eu acredito em todos estes sonhos, agora vamos lutar por eles.

(4)

AGRADECIMENTOS

Primeiramente a Deus, pela misericórdia, bondade infinita e por todas as bênçãos concedidas, mostrando sempre presente nas horas mais difíceis;

Ao meu orientador Claudio Eduardo Goes, pelo apoio e auxílio para a formação deste trabalho, pela cobrança, direcionamento e incentivo;

Aos meus colegas da Engenharia de Computação da Fainor e UEFS; Aos meus amigos que sempre torceram e acreditaram por minha vitória; A todos os professores do período de graduação;

(5)

RESUMO

O objetivo principal deste projeto foi desenvolver um software que contenha uma técnica para detecção de microcalcificações em imagens de mamogramas digitalizados, auxiliando assim o diagnóstico médico. Foi proposta uma nova técnica para detecção de microcalcificações utilizando um filtro passa banda no domínio da freqüência. Para os testes de detecção foram feitos recortes de regiões de interesse em phantons mamográficos. Também foram aplicados testes em regiões de interesse de mamogramas digitalizados reais. Por fim foi determinada a sensibilidade e especificidade do sistema utilizando curvas ROC. Os resultados mostram-se satisfatório, com uma sensibilidade de 98,2%.

(6)

ABSTRACT

The main objective of this project was to develop a software that contains a technique for microcalcification detection in digitized images of mammograms, thereby assisting medical diagnosis. We proposed a new technique for detection of microcalcifications using a bandpass filter in the frequency domain. For detection tests, clippings of regions of interest was made in mammography phantons. Tests also applied in regions of interest in real digitized mammograms. Finally was determined the system sensitivity and specificity using ROC curves. The results were satisfactory, with a sensitivity of 98.2%.

.

(7)

Lista de Figuras

Figura 1 - Estruturas internas que compõe a mama humana ...14

Figura 2 - Imagens de mamogramas reais com diferentes densidades. (a) mamograma de uma mama considerada densa – mulher com 21 anos de idade; (b) mamograma de uma mama considera não densa – mulher com 67 anos de idade ...15

Figura 3 - Exemplo de microcalcificação (a) mamograma digitalizado. (b) região de interesse (RI) com microcalcificações ...16

Figura 4 - Diagrama esquemático (a) e ilustração real (b) de um aparelho mamográfico ...17

Figura 5 - Compressão crânio caudal ...19

Figura 6 – Compressão médio lateral obliqua ...19

Figura 7 - Esquema de obtenção da imagem no aparelho mamográfico ...20

Figura 8 - Esquema simplificado de um aparelho de mamografia digital ...21

Figura 9 - (a) imagem do simulador mamográfico, (b) o phantom com a numeração das microcalcificações ...23

Figura 10 - Curvas ROC geradas a partir de dois subconjuntos diversos. (a) Área igual a 1,0 e (b) área aproximadamente 0,21 ...25

Figura 11 - (a) Imagem em tons de cinza. (b) Matriz representativa ...26

Figura 12 - Vizinhanças N4(p), ND(p) e N8(p) do pixel p = 0 ...27

Figura 13 - Passos realizados no processamento frequencial de imagens ...30

Figura 14 - Representação de uma imagem (phantom mamográfico) no domínio da freqüência ...30

Figura 15 – Gabarito de Phantom João Emilio com microcalcificações de tamanho 0,45 mm; 0,35 mm; 0,30 mm; 0,25mm e 0,18 mm (esquerda para direita). ...33

Figura 16 – Gabarito de Phantom Victoreen modelo 18-222 com a numeração e o tamanho das suas microcalcificações. ...34

Figura 17 – Gabarito de Phantom Victoreen Modelo 156 contendo microcalcificações numeradas de 7 a 11, de tamanho: 0,54 mm; 0,40 mm; 0,32 mm; 0,24 mm e 0,16 mm. ...34

Figura 18 - (a) Phantom Victoreen modelo 18-222, (b) Phantom João Emilio e (c) Phantom Victoreen Modelo 156 - phantons mamográfico digitalizados. ...35

Figura 19 - (a) Imagem original; (b) Localização das microcalcificações. ...36

Figura 20 - (a) Imagem original; (b) Localização das microcalcificações. ...36

Figura 21 - (a) Imagem original; (b) Localização das microcalcificações. ...36

Figura 22 – Exemplo de recortes de RI com microcalcificações em phantons de mama. ...37

Figura 23 - Exemplo de RI sem microcalcificação em phantom de mama ...37

Figura 24 – Exemplo de regiões de interesse com microcalcificações em mamogramas reais. ...38

Figura 25 – Esquema da técnica detecção de microcalcificações ...39

Figura 26 - (a) Imagem original; (b) Logaritmo do espectro de Fourier da imagem original. .40 Figura 27 - Banda de passagem do filtro para diferentes parâmetros de grande e pequenas estruturas – (a) parâmetros 3 e 2 pixels, (b) 20 e 2 pixels e (c) 20 e 19 pixels...40

Figura 28 - (a) Imagem original; (b) - Imagem com microcalcificações realçadas após aplicação do filtro com parâmetros de 2 pixels para pequenas estruturas e 3 pixels para grandes estruturas. ...41

Figura 29 - (a) Imagem com microcalcificações realçadas após aplicação do filtro; (b) imagem binarizada após aplicação do filtro, em branco as microcalcificações. ...42

Figura 30 - (a) Imagem binarizada com limiar 128; (b) Imagem binarizada com limiar 7000 42 Figura 31 - Forma básica de conexão entre pixels para ser considerado uma estrutura...43

(8)

Figura 33 - Interface gráfica do software desenvolvido ...44

Figura 34 - Imagem processada pela técnica de realce de estruturas. ...45

Figura 35 - Imagem processada após aplicação de threshold ...46

Figura 36 – (a) RI do phantom Victoreen modelo 18-222; (b) RI do phantom João Emilio; (c) RI do phantom Victoreen Modelo 156 ...47

Figura 37 – Estruturas realçadas após aplicação do filtro. ...47

Figura 38 - Curva ROC do processamento com o conjunto de RI’s de imagens de phantons .48 Figura 39 – Imagens binárias correpondente a segmentação das microcalcificações ...49

Figura 40 - Resultado da detecção para RIs sem microcalcificações ...49

Figura 41 - RIs em mamogramas digitalizados reais. ...50

Figura 42 - Resultado do processamento em RIs em mamogramas digitalizados reais . ...51

Figura 43 - Relação de VP x FN na escolha dos parâmetros de grandes e pequenas estruturas para o filtro. (a) caso com aumento do parâmetro de pequenas estruturas; (b) caso com parâmetros ótimos e (c) com aumento do parâmetro de grandes estruturas. ...52

Figura 44 - Relação da diminuição de falsos positivos – Região de interesse referente ao cluster número 13 do Victoreen modelo 18-222. ...53

(9)

Sumário

1. INTRODUÇÃO ...10 2. FUNDAMENTAÇÃO TEÓRICA ...13 2.1. MAMOGRAFIA ...13 2.1.1. ESTRUTURAS MAMÁRIAS ...13 2.1.2. DENSIDADE DA MAMA ...14 2.1.3. MICROCALCIFICAÇÕES...16 2.1.4. APARELHO MAMOGRÁFICO...17 2.1.5. MAMOGRAFIA ...18 2.1.6. EXAME MAMOGRÁFICO ...20 2.1.7. MAMOGRAFIA DIGITAL ...21

2.1.8. SIMULADORES DE MAMAS (PHANTOM DE MAMA) ...22

2.1.9. CURVAS ROC ...23

2.2. PROCESSAMENTO DIGITAL DE IMAGENS ...25

2.2.1. IMAGEM DIGITAL ...25

2.2.2. CONCEITOS FUNDAMENTAIS PARA O PROCESSAMENTO DIGITAL DE IMAGENS ...27

2.2.3. PRÉ-PROCESSAMENTO DE IMAGENS ...29

2.2.4. SEGMENTAÇÃO ...31

3. MATERIAS E MÉTODOS ...33

3.1. TECNOLOGIAS UTILIZADAS...33

3.2. IMAGENS DOS PHANTONS ...33

3.3. DESENVOLVIMENTO DA TÉCNICA DE DETECÇÃO DE MICROCALCIFICAÇÕES ...38

4. RESULTADOS ...44

4.1. SOFTWARE DESENVOLVIDO ...44

4.2. PROCESSAMENTO ...46

4.2.1. REGIÕES DE INTERESSE EM PHANTONS – COM MICROCALCIFICAÇÕES .46 4.2.2. REGIÕES DE INTERESSE EM PHANTONS – SEM MICROCALCIFICAÇÕES ..49

4.2.3. REGIÕES DE INTERESSE EM MAMOGRAMAS DIGITAIS REAIS ...50

5. DISCUSSÕES E ANÁLISE DE RESULTADOS ...52

5.1. DETECÇÃO E DESEMPENHO ...52

6. CONCLUSÕES ...55

6.1. SUGESTÕES PARA TRABALHOS FUTUROS ...56

(10)

1.

INTRODUÇÃO

O câncer de mama é apontado como o segundo tipo de câncer mais ocorrente em todo mundo e com maior índice de mortalidade entre as mulheres, por tanto, representa uma significante porcentagem da mortalidade causada por câncer no mundo inteiro (CHENG et. al., 2003).

As taxas de mortalidade por câncer de mama continuam elevadas, muito provavelmente porque a doença é diagnosticada em estágios avançados. No Brasil, estima-se 49.240 novos casos no ano de 2010 (INCA, 2009). O número de mortes, devido a esse câncer, no ano de 2008 chegou a 11.860, sendo 11.735 mulheres e 125 homens (INCA, 2010).

Apesar do aumento da incidência desse tipo de câncer, pode-se observar nos países mais desenvolvidos há uma redução de 25% a 30% na taxa de mortalidade devido ao câncer de mama. Esse fato pode ser atribuído a implantação de programas de rastreamento mamográfico que proporciona o diagnóstico de tumores ainda em sua fase inicial, com isso, aumenta-se a chance de cura e sobrevida do paciente (BROWN, 2000), (ELMORE et. al., 2003).

Evidências científicas sugerem que o auto-exame das mamas não é eficiente para a detecção precoce e não contribui para a redução da mortalidade por câncer de mama (INCA, 2010). A mamografia (radiografia da mama) permite a detecção precoce do câncer, ao mostrar lesões, muito pequenas, em fase inicial, como nódulos e microcalcificações (medindo microns). A mamografia é realizada em um aparelho de raios-X apropriado, chamado mamógrafo. Neste, a mama é comprimida de forma a fornecer melhores imagens, e, portanto, melhor capacidade de diagnóstico.

Um sinal aparente que revela a existência de câncer de mama é a presença de pequenas estruturas de cálcio conhecidas como microcalcificações. Devido ao seu tamanho reduzido, as microcalcificações apresentam baixo contraste local. A visibilidade dessas estruturas é um problema em exames mamográficos realizados em filme radiológico, onde há grande presença de ruído pelo sistema de registro e pelo processo de digitalização (imagens de mamogramas digitalizados) no caso de armazenamento em computadores (CURRY et. al., 1990).

(11)

Segundo vários autores (SHEN et. al., 1993), as microcalcificações, freqüentemente, estão associadas a tumores de mama. Todavia, devido ao tamanho reduzido destas estruturas, sua visualização é muito difícil e exige grande experiência do examinador e mesmo assim, muitas vezes são passadas desapercebidas, visto que o sistema de raios-X pode apresentar varias limitações que prejudicam a nitidez da imagem.

Para localizar microcalcificações, um radiologista deve analisar atenciosamente imagens mamográficas. Porém, nem sempre essas estruturas são localizadas pelo radiologista. Uma alternativa para melhora da eficácia da analise do exame seria a utilização de algoritmos computacionais de processamento de imagens conhecidos como sistemas computacionais de auxílio ao diagnóstico (CAD – computer-aided diagnosis). Estes algoritmos têm o propósito de detectar automaticamente estruturas que possam estar associadas a tumores nos exames de mamografia, aumentando a taxa de detecção precoce de estruturas de interesse ligadas ao câncer de mama (CHENG et. al., 2003) auxiliando o radiologista em seu diagnóstico.

Vários trabalhos têm sido desenvolvidos até hoje visando o melhoramento da performance de sistemas CAD. Em 2001, Nunes (Nunes, 2001) propôs uma investigação sobre as imagens radiográficas de mamas densas, a partir das quais foram desenvolvidas técnicas de realce de contraste que, somadas a outras técnicas de processamento digital, proporcionaram um desempenho mais apropriado de um esquema de processamento para clusters.

A seguir, Góes em 2002 (Góes, 2002) investigou técnicas de segmentação de imagens digitais e suas características para aplicação em imagens mamográficas objetivando auxiliar a detecção de microcalcificações.

Vieira (Vieira, 2005) investigou o comportamento de equipamentos de rediodiagnóstico em termos da qualidade da imagem produzida e a subseqüente aplicação desses resultados na otimização do desempenho de esquemas CAD.

Em 2008, Romualdo (Romualdo et. al.) desenvolveu uma técnica de pré-processamento para realce de microcalcificações em imagens mamográficas digitalizadas baseada no filtro passa banda do tipo Butterworth no domínio da freqüência, onde os parâmetros para o filtro são obtidos através de especificações de freqüência de corte e largura de banda que define a dimensão das estruturas que deve ser realçadas pelo filtro. Utilizando as técnicas propostas por Goes (2002), Romualdo (Romualdo et. al.) demonstrou melhor performance usando as imagens realçadas pelo filtro proposto.

(12)

Desta forma, a busca contínua de modelos e algoritmos para o processamento de imagens, para melhorar a performance dos sistemas CAD, devem ser uma conduta permanente nas fases de desenvolvimento e de controle de qualidade de tais sistemas.

Sendo assim, o principal objetivo deste trabalho é mostrar toda a teoria e métodos de processamento de imagens utilizados para desenvolver um software que contenha um algoritmo para detecção de microcalcificações em imagens de mamogramas digitalizados para ser utilizado por especialistas em mamografias. O software se propõe a auxiliar o diagnostico médico de mamografias. A ajuda deste software será disponibilizando técnicas de processamento de imagens digitais para realçar e identificar agrupamentos de microcalcificações em regiões de interesse selecionada pelo especialista em mamografia. Para isso foram feito recortes em imagens de phantons mamográficas com estruturas de interesse (microcalcificações) para que sejam utilizados nos testes da técnica de detecção proposta. Para a utilização da técnica e verificação dos resultados foi desenvolvido um software e, por fim, foi determinada a sensibilidade e especificidade utilizando curvas ROC.

Este trabalho está disposto em 8 seções. Na seção 1, da qual faz parte a presente introdução, é apresentado o enquadramento geral do trabalho desenvolvido, bem como as motivações que estiveram na sua origem e os objetivos propostos. Na seção 2 é apresentada a fundamentação teórica, ou seja, todos os conceitos relevantes para confecção deste; nela são apresentados todos os conceitos necessários para entendimento de um exame mamográfico, sua importância e o que procurar na mamografia para prevenção do câncer de mama; nesta seção também são apresentados os conceitos sobre processamento de imagens, necessários para desenvolvimento do trabalho. Na seção 3, tem-se a descrição dos materiais e métodos utilizados, mostrando o conjunto de imagens utilizadas, suas características particulares e, também, a técnica de detecção proposta. Na seção 4, com os resultados obtidos, mostrando o software desenvolvido e suas funcionalidades e os resultados do processamento no conjunto de imagens, posteriormente a seção 5 com a análise dos resultados das imagens processadas e, por fim, a seção 6 com as conclusões de acordo com sobre os resultados obtidos e os objetivos alcançados.

(13)

2.

FUNDAMENTAÇÃO TEÓRICA

2.1.

MAMOGRAFIA

O objeto de estudo nesse trabalho é a mama, suas subestruturas e eventuais moléstias. Portanto é necessária uma descrição desse órgão, para proporcionar um melhor entendimento do trabalho num aspecto geral, além de enfatizar as características gerais das patologias associadas. Como já mencionado anteriormente, a principal forma de auxílio ao diagnóstico médico é através do exame mamográfico, tal ferramenta deve também ser abordada uma vez que é uma das principais responsáveis pela formação da imagem da mama.

Nas subseções a seguir serão descritos os principais aspectos estruturais da mama assim como o detalhamento do exame momográfico, aparelhagem utilizada e estruturas de interesses encontradas nestas imagens.

2.1.1. ESTRUTURAS MAMÁRIAS

Para compreender a formação da imagem mamográfica é interessante entender a composição da mama. Em geral, o tamanho médio de uma mama é de 45 mm comprimida, formada principalmente por tecido adiposo, glandular e fibroso, apresentando uma simetria de forma entre as mamas no exame mamográfico, devendo uma assimetria ser considerada como uma anomalia. Em geral a mama é constituída por: tecido glandular, formado pelos lóbulos e dutos, tecido conjuntivo ou fibroso e tecido adiposo, que preenche os espaços dos demais tecidos.

Na figura 1 é possível observar um diagrama esquemático de uma mama na qual destacam as seguintes estruturas:

Ácino: menor parte da glândula e responsável pela produção do leite durante a lactação;

Lóbulo mamário: conjunto de ácinos;

Lobo mamário: conjunto de lóbulos mamários que se liga à papila através de um ducto;

(14)

Ductos mamários: é um conjunto de 15 a 20 canais, conduzem a secreção até a papila;

Tecido glandular: conjunto de lobos e ductos;

Papila: protuberância elástica onde desembocam os ductos mamários;

Aréola: estrutura central da mama onde se projeta a papila;

Tecido adiposo: todo o restante da mama é preenchido por tecido adiposo ou gorduroso, cuja quantidade varia com as características físicas, estado nutricional e idade da mulher.

Figura 1 - Estruturas internas que compõe a mama humana Fonte: INCA (2010)

2.1.2. DENSIDADE DA MAMA

De acordo com o INCA (2010), as mulheres mais jovens apresentam mamas com maior quantidade de tecido glandular, o que tornam esses órgãos mais densos e firmes. Ao se aproximar da menopausa, o tecido mamário vai se atrofiando, sendo substituído progressivamente por tecido gorduroso, até se constituir, quase que exclusivamente, de

(15)

gordura e resquícios de tecido glandular na fase pós-menopausa. Essas mudanças de características promovem um nítida diferença entre as densidade radiológicas das mamas da mulher jovem e da mulher pós-menopausa como ilustra a figura 2.

(a) (b)

Figura 2 - Imagens de mamogramas reais com diferentes densidades. (a) mamograma de uma mama considerada densa – mulher com 21 anos de idade; (b) mamograma de uma mama considera não densa –

mulher com 67 anos de idade Fonte: Martinez (2007)

Na prática, isso significa um grau mais elevado de dificuldade no processo de averiguação diagnóstica, uma vez que as imagens resultantes do exame mamográfico deverão possuir baixo nível de contraste. Somando-se a esse fato as densidades de massas (nódulos, cistos), calcificações e microcalcificações são muito semelhantes à dos tecidos que compõem a maior parte das mamas densas, o que permite uma “camuflagem” dessas estruturas entre o parênquima mamário.

Além disso, segundo Silva Junior (2009), a mama radiograficamente densa produz mais radiação espalhada, o que aumenta a presença de ruído randômico, possivelmente confundido com as microcalcificações isoladas ou mesmo as agrupadas.

(16)

2.1.3. MICROCALCIFICAÇÕES

Uma das estruturas encontradas na mama são as calcificações. É um achado que corresponde ao sinal mais precoce de malignidade encontrado no rastreamento do câncer de mama (CANELLA, 1999).

Segundo Nappi et. al. (1999), as calcificações são pequenos depósitos de cálcio, difíceis de serem visualizados em imagens mamografias pelo fato do tamanho, geralmente menores que 0,5 mm. Esta estrutura indica a presença de malignidade em 42% das lesões não palpáveis.

Sua classificação pode ser feita de acordo com seu tamanho, forma, densidade, distribuição e quantidade, sendo denominadas por benignas, malignas ou indeterminadas. Quando suspeitas de malignidade devem apresentar-se agrupadas em grande número, mais que 5 por centímetro cúbico (MITCHELL, 1988).

Algumas características radiográficas que levam a suspeita de malignidade:

 microcalcificações de 0,1 a 0,3 mm de diâmetro;

 pouca intensidade;

 formatos irregulares e densidades não uniformes;

 agrupamentos ovais de 2 a 5 mm de diâmetro.

A figura 3 ilustra um mamograma digitalizado com microcalcificações de 3 mm de diâmetro.

Figura 3 - Exemplo de microcalcificação (a) mamograma digitalizado. (b) região de interesse (RI) com microcalcificações

(17)

Segundo Goes (2002), o diagnóstico correto não depende apenas da percepção destas pequenas partículas de cálcio, mas também de interpretações. Somente por uma análise minuciosa dos formatos individuais de cada calcificação e seus clusters é possível diferenciar casos malignos ou suspeitos, ou ainda benignos.

Portanto, a qualidade da imagem é um fator crítico, importantíssimo nos diagnósticos de diferenciações de microcalcificações mamárias.

2.1.4. APARELHO MAMOGRÁFICO

Antigamente as imagens mamográficas eram obtidas através de equipamentos projetados para aquisição de imagens de outros órgãos, como o pulmão. Com o passar do tempo, os aparelhos mamográficos, foram acrescentados ou modificados para que se tornassem adequados para registrar a imagem da mama devido às particularidades radiográficas que compõem a mama, basicamente tecido glandular, tecido fibroso e gordura. Tais tecidos possuem níveis de atenuação aos raios-X muito próximos, o que acarreta um baixo contraste na imagem. O aparelho possui um compartimento de compressão, composto por duas placas de um material rádio transparente, cuja finalidade é obter a menor espessura possível da mama, homogeneizar ao máximo a densidade a ser radiografada e, também, garantir a imobilidade do paciente durante o exame. Na figura 4 pode ser observada a ilustração de um aparelho mamográfico.

(a) (b)

Figura 4 - Diagrama esquemático (a) e ilustração real (b) de um aparelho mamográfico Fonte: http://www.uspar.com.br

(18)

O ponto focal é outro fator de grande importância no aparelho mamográfico, este deve ser bem pequeno para que estruturas pequenas como microcalcificações (estruturas de até 0,3 mm), possam ser visualizadas.

2.1.5. MAMOGRAFIA

A mamografia é um exame semelhante aos demais exames de raios-X, destinada ao diagnostico por imagem das mamas. É muito importante que apresente uma imagem de boa qualidade diagnóstica, com alto contraste e resolução, mas com pequena taxa de ruído, já que o contraste dos diversos tecidos que compõem a mama é baixo. A mamografia é a técnica mais comum de detecção não palpável, utilizada de forma preventiva para o câncer de mama.

A formação da imagem radiográfica é conseqüência da interação de fótons de raios-X com um determinado objeto. Tais fótons atravessam o objeto, sofrendo atenuações, causadas pela absorção no objeto a ser registrado. No tecido, por exemplo, músculos e gorduras absorvem os fótons diferentemente, levando a diferentes níveis de atenuações e conseqüentemente a diferentes intensidades de radiação. Essa diferença possibilita a formação de contraste e com isso possibilitando a identificação de estruturas.

Através da mamografia é permitido à detecção precoce do câncer, por ser capaz de mostrar lesões em fase inicial, muito pequenas (de milímetros de comprimento). Para a realização do exame é necessário comprimir a mama para que o tecido fique distribuído de maneira uniforme. É uma compressão rápida, enquanto os raios-X incidem sobre a mesma. São realizadas duas formas de incidência, o que permite a aquisição de duas imagens em ângulos diferentes, a crânio-caudal, mostrado na figura 5 e a médio lateral obliqua, na figura 6 em cada mama, auxiliando no problema de projeção, isto é, por exemplo, uma fibra perpendicular ao feixe em uma das incidências aparece como um ponto intenso, enquanto na outra não, devido ao ângulo do feixe, A incidência crânio-caudal, tem como objetivo apresentar uma imagem contendo a mama, enquanto a médio lateral oblíqua, mostra também parte do músculo peitoral até a axila, pois é sobre o músculo que a mama encontra-se.

(19)

Figura 5 - Compressão crânio caudal Fonte: Almeida et al. (2007)

Figura 6 – Compressão médio lateral obliqua Fonte: Almeida et al. (2007)

O objetivo da mamografia é a detecção precoce do câncer, ou seja, quando ele ainda não é palpável, mesmo se examinado pelo médico ou através do auto-exame. As descobertas precoces deste tipo de câncer através da mamografia podem proporcionar o aumento das chances de um tratamento bem sucedido.

(20)

2.1.6. EXAME MAMOGRÁFICO

O exame mamográfico inclui quatro aquisições de imagem, que fornecem duas incidências de cada mama: médio lateral oblíqua e uma crânio-caudal. A incidência médio lateral oblíqua é a mais eficaz, pois mostra uma quantidade maior do tecido mamário e inclui estruturas mais profundas, enquanto a crânio-caudal tem como objetivo incluir todo o material póstero-medial, complementando a médio lateral oblíqua (MARQUES 2001).

Santos (2002) afirma que o exame mamográfico é realizado da seguinte forma: o feixe de raios-X é disparado e a imagem é registrada em filme. Após a revelação do filme o radiologista interpreta o mamograma a fim de determinar se nele existe alguma área suspeita. Caso haja necessidade, uma nova mamografia é solicitada com enfoque maior na região de interesse e, caso o médico julgue necessário, uma biópsia é solicitada. A figura 7 ilustra um esquema do aparelho mamográfico durante a realização de um exame.

Figura 7 - Esquema de obtenção da imagem no aparelho mamográfico Fonte: GOES (2002)

Por prevenção, muitas pacientes acabam submetendo-se a biópsias desnecessárias. A diminuição de biópsias desnecessárias é um dos objetivos dos CAD de detecção precoce do câncer de mama, conforme afirma Chan et. al. (1987).

(21)

2.1.7. MAMOGRAFIA DIGITAL

Os mamógrafos digitais começaram a surgir no final da década de 80 (Nishikawa et. AL., 1987). Apenas no ano 2000 foi aprovado o primeiro equipamento mamográfico digital. Consiste em um aparelho muito semelhante ao aparelho do mamógrafo convencional (tubos de raios-X, dispositivo de compressão, etc.), com exceção do sistema de registro, onde o filme e o écran são substituídos por detectores semicondutores sensíveis aos raios-X, conforme figura 8. O processo de aquisição da imagem é feito diretamente pelos detectores, que convertem a radiação recebida em sinal elétrico, este sinal é quantizado e convertido em sinal digital por um conversor analógico-digital (A/D), formando a imagem digital. A resolução do mamógrafo digital é função do tamanho dos detectores, do espaçamento entre eles e da taxa de amostragem do conversor A/D. A resolução de contraste é função da sensibilidade dos sensores e do numero de bits do conversor A/D.

Figura 8 - Esquema simplificado de um aparelho de mamografia digital Fonte: Martinez (2007)

(22)

A mamografia digital oferece vantagens como maior velocidade na realização do exame e melhor qualidade de imagem, particularmente quando as mamas são “densas”, ou seja, têm predomínio do tecido glandular em sua composição.

Com este tipo de mamografia é permitido que a imagem da mama possa ter a sua definição, tamanho, brilho ou contraste controlado, pode-se aplicar algoritmos de rastreamento de estruturas de interesse na prevenção do câncer de mama. Com isso, a mamografia digital dá ao radiologista especializado melhores condições para identificar e interpretar as áreas de densidades anormais ou outras características suspeitas, levando a um diagnóstico mais preciso.

2.1.8. SIMULADORES DE MAMAS (PHANTOM DE MAMA)

Um dos maiores desafios no desenvolvimento de algoritmos de detecção em imagens mamográficas é a avaliação de seu desempenho, pois é necessário verificar a autenticidade do resultado obtido pelo algoritmo.

Sendo assim, é fundamental o conhecimento prévio das informações contidas nas imagens a serem avaliadas pelo sistema para que a precisão diagnóstica seja estabelecida. Normalmente, são utilizadas imagens simuladoras de mamogramas digitais, pois, se a avaliação for feita somente com imagens reais, onde informações relevantes são definidas “empiricamente” por inspeção visual, a acurácia do resultado não pode ser assegurada. Também é considerada a dificuldade de se obter um variado número de imagens mamográficas e seus respectivos laudos de biopsias (MATHEUS; SCHIABEL, 2008). Tais imagens simuladoras são conhecidas como phantons de mama.

A possibilidade de gerar imagens cujos conteúdos sejam plenamente conhecidos é um grande facilitador na avaliação do desempenho de algoritmos de detecção para auxílio ao diagnostico. Contextualizando Oliveira (2005), os phantom de mana têm como principal propósito a simulação da interação do feixe com a mama, objetivando a avaliação da radiação (enegrecimento) e o estudo qualitativo (a definição e o contraste da imagem mamográfica) e quantitativo (caracterização dos achados mamográfica) do desempenho da imagem.

A figura 9(a) mostra a imagem de um phantom e 9(b) o “gabarito” do phantom com a numeração das microcalcificações.

(23)

(a) (b)

Figura 9 - (a) imagem do simulador mamográfico, (b) o phantom com a numeração das microcalcificações Fonte: (a) GOES (2002) (b) Modificada de GOES (2002)

Resumindo, o phantom de mamografia é um objeto teste que simula as características radiográficas dos tecidos da mama comprimidos, e contém componentes que representam anormalidades da mama e câncer na imagem do phantom. Suas funções são determinar adequação do sistema de imagem completo (incluindo processamento do filme) em termos de detecção de achados radiográficos sutis e verificar a reprodutibilidade de características a imagem ao longo do tempo.

2.1.9. CURVAS ROC

Segundo Evans (1981), é um procedimento estatístico que leva em conta o aspecto subjetivo envolvido em um determinado evento. O método que utiliza curvas ROC consiste em comparar a quantidade de certos e erros do sistema em avaliação, de forma que uma representação gráfica possa fornecer uma medida de eficiência (Delamaro e Andrade, 2001). Com isso, obtém-se a avaliação do desempenho de um evento, através da apresentação da relação entre sensibilidade e especificidade.

(24)

Essa metodologia científica foi desenvolvida com bases estatísticas em que a principal característica é a relação percentual de acertos, isto é, situação onde o sistema encontra um evento que de fato existe (verdadeiro-positivo – VP) versus erros, que são representados pela afirmação de existência de estrutura não sendo verdadeira a sua presença (Falso-positivo – FP). Essa análise gera uma representação gráfica do percentual probabilístico de FP em relação à VP. A taxa de VPs é denominado sensibilidade do sistema e a taxa de FPs é chamada de especificidade (Delamaro e Andrade, 2001).

Conforme Delamaro (2001), o traçado de uma curva ROC considera as porcentagens de ocorrência de VP no eixo das ordenadas em função das porcentagens de ocorrência de FP no eixo das abscissas, variando-se valores de corte ao longo do eixo das abscissas. Os valores de corte são valores específicos de um ou mais parâmetros do sistema, dentro de um intervalo. Um dos índices utilizados para medir a eficiência do sistema é a área entre a curva construída e o eixo das abscissas. Em uma situação ideal esta reta seria igual a um, considerando que a taxa de VP seria um para qualquer taxa de FP. Atualmente a curva ROC tornou-se um padrão aceito como medida de eficiência de esquemas CAD e qualidade de imagens médicas.

O ideal para um sistema é que a quantidade de acertos diagnóstico tanto em fatores verdadeiros-positivos quanto em verdadeiros-negativos seja máxima, conceito definido como sensibilidade e especificidade do sistema, respectivamente.

Do ponto de vista da análise das curvas ROC, isso significa que o ponto ótimo da curva é definido pelo extremo superior esquerdo que corresponde à máxima sensibilidade e mínimo número de falsos-positivos, ou seja, máximo índice de verdadeiro-positivo. Consequentemente, quanto mais próxima de 1 (o que equivale a 100%) a área sob a curva melhor o desempenho alcançada pelo sistema (Braga, 2000).

Estes conceitos podem ser observados na figura 10, onde temos duas curvas geradas a partir de diferentes subconjuntos de imagens. Para primeira curva (a) foram processadas 50 imagens para as quais um sistema obteve 100% de acerto, resultando em uma área igual a 1,0. Na segunda curva (b) foram processadas outras 50 imagens que resultaram em uma curva ROC com área aproximada de 0,21, que indica uma péssima performance do sistema testado por Delamaro (2001).

(25)

(a) (b)

Figura 10 - Curvas ROC geradas a partir de dois subconjuntos diversos. (a) Área igual a 1,0 e (b) área aproximadamente 0,21

Fonte: DELAMARO (2001)

2.2.

PROCESSAMENTO DIGITAL DE IMAGENS

O Processamento Digital de Imagens (PDI) consiste em uma área de pesquisa relevante no cenário atual da Computação que visa analisar uma imagem em formato digital e aplicar sobre ela operações para obter uma imagem mais fácil de ser analisada. Seu estudo permite o desenvolvimento de técnicas e procedimentos aplicáveis a diversas áreas, com por exemplo, no contexto deste trabalho, a manipulação de imagens médicas.

Segundo Gonzalez e Woods (2002), o interesse nessa área provém de duas principais aplicações: a melhoria da percepção visual humana de uma imagem e o processamento de imagens para uma percepção autônoma realizada por máquinas.

2.2.1. IMAGEM DIGITAL

Uma imagem digital pode ser definida, geralmente, como uma função f(x,y), onde o valor nas coordenadas x e y correspondem ao brilho (radiância) da imagem nos pontos da coordenada (Gonzalez e Woods, 2002). A imagem digital corresponde à representação numérica do objeto, é uma função quantificada e amostrada, sendo a sua menor unidade

(26)

denominada de pixel (picture element). Na figura 11, é possível visualizar a representação de uma imagem com 256 tons de cinza.

(a) (b)

Figura 11 - (a) Imagem em tons de cinza. (b) Matriz representativa Fonte: Silva (2005)

A coloração de uma imagem pode ser representada segundo vários modelos propostos na literatura. Para imagens coloridas, alguns dos mais comuns são o Red Green e Blue (RGB), o Cian Magenta Yellow e Black (CMYK), Hue Saturation e Intensity (HSI) e o Hue, Saturation e Value (HSV). Para imagens monocromáticas, costuma-se utilizar uma escala com valores mínimos e máximos para a cor presente na imagem, variando o brilho da mesma nos intervalos entre esses valores. Como a natureza das imagens mamográficas analisadas neste trabalho é de imagens em tons de cinza, fica definido que uma imagem digital pode ser vista como uma função bidimensional f(x y), onde x e y são pontos no plano, e a amplitude de f como um par de coordenadas (x,y) denominada intensidade do nível de cinza no determinado ponto da imagem. Quando os valores de x,y e da amplitude f são finitos e discretos, dizemos que esta é uma imagem digital. A área do processamento digital de imagens se refere ao processamento digital de imagens em termos de um computador digital. Perceba que a imagem digital é composta por um número finito de elementos, onde cada qual possui uma localização particular e um valor.

Uma vez que uma imagem digital pode ser tratada como uma função bidimensional f(x,y), ou matriz bidimensional, é possível estabelecer relacionamentos entre seus pixels.

(27)

2.2.2. CONCEITOS FUNDAMENTAIS PARA O PROCESSAMENTO DIGITAL DE IMAGENS

Resolução - Resolução é a habilidade de distinguir pequenos detalhes espaciais. A freqüência espacial na qual uma imagem é mostrada é um bom indicador da sua resolução. A resolução indica quantos pontos ou pixels por polegada existem na imagem. Quanto maior a resolução de uma imagem, maior o seu nível de detalhes, pois menor é o tamanho de cada um de seus pixel, porém, maior o espaço em memória necessário para armazená-la.

Dimensão da Imagem - São as medidas verticais e horizontais de uma imagem expressas em termos de pixel. As dimensões podem ser determinadas pela multiplicação da largura e altura pela quantidade de pontos por polegada (dpi).

Profundidade de Bits - A profundidade de bits é determinada pelo número de bits utilizados para definir cada pixel. Quanto maior a profundidade de bits, maior será o número de tons representados, em escala de cinza.

Vizinhança - Em Gonzalez e Woods (2002) define a vizinhança de um pixel da seguinte forma: seja p um pixel nas coordenadas (x,y). A vizinhança de 4 (ou N4(p)) de um pixel é composta de seus vizinhos na horizontal e na vertical, cujas coordenadas são: (x+1,y), (x-1,y), (x,y+1) e (x,y-1). A vizinhança diagonal (ou ND(p)) de um pixel é constituída por seus vizinhos com coordenadas: (x+1,y+1), (x+1,y-1), (x-1,y+1) e (x-1,y-1). A vizinhança de 8 (ou N8(p)) é um conjunto de todos os pixels vizinhos, ou seja: N4(p) U ND(p). Observe a figura 12.

Figura 12 - Vizinhanças N4(p), ND(p) e N8(p) do pixel p = 0 Fonte: ENECA (2005)

Adjacência - A adjacência, conforme afirma Gonzalez e Woods (2002), é a característica de um par de pixels vizinhos que compartilham uma borda ou um vértice, sendo que:

(28)

o um par de pixels de uma imagem que compartilham uma borda é dito “adjacente de borda” ou “4-adjacente”;

o um par de pixels de uma imagem que compartilham um vértice é dito “adjacente por vértice” ou “4-adjacente”.

Conectividade - É um importante conceito usado para estabelecer bordas de objetos e componentes de regiões de uma imagem. Em Gonzalez e Woods (2002), afirma-se que dois pixels são conectados se:

o são adjacentes e;

o obedecem um critério de similaridade dentro de uma escala de cinza, isto é, seus valores estão dentro de um conjunto pré-estabelecido de valores de cinza.

Seja V = {G1, G2, ..., Gk} o conjunto de “k” valores de cinza usado para definir a conectividade. São definidos três tipos de conectividade:

o Conectividade de 4: dois pixels p e q com valores em V e q contém N4(p); o Conectividade de 8: dois pixels p e q com valores em V e q contém N8(p); o Conectividade-m: dois pixels p e q com valores em V e:

 q contém N4(p) ou

 q contém ND(p) e N4(p) ∩ N4(q) = vazio.

Distância entre pixels - A distância entre pixels é uma importante definição para grande parte dos algoritmos que manipulam a imagem. Conforme citado em Gonzalez e Woods (2002), a distancia d(x,y) geralmente é um valor mensurável e:

o d(x,y) = 0, se x = y; o d(x,y) = d(y,x);

o d(x,y) + d(y,z) ≥ d(x,z).

Há diversas fórmulas empregadas para a definição de distância e atualmente ainda são definidas e adaptadas fórmulas para aplicações específicas. Algumas das métricas mais conhecidas, aplicadas para dois pixels p = (x1,y1) e q = (x2,y2) são:

o distância Euclidiana: d(p,q) = √((x1-y1)2 + (x2-y2)2) o distância “City Block”: d(p,q) = |x1- x2| + | y1-y2| o distância “Chessboard”: d(p,q) = max{|x1- x2|,| y1-y2|}

(29)

2.2.3. PRÉ-PROCESSAMENTO DE IMAGENS

Operações de pré-processamento são aplicadas em uma imagem para alcançar como resultado outra imagem com características realçadas, mais adequadas para prosseguir com as demais etapas de processamentos necessárias (Gonzalez e Woods, 2002). Existem inúmeras técnicas de realce de imagens. Dentre as mais conhecidas estão as de filtragem nos domínios do espaço e de freqüência. Neste trabalho daremos ênfase somente ao pré-processamento no domínio da freqüência, pois foi utilizado para desenvolvimento da técnica de detecção de microcalcificações que será descrita na seção 3.

O processamento no domínio da freqüência é semelhante ao feito no domínio espacial, porém os operadores utilizados nas tarefas de filtragem mudam significativamente, tendo em vista que a busca pelas características da imagem ocorre no plano da freqüência. Freqüência é uma novo domínio de representação das informações da imagem original. A imagem é analisada em F(u,v), que é a representação da imagem f no domínio da freqüência.

A ferramenta utilizada para mapear os dados de f do domínio espacial para F no domínio da freqüência é a Transformada Discreta de Fourier (DFT). Esta ferramenta mapeia as características do sinal no tempo (espaço) para um somatório de senos e cossenos com seus respectivos pesos, de forma a traduzir perfeitamente o sinal para o domínio da freqüência. Para retornar ao domínio do tempo, sem perdas de informações, basta aplicar a transformada inversa ao sinal da freqüência.

O processamento no domínio da freqüência costuma ser mais custoso e demorado, devido ao número maior de etapas de processamento a serem cumpridas, e pela natureza das máscaras de convolução freqüências, que são bem maiores do que as utilizadas no processamento espacial. O processamento de uma imagem no domínio da freqüência segue os seguintes passos, também ilustrado na figura 13:

1. Multiplicar a imagem no domínio espacial por um fator (−1)x+y, para auxiliar o cálculo posterior da DFT (pois centraliza as informações da transformada na imagem). 2. Calcular a DFT da imagem f propriamente dita, gerando F(u,v).

3. Aplicar uma função de filtragem H(u,v) sobre a imagem F, de acordo com as características que se deseja realçar na imagem, gerando uma nova imagem: G(u,v) = H(u,v)F(u,v).

4. Calcular a DFT inversa do resultado da filtragem (G) realizado no passo 3, trazendo a imagem de volta ao domínio espacial com as modificações da filtragem.

(30)

5. Extrair apenas a parte real do resultado obtido da DFT inversa no passo 4.

6. Multiplicar esta parte real novamente por (−1)x+y para rearranjar a imagem corretamente no domínio espacial e possibilitar a visualização dos resultados.

Figura 13 - Passos realizados no processamento frequencial de imagens Fonte: ENECA 2005

As imagens F geradas no domínio da freqüência pouco ou nada tem a ver no aspecto visual com suas imagens f originais no domínio espacial, conforme visto na figura 14. Na figura 14(b) tem-se a imagem no domínio da freqüência, freqüências mais próximas do centro representam baixas freqüências, são regiões onde, no domínio do espaço, representam homogeneidade nos tons de cinza e as frequencias mais distantes do centro são altas frequencias, representando variações mais abruptas nos tons de cinza da imagem, normalmente correspondendo a bordas de objetos.

(a) Imagem original (b) Imagem no domínio da Freqüência Figura 14 - Representação de uma imagem (phantom mamográfico) no domínio da freqüência

(31)

Existem três tipos principais de filtros freqüências comumente empregados: os filtros passa-baixa (ou de suavização) e os filtros passa-alta (ou de enfatização) e o passa-banda que delimita uma faixa de freqüências a serem realçadas.

Passa-Baixa: análogos aos filtros de suavização no domínio espacial, porém com uma configuração da máscara de convolução diferente, que permite realizar as mesmas operações de suavização de cantos e arestas e redução de ruídos no domínio da freqüência.

Passa-Alta: análogos aos filtros de enfatização do domínio espacial, porém com uma configuração da máscara de convolução diferente, que permite realizar as mesmas operações de realce de cantos e arestas no domínio da freqüência.

Passa-Banda: deixará presente nas imagens apenas os valores dos sinais correspondentes à determinada freqüência eliminando os demais valores. Seu efeito visual depende da faixa predefinida e geralmente é projetado para salientar aspectos determinados, eliminar ruídos ou imperfeições presentes em uma freqüência conhecida.

2.2.4. SEGMENTAÇÃO

O objetivo das técnicas de segmentação é dividir a imagem em suas diversas partes constituinte ou segmentos (objetos e regiões). O nível ou quantidade de divisões aplicadas na imagem varia conforme a aplicação, e em geral é realizada até atingir um nível de separação suficiente entre os objetos de interesse na cena analisada (Gonzalez e Woods, 2002).

Os algoritmos de segmentação baseiam-se principalmente em duas propriedades do nível de intensidade luminosa das imagens: a descontinuidade e a similaridade. Quanto à descontinuidade, a idéia está em dividir a imagem em regiões de acordo com as mudanças abruptas do nível de intensidade luminosa em seus pontos, por exemplo, cantos e arestas de objetos na imagem. Já por similaridade, a imagem é dividida em regiões de acordo com algum padrão de similaridade entre estas regiões, como por exemplo, o nível de intensidade luminosa, a cor e a textura. Dentre as técnicas de segmentação mais conhecidas foi abordada neste trabalho a detecção de limiares (thresholding), que também foi utilizado para

(32)

desenvolvimento da técnica de detecção de microcalcificações e que será apresentada na seção 3.

A detecção de limiares é uma das técnicas de segmentação mais simples e fáceis de aplicar, sendo usado constantemente em qualquer aplicação de processamento de imagens. A técnica procura agrupar os diferentes objetos e regiões da imagem conforme a similaridade de tonalidades (nível de intensidade luminosa) entre os mesmos.

A operação de limiarização simples corresponde à definição de um valor T de limiar para o nível de intensidade luminosa ao qual deseja-se realizar o ponto de corte (binarização) da imagem. Em uma imagem de 256 tons de cinza, caso T =50, todas as tonalidades entre 0 e 50 ( f (x,y)< T) tornar-se-iam informação de fundo da imagem (valor 0 binário, ou cor preta). Já os demais valores a partir deste limiar ( f (x,y)>T) tornar-se-iam informação correspondente aos objetos da imagem (valor 1 binário, ou cor branca). Desta forma, a simples definição de um valor de limiar ou de corte já é suficiente para dividir a imagem em duas regiões: fundo e objetos, sendo útil quando já existe bom contraste entre estas regiões e apresentando resultados pobres em situações mais adversas.

É possível ainda definir múltiplos limiares de corte, e definir faixas de valores de intensidade luminosa para cada entidade da imagem. Por exemplo, caso existam para uma imagem f (x,y) dois valores distintos de limiar (T1 e T2), define-se que todos os valores em que f (x,y)<T1 correspondem ao fundo da imagem, enquanto os valores em que T1 > f (x,y)>T2 correspondem a um determinado objeto, e quando f (x,y) > T2 há um outro objeto correspondente na cena. É possível definir mais valores de limiar, porém, situações que demandam diferentes valores de limiar para realizar sua segmentação são normalmente melhor solucionadas por técnicas de segmentação baseadas em regiões.

(33)

3. MATERIAS E MÉTODOS

3.1.

TECNOLOGIAS UTILIZADAS

Este sistema foi desenvolvido utilizando a linguagem de programação Java (SUN, 2010), em virtude de algumas vantagens que esta apresenta como flexibilidade, portabilidade, reuso de código, facilidade de programação, entre outras. Juntamente com esta linguagem de programação foi utilizada a API (Application Program Interface) open source (código aberto) do ImageJ, que é um processador de imagem de domínio público baseado em Java (IMAGEJ, 2011a) e possui diversos filtros e operadores para processamento de imagens desenvolvidos.

3.2.

IMAGENS DOS PHANTONS

As imagens utilizadas para o processamento, neste trabalho, são phantons mamográficos com resolução de contraste de 12 bits (4096 tons) de escala de cinza e resolução espacial de 1024 pixels por linha, fornecendo um tamanho de pixel de 150μm. Estes phantons proporcionam facilidade de verificação e localização dos sinais presentes na imagem. Possuem um “gabarito” que identificam onde suas estruturas estão posicionadas e diversas regiões de interesse tais como agrupamentos de microcalcificações, que são mostrados nas figuras 15, 16 e 17. Estas imagens são as mesmas utilizadas por Goes (2002) e foram obtidas através de um mamógrafo CGR Senographe 500t e apresentam como característica um contraste muito baixo.

Figura 15 – Gabarito de Phantom João Emilio com microcalcificações de tamanho 0,45 mm; 0,35 mm; 0,30 mm; 0,25mm e 0,18 mm (esquerda para direita).

(34)

Figura 16 – Gabarito de Phantom Victoreen modelo 18-222 com a numeração e o tamanho das suas microcalcificações.

Fonte: GOES (2002)

Figura 17 – Gabarito de Phantom Victoreen Modelo 156 contendo microcalcificações numeradas de 7 a 11, de tamanho: 0,54 mm; 0,40 mm; 0,32 mm; 0,24 mm e 0,16 mm.

(35)

Os Phantom Victoreen modelo 18-222 (figuras 18(a)), Phantom João Emilio (figura 18(b)) e o Phantom Victoreen Modelo 156 (figura 18(c)), foram designadas para testes de desempenho de sistemas de mamografia, determinando se estes sistemas detectam arranjos similares aos encontrados clinicamente. Os objetos dentro do simulador representam microcalcificações, fibras de calcificações e tumores ou massas de acordo com seus gabaritos (figuras 15, 16 e 17, nesta ordem).

(a) (b) (c)

Figura 18 - (a) Phantom Victoreen modelo 18-222, (b) Phantom João Emilio e (c) Phantom Victoreen Modelo 156 - phantons mamográfico digitalizados.

Fonte: GOES(2002)

Estes phantons estão armazenados no formato TIFF (Tag Image File Format – formato de arquivos etiquetados) com resoluções espaciais de: 1140x1485 pixels para phantom Victoreen Modelo 18-222, 1140x1485 pixels para phantom Victoreen Modelo 156 e 940x448 pixels para phantom João Emílio. O formato TIFF é usado para representar esses tipos de imagens devido a sua capacidade de representar imagens com mais de 8 bits, ou seja, maior detalhamento dos componentes de cinza.

As figuras 19, 20 e 21, mostram a imagem original e a marcação manual da localização das microcalcificações em amarelo. O principal objetivo dessas imagens é mostrar a localização exata das microcalcificações de acordo com a imagem original e com isso identificar de forma precisa as regiões de interesse.

(36)

(a) (b)

Figura 19 - (a) Imagem original; (b) Localização das microcalcificações. Fonte: Goes(2002)

(a) (b)

Figura 20 - (a) Imagem original; (b) Localização das microcalcificações. Fonte: Próprio autor

(a) (b)

Figura 21 - (a) Imagem original; (b) Localização das microcalcificações. Fonte: Próprio autor.

(37)

Foram recortadas 10 regiões com resolução espacial de 90x105 pixels, em locais que continham estruturas verdadeiro-positivos (VP) de clusters de microcalcificações (regiões de interesse - RIs) (ver figura 22), para que se possa analisar a técnica nessas regiões mais específicas, pois estas possuem a característica de menor quantidade de ruídos que a imagem como um todo e, conseqüentemente, menos interferência no processamento.

O processamento nessas regiões simula o ato de um analisador selecionar uma região específica na qual ele deseje processar. Esse conjunto RIs, além de fornecer a localização exata conhecida a priori das estruturas de interesse (cluster de microcalcificações), também traz a simulação de tecidos densos, uma vez que o mamógrafo utilizado fornece imagens de baixo contraste (Goes, 2002). Sendo assim, este é o primeiro conjunto de imagens a serem processadas.

O segundo conjunto de imagens é o de controle. Também formado por 10 RIs, com imagens de phantons sem microclcificações agrupadas, ou seja, recortadas em regiões normais das imagens utilizadas (ver figura 23). Apesar de “vazias”, tais regiões podem conter alguns sinais que não representam efetivamente estruturas de interesse, mas podem gerar detecções falsos positivos.

Figura 22 – Exemplo de recortes de RI com microcalcificações em phantons de mama. Fonte: Próprio autor

Figura 23 - Exemplo de RI sem microcalcificação em phantom de mama Fonte: Próprio autor.

(38)

Por fim, buscando comparar a performance da técnica de detecção desenvolvida através de imagens reais com as dos phantons foram utilizados recortes com microcalcificações de imagens mamográficas digitais reais. Esse conjunto de imagens possuem resolução espacial de 71x71 pixels (ver figura 24). É importante ressaltar que os resultados para este conjunto não foram utilizados como parâmetros para verificar a sensibilidade da técnica, pelo fato de que, em uma imagem real, apenas o médico examinador pode afirmar se o achado é ou não uma microcalcificação através de uma biópsia ou através de laudos dos próprios médicos que indiquem a veracidade de um achado. Como é de bastante dificuldade obter tais laudos, a técnica não pode ser validada cientificamente em imagens reais. Vale ressaltar que tais recortes possuem microcalcificações e foram obtidas através de Goes (2002), mas este também não possui os laudos.

(a)

Figura 24 – Exemplo de regiões de interesse com microcalcificações em mamogramas reais. Fonte: GOES (2002)

3.3.

DESENVOLVIMENTO DA TÉCNICA DE DETECÇÃO

DE MICROCALCIFICAÇÕES

Dada a sua natureza, as microcalcificações destacam-se numa mamografia pelo seu brilho, forma e tamanho, geralmente pequenos pontos brilhantes. As imagens utilizadas têm como característica particular a alta densidade, o que reduz o contraste, fazendo com que algumas estruturas sejam mascaradas pelo tecido da mama.

A técnica de detecção aqui proposta visa aproveitar duas características distintas das microcalcificações, o tamanho e o brilho, para que seja possível isolá-las e extraí-las da imagem. A figura 25 mostra o esquema da técnica proposta:

(39)

Figura 25 – Esquema da técnica detecção de microcalcificações

Fonte: Próprio autor

Como se pode observar na figura 24, a técnica inicia com a aquisição da imagem original a ser processada. Esta imagem é armazenada de forma que seja possível ter acesso aos seus dados, tais como: resolução espacial, resolução de contraste e valores de pixels. Com isso, é possível aplicar técnicas de processamento de imagens.

Posteriormente são necessários dois parâmetros: tamanho de grandes e pequenas estruturas a serem filtradas (realçadas), sendo estes valores dados em pixels. Estes parâmetros serão utilizados para definir a banda de freqüências a serem realçadas na imagem no domínio da freqüência. Este passo oferece alguns graus de liberdade, no sentido em que se pode escolher as freqüências de corte mais adequadas. Para isto é necessário a conversão da imagem para o espaço de Fourier, ou seja, para o domínio da freqüência. Esta conversão foi realizada com recurso à FFT (Fast Fourier Transform – transformada rápida de Fourier). Esta transformada coloca as freqüências mais baixas no centro e as mais elevadas nos cantos, como ilustra a figura 26. Para facilitar a visualização, apresenta-se o logaritmo do espectro.

(40)

(a) (b)

Figura 26 - (a) Imagem original; (b) Logaritmo do espectro de Fourier da imagem original. Fonte: Próprio autor

É percebido que nessas imagens de baixo contraste, o gráfico de freqüências, figura 26(b), evidencia grande parte dos pixels distribuídos ao redor do centro, sugerindo que a informação da imagem se situa na faixa de baixas freqüências, ou seja, há pouco contraste nas transições da imagem. Sendo assim, pretende-se selecionar uma gama de freqüências e reconstruir a imagem com apenas a informação desejada, as microcalcificações. Para atingir esse objetivo utilizou-se do filtro passa banda do processador de imagem ImageJ (IMAGEJ, 2011b), que atenua estruturas de tamanhos específicos de acordo com os dois parâmetros de grandes e pequenas estruturas, requeridos anteriormente.

Neste filtro, os parâmetros definem a banda de passagem para as freqüências nas quais desejamos realçar (objetos a serem detectados) e suprimir (fundo da imagem) na imagem e pode ser entendido como um filtro de grandes estruturas (correção de sombreamento) e pequenas estruturas (suavização). A importância da definição dos parâmetros pode ser observada na figura 27, onde pode ser observado o tamanho da banda de passagem de acordo com os tamanhos diferentes de parâmetros para grandes e pequenas estruturas.

(a) (b) (c)

Figura 27 - Banda de passagem do filtro para diferentes parâmetros de grande e pequenas estruturas – (a) parâmetros 3 e 2 pixels, (b) 20 e 2 pixels e (c) 20 e 19 pixels.

(41)

A intensidade do filtro, figuras 27, varia com a distância ao centro da imagem e assume valores no intervalo entre [0,1]. As tonalidades de cinza mais intensas (cor branca na imagem) representam as freqüências de passagem do filtro correspondentes à informação que se pretende realçar, isto é, valores mais próximos de 1 e as tonalidades mais escuras mostram as freqüências suprimidas, correspondentes a valores mais próximos de 0. O tamanho da banda está diretamente relacionado com os valores dos parâmetros estipulados, sendo assim, com o aumento do valor do parâmetro de grandes estruturas temos uma maior proximidade do centro do filtro e o inverso para o parâmetro de pequenas estruturas.

A imagem resultante da aplicação deste filtro, figura 28 (b), é obtida recorrendo à operação inversa da FFT, que irá utilizar o espectro filtrado para reconstruir a imagem. Os três círculos maiores na imagem, figura 28(b), foram adicionados manualmente, apenas para efeito ilustrativo e não pertencem a técnica.

Conforme é possível verificar na figura 28, são realçadas as microcalcificações (pequenos pontos) presentes na imagem e suprimido o tecido envolvente. Inevitavelmente, outras estruturas da imagem são realçadas devido ao baixo contraste e ruído na imagem.

(a) (b)

Figura 28 - (a) Imagem original; (b) - Imagem com microcalcificações realçadas após aplicação do filtro com parâmetros de 2 pixels para pequenas estruturas e 3 pixels para grandes estruturas.

Fonte: Próprio autor

Uma vez realçada as microcalcificações, destacando-as de forma evidente do tecido envolvente, é possível extraí-las (segmentar) da imagem por conversão para preto e branco (binarização).

A conversão de uma imagem em tons de cinza em uma imagem binária é conseguida com a utilização de um threshold (limiar) de intensidade: abaixo deste, todos os níveis de intensidade passam a preto; e acima do mesmo, todas as intensidades passam a branco. Pretende-se que as microcalcificações sejam mostradas em branco, sobre um fundo preto, conforme figura 29(b).

(42)

(a) (b)

Figura 29 - (a) Imagem com microcalcificações realçadas após aplicação do filtro; (b) imagem binarizada após aplicação do filtro, em branco as microcalcificações.

Fonte: Próprio autor

A escolha do limiar é um grau de liberdade da técnica desenvolvida. Quando aumentado, tem-se uma especificidade reduzida na detecção, ou seja, um maior número de falsos positivos; quando reduzido, se obtém um maior número de verdadeiros positivos em relação aos falsos positivos, o que é mais desejável ao sistema. A figura 30 mostra a influência da escolha do limiar na relação verdadeiros positivos x falsos positivos.

(a) (b)

Figura 30 - (a) Imagem binarizada com limiar 128; (b) Imagem binarizada com limiar 7000

Fonte: Próprio autor

Conforme é possível observar, com o aumento do limiar ocorre um aumento do número de falsos positivos na imagem. Foi escolhido um limiar igual a 128, figura 30 (a), uma vez que fornece um bom número de verdadeiros positivos em relação aos falsos positivos, e, um limiar de 7000, figura 30(b), que aumenta o número de detecções e falsos positivos.

Ao se analisar estas imagens binárias percebeu-se que, em grande parte, os falsos positivos são pixels isolados, sem nenhuma conectividade a pixels vizinhos. Sendo assim, a fim de reduzir o número de falsos positivos na imagem, considerou-se que: para que seja considerada uma estrutura, um pixel detectado deve conter pelo menos uma conexão com um pixel vizinho de 8, conforma ilustra a figura 31.

(43)

Figura 31 - Forma básica de conexão entre pixels para ser considerado uma estrutura. Fonte: Próprio autor

O efeito deste procedimento pode ser observado ao analisarmos a figura 32 antes e depois de aplicado essa técnica de redução de falsos positivos. Os círculos vazados na figura 32 são de efeito ilustrativo e servem para mostrar a localização das detecções falso-positivas.

(a) (b)

Figura 32 - (a) Imagem com 34 falsos positivos; (b) Imagem com 12 falsos positivos.

Fonte: Próprio autor

Observa-se que houve uma considerável redução no numero de falsos positivos, correspondendo, neste caso, a uma redução de aproximadamente 65,7%. Com isso, pixels rotulados como 1 (cor branca na imagem) correspondem as estruturas detectadas, enquanto aqueles rotulados com 0 (cor preta na imagem) correspondem ao fundo, caracterizando esta a ultima etapa da técnica de detecção de microcalcificações proposta.

(44)

4. RESULTADOS

4.1.

SOFTWARE DESENVOLVIDO

O software desenvolvido tem por objetivo proporcionar as seguintes funcionalidades: abrir e exibir imagens mamográficas digitais; processar imagens e exibir resultado do processamento. Para tanto foi desenvolvida uma interface gráfica para que o usuário possa interagir com estas funcionalidades, como pode ser observado na figura 33.

Figura 33 - Interface gráfica do software desenvolvido Fonte: Próprio autor

Pode-se observar, na figura 33, na área marcada com o número 1, que há um menu onde o usuário pode escolher opções de abrir, processar lote de imagens, salvar a imagem e sair do software. Quando selecionada a opção de “Abrir”, é exibida uma janela na qual o usuário seleciona o diretório e imagem mamográfica digital a ser processada, logo após a seleção é exibida uma nova janela, interna a principal, marcada com o número 2 na figura 33, com a imagem carregada. Nesta janela contendo a imagem são apresentados os campos de definição dos parâmetros de configuração da técnica desenvolvida. Esta interface serve para que seja possível o usuário aplique e visualize a imagem a ser processada.

(45)

Também é possível o usuário processar um lote de imagens onde o usuário seleciona um conjunto de imagens em um diretório e em seguida define parâmetros e diretório de destino para que o resultado das imagens processadas seja salvo.

O fluxo para aplicação da técnica segue a seguinte ordem, conforme mostrado na figura 34: define-se o tamanho de pixels para grandes e pequenas estruturas a serem filtradas (marcação 1 e 2 na figura), aplica-se estes parâmetros clicando no botão “Aplicar” e uma nova imagem processada é exibida (marcação 3 na imagem); em seguida pode-se aplicar o threshold (limiar) para separar as microcalcificações detectadas de todo o resto da imagem, sendo que esse threshold pode ser definido por um valor específico ou controlado pela barra deslizante (marcação 4 na imagem).

Figura 34 - Imagem processada pela técnica de realce de estruturas. Fonte: Próprio autor

O resultado final, após o threshold, pode ser observado na mesma janela interna, conforme figura 35.

(46)

Figura 35 - Imagem processada após aplicação de threshold mostrando microcalcificações detectadas

Fonte: Próprio autor

4.2.

PROCESSAMENTO

4.2.1. REGIÕES DE INTERESSE EM PHANTONS – COM MICROCALCIFICAÇÕES

Do phantom Victoreen modelo 18-222 e do phantom João Emilio as RIs possuem um clusters de microcalcificações dispostas na forma de pentagramas com uma microcalcificação por vértice e uma central, constituindo, assim, um conjunto de seis microcalcificações por cluster e podem ser observadas na figuras 36(a) 36(b) repectivamente para cada phantom. E do phantom Victoreen Modelo 156 disposição de microcalcificações em forma de quadrado, com uma microcalcificação por vértice e uma central formando um cluster de 5 microcalcificações, conforme ilutra figura 36(c).

Referências

Documentos relacionados

Assim sendo, o espaço da estrada é determinante como facilitador de um exercício de uma sexualidade mais plena, aberta e satisfatória, pelo menos para Thelma, e ao

Dentre as principais conclusões tiradas deste trabalho, destacam-se: a seqüência de mobilidade obtida para os metais pesados estudados: Mn2+>Zn2+>Cd2+>Cu2+>Pb2+>Cr3+; apesar dos

el´etron de modo que um orbital fica especificado pelo vetor de onda k e pelo vari´avel de spin, ou seja, a cada vetor de onda k corresponde dois orbitais.. Nesse regime o g´as

Para instauração do competente Procedimento Disciplinar para verificação de quebra de decoro parlamentar em desfavor do senador Aécio Neves da Cunha (PSDB-MG),

Ficou constatada a possibilidade de manipulação da composição dos ácidos graxos da gordura da gema do ovo, favorável ao aumento de PUFAs n-3 com as fontes suplementares de

Para análise dos atributos toque seco, pegajosidade e espalhabilidade as instruções foram: aplicar uma quantidade pré-determinada do produto na bochecha direita,

  Directrizes para planeamento, gestão e monitorização   Perspectivas do público e autoridades das questões.

Refere-se, porém, que algumas recomendações defendidas pela European Respiratory Society não são baseadas em ensaios aleatorizados e controlados (randomized controlled trials –