• Nenhum resultado encontrado

CAPÍTULO 3 – REVISÃO BIBLIOGRÁFICA

3.2 Trabalhos Correlatos

3.2.2 Detectores de pontos anatômicos específicos

Wörz e Rohr (2005) Neste trabalho os autores apresentam uma técnica para a localização de pontos salientes anatômicos 3D em imagens volumétricas que aplica modelos de intensi- dade paramétricos ajustados aos níveis de cinza da imagem. Os modelos paramétricos consi- derados representam três estruturas principais: estrutura de “ponta” (tip-like), estrutura de sela (saddle-like), e estrutura do tipo esfera (sphere-like), cada um deles refletindo as variações de intensidade das estruturas em imagens tomográficas 3D.

A técnica proposta descreve as intensidades de pontos salientes anatômicos na imagem em uma região como uma função analítica, com um número determinado de parâmetros. Dessa maneira, é necessário definir uma região de interesse (Region of Interest - ROI) grande o sufici- ente ao redor de cada ponto saliente para capturar uma quantidade de informações satisfatória da imagem e assim garantir a localização precisa do ponto. No entanto, é necessário ter cui- dados na definição da ROI, pois uma região muito grande pode conter estruturas vizinhas que influenciam negativamente na acurácia da localização. Sendo assim, os autores desenvolve- ram também uma nova abordagem para a seleção do tamanho ótimo da ROI 3D. Além disso, também propuseram um algoritmo para inicializar automaticamente os parâmetros do modelo, usando-se de propriedades diferenciais e de outras propriedades da estrutura na imagem.

A avaliação dos resultados foi realizada em imagens sintéticas 3D, representado estrutu- ras do tipo “ponta”, “sela” e “esfera” com diferentes variações na orientação, tamanho e nível de ruído gaussiano, e em imagens de RM e de tomografia computadorizada (Computed Tomo- graphy- CT) do cérebro. Nas imagens sintéticas, a localização do ponto saliente é definida

3.2 Trabalhos Correlatos 35

pelo modelo usado para a geração dessas imagens. Os autores conseguiram alta acurácia na localização dos pontos com a técnica proposta, sendo que o erro médio da localização estimada foi de 0,04mm nas estruturas do tipo “ponta”, 0,03mm nas estruturas do tipo sela e 0,01mm nas estruturas do tipo “esfera”. Nas imagens clínicas os autores usaram pontos anatômicos manual- mente marcados por especialistas como ground truth. O erro médio da localização dos pontos nessas imagens foi de 1,63mm utilizando a inicialização automática das regiões de interesse.

Zheng et al. (2015) Mais recentemente, dada a popularização da aplicação de técnicas de deep learningpara a resolução de diversos tipos de problemas computacionais (NAJAFABADI et al., 2015), alguns trabalhos foram propostos para a detecção de pontos salientes anatômicos utilizando o aprendizado oferecido por essas técnicas. Tais trabalhos, embora focados em re- solver problemas 2D, demonstraram que é possível aprender características importantes de um conjunto de treinamento.

O desafio de se utilizar técnicas de deep learning em um conjunto de imagens 3D reside no fato de que o vetor de entrada, nesse caso, é muito maior que o vetor de entrada do caso 2D. Isso aumenta drasticamente o tempo de computação e as chances de ocorrer overfitting3, especialmente quando combinado com um número de amostras de treinamento limitado, o que é típico em aplicações de imagens médicas (ZHENG et al., 2015).

Para tratar esse problema, Zheng et al. (2015) propuseram um algoritmo de deep learning, dividido em dois passos principais, que é capaz de realizar a detecção de pontos salientes anatô- micos em dados volumétricos. Primeiramente, uma rede com apenas uma camada escondida é usada para testar todos os voxels da imagem. O objetivo dessa etapa inicial é obter um con- junto menor de voxels que são mais promissores a representarem pontos salientes anatômicos de interesse. A seguir, é aplicada uma classificação mais acurada, utilizando uma rede profunda composta por 3 camadas. Essa rede recebe como entrada os voxels selecionados pela rede rasa (de uma camada), de modo que a entrada passa a ter tamanho 2000, diminuindo consideravel- mente a complexidade do algoritmo. Para mitigar o problema de overfitting, os autores extraem pequenos patches 3D de uma pirâmide multirresolução. As características da imagem apren- didas pela rede profunda são combinadas com características da transformada wavelet de Haar para aumentar a acurácia da detecção. O método foi avaliado quantitativamente para a detecção da bifurcação da artéria carótida em um conjunto de imagens de CT 3D da região da cabeça- pescoço composto por 455 pacientes. Segundo os autores, a técnica proposta consegue realizar a detecção desse ponto saliente anatômico em menos de um segundo e com uma distância média

3Overfitting, ou sobreajuste, ocorre quando um modelo se ajusta muito bem ao conjunto de treinamento, mas

de 2,64mm.

Ghesu et al. (2016) Em (GHESU et al., 2016), os autores também utilizam técnicas de deep learningpara a detecção de pontos salientes anatômicos em imagens médicas 2D e 3D. Nesse trabalho, os autores combinam uma rede neural convolucional (Convolutional Neural Network - CNN) com técnicas de aprendizado de máquina para modelar pontos anatômicos nas imagens. Os autores propuseram um novo paradigma de aprendizado que contrasta com o paradigma normalmente adotado na literatura, em que a maioria das soluções se restringem em aprender um modelo de aparência e escanear exaustivamente um espaço de parâmetros para detectar uma característica anatômica específica. Nesse caso, todos os aspectos relacionados ao entendimento do problema e a garantia da generalidade do algoritmo são responsabilidade do engenheiro, enquanto a máquina desacoplada desse alto nível de compreensão executa cegamente a solução.

No novo paradigma, a modelagem da aparência do modelo e a estratégia de busca de pa- râmetros são realizadas simultaneamente como uma tarefa comportamental unificada para um agente artificial, resultando em uma técnica que combina as vantagens de aprendizado compor- tamental (behavior learning), alcançados por meio do aprendizado por esforço (reinforcement learning), com extração hierárquica de características por meio de uma técnica de deep lear- ning. A modelagem do aprendizado do agente (treinamento) é realizada por meio do modelo Markov Decision Process (MDP), em que os estados descrevem uma região de interesse com seu centro representando a posição atual do agente. As ações são modeladas denotando os mo- vimentos do agente no espaço paramétrico e os ganhos são modelados codificando o feedback supervisionado recebido pelo agente, representado pela mudança da distância relativa até a lo- calização do ponto saliente anatômico depois de executar o movimento. Dada a definição do modelo, o objetivo do agente é selecionar ações por meio da interação com o ambiente para ma- ximizar o ganho futuro acumulado, e isso é feito utilizando uma CNN profunda para aproximar a função de ação-valor ótima para determinar as ações.

A avaliação da metodologia proposta foi realizada em conjuntos de imagens médicas 2D (de RM e ultrassom) e em um conjunto de imagens 3D (CT). Os conjuntos de dados consistem em 891 imagens de RM 2D cardíacas de 338 pacientes, 1186 imagens de ultrassom cardíaco de 361 pacientes e 455 imagens distintas de CT da região pescoço-cabeça. Nas diferentes imagens foram determinados diferentes pontos anatômicos, como o LV-center nas imagens de RM 2D e a bifurcação da artéria carótida em imagens de CT 3D. A métrica de avaliação foi a distância média do ponto detectado em relação ao GT demarcado nessas bases de dados, e os resultados mostraram que a técnica proposta pelos autores consegue detectar a uma distância menor em relação ao estado da arte de técnicas usadas para a detecção de pontos anatômicos,