• Nenhum resultado encontrado

Diagnóstico de Leucemia Linfoide Aguda com Redes Neurais Convolucionais Pré-treinadas

N/A
N/A
Protected

Academic year: 2021

Share "Diagnóstico de Leucemia Linfoide Aguda com Redes Neurais Convolucionais Pré-treinadas"

Copied!
6
0
0

Texto

(1)

Diagnóstico de Leucemia Linfoide Aguda com Redes Neurais

Convolucionais Pré-treinadas

Luis H. S. Vogado1, Rodrigo M. S. Veras1, Alan R. Andrade1, Luís G. T. Santos1 1Departamento de Computação,

Universidade Federal do Piauí, Teresina-PI

lhvogado@gmail.com, rveras@ufpi.edu.br,

{alanribeiroandrade, luisguilherme.ufpi}@gmail.com

Resumo. O diagnóstico de doenças é um importante processo realizado por médicos, que consiste em determinar a presença ou não de doenças baseando-se em um conjunto de dados. A leucemia é uma das doenças que mais atingem jovens e adultos, causando morte precoce ou diversos outros sintomas em paci-entes portadores. Com o objetivo de auxiliar especialistas no diagnóstico dessa doença, sistemas de auxílio a diagnóstico por computador, são utilizados para reduzir a quantidade de diagnósticos errôneos. Neste trabalho, apresentamos uma nova metodologia para a criação de um sistema de diagnóstico de leu-cemia com o uso de CNN’s e SVM. Foi utilizada a base de dados ALL-IDB2 e obtivemos 99,20% de Acurácia, sobrepondo os resultados apresentados na literatura.

1. Introdução

Ao longo dos anos, foram propostos múltiplos sistemas de auxílio médico. Doenças como glaucoma, câncer de pele, câncer de mama e leucemia foram abordadas nesses sistemas. O diagnóstico precoce dessas doenças é fundamental para o seu tratamento. Este por sua vez pode ser dispendioso e complexo, que mesmo em alguns casos, não curando o paciente, prolonga a sua sobrevida.

Dentre as doenças trabalhadas, a leucemia é a que possui maior número de ví-timas fatais entre adolescentes e crianças. A leucemia é um câncer que se origina na medula óssea e é caracterizado pela proliferação anormal de glóbulos brancos (Figura 1). O diagnóstico da leucemia pode ser feito por meio de várias análises e exames, dentre eles o exame físico, teste de sangue, hemograma, mielograma, entre outros. A realização do exame que utiliza a análise microscópica é a maneira mais econômica para a triagem inicial de pacientes com leucemia. Esse tipo de exame é feito manualmente o que acaba gerando cansaço e fadiga no operador, justificando a necessidade de um sistema de auxílio [Putzu et al. 2014].

Parte desses sistemas são desenvolvidos com a utilização de técnicas de proces-samento de imagens e inteligência computacional e geralmente possuem etapas de pré-processamento, segmentação, extração de características e classificação. As etapas que melhor definem o diagnóstico realizado por esses sistemas são a extração de caracterís-ticas e a classificação. No entanto, para conseguir mais robustez, essas etapas acabam dependendo de suas predecessoras, ou seja, uma boa segmentação pode prover uma boa extração e consequentemente uma boa classificação.

III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 230-235, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6

(2)

Figura 1. Exemplos de lâminas de sangue com leucemia(esquerda) e sem(direita). Ambas pertencentes a base ALL-IDB 2.

A abordagem proposta neste trabalho descreve um sistema de diagnóstico da leu-cemia que não necessita da etapa de segmentação, essa sendo uma etapa comumente apresentada em trabalhos no estado da arte. Na etapa de extração, utilizamos Redes Neu-rais Convolucionais (CNN’s) pré-treinadas e selecionamos os atributos com o algoritmo de razão de ganho para a classificar os dados com o Support Vector Machine (SVM). Pro-curamos avaliar a performance do sistema em uma base de imagens, que contém apenas um leucócito por imagem. Os resultados obtidos são comparados com outros sistemas existentes no estado da arte.

O restante do texto está dividido da seguinte forma: trabalhos relacionados são apresentados na seção 2, e a metodologia proposta na seção 3. Na seção 4 apresentamos a base de imagens utilizada nos testes e discutimos os resultados. Finalmente, temos as conclusões e perspectivas para trabalhos futuros na seção 5.

2. Trabalhos Relacionados

Diversos sistemas utilizados para auxiliar no diagnóstico da leucemia foram propostos ao longo do tempo. Dentre estes, alguns apresentaram soluções para a classificação dos dois tipos de leucemia mais comuns, são elas: a leucemia mieloide aguda (LMA) e a leucemia linfóide aguda (LLA), utilizando imagens de lâminas de sangue.

Em [Mohaprata et al. 2011], os autores passaram a usar apenas os leucócitos na classificação. A segmentação é enfatizada neste trabalho, já que um bom resultado nesta etapa pode proporcionar uma melhor extração de características. Os autores utilizaram a dimensão Fractal, assinatura de contorno, forma, cor e GLCM. A classificação é realizada pelo SVM e o número de imagens utilizadas no testes são de 108. A Acurácia obtida foi de 93% de acerto. O sistema proposto por [Mohapatra et al. 2014] utiliza um comitê para classificar a LLA. O pré-processamento utilizado elimina a presença de ruídos com um filtro seletivo e um ajuste de contraste. Diversos descritores foram utilizados na extração de características, dentre eles temos: forma, textura (GLCM), dimensão Fractal, assina-tura de contorno, texassina-turas de Haralick’s, Wavelet e os descritores de Fourier. Os autores utilizaram um comitê para classificar os dados e obtiveram 94,73% de acerto.

O sistema inteligente proposto por [Neoh et al. 2015] considerou não apenas o nú-cleo, mas também o citoplasma na extração de características. Com descritores baseados em forma, textura (GLCM), cor (CIELAB) e estatísticos, o sistema consegue diferenciar células saudáveis e doentes. Foram avaliadas 150 imagens da base ALL-IDB2 que possui apenas uma célula por imagem. Um comitê simples é utilizado para classificar as caracte-rísticas e o melhor resultado foi obtido a partir do classificador de Dempster-Shafer com 96,72% de Acurácia.

(3)

O sistema de diagnóstico auxiliado por computador proposto no trabalho de [Rawat et al. 2015], se baseia no estado da arte na escolha dos descritores. As carac-terísticas de textura (GLCM) e as de forma são utilizadas. Os autores avaliaram a por-centagem de acerto do núcleo e do citoplasma separadamente, assim como os descritores. Para realizar a experimentação do trabalho, foram selecionadas as imagens de leucócitos da base ALL-IDB2, sendo 130 para treino e a outra metade para testes. O resultado final obtido pelo sistema foi de 89,9% de acerto. O sistema proposto por [Putzu et al. 2014] recebe uma imagem da lâmina de sangue como entrada para o seu sistema. No sistema são extraídas três tipos diferentes de características, são elas: forma, cor e textura. O classificador SVM foi utilizado com a validação cruzada k-fold com k igual a 10. Os resultados obtidos por esta abordagem foram de 93,63% de acerto com 245 imagens de leucócitos da base ALL-IDB1.

Como foi apresentado nesta seção, muitos métodos do estado da arte utilizam descritores semelhantes para realizar a distinção dos lâminas de sangue. No entanto, em pesquisas mais recentes, os autores estão utilizando técnicas de Deep Learning como descritores ou classificadores, proporcionando a utilização de poderosas redes nesses sis-temas de auxílio.

3. Método Proposto

O processo de extração de características consiste na representação de um conjunto redun-dante de dados, por meio de características únicas que o façam se diferenciar de outros conjuntos. Dentre os diversos descritores propostos no estado da arte, a utilização de CNN’s neste processo de extração vem ganhando destaque. No estado da arte, os autores apresentam duas formas de realizar o processo de aprendizagem de uma base de ima-gens com CNN’s: a primeira é a forma usual, realizando o treinamento com um grande conjunto de dados, a segunda forma é a transferência de aprendizado, utilizando redes pré-treinadas.

No nosso trabalho, utilizamos a técnica de transferência de aprendizado onde a CNN já está treinada com uma grande base natural de imagens fazendo com que assimile características genéricas, facilitando a sua aplicabilidade em pequenas bases de dados. Sendo o sucesso ou não dos resultados dependerá da similaridade da base utilizada para se extrair as características com a base de treinamento. Duas formas de transferências são apresentadas no trabalho de Castellucio et al. [Castelluccio et al. 2015], a primeira consiste no fine-tune da rede, onde sua estrutura é modificada, congelando-se as camadas de alto nível. A segunda é a extração da penúltima camada totalmente conectada da rede, obtida a partir da imagem de entrada da rede e utiliza-se outro classificador no processo de classificação. Esta sendo a forma de transferência utilizada neste trabalho, como pode ser observado no fluxograma da Figura 2.

As CNN’s que utilizamos são pré-treinadas na base natural de imagens ImageNet e estão disponíveis no website MatConvNet. Três arquiteturas propostas recentemente foram utilizadas na construção da abordagem, são elas: AlexNet e CaffeNet.

A AlexNet é uma arquitetura desenvolvida recentemente e foi utilizada na compe-tição LSVRC-2010 para classificar a base de imagens ImageNet [Krizhevsky et al. 2012]. Compreende oito camadas que precisam ser treinadas, cinco camadas convolucionais seguidas de três camadas totalmente conectadas, bem como camadas de agrupamento

(4)

Figura 2. Fluxograma da abordagem proposta.

máximo. A arquitetura CaffeNet foi devenvolvida no Centro de Visão e Aprendi-zado de Berkeley, sendo considerada uma das mais populares no aprendiAprendi-zado profundo [Jia et al. 2014]. Compreende 5 camadas convolucionais, cada uma seguida por uma ca-mada de pooling, e 3 caca-madas inteiramente conectadas. Também é a mais fácil de ma-nipular e alterar as propriedades dentre as analisadas neste trabalho além de possuir um fácil acesso, disponibilizando APIs em C++, Matlab e Python. Esses três modelos pos-suem arquiteturas semelhantes e a principal diferença entre essas é o tamanho dos filtros utilizados nas camadas convolucionais e na quantidade de neurônios das camadas total-mente conectadas.

A quantidade de elementos da camada retirada da rede é de 4096, sendo este o tamanho do vetor inicial. Com a grande quantidade de características, fez-se necessária a utilização de uma seleção de atributos. O algoritmo de Razão de Ganho foi escolhido para realizar essa seleção, esse algoritmo é baseado no algoritmo de Ganho de Informação, que utiliza a entropia como medida de impureza e árvores de decisão para representar os atributos do vetor. Para classificarmos os atributos resultantes da seleção, foi escolhido um classificador presente em parte dos trabalhos apresentados no estado da arte. Os atributos que apresentaram um ganho superior a 0,1 foram selecionados, totalizando assim um vetor com 1029 características. O SVM é um classificador que busca separar duas classes de um conjunto de dados por meio de uma linha de separação ou hiperplano, utilizando as semelhanças entre as características de cada instância na construção dessa linha. Na realização dos testes, foi escolhida a validação cruzada do tipo k-fold sendo o valor de k igual a 10 e o kernel polinomial.

4. Experimentos

4.1. Base de Imagens

Vários autores testaram seus sistemas com apenas uma base de dados, ou então nas suas próprias bases. No entanto, um dos desafios no processamento de imagens de sangue é a habilidade de diagnosticar a doença mesmo em bases com características distintas. Pro-posta em [Labati et al. 2011], a ALL-IDB é uma base que contém duas versões distintas, denominadas de ALL-IDB1 e ALL-IDB2. Todas as imagens possuem a resolução nativa de 2592 × 1994 pixels, e a sua captura foi feita com uma câmera PowerShot G5. Dentre as duas versões utilizamos a ALL-IDB2, que é composta por 260 imagens (130 saudáveis e 130 doentes) e apresentam apenas um núcleo por imagem.

4.2. Resultados e Discussão

Para validarmos o sistema proposto, foram realizadas diversas comparações, sendo elas, com outros sistemas propostos no estado da arte, com a saída de cada arquitetura e

(5)

tam-bém com uma variação do método proposto acrescentando uma etapa de segmentação. Nesta última comparação, escolhemos o método proposto em [Vogado et al. 2016]. Neste trabalho, os autores apresentam um método robusto, com testes realizados em bases com características distintas e que em seus resultados, superam outros 9 métodos da literatura. Na Tabela 1, apresentamos resultados da abordagem com e sem segmentação na base ALL-IDB2. Os resultados das saídas concatenadas foram melhores que as mesmas separadas. Também observamos que os resultados sem a segmentação são superiores a sua contraparte. Acreditamos que isso se deve a outros elementos existentes na imagem, como o citoplasma, as hemácias e o fundo. Com a presença destes, a rede consegue assimilar mais informações relevantes durante a extração de características e consequentemente auxiliando na alta taxa de acerto.

Comparando a Acurácia da nossa abordagem com outros trabalhos do estado da arte (Tabela 2), verificou-se uma superioridade nos resultados, demonstrando a robustez do sistema apresentado. Acredita-se que as taxas obtidas podem ser melhoradas, uma vez que o método de transferência de aprendizado não consegue assimilar completamente as características das imagens de sangue, já que as redes foram treinadas para extrair carac-terísticas genéricas e não específicas da doença. Dentre os três modelos de arquiteturas utilizados, a AlexNet e a VggNet atingiram valores próximos, sendo que este resultado indica que redes mais rasas, como AlexNet, aprendem características mais gerais que são aplicáveis a uma variedade mais ampla de imagens. Os recursos aprendidos da AlexNet são menos otimizados semanticamente para imagens naturais, são mais generalizáveis e adaptáveis quando transferidos para o domínio da imagem médica.

Tabela 1. Resultados da performance das arquiteturas na base ALL-IDB2 com e sem segmentação. P(%) R(%) A(%) K Com segmentação AlexNet 87,20 87,20 87,20 0,7439 CaffeNet 88,00 88,00 88,00 0,7599 AlexNet + CaffeNet 91,60 91,60 91,60 0,8319 Sem segmentação AlexNet 98,00 98,00 98,00 0,9600 CaffeNet 98,00 98,00 98,00 0,9600 AlexNet + CaffeNet 99,20 99,20 99,20 0,9840

Tabela 2. Comparação da acurácia com outros métodos da literatura ( ALL-IDB2).

Trabalho Quantidade de imagens A(%) Mohapatra et al. [Mohaprata et al. 2011] 108 93.00 Mohapatra et al. [Mohapatra et al. 2014] 270 94.73 Neoh et al. [Neoh et al. 2015] 180 96.72 Putzu et al. [Putzu et al. 2014] 267 93.63 Rawat et al. [Rawat et al. 2015] 130 89.80 Método proposto 260 99.20

5. Conclusão

Como a extração de características e a classificação são considerados os passos mais im-portantes no diagnóstico automático de diferentes sistemas computacionais, constatou-se

(6)

que diversos métodos da literatura apresentaram resultados promissores. No entanto, ne-cessitam de maior robustez e de uma maior quantidade de imagens para obter uma melhor performance e confiabilidade nos seus resultados. O trabalho apresentado neste artigo descreve um novo sistema para o diagnóstico de leucemia em imagens de sangue com a utilização das Redes Neurais Convolucionais como descritores. Baseando-se nos resulta-dos obtiresulta-dos pela abordagem, é possível validar a sua robustez perante outros trabalhos do estado da arte. Como trabalhos futuros, propõe-se a utilização de um ajuste fino na rede, para que seja possível melhorar a abstração de informações da leucemia.

Referências

Castelluccio, M., Poggi, G., Sansone, C., and Verdoliva, L. (2015). Land use classification in remote sensing images by convolutional neural networks. CoRR, abs/1508.00092. Jia, Y., Shelhamer, E., Donahue, J., Karayev, S., Long, J., Girshick, R., Guadarrama, S.,

and Darrell, T. (2014). Caffe: Convolutional architecture for fast feature embedding. In Proceedings of the 22Nd ACM International Conference on Multimedia, MM ’14, pages 675–678, New York, NY, USA. ACM.

Krizhevsky, A., Sutskever, I., and Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. In Pereira, F., Burges, C. J. C., Bottou, L., and Weinberger, K. Q., editors, Advances in Neural Information Processing Systems 25, pages 1097–1105. Curran Associates, Inc.

Labati, R. D., Piuri, V., and Scotti, F. (2011). All-idb: The acute lymphoblastic leuke-mia image database for image processing. Image Processing (ICIP), 2011 18th IEEE International Conference on, pages 2045–2048.

Mohapatra, S., Patra, D., and Satpathy, S. (2014). An ensemble classifier system for early diagnosis of acute lymphoblastic leukemia in blood microscopic images. Neural Computing and Applications, 24:1887–1904.

Mohaprata, S., Samanta, S. S., Patra, D., and Satpathi, S. (2011). Fuzzy based blood image segmentation fo automated leukemia detection. Devices and Communications (ICDeCom), pages 1–5.

Neoh, S. C., Srisukkham, W., Zhang, L., Todryk, S., Greystoke, B., Lim, C. P., Hossain, M. A., and Aslam, N. (2015). An intelligent decision support system for leukaemia diagnosis using microscopic blood images. Sci. Rep., pages 1–14.

Putzu, L., Caocci, G., and Ruberto, C. D. (2014). Leucocyte classification for leukae-mia detection using image processing techniques. Artificial Intelligence in Medicine, 62:179–191.

Rawat, J., Singh, A., Bhadauria, H. S., and Virmani, J. (2015). Computer aided diag-nostic system for detection of leukemia using microscopic images. 4th International Conference on Eco-friendly Computing and Communication Systems, 70:748–756. Vogado, L. H. S., de M S Veras, R., Andrade, A. R., e Silva, R. R. V., de Araujo, F. H. D.,

and de Medeiros, F. N. S. (2016). Unsupervised leukemia cells segmentation based on multi-space color channels. In International Symposium on Multimedia, pages 451– 456. IEEE.

Referências

Documentos relacionados

Para calcular la intensidad de campo eléctrico creado por un conjunto de cargas puntuales se suman vectorialmente los campos que crearía cada carga suponiendo que estuviese solo ella

Segundo (ZANETTE et al., 2006), durante o tempo em que a forc¸a de protens˜ao vai sendo aplicada aos cabos, o elemento estrutural fica sujeito a um conjunto de esforc¸os que pode

De acordo com Chizzotti (2001), os questionários são questões elaboradas pelos pesquisadores, distribuídas por itens, através do qual os entrevistados respondem de

Assim, no que se refere à família, é necessário dizer que a historiografia brasileira nos leva a concluir que não existe atualmente um “modelo único de

Researchers interested in the role of language should focus on the discursive resources (generalized and particularized membership ties, collective iden- tity, common and

§ 2° - Os Centros deverão entregar no Congresso Técnico: a) as fichas de inscrição originais, devidamente assinadas, não sendo aceito, em hipótese

RESUMO O presente estudo constitui-se como um subprojeto que integra o macro-projeto Construções Superlativas no Português do Brasil – Uma Abordagem Sociocognitiva MIRANDA 2007 - e

Proteomic and phosphoproteomic profiling of the pancreas during the early development of experimental pancreatitis .... Characterization of the coelomic fluid of the