Vantagens e desvantagens dos sistemas de apoio à decisão no diagnóstico de câncer de
mama
Kelton Bruno Klein de Farias
1, Alissa Peres Penteado
21. Bacharel em Biomedicina pela Universidade Estadual de Londrina - UEL e Graduando em Ciência da Computação, Universidade Paulista - UNIP.
2. Mestre em Ciências. Universidade Aberta do Brasil, Universidade Federal de São Paulo - UNIFESP, São Paulo (SP), Brasil.
Resumo
Objetivo: Identificar na literatura científica estudos que empregam sistemas de apoio à decisão no diagnóstico de câncer de mama e analisar quanto às vantagens, limitações e perspectivas futuras. Método: Pesquisa na literatura de artigos publicados entre 2012 e 2016 na base de dados PubMed. Resultados: Foram selecionados oito artigos seguindo os critérios de inclusão. Há trabalhos que tem como objetivo a criação de sistemas de apoio à decisão e a análise de seu desempenho (sensibilidade, especificidade) e trabalhos cujo objetivo foi analisar os sistemas de apoio à decisão com uma abordagem prática. Conclusão Embora sejam tecnologias ainda em desenvolvimento e que necessitam de aprimoramentos, os sistemas de apoio à tomada de decisão apresentam potencial inquestionável no diagnóstico precoce e diminuição das taxas de mortalidade por câncer de mama.
Descritores: Neoplasias de Mama, Diagnóstico, Sistemas de Apoio às Decisões Clinicas.
Introdução
O câncer de mama aparece em segundo lugar dentre os tipos de câncer com maior incidência mundial (excluindo câncer de pele não melanoma), com 1,7 milhões de novos casos e 25% dos tipos de câncer diagnosticados em mulheres em 2012.
Nesta mesma estimativa, somente na América Latina, o câncer de mama representa
o tipo de câncer feminino (excluindo câncer de pele não melanoma) mais incidente,
estimando-se 152 mil novos casos em 2012 (1).
Nos Estados Unidos, estima-se que tenham sido diagnosticados 231.840 novos casos em mulheres no ano de 2015, valor que representa 29% dos cânceres diagnosticados nesta população com um total de 40.290 mortes (2). No Brasil, estimativas apontam que em 2016 existam 57.960 novos casos de câncer de mama em mulheres, representando 28,1% dos casos diagnosticados nesta população (3).
O projeto GloboCan (1), no ano de 2012, estimou 500 mil mortes por câncer de mama no mundo, o que representa 15% de todos os óbitos por câncer em mulheres, tornando-o o tipo de câncer com a maior mortalidade na população feminina. No Brasil, ocorreram 14.786 óbitos por neoplasias malignas da mama em 2014 (4) (Tabela 1).
Tabela 1 - Mortalidade no Brasil: neoplasias malignas da mama, em 2014.
Região Óbitos
Região Norte 571
Região Nordeste 3097
Região Sudeste 7523
Região Sul 2615
Região Centro-Oeste 980
Total 14786
Fonte: MS/SVS/CGIAE - Sistema de Informações sobre Mortalidade – SIM (4).
Apesar de ser uma doença com alta incidência, principalmente após os 50 anos, o prognóstico é otimista se diagnosticado precocemente (5). A detecção precoce é a principal arma na melhoria dos resultados e sobrevida, principalmente por rastreamento por mamografia (6). Existem evidências de que o rastreio por mamografia pode reduzir aproximadamente 20% da mortalidade (6).
A mamografia é a modalidade mais comum na detecção e diagnóstico do câncer de mamário. O rastreio por mamografia é o único método de triagem, que tem se mostrado eficaz (6) e é muitas vezes complementado por ultrassonografia e ressonância magnética (7).
As imagens médicas são altamente complexas e contém grande quantidade de
informações. Para aperfeiçoar a leitura destas informações podemos melhorar vários
aspectos do processo de diagnóstico, como a aquisição da imagem ou a análise
(extração e classificação de características) (8, 9). Além disso, um diagnóstico eficaz
deve integrar também os dados pessoais do paciente, buscando estender os limites
da própria imagem, pela avaliação de histórico clínico, familiar e de exposição a
fatores de risco (10) (genéticos, endócrinos, idade, vida reprodutiva, atividade física, alimentação saudável, obesidade, exposição à radiação ionizante) (5, 6).
Buscando melhorar o desempenho dos radiologistas, diminuir a variabilidade na interpretação, aumentar a confiança na decisão e também fornecer uma segunda opinião imediata, foi proposto o uso de sistemas de apoio à decisão (8, 11). Em 2001 menos de 5% das triagens por mamografia eram realizadas com auxílio destes sistemas nos Estados Unidos. De 2002 a 2008 houve um aumento excepcional chegando a 74% (12, 13). A figura 1 representa a evolução da adoção de sistemas de auxílio computadorizados em mamografia em comunidades ligadas ao Consórcio de Vigilância de Câncer de Mama (Breast Cancer Surveillance Consortium - BCSC) nos Estados Unidos.
Figura 1 - Padrões de triagem por mamografia de 2000 a 2012 em comunidades ligadas ao
Consórcio de Vigilância de Câncer de Mama (Breast Cancer Surveillance Consortium - BCSC) nos
Estados Unidos da América (Adaptado de Lehman et al. 2015(14)).
A ideia de utilizar o computador para auxiliar no diagnóstico vem de estudos
dos anos 60, mas somente em 1998 com a aprovação do Image Checker (R2
Technology, Inc.) pela agência reguladora dos Estados Unidos FDA (Food and Drug Administration) (8, 15) sistemas de apoio à decisão chegaram ao mercado americano.
Em 2012 a FDA estabeleceu duas classificações para sistema de apoio à decisão. O sistema que apresenta reconhecimento de padrões e análise de dados, cujo objetivo é salientar uma região de interesse da imagem para que o radiologista faça sua interpretação, foi classificado como dispositivo detector assistido por computador (computer-assisted detection - CADe). Enquanto isso, um sistema que pretende dar outras informações além da localização e do apontamento na imagem de regiões de interesse, e que qualifica a região avaliando o grau, estágio e severidade da doença, foi classificado como dispositivo de diagnóstico assistido por computador (computer-assisted diagnostic - CADx) (16). No Brasil, o órgão responsável pela supervisão de ferramentas tipo CAD é a ANVISA (Agência Nacional de Vigilância Sanitária), que classifica os sistemas de apoio à decisão como “Software produto para a saúde”, pois realizam processamento de imagens de diagnóstico. Enquadram-se na Lei nº 6.360 de 1976, e, portanto, deve ser feito seu registro para comercialização no Ministério da Saúde conforme nota técnica N°
04/2012/GQUIP/GGTPS/ANVISA (17).
Neste trabalho revisamos alguns estudos que empregaram sistemas CADe e CADx no diagnóstico de câncer de mama, com o intuito de avaliarmos as vantagens, limitações e futuras perspectivas do emprego destes sistemas na interpretação dos resultados pela equipe médica e seu potencial na prática clínica.
Métodos
A busca da literatura foi realizada utilizando os termos sistema de apoio à
decisão, diagnóstico, detecção, mamografia, câncer de mama e seus equivalentes
em inglês e espanhol. A base de dados utilizada para as buscas foi o PubMed
(http://www.ncbi.nlm.nih.gov/pubmed). Os critérios de inclusão são artigos
publicados num período de cinco anos (2012 a 2016) e que estejam disponíveis na
íntegra. Como critérios de exclusão foram eliminados trabalhos cujo contexto divirja
ao objetivo desta revisão, mesmo que sejam utilizados sistemas de apoio à decisão,
como em análise de risco e otimização de tratamento.
Para serem elegíveis para a inclusão nesta revisão os artigos precisam incluir os termos "sistemas de apoio à decisão" e "câncer de mama", e pelo menos um dos seguintes: diagnóstico, detecção, mamografia.
Resultados
As buscas listaram 17 artigos no total, porém apenas oito foram incluídos neste trabalho, o restante foi descartado de acordo com os critérios de exclusão. Para esta análise, nenhum artigo em português ou espanhol foi localizado. Os artigos selecionados para análise estão sintetizados na tabela 2.
Tabela 2 – Artigos localizados nas bases de dados PubMed (MedLine) (2012-2016), sobre sistemas
de apoio à decisão aplicados no diagnóstico de câncer de mama.
Título Objetivo Resultados
Using Automatically Extracted Information from
Mammography Reports for Decision-
Support (10)
Avaliar um sistema de apoio à decisão para avaliação de laudos de mamografia guiado por processamento de linguagem natural através de rede bayesiana, integrado ao fluxo de trabalho do radiologista.
O sistema de apoio à decisão para avaliação de laudos de mamografia é constituído de 2 módulos, o sistema processador de linguagem natural (NLP) extrai dados estruturados (BI-RADS) do laudo, também extrai dados relacionados ao câncer de mama do histórico pessoal e familiar do paciente, estes dados agora estruturados servem então como entrada para a rede bayesiana (BN), onde o resultado final é a probabilidade de malignidade para cada lesão reportada no laudo. A precisão de extrações de dados dos laudos foi de 98,3%
e revocação (recall) de 98,8%. A precisão e recall para a extração dos dados do histórico familiar foi de 97,7%. A acurácia da BN ao analisar os dados quando incluídos também o histórico foi de 98,14% e 98,15 quando não incluídos.
Breast Cancer Detection with Reduced Feature Set (18)
Avaliar o desempenho de classificadores
computacionais (benigno e maligno): rede neural (ANN), K vizinhos mais próximos (kNN), redes neurais com função de base radial (RBFNN), máquina de vetores suporte (SVM), de produto de redimensionamento por análise de componentes
independentes (ICA) a partir do conjunto de dados diagnóstico de câncer de mama de Wisconsin (WDBC) (aspirados de agulha fina), diminuindo a complexidade e tempo computacional.
WDBC contém um conjunto de 30 características (30F) para cada núcleo das células de biópsias por aspirado de agulha fina, através de análise de componentes independentes foi possível redimensionar para uma dimensão (1F). Os classificadores foram testados e treinados através das técnicas validação cruzada (10- CV) e por partição 20% (20% para teste e 80% para treinamento). Foi então analisada acurácia para cada classificador nas condições 1F e 30F. Foi observado para ANN, kNN e SVM, ligeira baixa de acurácia de 97,55%, 93,14% e 95,25%, respectivamente em 30F, para 90,5%, 91,03% e 90,86%, respectivamente em 1F, com exceção de RBFNN que apresentou alta de 87.17%
para 90.49%. RBFNN também obteve melhora em sensibilidade, passando de 93.55% para 96.63%, o que indica maior sucesso na classificação das amostras malignas. Como a análise de componentes independentes redimensiona os dados do WDBC foi analisado o tempo computacional para a classificação, com o emprego da técnica de 20% houve diminuição do tempo, principalmente para as redes neurais (ANN, RBDNN) e fica mais evidente em 10-CV, diminuindo de 118,21 e 129,84 para 76,72 e 90.49 segundos. Em ambos os casos ICA diminuiu o tempo para kNN e SVM, mas em taxas inferiores que para as redes neurais. Para os classificadores kNN, ANN e SVM, a redução de características reduzido por ICA diminuiu a precisão, a
exceção foi RBFNN em que houve melhora das taxas.
Para todas as ferramentas ocorreram melhora no tempo de processamento.
A New Hybrid Case- Based Reasoning Approach for Medical Diagnosis Systems (19)
Desenvolver e avaliar uma nova abordagem de sistema CBR que integra raciocínio baseado em casos e de raciocínio baseado em regras, e também aplica novo processo de adaptação automaticamente, através da exploração de regras de adaptação.
Foi desenvolvido em linguagem C#.NET uma nova abordagem híbrida de raciocínio baseado em casos para sistemas de diagnóstico médico. Um novo processo de aprendizagem/adaptação foi adicionado aos passos REUTILIZAR/ADAPTAR (REUSE/ADAPT) do ciclo clássico de um CBR chamado RAZÃO (REASON), neste novo passo regras de raciocínio são aplicados para encontrar uma solução quando o processo REUTILIZAR/ADAPTAR falha. O sistema foi avaliado com dois conjuntos de dados: de mamografias (classificando em 0 = benigno e 1 = maligno) e de doenças da tireoide (classificando em 1 = normal, 2 = hiper, 3 = hipo). Obteve acurácia média de 99,53%
(97.67% - 100%) para tireoide, e 99,33% (98.32% - 100%) para mamografias.
Decision support system for breast cancer detection using mammograms (20)
Avaliar a melhor
combinação de
características extraídas das bases de dados:
Digital Database for Screening Mammography (DDSM) e Singapore Anti- Tuberculosis Association CommHealth (SATA CommHealth), e comparar a acurácia das avaliações de seis diferentes classificadores.
As características foram extraídas pelos métodos:
padrões binários locais (LBP), medida de energia de Laws (LTE), transformada discreta wavelet (DWT), Estatísticas de alta-ordem (HOS), e posteriormente selecionadas e agrupadas. A acurácia da classificação das características extraídas da base DDSM foi abaixo de 77% para todas as combinações de métodos de extração testadas, com exceção da árvore de decisão (DC) que avaliando um conjunto de 20 características (LBP + LTE) e outro conjunto de 34 características (LBP + LTE + DWT + HOS) com acurácia de 81% e 91,6%, respectivamente. Na análise das características extraídas da base SATA CommHealth todos os classificadores apresentaram acurácia abaixo de 78%
para todas as combinações de métodos de extração testadas, com exceção da DC, avaliando LBP + LTE com 27 características e LBP + LTE + DWT + HOS com 29 características , que obteve 92% e 96.30%, respectivamente, e do classificador Panzer, que alcançou acurácia de 91,67% avaliando LBP + LTE + DWT + HOS com 12 características.
Observer Study of a Prototype Clinical Decision Support System for Breast Cancer Diagnosis Using Dynamic Contrast-Enhanced MRI (21)
Avaliar o desempenho de radiologistas utilizando um protótipo de sistema de suporte de decisões clínico (CDS) baseado em estudos de contraste dinâmico de ressonâncias
magnéticas no
diagnóstico e manejo de pacientes com câncer de mama.
O estudo foi realizado com 5 radiologistas com e sem o uso do sistema computadorizado de auxílio à tomada de decisões, para 192 lesões (malignas e benignas) e analisados por gráficos de característica de operação do receptor (ROC). Não foram observadas alterações significativas no desempenho dos radiologistas com o uso do sistema computadorizado de suporte de decisões (área da curva ROC se manteve sem variações significativas – Média 0,8 com p=0,61). A confiança dos radiologistas foi medida pelo pedido ou não de exames posteriores (como biópsia e acompanhamento) e houve aumento significativo de confiança para 3 dos 5 radiologistas com o uso do sistema computadorizado de suporte (de 5,9 para 6,3 com p< 0,001; de 7,0 para 7,2 com p=0,04 e de 4,4 para 5,4 com p<0,001, respectivamente). No entanto, a confiança dos radiologistas foi maior somente para casos de malignidade, enquanto para lesões benignas o radiologista permaneceu em dúvida do diagnóstico correto mesmo quando o computador apresentou imagens de lesões benignas confirmadas para o auxílio da tomada de decisões.
Standalone computer-aided detection compared to radiologists’
performance for the detection of mammographic masses (22)
Comparar a performance autônoma de um sistema computadorizado de detecção, utilizado para tomada de decisões na identificação de massas
malignas em
mamografias, com a
performance de
radiologistas.
A performance do sistema computadorizado de detecção de massas (CAD) foi comparada com a leitura dada por 9 radiologistas e 3 residentes para 200 mamografias contendo massas (malignas, distorções e densidades assimétricas). Para frações baixas de falsos-positivos (0-0,05), as leituras positivas (corretas) do sistema computadorizado foram similares aos radiologistas (true-positive rate TP=0,487), e quando considerados frações altas de falsos-positivos (> 0,14), o sistema computadorizado teve pior performance que os radiologistas (TP=0, 518 com P<0,001). A performance do sistema computadorizado foi similar a dos residentes para qualquer uma das frações de falso- positivos consideradas. Os resultados indicam que a performance do sistema computadorizado de detecção de massas em mamografias é próxima ao de profissionais treinados e possui alta especificidade, com potencial para ser usado de forma independente em triagens de mamografias.
An Improved Decision Support System for Detection of Lesions in Mammograms Using Differential Evolution Optimized Wavelet Neural Network (23)
Avaliar proposta de rede neural wavelet (WNN) otimizada por algoritmo de evolução diferencial (DEOWNN) como sistema de apoio à decisão para a detecção de massas
tumorais em
mamografias.
O desempenho do sistema de apoio à decisão foi avaliado utilizando um mini banco de dados da Mammographic Image Analysis Society (MIAS), que é constituído de 322 imagens 1024x1024, 208 imagens normais, 63 benignas e 51 malignas. A extração de características foi feita pela medida de energia de Laws das Regiões de Interesse (ROI). Em seguida a classificação das regiões normais e anormais nas mamografias é realizada. O algoritmo de evolução diferencial foi aplicado para a evolução de WNN, otimizando tanto o número de neurônios na camada oculta quanto a taxa de aprendizagem e do fator de momentum, evoluindo a WNN para uma melhor solução.
O algoritmo proposto apresentou sensibilidade de 96,9%, especificidade de 92,9% e a área sob a curva ROC de 0.97843.
Diagnostic Accuracy of Digital Screening Mammography With and Without Computer-Aided Detection (14)
Avaliar o desempenho de radiologistas no rastreamento por mamografia com e sem sistema de detecção computacional (CADe).
Entre 2003 e 2009 625.625 mamografias foram realizadas por 271 radiologistas realizadas em 66
instalações do
Consorcio de Vigilância de Câncer de Mama (Estados Unidos da América). O desempenho dos radiologistas não melhorou com o uso de CADe, a sensibilidade diminuiu significativamente, de 87.3% (sem CADe) para 85,3% (com CADe). Não houve diferença na taxa de detecção do câncer. Não foram encontradas evidências de que o uso de CADe no diagnóstico de câncer mamário no rastreamento por mamografia aumenta o desempenho dos radiologistas.