• Nenhum resultado encontrado

Classificação de lateralidade hemisférica de linguagem de linguagem em imagens de ressonância magnética funcional utilizando aprendizado de máquina

N/A
N/A
Protected

Academic year: 2021

Share "Classificação de lateralidade hemisférica de linguagem de linguagem em imagens de ressonância magnética funcional utilizando aprendizado de máquina"

Copied!
83
0
0

Texto

(1)

ESCOLA POLITÉCNICA

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA MESTRADO EM ENGENHARIA ELÉTRICA

MARIANA PASTRO MORAIS

CLASSIFICAÇÃO DE LATERALIDADE HEMISFÉRICA DE LINGUAGEM EM IMAGENS DE RESSONÂNCIA MAGNÉTICA FUNCIONAL UTILIZANDO APRENDIZADO DE MÁQUINA

Porto Alegre 2020

(2)

CLASSIFICAÇÃO DE LATERALIDADE HEMISFÉRICA DE

LINGUAGEM EM IMAGENS DE RESSONÂNCIA MAGNÉTICA

FUNCIONAL UTILIZANDO APRENDIZADO DE MÁQUINA

MARIANA PASTRO MORAIS

BACHAREL EM FÍSICA MÉDICA

DISSERTAÇÃO PARA A OBTENÇÃO DO TÍTULO DE MESTRE EM

ENGENHARIA ELÉTRICA

Porto Alegre

Março, 2020

(3)

CLASSIFICAÇÃO DE LATERALIDADE HEMISFÉRICA DE

LINGUAGEM EM IMAGENS DE RESSONÂNCIA MAGNÉTICA

FUNCIONAL UTILIZANDO APRENDIZADO DE MÁQUINA

MARIANA PASTRO MORAIS

BACHAREL EM FÍSICA MÉDICA

ORIENTADORA: PROFA. DRA. ANA MARIA MARQUES DA SILVA

Dissertação de Mestrado realizada no Programa de Pós-Graduação em Engenharia Elétrica (PPGEE) da Pontifícia Universidade Católica do Rio Grande do Sul, como parte dos requisitos para a obtenção do título de Mestre em Engenharia Elétrica.

Porto Alegre

Março, 2020

(4)
(5)
(6)

Este trabalho é dedicado aos inúmeros pacientes

que me deparei ao longo da minha graduação em

Física Médica, e que de alguma forma me motivaram

a fazer da ciência mais uma ferramenta de diagnóstico

e terapia de patologias, em especial as neurológicas.

(7)

AGRADECIMENTOS

Não poderia deixar de agradecer aos professores que inspiraram este projeto e me deram a base do conhecimento necessário para que este trabalho chegasse ao fim: Alexandre Rosa Franco, Dario Azevedo, Fernando de Castro, Maria Cristina de Castro e minha orientadora, Ana Maria Marques da Silva, que com tanta dedicação me ajudou a concluir esta etapa.

Aos colegas do LABIMA e do NIMed, em especial Guilherme Froes, Marcelo Bergmann, Milton Rosenbach e Luis Vinicius Moura, que dedicaram seus valiosos tempos durante os estudos para me elucidar questões de computação e me inspirar a finalizar este trabalho. Sem a ajuda de vocês, muitos dos meus insights não teriam sequer existido.

Um agradecimento mais que especial à, então, doutoranda Nathalia Esper Bianchini, que dedicou seu tempo com muito carinho, e cuja ajuda foi fundamental para que todo este trabalho fosse realizado. Não esquecendo do agradecimento ao Dr. Ricardo Paganin que contribuiu significativamente para a conclusão deste trabalho, dedicando seu tempo para classificar a lateralidade dos pacientes e possibilitar a finalização deste estudo.

Agradeço também aos meus familiares, amigos, colegas de trabalho e de profissão por acompanharem de perto essa jornada, sempre me dando forças para acreditar no meu potencial. O meu muito obrigada a cada um de vocês.

O presente trabalho foi realizado com o apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001.

(8)

“Estude! Não para saber

mais, mas para saber

melhor.” (Sêneca)

(9)

LISTA DE FIGURAS

Figura 1. Algoritmos de aprendizado de máquina utilizados na literatura médica ... 27

Figura 2. Modelo de neurônio computacional... 29

Figura 3. Curvas das funções de ativação. ... 30

Figura 4. Modelos gráficos de algumas funções de ativação: (a) Sigmoid; (b) tanh; (c) ReLu... 36

Figura 5. Diagrama das principais etapas de pré-processamento. ... 44

Figura 6. Representação do sinal e seus respectivos valores de beta (valores exemplo). ... 44

Figura 7. Fluxograma das etapas da proposta. ... 47

Figura 8. Exemplo de gráficos gerados por cada voxel de uma RMf. ... 51

Figura 9. Exemplo de gráficos gerados por cada voxel de uma RMf. ... 51

Figura 10. Exemplo de RMf com valores de coeficiente de ativação por região. ... 52

Figura 11. Mapa esquemático das ativações por hemisfério cerebral. ... 55

Figura 12. Dados estatísticos referentes ao Teste de concordância Kappa obtidos pelo SPSS. ... 64

(10)

LISTA DE TABELAS

Tabela 1. Descrição dos dois componentes de arquitetura da RNA MLP do Orange. ... 35 Tabela 2. Paradigma das tarefas utilizadas durante aquisição das imagens. ... 49 Tabela 3. Comandos utilizados no AFNI para geração de coeficientes de ativação. 52 Tabela 4. Relação de número de dados e sujeitos para treino e teste. ... 57 Tabela 5. Threshold e p utilizados na análise visual de lateralidade realizada pelo

neurorradiologista nas imagens de RMf. ... 59 Tabela 6. Dados estatísticos referentes aos valores de IL. ... 61 Tabela 7. Dados estatísticos referentes aos valores de beta. ... 62 Tabela 8. Relação dos dados de treino das arquiteturas testadas na configuração da

RNA MLP. ... 65 Tabela 9. Relação dos dados de teste das arquiteturas de RNA MLP. ... 66 Tabela 10. Dados de treino das arquiteturas selecionadas. ... 67 Tabela 11. Relação dos dados de treino das arquiteturas testadas, na configuração

de RNA MLP escolhida. ... 67 Tabela 12. Desempenho das RNAs para cada lateralidade. ... 68 Tabela 13. Desempenho da RNA Logistic/L-BFGS-B com 6 neurônios na camada

(11)

LISTA DE GRÁFICOS

Gráfico 1. Distribuição de valores de IL por lateralidade. ... 60 Gráfico 2. Distribuição de valores de beta por lateralidade. ... 62 Gráfico 3. Comparação entre RNA e IL para dados inéditos. ... 70

(12)

LISTA DE ABREVIATURAS E SIGLAS

ACERTA Avaliação de Crianças em Risco de Transtorno de Aprendizagem

AFNI do inglês Analysis of Functional NeuroImages, que significa Análise de Neuroimagens Funcionais

AM Aprendizado de Máquina

ATP do inglês Adenosine Triphosphate, que significa Adenosina Trifosfato

AUC do inglês Area Under ROC Curve, que significa Área Sob a Curva ROC BOLD do inglês Blood Oxygenation Level Dependent, que significa Nível de

Dependência de Oxigenação no Sangue

CA do inglês Classification Accuracy, que significa Classificação de Acurácia

DL do inglês Dichotic Listening, que significa Escuta Dicótica

fMRI do inglês functional Magnetic Resonance Imaging, que significa Imagem de Ressonância Magnética funcional

FOV do inglês Field of View, que significa Campo de Visão IA Inteligência Artificial

IL Índice de Lateralidade

LABIMA Laboratório de Imagens da PUCRS MEG Magnetoencefalografia

MLP do inglês Multilayer Perceptron, que significa Perceptron Multicamada

NIMed Núcleo de Imagens Médicas da PUCRS

PET do inglês Positron Emission Tomography, que significa Tomografia por Emissão de Pósitrons

(13)

PUCRS Pontifícia Universidade Católica do Rio Grande do Sul RMN Ressonância Magnética Nuclear

RMf Ressonância Magnética funcional RNA Rede Neural Artificial

ROI do inglês Region of Interest, que significa Região de Interesse

SVM do inglês Support Vector Machine, que significa Máquina de Vetores de Suporte

TE Tempo de Eco

TMS do inglês Transcranial Magnetic Stimulation, que significa Estimulação Magnética Transcraniana

(14)

SUMÁRIO

AGRADECIMENTOS ... 6

LISTA

DE

FIGURAS ... 8

LISTA

DE

TABELAS ... 9

LISTA

DE

GRÁFICOS ... 10

LISTA

DE

ABREVIATURAS

E

SIGLAS ... 11

SUMÁRIO ... 13

RESUMO... 15

ABSTRACT ... 16

INTRODUÇÃO ... 17

OBJETIVOS ... 21

OBJETIVOS ESPECÍFICOS ... 21

FUNDAMENTOS

TEÓRICOS ... 22

3.1. RESSONÂNCIA MAGNÉTICA FUNCIONAL ... 22

LINGUAGEM CEREBRAL E ÁREAS DE WERNICKE E BROCA ... 24

BILATERALIDADE HEMISFÉRICA ... 25

APRENDIZADO DE MÁQUINA E REDE NEURAL ARTIFICIAL MULTILAYER PERCEPTRON ... 26

ARQUITETURA DA REDE NEURAL ... 32

MÉTODOS DE AVALIAÇÃO QUANTITATIVA DE LATERALIZAÇÃO DA LINGUAGEM EM RMF – ESTADO DA ARTE ... 38

PROCESSAMENTO DE IMAGENS DE RMF ... 43

METODOLOGIA ... 46

BASE DE DADOS ... 47

EXTRAÇÃO DO COEFICIENTE DE ATIVAÇÃO ... 50

CÁLCULO DO ÍNDICE DE LATERALIDADE ... 53

CONFIGURAÇÃO E VALIDAÇÃO DA RNA MLP ... 56

DADOS DE TREINO (CONFIGURAÇÃO) ... 56

(15)

ANÁLISE VISUAL POR ESPECIALISTA ... 58

ANÁLISE ESTATÍSTICA ... 59

RESULTADOS

E

DISCUSSÕES ... 60

CONCLUSÕES ... 73

PROPOSTAS

PARA

TRABALHOS

FUTUROS ... 75

(16)

RESUMO

PASTRO MORAIS, Mariana. Classificação de lateralidade hemisférica de linguagem

em imagens de ressonância magnética funcional utilizando Aprendizado de Máquina.

Porto Alegre. 2020. Dissertação. Programa de Pós-Graduação em Engenharia Elétrica, PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL.

Embora a área cerebral de linguagem tenha sua localização anatômica definida pelas áreas de Wernicke e de Broca, alguns pacientes acometidos com tumores cerebrais têm suas topografias de ativação alteradas, devido a um fenômeno chamado translocação de linguagem. A ressonância magnética funcional (RMf) é um método de diagnóstico por imagem que evidencia as áreas de linguagem, contribuindo para um correto planejamento cirúrgico de retirada de tumores. Apesar da detecção das áreas de ativação cerebral por inspeção visual ser a mais utilizada na clínica, alguns trabalhos vêm utilizando técnicas de Aprendizado de Máquina, como Support

Vector Machine, Regressão Logística, Árvores de Decisão, entre outras. Este trabalho

tem como objetivo avaliar a aplicação de uma técnica de classificação de lateralidade hemisférica cerebral em área de linguagem utilizando Aprendizado de Máquina. Os coeficientes de ativação das áreas de interesse em imagens de RMf foram extraídos por meio do software AFNI. Uma rede neural artificial Multilayer Perceptron foi configurada, de modo a determinar a probabilidade de as áreas de linguagem estarem alocadas em determinado hemisfério cerebral. O desempenho da rede neural foi avaliado por meio da comparação estatística com o Índice de Lateralidade e com a análise visual. Os resultados mostraram que a RNA MLP tem potencial para ser um método auxiliar para classificação de lateralidade hemisférica cerebral em área de linguagem.

Palavras-Chave: Ressonância Magnética Funcional, Aprendizado de Máquina, Neurolinguagem, Lateralidade Hemisférica Cerebral.

(17)

ABSTRACT

PASTRO MORAIS, Mariana. Classification of Hemispheric Lateralization in functional

Magnetic Resonance using Machine Learning. Porto Alegre. 2020. Master. Graduation

Program in Electrical Engineering, PONTIFICAL CATHOLIC UNIVERSITY OF RIO GRANDE DO SUL.

Although the cerebral language area has its anatomical location defined by Wernicke’s area and Broca’s area, some patients affected with brain tumors have their activation topographies altered due to a phenomenon called language translocation. Functional Magnetic Resonance Imaging (fMRI) is a diagnostic imaging method that highlights language areas, contributing to the correct surgical planning of tumor removal. Despite the detection of brain activation areas by visual inspection being the most used at the clinic, some studies have been using Machine Learning techniques, such as Support Vector Machine, Logistic Regression, Decision Trees, and others. This work aims to evaluate the application of a technique for classification language area laterality to be using Machine Learning. The activation coefficients of the areas of interest in fMRI images were extracted using the AFNI software. A Multilayer Perceptron artificial neural network was set up in order to determine the probability of the language area are allocated in a certain cerebral hemisphere. The performance of the neural network was assessed by means of statistical comparison with the Laterality Index and the visual analisys. The results showed that MLP RNA has the potential to be an auxiliary method for classifying cerebral hemispheric laterality in the language area.

Key-words: Functional Magnetic Resonance, Machine Learning, Neurolanguage, Cerebral Hemispheric Laterality.

(18)

INTRODUÇÃO

Os avanços crescentes na área da medicina, aliadas à engenharia e à computação, abriram novas possibilidades para o diagnóstico de doenças, principalmente as neurológicas. Equipamentos de alta tecnologia são cada vez mais utilizados, a fim de obter exames com melhor qualidade de imagem. Devido a esse crescente uso de equipamentos na área diagnóstica, novas patologias são detectadas e novas alternativas de tratamento podem ser estudadas.

A Ressonância Magnética Nuclear (RMN) é um fenômeno utilizado no diagnóstico por imagem que utiliza um intenso campo magnético para gerar imagens internas do corpo humano. O campo magnético gerado pelo magneto da RMN interage diretamente com os spins dos átomos de hidrogênio do corpo humano (GIL; GERALDES, 2002). Uma vez que a maior parte do corpo humano é composta por hidrogênio – devido à sua prevalência nas moléculas de água – há uma biodisponibilidade de átomos de hidrogênio no corpo humano que possibilita essa interação, produzindo o alinhamento destes átomos. A emissão de um pulso de radiofrequência ressonante com a região do corpo a ser estudada excita os spins dos átomos de hidrogênio, retirando-os do alinhamento. Ao cessar da emissão de radiofrequência, os spins tendem a voltar ao seu estado estável de alinhamento com o campo magnético, emitindo um sinal de radiofrequência e possibilitando o mapeamento de sua localização através das bobinas receptoras. Devido a esta tecnologia, as imagens por RMN possibilitam identificar, com alta resolução espacial,

(19)

a diferença entre substância branca e substância cinzenta, bem como entre tecidos saudáveis e lesões (HUETTEL; SONG; McCARTHY, 2004).

Nas cirurgias de retirada de tumores cerebrais, existe a possibilidade de os pacientes perderem funções primárias, como fala, movimento e tato. O planejamento pré-cirúrgico de ressecção de lesões cerebrais é fundamental para evitar o prejuízo funcional dos pacientes, seja em área de linguagem, seja nas demais áreas. Por esta razão, existem diversos procedimentos de classificação das áreas cerebrais de linguagem que devem ser realizados antes da retirada de tumores.

Uma das abordagens utilizadas para identificar as áreas nas quais os pacientes possuem suas funções primárias alocadas, assim como a sua translocação após o aparecimento do tumor, é o exame de Ressonância Magnética funcional (RMf) (SUNAERT, 2006). Outros procedimentos são o Teste de Wada e a Eletrocorticografia. O Teste de Wada e a Eletrocorticografia são exames invasivos, que aumentam o risco e também o tempo de recuperação em pacientes com patologias, como lesões cerebrais (PARTOVI et al., 2012). Além da RMf, existem outras técnicas não invasivas, como PET (Pósitron Emission Tomography), MEG (Magnetoencefalografia) e TMS (Estimulação Magnética Transcraniana, em português), também empregadas em pacientes acometidos com tumores cerebrais, contudo são utilizadas para determinar a localização do córtex sensorial e motor. Entretanto, entre todas essas técnicas, a RMf é considerada padrão-ouro na detecção da ativação cerebral (HOU; BATHIA; CARPENTER, 2016).

No cérebro, o processamento sensorial e cognitivo é assimétrico em relação aos hemisférios cerebrais. Embora os dois hemisférios estejam em comunicação contínua, diferenças entre os processamentos nos hemisférios esquerdo e direito têm sido comumente relatadas em numerosos estudos de neuroimagem funcional. A

(20)

linguagem foi a primeira função cognitiva cuja dominância hemisférica foi comprovada por estudos de Paul Broca e Carl Wernicke no final do século XIX. Sabe-se que danos em determinadas áreas do hemisfério dominante resultam em distúrbios de linguagem (afasias) que não ocorrem após danos no hemisfério não dominante. No entanto, sabe-se que fatores genéticos, de desenvolvimento, ambientais e patológicos podem influenciar a lateralidade da linguagem (BINDER et al., 1997).

A técnica de RMf possibilita a identificação das áreas de Wernicke e de Broca, responsáveis pela linguagem. Tais áreas podem sofrer translocação devido ao crescimento de um tumor em hemisfério dominante de funções primárias (NADKARNI et al., 2015). Para determinar esta lateralidade das ativações, é necessário realizar um processamento nos sinais de RMf, além de criar paradigmas adequados para cada paciente, de forma que os resultados obtidos sejam o mais próximo possível do verdadeiro.

O método de avaliação mais comum da RMf para classificação de lateralidade hemisférica cerebral em área de linguagem é qualitativo, ou seja, o médico avalia imagens de forma visual (BENJAMIN et al., 2017). Isso significa que, em alguns casos nos quais as áreas de ativação são presentes em ambos os hemisférios (atividade bilateral), é difícil determinar as áreas de ativação que poderiam comprometer funções primárias do paciente (NORRELGEN et al., 2015). A existência de uma ferramenta computacional que realize uma avaliação quantitativa para a classificação da lateralidade tornaria o diagnóstico mais simples e confiável (GAZIT et al., 2016).

Nos últimos anos, abordagens de Aprendizado de Máquina (AM) vêm sendo utilizadas na área de diagnóstico por imagem para processamento, segmentação e análise de imagens médicas. Dentre alguns exemplos, a técnica de Support Vector

(21)

(TRAMBAIOLLI; LORENA; ANGHINAH, 2009), a regressão logística foi utilizada para identificação de lateralidade hemisférica cerebral (GAZIT et al., 2016), os algoritmos

fuzzy para identificação de câncer de próstata (TOSATTI et al., 2008), a mineração de

dados para identificação de câncer de mama (HOLSBACH; FOGLIATTO; ANZANELLO, 2014) e a análise de componentes independentes para planejamento pré-operatório de linguagem (BRANCO et al., 2016), dentre outros.

Este estudo se propõe a desenvolver um método para determinar a lateralidade hemisférica de áreas de linguagem em exames de RMf utilizando uma técnica de Aprendizado de Máquina. A partir da extração de sinais de RMf de exames de sujeitos saudáveis com lateralidade hemisférica de linguagem bem definida e sujeitos acometidos com tumores cerebrais em áreas próximas à da linguagem, uma rede neural artificial do tipo Multilayer Perceptron (MLP) é treinada e testada. Além de o trabalho oferecer uma nova forma de obter o valor de Índice de Lateralidade (IL) para cada sujeito, também contribui para o estudo das limitações e potencialidades das abordagens de Aprendizado de Máquina para a solução deste problema.

(22)

OBJETIVOS

O objetivo principal deste trabalho é avaliar a aplicação de uma técnica de detecção da lateralidade hemisférica cerebral em área de linguagem utilizando Aprendizado de Máquina.

Objetivos Específicos

▪ Extrair os coeficientes de ativação dos hemisférios esquerdo e direito de cada sujeito utilizando dados de RMf;

▪ Determinar o Índice de Lateralidade a partir do cálculo de voxels ativos em cada região examinada, de cada sujeito analisado;

▪ Determinar a lateralidade hemisférica do sujeito por meio de inspeção visual realizada por médico neurorradiologista;

▪ Configurar a arquitetura de uma Rede Neural Artificial do tipo Multilayer

Perceptron com os dados obtidos dos exames de RMf dos dois grupos de

sujeitos (saudáveis e com lesões), cujas ativações de linguagem possuem, respectivamente, lateralidade hemisférica bem definida e de difícil interpretação, para treinamento e validação da rede;

▪ Comparar os valores obtidos pelo cálculo do Índice de Lateralidade e pela inspeção visual do médico especialista com os resultados gerados pela Rede Neural Artificial.

(23)

FUNDAMENTOS TEÓRICOS

Para descrever detalhadamente as etapas deste estudo, se faz necessária a descrição dos principais conceitos utilizados neste trabalho, principalmente em relação à aquisição de imagens por RMN, e ao funcionamento de uma rede neural artificial.

3.1. RESSONÂNCIA MAGNÉTICA FUNCIONAL

A imagem por RMN foi uma tecnologia descoberta em várias etapas diferentes da história, e por vários cientistas ao redor do mundo. Em meados de 1950, Edward Purcell e Felix Bloch descreveram o efeito da ressonância magnética nuclear em sólidos e líquidos (parafina e água), ganhando o prêmio Nobel de Física por isso (GIL; GERALDES, 2002). Mais tarde, em 1970, Raymond Damadian demonstrou que as constantes de relaxação da água são bastante diferentes entre tumores malignos e tecidos saudáveis. Assim, nesta mesma década de 70, Paul Lauterbur e Peter Mansfield conseguiram gerar a primeira imagem por RMN da história (SLAVKOVSKY; UHLIAR, 2004). A partir de então, a técnica sofreu constantes mudanças até chegar à tecnologia atual, sendo um dos exames de imagem com maior qualidade diagnóstica na Medicina.

A tecnologia das imagens por RMN é baseada na interação entre um campo magnético externo e os átomos do corpo humano, ou – em outras palavras – “é um fenômeno em que partículas, contendo momento angular e momento magnético, exibem um movimento de precessão quando estão sob ação de um campo magnético” (MAZZOLA, 2009, p. 2).

(24)

Quando um sujeito exerce a função de leitura, compreensão e expressão da linguagem, por exemplo, o cérebro ativa regiões conhecidas como áreas de Wernicke e de Broca. Uma vez que o cérebro sofre uma maior oxigenação cerebral durante certas atividades, é possível mapear estas regiões através de técnicas sensíveis a este fenômeno. Assim, é possível determinar as regiões em que o paciente possui as funções primárias alocadas (HUETTEL; SONG; McCARTHY, 2004).

A RMf é uma modalidade de exame que se baseia no chamado efeito BOLD (Blood-Oxygenation-Level Dependent). Em 1936, o ganhador do Nobel de Química, Linus Pauling, descobriu em seus estudos que a molécula de hemoglobina possuía propriedades magnéticas que diferiam dependendo do seu nível de oxigênio. Desta forma, a hemoglobina oxigenada é diamagnética, enquanto a hemoglobina desoxigenada é paramagnética. Assim, a alteração da susceptibilidade magnética do sangue em um campo magnético causa defasamento de rotação, resultando em um decaimento de magnetização, que depende da constante de tempo de relaxação T2*. Pelo fato de o sangue desoxigenado afetar a susceptibilidade magnética, sequências de pulsos sensíveis a T2* mostram maior intensidade de sinal de RMN quando o sangue é altamente oxigenado, e menor intensidade de sinal de RMN nas regiões nas quais ele é altamente desoxigenado (HUETTEL; SONG; McCARTHY, 2004).

Deve-se esclarecer que, na investigação de fluxo sanguíneo em áreas cerebrais, o objeto de estudo são as demandas metabólicas de neurônios ativos, e não de atividade neuronal em si. A energia é necessária para manutenção e restauração de potenciais de membranas neuronais, necessárias para integração e sinalização. Mesmo pequenos aumentos na atividade neuronal podem resultar em um grande aumento da demanda de energia local. Por existirem reservas escassas de energia no cérebro, ela deve ser fornecida continuamente através de suprimento de

(25)

sangue ao cérebro. As fontes primárias de energia são glicose e oxigênio, usadas para criar ATP (adenosina trifosfato) nas células cerebrais. O oxigênio é ligado às moléculas de hemoglobina e trocado por dióxido de carbono residual em capilares (HUETTEL; SONG; McCARTHY, 2004).

LINGUAGEM CEREBRAL E ÁREAS DE WERNICKE E BROCA

Desde o século XIX, o modelo amplamente difundido de arquitetura de cognição de linguagem é o modelo conexionista de Wernicke-Lichtheim. As principais áreas corticais que constam nesse modelo são Broca e Wernicke, conectadas pelo fascículo arqueado, e as áreas complementares do giro angular, os córtices auditório e visual primários (BUCHWEITZ; MOTA, 2015).

A área de Broca fica localizada no giro frontal inferior do cérebro e é responsável pela expressão da linguagem, pois contém os programas motores da fala. A área que agrega Broca também é conhecida como pars opercularis (área 44 de Brodmann), pars triangularis (área 45 de Brodmann) e pars orbitalis (área 47 de Brodmann), e tem sido relacionada à produção de linguagem, gramática, fluência de linguagem e sequenciamento (ARDILA; BERNAL; ROSSELLI, 2016).

A área de Wernicke fica localizada no giro temporal superior, giro supramarginal e giro angular, e é a área responsável pela compreensão e recepção da linguagem, o que significa que podemos ativá-la sem necessariamente falar ou se comunicar, bastando ouvir ou ler para isso. Esta área está envolvida no reconhecimento de palavras e em associações de linguagem (ARDILA; BERNAL; ROSSELLI, 2016).

No cérebro humano, as áreas de Broca e Wernicke coexistem, mas não necessariamente precisam estar localizadas no mesmo hemisfério cerebral. Na maior parte dos seres humanos, elas vão se originar no mesmo hemisfério e são ativadas conforme as atividades de linguagem praticadas. No entanto, esta topografia pode ser

(26)

alterada por diversos fatores fisiológicos, entre eles o desenvolvimento de tumores ou lesões cerebrais (HOU; BATHIA; CARPENTER, 2016). Lesões de crescimento lento mostram maior lateralização do que lesões de crescimento rápido (KUNDU et al., 2013). Isso se deve à capacidade cerebral de sofrer translocação de funções primárias, principalmente quando a lesão está alocada no hemisfério dominante (HOU; BATHIA; CARPENTER, 2016). Ou seja, o cérebro lentamente altera a região responsável por determinada função, de forma a preservá-la.

BILATERALIDADE HEMISFÉRICA

O fenômeno de bilateralidade ocorre quando as duas áreas responsáveis pela linguagem não se encontram no mesmo hemisfério. O surgimento de lesões cerebrais ou doenças, como tumores e epilepsia, pode ser responsável pela bilateralidade, embora também seja possível sua ocorrência no nascimento (ADCOCK, et al., 2003). Embora a bilateralidade seja comumente identificada através de exames de imagem, como a RMf, a literatura mostra que a comparação entre testes diferentes, como o Teste de Wada e a RMf, podem divergir em relação à bilateralidade do sujeito (ADCOCK, et al., 2003). Um sujeito com linguagem dominante no hemisfério esquerdo através do Teste de Wada, pode apresentar bilateralidade por RMf. Esta divergência está geralmente relacionada ao valor de threshold utilizado na RMf, e por isso a importância de se definir adequadamente os parâmetros do processamento de imagem. O domínio hemisférico da linguagem costuma ser estabelecido até os 5 anos de idade, contudo é possível ocorrer uma plasticidade tardia, aos 14 anos, ou ainda sua alteração na topografia durante a vida adulta, devido ao surgimento de lesões (ADCOCK, et al., 2003). Assim, o fenômeno de bilateralidade deve ser avaliado com especial atenção ao perfil do sujeito e aos parâmetros utilizados durante a análise dos dados.

(27)

APRENDIZADO DE MÁQUINA E REDE NEURAL ARTIFICIAL MULTILAYER

PERCEPTRON

A Inteligência Artificial (IA) visa imitar funções cognitivas humanas e está trazendo uma mudança significativa para a área da saúde, impulsionada pelo aumento da disponibilidade de dados e pelo rápido progresso das técnicas de análise. As técnicas populares de IA incluem métodos de Aprendizado de Máquina para dados estruturados, como máquina de vetores de suporte (Support Vector Machine, SVM), Redes Neurais Artificiais (RNA), e aprendizado profundo (Deep Learning), como processamento de linguagem natural para dados não estruturados (JIANG et al., 2017).

Aprendizado de máquina é uma das formas de IA utilizadas na atualidade para criar algoritmos que desenvolvem capacidades de aprendizado independente. Existem diversas técnicas de AM, como Máquinas de Vetores de Suporte, Regressão Logística, Árvore de Decisão e Regressão, Redes Neurais Artificias, dentre outras (FACELI et al., 2011). A técnica de AM escolhida para este trabalho é RNA do tipo

Multilayer Perceptron (MLP). As RNAs são um dos tipos de algoritmos mais utilizados

na literatura médica para resolução de problemas de detecção e classificação, conforme apresenta o gráfico de trabalhos publicados na literatura médica na Figura 1.

(28)

Figura 1. Algoritmos de aprendizado de máquina utilizados na literatura médica

Fonte: Jiang; et al. (2017, p. 234)

Uma RNA é uma estrutura computacional projetada para mimetizar a maneira pela qual o cérebro realiza uma particular tarefa de seu interesse. Os principais fatores que diferem as RNAs das redes neurais naturais são: 1) as redes neurais naturais não transmitem sinais negativos; 2) sua ativação é medida pela frequência com que emite pulsos – frequência essa de pulsos contínuos e positivos; 3) não são uniformes, e apresentam uniformidade somente em alguns pontos do organismo; 4) seus pulsos não são contínuos (VIEIRA et al., 2003).

A forma de organização dos neurônios em uma RNA (topologia) está intrinsecamente ligada ao problema que se deseja solucionar e é fator importante na definição da arquitetura a ser utilizada. Geralmente, as RNAs possuem uma camada de entrada, usada para receber os estímulos externos, e podem apresentar ou não camadas intermediárias. Um exemplo de RNA com camada intermediária é a MLP (ALBANEZ, 2017).

As RNAs MLP possuem uma ou mais camadas ocultas, também chamadas de camadas escondidas (hidden layer), de neurônios cuja função é processar os sinais

(29)

de entrada (input layer) antes de enviá-los aos neurônios de saída (output layer). Apesar de maior complexidade, essa arquitetura possibilita uma melhor qualidade de treinamento, pois a disposição dos neurônios com mais camadas possibilita resolver problemas não linearmente separáveis (ALBANEZ, 2017). Na RNA MLP cada neurônio recebe entradas a partir de camadas anteriores, com fluxo unidirecional de informações para a saída (PRATOLA; FRATE; LICCIARDI, 2011). O número de nós nas camadas escondidas define a complexidade e o poder da rede neural a um dado treinamento (KAVZOGLU, 2009). Cada neurônio desse tipo de rede possui uma função de ativação não-linear e diferençável, tornando possível o cálculo do gradiente responsável pela indicação da direção de ajuste de pesos durante o treinamento. Os neurônios das camadas escondidas são responsáveis pelo poder de generalização da rede e adicionam-se uma ou mais camadas para este ajuste (HAYKIN, 2003). O número de neurônios nas camadas de entrada e saída segue as características do problema. No entanto, a melhor maneira de se estimar o número de neurônios nas camadas escondidas é através da tentativa e erro (ALBANEZ, 2017).

As RNAs já se mostraram bastante eficazes em estudos médicos. Nos estudos de Albanez (2017) a rede neural de pulso acoplado foi utilizada para segmentação de imagens médicas. Weiner et al. (2017) utilizou a rede neural para prognóstico de doença de Alzheimer. A rede neural baseada em sistemas fuzzy foi utilizada no trabalho de Fernandes (2007) para classificação de calcificações em mamografias, e no trabalho de Cosma et al. (2016) para previsão de estágio patológico em pacientes com câncer de próstata. Estes estudos mostram a ampla utilização das RNAs na identificação de patologias, o que contribui para obter novas formas de diagnóstico médico.

(30)

O neurônio é a unidade de processamento fundamental de uma RNA. Cada terminal de entrada do neurônio (que representa os dendritos em um neurônio real) recebe um valor. Esses valores recebidos são ponderados e combinados por uma função matemática fa, que equivale ao processamento realizado pelo somatório

(Figura 2). A saída da função é a resposta do neurônio para a entrada. Se supormos que o objeto x, com d atributos, representado na forma de vetor como x = [x1, x2, ...,

xd]t e um neurônio, com d terminais de entrada, cujos pesos são representados na

forma vetorial como w=[w1, w2, ..., wd], a entrada total recebida pelo neurônio u pode

ser definida pela Equação 1 (FACELI et al., 2011):

𝑢 = ∑

𝑑𝑗=1

𝑥

𝑗

𝑤

𝑗 (Equação 1)

Figura 2. Modelo de neurônio computacional

Fonte: HAYKIN, 2003.

O modelo que mais se aproxima da saída de um neurônio biológico pode ser matematicamente descrito pela função sigmoidal (conforme Figura 3.c), que é uma curva que apresenta uma função monotômica crescente, contínua e com propriedades assintóticas. Essas características são responsáveis por gerar valores graduais e não lineares num intervalo de amplitude de 0 a 1, o que se torna importante no controle do

(31)

aprendizado deste tipo de rede. A arquitetura da rede restringe-se ao tipo de problema no qual ela poderá ser utilizada – número de camadas, número de nós em cada camada e conexão entre os nós (HELEGDA, 2014). Além da função sigmoidal, existem também as funções limiar (binária) e linear. O uso da função linear identidade implica retornar como saída o valor de u (Equação 1), enquanto na função limiar, seu valor define quando o resultado da função será igual a 1 ou 0 (alternativamente, pode-se empregar o valor -1). Quando a soma das entradas recebidas ultrapassa o limiar estabelecido, o neurônio torna-se ativo (FACELI et al., 2011).

Fonte: FACELI et al., 2011 (adaptado)

A função linear (a), como é possível ver no gráfico da Figura 3, é uma função crescente definida pela equação:

𝑓(𝑥) = 𝑥 (Equação 2) Na função limiar (b), a saída do neurônio assume valor 0 quando seu resultado for negativo, e 1 caso contrário (por isso é também chamada de função binária), conforme Equação 3 (AMBROSIO, 2002).

(32)

𝑓(𝑢) = {1 𝑠𝑒 𝑢 ≥ 0

0 𝑠𝑒 𝑢 < 0 (Equação 3)

A função sigmoidal (c), ou função logística, é descrita pela Equação 4, que é uma função estritamente crescente (AMBROSIO, 2002).

𝑓(𝑢) =

1

1+ 𝑒−𝑎𝑢 (Equação 4)

Onde a é o parâmetro de inclinação da função (quanto maior o valor de a, mais inclinada se torna a curva) (AMBROSIO, 2002).

O treinamento é composto por um processo iterativo de ajustes aplicado aos seus pesos, que resulta na habilidade da rede em aprender por intermédio de exemplos e fazer inferências com o que aprendeu – melhorando gradativamente seu desempenho. Este aprendizado ocorre quando a rede neural converge, atingindo uma solução generalizada para um determinado problema. O algoritmo back-propagation é baseado no aprendizado supervisionado através de correção de erros, em que um padrão de entrada é apresentado, gerando uma resposta de cada unidade (nó) que, por sua vez, se propaga como uma nova entrada, e assim sucessivamente, até atingir a camada de saída e gerar uma resposta final. A configuração da arquitetura permite determinar o número de camadas escondidas, o mínimo erro que a rede deve atingir para cessar a reprodução de gerações, além de informar o número de épocas necessárias para atingir este mínimo erro (HELEGDA, 2014).

Para treinar o algoritmo back-propagation é necessário seguir um conjunto de regras bem definidas para a devida solução de um problema de aprendizado. Para a

(33)

execução de uma tarefa específica, a rede precisa aprender e adaptar-se, e esse pode ser considerado um problema devido a atualização de seus pesos sinápticos. O

back-propagation realiza uma retropropagação do erro da saída para as camadas

anteriores, e esse erro é o resultado da comparação entre a saída desejada e a saída real da rede. Esta retropropagação, em conjunto com uma função limiar de valores fracionários, possibilita a representação de funções não-lineares, resultando no treinamento da função como um todo. O esquema de aprendizado supervisionado consiste em uma saída para toda entrada apresentada à rede, sendo o valor da saída conhecido durante a etapa de treinamento. Por esta razão, é possível avaliar a resposta obtida com o respectivo valor desejado. Assim, a rede compara continuamente o erro entre a resposta atual e a resposta desejada, buscando ser o menor possível. Essas interações sucessivas são chamadas de épocas. A arquitetura da rede possibilita realizar os ajustes apropriados nos pesos e nos limiares das funções de ativação de cada conexão de forma a reduzir a diferença, até a convergência para o valor final desejado (HELEGDA, 2014).

Para utilizar o algoritmo back-propagation em situações práticas, é necessário um grande número de amostras previamente selecionadas e rotuladas como parâmetros de treinamento. O objetivo principal da utilização de uma RNA é obter um modelo que generalize um problema. Isto é, criar uma RNA capaz de responder a desconhecidas questões (padrões inéditos). Esta habilidade em avaliar novos valores pode ser interpretada como uma capacidade de armazenar conhecimento baseado em aprendizagem (HELEGDA, 2014).

ARQUITETURA DA REDE NEURAL

Uma RNA é caracterizada por dois aspectos básicos: arquitetura e aprendizado. Enquanto a arquitetura está relacionada ao tipo e número de unidades

(34)

de processamento e à forma como os neurônios estão conectados, o aprendizado diz respeito às regras utilizadas para o ajuste dos pesos da rede e que informação é utilizada pelas regras (FACELI et al., 2011).

O primeiro passo, portanto, para que uma RNA induza a um modelo para o conjunto de dados, é a definição de sua arquitetura, que geralmente é realizada por um processo de tentativa e erro, quando diferentes configurações são avaliadas antes de escolher uma delas. Nesse processo de busca, cada arquitetura investigada deve ser treinada e avaliada em relação a sua acurácia preditiva para o conjunto de dados de treinamento. Comumente a arquitetura é definida por um processo de busca exaustiva, que pode ser realizada por diversas abordagens, como a empírica (busca no espaço de diversas arquiteturas), a meta-heurística (combinação de características entre diversas RNAs), a poda ou pruning (utilização de um algoritmo de poda para remover conexões e neurônios irrelevantes) e a construtiva (insere novos neurônios gradualmente para melhorar a rede) (FACELI et al., 2011). A abordagem deste trabalho foi a empírica, onde todos os dados de treino são utilizados em diversas arquiteturas diferentes a fim de definir o modelo mais adequado para o conjunto de dados.

O software utilizado no trabalho, Orange Data Mining1, oferece alguns

recursos que possibilitam a configuração da arquitetura da rede neural, de forma a

(35)

adaptá-la aos dados utilizados. Dentre os parâmetros que definem a arquitetura de uma rede neural, existem a função de ativação, a amostragem e a topologia da rede (número de neurônios nas camadas escondidas). A configuração do número adequado de neurônios depende de alguns fatores, como número de exemplos de treinamento, quantidade de ruído nos exemplos, complexidade dos dados e sua distribuição estatística, por exemplo (FACELI et al., 2011).

A função de ativação permite que pequenas mudanças nos pesos sinápticos das redes neurais causem uma pequena alteração no output (saída do algoritmo), o que é fundamental para o correto aprendizado da rede neural. A função de ativação basicamente decide se um neurônio deve ser ativado ou não. A função de ativação é a transformação linear que fazemos ao longo do sinal de entrada. A saída transformada é então enviada para a próxima camada de neurônios como uma nova entrada. Uma vez que não temos a função de ativação, os pesos sinápticos fazem uma transformação linear, que é simples de resolver, mas limitada em relação a problemas complexos. Uma rede neural que não possui uma função de ativação é somente um modelo de regressão linear, e por isso a função de ativação – que faz uma transformação não-linear nos dados de entrada – torna-se capaz de aprender e executar tarefas mais complexas (NIELSEN, 2015).

Existem diversas funções de ativação disponíveis para a implementação de RNAs. O software Orange disponibiliza quatro opções de “Activation” (função de ativação): Identity, Logistic, tanh e ReLu; e também três opções de “Solver” (solução para otimização de peso): L-BFGS-B (versão de memória limitada do algoritmo de Broyden–Fletcher–Goldfarb–Shanno), SGD (Stochastic Gradient Descendent) e ADAM (Adaptive Moment Estimation). O significado de cada opção encontra-se na Tabela 1:

(36)

Tabela 1. Descrição dos dois componentes de arquitetura da RNA MLP do Orange.

Activation

Identity

Ativação sem operação, útil para implementar gargalos lineares, também chamado de ‘ponto de estrangulamento’, designa um componente que limita o desempenho ou a capacidade de todo um sistema (BARROS; MOCCELLIN, 2004).

Logistic

Função sigmoide logística. Essa função gera uma saída não linear que tenta empurrar valores de y para os extremos em um gráfico. É útil para classificar valores para uma classe específica.

tanh

Função tangente hiperbólica. É uma função escalonada da função sigmoide, mas que mantém uma simetria em relação à origem do gráfico, variando de -1 a 1. É contínua e diferençável em todos os pontos e é não linear, facilitando a retropropagação

(back-propagation) nos erros.

ReLu

Função de unidade linear retificada. É uma função que, por ser não linear, pode facilmente copiar os erros para trás e ter várias camadas de neurônios ativados. Ela não ativa todos os neurônios ao mesmo tempo, tornando a rede neural esparsa e consequentemente mais eficiente.

Solver

L-BFGS-B Otimizador ‘n’ na família de métodos

quase-Newtonianos (BYRD et al., 1995).

SGD Descida de gradiente estocástico (TADDY, 2019). Adam Otimizador baseado em gradiente estocástico

(DIEDERIK; BA, 2014).

A função de ativação Sigmoid, conforme é retratado na Figura 4(a), varia de 0 a 1 e mostra que uma pequena mudança em x resultaria em uma grande mudança em y. É uma função geralmente utilizada na camada de saída da classificação binária. Já a função de ativação tanh, representada na Figura 4(b), varia entre -1 e 1, e seus valores de saída são centralizados em torno de zero. Geralmente é utilizado em camadas ocultas. A função de ativação ReLu, representada na Figura 4(c), varia entre 0 e o próprio valor que entra no neurônio. É computacionalmente mais vantajoso se comparado às funções Sigmoid e tanh, pois possui um processamento menos exigente. Costuma ser uma função padrão para as camadas ocultas (GAJAWADA, 2019).

(37)

Figura 4. Modelos gráficos de algumas funções de ativação: (a) Sigmoid; (b) tanh; (c) ReLu.

(a) (b) (c)

Fonte: GAJAWADA, 2019 (Adaptado).

Além dos parâmetros listados acima, existem também o número de neurônios por camada escondida, a regularização e o número máximo de interações, todos configuráveis pelo usuário. O número de camadas escondidas é definido pelo i-ésimo elemento que representa o número de neurônios na i-ésima camada oculta. O termo de regularização é o parâmetro de penalidade L2, que representa o valor de alfa (ORANGE Data Mining, 2015). Para definir qual o melhor modelo de rede neural a ser utilizado, todas as combinações de ativação e otimização de peso foram testadas.

Um dos obstáculos para utilizar redes multicamadas era a ausência de um algoritmo para o treinamento dessas redes, o que foi superado com a proposta de um algoritmo de treinamento baseado em um gradiente descendente, denominado

back-propagation. Para se utilizar esse algoritmo, é necessário que a função de ativação

seja contínua, diferençável e não decrescente, e a função de ativação do tipo sigmoidal obedece a esses requisitos (FACELI et al., 2011).

(38)

O treinamento do algoritmo back-propagation é baseado na regra delta, que leva em consideração a iteração de duas fases, a fase para frente (forward) e a fase para trás (backward). Na fase forward, cada objeto de entrada é apresentado à rede, sendo estes objetos recebidos por cada um dos neurônios da primeira camada intermediária da rede (ponderado pelos pesos correspondentes). Cada neurônio nessa camada aplica a função de ativação, produzindo um valor de saída que será utilizado como um valor de entrada para as camadas seguintes. O processo continua até que os neurônios da camada de saída produzam um valor de saída que, comparado ao valor desejado para a saída desse neurônio, corresponda a um erro que será utilizado na fase backward, a fim de ajustar os pesos de entrada. O ajuste dos pesos de uma rede prossegue da camada de saída até a primeira camada intermediária (FACELI et al., 2011), conforme é ilustrado na equação abaixo:

𝑤𝑗𝑙(𝑡 + 1) = 𝑤𝑗𝑙(𝑡) + 𝜂𝑥𝑗𝛿𝑙 (Equação 5)

Nesta equação,

w

jl representa o peso entre um neurônio l e o j-ésimo

atributo de entrada ou saída do j-ésimo neurônio da camada anterior, 𝛿𝑙

indica o erro

associado ao l-ésimo neurônio e xj indica a entrada recebida por esse neurônio (o

j-ésimo atributo de entrada ou a saída do j-j-ésimo neurônio da camada anterior) (FACELI et al., 2011).

Os ciclos de apresentação dos dados de treinamento e eventuais ajustes de pesos no algoritmo back-propagation são iterados até que seja atingido um critério de parada. Podem ser utilizados diferentes critérios de parada, como por exemplo um número máximo de ciclos ou uma taxa máxima de erro. Para reduzir a ocorrência de

overfitting (quando uma RNA prevê muito bem os dados de treino na qual foi treinada,

(39)

aumentando após comportar-se em queda), parte do conjunto de treinamento é usualmente separada, formando um conjunto de validação. Os dados do conjunto de validação são apresentados à rede a cada ‘x’ número de ciclos, a fim de avaliar a taxa de erro da rede para dados que não fazem parte do conjunto de treinamento (dados considerados inéditos para a rede). Se estas taxas de erro forem plotadas em um gráfico, se observa que no início do treinamento elas tendem a cair. Entretanto, em um dado momento elas começam a subir, o que pode ser um indício de que a rede parou de aprender e está se tornando superajustada (daí o termo overfitting) aos dados de treinamento. Neste ponto, o treinamento da rede deve ser finalizado. Esse processo de encerramento do treinamento é conhecido como validação cruzada ou

early stop (FACELI et al., 2011).

MÉTODOS DE AVALIAÇÃO QUANTITATIVA DE LATERALIZAÇÃO DA LINGUAGEM EM RMf – ESTADO DA ARTE

Antes do início dos estudos realizados por RMf, os procedimentos mais utilizados para classificação de lateralidade de linguagem eram o Teste de Wada e a Eletrocorticografia, ambos métodos invasivos (PARTOVI et al., 2012) e outros não invasivos, como exames de PET e medidas eletrofisiológicas da linguagem, mas nenhum chega a resultados tão satisfatórios como a RMf (NORRELGEN et al., 2015). Embora atualmente a RMf seja amplamente utilizada sem o uso de parâmetros quantitativos, a confiabilidade do diagnóstico médico na determinação da lateralidade e a superioridade da RMf frente ao teste de Wada a torna bastante utilizada (BENJAMIN et al., 2017).

Uma forma de detectar a probabilidade de a área da linguagem estar localizada em determinado hemisfério é o chamado Dichotic Listening (DL). Existem várias versões da DL, mas todas são baseadas no princípio de que as projeções

(40)

corticais auditivas contralaterais são mais fortes do que as projeções ipsilaterais. Assim, quando dois estímulos de fala concorrentes são apresentados a cada ouvido simultaneamente, muitas vezes, a média de respostas dos estímulos ao ouvido contralateral do hemisfério dominante da área de linguagem mostra vantagem sobre os estímulos apresentados ao ouvido ipsilateral. Ou seja, em indivíduos com dominância típica do idioma do lado esquerdo há, portanto, uma vantagem do ouvido direito. Este procedimento é mais fácil de realizar em crianças, pois não envolve leitura. Em vários estudos, descobriu-se que o DL tem boa concordância com o Teste de Wada (Hugdahl, 1997)¹, as imagens PET (Hugdahl, 1999)¹, RMf (van der Noort, 2008)¹ e as medidas eletrofisiológicas da linguagem (Brancucci, 2004-2005)¹, (¹citados por NORRELGEN et al., 2015).

No estudo de Norrelgen et al. (2015) foram utilizados dois paradigmas de RMf e dois índices de DL, e não houve resultados contraditórios entre ambos. A combinação de dados de RMf e DL é útil, pois reduz o risco de obter resultados incorretos. Mas os autores afirmam que a validade e confiabilidade dos dados de RMf dependem profundamente da tarefa de linguagem utilizada. A potencial limitação comentada no estudo de Norrelgen et al. (2015) é associada à análise de dados de RMf por inspeção visual dos padrões de ativação, ou seja, uma análise qualitativa.

Entre os métodos utilizados para determinar a lateralidade da linguagem, o Índice de Lateralidade é o mais amplamente aplicado, pois é uma análise quantitativa e que, portanto, torna o processo mensurável, apesar de diversas questões metodológicas que devem ser levadas em conta em sua determinação (SEGHIER, 2008).

O estudo de Kosla et al. (2012) apresenta diversos pacientes submetidos a procedimentos cirúrgicos de ressecção de tumores cerebrais, que tiveram suas

(41)

linguagens avaliadas antes e após a cirurgia. Em todos os pacientes foi realizada a ressecção do tumor, e suas falas foram avaliadas antes e depois do procedimento cirúrgico. Em vários pacientes foi analisada e observada disfasia (distúrbio da fala; dificuldade de estruturar ordenadamente as frases) após a cirurgia, o que mostra que o método de classificação de lateralidade a partir do cálculo do índice de lateralidade não garante que o paciente não terá prejuízos de linguagem no pós-cirúrgico.

Em contrapartida, Benjamin et al. (2017) ressalta a confiabilidade do diagnóstico médico na determinação de lateralidade, ao comparar uma análise quantitativa a uma análise qualitativa. A análise quantitativa foi feita com o cálculo do Índice de Lateralidade, usando voxels ativos de cada hemisfério. Já a análise qualitativa foi realizada através da avaliação clínica de três médicos especialistas da área, que são professores e publicam no campo da epilepsia (uma das áreas mais exploradas quando tratamos de lateralidade da linguagem). As avaliações médicas tiveram concordância entre 84 e 89%, significando que mesmo uma análise qualitativa pode ser confiável.

No estudo de Partovi et al. (2012) se concluiu que, se uma massa tumoral for detectada dentro de uma distância crítica das áreas de Broca e Wernicke do lado esquerdo, então uma RMf deve ser realizada a fim de verificar a localização das ativações. Esta distância crítica foi definida como a alteração no sinal T1 relacionada ao tumor, com ou sem realce pelo contraste. Outra evidência do estudo é a alta sensibilidade e especificidade da RMf para a lateralização da linguagem, mesmo quando se usam paradigmas diferentes e configurações experimentais diferentes – contrapondo os estudos de Norrelgen et al. (2015). Para determinar a lateralização da linguagem, o estudo utiliza o cálculo do IL por meio do software BrainVoyager, e

(42)

demonstra a viabilidade de realizar RMf para classificação de lateralidade da linguagem através do cálculo de IL das áreas de Wernicke e de Broca.

Os estudos de Partovi et al. (2012) e Kundu et al. (2013) mostram que a proximidade das áreas de ativação, como a área de Broca, com a região tumoral pode resultar em déficit de linguagem. Desta forma, tumores maiores são relacionados a um índice maior de bilateralidade, e que sujeitos que possuem uma curta distância entre o tumor e a área de linguagem adquirem afasia (perda total ou parcial da fala ou da compreensão da linguagem). Isso se deve à fisiologia do tumor. Lesões de crescimento lento mostram mais lateralização que lesões de crescimento rápido, o que poderia explicar o insucesso da RMf nos estudos de Kosla et al. (2012).

Na avaliação pré-cirúrgica da linguagem, tanto a localização como a lateralização das áreas funcionais são essenciais para a prevenção de déficits pós-operatórios, como afasia e disartria (dificuldade na pronúncia das palavras). O padrão-ouro para lateralização de linguagem era o teste de Wada. No entanto, este procedimento possui desvantagens, pois além de ser invasivo, pode apresentar complicações clínicas como sangramentos, infecção, além de desconforto para o paciente. Além disso, a interpretação dos resultados de Wada pode ser problemática porque não há nenhum procedimento padrão para testar a linguagem e a memória, e por isso uma minoria de pacientes pode produzir falsa lateralização. Ao longo dos anos, várias medidas quantitativas de lateralização baseadas na RMf foram propostas. Em sua forma mais básica, um Índice de Lateralização é um valor entre -1 e 1 que detalha a relação de atividade entre aglomerados homólogos dos hemisférios esquerdo e direito (GAZIT et al., 2016).

Como os neurocirurgiões estão tipicamente interessados em classificar os pacientes como tendo lateralização de linguagem esquerda, direita ou bilateral, os

(43)

algoritmos de classificação podem ser de grande ajuda. Tradicionalmente, esses métodos usavam um limite de ativação para classificar os sujeitos em grupos de lateralidade, mas essa classificação rigorosa pode ser arriscada, pois as classificações errôneas são inevitáveis. Em vez disso, fornecer à equipe clínica as probabilidades de lateralização do processamento de linguagem poderia ser mais benéfico. Tal tarefa pode se beneficiar da utilização de algoritmos probabilísticos de Aprendizado de Máquina.

O estudo de Gazit et al. (2016) utilizou a tarefa de geração de verbos para estimular a ativação repetida de áreas de linguagem com RMf. Utilizando uma abordagem leave-one-out e Regressão Logística, o conjunto de dados de cada sujeito que realizou o exame de Wada foi removido dos dados e o algoritmo teve que aprender com os dados dos demais participantes (conjunto de treinamento). Finalmente, a classificação do sujeito removido usando os parâmetros aprendidos do conjunto de treinamento foi avaliada contra o resultado de Wada (conjunto de teste). Esta é uma abordagem utilizada em Aprendizado de Máquina, principalmente para determinar o desempenho do algoritmo.

O estudo de Song e Chen (2014) utiliza Aprendizado de Máquina para determinar a lateralidade da linguagem em pacientes submetidos à RMf. Os voxels identificados com ativação foram usados para treinar uma Support Vector Machine. Um método baseado em SVM foi desenvolvido para analisar de forma unificada dados de RMf em resting state (estado de repouso) e dados relacionados à tarefa. A principal inovação do trabalho de Song e Chen foi formular o mapeamento de voxels ativos e conectados como um processo de detecção de outliers, com base no qual, a análise de dados de resting state ou de tarefa é realizada usando a mesma estrutura de Aprendizado de Máquina.

(44)

Portanto, o referencial bibliográfico mostra que análises qualitativas, apesar de muito utilizadas, não são suficientes para determinar com confiança a lateralidade hemisférica da linguagem em alguns pacientes. Para uma análise quantitativa simples, usa-se mais comumente o cálculo do IL dos sujeitos, de forma a quantificar as ativações cerebrais. Mas, em casos mais complicados, onde nem a inspeção visual e nem a análise quantitativa dão o suporte necessário para definir com precisão a lateralidade dessas áreas, o Aprendizado de Máquina pode auxiliar na classificação da lateralidade das ativações, servindo como uma complementação para a rotina diagnóstica de planejamentos pré-cirúrgicos de ressecção de lesões cerebrais.

PROCESSAMENTO DE IMAGENS DE RMf

Os dados de RMf são muito sensíveis a qualquer variável que interfira na aquisição das imagens, como artefatos provenientes de fontes de ruído (HUETTEL; SONG; MCCARTHY, 2004). A análise de dados em RMf envolve diversos fatores, como a correção de movimento, a correção temporal, a normalização espacial, a filtragem temporal, as análises estatísticas e, finalmente, a visualização dos resultados. O objetivo do processamento das imagens de RMf é remover, ao máximo, qualquer interferência que possa prejudicar a análise dos dados.

Em um exame de RMf é gerado um sinal de ativação no cérebro todo, que pode ser visualizado voxel a voxel. Um dos softwares mais utilizados para este processamento é o AFNI (Analysis of Functional NeuroImages), versão 19.1.06 “Caligula” (COX, 1996). Um exemplo das etapas de pré-processamento de um exame de RMf é mostrado na Figura 5.

(45)

Figura 5. Diagrama das principais etapas de pré-processamento.

Fonte: Esper (2016).

Para obter os sinais de interesse, na busca pelas ativações cerebrais, é criada uma máscara que tem como objetivo delinear a região na qual se busca obter o sinal. Cada voxel possui um sinal que pode ser caracterizado por quatro elementos: uma constante (𝛽0), uma tendência linear (𝛽1), uma função senoide (que representa modelos de ativações conhecidas) (𝛽2), e um ruído (𝑒𝑛), (Figura 6).

Fonte: A autora Identificação de Outliers Correção de Movimentos Despiking Correção do Tempo de Aquisição Corregistro Escalamento Regressão Múltipla

(46)

Através de uma regressão múltipla desses valores, obtém-se a média de toda a região da máscara. Este sinal é incluído em uma matriz de design composta por todos os componentes do sinal, exceto o ruído. Essa matriz gera três valores de beta (um para cada elemento da representação do sinal). A média simples desses três valores de beta é considerada o coeficiente de ativação daquela região do cérebro do paciente, conforme equação:

𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝐴𝑡𝑖𝑣𝑎çã𝑜 = 𝛽0+𝛽1+𝛽2

3 (Equação 6)

Utilizando o software AFNI é possível extrair o sinal de cada voxel da região desejada, seja em forma de onda, seja em valores de beta. Criando máscaras com as regiões que se deseja investigar, extrai-se o sinal resultante desses voxels, de forma a compor um mapa de ativações de áreas como Broca e Wernicke. Uma vez que a área de Broca é composta por três regiões anatômicas distintas, podem ser gerados três valores referentes à área de Broca, para cada hemisfério. O mesmo ocorre com a área de Wernicke. Assim, um paciente possui diversos valores de coeficientes de ativação, que são utilizados para calcular seu IL, bem como treinar uma máquina de aprendizado para obter resultados de lateralidade hemisférica cerebral.

(47)

METODOLOGIA

A proposta deste trabalho é avaliar a aplicação de uma técnica de Aprendizado de Máquina para classificação de lateralidade hemisférica cerebral em área de linguagem, a partir de dados de RMf. Para tal, foram extraídos coeficientes de ativação das regiões cerebrais referentes à linguagem para treinamento de uma RNA do tipo MLP. Os resultados obtidos foram comparados com o IL e com a análise visual de um médico neurorradiologista. Para isso, foram desenvolvidas as etapas representadas na Figura 7, que serão detalhadas a seguir.

(48)

Figura 7. Fluxograma das etapas da proposta.

Fonte: A autora.

BASE DE DADOS

Este estudo utilizou dados retroativos de 66 sujeitos submetidos a exames de RMf em duas diferentes instituições, classificadas como SM e GE. Destes 66 sujeitos analisados pelo médico neurorradiologista, somente 48 tiveram suas lateralidades definidas pela inspeção visual. Os demais 18 sujeitos não mostraram dados suficientes para a classificação de lateralidade por análise visual.

Dos 66 sujeitos, 31 pertencem ao grupo denominado SM, são adultos com patologias caracterizadas por lesão cerebral em hemisfério dominante, submetidos a exames de RMf para planejamento cirúrgico de ressecção de lesões cerebrais, sob o

Aplicação da Máscara Haskins

Obtenção do Coeficiente de Ativação para a região

desejada Cálculo do Índice de Lateralidade Configuração da RNA MLP (treino) com coeficientes adquiridos Validação da RNA MLP (teste) e Análise do Desempenho da rede Resultados obtidos Análise Visual Comparação dos resultados

(49)

CAAE: 61107016.3.0000.5330. O equipamento utilizado neste grupo de sujeitos é da marca Siemens, modelo Magneton Avanto 1,5T, localizado na cidade de Porto Alegre. As sequências de imagens utilizadas, nomeadas no padrão Siemens, foram: T1 estrutural “t1_mpr_tra” (TR: 1800ms, TE: 2,5ms), gradiente “gre_field_mapping” (TR: 400ms, TE: 7,4ms), ativação “act_MoCoSeries” (TR: 3650ms, TE: 30ms) e “EvaSeries_GLM” (TR: 3650ms, TE: 30ms), matriz de 208x256, FOV de 200x200mm, tamanho de voxel de 3,0x3,0x3,0mm.

Dentre os 66 sujeitos, 35 pertencem ao grupo denominado GE e são crianças saudáveis, em idade de leitura (entre 9 e 14 anos), vinculados ao projeto ACERTA sob o CAAE: 30895614.5.0000.5336, e submetidos a exames para identificação de área de linguagem. O equipamento utilizado neste grupo de sujeitos é da marca GE, modelo HDxT 3,0T, localizado na cidade de Porto Alegre. As sequências de imagens utilizadas foram: T1 estrutural (TR: 6,16ms, TE: 2,18ms), EPI (TR: 2000ms, TE: 30ms), matriz de 64x64, FOV de 220x220mm, tamanho de voxel de 3,44x3,44x3,60mm. Estes sujeitos foram selecionados por serem classificados como bons leitores e leitores regulares (sem apresentarem prejuízos em área de linguagem). Os sujeitos tiveram suas imagens de RMf processadas no software AFNI e foram disponibilizadas, já processadas, para este estudo.

Durante a aquisição dos exames, são realizadas diversas etapas para avaliação motora, de linguagem e somato-sensorial. Neste estudo foi avaliada, no grupo de sujeitos SM, somente a etapa de geração de verbos. A tarefa de geração de verbos consiste em citar substantivos durante o exame, enquanto o indivíduo é instruído a pensar em um verbo associado ao substantivo. Este processo é repetido até completar o total de palavras sugeridas.

(50)

No grupo de sujeitos GE, a etapa de linguagem avaliada foi a classificação de palavras. A tarefa de classificação de palavras consiste no sujeito classificar palavras surgidas em uma tela, em regulares, irregulares ou pseudopalavras.

No planejamento do equipamento Siemens, a tarefa consiste em 30 substantivos, sendo 10 irregulares e 20 regulares. As palavras são visualizadas pelo paciente a cada 4 segundos, e o baseline ocorre a cada 20 segundos. O baseline corresponde ao estado de repouso/devaneio do paciente, ocorrido durante a fase

resting state. Já no planejamento do equipamento GE, a tarefa consiste na

apresentação de 20 palavras regulares, 20 palavras irregulares e 20 pseudopalavras, com intervalo de apresentação de 10 segundos entre elas e o baseline de 189 segundos. É possível visualizar o paradigma das tarefas executadas em cada equipamento na Tabela 2:

Tabela 2. Paradigma das tarefas utilizadas durante aquisição das imagens.

Grupo de Sujeitos Nº Palavras irregulares Nº Palavras Regulares Nº Pseudo Palavras Timing Baseline Total palavras Intervalo entre palavras SM 10 20 __ 20 s 30 4 s GE 20 20 20 189 s 60 10 s

Os pacientes foram submetidos a 16 tarefas cada. Os paradigmas possuem diferentes grupos de palavras para que sejam realizadas diversas tarefas de linguagem. O objetivo de realizar mais de uma tarefa de linguagem é para visualizar as áreas de ativação do paciente em diferentes situações. Cada tarefa gera um coeficiente de ativação de linguagem, que será utilizado no estudo para o treinamento da RNA MLP.

(51)

EXTRAÇÃO DO COEFICIENTE DE ATIVAÇÃO

Para pré-processamento e extração dos dados foi utilizado o AFNI, um software gratuito para fins de pesquisa composto por um conjunto de programas de processamento para C, para análise e exibição de dados de RMf (Fonte: https://afni.nimh.nih.gov/).

Esta etapa consiste em extrair os valores referentes aos coeficientes de ativação gerados pelos sinais de ativações cerebrais, de sujeitos submetidos a exames de RMf com paradigma de linguagem, originados pelo software AFNI. Neste software existem diversas máscaras que podem compreender o cérebro todo, ou somente a região de interesse. Para este estudo foi utilizada uma máscara denominada Máscara Haskins, criada pelo grupo de estudos do Laboratório de Imagens da PUCRS (LABIMA) no software AFNI, que extrai o sinal das regiões Wernicke e Broca dos lados direito e esquerdo. As regiões de Broca foram denominadas, do lado esquerdo, como 56 (pars opercularis), 57 (pars orbitalis) e 58 (pars triangularis), e seus pares do lado direito como 90, 91 e 92, respectivamente. As regiões de Wernicke foram denominadas do lado esquerdo como 68 (giro temporal superior) e 69 (giro supramarginal), e seus pares do lado direito como 102 e 103, respectivamente. De cada uma dessas regiões são extraídos valores de coeficiente de ativação e, portanto, cada sujeito possui dez valores de coeficiente de ativação, cinco para cada hemisfério cerebral. Cada número gerado, por meio do comando do AFNI, representa a estimativa média do parâmetro para o contraste em questão, em todos os voxels fornecidos, dentro de uma máscara (referente à região cerebral analisada).

Cada voxel da imagem de RMf possui um sinal que pode ser visto em forma de gráfico de intensidade ao longo do tempo no AFNI, conforme Figura 8.

(52)

Figura 8. Exemplo de gráficos gerados por cada voxel de uma RMf.

Fonte: a autora.

A média desses sinais é comparado ao sinal de resting state. O resultado desta comparação gera um valor chamado de coeficiente de ativação (beta), conforme está representado na Figura 9. Este valor de beta é extraído do AFNI e neste trabalho é utilizado para treinar a rede neural.

Figura 9. Exemplo de gráficos gerados por cada voxel de uma RMf.

Fonte: a autora.

Estes coeficientes de ativação estão presentes para cada região de interesse do sujeito. Portanto, cada paciente possui 10 coeficientes de ativação, conforme representado pelos números das caixas brancas na Figura 10.

Referências

Documentos relacionados

45 Figure 18 - Study of the extract concentration in the phycobiliproteins extraction and purification using the mixture point composed of 10 wt% Tergitol 15-S-7 + 0.3

Detectadas as baixas condições socioeconômicas e sanitárias do Município de Cuité, bem como a carência de informação por parte da população de como prevenir

hospitalizados, ou de lactantes que queiram solicitar tratamento especial deverão enviar a solicitação pelo Fale Conosco, no site da FACINE , até 72 horas antes da realização

Esse sistema permite a obtenção de um composto orgânico com qualidades físicas, químicas e biológicas comprovadas, sendo o produto certificado pelo

Em estudos mais aprofundados, tem-se a análise dinâmica não linear geométrica de estruturas laminadas modeladas com elementos tridimensionais de barra considerando o efeito

Os doentes paliativos idosos que permanecem nas instituições privadas são encaminhados pelos hospitais em que estavam ou internados pelos próprios familiares

Para preparar a pimenta branca, as espigas são colhidas quando os frutos apresentam a coloração amarelada ou vermelha. As espigas são colocadas em sacos de plástico trançado sem

dois gestores, pelo fato deles serem os mais indicados para avaliarem administrativamente a articulação entre o ensino médio e a educação profissional, bem como a estruturação