Limiariza¸c˜ ao e interpreta¸c˜ ao de mapas

liberdade, a probabilidade de ocorrˆencia devido ao acaso de um valor qualquer u > F, F >0, pode ser calculada por (Spiegel et al.,2000):

P{u>F|ν₁, ν₂}= Γ

ν₁+ν₂ 2

Γν1

Γν2

2 ν

ν1 2

1 ν

ν2 2

Z ∞ F

u^ν²¹⁻¹(ν2+ν1u)⁻^ν¹⁺²^ν²du (2.40) Para simplifica¸cão, as probabilidades P{t > T|ν} e P{u > F|ν₁, ν₂} serão doravante simplesmente denominadasp-valores. Graficamente, estas probabilidades correspondem à

area sob as fun¸c˜oes de densidade de probabilidade das distribui¸c˜oesteF, respectivamente (Figuras2.7 e2.8).

Para um teste de hipóteses realizado em um único voxel o p-valor, correspondente à estat´ıstica T ou F, é a probabilidade de ocorrência de uma estat´ıstica com valor igual ou superior, meramente devido ao acaso, ou seja, rejeitar a hipótese nula quando H₀ é verdadeira (Tabela 2.1). Para um voxel isolado, o pesquisador pode utilizar a estat´ıstica calculada para rejeitar H₀, sabendo que existe uma probabilidadep de obter os mesmos valores por acaso. Outra possibilidade, mais adotada, consiste em, antes mesmo de iniciar o experimento, fixar um nivel de significânciaα, bem como a estat´ıstica que produzp=α de acordo com a distribui¸cão a priori dos dados sob H₀. Se ao final do experimento, a estat´ıstica obtida for maior ou igual à estat´ıstica fixada, o que equivale a p 6 α, então o H₀ é rejeitada. O valor α = 0,05 é amplamente adodado nos mais variados ramos da pesquisa experimental (Keppel e Wickens,2004).

Tabela 2.1: Os dois tipos de erros cometidos em testes de hip´oteses.

H₀ verdadeira H₀ falsa H₀ rejeitada Erro tipo I Decisão correta H₀ não-rejeitada Decisão

correta Erro tipo II

Figura 2.7: Fun¸cão de densidade de probabilidade para uma distribui¸cão t. A probabilidade de t>T corresponde à área sombreada.

Figura 2.8: Fun¸cão de densidade de probabilidade para uma distribui¸cão F. A probabilidade de u>F corresponde à área sombreada.

Comumente, os voxels cujop-valor é inferior a um certo limiarα definido pelo pesquisador são rotulados como “ativos”, apresentados nos mapas com cores vibrantes e usual- mente são sobrepostos à imagens estruturais de alta resolu¸cão para aumentar o poder de localiza¸cão. Os demais voxels são marcados como “inativos”, e não são exibidos.

Ao definir o valor cr´ıtico α, é muito importante observar que milhares de voxels estão sendo testados simultaneamente, constituindo o chamado problema dos testes múltiplos (Cap´ıtulo 3). É essencial decidir qual medida de erro (Se¸cão 3.1) será controlada, para que se possa afirmar com relativa seguran¸ca se uma área pode ser considerada “ativa” ou não, e qual probabilidade errar ao efetuar tal afirma¸cão.

Classificar os voxels como “ativos” ou “inativos” traz algumas vantagens ao pesquisador. Mapas limiarizados podem geralmente ser interpretados mais facilmente, especialmente quando sobrepostos a imagens estruturais de alta resolu¸cão, e a compara¸cão visual entre mapas de diferentes indiv´ıduos também é mais simples. Além disso, áreas cujos p-valores são elevados são de pouco ou nenhum interesse para o pesquisador.

Todavia, a limiariza¸cão apresenta alguns riscos, para os quais o pesquisador deve estar sempre atento. A escolha inapropriada do limiar pode mascarar resultados importantes, ou ainda, perigosamente exibir áreas com elevada estat´ıstica calculada meramente devido ao acaso ou a artefatos. Além disso, na sele¸cão do limiar está implicita a suposi¸cão de que existe uma rela¸cão mutuamente exclusiva entre “atividade” e “inatividade” para esta ou aquela região cerebral. Contudo, diferentes regiões cerebrais participam em maior ou menor escala ao executar uma tarefa. Tentar classificar todas regiões, e todas as respostas poss´ıveis em apenas nos padrões ligado/desligado pode ser considerado, no máximo, uma aproxima¸cão ao verdadeiro grau com que cada região contribui para a execu¸cão de uma tarefa experimental (Loring et al.,2002).

Idealmente, os resultados de experimentos de fMRI deveriam ser interpretados diretamente no mapa estat´ıstico, no qual as probabilidades de erro tipo I são exibidas claramente para todos os voxels (Jernigan et al., 2003). Nessa situa¸cão o pesquisador teria a opor- tunidade de observar áreas cujo sinal BOLD apresentou alguma correla¸cão com a tarefa experimental, mesmo sem atingir o n´ıvel de significância necessário para receber o rótulo de “ativo”. Do ponto de vista experimental, a vantagem imediata seria a reavalia¸cão do paradigma utilizado, que poderia ser modificado para evidenciar com mais clareza a hipótese em teste pelo pesquisador. Do ponto de vista cl´ınico, o mapa não-limiarizado também poderia ser interpretado em conjunto com os sinais e sintomas apresentados pelo paciente, com os resultados de outros testes diagnósticos, e com o tratamento sendo realizado. No uso cl´ınico, como ocorre com qualquer teste diagnóstico, estudos por fMRI não podem ser interpretados isoladamente. Além disso, o limite entre “normalidade” e

“anormalidade” ainda precisa ser estabelecido.

Ao analisar um mapa limiarizado como o da Figura2.9, deve-se observar que as ´areas

Figura 2.9: Resultado de um experimento de fMRI. Os mapas estat´ısticos podem ser limiarizados e apresentados sobrepostos à uma imagem estrutural de alta resolu¸cão (a), ou exibidos diretamente (b). A limiariza¸cão facilita a interpreta¸cão do resultado, mas despreza informa¸cões potencialmente relevantes.

que não foram declaradas como ativas não estão “desligadas” ou “adormecidas”. Mui- tas áreas cerebrais subliminares podem ter participa¸cão essencial na realiza¸cão da tarefa experimental, embora esta participa¸cão possa não ter sido detectada devido ao desenho experimental inapropriado, ao modelamento impróprio da matriz experimental, por razões inerentes ao modelo linear geral, excesso de ru´ıdo ou outras variáveis indesejadas, ou meramente por estar aquém dos limites de resolu¸cão espacial e temporal do método, o qual avalia só indiretamente a verdadeira atividade neuronal (Bandettini, 2002). Isso é par- ticularmente importante nos voxels adjacentes às áreas declaradas ativas, visto que os p-valores não variam de maneira abrupta no espa¸co, e a inspe¸cão das imagens limiarizadas em geral sugere justamente o oposto.

Uma implica¸cão prática relacionada ao problema da limiariza¸cão consiste no arquiva- mento dos mapas calculados. Sempre que poss´ıvel, os mapas devem ser salvos por inteiro, sem a limiariza¸cão. Isso facilita posterior reanálise, bem como o trabalho futuro de outros pesquisadores interessados em meta-análises (Jernigan et al.,2003).

Além disso, antes de analisar o mapa, é necessário conhecer cada detalhe do desenho experimental. A grande maioria dos experimentos atualmente realizados identifica asso- cia¸cão entre áreas cerebrais e tarefas experimentais, ou seja, verifica por exemplo, que uma

area A está associada à execu¸cão do processo cognitivo P, não implicando que a área A

é necessária ou suficiente para a execu¸cão deP (Smith e Jonides, 2003). Para assegurar queAé necessária para a execu¸cão de P, seria necessário demonstrar que na ausência de A,P esta comprometido. Sempre que poss´ıvel, deve-se correlacionar os dados de exames de imagem com dados cl´ınicos, especialmente no cérebro patológico.

Outra quest˜ao importante diz respeito aos contornos das ´areas de atividade cerebral.

Figura 2.10: Mapa frenol´ogico elaborado por Joseph Millott Severn da Brighton Phrenological Institution, 1905. A frenologia ainda era bastante popular nos primeiros anos do s´eculoxx(cortesia da Whipple Museum Reserve Gallery, University of Cambridge).

Pesquisadores costumam interpretar um certo “padrão” de ativa¸cão atribuindo caracteris- ticas funcionais a estruturas anatômicas sobre as quais os voxels coloridos são apresentados, e não aos demais (Jernigan et al., 2003). É amplamente sabido, muito antes do advento das modernas técnicas de neuroimagem, que as áreas corticais apresentam variabilidade importante entre indiv´ıduos, e que um mesmo indiv´ıduo apresenta variabilidade funcional ao longo da vida.

A interpreta¸cão apressada ou intempestiva de mapas limiarizados pode conduzir a conclusões tendenciosas e dar suporte, ainda que indiretamente, a teorias de segrega¸cão do funcionamento cerebral há muito em desuso. O exemplo da frenologia, pseudo-ciência que floresceu no século xix (Figura 2.10), deve ser sempre lembrado antes de extrairmos conclusões baseadas exclusivamente na interpreta¸cão de resultados de fMRI, especialmente mapas limiarizados (Uttal,2001).

Não surpreendentemente, mapas não-limiarizados não estão livres de problemas. Os mapas são computados a partir de cálculos estat´ısticos variados, baseados em suposi¸cões muitas vezes não suficientemente bem compreendidas para dar suporte a estudos de neuroimagem (Cohen,1996).

Apesar de suas limita¸cões e, ocasionalmente, uso inapropriado por pesquisadores ingê- nuos (Cohen,1996), exames de neuroimagem funcional como fMRI já conquistaram espa¸co e provaram valor em uma variedade de situa¸cões (Donaldson,2004;Jonides et al.,2006).

Não obstante, o bom senso e o conhecimento detalhado das limita¸cões do método devem prevalecer antes da extra¸cão de conclusões. Caso contrário, um método de estudo ainda jovem e promissor poderá cair rapidamente em descrédito.

O problema dos testes m´ ultiplos

Conforme revisado no Cap´ıtulo 2, para um voxel isolado, é suficiente calcular o p-valor, e confrontá-lo com o n´ıvel de significância α definido antes de iniciar o experimento para rejeitar ou não a hipótese nula H₀ de ausência de atividade para aquele voxel. Contudo, no contexto de neuroimagem funcional, testes de hipóteses envolvendo um único voxel têm pouca ou nenhuma utilidade. Os testes são realizados simultaneamente em uma grande quantidade de voxels. Ao executar muitos testes de hipóteses, porém, a probabilidade de ocorrência de p-valores abaixo do n´ıvel de significância α, meramente devido ao acaso, aumenta substancialmente.

Este é o denominado problema dos testes múltiplos¹. Eventos raros para um teste isolado podem ocorrer muito freqüentemente se um número suficientemente grande de testes for realizado, de modo que se pode inferir a presen¸ca de efeito, quando na verdade nenhum efeito existe (Abdi,2007).

Tome-se, por exemplo, um exame de ressonância magnética funcional em que tenham sido adquiridos 26 cortes, cada qual contendo uma imagem (matriz) 64×64 voxels. O número total de voxels é 64×64×26 = 106496. Supondo que somente sejam testados os voxels contidos dentro do encéfalo, e que o mesmo ocupe somente cerca de metade do volume total de voxels, o número total de testes de hipóteses sendo executados é 106496/2 = 53248. Para um n´ıvel de significância estabelecido emα= 0,05, espera-se que aproximadamente 53248×0,05 = 2662 voxels sejam declarados ativos, meramente devido ao acaso, um número inaceitavelmente elevado.

O n´ıvel de significânciaαdefinido pelo pesquisador corresponde, para um determinado voxel, a um valor lim´ıtrofe, aqui representado apenas port, para o escore estat´ıstico, acima do qual o voxel é declarado ativo. O valor exato do limiar depende da distribui¸cão de probabilidade para os escores quando H₀ é verdadeira em toda a imagem (Se¸cão 2.4.3).

1Também chamado de problema das múltiplas compara¸cões. Esta denomina¸cão, todavia, não é reco- mendável, por sugerir que os testes estão sendo comparados entre si, o que normalmente não é o caso (Nichols e Hayasaka,2003).

Hip´otese nula falsa

Hipotese nula

verdadeira Total Declarado

significativo VVP VFP VP

Declarado

n˜ao-significativo V_FN V_VN V_N

Total VF VV V

VVP: verdadeiros positivos (H0corretamente rejeitada);VVN: verdadeiros negativos (H0corretamente n˜ao rejeitada);VFP: falsos positivos (H0incorretamente rejeitada); VFN: falsos negativos (H0 incorretamente n˜ao rejeitada); VV: H0

verdadeira;VF: H0 falsa;VP: total de testes em queH0foi rejeitada;VN: total de testes em queH0 n˜ao foi rejeitada;V: total de testes (voxels).

Ao deparar-se com m´ultiplos testes, o problema do pesquisador consiste em definir um valor lim´ıtrofe para todos os voxels que permita identificar a maior quantidade poss´ıvel de voxels “ativos” corretamente, mas ao mesmo tempo minimizando a quantidade daqueles declarados como “ativos” erroneamente. O valor lim´ıtrofe deve ainda permitir algum controle sobre a possibilidade de marcar erroneamente um voxel “inativo” como “ativo”.

Admita-se queV seja o total de voxels sendo testados para a presen¸ca do efeito experimental, ou seja, os voxels em que o teste de hip´oteses est´a sendo aplicado, a Tabela3.1 mostra como estes voxels podem ser classificados, dependendo dos resultados encontrados quando o pesquisador escolhe o limiar t.

No documento Inferência baseada em voxel para fMRI (páginas 63-70)