Processamento de prosódia e processamento de prosódia emocional

2.4 Uso da eletroencefalografia na investigação de processamento semântico, reconhecimento de

2.4.3 Processamento de prosódia e processamento de prosódia emocional

Como ressaltado anteriormente, na maior parte do tempo as informações com conteúdo emocional não se apresentam isoladamente, pelo contrário, comunicamos nossos sentimentos por meio da expressão facial juntamente com informações com conteúdo verbal expressa sincronicamente com modulação da voz, ou seja, com o uso adequado da prosódia.

A identificação da emoção expressa por meio da integração de expressão facial e voz é uma estratégia que pode ser observada em idades precoces. Estudo realizado por Walker et al. (1982), submeteu crianças de 5 a 7 meses a apresentação de duas faces com expressões emocionais distintas

26 e uma voz relacionada a um dos dois tipos de expressão facial. Foi observado que o olhar das crianças foi em geral direcionado para a expressão congruente com som.

Há uma quantidade menor de estudos sobre o reconhecimento da emoção em estímulos auditivos, especificamente em relação à prosódia. Esse número se restringe ainda mais em relação à investigação de potenciais relacionados ao evento em tarefas de identificação de congruência e incongruência entre pares de estímulos de face-voz em crianças com autismo.

A maioria dos estudos que investigam o processamento da prosódia analisam os componentes N100 e P200.

Acredita-se que o componente N100 reflete o processamento sensorial auditivo e perceptual sendo também modulado pela atenção (ROSBURG, BOUTROS e FORD (2008). Já o componente P200, de acordo com Paulmann e Kotz, (2008) está associado à codificação e processamento de prosódia emocional. Os autores sinalizam que o estímulo vocal com expressão emocional independente de conter valência positiva ou negativa podem ser diferenciados de estímulo com prosódia emocional neutra em torno de 200 ms após sua apresentação, eliciando maior amplitude do componente P200 para conteúdo emocional. O mesmo pode ser observado em áreas corticais auditivas e parece ser modulado pela congruência entre as emoções transmitidas por meio de expressão facial e por estímulo auditivo (voz).

Pourtois et al. (2000) relataram maior amplitude do componente P200 para prosódia afetiva congruente a estímulo visual em relação a estímulos incongruentes, além de ser observado menor latência (GROSSMAN et al., 2006).

Schimer e Kotz (2006) desenvolveram três estágios envolvidos no processamento da prosódia. De acordo com os autores, o primeiro estágio se refere ao processamento sensorial da voz, ou seja, a análise de características acústicas do estimulo auditivo, como frequência e tom, correspondendo dessa forma a uma fase de transdução da informação auditiva. Além disso, nesse primeiro estágio ocorre o processamento sensorial prévio da emoção. Os autores atribuem esse estágio ao componente N100. Já o segundo estágio, onde ocorre a identificação implícita dos sinais emocionais e não emocionais presentes na fala e corresponde ao componente P200. Por fim, o terceiro estágio que corresponde ao componente N300 envolve a integração e avaliação do significado emocional.

Com o objetivo de avaliar o processamento da prosódia emocional Iradale et al. (2013) avaliou participantes com desenvolvimento típico durante processamento de prosódia de palavras (substantivos) neutros com prosódia neutra, feliz e de raiva. Os autores observaram predominância do hemisfério direto relacionada ao componente N1 corroborando com os estudos de neuroimagem sobre identificação da prosódia. Porém, além do N100 ser demonstrado como um marcador pra

27 processamento sensorial, os autores observaram maior amplitude de N100 para as prosódias emocionais (feliz e brava) quando comparada a neutra. Os autores justificam esses achados com base em estudo prévio que mostram que frequência e tom podem influenciar a amplitude do componente N100. Dessa forma as prosódias emocionais podem ter sido faladas com maior ou menor intensidade em relação às neutras e isso justificaria a diferença na amplitude do componente.

Por fim, em relação ao componente P200 foi observada maior amplitude para estímulos emocionais quando comparado aos estímulos neutros. Diferenças na lateralização hemisférica foram observadas, sendo maior amplitude para prosódia de raiva no hemisfério direito e maior amplitude de prosódia de felicidade no hemisfério esquerdo, corroborando com os estudos de neuroimagem em relação à valência já mencionados nesse trabalho.

Em relação a essa diferença na ativação hemisférica, outras explicações alternativas são encontradas na literatura. Estudo de Mitchell e Ross (2008) sinalizou que o hemisfério esquerdo é recrutado para auxiliar no processamento de estímulos com maior complexidade. Nesse caso estímulos com valência positiva tem menor precisão de acurácia do que com valência negativa (por exemplo, prosódia com emoção brava), fato este apontado em estudos comportamentais, justificando assim a ativação do hemisfério esquerdo para prosódia feliz. Sendo assim, se essa hipótese estiver correta o P200 refletiria um processamento mais controlado do contexto, que exige maior esforço cognitivo.

Um dos primeiros estudos com eletroencefalografia realizado com bebês de 7 meses de idade em tarefa de integração face-voz foi desenvolvido por Grossman et al. (2006). Os pesquisadores avaliaram o processamento emocional de pares de estímulos face-voz por meio de registro eletroencefalográfico. A tarefa realizada consistiu na apresentação de uma imagem de face feminina com expressão feliz ou de raiva seguida após 400 milissegundos pela apresentação vocal de um verbo neutro com prosódia que poderia ser congruente ou incongruente com a imagem apresentada. Os resultados evidenciaram um componente negativo por volta de 350 milissegundos em eletrodos frontais e parietais após a apresentação dos estímulos, sendo a maior amplitude observada para verbos com prosódia incongruente com a expressão facial. Em contrapartida foi observado maior amplitude do componente positivo tardio para estímulos com prosódia congruente em relação aos estímulos com prosódia incongruente. A partir desses achados, os autores sinalizaram que esse componente corresponde ao N400 observado em tarefas de integração semântica em adultos. Além disso, os autores concluíram que bebês com 7 meses possuem capacidade de integrar informação emocional e reconhecem o afeto presente nesse contexto.

Estudo recente de Ho et al. (2015) investigou a influencia da atenção seletiva na percepção de combinações de faces com expressão facial neutra ou brava e prosódia congruente ou

28 incongruente a face apresentada. Os resultados evidenciaram que o componente N100 foi modulado pela atenção seletiva. Além disso, expressão facial precedida por prosódia congruente levou uma redução na amplitude do componente N100. Resultados semelhantes foram relatados por Chen et al.

(2016).

Ainda a fim de analisar processamento de prosódia emocional, Diamond et al. (2016), submeteram voluntários saudáveis a uma tarefa processamento semântico durante a apresentação de faces com expressão de felicidade ou raiva pareados com estímulos auditivos de duas categorias, sendo eles: palavras com prosódia emocional de felicidade ou raiva e estímulos fonéticos (formato de lábios correspondendo a fala das vogais “a” ou “i”, também com prosódias de felicidade ou raiva. Os resultados evidenciaram maior amplitude de N400 para estímulos congruentes tanto para a apresentação da prosódia fonética quanto para a prosódia das palavras. Porém para os estímulos fonéticos houve lateralização do componente no hemisfério esquerdo, sendo que para as palavras houve lateralização no hemisfério direito. Esse padrão de lateralização à direita para prosódia emocional de palavras/frases é corroborado em estudos anteriores já citados.

Utilizando paradigma semelhante, Liu et al. (2011) observaram em seu estudo com voluntários saudáveis, maior amplitude de N100 durante apresentação de pares face-voz congruentes em relação aos pares incongruentes. Além disso, foram observadas maiores amplitudes de P200 e P300 para os estímulos emocionais, independente da valência em comparação aos neutros, enquanto que maiores amplitudes de N250 foram observadas para estímulos neutros em relação aos emocionais. Os resultados do presente estudo reforçam a afirmativa de que o componente P200 corresponde ao processamento da informação audiovisual com conteúdo emocional.

Em relação aos estudos que avaliam prosódia emocional combinada a apresentação de expressão facial em população com autismo, os achados na literatura são ainda mais restritos.

Estudo de Magneé et al. (2008), avaliou o processamento de prosódia emocional em pacientes com autismo de alto funcionamento combinada a apresentação de faces com expressão facial. A apresentação da prosódia (valência positiva: felicidade ou valência negativa: medo) foi seguida da apresentação de uma expressão facial, sendo que poderia ser compatível ou incompatível a imagem da face apresentada. Foi observada maior amplitude de P100 e N100 para faces de medo em relação a faces felizes no grupo com autismo e no grupo controle. Além disso, foi observada maior amplitude de P200 para vozes com prosódia de medo em comparação a prosódia de felicidades também em ambos os grupos. Porém, em relação ao componente N200, componente avaliado em tarefas que os estímulos de face-voz são apresentados simultaneamente, foi observado no grupo controle maior amplitude para voz de medo comparada a voz de felicidade apenas quando

29 a expressão facial era compatível com a prosódia. Resultado contrario foi observado no grupo com autismo, onde foi observado maior amplitude de N200 para a voz de medo, mesmo quando esta não era compatível com a expressão facial. Os autores atribuem essa diferença vista no componente N200 como uma falha na integração entre o giro fusiforme e o sulco temporal superior, sendo essas áreas cerebrais importantes para que ocorra a integração multissensorial.

Em estudo mais recente, Magneé et al. (2011), avaliaram a presença de P200 em 23 adultos com autismo de alto funcionamento pareados com grupo controle por idade e QI a fim de identificar se há um déficit de processamento de informação multissensorial (apresentada de estimulo face-voz) ou se o que ocorre é uma falta de atenção direcionada. Os autores observaram que apenas quando a atenção seletiva estava direcionada ao estímulo, o grupo controle exibiu P200 semelhante ao grupo controle. No entanto, na condição de atenção dividida foi observado um déficit no processamento multissensorial, indicando dessa forma que a atenção é um fator importante para a integração de face e voz no grupo com autismo.

Utilizando metodologia semelhante, estudo de Megnin et al (2012) mostrou que a apresentação do componente N100 foi semelhante entre grupo controle e grupo com autismo analisados a partir do inicio do estimulo auditivo, dessa forma ambos os grupos utilizam as pistas visuais para prever o inicio da fala. Em relação ao componente P200, sua amplitude foi reduzido no grupo com autismo. Tal resultado não pode ser explicado como sendo falta de direcionamento atencional, uma vez que o grupo com autismo processa a informação visual, porém não se utiliza dela para processamento da informação auditiva.

Os estudos apresentados anteriormente mostram em conjunto que pacientes com diagnóstico de autismo apresentam alterações em tarefas que envolvem processamento de expressão facial, integração semântica de informações tanto emocionais quanto não emocionais e apreensão de informações emocionais por fatores como a prosódia. No entanto, como pode ser observado, ainda são poucos os estudos, em particular, com grupos de autistas com idade inferior e para alguns aspectos praticamente pouco se sabe sobre as bases neurofisiológicas. Vale ainda ressaltar que os estudos também apresentam resultados contraditórios em relação à extensão desses déficits. Mais ainda, não há estudos sobre como essas funções se manifestam quando inseridas em contexto que envolva interação materna. É interessante notar que há indícios de um efeito de familiaridade em estudos sobre o chamado ritmo Mu. O ritmo Mu é uma faixa de frequência observada via eletroencefalografia tipicamente nos eletrodos C3 e C4 (GASTAUT, BERT, 1954; PINEDA, 2008).

Essa faixa é suprimida durante observação, execução e mentalização de movimentos e parece refletir a atividade do chamado sistema de neurônios em espelho. Oberman, Ramachandran e Pineda (2008) mostraram em pessoas com diagnóstico de autismo que a supressão do ritmo Mu,

30 assim como em voluntários com desenvolvimento típico, encontra-se correlacionada com a familiaridade dos estímulos observados (maior supressão para movimentos de mãos conhecidas em comparação a mãos desconhecidas). Tais dados sinalizam para a importância de estudos que integrem em suas tarefas estímulos familiares.

Dessa forma, o primeiro experimento desse trabalho investiga o processamento de linguagem semântica, através da análise de componentes sensoriais como o N170 e P1 e o componente N400 durante interação materna e interação de pessoa desconhecida. Já o experimento dois, avaliará o processamento semântico mediante a apresentação de expressões faciais com conteúdo emocional (alegria e raiva) através do registro eletroencefalográfico dos mesmos componentes analisados no experimento 1. Por fim, no experimento 3 será investigado o processamento de prosódia emocional através dos componentes N100, P200 e N400.

A hipótese desse trabalho é de que tanto os componentes básicos, descritos como componentes sensoriais, N170, P1. N100 e P200 quanto o componente N400 apresentarão o mesmo padrão neuroelétrico no grupo com autismo quando comparada as duas fontes de voz; materna e de pessoa desconhecida. Além disso, em comparação ao grupo controle, espera-se no grupo com autismo menor amplitudes dos componentes, especialmente do componente N400, marcador neuroelétrico para identificação de incongruência.

Com isso, pretendeu-se verificar as diferenças do registro eletrofisiológico nos grupos para que dessa forma possamos replicar ou oferecer novas contribuições nos escassos estudos realizados até o momento com população nessa faixa etária.

3. OBJETIVOS

No documento UNIVERSIDADE PRESBITERIANA MACKENZIE CLAUDIA APARECIDA VALASEK (páginas 39-44)