Abordagens Bayesianas e Codificação Preditiva

III- Segundo Movimento Qual a razão pela qual sentimos prazer com a música ?

2. Neuropsicologia das Expectativas Musicais

2.3. Abordagens Bayesianas e Codificação Preditiva

Uma das perguntas que mais intriga os cognitivistas é como pode o cérebro lidar com processos incertos. Como é possível fazer predições sobre a padronização de inputs sensoriais, dentre os quais a música é um exemplo (Clark, 2013)?

O fluxo de novas informações sobre o sistema nervoso transforma radicalmente a maneira de interpretá-lo. O cérebro já foi visto como um espelho da realidade externa e também como um intérprete. Atualmente, ele começa a ser visto como um preditor, uma máquina de fazer inferências probabilísticas sobre o mundo. Em Kinds of Minds (1996), Daniel Dennet argumenta que a mente é fundamentalmente um antecipador de eventos, um gerador de expectativas, uma máquina de antecipação que é mimada com recompensas sempre que faz previsões corretas. O cérebro elabora hipóteses sobre os possíveis inputs e compara com os dados sensoriais. As hipóteses favorecidas são aquelas que minimizam as incertezas e diminuem os erros de previsão entre as apostas e a experiência.

É frequentemente assumido que o mecanismo subjacente à aprendizagem estatística do cérebro seja regido por modelos probabilísticos internos que se

Figura 13 – Proposta de entendimento da relação exposição x agradabilidade musical de Vuust (2017).

aproximam das estatísticas bayesianas. Estes modelos levam em consideração as tendências ou as distribuições prévias de probabilidade que contribuem para o aprendizado. As abordagens bayesianas das funções cerebrais tentam dar conta da capacidade neuronal de operar de forma ótima em situações de incerteza. Atualmente, um largo espectro de estudos interpretam os resultados de experimentos psicofísicos à luz de modelos bayesianos e questionam como o cérebro pode implementar estes algoritmos bayesianos (Friston 2002; Shepard, 2001; Tononi, 1998).

Estatística bayesiana é um ramo da Estatística que usa a probabilidade P como medida condicional de incerteza associada à ocorrência de um evento E, dada a informação disponível D. Logo, P(E|D) é uma medida de crença de ocorrência de um evento E quando ocorrem as condições resumidas nos dados D. (Paulino et al, 2003)

Um modelo promissor foi proposto por Friston (2005), em que a Codificação Preditiva é o princípio central da função cerebral. Friston fornece uma descrição de como o cérebro identifica e categoriza as causas de seus inputs sensoriais, posto que humanos e animais vivem em um mundo de incertezas. O modelo tenta demonstrar como os neurônios podem reconhecer padrões sensoriais por inferência bayesiana, combinando-os com o conhecimento prévio para inferir causas de alto nível aos estímulos.

A Codificação Preditiva postula uma organização hierárquica, através da qual as regiões cerebrais de baixo-nível estimam as previsões de estímulos esperados, baseado em informações contextuais através de conexões de feedback de regiões mais altas (Friston, 2002). Um evento inesperado contradiz a expectativa, gerando uma comparação entre previsão e input recebido, e um termo de erro que, se for suficientemente significativo, forçará uma atualização da expectativa. A memória de curto prazo também será resetada, abandonando as expectativas anteriores e será iniciada uma resposta orientada ao novo contexto, permitindo a aquisição de novas associações explicativas (Gossberg, 1982). Isso gera um processo recursivo que visa minimizar o erro de predição, ou seja, diminuir a diferença entre input e previsão. É defendido que o cálculo cerebral que calibra a medida das incertezas e expectativas opera de acordo com o Teorema de Bayes, expresso forma da seguinte equação:

Onde:

H – hipótese afetada pelos dados

E – evidências, dados que não foram utilizados no cálculo de probabilidade

anterior.

P(H)- probabilidade a priori, probabilidade da hipótese antes da análise das

evidências.

P(H|E) - probabilidade a posteriori, isto é, a probabilidade da hipótese após a

análise das evidências.

P(E|H) – probabilidade de se observar as evidências dada a hipótese. Trata-se da

compatibilidade entre as duas.

P(E) – probabilidade marginal, uma constante para todas as hipóteses possíveis.

No modelo bayesiano para expectativas, a inferência probabilística de qualquer fenômeno é dinâmica e completamente sensível ao contexto. O contexto é fundamental para entender o processo de detecção de padrões envolvido na aprendizagem implícita e, portanto, na compreensão dos mecanismos subjacentes à aquisição de regras. A hipótese bayesiana aquiesce com o que Otto Laske já havia postulado em 1977 acerca da apreciação do continuum sonoro: “um processo de resolução de quebra-cabeças ou caminhar por um labirinto, onde o estado atual de processamento musical deve ser inferido através da somatória de todos os estados de inferência anteriores”. Observamos, assim, a existência de uma pragmática formal da percepção musical, que funciona por meio das inferências.

Como vem sendo repetido: a geração e subsequente confirmação ou violação de expectativas é crítica para a experiência estética e para o significado musical (Meyer, 1956; Wiggins, 2006). Quando se escuta uma peça de música, o envolvimento dinâmico com o modelo estatístico do ouvinte o habilita a fazer as predições sobre o desenrolar, lançando mão dos conhecimentos e templates aprendidos em experiências prévias, mas também de acordo com o contexto imediato da peça em desenvolvimento. As expectativas musicais são moldadas pela apreensão estatística da ocorrência de eventos sonoros. Ao passo que a música desenrola-se, há uma revisão do modelo e - consequentemente - do estado de crença probabilística que sustenta as futuras predições.

A frustração de uma expectativa musical é consequência de um evento de baixa

probabilidade acontecer no lugar de um evento provável. Segundo Levitin (2016): “a

música é o som organizado, mas sua organização também envolve o elemento inesperado, de outro modo seria emocionalmente fraca ou automatizada” (tradução livre). As predições temporais e qualitativas acerca de notas futuras podem ser surpreendidas, por exemplo, por uma nota antecipada ou atrasada em relação ao tempo predito ou mesmo uma nota alterada, o que suscita um erro de predição.

a-) Erros de Predição

Teorias recentes do processamento da recompensa postulam que a resposta dopaminérgica reflete os erros de predição. Como já foi dito: a manutenção de um quadro de informações do meio em que o organismo está inserido possibilita uma melhor leitura do ambiente e com poucos custos energéticos. Tal análise e atualização de dados do ambiente permite a inferência probabilística de invariações, bem como a predição de eventos futuros.

Schultz (2010) defende que o termo de erro, isto é, a discrepância entre o evento ocorrido e o previsto seja codificada pelos neurônios dopaminérgicos, que são fundamentais para o condicionamento Pavloviano8. Os neurônios dopaminérgicos do mesencéfalo respondem quando a recompensa é ainda maior do que a prevista, guiando o aprendizado (Schultz, 2016). Os erros de previsão de recompensa ajustam as forças sinápticas até que o ambiente possa ser previsto com acuidade. O disparo dopaminérgico reforça o comportamento para a aprendizagem sobre recompensas e para a motivação em busca de mais recompensas - um traço evolutivo - uma vez que a dopamina é reconhecida por reforçar as conexões sinápticas que motivam a realização de determinado comportamento. Ações gratificantes são aquelas que minimizam a energia livre do cérebro, criando assim um modelo mais forte e preciso do mundo.

A maioria dos neurônios da dopamina no mesencéfalo de humanos, macacos e roedores é ativada quando há mais recompensa do que o previsto (erro de previsão

Condicionamento Pavloviano: É um tipo de aprendizagem descoberta pelo fisiologista Ivan Pavlov (1849-1936) que ocorre por associações entre um estímulo ambiental (estímulo neutro) e um estímulo que ocorre naturalmente (estímulo incondicionado). O Condicionamento Pavloviano envolve a colocação de um sinal neutro antes de um reflexo que ocorre naturalmente. No experimento clássico de Pavlov com cães, o sinal neutro era o soar de um sino e o reflexo que ocorrria naturalmente era o salivar em resposta aos alimentos. Ao emparelhar sucessivas vezes o estímulo neutro com o estímulo ambiental, o som do sino por si só poderia produzir a resposta de salivação nos cães.

positivo). Os neurônios dopaminérgicos permanecem em atividade na linha de base quando as recompensas são totalmente previstas e mostram atividade deprimida com recompensas menores do que a prevista (erro de previsão negativo) (Schultz, 2011 Asaad, W. F., & Eskandar, 2011).

Em seguida, veremos os resultados de experimentos feitos por Schultz com ratos a respeito do tema:

Figura 14 - Schultz (1997) - Ativação dos neurônios dopaminérgicos e sua relação com erros de predição

No estudo de Schultz (1997), na ausência de estímulo condicionado a resposta dopaminérgica ocorre logo após a recompensa. Entretanto, havendo um estímulo condicionado e não havendo recompensa, em função de um erro comportamental, ocorre uma depressão dopaminérgica que sucede o momento predito da recompensa, visando inibir o comportamento. No caso da recompensa predita ser igual à recompensa ocorrida, a resposta dopaminérgica é zero. Se a recompensa predita foi menor do que a

Ao lado, vê-se o disparo

dopaminérgico no mesencéfalo de macacos. No primeiro gráfico, notamos o disparo dopaminérgico quando recebem um suco adocicado, sem previsão desta recompensa, isto é, um erro positivo de predição de recompensa.

Após o aprendizado, o estímulo condicionado prediz a recompensa e esta ocorre de acordo com a previsão. Não há erro na previsão. O neurônio dopaminérgico não é ativado pela previsão.

No último caso, o estímulo prediz a recompensa, mas esta não acontece por um erro comportamental. A atividade do neurônio dopaminérgico é deprimida exatamente no momento em que a recompensa deveria acontecer.

recompensa ocorrida, a resposta dopaminérgica tem valor positivo, o que é reconhecido como um Erro de Predição Positivo9 (Schultz, 1997, 2002; Fiorillo, 2003).

Esse comportamento pode ser melhor compreendido de acordo com a seguinte equação:

Em 1972, Rescorla lançaria um dos primeiros modelos matemáticos para erros de predição de recompensa, defendendo que a codificação do erro se dá em função da diferença entre o peso do estímulo e a média dos estímulos passados, conforme a equação a seguir:

ΔV= αβ(λ-V)

Em que:

V= força de associação entre estímulo e recompensa;

α = constante relativa à relevância do estímulo condicionado;

β = constante relativa à relevância do estímulo não-condicionado; λ = força máxima de associação.

Quando a força de associação entre estímulo e recompensa é igual à força máxima de associação, V= λ, o aprendizado é cessado (ΔV= 0).

Esse paradigma pode explicar a razão pela qual gostamos de músicas ligeiramente mais complexas do que nosso esquema mental, ou nossa gramática musical subjetiva. Por serem músicas menos previsíveis, com um grau médio de entropia (Vuust, 2014), possibilitam a emergência de erros de predição positivos.

Por fim, dada a natureza antecipatória da música (e suas respectivas violações em diferentes aspectos), ela mostra-se como um bom substrato para testar a hipótese de Friston para a Codificação Preditiva (Vuust, 2017).

9_{Positive Prediction Error}

b-) Tipos de Erros de Predição Musical

Vuust (2014) faz uma sutil e importante distinção entre dois tipos de "erros de predição" envolvidos na escuta musical:

i) Recompensa por erro de predição (RPE): referente a expectativas

psicológicas de como uma peça emocionalmente gratificante se desenvolverá.

ii) Erro de predição (PE): relativo à computação neuronal de entrada sensorial

relacionada às previsões do cérebro sobre a própria música.

Essas diferenças podem ser traduzidas nas questões: "quanto eu vou gostar do próximo acorde?" (RPE) e "qual é o próximo acorde?" (PE). O autor argumenta que são apostas distintas e potencialmente ortogonais, com diferentes constituintes neuronais (Vuust, 2017). Do ponto de vista computacional, o primeiro baseia-se no aprendizado de reforço, que estabelece princípios computacionais para maximizar o valor da recompensa, independentemente de especificidades músico-estruturais (Schultz, 2013). O último aborda as previsões sobre a estrutura musical e foi modelado utilizando o aprendizado estatístico e a codificação preditiva (Vuust et al., 2009; Hansen e Pearce, 2014; Vuust e Witek, 2014; Hansen et al., 2016).

Na codificação preditiva, PE, o erro de predição não é nem positivo nem negativo per se, mas forte ou fraco em um único contínuo (Vuust, 2017).

Uma reivindicação de Salimpoor et al. (2015) já vista anteriormente neste trabalho, é que quando estamos ouvindo músicas nunca ouvidas antes, modelos auditivos de som semelhantes são ativados para gerar expectativas de como os novos sons serão desenvolvidos. Se os novos sons forem melhores do que o esperado (ou seja, RPE), o PE positivo resultaria. Avaliar se a música é estruturalmente melhor do que a sequência esperada requer, entretanto, uma mais definição clara e observamos dificuldades em encontrar estudos que discutam a qualidade ou a valência emocional do que seria um som melhor, de acordo com a gramática subjetiva dos ouvintes.

No documento Por que gostamos de música? : um entendimento interdisciplinar para a hipótese das espectativas (páginas 53-60)