• Nenhum resultado encontrado

Magnitude, valence et saillance : comment définir le système de récompense ?

II. A PPROCHE NEUROBIOLOGIQUE DE LA RECOMPENSE

3. E TUDES ELECTROPHYSIOLOGIQUES ET NEUROPSYCHOLOGIQUES CHEZ L ’ ANIMAL

4.1. Magnitude, valence et saillance : comment définir le système de récompense ?

d’évaluation des récompenses et d’erreur de prédiction 8 . De façon intéressante, et contrairement aux résultats obtenus chez l’animal basés quasi-exclusivement sur l’utilisation de récompenses alimentaires et de drogues, les connaissances actuelles sur le système de récompense humain se sont construites essentiellement sur la base d’études manipulant de l’argent. Ceci est lié au fait que l’argent est une récompense facile à quantifier, ayant une valeur universelle, et ne produisant pas ou peu d’effets de satiété. Cependant les êtres humains utilisent une variété particulièrement importante de récompenses, à la fois primaires et secondaires, ce qui offre une opportunité unique d’étudier le système de récompense sous différents angles pour en déduire des principes de fonctionnement généraux. Nous accorderons donc une attention particulière à cet aspect dans l’exposé qui va suivre.

4.1. Magnitude, valence et saillance : comment définir le système de récompense ?

comme une confirmation de l’existence d’un système de récompense unique et centralisé dans le cerveau (Figure 18).

Cependant, l’utilisation de stimuli neutres comme condition contrôle peut être critiquée, car ces stimuli se distinguent des récompenses certes par leur absence de valeur hédonique, mais aussi par leur caractère moins saillant, créant ainsi une confusion possible entre les deux (Haber and Knutson, 2010). Pour pallier ce défaut, une possibilité est de contraster des récompenses et des punitions de magnitude équivalente, et donc appariées en termes de saillance10. Plusieurs études utilisant de l’argent ont ainsi montré une activation accrue pour les gains par rapport aux pertes monétaires dans le striatum (Delgado et al., 2000;

Cox et al., 2005) et l’OFC (O'Doherty et al., 2001a; O'Doherty et al., 2003a), confirmant l’implication de ces régions dans le traitement des récompenses. Dans le domaine des récompenses primaires, deux études ont manipulé à la fois la valence et la magnitude de d’odeurs et de boissons, en faisant varier orthogonalement leur attractivité (odeurs/boissons appétitives versus aversives) et leur concentration en agents appétitifs ou aversifs (Anderson et al., 2003; Small et al., 2003). Des comparaisons ont ainsi pu être réalisées selon la valence,

10 Magnitude et saillance sont ici quasiment synonymes, car directement corrélés

Eキェ W"ヱΒく"yW Y Wミ ; キラミ" IエYマ; キ W"S " XマW"SW" YIラマ Wミ W"IエW "ノげエ マ;キミく"]W" キミIキ ;ノ"

ラ "S " XマW"SW" YIラマ Wミ W"W "Iラミ キ Y" ; "ノW "ミW ラミW "Sラ ;マキミW ェキ W "SW"ノ;" ラキW"

Sキ W" マY ラIラ キIラノキマHキ W" ふWミ" HノW ぶが" キ" キミミW W" Wミ W" ; W が" <" ; キ " S " マY WミIY エ;ノWが" ノW"

キ; マが" ノげ;マ ェS;ノWが" ノW" Iラ W " ラ Hキ ラa ラミ ;ノ" W " ノW" Iラ W " Ya ラミ ;ノく" " 1W W" ノキ W" SW" I W "

IY YH ;ノW "ミげW "IW W " ; "W エ; キ Wが"マ;キ "Iラミ キ W"IW" キ"W "ェYミY ;ノWマWミ ";IIW Y"IラママW"

ノげ; Iエキ WI W" キミIキ ;ノW"S " XマW"SW" YIラマ Wミ Wく""

Striatum ventral

Amygdale Cortex

orbitofrontal Cortex préfrontal

Mésencéphale (aire tegmentale ventrale

et substance noire) Striatum ventral

Amygdale Cortex

orbitofrontal Cortex préfrontal

Mésencéphale (aire tegmentale ventrale

et substance noire)

tout en contrôlant la magnitude, et inversement selon la magnitude, tout en contrôlant la valence. Les résultats de ces deux études s’accordent sur une dissociation entre ces deux paramètres au sein du système de récompense : alors que l’OFC est principalement sensible à la valence des stimuli –confirmant les résultats obtenus avec l’argent, l’amygdale est sensible à leur magnitude, quelle que soit la valence. Le codage différentiel des récompenses et des punitions dans l’OFC est cohérent avec le rôle de cette région dans l’apprentissage du renversement (cf section II.3.2) et plus généralement avec un rôle dans l’évaluation des conséquences de nos actions (« outcome monitoring ») (Kringelbach, 2005). Cependant, le schéma d’activation observé dans l’amygdale jette un doute sur sa spécificité vis-à-vis des récompenses, et suggère plutôt un rôle dans le codage de la saillance des stimuli, indépendamment de leur valence affective. Ce résultat est d’ailleurs cohérent avec une large littérature montrant que l’amygdale répond aussi bien, voire mieux, aux punitions et aux stimuli aversifs qu’aux récompenses et aux stimuli appétitifs (McClure et al., 2004a; Murray, 2007). Par conséquent, bien que l’amygdale soit traditionnellement associée au traitement des récompenses, son rôle semble plus général et lié plutôt à l’attribution d’un degré de saillance émotionnelle. Cette idée est par ailleurs soutenue par un nombre croissant de résultats montrant que l’amygdale est indispensable pour le traitement des émotions mais pas nécessairement pour le traitement des récompenses (Murray, 2007).

Parallèlement, plusieurs études se sont intéressées à l’influence des réponses instrumentales sur l’activité du système de récompense, et plus particulièrement du striatum.

En effet, pour mieux comprendre le rôle fonctionnel du striatum dans le codage des récompenses, il parait important de déterminer si son activité est modulée par la perception d’une contingence entre l’obtention de la récompense et les actions motrices qui précèdent.

Afin de répondre à cette question, Elliott et al. ont utilisé une tâche de détection de cible, où des récompenses monétaires étaient délivrées dans un contexte de conditionnement pavlovien (i.e. sans réponse motrice) ou instrumental (i.e. nécessité d’une réponse motrice). Les résultats ont montré une activité accrue dans le striatum dorsal (noyau caudé), ainsi que dans l’amygdale et le mésencéphale, pour les récompenses obtenues à la suite d’une réponse motrice, illustrant l’influence effective de la motivation sur les réponses hédoniques (Elliott et al., 2004). Il faut toutefois noter que l’OFC ne semblait pas sensible à cette manipulation.

Dans une autre étude, Tricomi et al. ont comparé deux conditions expérimentales où les récompenses monétaires reçues résultaient ou non d’un choix effectué par les participants (Tricomi et al., 2004). Similairement à l’étude précédente, la perception d’un lien de contingence induite par le choix était accompagnée d’une augmentation d’activité dans le

striatum dorsal. De façon plus globale, ces résultats confirment une observation générale issue de la littérature. En effet, le striatum dorsal a souvent été retrouvé activé dans les études où l’obtention d’une récompense dépendait directement des décisions ou des temps de réaction des participants (Elliott et al., 2000b; Delgado et al., 2003; Knutson et al., 2003), mais ne semble pas sollicité lorsque ces récompenses sont reçues de façon passive (Berns et al., 2001;

Breiter et al., 2001; McClure et al., 2003). Dans l’ensemble, ces données ont donc conduit les chercheurs à reconsidérer le rôle du striatum dorsal, qui serait davantage impliqué dans les mécanismes de renforcement instrumental et de sélection de l’action, plutôt que dans le traitement des récompenses en soi (Delgado, 2007). Cette interprétation est cohérente avec des données électrophysiologiques montrant une sélectivité des neurones du striatum dorsal pour les actions récompensées (Schultz et al., 2000), ainsi qu’avec les fortes connexions anatomiques de cette région avec le cortex moteur et le cortex préfrontal dorso-latéral (Alexander and Crutcher, 1990). Elle est également compatible avec les modèles d’apprentissage par renforcement qui décrivent le striatum dorsal comme un « acteur » chargé de renforcer les associations réponse-récompense (par opposition au rôle de « critique » joué par le striatum ventral dans le renforcement des associations stimulus-récompense) (O'Doherty et al., 2004).

Une série d’études menées par Caroline Zink a adopté un point de vue légèrement différent, en suggérant un rôle plus général du striatum dans le codage de la saillance. Dans une première expérience comparant des récompenses monétaires reçues de façon active ou passive, Zink et al. ont montré une activité accrue dans le striatum (dorsal et ventral) pour les récompenses reçues de façon active (Zink et al., 2004), en adéquation avec les résultats précédemment obtenus par Elliott et al (2004). Cependant, cette différence d’activité n’était pas présente lorsque les récompenses monétaires étaient remplacées par des formes géométriques sans valeur, qui par ailleurs engendraient une activité équivalente à celle observée pour les récompenses passives (Figure 19). D’après les auteurs, l’activité du striatum ne serait donc pas simplement due à la récompense ni à une contingence action-résultat, mais à une interaction entre ces deux paramètres qu’ils désignent par le terme de « saillance ». Pour étayer leur argumentation, Zink et al. ont conduit deux autres études manipulant des stimuli saillants dépourvus de toute valeur hédonique (Zink et al., 2003; Zink et al., 2006). Ces stimuli étaient des distracteurs visuels et auditifs présentés dans le cadre de tâches de décision perceptuelle. Leur saillance était d’autant plus grande que leur apparition était peu fréquente.

Les résultats de ces deux études vont dans le même sens, et montrent que l’activité du striatum est directement proportionnelle à la saillance des distracteurs. Sans remettre en

question les réponses striatales observées dans les tâches de récompense, ces résultats proposent de les redéfinir en termes de saillance : l’activité du striatum ne reflèterait pas tellement la valeur hédonique des récompenses, mais plutôt leur pertinence immédiate pour la réorientation des ressources cognitives et l’adaptation du comportement. Cette interprétation est cohérente avec le rôle attribué aux neurones dopaminergiques dans le codage d’une erreur de prédiction, qui se traduit par une activité d’autant plus importante que les récompenses sont imprévisibles et donc saillantes (cf section II.3.1) (Schultz and Dickinson, 2000). Cette interprétation rejoint également les théories qui défendent un rôle général de la dopamine sous-corticale dans le codage de la saillance (cf section II.2.2) (Horvitz, 2000). Notons toutefois que cette interprétation se heurte à des résultats évoqués plus hauts montrant une Eキェ W"ヱΓく"}Wミ キHキノキ Y"S " キ; マ"<"ノ;" ;キノノ;ミIW"SW "ェ;キミ "マラミY ;キ W く"]W" キ; マ"Sラ ;ノ"ふ#ぶ"W "ノW"

キ; マ" Wミ ;ノ"ふ0ぶ" Y Wミ Wミ " ミW"; ェマWミ ; キラミ"Sげ;I キ キ Y" ミキ WマWミ " ラ "SW "ェ;キミ "マラミY ;キ W "

WN "; X "ノげW YI キラミ"Sげ ミW";I キラミ"マラ キIWく"7W" ノ が"ノげW YI キラミ"SW"IW W"マZマW";I キラミ"ミげWミェWミS W"

; " Sげ;I キ ; キラミ" SキaaY Wミ キWノノW" ノラ W" ノW " ェ;キミ " ラミ " Wマ ノ;IY " ; " SW " aラ マW " ェYラマY キ W "

ふた"HノラH "だぶく" ]W" キ; マ" W " SラミI" Wミ キHノW" <" ノ;" ;キノノ;ミIW" SW " ェ;キミ " マラミY ;キ W が" SYaキミキW" IラママW" ノ;"

IラマHキミ;キ ラミ" SW" ノW " ;ノW " エYSラミキ W" " W " S " ノキWミ" SW" Iラミ キミェWミIW" キ" ノW " ミキ " <" ノげ;I キラミ" マラ キIWく"

7げ; X "́キミニ"W ";ノくが"ヲヰヰヴく"

A

B

nette différence d’activation pour des gains et des pertes monétaires de magnitude (i.e. de saillance) équivalente. Elle est aussi en contradiction avec un ensemble d’études monétaires rapportant une désactivation du striatum lorsqu’une récompense attendue est finalement omise, alors même qu’une telle omission est particulièrement saillante (Knutson et al., 2001b;

Pagnoni et al., 2002; O'Doherty et al., 2003c). Bien que le débat sur l’interprétation de l’activité striatale en termes de récompense ou de saillance demeure, il se pourrait que les deux processus coexistent au niveau neuronal (O'Doherty, 2004).