• Nenhum resultado encontrado

Comparaison des récompenses : vers une monnaie neurale commune ?

II. A PPROCHE NEUROBIOLOGIQUE DE LA RECOMPENSE

3. E TUDES ELECTROPHYSIOLOGIQUES ET NEUROPSYCHOLOGIQUES CHEZ L ’ ANIMAL

3.2. Rôle du cortex orbitofrontal dans l’évaluation des récompenses

3.2.2. Comparaison des récompenses : vers une monnaie neurale commune ?

L’ensemble de ces données démontre que l’OFC, de concert avec le mPFC, encode l’ensemble des paramètres nécessaires à la construction d’une représentation flexible de la valeur attendue des récompenses. Cependant toutes les récompenses ne se valent pas, et il est important de pouvoir situer leurs valeurs respectives les unes par rapport aux autres. Ceci s’avère particulièrement utile dans les situations de choix ou d’échanges entre récompenses.

Plusieurs études suggèrent que l’OFC est équipé de tels mécanismes de comparaison.

Tremblay et Schultz ont ainsi montré que les neurones de l’OFC encodent la valeur des récompenses de façon relative (Tremblay and Schultz, 1999). Dans leur expérience, trois

récompenses alimentaires étaient utilisées, avec un ordre de préférence bien établi : les singes préféraient la récompense A (raisin) par rapport à la récompense B (pomme), et la récompense B par rapport à la récompense C (céréales). De plus, l’expérience était divisée en sessions, au sein desquelles les singes ne pouvaient recevoir que deux récompenses parmi les trois. Chaque récompense reçue était précédée d’un symbole prédictif annonçant sa nature.

Les auteurs ont montré que dans les sessions A:B, les neurones de l’OFC répondaient fortement à la récompense A, mais peu à la récompense B, alors que dans les sessions B:C,

Eキェ W"ヱヶく"1ラS;ェW"SW"ノ;" ;ノW " Wノ; キ W"SW " YIラマ Wミ W "S;ミ "ノW"Iラ W "ラ Hキ ラa ラミ ;ノ"S " キミェWく"

7;ミ " IW W" W Y キWミIWが" SW " キミェW " WNラキ Wミ " ラキ " W " SW" YIラマ Wミ W " #が" 0" ラ " 1" ふIノ; YW " ; "

ラ S W"SW" YaY WミIWぶ"SW"a;Nラミ";ノY; ラキ Wく"⁄ミW" W ノW" YIラマ Wミ W"W "SYノキ YW" ; "W ;キが"W ";ミミラミIYW"

<"ノげ;キSW"Sげ ミ" マHラノW" YSキI キaく"]げW Y キWミIW"W "Sキ キ YW"Wミ" W キラミ が"W " W ノW "SW " ; マキ"ノW " ラキ "

YIラマ Wミ W " ラミ " Sキ ラミキHノW " S;ミ " Iエ; W" W キラミく"ふ#ぶ" vノ;ミ " SW" YミY ; キラミ" SW " YノWI ラSW "

SげWミ Wェキ WマWミ " S;ミ " ノW" Iラ W " ラ Hキ ラa ラミ ;ノく"ふ0ぶ" 7;ミ " ノW " W キラミ " Iラミ Wミ;ミ " W ノWマWミ " ノW "

YIラマ Wミ W "#"W "0が"ノW "ミW ラミW "SW"ノげjE1"SYIエ; ェWミ "SW"a;Nラミ" ノ " ラH W" ラ "ノ;" YIラマ Wミ W"

#が" YaY YW" ; " ; ラ " <" ノ;" YIラマ Wミ W" 0" ふWミ" エ; ぶく" #" ノげキミ W Wが" S;ミ " ノW " W キラミ " Iラミ Wミ;ミ "

W ノWマWミ "ノW " YIラマ Wミ W "0"W "1が"IげW "ノ;" YIラマ Wミ W"0"ふ YaY YW" ; " ; ラ "<"ノ;" YIラマ Wミ W"1ぶ"

キ" WミェWミS W" ノ;" Y ラミ W" ノ;" ノ " ラH Wが" Sげキミ Wミ キ Y" WマHノ;HノW" <" ノ;" Y ラミ W" YIYSWママWミ "

ラH W YW" ラ "ノ;" YIラマ Wミ W"#"ふWミ"H; ぶく"7げ; X "~ WマHノ; ";ミS"}Iエ ノ が"ヱΓΓΓく"

Reward C (cereal)<Reward B (apple)

Reward C Reward B

Reward B (apple)<Reward A (raisin)

Reward A Reward B

A B

ces mêmes neurones répondaient fortement à la récompense B, et peu à la récompense C (Figure 16). Ces réponses étaient observables au moment de la réception de la récompense mais aussi pendant la phase d’anticipation. Globalement, ces résultats apportent la preuve d’un rôle de l’OFC dans le codage des préférences relatives des individus, et illustrent la plasticité de ce codage en fonction du contexte.

Cependant, si un tel mécanisme est efficace pour comparer la valeur de deux récompenses, il devient plus coûteux lorsqu’on augmente le nombre de récompenses, du fait d’une explosion combinatoire du nombre de comparaisons à effectuer. Dès lors, une solution simple consiste à convertir la valeur des récompenses dans une unité de mesure abstraite, permettant ainsi une comparaison sur une échelle commune. Sur la base des propriétés démontrées par les neurones de l’OFC, il a été proposé qu’une telle « monnaie neurale commune » puisse être implémentée dans cette région (Montague and Berns, 2002). Quelques études semblent appuyer cette thèse.

Dans une première étude, Padoa-Schioppa et Assad ont demandé à des singes d’effectuer des choix entre deux types de boissons proposées en quantités variables. L’analyse de leurs choix a permis de déterminer la valeur subjective attribuée à chaque boisson, qui peut s’exprimer sous la forme d’une relation d’équivalence : par exemple une goutte de jus de fruit peut être considérée comme hédoniquement équivalente à quatre gouttes d'eau pour un individu. Curieusement, parmi les neurones de l’OFC activés pendant la phase de choix, certains présentaient une activité directement proportionnelle à la valeur subjective de la boisson choisie, plutôt qu’à ses propriétés physiques (Padoa-Schioppa and Assad, 2006). En d’autres termes, pour l’individu évaluant quatre gouttes d'eau ou une goutte de jus de fruit au même niveau de plaisir, ces neurones répondaient de façon identique quelle que soit la récompense choisie, bien que les deux options présentent des caractéristiques physiques très différentes. Ce type de réponse correspond tout à fait à la définition d’une monnaie neurale commune.

Les mêmes auteurs ont alors conduit une deuxième expérience, dans laquelle les singes pouvaient recevoir trois types de récompenses A, B ou C (classées par ordre de préférence), et devaient faire des choix entre des quantités variables de ces récompenses présentées par paires. Confirmant et prolongeant à la fois les conclusions de l’étude précédente, les résultats ont montré que la valeur attribuée à une récompense donnée était encodée par un taux de décharge fixe, dépendant seulement de ses caractéristiques propres (nature et volume) et non des possibilités alternatives (Padoa-Schioppa and Assad, 2008).

Selon les auteurs, cette stabilité de la représentation de la valeur au sein de l’OFC permettrait

d’implémenter les règles de transitivité qui régissent classiquement les choix économiques (i.e. si A est préféré à B, et B est préféré à C, A devrait être préféré à C). Cependant ces résultats sont contradictoires avec ceux de Tremblay et Schultz, qui suggèrent une adaptation de la réponse neuronale en fonction du contexte. Padoa-Schioppa et Assad ont suggéré que cette divergence pourrait résulter d’une différence de protocole, ou bien seulement être le signe de l’existence de différents types de neurones au sein de l’OFC. Quoiqu’il en soit ces différentes études montrent que l’OFC ne se contente pas d’encoder passivement les propriétés physiques des récompenses, mais construit une véritable représentation de leur valeur économique, à partir des préférences individuelles des animaux.

4. Apport de la neuroimagerie chez l’homme

Cette partie est plus spécifiquement centrée sur l’être humain et sur la vision du système de récompense offerte par la neuroimagerie fonctionnelle, et plus particulièrement par l’IRMf. Il est important de souligner que l’IRMf est une technique assez récente. En effet, la validation conceptuelle de son utilité pour l’étude du fonctionnement cérébral ne remonte qu’à une vingtaine d’années (Ogawa et al., 1990). De plus, l’implémentation de méthodes analytiques fiables et compatibles avec les échelles de temps typiquement rencontrées dans le cerveau ne date que d’une dizaine d’années en arrière, avec l’avènement de l’IRMf évènementielle (ou « event-related fMRI », qui permet d’isoler l’activité cérébrale liée à certains évènements d’intérêt) (Rosen et al., 1998). Par rapport à l’électrophysiologie, l’IRMf a surtout l’immense avantage d’être non invasive, et a ainsi encouragé l’exploration du cerveau humain. Elle offre également la possibilité d’enregistrer l’activité dans l’ensemble du cerveau –et pas seulement au niveau d’un nombre limité d’électrodes– permettant ainsi une description du fonctionnement cérébral en termes de réseaux. Par rapport aux autres techniques de neuroimagerie fonctionnelle, i.e. la TEP, l’EEG et la MEG, l’IRMf offre une résolution spatiale particulièrement bonne. Cependant sa résolution temporelle est largement inférieure à celle de l’EEG et de la MEG. De plus, contrairement à la TEP, le signal enregistré ne délivre aucune information sur le substrat neurochimique impliqué, même si la combinaison avec des approches pharmacologiques est prometteuse, et indique par exemple une probable corrélation entre transmission dopaminergique et signal BOLD dans certaines régions comme le striatum (Knutson and Gibbs, 2007).

L’ensemble de ces caractéristiques explique la forte popularité acquise dès la fin des années 1990 par l’IRMf, qui est rapidement devenue une technique de prédilection pour

« cartographier » le cerveau humain. Cet élan exploratoire a été appliqué avec succès à l’étude du système de récompense, et les premières études ont rapidement retrouvé les régions cérébrales déjà identifiées par la BSR et l’électrophysiologie. Le nombre d’études publiées a alors rapidement augmenté (Figure 17), tout comme l’intérêt pour le rôle fonctionnel de ces régions dans le codage des différents attributs de la récompense. De nombreux paradigmes et méthodes d’analyses ont été employés, créant une littérature particulièrement riche et complexe, et souvent difficile à synthétiser (Haber and Knutson, 2010). Bien qu’une vision intégrée du système de récompense peine encore à émerger, l’IRMf a permis de dégager quelques consensus sur le(s) rôle(s) joué(s) par certaines régions. Afin de bien poser les connaissances et hypothèses de base sur lesquelles s’appuie cette thèse, il nous parait important d’exposer ici quelques-uns de ces consensus. Nous ne manquerons pas cependant d’évoquer certaines contradictions et polémiques persistantes, dont certaines ont également motivé le travail expérimental qui va suivre. Nous tâcherons aussi de jeter des ponts avec les données précédemment présentées chez l’animal, en abordant notamment les mécanismes

Eキェ W" ヱΑく" "; ラノ キラミ" S " ミラマH W" SげY SW " SげNyca" HノキYW " " ノ;" YIラマ Wミ W" Wミ W" ノW "

;ミミYW " ヲヰヰヰ" W " ヲヰヱヰく" " 1W " Iエキaa W " ラミ " Y Y" ラH Wミ " Wミ" キノキ ;ミ " ノ;" W Z W" ふacyN" #d7"

W ; Sぶ"S;ミ "v HマWS";ミミYW" ; ";ミミYWく"1W"ェ ; エキ W"キノノ W"ノW"ミラマH W"キマ ラ ;ミ "SげY SW "

HノキYW " " ノW" エXマW" SW" ノ;" YIラマ Wミ Wが" ;キミ キ" W" ノ;" ラ ノ; キ Y" I ラキ ;ミ W" SW" ノげNyca"

ふノげY ラノ キラミ" W ラミWミ キWノノW" S " ミラマH W" SげY SW " ミげW " ; " ラ W" ; " Sラマ;キミW" SW" ノ;"

YIラマ Wミ Wが"マ;キ " WaノX W" ノ レ " ミW" WミS;ミIW"ェYミY ;ノW"Wミ"ミW ラ IキWミIW "Iラェミキ キ W ぶく"

0 50 100 150 200

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Année

Nombre d'études

d’évaluation des récompenses et d’erreur de prédiction 8 . De façon intéressante, et contrairement aux résultats obtenus chez l’animal basés quasi-exclusivement sur l’utilisation de récompenses alimentaires et de drogues, les connaissances actuelles sur le système de récompense humain se sont construites essentiellement sur la base d’études manipulant de l’argent. Ceci est lié au fait que l’argent est une récompense facile à quantifier, ayant une valeur universelle, et ne produisant pas ou peu d’effets de satiété. Cependant les êtres humains utilisent une variété particulièrement importante de récompenses, à la fois primaires et secondaires, ce qui offre une opportunité unique d’étudier le système de récompense sous différents angles pour en déduire des principes de fonctionnement généraux. Nous accorderons donc une attention particulière à cet aspect dans l’exposé qui va suivre.

4.1. Magnitude, valence et saillance : comment définir le système de récompense ?