• Nenhum resultado encontrado

La relation input-output dans un répertoire stabilisé

No documento Bernard Victorri (páginas 70-76)

Chapitre IV FONCTION D'UN REPERTOIRE

1- La relation input-output dans un répertoire stabilisé

Il nous faut d'abord vérifier que la stabilisation de ces répertoirescorrespond bien à un apprentissage, c'est-à-dire que la probabilitédes "bonnes" réponses devient très grande à la fin du processus.

Pour cela, il nous faut étudier la forme de la probabilité detransition𝑃, définie sur 𝑋 × 𝑌, qui donne la probabilité d'outputquand un input est présenté à un répertoire stabilisé.

Avec les notations du chapitre précédent, 𝑃 s'écrit : 𝑃(𝑥, d𝑦) = 𝑛𝑖=1𝜆𝑖𝜓𝑖(𝑥)𝜇𝑖 d𝑦

𝜆𝑖𝜓𝑖(𝑥)

𝑛𝑖=1

avec 𝜆𝑖 = 𝑐𝑖+𝑎++ 𝑐𝑖𝑎𝜀 𝑐𝑖+𝑎++ 𝑐𝑖𝑎 qu'il s'agisse de répertoires disjoints ou à renforcement sélectif.

1.1- Métrique riemannienne sur X et Y

Nous allons avoir besoin, pour étudier 𝑃, de pouvoir parler de distances dans𝐸 = 𝑋 × 𝑌.

Pour cela, il nous faut définir une métrique sur𝐸, et nous allons essayer d'en trouver une qui soit "naturelle" d'un point de vue physiologique.

Revenons donc à la manière dont nous avons défini les variétés réceptrices et effectrices au chapitre I. Nous avons vu que les neurones étaient sensibles à un certain nombre de caractéristiques du stimulus, et que la variété réceptrice était le produit cartésien des variétés sur lesquelles étaient définies ces caractéristiques. Prenons un exemple : celui des cellules de l’aire 17 sensibles à des "barres". On sait qu’elles sont sensibles, entre autres, à la position spatiale de la barre, à son orientation et à sa longueur. Si l'on s'en tient à ces trois caractéristiques, la variété réceptrice 𝑋 serait le produit cartésien de trois variétés :

– pour la position spatiale, un ouvert de S2que l'on appellera Ω, décrit, par exemple, à l’aide des deux coordonnées polaires𝑟 et 𝜙 du milieu de l’image de la barre sur la rétine.

– pour l'orientation, la variété S1, décrite, par exemple, par l'angle 𝜓de la barre avec l'horizontale.

– pour la longueur, un intervalle ouvert borné Ide ℝ, décrit, par exemple, par la longueur 𝑙 de l'image de la barre sur la rétine.

Dès que l'on définit une métrique riemannienne sur chacune de ces variétés, on peut induire une métrique riemannienne sur la variété produit 𝑋. Par exemple, on peut choisir surΩ la métrique (d𝑟)2+ 𝑟2(d𝜙)2, sur S1 (d𝜓)2, et surI (d𝑙)2, ce qui donnera sur 𝑋 la métrique(d𝑟)2+ 𝑟2(d𝜙)2+ (d𝜓)2+ (d𝑙)2.

Cependant, cette métrique ne va pas être en général la mieux adaptée à notre problème. En effet, nous avons vu au chapitre I que les "cartographies" sensorielles dans le cerveau sont loin d'être "homogènes". Par exemple, le centre de la rétine, la fovéa, est beaucoup mieux représenté dans l'aire 17 que la périphérie ; il y a beaucoup plus de cellules sensibles à cette partie du champ, et leurs champs récepteurs y sont plus petits. De même, il est fort possible, pour l'orientation des barres, qu'il y ait plus de cellules sensibles aux directions proches de l'horizontale ou de la verticale qu'aux directions obliques, et que pour cette dimension aussi, les champs récepteurs ne soient pas de même "taille". Il serait donc judicieux de choisir, pour ces caractéristiques, une métrique qui tienne compte de cette réalité.

Pour ce faire, supposons que nous ayons défini une première métrique riemannienne sur la variété représentant une des caractéristiques du stimulus

(

par exemple (d𝑟)2+ 𝑟2(d𝜙)2sur Ω

)

. Grâce à cette métrique, on peut définir une mesure sur cette variété (voir, par exemple, Loomis et Sternberg, 1968). Cela nous permet alors de calculer le "volume" des champs récepteurs pour cette caractéristique (dans le cas de Ω, ce volume serait simplement∫ 𝑟d𝑟d𝜙).

On peut alors définir, en chaque point de cette variété, la "taille moyenne" des champs récepteurs qui contiennent ce point. Cette fonction "taille moyenne'' n'a aucune raison d'être continue, mais s'il y a beaucoup de champs récepteurs, on peut facilement lui substituer une fonction différentiable qui en soit une approximation raisonnable

(

ainsi, dans le cas de Ω, cette fonction "taille moyenne", notons-la 𝜌, ne dépendrait que de𝑟 :𝜌(𝑟)serait très petit tant que 𝑟serait plus petit que le rayon de la fovéa, puis serait une fonction croissante de 𝑟 pour les valeurs plus grandes de r

)

. En divisant alors notre métrique par une puissance convenable de cette fonction (qui est partout positive, bien entendu), on obtient une nouvelle métrique dans laquelle la "taille moyenne" des champs récepteurs est approximativement égale à 1 (dans notre exemple cette nouvelle métrique sur Ωserait 1 𝜌 𝑟 d𝑟 2+ 𝑟2 d𝜙 2 , mais dans le cas général, si Ωest de dimension 𝑑, il faudrait diviser par 𝜌2 𝑑).

Bien entendu, cette "normalisation" de la taille moyenne ne saurait être qu'approximative, puisque la normalisation se fait point par point, alors que le volume d'un champ récepteur est une intégrale sur toute une région (plus la taille des champs récepteurs est petite par rapport à la taille de la variété, plus cette approximation est bonne). Néanmoins, cela nous suffira dans l'étude qualitative que nous voulons mener.

Notons au passage que cela impose que la variété elle-même, en tant que recouvrement d'un nombre fini de champs récepteurs de taille finie, ait une taille finie. Ce sera effectivement le cas, tout organe sensoriel ne pouvant opérer que sur des "champs sensoriels" limités. En tout état de cause, chaque caractéristique des stimuli sera définie soit sur une variété compacte soit sur un ouvert borné de ℝ𝑛.

On peut alors, en répétant l'opération sur chaque caractéristique, définir une métrique riemannienne sur la variété réceptrice 𝑋, pour laquelle la taille moyenne des champs récepteurs sera approximativement égale à 1, et qui représentera mieux le type de cartographie des sens qui peut exister dans les aires corticales. Pour prendre un exemple ailleurs que dans le système visuel, la "surface tactile" d'un doigt, avec une telle métrique normalisée, pourra être aussi grande que celle du dos, et la "variété tactile" ainsi obtenue

ressemblera aux représentations que les physiologistes ont l'habitude de faire des aires tactiles du cortex (où mains, pieds et visage occupent une place démesurée par rapport au reste du corps).

Le même type de normalisation peut être fait sur les variétésreprésentant les mouvements moteurs de l'organisme. On sait qu'il ya des mouvements qui peuvent être exécutés avec beaucoup plus de finesseque d'autres, et que cela correspond à une innervation plus importantedes muscles, et à des neurones dont les champs effecteurssont plus petits. Nous pouvons là aussi définir une métrique sur legroupe moteur qui respecte cet état de fait.

Nous allons donc supposer dans ce qui suit que les variétés 𝑋 et 𝑌 de nos répertoires sont munies d'une telle métrique, ce qui munit du même coup l'espace des événements 𝐸= 𝑋 × 𝑌 d'une métrique riemannienne. Ces métriques définissent sur chacun des trois espaces 𝑋, 𝑌 et 𝐸, une distance et une mesure, que nous noterons respectivement 𝑑 et 𝜍dans les trois cas (le contexte sera suffisamment clair pour savoir sur quel espace elles sont définies chaque fois).

1.2- Répertoires disjoints

Rappelons qu'un répertoire disjoint est défini par un "quadrillage" de 𝐸 à partir de partitions 𝑋𝛼 et 𝑌𝛽 de 𝑋 et 𝑌 (figure 10, chapitre III). Pour chaque élément 𝑟𝑖, il existe un 𝛼et un𝛽 qu'on note 𝛼(𝑖)) et 𝛽(𝑖) tel que 𝑈𝑖 = 𝑋𝛼et𝑉𝑖 = 𝑌𝛽.De même, tout événement (𝑥, 𝑦)est dans une "case" 𝑋𝛼× 𝑌𝛽 et l'on notera 𝛼(𝑥) et 𝛽(𝑦) les indices pour lesquels 𝑥 ∈ 𝑋𝛼et ∈ 𝑌𝛽. Comme au chapitre précédent on notera 𝐼𝛼(resp. 𝐼𝛽) l'ensemble des 𝑖 pour lesquels 𝛼(𝑖) = 𝛼(resp. 𝛽(𝑖) = 𝛽).

Avec la métrique "normalisée" que nous avons définie, on peut supposerqu'en première approximation la taille des différentes "cases"est la même et qu'il y a le même nombre d'éléments par case. On posera donc 𝜍 𝑋𝛼 = 𝜍 𝑌𝛽 = 𝜍 𝑋𝛼 × 𝑌𝛽 = 1pour tout 𝛼et 𝛽, et l'on appellera𝑚 le nombre d'éléments 𝑟𝑖 ayantle même 𝑈𝑖× 𝑉𝑖 :𝑚 = card 𝐼𝛼 ∩ 𝐼𝛽 pour tout 𝛼et 𝛽.

Il est aussi logique de supposer que la probabilité d'output𝜇𝛽pour un 𝑌𝛽 est uniforme par rapport à la mesure 𝜍à l'intérieur de𝑌𝛽· :

∀𝐵 ∈ 𝒴 𝜇𝛽(𝐵) = 𝜍(𝐵 ∩ 𝑌𝛽)

(on vérifie que l’on a bien :𝜇𝛽(𝑌𝛽) = 𝜍 𝑌𝛽 = 1) La probabilité de transition peut donc s'écrire :

𝑃(𝑥, d𝑦) = 𝑖∈𝐼𝛼(𝑥)∩𝐼𝛽 (𝑦 )𝜆𝑖𝜓𝛼(𝑥)(𝑥)𝜇𝛽(𝑦) d𝑦 𝜆𝑖𝜓𝛼(𝑥)(𝑥)

𝑖∈𝐼𝛼(𝑥) = 𝑖∈𝐼𝛼 (𝑥)∩𝐼𝛽 (𝑦 )𝜆𝑖

𝜆𝑖

𝑖∈𝐼𝛼(𝑥) 𝜍 d𝑦

Ainsi, pour un 𝑥 donné, 𝑃(𝑥, d𝑦) est donné par une densité deprobabilité par rapport à 𝜍, qui ne dépend que de la "case" à laquelleappartient (𝑥, 𝑦) (fonction constante par morceaux).

On remarque aussique deux éléments définis par la même case ont le même 𝜆𝑖, puisque 𝑐𝑖 =∫ 𝑋 𝜍 d𝑦 𝜋 d𝑥

𝛼(𝑖)×𝑌𝛽 (𝑖) ∩𝐸

𝑋 𝜍 d𝑦 𝜋 d𝑥

𝛼(𝑖)×𝑌𝛽 (𝑖)

ne dépend que de 𝛼(𝑖) et de 𝛽(𝑖).

Appelons 𝜆𝛼,𝛽la valeur commune des 𝜆𝑖 tels que 𝛼(𝑖) = 𝛼et𝛽(𝑖) = 𝛽. Comme il y a 𝑚 éléments dans 𝐼𝛼(𝑥)∩ 𝐼𝛽(𝑦) on a :

𝑃(𝑥, d𝑦) =𝑚𝜆𝛼(𝑥),𝛽(𝑦) 𝜆𝑖

𝑗 ∈𝐼𝛼(𝑥) 𝜍 d𝑦

La densité de probabilité définie sur 𝑌 pour un 𝑥 donné est doncproportionnelle dans chaque 𝑌𝛽à 𝜆𝛼(𝑥),𝛽.

On arrive donc aux conclusions suivantes(figure 12) :

– si 𝑋𝛼× 𝑌𝛽 ⊂ 𝐸, 𝜆𝛼,𝛽 = 𝜀 et la densité de probabilitéest négligeable dans 𝑋𝛼× 𝑌𝛽. – si 𝑋𝛼× 𝑌𝛽 ⊂ 𝐸+,𝜆𝛼,𝛽 = 1 et la densité de probabilité estmaximum dans 𝑋𝛼× 𝑌𝛽.

– si 𝑋𝛼× 𝑌𝛽est à cheval sur 𝐸+et 𝐸, 𝜆𝛼,𝛽 va dépendredu rapport des volumes occupés par 𝐸+ et 𝐸 dans 𝑋𝛼 × 𝑌𝛽(mesurés par𝜋⨂𝜍) et du type de renforcement (rapport 𝑎 𝑎+).

Ainsi on peut affirmer qu'après stabilisation, un répertoiredisjoint aura une très forte probabilité de répondre pour un input 𝑥donné, par un output 𝑦 tel que soit (𝑥, 𝑦) ∈ 𝐸+("bonne réponse"),soit (𝑥, 𝑦)est à une distance de 𝐸+ d'au plus lediamètre1 d'unecase 𝑋𝛼× 𝑌𝛽. Nous appellerons cette distance la distance de discriminationdu répertoire.

On peut donc résumer ce qui précède en disant que la distancede discrimination d'un répertoire disjoint est de l'ordre des diamètresdes champs d'activité (les 𝑈𝑖 × 𝑉𝑖).

1.Le diamètre d’une case est défini comme la distance maximum de deux points de la case.

Figure 12 : Réponse d’un répertoire disjoint stabilisé 𝒀

𝑿 𝑌

+

𝑬+

𝑬+ 𝑬

𝑬 𝒙

bonnes réponses

densité de probabilité d’output pour l’input 𝑥

1.3- Répertoire à renforcement sélectif

Un répertoire à renforcement sélectif est caractérisé par le fait que les champs de renforcement 𝐶𝑖. sont très petits par rapport aux champs d'activité 𝑈𝑖× 𝑉𝑖. Nous avons déjà signalé que ce type de répertoires pourrait présenter un intérêt biologique quand les fonctions de sensibilité 𝜓𝑖et les densités de probabilité représentant 𝜇𝑖 étaient des surfaces en "cloche"

et que les champs 𝐶𝑖 étaient limités aux valeurs maximales de ces cloches (figure 11, chapitre III).

C'est le cas que nous allons considérer ici. Nous allons donc supposer que les 𝑈𝑖 sont des boules pour la métrique définie par la distance 𝑑sur 𝑋, de centre 𝑥𝑖 et que 𝜓𝑖 peut s'écrire, pour tout 𝑥 ∈ 𝑈𝑖, 𝜓𝑖(𝑥) = 𝑓𝑖 𝑑 𝑥, 𝑥𝑖 où𝑓𝑖est une fonction décroissante devenant négligeable aux frontières de 𝑈𝑖 (par exemple, du type 𝑓𝑖(𝜉) = 𝑒−4𝜉2 𝜌𝑖2où 𝜌𝑖 est le rayon de la boule 𝑈𝑖).

De même, les 𝑉𝑖 seront des boules sur 𝑌 centrées en 𝑦𝑖 et les probabilités 𝜇𝑖 seront du type 𝜇𝑖(d𝑦) = 𝑔𝑖 𝑑 𝑦, 𝑦𝑖 𝜍(d𝑦), où 𝑔𝑖 est une fonction décroissante devenant négligeable aux frontières de 𝑉𝑖, comme la fonction 𝑓𝑖, mais vérifiant de plus la condition de normalisation∫ 𝑔𝑉 𝑖 𝑑 𝑦, 𝑦𝑖 𝜍(d𝑦) = 1

𝑖

Le volume des 𝑈𝑖 et des 𝑉𝑖 peut être variable mais pour chaque point (𝑥, 𝑦) la moyenne des 𝜍 𝑈𝑖 × 𝑉𝑖 tels que (𝑥, 𝑦) ∈ 𝑈𝑖× 𝑉𝑖 est approximativement 1.

Quantà 𝐶𝑖, ce sera une boule de 𝐸 centrée en 𝑥𝑖, 𝑦𝑖 de rayon très petit. On aura donc 𝜆𝑖 = 𝜀 dès que 𝑥𝑖, 𝑦𝑖 est quelque peu éloigné de 𝐸+et𝜆𝑖 = 1dès que 𝑥𝑖, 𝑦𝑖 est à l’intérieur de 𝐸+. Examinons alors 𝑃(𝑥, d𝑦) :

𝑃(𝑥, d𝑦) = 𝑛𝑖=1𝜆𝑖𝜓𝑖(𝑥)𝜇𝑖 d𝑦 𝜆𝑖𝜓𝑖(𝑥)

𝑛𝑖=1

Pour un 𝑥 donné, le dénominateur de cette expression reste constant. La probabilité va donc varier comme le numérateur de cette expression. Or dans la somme

𝜆𝑖𝜓𝑖(𝑥)𝜇𝑖 d𝑦

𝑛𝑖=1 𝜆𝑖𝜓𝑖(𝑥)𝜇𝑖 d𝑦 dépend de la distance de (𝑥, 𝑦) à 𝑥𝑖, 𝑦𝑖 et de la positionde 𝑥𝑖, 𝑦𝑖 par rapport à 𝐸+.

On peut donc en déduire les résultats suivants (figure 13)

– si (𝑥, 𝑦) est inclus dans 𝐸+ il y aura dans cette somme un certain nombre de termes pour lesquels 𝑥𝑖, 𝑦𝑖 est dans 𝐸+ et 𝑑 𝑥, 𝑦 , 𝑥𝑖, 𝑦𝑖 est petit.

– par contre, dès que (𝑥, 𝑦) s'éloigne quelque peu de 𝐸+, le nombre de termes pour lesquels 𝑥𝑖, 𝑦𝑖 est dans𝐸+ (donc 𝜆𝑖 nonnégligeable) décroît rapidement (comme la puissance 𝑝𝑖è𝑚𝑒 de 𝑑 𝑥, 𝑦 , 𝐸+ si𝐸 est de dimension 𝑝). De plus, pour ces termes non négligeables 𝑑 𝑥, 𝑦 , 𝑥𝑖, 𝑦𝑖 ≥ 𝑑 𝑥, 𝑦 , 𝐸+ et donc𝜓𝑖(𝑥) et 𝜇𝑖 d𝑦 décroissent aussi rapidement avec 𝑑 𝑥, 𝑦 , 𝐸+ .

Ainsi, même en restant à ce niveau très qualitatif, on peut affirmer que 𝑃(𝑥, d𝑦)va décroître très rapidement dès que (𝑥, 𝑦) ∉ 𝐸+, ce qui signifie que la distance de discrimination d'un répertoire à renforcement sélectif sera beaucoup plus petite que le diamètre des champs récepteurs et effecteurs.

Ce résultat est très important car on sait que les capacités de discrimination d'un système perceptif sont beaucoup plus grandes que ne le laisserait supposer la taille des champs récepteurs. L'exemple le plus frappant à cet égard est l'acuité au "vernier" :on est capable de percevoir si deux traits verticaux sont ou non en face l'un de l'autre avec une précision de l'ordre de la seconde d'arc, ce qui est nettement plus petit que la taille du champ récepteur de n'importe quelle cellule visuelle (y compris les cônes et les bâtonnets de la rétine : voir Matin, 1972).

Cette propriété donne donc un net avantage aux répertoires à renforcement sélectif par rapport aux répertoires disjoints du point de vue de la vraisemblance physiologique.

Figure 12 : Réponse d’un répertoire à renforcement sélectif stabilisé 𝒀

𝑿 𝑌

+

𝑬+

𝑬+ 𝑬

𝑬

𝒙

bonnes réponses

densité de probabilité d’output pour l’input 𝑥

𝑼𝒊

𝑽𝒊

No documento Bernard Victorri (páginas 70-76)