• Nenhum resultado encontrado

Invariance d'un objet par rapport à son propre mouvement

No documento Bernard Victorri (páginas 107-110)

Chapitre VI INVARIANCE PERCEPTIVE ET GEOMETRIE DE LA PERCEPTION

5- Invariance d'un objet par rapport à son propre mouvement

Lorsqu'un objet se déplace dans l'environnement, certaines deses caractéristiques varient : essentiellement sa position et son orientationdans un repère fixe. Par contre, d'autres caractéristiquesrestent invariantes : sa taille, sa couleur, sa forme…Reconnaîtrele mouvement auquel est soumis un objet, c'est reconnaître que sescaractéristiques de position et d'orientation ont varié. Nous venonsde voir les problèmes que posaient cette reconnaissance du mouvementet les liens étroits qu'ils entretenaient avec les problèmes de reconnaissancede forme. C'est dans le cadre de cette interaction quel'on peut essayer de comprendre comment le système perceptif détectece qui reste invariant lors du mouvement d'un objet.

Prenons un exemple simple : un enfant manipule une règle d'unecertaine longueur. Chaque fois que la règle bouge, les images de larègle sur les rétines se transforment. L'enfant, grâce aux répertoiresassurant l'invariance perceptive par rapport à ses propres mouvementspeut percevoir que cette transformation correspond à un mouvement réelde la règle. Prenons alors un répertoire qui soit sensible à la foisà la position des deux extrémités de la règle (variété réceptriceℝ3× ℝ3, chaque input étant un couple de points deℝ3). Tout déplacementde la règle va transformer l'input d'un tel répertoire, et sil'on considère l'ensemble des déplacements possibles, l'input va décrireune partie de la variété réceptrice, qui sera une orbite dans

cettevariété de l'action du groupe des déplacements euclidiens. Ces orbitesforment une partition de la variété, chaque orbite étant caractériséepar la valeur d'un paramètre invariant sous l'action du groupe. Dansnotre cas, cet invariant sera tout simplement la longueur de la règle.

D'une manière plus générale, prenons un objet quelconque etsupposons qu'il donne naissance, après un processus de reconnaissancede forme, à un input dans un répertoire adéquat. Nous pouvons supposerque cet input est invariant par rapport aux mouvements du sujet. Maissi l'objet se déplace, l'input va se transformer, et décrire une orbitesur la variété réceptrice du répertoire de l'action du groupe des déplacements.

Ainsi, si ce répertoire se stabilise en respectant ces orbites,(c'est-à-dire de manière à ce qu'une classe d'équivalence d'inputsconduisant au même output soit constituée de telles orbites), il deviendraapte à détecter les caractéristiques intrinsèques de l'objet,indépendamment de sa position et de son orientation dans l'espace. Lareconnaissance de forme devient alors invariante non seulement parrapport aux mouvements du sujet, mais aussi par rapport aux mouvementsde l'objet.

Dans cette perspective, la perception d'un objet comme étant"le même", quelle que soit sa position dans l'espace, serait acquiseau cours du développement perceptif. Ce dernier point a été mis en évidenceen particulier par Piaget (1947) qui a montré, par exemple,qu'un bébé ne reconnaissait pas, dans les premiers stades de sa vie,son biberon si on le plaçait à 180° de son orientation habituelle, etqui a insisté sur l'importance de la manipulation des objets dans ledéveloppement de la perception visuelle chez le jeune enfant.

Une conséquence particulièrement importante de cette théorie,c'est que le groupe local de transformations par rapport auquel la perceptionde la forme d'un objet va être invariante dépend du type de mouvementsfamiliers auquel est soumis cet objet. Ainsi, peut-on expliquerque certains objets soient "reconnus" quelle que soit leur position dansl'espace, tandis que certains autres, par exemple un visage, ou unelettre de l'alphabet, n'admettent qu'un groupe local plus restreint(un visage tourné à 180° est très difficilement reconnaissable, ce quis'explique par le fait que l'on voit rarement les gens "tête en bas" !).

Pour des objets non-rigides (exemples : feuille de papier, animal…)le groupe de transformations admissibles pourrait être plus grand queles simples déplacements euclidiens.

Il faut, bien entendu, prendredans ce cas la notion de "forme" dans une acception plus large. Il estdifficile de parler de forme intrinsèque au sens strict pour un objet"déformable". Il est cependant indéniable que quelque chose (la "nature"de l'objet ?) se conserve au cours de ses déformations. C'est à cela queseraient sensibles les répertoires correspondants.

On voit donc que dans notre conception les "percepts" dépendentautant de la forme du stimulus qui est présenté que du groupe de transformationsadmissibles de cette forme.

A cette conception s'opposent d'autres théories qui ont cherchéaussi à expliquer l'invariance de la reconnaissance de forme par rapportaux déplacements de l'image à partir des données neurophysiologiques récentes.

L'une des plus importantes, qui connaît un grand succès depuisquelques années, s'appuie sur la découverte de neurones "analyseurs defréquence spatiale" pour supposer que la reconnaissance de forme sefait à partir d'une transformation de Fourier de l'image rétinienne, danschaque direction (Glexer, Ivanoff et Tscherbach, 1973 ;Maffei, 1978).L'invariance d'une telle décomposition par rapport aux translations dansle plan frontal serait ainsi automatique.

Blaivas (1975, 1977) propose, dans la même veine, une décompositionpar rapport aux harmoniques sphériques, qui ont l'avantage d'être la familledes fonctions propres du groupe SO(3) tout entier.

Remarquons d'abord que ce type de transformations ne permet pas,à lui seul, de résoudre le problème du passage du local au global. Eneffet, ce qui semble établi au niveau neurophysiologique, c'est que certains neurones sont localement (dans les limites de leur champ récepteur)sensibles à certaines fréquences spatiales. Or, un déplacement globalne respectera évidemment pas cet aspect local : le problème reste doncposé avec autant d'acuité dans ces théories.

De plus, ces transformations n'expliquent pas du tout comment sontacquises les invariances par rapport à d'autres mouvements que les translations, ou à la rigueur les déplacements dans un plan frontal : qu'enest-il, en particulier, des déplacements "en profondeur" (comme, parexemple, les rotations par rapport à un axe vertical) ?

Certains auteurs ont essayé d’introduire plus de "souplesse" dansleurs modèles. Ainsi, Dodwell (1967) émet 1 'hypothèse que le systèmevisuel opère par transformations conformes à partir de l'image visuelle,ce qui lui permet d'expliquer l'adaptation aux lunettes déformantes.

Lafamille des transformations conformes (du moins si l'on se restreint àun espace visuel à deux dimensions) est, en effet, assez "grande" pourreprésenter pratiquement toute déformation de l'image due à des lunettes.Cependant, on ne comprend pas pourquoi on devrait privilégier cette famillepar rapport à d'autres transformations différentiables : rien nele justifie, ni au niveau psychologique, ni au niveau neurophysiologique.

La théorie de l'invariance perceptive qui présente d'un point devue mathématique le plus d'élégance et d'envergure est sans doute celled'Hoffman (1966, 1970, 1978). Hoffman prend comme point de départ quele champ visuel est une variété différentielle, et il fait correspondre àchaque type d'invariance le groupe de transformations dont les orbitesdéfinissent cet invariant. Considérant alors l'algèbre de Lie du groupe,il dresse une table associant à toute transformation perceptive les dérivéesde Lie correspondantes, ce qui lui permet de discuter des phénomènesperceptifs avec le "vocabulaire" de cette puissante théorie mathématique.En particulier, il prédit, à partir de la nécessité de laclôture de la multiplication dans l'algèbre de Lie, l'existence de nouveauxinvariants perceptifs, et il explique aussi le développement perceptif par "stades" chez l’enfant. Cette théorie a attiré l’attentionde plusieurs spécialistes de la perception (Jung, 1973 ; Bresson, 1972 ;Zusne, 1970 ;Dodwell, 1978). Cependant, l'aspect neurophysiologique dela théorie prête le flanc à de sérieuses critiques. En effet, selonHoffman, les neurones du cortex visuel seraient des "générateurs infinitésimaux"des invariances. Concrètement, il suppose que chaque imagesur la rétine se traduit par un champ vectoriel dans le cortex le longdes neurones visuels et que la forme anatomique même de ces neurones enferait des détecteurs d'invariants. A chaque forme de neurone (cellulespyramidales, étoilées, "en corbeille", etc.) est associée un élémentde l’algèbre de Lie d'un groupe de transformations,la forme des courbes invariantes dans ℝ2 ou ℝ3 par cet élément del'algèbre et la forme du neurone se ressemblant (par exemple, aux neuronesétoilées correspond l'élément de l'algèbre de Lie engendrant les dilatations,etc.). Le déplacement de l'influx nerveux dans ces neuronesdécrirait donc automatiquement les orbites de l'image rétinienne pourles groupes à un paramètre correspondant à ces opérateurs infinitésimaux.Cette théorie, aussi ingénieuse soit-elle, semble en contradiction avecles faits neurophysiologiques :

il est difficile, en effet, d'admettreque la géométrie des neurones représente avec quelqu'exactitude desfamilles de courbes (droits, cercles, hyperboles) dont a besoin la théorie.

No documento Bernard Victorri (páginas 107-110)