• Nenhum resultado encontrado

[PENDING] L’intelligence en essaim sous l’angle des systèmes complexes : étude d’un système multi-agent réactif à base d’itérations logistiques couplées

N/A
N/A
Protected

Academic year: 2024

Share "L’intelligence en essaim sous l’angle des systèmes complexes : étude d’un système multi-agent réactif à base d’itérations logistiques couplées"

Copied!
273
0
0

Texto

Premièrement, notre modèle SMAL vise à disposer d’un cadre unificateur pour les deux types de questions d’intelligence en essaim ciblées par notre étude. Ceci conclut l’état de l’art des concepts et des techniques actuellement liés à l’intelligence en essaim.

Apparition du concept

Les avantages attendus de l’essaim de robots par rapport à un système de robots à contrôle centralisé découlent directement de ces caractéristiques. Beni situe l’intelligence de l’essaim de robots dans sa capacité à traiter à la fois la matière et l’énergie comme n’importe quelle machine, et l’information comme n’importe quel automate informatique.

Autres visions de l’intelligence en essaim

Pour nous, une autre dimension de l’intelligence en essaim est la modélisation basée sur les agents, ce qui est confirmé à la fois par les biologistes et par certains informaticiens. Selon nous, seule la notion d'agent peut permettre de capter l'intelligence de l'essaim dans toutes ses dimensions.

Inspiration biologique et caract´eristiques

La m´etaphore biologique

Une réflexion sur l’auto-organisation et l’adaptation est donc nécessaire ; elle doit s'appuyer sur une phase parfois longue de simulations informatiques et fait partie intégrante de l'intelligence en essaim. Le mouvement collectif que nous appelons dans ce document « flocage » est un phénomène central pour l'intelligence en essaim.

Caract´eristiques g´en´eriques des approches en essaim

Le manque de formalisation et d’analyse théorique au niveau local du fonctionnement de l’essaim est le principal reproche que nous faisons à la modélisation de l’intelligence par essaim en général.

De la bio-inspiration aux algorithmes embl´ematiques : “flocking” et colonies

  • Boids de Reynolds
  • Le mod`ele de Vicsek et les syst`emes particulaires
  • Le double pont de Deneubourg et l’algorithme fourmi de Dorigo
  • Vers l’optimisation
  • M´etaheuristiques et optimisation
  • Optimisation par essaim particulaire
  • Optimisation par colonies de fourmis

L'évaporation des phéromones n'est pas prise en compte du fait de la durée de l'expérience d'environ une heure. Cette famille d'algorithmes a montré ses performances sur plusieurs problèmes d'optimisation : l'extension de l'algorithme à d'autres types de problèmes d'optimisation comme

Robotique en essaim

La cybernétique met l'accent sur l'importance de la communication et du contrôle de l'information pour comprendre les niveaux d'organisation les plus complexes. De plus, cette phénoménologie de l'auto-organisation ne se produit, nous dit Prigogine, que pour des systèmes non linéaires d'une part, et loin de l'équilibre thermodynamique d'autre part.

Synerg´etique

En physique et en biologie, l’auto-organisation se produit dans des systèmes ouverts loin de l’équilibre thermodynamique27. Le principe fondamental de la synergie qui nous intéresse le plus ici repose sur des mécanismes observés dans les systèmes physiques. Pour modéliser ce principe de fonctionnement, la synergétique utilise la théorie des bifurcations dans les systèmes dynamiques [Arnoldet al., 1999, Haken, 1979].

M´ecanismes de l’auto-organisation biologique

En partie grâce à ces deux processus antagonistes, des formes d’auto-organisation biologique émergent au sein de grands groupes d’entités en interaction. L'interaction entre les individus ou les parties qui composent un système biologique est au cœur du problème de l'auto-organisation. La question de la nature des interactions est donc fondamentale et préalable à toute modélisation de l'auto-organisation.

Auto-organisation en intelligence artificielle

Calcul émergent Quant au « calcul émergent », cette approche est née de la volonté de se différencier de l'approche « physique » de l'auto-organisation et surtout d'intégrer la théorie du calcul comme contexte distinct pour ces problèmes. Il s’agissait donc de donner naissance à un mouvement spécifique dédié aux problématiques émergentes de l’informatique et de démontrer que ces phénoménologies existent aussi dans les objets manipulés par la théorie du calcul. La différence d’approche entre les algorithmes classiques d’intelligence artificielle et les algorithmes émergents est particulièrement frappante dans ce contexte.

Bilan interm´ediaire sur l’auto-organisation

La mesure de l’auto-organisation implique la définition d’une grandeur, celle de la complexité du système. Dans cette idée, le terme « profondeur logique de Bennett » [Bennett, 1986] rend mieux compte de la complexité organisée. Ce passage de l’auto-organisation à la complexité nous conduit naturellement vers des systèmes dits complexes, dont nous traçons les contours dans la section suivante.

La science des syst`emes complexes : une science f´ed´eratrice autour de l’auto-

D´efinitions du domaine

Dans le contexte de l'étude des systèmes complexes, un sous-domaine a émergé sous le nom de « systèmes complexes adaptatifs ». La science des systèmes complexes : une science fédératrice autour de l’auto-organisation en général est à ranger dans cette catégorie, en particulier -. Ce centre est essentiel pour faire du domaine des systèmes complexes une science.

Notre aproche : application logistique et RIC

Ceux-ci incluent : les réseaux (sociaux, informatiques, neuronaux, de spin, etc.), les algorithmes génétiques et évolutifs, la turbulence, les systèmes physico-chimiques et morphologie, la vie artificielle, les insectes sociaux et leurs applications algorithmiques, les systèmes coopératifs, la dynamique de groupe, la circulation automobile. Les outils de mesure de la complexité reposent aujourd’hui essentiellement sur des extensions de la théorie de l’information. Shalizi s'intéressait principalement aux outils de mesure de la complexité (cf. [Shaliziet al., 2004]).

L’application logistique : un mod`ele minimal non lin´eaire et chaotique

  • Analyse des s´eries temporelles de l’application logistique
  • Diagramme de bifurcation
  • Exposants de Lyapunov et chaos
  • Autres propri´et´es

5.3 - Premières applications de retour (à gauche) et séries temporelles associées (à droite) pour certaines valeurs du paramètre de contrôle de l'application logistique. Nous rapportons tous les points fixes ¯x de l'application en fonction de la valeur du paramètre de contrôle. 5.7 – Estimation de l'exposant de Lyapunov pour l'application logistique en fonction du paramètre de contrôle.

R´eseaux d’it´erations coupl´ees : mod`ele arch´etypal de syst`eme complexe com-

R´eseaux localement et globalement coupl´es

Réseaux d'itérations liées : modèle archétypal d'un système informatique complexe – Un graphe G= (V, E) qui définit le réseau. On retrouvera par exemple la version classique de l’application logistique et l’un de ses conjugués quadratiques utilisés. La particularité de cette application est que le domaine de définition de l’état cellulaire reste invariant quel que soit le paramètre de contrôle.

Ph´enom`enes de synchronisation

La stabilité de l'état synchrone dépend des valeurs propres de la matrice jacobienne associée à l'équation 5.18 en x∗. Cette courbe seuil 5,23 est très irrégulière, comme le tracé de l'exposant d'application logistique simple 5,7. La phase de synchronisation totale disparaît pour laisser place à une phase de « groupes flous »39 qui présentent le même type de comportement que les groupes précédents.

Le mod`ele de gaz d’it´erations coupl´ees

Les propriétés d'un RCM tendent vers celles du RIC global à la limite thermodynamique lorsque N ≫1. On voit donc ici l'importance des phénomènes de synchronisation cellulaire une fois qu'une série d'applications chaotiques sont reliées en réseau. Un régime de faible diffusion : les clusters se forment et forment une sorte de réseau de clusters ; les éléments se déplacent d'un de ces clusters à l'autre.

Entropie de Kolmogorov : mesure du degr´e de chaos d’un syst`eme

  • D´efinition de l’entropie K
  • Propri´et´es de l’entropie K
  • Calcul de l’entropie K
  • De la particule ` a l’agent : l’agent du physicien
  • L’agent de l’informaticien

Les limites identifiées au chapitre 3 sur l’intelligence en essaim ont motivé. Evolution du concept de particule Le concept d'agent est de plus en plus utilisé par les physiciens, sans doute en raison de l'engouement croissant pour l'étude des systèmes complexes. Jacques Ferber, dans ses travaux sur les systèmes multi-agents [Ferber, 1995], donne la définition générale suivante de l'agent.

Syst`eme multi-agent r´eactif

Le modèle influence-réponse est l’écriture de la dynamique couplée des agents avec leur environnement. Il représente souvent le modèle de l’espace physique dans lequel évoluent les agents. Dans cette section d'introduction, nous présentons les principes de conception de notre modèle de système logistique multi-agents (SMAL).

Sp´ecifications et formalisation du SMAL

  • D´efinition du syst`eme multi-agent logistique
  • Agents logistiques
  • Mod`ele de l’environnement
  • Caract´eristiques des champs de l’environnement
  • Equations maˆıtresses du SMAL
  • Op´erateurs de perception limit´ee
  • Processus sensorimoteurs
  • R´eactions de l’environnement
  • Discussion

Le champ de décision scalaire X(X) stocke de manière non persistante la valeur de la partie décision de l'état interne d'un agent. Le champ de contrôle est persistant ou transitoire, il intervient via un opérateur de perception pour modifier la variable de contrôle interne de l'agent. Cette valeur est généralement utilisée dans le calcul de la nouvelle position de l'agent.

Discussions sur le SMA logistique

Int´erˆet algorithmique : g´en´eration des comportements d’exploration

La figure 8.3 montre comment relier le principe d'exploration-exploitation aux zones du diagramme de bifurcation dans l'exemple d'une application logistique 46. Enfin, une application logistique est connectée avec d'autres applications du même type pour créer pour identifier les phénomènes émergents de synchronisation qu'ils révèlent être dans cette thèse. 8.3 – Application du principe d'exploration et d'exploitation sur les zones du diagramme de bifurcation de l'application logistique xn+1 =r xn(1−xn).

Interpr´etation biologique de la mod´elisation chaotique

Ce cas consiste concrètement en l'immersion de la dynamique interne des agents dans l'espace géométrique de l'environnement. 10.1) qui précise le script générique de la définition de l'état en fonction du problème. La synchronisation naît d'un effet de couplage interne des moyens et se traduit dans l'espace physique ou géométrique de l'environnement.

Mesure de la stabilit´e

Des agents jumeaux pour ´etudier la stabilit´e des clusters

L'analyse théorique de la section 5.4.2 est basée sur le calcul du coefficient transversal de Lyapunov. L'entropie partielle K enregistrée par Kb des séquences excessives de τ pas de temps est définie en tenant compte des coefficients partiels de Lyapun calculés par la formule (10.15) pour le groupe des agents G. Ce calcul des coefficients de Lyapun centrés sur l'individu ne correspond pas strictement aux coefficients du système dynamique global.

Application au suivi des clusters de synchronisation partielle

L'utilisation d'un agent jumeau permet de ne prendre en compte que dans une certaine mesure l'influence de l'interaction avec d'autres agents. Tab.10.1 – Valeurs de calcul de l'entropie partielle K et de la moyenne des coefficients partiels pour les 5 groupes visualisés. Le résultat du calcul d'entropie partielle K et la moyenne des coefficients de chaque groupe sont donnés arrondis à la troisième décimale.

Auto-organisation de type flocking

Cas d’´etude et instanciation

Nous proposons ici d'étudier un cas simple généré par une distribution uniforme des variables de contrôle des agents logistiques. La variable de contrôle a est donc une variable aléatoire à distribution uniforme sur [0,1].

R´esultats de simulations et analyse

10.12 – Evolution temporelle de toutes les variables de décision internes correspondant à tous les agents en fonction du temps. 10.13 – Agents de tout profil dynamique exemple : nombre moyen de clusters formés en z en fonction du couplage ǫ0 en y et du rayon de voisinage de détection R en x pour N = 100 agents. 10.14 – Spectre partiel de Lyapun et suivi de l'entropie K d'un système en fonction du temps avec deux valeurs de ǫ.

Discussion

La figure 10.3.2 montre, comme précédemment, le calcul des valeurs de l'entropie partielle K et du spectre partiel de Lyapunov 50 sur l'ensemble du groupe de moyennes. Mais dès qu’une collision se produit, les amas d’entropie la plus faible se brisent. Résumé– La référence des angles dans notre SMAL instancié ici est fixe par rapport à l'espace de.

Bilan

11.2 – Schéma de principe d’évitement d’obstacles pour l’agent logistique et calcul de la direction générale qui en résulte. Il ne s'agit donc pas vraiment d'un bruit, mais plutôt du résultat d'une décision autonome de l'agent. La direction de la vitesse de l'agent donnée par Ti est ainsi calculée en fonction de différentes perceptions.

Application au flocking de robots

La figure 11.5 raconte en quelques plans une des séquences d'un essaim de 5 robots sur un environnement de 1m×1m. On observe un regroupement des 5 robots au bout de cent secondes, puis une situation de blocage apparaît dans un des coins à 130 secondes, similaire à celle évoquée sur la figure 11.4(d). Ce travail est encore à l’étude et nous pensons pouvoir augmenter significativement le nombre de robots sans que cela ne pose problème.

Apparition de files d’agents par adaptation

Celles-ci sont uniformément réparties sur [0,1], valeur moyenne de la variable aléatoire p. La vitesse de l'agent dépend directement de la valeur de sa variable de décision x et voit donc également sa valeur varier autour de v20. Autour du point fixe il suffit de considérer un développement limité autour de la dérivée partielle selon (11.28).

Application ` a un syst`eme proie-pr´edateurs vu comme probl`eme d’optimisation 177

Comme on peut le constater, la vitesse de la proie diminue à mesure que le nombre de prédateurs dans son voisinage de Moore augmente. Le reste de l'action de chasse consiste en un opérateur influent qui agit sur la transformation du champ de contrôleC. Le bleu de l'environnement correspond à la valeur 1 répartie sur tout le champ C, sauf pour la proie.

L’exp´erience du double pont revisit´ee

Application des fourmis logistiques au probl`eme du TSP

Algorithme des fourmis logistiques pour le TSP

Simulations et r´esultats

Bilan

D´efinitions g´en´erales sur les syst`emes dynamiques

Les syst`emes dynamiques non lin´eaires discrets

Quelques ´el´ements de th´eorie des bifurcations

Bifurcation noeud-col

Bifurcation trans-critique

Bifurcation par doublement de p´eriode

Universalit´e de l’application logistique

La mod´elisation et l’analyse num´erique

Referências

Documentos relacionados