• Nenhum resultado encontrado

issus de la théorie des jeux

N/A
N/A
Protected

Academic year: 2023

Share "issus de la théorie des jeux"

Copied!
141
0
0

Texto

Théorie des jeux

6 exprimé en fonction du vecteur position et asservissement en boucle ouverte en fonction du temps uniquement. Les premiers travaux sur l'étude des jeux différentiels ont été initiés par "Isaacs" et concernent le problème d'évitement de poursuite dans un jeu différentiel à somme nulle.

Les équations de Riccati

Notre contribution

Le chapitre 2 est consacré aux systèmes différentiels couplés de type Riccati dérivés de l'équilibre de Nash en boucle ouverte. Enfin, pour conclure ce chapitre, nous présentons une résolution analytique d'un système différentiel de type Riccati couplé dans le cas scalaire.

Systèmes linéaires

  • Stabilité d’un système linéaire
  • Contrôlabilité et observabilité
  • Stabilisation et détectabilité
  • Equations algébriques du type Lyapunov

En posant V(t, x) = 12xTK(t)x, on vérifie que la matrice K(t) satisfait une équation différentielle de type Riccati. Celles-ci correspondent aux conditions nécessaires et suffisantes à l'existence du couple de solutions du système différentiel de type Riccati couplé.

Un jeu différentiel

Stratégies admissibles

Concernant un jeu différentiel à N joueurs, la notion de stratégies admissibles consiste en un choix raisonnable d'un complexe de stratégies pour que le système différentiel (1.6) admette une solution unique [Frie71]. Des conditions suffisantes pour l'existence d'un ensemble de stratégies admissibles pour la classe des jeux différentiels ΓN sont données dans Friedman (1971).

Structure d’information

Ceci est exprimé en termes d'une paire de solutions stabilisantes d'un système algébrique couplé de type Riccati de la forme suivante. Supposons qu'il existe une paire de solutions stabilisantes (M, V) d'un système algébrique couplé de type Riccati.

Un jeu différentiel linéaire quadratique

Stratégie du maxmin

La stratégie maxmin est considérée comme une stratégie de comparaison dans les jeux différentiels avec N joueurs. Elle peut être utilisée comme référence pour accepter ou rejeter toute proposition possible d'un autre principe d'optimalité, voir Başar et Olsder [BaOl95].

Stratégie de Nash

22 La recherche de stratégies de profit maximum et garanti apparaît, au moins, dans les trois cas suivants. Cette propriété signifie qu’il est plus avantageux pour un joueur d’utiliser sa stratégie d’équilibre de Nash que sa stratégie maximale, à condition que les autres joueurs utilisent également leurs stratégies de Nash.

Stratégie du point-selle

Une situation d’équilibre de Nash est généralement améliorable, c’est-à-dire qu’il peut exister une situation u¯∈ U telle que. Malgré ces défauts, le principe d’optimalité de Nash reste le principe le plus utilisé dans les jeux différentiels sans coalition.

Notions de commande optimale

Principe du Maximum de Pontryaguine

Dans cette section nous rappelons les conditions nécessaires à l’existence d’une solution optimale au problème de contrôle (1.21).

Equations de Hamilton-Jacobi-Bellman

Problème de la commande linéaire quadratique

  • Problème aux deux bouts
  • Equation différentielle du type Riccati
  • Lemme de Radon, version 1
  • Equation algébrique du type Riccati

Nous supposons que la solution de l’équation différentielle de type Riccati (1.31) existe pour tout t ∈ [t0, tf]. En plus de l’équation différentielle de type Riccati (1.31), nous étudierons le système différentiel linéaire suivant.

Conclusion

Ainsi, pour la recherche de quelques solutions d'un système différentiel de type Riccati couplé, nous distinguons deux approches. En 1986, Abou-Kandil [Abou86] a proposé une méthode permettant de rechercher des solutions analytiques du système différentiel de type Riccati, couplées dans le cas où certains coefficients sont proportionnels.

Présentation du problème

Problème aux deux bouts

Dans ce paragraphe, nous détaillons la méthode de calcul d'une paire de solutions itératives du système algébrique couplé de type Riccati. Cette limite permet la détermination d'une paire de solutions stabilisantes du système algébrique apparié de type Riccati.

Système différentiel du type Riccati couplé

Unicité de la stratégie de Nash

Le caractère unique de la stratégie de Nash pour la classe "J.D.L.Q" dans le cas d'un espace de Hilbert de dimension infinie a fait l'objet de travaux de Lukes et Russel [LuRu71] et d'Eisele [Eise82]. Dans le cas d'un espace de Hilbert de dimension finie, Engwerda [Engw98] a montré une équivalence entre l'unicité de la stratégie de Nash et l'unicité de la solution du problème aux deux extrémités.

Lemme de Radon, version 2

Le lemme de Radon, version 2 ci-dessus, présente également deux avantages majeurs.

Solutions équivalentes

Système différentiel linéaire couplé

Système différentiel du type Riccati couplé

Applications

Système du type Riccati couplé dans le cas général

Dans le cas où Q2 =αQ1, α ∈R, la solution du système (2.27) peut être obtenue en utilisant les vecteurs propres de la matrice Hnash. Les conditions nécessaires et suffisantes pour l'existence d'un couple de solutions du système différentiel de type Riccati couplé sont résumées dans le résultat suivant.

Système du type Riccati couplé d’un point-selle

Le théorème 2.4.2 permet de construire le système différentiel de type Riccati suivant : 2.57) Les conditions nécessaires et suffisantes pour l'existence de la solution du système différentiel de type Riccati couplé sont résumées dans le corollaire suivant .

Exemple scalaire

Ce résultat correspond bien à la solution donnée par Simman et Cruz [SiCr73] et par Abou-Kandil [Abou86].

Conclusions et perspectives

Notre première contribution dans ce chapitre est l'établissement de conditions de convergence suffisantes pour un algorithme défini par des itérations de type Lyapunov. Notre deuxième contribution consiste également à établir des conditions de convergence suffisantes pour un algorithme dérivé d'itérations de type Riccati [FJA96]. Dans la section 5, nous introduisons un nouvel algorithme qui caractérise les itérations de type Riccati, version 2.

Présentation du problème

La formulation d'une situation d'équilibre de Nash en boucle fermée peut être obtenue au moyen de quelques solutions stabilisantes du système algébrique couplé de type Riccati de la forme suivante. Nous donnons ci-dessous la définition de quelques solutions stabilisantes du système algébrique connexe de type Riccati. Nous supposons qu'il existe des solutions stabilisantes (P, R) du système algébrique connexe de type Riccati.

Itérations du type Lyapunov

Description de la procédure

Le calcul du couple de solutions (Pl, Rl)l≥1 se déroule de la manière suivante : – (a) on détermine Pl comme l'unique solution d'une équation algébrique du type. Pour y remédier, nous préciserons par la suite un ensemble de conditions pour que les matrices (Al)l≥0 restent stables lors de l'exécution.

Propriétés des solutions itératives

Ce travail a permis de présenter la solution optimale utilisant un couple de solutions stabilisantes d'un système algébrique de type Riccati fortement couplé. Le calcul du couple de solutions (Ml, Vl)≥1 se déroule comme suit : – (a) on détermine Ml comme l'unique solution de l'équation. Le calcul du couple de solutions (Zl, Ml+1)l≥0 se déroule comme suit : – (a) on détermine Zl comme l'unique solution de l'équation de type Riccati.

Conditions suffisantes de convergence

Itérations du type Riccati, version 1

Description de la procédure

Le calcul du couple de solutions appliqué au même exemple montre l'efficacité et les bonnes performances de l'algorithme issu des itérations de type Riccati, version 2. Le calcul du couple de solutions appliqué au même exemple montre une plus grande rapidité de convergence de l'algorithme issu d'itérations de type Riccati-Lyapunov. Nous proposons également de démontrer les propriétés du couple de solutions (Ml, Zl)l≥1 obtenu en exécutant l'algorithme A.L.C.V.

Conditions suffisantes de convergence

Itérations du type Riccati, version 2

Description de la procédure

De même, la convergence vers un couple de solutions semi-définies positives et stabilisantes n'est pas toujours garantie et dépend du signe de la suite de matrices (˜Ql)l≥1 déterminé par la condition (C3). On dit que le couple de solutions (M, V) du système algébrique couplé de type Riccati est stabilisé si la matrice A−B(M +γV) est stable. Pour ǫ = 10−7 on obtient la convergence des deux algorithmes vers une paire de solutions positives définies et stabilisantes.

Conditions suffisantes de convergence

Exemples numeriques

Pour ǫ = 10−5, on obtient la convergence des trois algorithmes A.L, A.R.1 et A.R.2 vers un couple de solutions positif et déterminé par stabilisation. Pour ǫ = 10−5, on obtient la convergence des trois algorithmes A.L, A.R.1 et A.R.2 vers une paire de solutions positives et déterminées de manière stabilisante. Pour ǫ = 10−8, on obtient la convergence des trois algorithmes A.L, A.R.1 et A.R.2 vers une paire de solutions positives et déterminées de manière stabilisante.

Fig. 3.1 – Performance des algorithmes A.L, A.R.1 et A.R.2.
Fig. 3.1 – Performance des algorithmes A.L, A.R.1 et A.R.2.

Conclusion et perspectives

Les conditions suffisantes pour l'existence d'une paire de solutions pour ces systèmes dans le cas différentiel ont été établies pour la première fois par Freiling et al. Ces conditions ont été obtenues à l'aide de théorèmes de comparaison d'équations différentielles de type Riccati. Dans le cas d'un système algébrique correspondant, à notre connaissance, il n'y a aucun résultat sur l'existence d'un couple de solutions stabilisantes.

Présentation du problème

Dans ce chapitre nous proposons d'étudier deux types de méthodes itératives pour calculer des solutions stabilisantes du système algébrique de type Riccati. Un calcul élémentaire effectué sur les équations algébriques montre que la matrice Z : = M + γV satisfait l'équation algébrique de type Riccati. Pour résoudre les deux équations algébriques de type Lyapunov, nous appliquerons des « itérations de type Lyapunov ».

Itérations du type Lyapunov

Description de l’algorithme

Ces méthodes sont construites à partir de la proposition 4.2.1 et consistent à utiliser la matrice Z := M +γV pour trouver une dynamique stable commune aux deux équations.

Propriétés des solutions itératives

Cette convergence s'établit à partir de la monotonie de la suite (Zl)l≥1 définie par l'équation (4.20). Cette convergence s'établit à partir de la monotonie de la séquence (Zl)l≥1 définie par l'équation (4.37). Dans le cas des systèmes algébriques de type Riccati couplés en boucle fermée, nous nous intéressons à ceux qui désignent deux notions d'optimalité.

Condition suffisante de convergence

Itérations du type Riccati-Lyapunov

Description de la procédure

Les étapes de calcul d'un couple de solutions itératives (Zl, Ml+1), pour tout ≥0 reposent sur les étapes suivantes. Pour garantir l’existence et l’unicité d’une solution stabilisante (Zl)l≥0 de l’équation algébrique de type Riccati (4.37), nous proposons l’hypothèse suivante. L'existence de la séquence (Zl)l≥0 telle que A−SZl soit stable, ainsi que la proposition 1.2.3 inclut l'existence et l'unicité de la séquence (Ml)l≥1 définie par l'équation (4.38).

Propriétés des solutions itératives

Le but de la préparation de cette thèse était d'étudier les propriétés des systèmes différentiels et algébriques de type Riccati couplés à la théorie des jeux. Dans le cas des systèmes différentiels couplés de type Riccati en boucle ouverte, notre intérêt se concentre sur les systèmes qui caractérisent le concept d'optimalité sur l'équilibre de Nash. Le lemme de Radon, version 2, nous a permis d'étendre cette propriété aux systèmes différentiels couplés de type Riccati.

Condition suffisante de convergence

Applications numériques

Pour ǫ = 10−6, on obtient la convergence des deux algorithmes vers une paire de solutions positives définies et stabilisantes. Pour ǫ = 10−8, on obtient la convergence des deux algorithmes vers une paire de solutions définies positives et stabilisantes. Pour ǫ = 10−7 on obtient la convergence des deux algorithmes vers une paire de solutions positives et stabilisantes définies par .

Fig. 4.1 – Performance des algorithmes A.L.C.V et A.R.C.V .
Fig. 4.1 – Performance des algorithmes A.L.C.V et A.R.C.V .

Conclusions et perspectives

Nous avons utilisé deux approches : une approche analytique pour les systèmes différentiels de type Riccati en boucle ouverte et une approche itérative dans le cas des systèmes algébriques de type Riccati en boucle fermée. Un critère pour que l'équation différentielle matricielle de Riccati soit linéarisable et les propriétés de certaines solutions. Jeux différentiels : leur portée, leur nature et leur avenir. 1995) Équations différentielles matricielles non autonomes de type Riccati : intervalle d'existence, construction d'une solution numérique continue et limites d'erreur.

Imagem

Fig. 3.1 – Performance des algorithmes A.L, A.R.1 et A.R.2.
Fig. 3.2 – Evolution de la suite ( ˜ Q l ) l≥1 .
Fig. 3.3 – Performance des algorithmes A.L, A.R.1 et A.R.2.
Fig. 3.4 – Evolution des suites (Γ p l ) l≥1 et (Γ r l ) l≥1 .
+7

Referências

Documentos relacionados

Nous calculons ainsi le cycle de synchronisation selon le type du nœud avec les relations suivantes: V.1 V.2 Dans cette configuration, nos objectifs sont:  De vérifier que la