• Nenhum resultado encontrado

opencourses.auth | Ανοικτά Ακαδημαϊκά Μαθήματα ΑΠΘ | Θεωρία Βέλτιστου Ελέγχου | Γραμμικό Τετραγωνικό Πρόβλημα

N/A
N/A
Protected

Academic year: 2023

Share "opencourses.auth | Ανοικτά Ακαδημαϊκά Μαθήματα ΑΠΘ | Θεωρία Βέλτιστου Ελέγχου | Γραμμικό Τετραγωνικό Πρόβλημα"

Copied!
43
0
0

Texto

(1)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ

Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα Νίκος Καραμπετάκης

Τμήμα Μαθηματικών

(2)

• Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

• Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε

άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται

ρητώς.

(3)

• Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

• Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού.

• Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού

Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση

(Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.

(4)

• Επίλυση Γραμμικού Τετραγωνικού Προβλήματος (Linear

Quadratic Regulator Problem (LQR)) με πεπερασμένο/άπειρο χρονικό ορίζοντα.

• Επίλυση του προβλήματος ανίχνευσης (tracking problem).

(5)

• Επίλυση του γραμμικού τετραγωνικού προβλήματος με πεπερασμένο χρονικό ορίζοντα :

◦ με επίλυση του συστήματος στον χώρο των καταστάσεων που προκύπτει από τις Χαμιλτονιανές εξισώσεις (αναγκαίες συνθήκες ακροτάτου)

◦ με επίλυση των διαφορικών εξισώσεων πινάκων Riccati.

• Επίλυση του γραμμικού τετραγωνικού προβλήματος με άπειρο χρονικό ορίζοντα :

◦ Με επίλυση του συστήματος στον χώρο των καταστάσεων που προκύπτει από τις Χαμιλτονιανές εξισώσεις (αναγκαίες συνθήκες ακροτάτου).

◦ Με επίλυση των αλγεβρικών εξισώσεων πινάκων Riccati.

◦ Ικανές και αναγκαίες συνθήκες επίλυσης του προβλήματος.

• Επίλυση του προβλήματος ανίχνευσης (tracking problem).

(6)

Θεωρούμε ένα γραμμικό σύστημα διαφορικών εξισώσεων 𝑥 𝑡 = 𝐴 𝑡 𝑥 𝑡 + 𝐵 𝑡 𝑢(𝑡)

και ζητούμε να ελαχιστοποιήσουμε τον δείκτη απόδοσης 𝐽 = 1

2 𝑥 𝑇 𝑡 𝑓 𝐻𝑥 𝑡 𝑓 + 1 2 𝑡

0

𝑡 𝑓

𝑥 𝑇 𝑡 𝑄 𝑡 𝑥 𝑡 + 𝑢 𝑇 𝑡 𝑅 𝑡 𝑢(𝑡) 𝑑𝑡

Απόδειξη:

Θεωρώ την Hamiltonian 𝐻 𝑥, 𝑢, 𝑝, 𝑡 = 1

2 𝑥 𝑇 𝑄𝑥 + 1

2 𝑢 𝑇 𝑅𝑢 + 𝑝 𝑇 (𝐴 𝑡 𝑥 𝑡 + 𝐵 𝑡 𝑢(𝑡))

(7)

𝑥 𝑡 = 𝜕𝐻

𝜕𝑝 = 𝐴 𝑡 𝑥 𝑡 + 𝐵 𝑡 𝑢 𝑡 𝑝 𝑡 = − 𝜕𝐻

𝜕𝑥 = −𝑄 𝑡 𝑥 𝑡 − 𝐴 𝑇 𝑡 𝑝 𝑡 0 = 𝜕𝐻

𝜕𝑢 = 𝑅 𝑡 𝑢 𝑡 + 𝐵 𝑇 𝑡 𝑝 𝑡 ⇒ 𝑢 𝑡 = −𝑅 −1 (𝑡)𝐵 𝑇 (𝑡)𝑝 (𝑡) και άρα:

𝑥 (𝑡)

𝑝 (𝑡) = 𝐴(𝑡) −𝐵(𝑡)𝑅 −1 (𝑡)𝐵 𝑇 (𝑡)

−𝑄(𝑡) −𝐴 𝑇 (𝑡)

𝑥 (𝑡)

𝑝 (𝑡)

(8)

Η λύση των παραπάνω εξισώσεων είναι της μορφής 𝑥 (𝑡 𝑓 )

𝑝 (𝑡 𝑓 ) = 𝜑 11 (𝑡 𝑓 , 𝑡) 𝜑 12 (𝑡 𝑓 , 𝑡) 𝜑 21 (𝑡 𝑓 , 𝑡) 𝜑 22 (𝑡 𝑓 , 𝑡)

𝜋𝜄𝜈𝛼𝜅𝛼𝜍 𝜇𝜀𝜏𝛼𝛽𝛼𝜎𝜂𝜍

𝑥 (𝑡)

𝑝 (𝑡) (𝐴)

𝜕ℎ

𝜕𝑥 𝑥 , 𝑡 𝑓 − 𝑝

Τ

𝛿𝑥 𝑓 + 𝐹 𝑥 , 𝑢 , 𝑡 𝑓 + 𝑝 𝑡 𝑇 𝑥 𝑡 𝑓 + 𝜕ℎ

𝜕𝑡 𝑥, 𝑡 𝑓 𝛿𝑡 𝑓 = 0

Επειδή το 𝑥(𝑡 𝑓 ) είναι ελεύθερο και το 𝑡 𝑓 συγκεκριμένο, θα πρέπει

𝜕ℎ

𝜕𝑥 𝑥 (𝑡 𝑓 ) − 𝑝 𝑡 𝑓 = 0 ⇒ 𝐻𝑥 𝑡 𝑓 − 𝑝 𝑡 𝑓 = 0 ⇒

𝑝 𝑡 𝑓 = 𝐻𝑥 (𝑡 𝑓 ) (B)

(9)

(A)+(B)⇒

𝑥 𝑡 𝑓 = 𝜑 11 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 12 𝑡 𝑓 , 𝑡 𝑝 𝑡

𝑝 𝑡 𝑓 = 𝐻𝑥 𝑡 𝑓 = 𝜑 21 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 22 𝑡 𝑓 , 𝑡 𝑝 𝑡

𝐻𝜑 11 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝐻𝜑 12 𝑡 𝑓 , 𝑡 𝑝 𝑡 = 𝜑 21 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 22 𝑡 𝑓 , 𝑡 𝑝 𝑡 ⇒ 𝑝 𝑡 = 𝐻𝜑 12 𝑡 𝑓 , 𝑡 − 𝜑 22 𝑡 𝑓 , 𝑡

𝐾𝑎𝑙𝑚𝑎𝑛 1960→∃ 𝛼𝜈𝜏𝜄𝜎𝜏𝜌𝜊𝜑𝜊𝜍

−1 𝜑 21 𝑡 𝑓 , 𝑡 − 𝐻𝜑 11 𝑡 𝑓 , 𝑡 𝑥 𝑡

Άρα 𝑝 𝑡 ≜ 𝐾 𝑡 𝑥 𝑡

𝑢 𝑡 = −𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 𝑥(𝑡)

𝐹(𝑡)

(10)

𝑢 𝑡 = −𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 𝑥(𝑡)

𝐹(𝑡)

(11)

𝑝 𝑡 = 𝐾 𝑡 𝑥 𝑡 ⇒ 𝑝 𝑡 = 𝐾 𝑡 𝑥 𝑡 + 𝐾 𝑡 𝑥 𝑡 ⇒

𝑝 𝑡 = 𝐾 𝑡 𝑥 𝑡 + 𝐾 𝑡 𝐴 𝑡 𝑥 𝑡 − 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 𝑥 𝑡

⇒ 𝑝 𝑡 = 𝐾 𝑡 + 𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 𝑥(𝑡) (1)

𝑝 𝑡 = −𝑄 𝑡 𝑥 𝑡 − 𝐴 𝑇 𝑡 𝑝 𝑡 𝑝=𝐾𝑥 𝑝 𝑡 = −𝑄 𝑡 − 𝐴 𝑇 𝑡 𝐾 𝑡 𝑥(𝑡) (2) (1)+(2) ⇒

𝐾 𝑡 + 𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 = −𝑄 𝑡 − 𝐴 𝑇 𝑡 𝐾 𝑡

Διαφορική εξίσωση Riccati

(12)

𝐾 𝑡 + 𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 = −𝑄 𝑡 − 𝐴 𝑇 𝑡 𝐾 𝑡 Παρατήρηση 1: 𝐾 𝑡 συμμετρικός ⇒ 𝑛(𝑛+1)

2 διαφορικές εξισώσεις.

Παρατήρηση 2: Eπειδή 𝑝 𝑡 𝑓 = 𝐻𝑥(𝑡 𝑓 ) ≡ 𝐾 𝑡 𝑓 𝑥(𝑡 𝑓 ) τελική συνθήκη 𝐾 𝑡 𝑓 = 𝐻 (θετικά ορισμένος)

Η λύση προκύπτει με προς τα πίσω διαφόριση 𝐾 𝑡 𝑓 = 𝐾 𝑡 𝑓 − 𝐾(𝑡 𝑓 − Δt)

Δ𝑡

(13)

Π =

𝜕 2 𝐻

𝜕𝑥 2

𝜕 2 𝐻

𝜕𝑥𝜕𝑢

𝜕 2 𝐻

𝜕𝑢𝜕𝑥

𝜕 2 𝐻

𝜕𝑢 2 𝐻 = 1

2 𝑥 𝑇 𝑄𝑥 + 1

2 𝑢 𝑇 𝑅𝑢 + 𝑝 𝑇 𝐴𝑥 + 𝐵𝑢

𝜕𝐻

𝜕𝑥 = 𝑄𝑥 + 𝐴 𝑇 𝑝,

𝜕 2 𝐻

𝜕𝑥 2 = 𝑄,

𝜕 2 𝐻

𝜕𝑢𝜕𝑥 = 0,

(14)

Π =

𝜕 2 𝐻

𝜕𝑥 2

𝜕 2 𝐻

𝜕𝑥𝜕𝑢

𝜕 2 𝐻

𝜕𝑢𝜕𝑥

𝜕 2 𝐻

𝜕𝑢 2

𝜕𝐻

𝜕𝑢 = 𝑅𝑢 + 𝐵 𝑇 𝑝,

𝜕 2 𝐻

𝜕𝑢 2 = 𝑅,

𝜕 2 𝐻

𝜕𝑥𝜕𝑢 = 0.

Π = 𝑄 0

0 𝑅 > 0 ≥ 0

(15)

Ποιά είναι η ελάχιστη τιμή του δείκτη απόδοσης?

𝐽 = 1

2 𝑥 𝑇 𝑡 𝑓 𝐻𝑥 𝑡 𝑓 + 1 2 𝑡 0

𝑡 𝑓

𝑥 𝑇 𝑡 𝑄 𝑡 𝑥 𝑡 + 𝑢 𝑇 𝑡 𝑅 𝑡 𝑢(𝑡) 𝑑𝑡 =

= 1

2 𝑥 𝑇 𝑡 𝑓 𝐾 𝑡 𝑓 𝑥 𝑡 𝑓 + 1 2 𝑡

0

𝑡 𝑓

𝑥 𝑇 𝑡 𝑄 𝑡 𝑥 𝑡 + 𝑢 𝑇 𝑡 𝑅 𝑡 𝑢 𝑡 𝑑𝑡 =

= 1

2 𝑥 𝑇 𝑡 0 𝐾 𝑡 0 𝑥 𝑡 0 + 1 2 𝑡

0

𝑡 𝑓

𝑥 𝑇 𝑄𝑥 + 𝑢 𝑇 𝑅𝑢 + 𝑑

𝑑𝑡 𝑥 𝑇 𝐾 𝑡 𝑥 𝑑𝑡 =

= 1

2 𝑥 𝑇 𝑡 0 𝐾 𝑡 0 𝑥 𝑡 0 + 1 2 𝑡 0

𝑡 𝑓

𝑥 𝑇 𝑄𝑥 + 𝑢 𝑇 𝑅𝑢 + 𝑥 𝑇 𝐾𝑥 + 𝑥 𝑇 𝐾𝑥 + 𝑥 𝑇 𝐾 𝑥 𝑑𝑡

(16)

Όμως 𝑢 = −𝑅 −1 𝐵 𝑇 𝐾𝑥

= 1

2 𝑥 𝑇 𝑡 0 𝐾 𝑡 0 𝑥 𝑡 0 + 1

2 𝑡

0

𝑡 𝑓

𝑥 𝑇 𝑄 + 𝐾𝐵𝑅 −1 𝑅𝑅 −1 𝐵 𝑇 𝐾 + 𝐴 − 𝐵𝑅 −1 𝐵 𝑇 𝐾 𝑇 𝐾 + 𝐾

(17)

Έστω το σύστημα διαφορικών εξισώσεων 𝑥 = − 1

2 𝑥 + 𝑢 και 𝐽 𝑥, 𝑢 = 1

2 𝑥 𝑇 𝑆𝑥 + 1

2 0 𝑡 𝑓

2𝑥 2 + 𝑢 2 𝑑𝑡, με 𝑡 𝑓 = 1.

𝐴 = − 1

2 , 𝐵 = 1, 𝐻 = 𝑆, 𝑄 = 2, 𝑅 = 1 Άρα ο βέλτιστος έλεγχος 𝑢 = −𝐾 𝑡 𝑥.

𝐾 𝑡 + 𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 = −𝑄 𝑡 − 𝐴 𝑇 𝑡 𝐾(𝑡)

𝐾 𝑡 = 𝐾 2 𝑡 + 𝐾 𝑡 − 2

με οριακή συνθήκη 𝐾 𝑡 = 𝑠.

(18)

𝐾 𝑡 = 𝐾 2 𝑡 + 𝐾 𝑡 − 2 Αν 𝑠 = 0 εφαρμόζουμε προς τα πίσω διαφόριση:

K t = 𝐾 𝑡 − 𝐾(𝑡 − 𝛿𝑡) 𝛿𝑡

𝑡 = 1.0 𝐾 1 = 𝑠 = 0 ⇒

𝐾 1 = 𝐾 2 1 + 𝐾 1 − 2 = −2

𝐾 0.8 = − 𝐾 1 Δt + K 1 = −2 −0.2 + 0 = 0.4 𝑡 = 0.8 𝐾 0.8 = 0.4 ⇒

𝐾 0.8 = 𝐾 2 0.8 + 𝐾 0.8 − 2 = −1.44

(19)

𝐾 0.6 = − 𝐾 0.8 Δt + K 0.8 = −1.44 −0.2 + 0.4 = 0.69 𝑡 = 0.6 → 𝐾 0.4 = 0.92

𝑡 = 0.4 → 𝐾 0.2 = 0.97

𝑡 = 0.2 → 𝐾 0 = 1

(20)

Ο χρόνος 𝑡 𝑓 → ∞

𝑥 𝑡 = 𝐴 𝑡 𝑥 𝑡 + 𝐵 𝑡 𝑢 𝑡 𝐽 𝑥, 𝑢 = 1

2 𝑡

0

𝑥 𝑇 𝑡 𝑄(𝑡)𝑥 𝑡 + 𝑢 𝑇 𝑡 𝑅 𝑡 𝑢(𝑡) 𝑑𝑡

Επίλυση με τον ίδιο τρόπο: 𝑢 𝑡 = −𝑅 −1 (𝑡)𝐵 𝑇 (𝑡) 𝐾(𝑡)𝑥 (𝑡) όπου lim

𝑡 𝑓 →∞ 𝐾 𝑡 = 𝐾(𝑡)

και η 𝐾(𝑡) ικανοποιεί την δ.ε. Riccati με τελικές συνθήκες

𝑡→∞ lim 𝐾 𝑡 = 0

𝜕ℎ

𝜕𝑥 𝑥 𝑡 𝑓 , 𝑡 𝑓 − 𝑝 𝑡 𝑓 𝛿𝑡 𝑓 ⇒ lim

𝑡 𝑓 →∞ 𝑝 𝑡 𝑓 = 0

(21)

𝑥 𝑡 = 𝐴𝑥 𝑡 + 𝐵𝑢 𝑡 𝐽 𝑥, 𝑢 = 1

2 𝑡

0

𝑥 𝑇 𝑡 𝑄(𝑡)𝑥 𝑡 + 𝑢 𝑇 𝑡 𝑅 𝑡 𝑢(𝑡) 𝑑𝑡 Συνθήκες Ύπαρξης Λύσης

• Αν το σύστημα είναι ελέγξιμο και 𝐻 = 0 στην δ.ε. Riccati, τότε

𝑡 lim 𝑓 →∞ 𝐾 𝑡 𝑓 = 𝐾 > 0 συμμετρικός

δηλαδή η λύση της δ.ε. είναι σταθ. Θετ. Συμ. Πίνακας και άρα

έχουμε να λύσουμε την αλγεβρική εξίσωση Riccati.

(22)

Το κλειστό σύστημα είναι ευσταθές αν (𝐴, 𝐶 𝑇 ) παρατηρήσιμο όπου 𝐶𝐶 𝑇 = 𝑄 ← 𝐶ℎ𝑜𝑙𝑒𝑠𝑘𝑦 𝐷𝑒𝑐𝑜𝑚𝑝𝑜𝑠𝑖𝑡𝑖𝑜𝑛.

Μπορώ να περιορίσω ακόμη πιο πολύ τις συνθήκες ύπαρξης λύσης

i. (𝐴, 𝐵) stabilizable

ii. (𝐴, 𝐶 𝑇 ) detectable

𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 + 𝑄 𝑡 + 𝐴 𝑇 𝑡 𝐾 𝑡 =0

Αλγεβρική εξίσωση Riccati

(23)

Έχουμε το σύστημα των διαφορικών εξισώσεων 𝑥 = 𝑎𝑥 + 𝑏𝑢

και

𝐽 𝑥, 𝑢 = 1 2 0

𝑞𝑥 2 + 𝑝𝑢 2 𝑑𝑡 Άρα 𝐴 = 𝑎, 𝐵 = 𝑏, 𝑄 = 𝑞, 𝑅 = 𝑝.

Ο βέλτιστος έλεγχος είναι

𝑢 = −𝑅 −1 𝐵 𝑇 𝐾𝑥 = −𝑝 −1 𝑏𝐾𝑥

𝐾 𝑡 + 𝐾 𝑡 𝐴 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 = −𝑄 𝑡 − 𝐴 𝑇 𝑡 𝐾(𝑡)

𝐾𝐴 − 𝐾𝐵𝑅 −1 𝐵 𝑇 𝐾 = −𝑄 − 𝐴 𝑇 𝐾

(24)

𝐾𝑎 − 𝐾𝑏𝑝 −1 𝑏𝐾 + 𝑞 + 𝑎 𝑇 𝐾 = 0 𝐾>0 𝐾 =

𝑎 + 𝑎 2 + 𝑞 𝑝 𝑏 2 𝑏 2

𝑝 και άρα

𝑢 = −

𝑎 + 𝑎 2 + 𝑞 𝑝 𝑏 2

𝑏 𝑥

και το σύστημα δ.ε. γίνεται

𝑥 = − 𝑎 2 + 𝑞

𝑝 𝑏 2 𝑥

(25)

Συμπέρασμα:

𝑏 → 0 (μη ελέγξιμο) ⇒ 𝑢 → ∞

𝛼 > 0 (αρχ. Συστ. ασταθές) ⇒ κλ. Συστ. Ευσταθ.

(26)

Έστω

𝑥 = 𝐴𝑥 + 𝐵𝑢

𝑦 = 𝐶𝑥 ελέγξιμο, παρατηρήσιμο 𝐽 𝑥, 𝑢 = 1

2 0

𝑦 𝑇 𝑄𝑦 + 𝑢 𝑇 𝑅𝑢 𝑑𝑡 𝑦 𝑇 = 𝑥 𝑇 𝐶 𝑇

𝐽 𝑥, 𝑢 = 1 2 0

𝑥 𝑇 𝐶 𝑇 𝑄𝐶

𝑄′

𝑥 + 𝑢 𝑇 𝑅

𝑅′

𝑢 𝑑𝑡

(27)

(Α) 𝑥 𝑡 = 𝐴 𝑡 𝑥 𝑡 + 𝐵 𝑡 𝑢 𝑡

J= 1

2 𝑥 𝑡 𝑓 − 𝑟 𝑡 𝑓 𝑇 𝐻 𝑥 𝑡 𝑓 − 𝑟 𝑡 𝑓 + 1

2 𝑡 0 𝑡 𝑓

(𝑥 𝑡 −

(28)

(B) 𝑝 = − 𝜕𝐻

𝜕𝑥 = −𝑄𝑥 − 𝐴 𝑇 𝑝 + 𝑄𝑟 (Γ) 0 = 𝜕𝐻

𝜕𝑢 = 𝑅𝑢 + 𝐵 𝑇 𝑝 ⇒ 𝑢 = −𝑅 −1 𝐵 𝑇 𝑝 Από (Α)+(Β)+(Γ)

𝑥

𝑝 = 𝐴 −𝐵𝑅 −1 𝐵 𝑇

−𝑄 −𝐴 𝑇

𝑥 𝑝 +

0 𝑄𝑟

⇓ 𝑥 𝑡 𝑓

𝑝 𝑡 𝑓 = 𝜑 𝑡 𝑓 , 𝑡 𝑥 (𝑡)

𝑝 (𝑡) +

𝑡 𝑡 𝑓

𝜑 𝑡 𝑓 , 𝜏 0

𝑄 𝜏 𝑟 𝜏 𝑑𝜏

= 𝜑 11 𝑡 𝑓 , 𝑡 𝜑 12 𝑡 𝑓 , 𝑡 𝑥 (𝑡)

∗ + 𝑓 1 (𝑡)

(29)

1) 𝑥 𝑡 𝑓 = 𝜑 11 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 12 𝑡 𝑓 , 𝑡 𝑝 𝑡 + 𝑓 1 (𝑡)

2) 𝑝 𝑡 𝑓 = 𝜑 21 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 22 𝑡 𝑓 , 𝑡 𝑝 𝑡 + 𝑓 2 (𝑡) Αλλά από τις συνοριακές συνθήκες:

𝜕ℎ

𝜕𝑥 𝑥 𝑡 𝑓 , 𝑡 𝑓 − 𝑝 𝑡 𝑓 𝛿𝑥 𝑓 ⇒ 𝑝 𝑡 𝑓 = 𝐻𝑥 𝑡 𝑓 − 𝐻𝑟 𝑡 𝑓

⇓ (1), (2)

𝜑 21 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 22 𝑡 𝑓 , 𝑡 𝑝 𝑡 + 𝑓 2 𝑡 =

= 𝐻𝜑 11 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝐻𝜑 12 𝑡 𝑓 , 𝑡 𝑝 𝑡 + 𝐻𝑓 1 (𝑡) − 𝐻𝑟 𝑡 𝑓

(30)

𝑝 𝑡 = 𝜑 22 𝑡 𝑓 , 𝑡 − 𝐻𝜑 12 𝑡 𝑓 , 𝑡 −1 ∙ 𝐻𝜑 11 𝑡 𝑓 , 𝑡 − 𝜑 212 𝑡 𝑓 , 𝑡 𝑥 𝑡 + 𝜑 22 𝑡 𝑓 , 𝑡 − 𝐻𝜑 12 𝑡 𝑓 , 𝑡 −1 𝐻𝑓 1 𝑡 − 𝐻𝑟 𝑡 𝑓 =

= 𝐹 𝑡 𝑥 𝑡 + 𝑣(𝑡)

(31)

Ας υποθέσουμε ότι

𝑝 𝑡 = 𝐾 𝑡 𝑥 𝑡 + 𝑠 𝑡 ⇒

𝑝 𝑡 = 𝐾 𝑡 𝑥 𝑡 + 𝐾 𝑡 𝑥 𝑡 + 𝑠 𝑡 ⇒

−𝑄 𝑡 𝑥 𝑡 − 𝐴 𝑇 (𝑡) 𝐾 𝑡 𝑥 𝑡 + 𝑠(𝑡) =

= 𝐾 𝑡 𝑥 𝑡 +

+𝐾 𝑡 𝐴 𝑡 𝑥 𝑡 − 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾 𝑡 𝑥 𝑡 + 𝑠 𝑡 + 𝑠 𝑡

𝐾 𝑡 = −𝐾 𝑡 𝐴 𝑡 − 𝐴 𝑇 𝑡 𝐾 𝑡 − 𝑄 𝑡 + 𝐾 𝑡 𝐵(𝑡)𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝐾(𝑡)

𝑠 𝑡 = − 𝐴 𝑇 𝑡 − 𝐾 𝑡 𝐵 𝑡 𝑅 −1 𝑡 𝐵 𝑇 𝑡 𝑠 𝑡 + 𝑄 𝑡 𝑟(𝑡)

(32)

Με συνοριακές συνθήκες

𝜕ℎ

𝜕𝑥 𝑥 𝑡 𝑓 , 𝑡 𝑓 − 𝑝 𝑡 𝑓 = 0 ⇒

𝑝 𝑡 𝑓 = 𝐻𝑥 𝑡 𝑓 − 𝐻𝑟 𝑡 𝑓 ≡ 𝐾 𝑡 𝑓 𝑥 𝑡 𝑓 + 𝑠 𝑡 𝑓

⇓ ∀𝑥 𝑡 𝑓 , 𝑟 𝑡 𝑓

𝐾 𝑡 𝑓 = 𝐻 ⊕ 𝑠 𝑡 𝑓 = −𝐻𝑟 𝑡 𝑓

(33)

𝐹

Δύναμη απο προφυλ.

1

𝑚 → 𝑣 Επιταχ.

1

𝑠 → 𝑣 Ταχυτ.

1 𝑠

𝑣 Θέση Μοντέλο κατάστασης: 𝑥 1 = 𝑦, 𝑥 2 = 𝑦

Εξισώσεις κατάστασης: 𝑥 1 = 𝑥 2 , 𝑥 2 = 𝐹

𝑚 = 𝑢

1

y

1

y

1

y

Fm   s   s  

Παράδειγμα: (Ν. Κρικέλης 1996)

Δύναμη Επιτάχ. Ταχύτ. Θέση

από προφυλ.

(34)

Επαφή προφυλακτήρα με τοίχο: (χρόνος 0) 𝑦 0 = 0, 𝑦 0 = 4

Μετά από 1 sec ο προφυλακτήρας φέρει την ταχύτητα του αυτοκ. στο μηδέν: 𝑦 1 = 0

𝑦 1 ελεύθερο

a) Προστασία επιβατών ⇒ Ελαχιστοποίηση 𝑦 𝐽 𝑥, 𝑢 = 1

2 0

1

𝑦 2 𝑑𝑡 = 1 2 0

1

𝑢 2 𝑑𝑡

b) 𝑥 1

𝑥 2 = 0 1 0 0

𝑥 1

𝑥 2 + 0

1 𝑢, 𝑦 = 1 0 𝑥 1

𝑥 2

(35)

𝐽 = 1 2 0

𝑦 2 + 𝑝𝑢 2 𝑑𝑡 = 1 2 0

𝑥 1 2 + 𝑝𝑢 2 𝑑𝑡 =

= 1 2 0

𝑥 1 𝑥 2 𝑇 1 0 0 0

𝑥 1

𝑥 2 + 𝑝𝑢 2 𝑑𝑡 Λύση: Η συνάρτηση Pontryagin είναι

𝐻 = 1

2 𝑢 2 + 𝜆 1 𝑥 2 + 𝜆 2 𝑢

𝜕Η

𝜕𝜃 = 0 ⇒ 𝑢 + 𝜆 2 = 0 ⇒ 𝑢 = −𝜆 2 𝐻 = 1

2 −𝜆 2 2 + 𝜆 1 𝑥 2 + 𝜆 2 −𝜆 2 = − 1

2 𝜆 2 2 + 𝜆 1 𝑥 2

(36)

𝐻 = 1

2 −𝜆 2 2 + 𝜆 1 𝑥 2 + 𝜆 2 −𝜆 2 = − 1

2 𝜆 2 2 + 𝜆 1 𝑥 2

𝑥 = 𝜕𝐻

𝜕𝜆 𝜆 = − 𝜕Η

𝜕𝑥

𝑥 1 = 𝜕𝐻

𝜕𝜆 1 𝑥 2 = 𝜕𝐻

𝜕𝜆 2 𝜆 1 = − 𝜕𝐻

𝜕𝑥 1 𝜆 2 = − 𝜕𝐻

𝜕𝑥 2

𝑥 1 = 𝑥 2 𝑥 2 = −𝜆 2

𝜆 1 = 0 𝜆 2 = −𝜆 1

(37)

𝜆 1 = 𝑐 1

𝜆 2 = −𝑐 1 𝑡 + 𝑐 2 𝑥 1 = 𝑐 1 𝑡 3

6 − 𝑐 2 𝑡 2

2 + 𝑐 3 𝑡 + 𝑐 4 𝑥 2 = 𝑐 1 𝑡 2

2 − 𝑐 2 𝑡 + 𝑐 3

𝑡 = 0, 𝑥 1 0 = 0 ⇒ 𝑐 4 = 0 𝑡 = 0, 𝑥 2 0 = 4 ⇒ 𝑐 3 = 4 𝑡 = 1, 𝜆 1 1 = 0 ⇒ 𝑐 1 = 0 𝑡 = 1, 𝑥 2 1 = 0 ⇒ 𝑐 2 = 4

⇓ 𝜆 2 =4

Άρα 𝑢 = −4

Συμπέρασμα: Ελαχιστοποίηση επιτάχυνσης ⇒σταθερή δύναμη

(38)

Να υπολογιστεί το ακρότατο του συναρτησιακού 𝐽 𝑥, 𝑢, 𝑡 = 1

2 𝑥 𝑇 𝑡 𝑓 𝐻𝑥 𝑡 𝑓 + 1 2 𝑡

0

𝑡 𝑓

𝑥 𝑇 𝑢 𝑇 𝑄 𝑆 𝑆 𝑇 𝑅

𝑥

𝑢 𝑑𝑡 υπό τις συνθήκες

𝑥 𝑡 = 𝐴𝑥 𝑡 + 𝐵𝑢(𝑡).

(39)

• Νικόλαος Καραμπετάκης, 2009, Βέλτιστος Έλεγχος Συστημάτων, Εκδόσεις Ζήτη.

• D.E. Kirk, 1970, Optimal Control Theory, Prentice Hall, Englewood Cliffs, NJ.

• D. S. Naidu, 2002, Optimal Control Systems, CRC Press LLC.

(40)

Copyright Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Νικόλαος Καραμπετάκης. «Θεωρία Βέλτιστου Ελέγχου. Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα ». Έκδοση: 1.0. Θεσσαλονίκη 2014.

Διαθέσιμο από τη δικτυακή διεύθυνση:

http://eclass.auth.gr/courses/OCRS288/

(41)

Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά - Παρόμοια Διανομή [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες,

διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία

αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων».

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί.

[1] http://creativecommons.org/licenses/by-sa/4.0/

(42)

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει:

 το Σημείωμα Αναφοράς

 το Σημείωμα Αδειοδότησης

 τη δήλωση Διατήρησης Σημειωμάτων

 το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους.

(43)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ

Επεξεργασία: Αναστασία Γ. Γρηγοριάδου

Θεσσαλονίκη, Εαρινό εξάμηνο 2013-2014

Referências

Documentos relacionados

Επιπλέον, η πλειοψηφία των δημοτών είναι δυσαρεστημένη από τις υπηρεσίες του Δήμου ακόμα και μετά την εφαρμογή του Καλλικράτη και τίθενται υπέρ της συνεργασίας του Δήμου Καλαμάτας με