Anda di halaman 1dari 59

KONTROL OPTIMAL BERDASARKAN PADA

KALKULUS VARIASI

Tugas Akhir

Diajukan untuk memenuhi persyaratan


Sidang Sarjana Matematika

Oleh:
VANESSA SARAH GRISELDA
10104017

PROGRAM STUDI MATEMATIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
INSTITUT TEKNOLOGI BANDUNG
2010

0
PRAKATA

Puji syukur penulis haturkan sedalam-dalamnya ke hadirat Allah SWT yang telah
memberikan limpahan anugerah, bimbingan, dan kekuatan sehingga penulis dapat
menyelesaikan tugas akhir ini sejak Maret 2009 hingga Februari 2010. Tanpa
masukan berharga, kepercayaan, dan dukungan yang diberikan oleh Dr. Janson
Naiborhu selaku pembimbing, maka penulis tidak akan dapat menyelesaikan tugas
akhir ini dengan hasil memuaskan. Penulis berterima kasih sebesar-besarnya kepada
kedua orang tua penulis yang telah memberikan endless support dan courage selama
penulis berkuliah di ITB. Terima kasih penulis sampaikan Dr. Agus Yodi selaku
dosen penguji atas segala pelajaran dan bimbingan dalam tugas akhir ini, serta Dr.
Hanni Garminia selaku dosen penguji tugas akhir dan juga dosen wali selama 5 tahun
terakhir. Tidak lupa penulis berterima kasih kepada Heru Tjahjana atas bantuan
dalam menyelesaikan fundamental codes Matlab untuk hampiran numerik. Pada
akhirnya, penulis ingin mengucapkan terima kasih setulusnya kepada Hutama G.
Soediredja atas seluruh dukungannya setiap hari, setiap saat.

Penulis menyadari bahwa tugas akhir ini masih memiliki beberapa kekurangan. Oleh
karena itu, penulis mengharapkan kritik dan saran yang membangun dari pembaca
untuk perbaikan selanjutnya. Semoga tugas akhir ini dapat bermanfaat bagi kemajuan
ilmu pengetahuan dan bagi siapapun yang membacanya.

Bandung, Februari 2010

Penulis

1
ABSTRAK

Kontrol Optimal berhubungan dengan permasalahan dalam menentukan hukum


kontrol untuk suatu sistem sehingga kriteria keoptimalan tertentu dapat terpenuhi.
Permasalahan kontrol optimal melibatkan fungsi biaya yang merupakan fungsional
atas state dan variabel kontrol. Kontrol optimal adalah himpunan dari persamaan
diferensial yang merupakan lintasan dari variabel kontrol yang meminimalkan fungsi
biaya. Dalam tugas akhir ini, Pontryagin’s Maximum Principle digunakan untuk
menurunkan hukum kontrol dan solusi umum diperoleh dengan menerapkan
pendekatan Kalkulus Variasi. Lebih jauh lagi, beberapa permasalahan kontrol optimal
sederhana serta solusi analitik telah ditampilkan. Selain itu, algoritma Steepest
Descent digunakan sebagai hampiran numerik bagi solusi optimal.

2
ABSTRACT

Optimal Control deals with the problem of finding a control law for a given system
such that a certain optimality criterion is achieved. A control problem includes a cost
functional that is a function of state and control variables. An optimal control is a set
of differential equations describing the paths of the control variables that minimize
the cost functional. In this final project, Pontryagin’s Maximum Principle is used for
deriving control policies and general solutions are obtained by using Calculus of
Variations approach. Furthermore, several simple optimal control problems and their
analytical solutions are presented. In addition, Steepest Descent algorithm is being
used as numerical approach to optimal solutions.

3
BAB 1

PENDAHULUAN

1.1. Latar Belakang


Sebagian besar sistem dalam bidang fisika, kimia, biologi, dan ekonomi dapat
dimodelkan dengan persamaan matematika, salah satu bentuknya adalah model
persamaan diferensial stokastik atau deterministik. Keadaan dari sistem-sistem ini
kemudian mengalami perubahan nilai terhadap waktu atau variabel bebas lainnya,
tergantung pada persamaan dinamik tertentu. Lebih jauh lagi, sistem-sistem ini akan
membawa satu state ke state yang lainnya dengan cara menerapkan beberapa input
dari luar sistem, atau disebut juga kontrol input. Jika hal ini dapat dilakukan, maka
ada beberapa cara yang berbeda untuk mencapai nilai tertentu. Dan jika demikian,
maka ada cara yang terbaik di antara seluruh cara yang memungkinkan. Input yang
menghasilkan cara terbaik ini disebut kontrol optimal. Untuk mengukur seberapa baik
cara tersebut, digunakan indeks performa atau fungsi biaya sebagai parameter.

1.2. Rumusan Masalah

Bentuk umum dari permasalahan kontrol optimal diberikan sebagai berikut. Sistem
dinamik nonlinear dideskripsikan dalam bentuk persamaan diferensial

𝑥(𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 (1.2.1)

dengan state 𝑥(𝑡) ∈ 𝑹𝑛 , kontrol input 𝑢(𝑡) ∈ 𝑹𝑚 , dan indeks performa

4
𝑇
𝐽(𝑡) = 𝜙 𝑥 𝑇 , 𝑇 + 𝑡0
𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡 (1.2.2)

dimana :

𝑡0 adalah waktu awal (tetap),

𝑇 adalah waktu akhir (bebas),

𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 adalah fungsi biaya pada selang waktu antara [𝑡0 , 𝑇] ,

𝜙 𝑥 𝑇 , 𝑇 adalah fungsi biaya pada waktu akhir yang bergantung hanya pada 𝑇 dan
𝑥(𝑇).

Permasalahan kontrol optimal adalah untuk mencari input 𝑢∗ 𝑡 pada selang waktu
[𝑡0 , 𝑇] yang membawa persamaan (1.2.1) sepanjang lintasan 𝑥 ∗ 𝑡 sehingga nilai dari
indeks performa (1.2.2) menjadi minimal, dan

𝜓 𝑥 𝑇 ,𝑇 = 0 (1.2.3)

dimana 𝜓 𝑥 𝑇 , 𝑇 merupakan fungsi pembatas pada state akhir dengan 𝜓 ∈ 𝑹𝑝


diberikan.

1.3. Tujuan

Tujuan dari tugas akhir ini adalah menurunkan kondisi keoptimalan bagi
permasalahan kontrol optimal dengan menggunakan pendekatan kalkulus variasi.
Kondisi keoptimalan yang diperoleh bersifat umum, oleh karena itu penulis akan
menerapkannya pada beberapa sistem kontrol optimal sederhana sebagai gambaran
khusus. Lebih jauh lagi, dengan menggunakan kondisi keoptimalan tersebut akan
ditentukan solusi analitik dan numerik bagi beberapa permasalahan.

5
1.4. Batasan Masalah

Dalam tugas akhir ini, penulis memfokuskan permasalahan pada sistem kontrol yang
kontinu. Lebih jauh lagi, pembahasan hanya terfokus pada sistem deterministik,
bukan pada sistem stokastik.

1.5. Sistematika Penulisan


Tugas akhir ini dibagi menjadi beberapa bab. Bab I menjelaskan tentang latar
belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penulisan dari
tugas akhir. Pada bab II dijelaskan pemaparan mengenai kontrol optimal dan kalkulus
variasi, serta bagaimana menentukan kondisi keoptimalan bagi sistem kontinu. Bab
III menyajikan tentang penerapan teori kontrol optimal dalam sistem nonlinear
sederhana dan penentuan solusi analitik serta numerik atas beberapa permasalahan.
Pada Bab IV, penulis memberikan kesimpulan atas tugas akhir ini.

6
BAB 2

KONTROL OPTIMAL BERDASARKAN PADA

KALKULUS VARIASI

Titik berat dari kontrol optimal adalah menentukan kontrol input 𝑢∗ 𝑡 (tanda (*)
menandakan kondisi optimal) yang akan membawa suatu proses (plant) 𝑥 (𝑡) dari
state awal ke state akhir yang memenuhi kondisi batas dan mengekstrimkan
(memaksimumkan atau meminimumkan) indeks performa 𝐽.

Gambar 2.1 Permasalahan Kontrol Optimal

7
Terdapat dua metode yang umum digunakan untuk mencari kontrol input. Metode
pertama adalah metode dynamic programming yang dikembangkan oleh R.E.
Bellman, sedangkan metode kedua menggunakan Maximum Principle yang
dikemukakan oleh L.S. Pontryagin. Pontryagin Maximum Principle menyatakan
bahwa lintasan state yang optimal 𝑥 ∗ , kontrol optimal 𝑢∗ , dan faktor pengali
Lagrange yang bersesuaian 𝜆∗ harus meminimumkan Hamiltonian. Pada tugas akhir
ini, pendekatan kalkulus variasi berdasarkan Pontryagin Maximum Principle akan
digunakan untuk menurunkan kondisi keoptimalan.

Dalam penurunan kondisi keoptimalan akan disinggung mengenai permasalahan


meminimalkan indeks performa dengan cara mencari variasi pertama dari fungsional
tertentu. Oleh karena itu, penulis merasa perlu untuk memaparkan beberapa konsep
dasar dari kalkulus variasi yang berguna untuk mencari kondisi keoptimalan.

2.1. Kalkulus Variasi

Definisi 1 : Suatu variabel 𝑥 dikatakan fungsi atas 𝑡 , dituliskan 𝑥(𝑡) , jika peta
(range) dari setiap nilai 𝑡 berkorespondensi dengan suatu nilai 𝑥.

Definisi 2 : Suatu variabel 𝐽 dikatakan fungsional atas fungsi 𝑓 𝑥 , dituliskan


𝐽 = 𝐽 𝑓 𝑥 , jika untuk setiap fungsi 𝑓(𝑥) berkorespondensi suatu nilai 𝐽.

Definisi 3 : Jika 𝑞 dan 𝑞 + ∆𝑞 adalah elemen-elemen dimana fungsi 𝑓 terdefinisi,


maka increment dari fungsi 𝑓, dinotasikan dengan ∆𝑓, adalah

∆𝑓 ≜ 𝑓 𝑞 + ∆𝑞 − 𝑓(𝑞)

∆𝑓 bergantung pada 𝑞 dan ∆𝑞, untuk lebih eksplisit, notasikan ∆𝑓(𝑞, ∆𝑞).

8
Definisi 4 : Jika 𝑥 dan 𝑥 + 𝛿𝑥 adalah fungsi-fungsi dimana fungsional 𝐽 terdefinisi,
maka increment dari fungsional 𝐽, dinotasikan ∆𝐽, adalah

∆𝐽 ≜ 𝐽 𝑥 + 𝛿𝑥 − 𝐽(𝑥)

Untuk lebih eksplisit, notasikan ∆𝐽(𝑥, 𝛿𝑥), sedangan 𝛿𝑥 disebut variasi dari fungsi 𝑥.

Definisi 5 : Misalkan increment pada fungsi 𝑓 saat 𝑡 ∗ dideskripsikan sebagai

∆𝑓 ≜ 𝑓 𝑡 ∗ + ∆𝑡 − 𝑓(𝑡 ∗ )

Dengan mengekspansi 𝑓 𝑡 ∗ + ∆𝑡 dengan deret Taylor di sekitar 𝑡 ∗ , diperoleh

𝑑𝑓 1 𝑑2 𝑓
∆𝑓 = 𝑓 𝑡 ∗ + ∆𝑡 + ∆𝑡 2
+ … − 𝑓(𝑡 ∗ )
𝑑𝑡 ∗ 2! 𝑑𝑡 2 ∗

dimana

𝑑𝑓
∆𝑡 = 𝑓 𝑡 ∗ ∆𝑡 = 𝑑𝑓
𝑑𝑡 ∗

𝑑𝑓 disebut diferensial atas fungsi 𝑓 pada titik 𝑡 ∗ , sedangkan 𝑓 𝑡 ∗ adalah turunan


atau slope dari 𝑓 pada titik 𝑡 ∗ . Dengan kata lain, diferensial 𝑑𝑓 adalah aproksimasi
orde pertama (linear) terhadap increment ∆𝑓.

9
Gambar 2.1.1 Increment ∆𝑓, Diferensial 𝑑𝑓, dan Turunan 𝑓 dari Fungsi 𝑓(𝑡)

Definisi 6 : Misalkan increment pada fungsional 𝐽 dideskripsikan sebagai

∆𝐽 ≜ 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 − 𝐽(𝑥(𝑡)

dengan mengekspansi 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 menggunakan deret Taylor, diperoleh

𝜕𝐽 1 𝜕2𝐽 2
∆𝐽 = 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 + 𝛿𝑥 𝑡 + …− 𝐽 𝑥 𝑡
𝜕𝑥 2! 𝜕𝑥 2

𝜕𝐽 1 𝜕2𝐽 2
= 𝛿𝑥 𝑡 + 𝛿𝑥 𝑡 + …
𝜕𝑥 2! 𝜕𝑥 2

= 𝛿𝐽 + 𝛿 2 𝐽 + ⋯

dimana,

𝜕𝐽 1 𝜕2𝐽 2
𝛿𝐽 = 𝛿𝑥 𝑡 dan 𝛿2𝐽 = 𝛿𝑥 𝑡
𝜕𝑥 2! 𝜕𝑥 2

10
disebut variasi pertama dan variasi kedua dari fungsional 𝐽 . Variasi 𝛿𝐽 adalah
aproksimasi orde pertama (linear) dari increment ∆𝐽.

Gambar 2.1.2 Increment ∆𝐽 dan Variasi Pertama 𝛿𝐽 dari Fungsional 𝐽

Lema 1 : Hubungan antara variasi dan diferensial

Misalkan 𝑥(𝑡) adalah fungsi kontinu dalam waktu 𝑡, dan diferensial 𝑑𝑥(𝑡) dan 𝑑𝑡
tidak independen. Namun dapat didefinisikan perubahan kecil dalam 𝑥(𝑡) yang
independen terhadap 𝑑𝑡 . Definisikan variasi dalam 𝑥(𝑡) , yaitu 𝛿𝑥(𝑡) , sebagai
perubahan (increment) dalam 𝑥(𝑡) saat 𝑡 dibuat tetap.

Untuk mengilustrasikan hubungan antara 𝑑𝑥, 𝛿𝑥, dan 𝑑𝑡, dapat diperhatikan gambar
berikut.

11
Gambar 2.1.2 Hubungan antara Variasi 𝛿𝑥 dan Diferensial 𝑑𝑥

Pada gambar ditunjukkan fungsi asal 𝑥(𝑡) dan fungsi yang bertetangga 𝑥 𝑡 + 𝑑𝑥(𝑡)
dalam selang [𝑡0 , 𝑇].

Hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 dinyatakan dalam persamaan berikut

𝑑𝑥 𝑇 = 𝛿𝑥 𝑇 + 𝑥 𝑇 𝑑𝑇 (2.1.1)

Lema 2 : Aturan Leibniz untuk fungsional

𝑇
Jika 𝑥(𝑡) ∈ 𝑹𝑛 adalah fungsi dari 𝑡 dan 𝐽 𝑥 = 𝑡0
ℎ 𝑥 𝑡 , 𝑡 𝑑𝑡 maka

𝑇
𝑑𝐽 = ℎ 𝑥 𝑇 , 𝑇 𝑑𝑇 − ℎ 𝑥 𝑡0 , 𝑡0 𝑑𝑡0 + ℎ𝑥𝑇 (𝑥 𝑡 , 𝑡)𝛿𝑥(𝑡) 𝑑𝑡
𝑡0

dengan notasi

𝜕ℎ
ℎ𝑥 ≜
𝜕𝑥

12
Definisi 7 : Suatu fungsional 𝐽 dikatakan memiliki nilai optimum relatif di 𝑥 ∗ jika
terdapat suatu 𝜖 sehingga untuk setiap fungsi 𝑥 dalam domain Ω memenuhi 𝑥 −
𝑥 ∗ < 𝜖 . Dengan kata lain, jika

∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥 ∗ ) ≥ 0

maka 𝐽(𝑥 ∗ ) adalah nilai minimum relatif. Dan sebaliknya, jika

∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥 ∗ ) ≤ 0

maka 𝐽(𝑥 ∗ ) adalah nilai maksimum relatif. Jika hubungan di atas terpenuhi untuk 𝜖
yang cukup besar, maka 𝐽(𝑥 ∗ ) adalah nilai optimum global.

Teorema 1 : Teorema Dasar Kalkulus Variasi

Supaya suatu nilai 𝑥 ∗ (𝑡) menjadi suatu nilai yang optimum, variasi pertama dari 𝐽
harus bernilai 0 pada saat 𝑥 ∗ (𝑡), dalam hal ini 𝛿𝐽(𝑥 ∗ 𝑡 , 𝛿𝑥 𝑡 ) = 0, untuk semua
nilai yang memungkinkan dari 𝛿𝑥 𝑡 .

2.2. Kontrol Optimal Berdasarkan pada Kalkulus Variasi

Tinjau sistem dinamik nonlinear (1.2.1)


𝑥(𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡
dengan indeks performa (1.2.2)
𝑇
𝐽(𝑡0 ) = 𝜙 𝑥 𝑇 , 𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡
𝑡0

serta fungsi pembatas pada state akhir (1.2.3)


𝜓 𝑥 𝑇 ,𝑇 = 0

13
Berikut akan diturunkan kondisi yang diperlukan untuk keoptimalan dengan
menerapkan kalkulus variasi terhadap indeks performa yang merupakan subjek bagi
fungsi pembatas (1.2.1) dan (1.2.3).

Untuk mendekatkan fungsi pembatas (1.2.1) dan (1.2.3) dengan indeks performa
maka persamaan (1.2.2) dimodifikasi dengan faktor pengali Lagrange. Karena
𝑥(𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 berlaku untuk setiap 𝑡 ∈ [𝑡0 , 𝑇] maka dibutuhkan faktor
pengali Lagrange yang bersesuaian, yaitu 𝜆(𝑡) ∈ 𝑹𝑛 yang merupakan fungsi dalam 𝑡.
Sedangkan untuk 𝜓 𝑥 𝑇 , 𝑇 yang hanya berlaku saat 𝑇, faktor pengali Lagrange
yang bersesuaian adalah 𝑣 ∈ 𝑹𝑝 .

Modifikasi indeks performa (1.2.2) dengan menggunakan faktor pengali Lagrange


tersebut dan diperoleh

𝐽 = 𝜙 𝑥 𝑇 , 𝑇 + 𝑣𝑇 𝜓 𝑥 𝑇 , 𝑇

𝑇
+ 𝑡0
[𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 +𝜆𝑇 (𝑡) 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝑥(𝑡) ]𝑑𝑡 (2.2.1)

Definisikan Hamiltonian 𝐻(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) untuk mendekatkan fungsi biaya dengan


fungsi pembatas

𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 = 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 + 𝜆𝑇 𝑓(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) (2.2.2)

Indeks performa (2.2.1) dapat dituliskan ulang sebagai

𝑇
𝐽 = 𝜙 𝑥 𝑇 , 𝑇 + 𝑣𝑇 𝜓 𝑥 𝑇 , 𝑇 + 𝑡0
[𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝜆𝑇 𝑥(𝑡)]𝑑𝑡 (2.2.3)

Untuk menerapkan kondisi yang diperlukan bagi keoptimalan, dalam hal ini 𝛿𝐽 = 0,
terlebih dahulu perlu dihitung variasi 𝛿𝐽. Dengan menggunakan aturan Leibniz pada
Lema 2 dan dengan mengasumsikan variasi independen dalam 𝛿𝑢( ), 𝛿𝑥 , 𝛿𝑣, 𝛿𝜆,
dan 𝛿𝑡 diperoleh variasi pertama dari persamaan (2.2.3), yaitu

14
𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 𝑑𝑥(𝑇) + 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 𝑑𝑇

+𝜓𝑇 𝑥 𝑇 , 𝑇 𝑑𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥(𝑇) 𝑑𝑇 − 𝐻 − 𝜆𝑇 𝑡0 𝑥(𝑡0 ) 𝑑𝑡0


𝑡𝑓
+ 𝐻𝑥𝑇 𝛿𝑥 𝑡 + 𝐻𝑢𝑇 𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡
𝑡0

Disusun ulang menjadi

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 𝑑𝑥 𝑇

+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜓𝑇 𝑥 𝑇 , 𝑇 𝑑𝑣

− 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0

𝑡𝑓
+ 𝑡0
𝐻𝑥𝑇 𝛿𝑥 𝑡 + 𝐻𝑢𝑇 𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡 (2.2.4)

𝑇
Dengan menggunakan pengintegralan parsial untuk 𝑡0
𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡 ,

penyederhanaan pada variasi 𝑥 dapat dilakukan.

𝑇 𝑇
− 𝑡0
𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡 = −𝜆𝑇 𝑇 𝛿𝑥 𝑇 + 𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 + 𝑡0
𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡 (2.2.5)

Berdasarkan persamaan (2.1.1), hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 adalah

𝛿𝑥 𝑡 = 𝑑𝑥 𝑡 − 𝑥 𝑡 𝑑𝑡

dimana 𝑥(𝑡) fungsi kontinu atas 𝑡 , serta turunan 𝑑𝑥(𝑡) dan 𝑑𝑡 saling
bergantung. 𝛿𝑥(𝑡) adalah variasi dari 𝑥(𝑡) , increment kecil dalam 𝑥(𝑡) saat 𝑡
dianggap tetap, yang saling bebas dengan 𝑑𝑡. Term dalam 𝑡 = 𝑇 bergantung pada
𝑑𝑥(𝑡) dan 𝑑𝑇.

𝛿𝑥 𝑇 didefinisikan dalam 𝑑𝑥 𝑇 dan 𝑑𝑇, begitu pula dengan 𝛿𝑥 𝑡0 didefinisikan


dalam 𝑑𝑥 𝑡0 dan 𝑑𝑡0 , menjadi

−𝜆𝑇 𝑇 𝛿𝑥 𝑇 = −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 (2.2.6)

15
𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 = 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 (2.2.7)

Substitusikan persamaan (2.2.6) dan (2.2.7) ke persamaan (2.2.5), maka akan


diperoleh

𝑇
− 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡 = −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0
𝑡0

𝑇
−𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝑡0
𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡 (2.2.8)

Kemudian substitusikan penyederhanaan pada persamaan (2.2.8) ke persamaan


(2.2.4).

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇

+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇

+𝜓𝑇 𝑥 𝑇 , 𝑇 𝑑𝑣 − 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 + 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0

𝑡𝑓
+ (𝐻𝑥𝑇 + 𝜆𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢𝑇 𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡
𝑡0

Disederhanakan kembali menjadi

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜓𝑇 𝑥 𝑇 , 𝑇 𝑑𝑣

+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 𝑑𝑇 − 𝐻𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0

𝑡𝑓
+ (𝐻𝑥𝑇 + 𝜆𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢𝑇 𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡
𝑡0

Berdasarkan teori Lagrange, nilai minimum (ekstremum) dari 𝐽 dicapai pada keadaan
yang sama dengan nilai minimum dari 𝐽, yaitu saat 𝛿𝐽 = 0. Untuk memenuhi keadaan
ini, nilai-nilai dari semua koefisien pada increment bebas 𝛿𝜆, 𝑑𝑣, 𝛿𝑢, 𝛿𝑝, 𝛿𝑥 𝑇 , 𝛿𝑥(𝑡)
dijadikan 0.

16
𝑑𝑣 = 0 → 𝜓𝑇 𝑥 𝑇 , 𝑇 = 0

𝛿𝜆 = 0 → 𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 = 0

𝜕𝐻
𝑥 𝑡 = 𝜕𝜆 =𝑓
𝑡

𝛿𝑥 = 0 → 𝐻𝑥𝑇 + 𝜆𝑇 𝑡 = 0

𝜕𝐻
𝜆 𝑡 = − 𝜕𝑥

𝜕𝐻
𝛿𝑢 = 0 → 0 = 𝐻𝑢𝑇 = 𝜕𝑢

𝑑𝑥 𝑇 = 0 → 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 = 0

𝜙𝑥 𝑥 𝑇 , 𝑇 − 𝜆𝑇 𝑇 = 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣

𝑑𝑇 = 0 → 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 = 0

𝐻 + 𝜙𝑡 𝑥 𝑇 , 𝑇 = −𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣

17
Tabel 1 Syarat keoptimalan bagi fungsi kontinu

Persamaan Variasi

Model
Pertumbuhan 𝑥(𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡
Sistem 𝑡 ≥ 𝑡0 , 𝑡0 𝑡𝑒𝑡𝑎𝑝

Indeks Performa 𝑡𝑓
𝐽(𝑡0 ) = 𝜙 𝑥 𝑇 , 𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡
𝑡0

Fungsi pembatas
bagi state akhir 𝜓 𝑥 𝑇 ,𝑇 = 0 𝑑𝑣

Persamaan State 𝜕𝐻 𝛿𝜆
𝑥 𝑡 =
𝜕𝜆 𝑡
Persamaan
Costate 𝜕𝐻 𝛿𝑥
𝜆 𝑡 =−
𝜕𝑥
Kondisi
Kestasioneran 𝜕𝐻 𝛿𝑢
=0
Input 𝜕𝑢

Kondisi Pembatas 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇 𝑑𝑥(𝑇)


pada waktu akhir
+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 𝑑𝑇 = 0 𝑑𝑇

18
BAB 3

APLIKASI KONTROL OPTIMAL

DALAM SISTEM KONTINU

3.1. Prinsip Hamilton dalam Dinamika Klasik

Dinamika klasik adalah salah satu cabang ilmu Mekanika klasik, yang mempelajari
ilmu fisika tentang gaya yang bekerja pada benda. Dinamika partikel dideskripsikan
oleh hukum-hukum Newton tentang gerak, terutama oleh hukum kedua Newton.
Hukum ini menyatakan, "Sebuah benda yang memperoleh pengaruh gaya atau
interaksi akan bergerak sedemikian rupa sehingga laju perubahan waktu dari
momentum sama dengan gaya tersebut".

Jika ditinjau gerak partikel pada suatu permukaan bidang, dapat diperhatikan bahwa
diperlukan adanya gaya tertentu yakni gaya konstrain yang berperan mempertahankan
kontak antara partikel dengan permukaan bidang. Namun tak selamanya gaya
konstrain yang beraksi terhadap partikel dapat diketahui. Pendekatan Newtonian
memerlukan informasi gaya total yang bekerja pada partikel. Gaya total ini
merupakan total dari keseluruhan gaya yang beraksi pada partikel, termasuk juga
gaya konstrain. Oleh karena itu, jika dalam kondisi khusus terdapat gaya yang tidak
dapat diketahui, maka pendekatan Newtonian tidak berlaku, sehingga diperlukan
pendekatan baru dengan meninjau kuantitas fisis lain yang merupakan karakteristik
partikel, misal energi totalnya. Pendekatan ini dilakukan dengan menggunakan
prinsip Hamilton, dimana persamaan Lagrange dapat diturunkan dari prinsip tersebut.

19
Prinsip Hamilton untuk sistem konservatif yang seringkali ditemukan dalam fisika
klasik menyatakan bahwa “Dari seluruh lintasan yang mungkin bagi sistem dinamik
untuk berpindah dari satu titik ke titik lain dalam interval waktu spesifik (konsisten
dengan sembarang konstrain), lintasan nyata yang diikuti sistem dinamis adalah
lintasan yang meminimumkan integral waktu selisih antara energi kinetik dengan
energi potensial.” (Marion 1965).

Sesuai dengan prinsip Hamiltonian, persamaan gerak partikel yang dinyatakan oleh
persamaan Lagrange dapat diperoleh dengan meninjau energi kinetik dan energi
potensial partikel tanpa perlu meninjau gaya yang beraksi pada partikel. Energi
kinetik partikel dalam koordinat kartesian adalah fungsi dari kecepatan, energi
potensial partikel yang bergerak dalam medan gaya konservatif adalah fungsi dari
posisi.

Lebih jauh lagi, Lagrangian didefinisikan sebagai selisih antara energi kinetik dan
energi potensial. Dari prinsip Hamilton, dapat diturunkan persamaan Lagrange
dengan menggunakan kondisi kestasioneran. Persamaan Lagrange merupakan
persamaan gerak partikel sebagai fungsi dari koordinat, kecepatan, dan waktu.
Fungsi Lagrangian terhadap waktu merupakan konsekuensi dari fungsi konstrain
terhadap waktu atau dikarenakan persamaan transformasi yang menghubungkan
koordinat kartesian dan koordinat umum memuat fungsi atas waktu.

a. Persamaan Gerak Lagrange

Persamaan Lagrange untuk pergerakan dapat diturunkan dari Prinsip Hamilton


dengan mendefinisikan

𝑞 ≜ vektor koordinat,

20
𝑢 = 𝑞 ≜ vektor kecepatan,

𝑈(𝑞) ≜ energi potensial,

𝑇(𝑞, 𝑢) ≜ energi kinetik,

𝐿 𝑞, 𝑢 ≜ 𝑇 𝑞, 𝑢 − 𝑈(𝑞) , Lagrangian dari sistem.

Model pertumbuhan dideskripsikan dengan

𝑞 = 𝑢 ≜ 𝑓(𝑞, 𝑢) (3.1.1)

dimana fungsi 𝑓 diberikan oleh bagian fisika dari permasalahan. Untuk mencari
lintasan gerak, prinsip Hamilton mengatakan bahwa indeks performa berikut
harus diminimalkan

𝑇
𝐽 0 = 0
𝐿 𝑞, 𝑢 𝑑𝑡 (3.1.2)

dengan Hamiltonian

𝐻 = 𝐿 + 𝜆𝑇 𝑢 (3.1.3)

Berdasarkan tabel keoptimalan, untuk meminimalkan indeks performa maka


kondisi-kondisi berikut harus dipenuhi

𝜕𝐻 𝜕𝐿
−𝜆 = = (3.1.4)
𝜕𝑞 𝜕𝑞

𝜕𝐻 𝜕𝐿
0= = +𝜆 (3.1.5)
𝜕𝑢 𝜕𝑢

Setelah mengkombinasikan kedua persamaan di atas diperoleh Persamaan Gerak


Lagrange

𝜕𝐿 𝑑 𝜕𝐿
− =0 (3.1.6)
𝜕𝑞 𝑑𝑡 𝜕𝑞

21
Perlu ditekankan bahwa dalam konteks ini, persamaan costate dan kondisi
kestasioneran ekivalen dengan Persamaan Lagrange. Dalam konteks yang lebih
umum dari permasalahan variasi, persamaan di atas disebut Persamaan Euler.
Persamaan costate dan kondisi kestasioneran pada tabel keoptimalan adalah
formulasi alternatif dari persamaan Euler.

b. Persamaan Gerak Hamilton

Jika vektor momentum didefinisikan dengan

𝜕𝐿
𝜆=− (3.1.7)
𝜕𝑞

maka persamaan gerak dapat dituliskan dalam bentuk Hamiltonian dengan

𝜕𝐻
𝑞= (3.1.8)
𝜕𝜆

𝜕𝐻
−𝜆 = (3.1.9)
𝜕𝑞

Jadi, dalam permasalahan kontrol optimal, persamaan state dan costate adalah
generalisasi dari Persamaan Gerak Hamilton.

22
3.2. Jarak Terdekat antara Dua Titik

Persamaan panjang kurva 𝑥(𝑡) yang bergantung pada parameter 𝑡 dengan 𝑎 ≤ 𝑡 ≤ 𝑏


diberikan oleh

𝑏
𝐽= 𝑎
1 + 𝑥 2 (𝑡) 𝑑𝑡 (3.2.1)

Untuk menyatakan bahwa kurva 𝑥(𝑡) menghubungkan dua titik di bidang, 𝑎, 𝐴 dan
(𝑏, 𝐵), maka perlu ditetapkan kondisi-kondisi batas berikut

𝑥 𝑎 =𝐴 (3.2.2)

𝑥 𝑏 =𝐵 (3.2.3)

Berikutnya, akan dicari kurva 𝑥(𝑡) yang menghubungkan 𝑎, 𝐴 dan (𝑏, 𝐵) serta
meminimalkan 𝐽.

Model pertumbuhan didefinisikan dengan

𝑥=𝑢 (3.2.4)

dan 𝐽 jika dituliskan dalam 𝑢 akan menjadi

𝑏
𝐽= 𝑎
1 + 𝑢2 𝑑𝑡 (3.2.5)

dengan Hamiltonian

𝐻 = 1 + 𝑢2 + 𝜆𝑢 (3.2.6)

Tabel keoptimalan memberikan kondisi

𝑥 = 𝐻𝜆 = 𝑢 (3.2.7)

−𝜆 = 𝐻𝑥 = 0 (3.2.8)

23
𝑢
0 = 𝐻𝑢 = 𝜆 + (3.2.9)
1 + 𝑢2

Untuk mencari 𝑢 yang optimal, dari persamaan terakhir diperoleh

𝜆
𝑢= (3.2.10)
1 + 𝜆2

namun dari persamaan (3.2.8) diketahui bahwa 𝜆 konstan, dengan demikian maka 𝑢
yang bernilai konstan merupakan solusi optimal.

Kurva 𝑥(𝑡) yang optimal memiliki persamaan

𝑥 𝑡 = 𝑐1 𝑡 + 𝑐2 (3.2.11)

Untuk mencari nilai 𝑐1 dan 𝑐2 dapat digunakan kondisi batas yang telah ditetapkan
sebelumnya, dan diperoleh

𝐴 − 𝐵 𝑡 + 𝑎𝐵 − 𝑏𝐴
𝑥 𝑡 = (3.2.12)
𝑎−𝑏

yang merupakan persamaan garis lurus sebagai lintasan optimal antara dua titik.

3.3. Kontrol Temperatur dalam Ruangan

Misalkan suatu keadaan dimana dibutuhkan energi seminimal mungkin untuk


memanaskan ruangan. Jika 𝜃(𝑡) adalah temperatur ruangan pada saat 𝑡, 𝜃𝑎 adalah
temperatur udara di luar ruangan (konstan), dan 𝑢(𝑡) adalah laju perubahan
temperatur ke dalam ruangan, maka model dinamiknya adalah

𝜃 = −𝑎 𝜃 − 𝜃𝑎 + 𝑏𝑢 (3.3.1)

untuk suatu konstanta 𝑎 dan 𝑏, yang bergantung pada redaman panas di ruangan, dan
sebagainya. Dengan menuliskan state sebagai

24
𝑥 𝑡 ≜ 𝜃 𝑡 − 𝜃𝑎 (3.3.2)

persamaan state dapat pula dinyatakan dengan

𝑥 = −𝑎𝑥 + 𝑏𝑢 (3.3.3)

Untuk mengontrol temperatur ruangan pada suatu interval waktu tetap [0, 𝑇] dengan
energi seminimal mungkin, definisikan indeks performa sebagai berikut

1 𝑇 2
𝐽 0 =2 0
𝑢 𝑡 𝑑𝑡 (3.3.4)

Hamiltonian yang digunakan adalah

𝑢2
𝐻= + 𝜆 −𝑎𝑥 + 𝑏𝑢 (3.3.5)
2

Berdasarkan tabel keoptimalan, kontrol optimal 𝑢(𝑡) dapat ditentukan dengan


menyelesaikan

𝑥 = 𝐻𝜆 = −𝑎𝑥 + 𝑏𝑢 (3.3.6)

𝜆 = −𝐻𝑥 = 𝑎𝜆 (3.3.7)

0 = 𝐻𝑢 = 𝑢 + 𝑏𝜆 (3.3.8)

Kondisi kestasioneran mengatakan bahwa kontrol optimal diberikan oleh

𝑢 𝑡 = −𝑏𝜆(𝑡) (3.3.9)

sehingga untuk menetukan 𝑢∗ (𝑡) diperlukan untuk mencari costate yang optimal
𝜆∗ (𝑡) terlebih dahulu.

Substitusikan (3.3.9) ke (3.3.6) dan diperoleh persamaan state dan costate

𝑥 = −𝑎𝑥 − 𝑏 2 𝜆 (3.3.10a)

25
𝜆 = 𝑎𝜆 (3.3.10b)

yang harus diselesaikan untuk 𝜆∗ (𝑡) dan lintasan state yang optimal 𝑥 ∗ (𝑡).

Walaupun final costate 𝜆(𝑇) belum diketahui, namun persamaan di atas dapat
diselesaikan dengan mengasumsikan 𝜆(𝑇) telah diketahui. Solusi untuk (3.3.10b)
adalah

𝜆∗ 𝑡 = 𝑒 −𝑎 𝑇−𝑡
𝜆(𝑇) (3.3.11)

dan dengan menggunakan hasil ini untuk (3.3.10a), diperoleh

𝑥 = −𝑎𝑥 − 𝑏 2 𝜆(𝑇)𝑒 −𝑎(𝑇−𝑡) (3.3.12)

Terapkan transformasi Laplace pada persamaan ini, dan dihasilkan

𝑥(0) 𝑏 2 𝜆(𝑇)𝑒 −𝑎𝑇


𝑋 𝑠 = −
𝑠+𝑎 𝑠 + 𝑎 (𝑠 − 𝑎)

1 1
𝑥(0) 𝑏 2 −2
= − 𝜆 𝑇 𝑒 −𝑎𝑇
+ 2 (3.3.13)
𝑠+𝑎 𝑎 𝑠+𝑎 𝑠−𝑎

sehingga

𝑏2
𝑥 ∗ 𝑡 = 𝑥 0 𝑒 −𝑎𝑇 − 𝜆 𝑇 𝑒 −𝑎𝑇 sinh 𝑎𝑡 (3.3.14)
𝑎

Persamaan (3.3.11) dan (3.3.14) memberikan costate yang optimal 𝜆∗ (𝑡) dan state
yang optimal 𝑥 ∗ (𝑡) dengan catatan bahwa final costate 𝜆(𝑇) belum diketahui. State
awal 𝑥 0 diberikan.

Lebih jauh lagi, objektif dari permasalahan kontrol perlu diklasifikasikan menjadi dua
kasus, yang masing-masing akan memberikan nilai 𝜆(𝑇).

26
a. State Akhir Tetap

Misalkan temperatur awal ruangan sama dengan 𝜃𝑎 = 60о . Kemudian

𝑥 0 = 0о (3.3.15)

Diasumsikan bahwa objektif dari permasalahan kontrol adalah untuk membawa


temperatur akhir 𝜃(𝑇) tepat ke 70о selama 𝑇 detik, sehingga state akhir bernilai
tetap yaitu

𝑥 𝑇 = 10о (3.3.16)

Karena waktu akhir dan state akhir keduanya bernilai tetap, maka 𝑑𝑇 dan 𝑑𝑥(𝑇)
keduanya bernilai 0, dan kondisi batas (pada tabel keoptimalan) terpenuhi.

Dengan menggunakan persamaan (3.3.15) dan (3.3.16) akan ditentukan 𝜆(𝑇);


kemudian akan dicari 𝜆(𝑡) dengan menggunakan persamaan (3.3.11) dan mencari
kontrol optimal dengan memakai persamaan (3.3.9). Untuk mencari 𝜆(𝑇) ,
gunakan persamaan (3.3.14) untuk mendapatkan

−𝑎𝑇
𝑏2
𝑥 𝑇 =𝑥 0 𝑒 − 𝜆 𝑇 1 − 𝑒 −2𝑎𝑇 (3.3.17)
2𝑎

Substitusikan persamaan (3.3.15) dan (3.3.16) dan diperoleh final costate

20𝑎
𝜆 𝑇 =− (3.3.18)
𝑏2 1 − 𝑒 −2𝑎𝑇

maka lintasan costate yang optimal adalah


10𝑎𝑒 𝑎𝑡
𝜆 𝑡 =− 2 (3.3.19)
𝑏 sinh 𝑎𝑇

27
dan akhirnya laju perubahan temperatur yang optimal diberikan oleh (3.3.9) atau


10𝑎𝑒 𝑎𝑡
𝑢 𝑡 = 0≤𝑡≤𝑇 (3.3.20)
𝑏 sinh 𝑎𝑇

Untuk memeriksa solusi, terapkan 𝑢∗ 𝑡 ke dalam sistem (3.3.3). Kemudian


selesaikan untuk lintasan state, diperoleh

sinh 𝑎𝑡
𝑥 ∗ 𝑡 = 10 (3.3.21)
sinh 𝑎𝑇

𝑥 ∗ 𝑡 = 10

sesuai dengan hasil yang diharapkan.

b. State Akhir Bebas

Misalkan state akhir tidak ditetapkan bernilai 10о seperti kasus sebelumnya.
Yang diharapkan adalah fungsi kontrol 𝑢(𝑡) meminimalkan

𝑇
1 1
𝐽 0 = 𝑠(𝑥 𝑇 − 10)2 + 𝑢2 𝑡 𝑑𝑡 (3.3.22)
2 2 0

untuk suatu bobot 𝑠 (misal 𝑠 ∈ 𝑹) yang dipilih kemudian. Jika nilai 𝑠 cukup
besar, maka solusi optimal akan memiliki nilai 𝑥(𝑇) mendekati 10о , karena
berikutnya term pertama akan berkontribusi kecil terhadap biaya.

Berdasarkan tabel keoptimalan, persamaan state dan costate diberikan oleh


(3.3.10), dan kontrol optimal oleh (3.3.9). Dengan demikian, (3.3.11) dan (3.3.14)
tetap valid.

Kondisi awal tetap diberikan oleh (3.3.15), namun kondisi akhir harus ditentukan
dengan menggunakan kondisi batas. Waktu akhir 𝑇 bernilai tetap, sehingga

28
𝑑𝑇 = 0 dan term ke dua dari kondisi batas (pada tabel) otomatis bernilai 0.
Karena 𝑥(𝑇) tidak tetap, 𝑑𝑥(𝑇) tidak nol (sama seperti pada kasus state akhir
tetap).

Dengan memandang kondisi di atas, dibutuhkan bahwa

𝜕𝜙
𝜆 𝑇 = = 𝑠 𝑥 𝑇 − 10 (3.3.23)
𝜕𝑥 𝑇

Dari (3.3.15) dan (3.3.23) akan ditentukan 𝜆(𝑇).

Untuk itu, perhatikan bahwa

𝜆 𝑇
𝑥 𝑇 = + 10 (3.3.24)
𝑠

Kombinasikan (3.3.24), (3.3.15), dan (3.3.17) kemudian selesaikan untuk final


costate diperoleh

−20𝑎𝑠
𝜆 𝑇 = (3.3.25)
2𝑎 + 𝑏 2 𝑠 1 − 𝑒 −2𝑎𝑇

Dengan menggunakan (3.3.11) didapatkan lintasan costate yang optimal

−10𝑎𝑠𝑒 𝑎𝑡
𝜆∗ 𝑡 = (3.3.26)
𝑎𝑒 𝑎𝑇 + 𝑠𝑏 2 sinh 𝑎𝑇

Akhirnya diperoleh kontrol optimal

10𝑎𝑏𝑠𝑒 𝑎𝑡
𝑢∗ 𝑡 = (3.3.27)
𝑎𝑒 𝑎𝑇 + 𝑠𝑏 2 sinh 𝑎𝑇

Untuk memeriksa kebenaran solusi, simulasikan fungsi kontrol dengan


menggunakan 𝑢∗ 𝑡 dalam model pertumbuhan (3.3.3). Dengan menyelesaikan
untuk lintasan state yang optimal diperoleh

29
10𝑠𝑏 2 sinh 𝑎𝑡
𝑥∗ 𝑡 = (3.3.28)
𝑎𝑒 𝑎𝑇 + 𝑠𝑏 2 sinh 𝑎𝑇

Pada waktu akhir,

10𝑠𝑏 2 sinh 𝑎𝑇
𝑥∗ 𝑇 = (3.3.29)
𝑎𝑒 𝑎𝑇 + 𝑠𝑏 2 sinh 𝑎𝑇

3.4. Permasalahan Titik Potong dan Titik Temu

a. Formulasi Masalah

Geometri dari permasalahan ditunjukkan pada gambar, dimana 𝑦(𝑡) dan 𝑣(𝑡)
masing-masing adalah posisi vertikal dan kecepatan dari pesawat pengejar 𝐴
relatif terhadap pesawat target 𝐴𝑡 , yang diasumsikan sedang beristirahat. Jarak
horisontal awal pesawat pengejar terhadap pesawat target adalah 𝐷. Kecepatan
horisontal pengejar relatif terhadap target 𝐴𝑡 adalah 𝑉; sehingga waktu akhir 𝑇,
dimana kedua pesawat akan memiliki jarak horisontal yang sama, adalah tetap
dan diketahui bernilai

𝐷
𝑇 = 𝑡0 + (3.4.1)
𝑉

dengan sudut penglihatan 𝜎(𝑡).

Dalam permasalahan titik temu, diinginkan agar posisi akhir 𝑦(𝑇) dan kecepatan
akhir 𝑣(𝑇) keduanya bernilai 0. Namun dalam permasalahan titik potong,
kecepatan akhir tidak dipentingkan, meskipun diharapkan bahwa posisi akhir
𝑦(𝑇) adalah 0.

30
Gambar 3.4.1 Geometri dari Permasalahan Titik Potong dan Titik Temu

Persamaan dinamik dari pergerakan vertikal dinyatakan oleh persamaan state

𝑦=𝑣 (3.4.2)

𝑣=𝑢 (3.4.3)

dimana 𝑢(𝑡) adalah percepatan vertikal. Kemudian indeks performa yang


digunakan adalah

𝑠𝑦 𝑦 2 (𝑇) 𝑠𝑣 𝑣 2 (𝑇) 1 𝑇
𝐽 𝑡0 = + + 𝑢2 𝑡 𝑑𝑡 (3.4.4)
2 2 2 𝑡0

Untuk titik potong, 𝑠𝑣 = 0 dan 𝑠𝑦 dibuat bernilai cukup besar sehingga kontrol
optimal akan menghasilkan 𝑦 2 (𝑇) yang kecil. Untuk titik temu, 𝑠𝑣 dan 𝑠𝑦
keduanya dipilih bernilai besar.

b. Solusi Permasalahan

Kontrol optimal akan dipilih sedemikian rupa sehingga meminimalkan (3.4.4).

31
Setiap komponen pada state harus memiliki faktor pengali Lagrange yang
bersesuaian; oleh karena itu ambil 𝜆 ≜ [𝜆𝑦 , 𝜆𝑣 ]𝑇 dan Hamiltonian

1 2
𝐻= 𝑢 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣 (3.4.5)
2

maka persamaan costate adalah

𝜕𝐻
𝜆𝑦 = − =0 (3.4.6)
𝜕𝑦

𝜕𝐻
𝜆𝑣 = − = −𝜆𝑦 (3.4.7)
𝜕𝑣

Kondisi kestasioneran adalah

𝜕𝐻
0= = 𝑢 + 𝜆𝑣 (3.4.8)
𝜕𝑢

sehingga kontrol optimal adalah negatif dari faktor pengali kecepatan

𝑢 𝑡 = −𝜆𝑣 (𝑡) (3.4.9)

Kondisi awal adalah

𝑦 𝑡0 , 𝑣 𝑡0 diberikan. (3.4.10)

Kondisi akhir ditentukan oleh kondisi batas pada tabel keoptimalan. Karena
waktu akhir tetap, 𝑑𝑇 = 0, maka hanya term pertama yang memberikan kondisi
mengikat.

𝜕𝜙
𝜆𝑦 𝑇 = 𝑇 = 𝑠𝑦 𝑦 𝑇 (3.4.11)
𝜕𝑦

𝜕𝜙
𝜆𝑣 𝑇 = 𝑇 = 𝑠𝑣 𝑣 𝑇 (3.4.12)
𝜕𝑣

32
Berikutnya akan diselesaikan permasalahan nilai batas yang didefinisikan oleh
persamaan state dan costate dengan 𝑢 seperti pada (3.4.9) dan kondisi batas
(3.4.10) – (3.4.12). Seperti pada 3.3, 𝜆𝑦 𝑇 dan 𝜆𝑣 𝑇 diasumsikan telah
diketahui. Persamaan costate diselesaikan secara mundur terhadap waktu, dan
persamaan state kemudian diselesaikan secara maju terhadap waktu.

Dengan mengintegralkan kedua ruas pada (3.4.6) dari 𝑡 hingga 𝑇 diperoleh


konstanta komponen costate, yaitu

𝜆𝑦 𝑡 = 𝜆 𝑦 𝑇 ≜ 𝜆𝑦 (3.4.13)

Integralkan (3.4.7), memberikan

𝜆𝑣 𝑇 − 𝜆𝑣 𝑡 = −(𝑇 − 𝑡)𝜆𝑦

atau

𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + (𝑇 − 𝑡)𝜆𝑦 (3.4.14)

Selanjutnya, untuk menyederhanakan diasumsikan bahwa 𝑡0 = 0 . Kemudian


substitusikan kontrol (3.4.9) ke (3.4.3) dan dihasilkan

𝑣 = −𝜆𝑣 𝑡 (3.4.15)

Dengan menggunakan (3.4.14) dan mengintegralkan kedua ruas untuk [0, 𝑡]


diperoleh persamaan kuadrat

𝑡2
𝑣 𝑡 = 𝑣 0 − 𝑡 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 + 𝜆 (3.4.16)
2 𝑦

Substitusikan hasil ini ke dalam perhitungan dan integralkan (3.4.2) lalu diperoleh
persamaan kubik

𝑡2 𝑡3
𝑦 𝑡 =𝑦 0 +𝑤 0 − 𝜆 𝑇 + 𝑇𝜆𝑦 + 𝜆𝑦 (3.4.17)
2 𝑣 6

33
Persamaan state dan costate telah diselesaikan dalam term 𝜆(𝑇) dan 𝑦 0 , 𝑣(0)
yang diberikan. Namun, final costate belum diketahui. Untuk mencarinya, dapat
digunakan hubungan (3.4.11) dan (3.4.12) antara final state dan final costate.
Setelah menggabungkan hubungan ini dengan (3.4.16) dan (3.4.17) didapat

𝑇2 𝑇3
𝜆𝑦 = 𝑠𝑦 𝑦 0 + 𝑇𝑣 0 − 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 + 𝜆𝑦 (3.4.18)
2 6

dan

𝑇2
𝜆𝑣 𝑇 = 𝑠𝑣 𝑣 0 − 𝑇 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 + 𝜆 (3.4.19)
2 𝑦

Kedua persamaan ini dapat dituliskan ulang sebagai

𝑠𝑦 𝑇 3 𝑠𝑦 𝑇 2
1+ 𝜆𝑦 𝑠𝑦 𝑠𝑦 𝑇 𝑦 0
3 2 = (3.4.20)
2 𝜆𝑣 𝑇 0 𝑠𝑣 𝑣 0
𝑠𝑣 𝑇
1 + 𝑠𝑣 𝑇
2

Menyelesaikan persamaan ini dan diperoleh final costate

𝑇
𝜆𝑦 1 𝑠𝑣 + 𝑇 𝑇 𝑠𝑣 +
2 𝑦 0
= 2 3 (3.4.21)
𝜆𝑣 𝑇 ∆ 𝑇 𝑇 𝑇 𝑣 0
− 𝑠𝑦 −
2 6

dimana

𝑇3 𝑇4
∆ 𝑇 = 𝑠𝑦 + 𝑠𝑣 + 𝑇 − (3.4.22)
3 4

bobot akhir diperoleh

1
𝑠𝑦 ≡ (3.4.23𝑎)
𝑠𝑦

34
1
𝑠𝑣 ≡ (3.4.23𝑏)
𝑠𝑣

Pada faktanya, waktu awal 𝑡0 tidak bernilai 0. Karena persamaan state dan costate
linear, untuk mengoreksi dibutuhkan untuk mensubstitusi (𝑇 − 𝑡0 ) ke dalam 𝑇
pada ruas kanan persamaan (3.4.21). Sebelumnya, perlu diingat bahwa pada saat
𝑡 ≤ 𝑇 nilai 𝑦 𝑡 dan 𝑣(𝑡) telah diketahui, sehingga 𝑡 dapat diambil sebagai waktu
awal. Hal ini berkorespondensi dengan meminimalkan 𝐽(𝑡), yaitu remaining cost
pada selang [𝑡, 𝑇].

Dengan mensubstitusikan (𝑇 − 𝑡) untuk 𝑇 dalam persamaan (3.4.21) diperoleh


persamaan untuk final costate dalam variabel state saat ini :

𝑇−𝑡
𝜆𝑦 1 𝑠𝑣 + 𝑇 − 𝑡 𝑇−𝑡 𝑠𝑣 +
2 𝑦 𝑡
= 2 3 (3.4.24)
𝜆𝑣 𝑇 ∆ 𝑇−𝑡 𝑇−𝑡 𝑇−𝑡 𝑣 𝑡
− 𝑠𝑦 −
2 6

Pada akhirnya, kontrol optimal dapat dihitung dengan mendasarkan perhitungan


pada (9) dan (14)

𝜆𝑦
𝑢 𝑡 =− 𝑇−𝑡 1 (3.4.25)
𝜆𝑣 𝑇

Dengan turut memperhitungkan (24) diperoleh kontrol optimal

2
𝑇−𝑡
𝑇 − 𝑡 𝑠𝑣 +
𝑢 𝑡 =− 2 𝑦 𝑡
∆ 𝑇−𝑡

3
𝑇−𝑡
𝑠𝑦 + 𝑇 − 𝑡 2 𝑠𝑣 +
− 3 𝑣 𝑡 (3.4.26)
∆ 𝑇−𝑡

Hasil ini merupakan hukum kontrol feedback karena kontrol yang sesungguhnya
hanya diberikan dalam state saat ini.

35
c. Navigasi Proporsional

Untuk permasalahan titik potong, pilih 𝑠𝑣 = 0 dan 𝑠𝑦 → ∞. Dengan mengambil


limit dari (26) diperoleh

3 3
𝑢 𝑡 =− 2
𝑦 𝑡 − 𝑣 𝑡 (3.4.27)
𝑇−𝑡 𝑇−𝑡

sebagai kontrol optimal titik potong.

Perlu diperhatikan bahwa untuk sudut penglihatan yang kecil

𝑦 𝑡
𝜎 𝑡 = tan 𝜎 𝑡 = (3.4.28)
𝑇−𝑡 𝑉

sehingga

𝑦(𝑡) 𝑦 𝑡
𝜎= + (3.4.29)
𝑇−𝑡 𝑉 𝑇 − 𝑡 2𝑉

maka kontrol optimalnya adalah

𝑢 𝑡 = −3𝑉𝜎 (3.4.30)

Persamaan ini adalah hukum kontrol untuk navigasi proporsional. Setiap pilot
mengetahui bahwa untuk melakukan perpotongan hanya diperlukan untuk
menjaga sudut terhadap target tetap konsan sehingga tidak akan ada pergerakan
terhadap posisi relatif.

3.5. Keoptimalan Sudut Gaya Dorong

Contoh ini bertujuan untuk menekankan bahwa kondisi keoptimalan pada tabel dapat
diterapkan pada sistem tak linear umumnya.

36
a. Hukum Tangent Bilinear

Sebuah partikel dengan massa 𝑚 digerakkan oleh gaya dorong konstan 𝐹 dan
dikenakan pada variabel sudut 𝛾(𝑡) . Posisi partikel adalah (𝑥 𝑡 , 𝑦 𝑡 ) dan
kecepatan pada sumbu 𝑥 dan 𝑦 masing-masing adalah 𝑢(𝑡) dan 𝑣(𝑡). Perhatikan
gambar. Persamaan state tak linear untuk 𝑋 = 𝑓(𝑋, 𝛾, 𝑡) adalah

𝑥=𝑢 (3.5.1)

𝑦=𝑣 (3.5.2)

𝑢 = 𝑎 cos 𝛾 (3.5.3)

𝑣 = 𝑎 sin 𝛾 (3.5.4)

dimana vektor untuk state adalah 𝑋 = 𝑥 𝑦 𝑢 𝑣 𝑇


, dan 𝑎 ≜ 𝐹/𝑚 adalah
percepatan gaya dorong yang telah diketahui. Sudut gaya dorong 𝛾(𝑡) merupakan
kontrol input.

Indeks performa yang digunakan berupa fungsi atas waktu akhir 𝑇 dan state

𝐽 = 𝜙(𝑋 𝑇 , 𝑇) (3.5.5)

Misalkan suatu fungsi 𝜓 atas state akhir harus bernilai 0, sehingga

𝜓 𝑋 𝑇 ,𝑇 = 0 (3.5.6)

Akan dicari bentuk dari 𝛾(𝑡) yang meminimalkan 𝐽 dan memenuhi (3.5.6).
Hamiltonian adalah

𝐻 = 𝐿 + 𝜆𝑇 𝑓 = 𝜆𝑥 𝑢 + 𝜆𝑦 𝑣 + 𝜆𝑢 𝑎 cos 𝛾 + 𝜆𝑣 𝑎 sin 𝛾 (3.5.7)

dimana faktor pengali Lagrange 𝜆 𝑡 = 𝜆𝑥 𝜆𝑦 𝜆𝑢 𝜆𝑣 𝑇


memiliki komponen
yang berasosiasi dengan komponen setiap state.

37
Gambar 3.5.1 Keoptimalan Sudut Gaya Dorong

Berdasarkan tabel keoptimalan, persamaan costate adalah 𝜆 = −𝑓𝑋𝑇 𝜆 atau

𝜆𝑥 = −𝑓𝑥𝑇 𝜆 = 0 (3.5.8)

𝜆𝑦 = −𝑓𝑦𝑇 𝜆 = 0 (3.5.9)

𝜆𝑢 = −𝑓𝑢𝑇 𝜆 = −𝜆𝑥 (3.5.10)

𝜆𝑣 = −𝑓𝑣𝑇 𝜆 = −𝜆𝑦 (3.5.11)

(Perhatikan bahwa subskrip pada 𝑓 menotasikan turunan parsial, sedangkan


subskrip pada 𝜆 menotasikan komponen dari persamaan costate.)

Kondisi kestasioneran adalah

0 = 𝐻𝛾 = −𝜆𝑢 𝑎 sin 𝛾 + 𝜆𝑣 𝑎 cos 𝛾 (3.5.12)

atau

𝜆𝑣 𝑡
tan 𝛾(𝑡) = (3.5.13)
𝜆𝑢 𝑡

38
Dengan mengintegralkan persamaan costate secara mundur dari waktu akhir 𝑇
diperoleh

𝜆𝑥 𝑡 = 𝜆𝑥 (𝑇) ≜ 𝜆𝑥 (3.5.14)

𝜆𝑦 𝑡 = 𝜆𝑦 (𝑇) ≜ 𝜆𝑦 (3.5.15)

𝜆𝑢 𝑡 = 𝜆𝑢 𝑇 + 𝑇𝜆𝑥 − 𝑡𝜆𝑥 ≜ 𝑐1 − 𝑡𝜆𝑥 (3.5.16)

𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 − 𝑡𝜆𝑦 ≜ 𝑐2 − 𝑡𝜆𝑦 (3.5.17)

Kemudian substitusikan ke persamaan (3.5.13) dan diperoleh hukum kontrol


optimal

𝑡𝜆𝑦 − 𝑐2
tan 𝛾 𝑡 = (3.5.18)
𝑡𝜆𝑥 − 𝑐1

Persamaan ini disebut hukum tangent bilinear untuk arah gaya dorong optimal
𝛾 𝑡 .

Untuk menentukan konstanta 𝜆𝑥 , 𝜆𝑦 , 𝑐1 , dan 𝑐2 , dapat dilakukan dengan cara


mensubstitusikan persamaan (3.5.18) ke persamaan state, menyelesaikannya, dan
menerapkan kondisi batas. Untuk menentukan kondisi batas, diperlukan untuk
mengetahui 𝜙 dan 𝜓, yang bergantung pada objektif kontrol tertentu. Ada banyak
objektif permasalahan kontrol yang memungkinkan mengingat bahwa seluruhnya
bergantung pada sifat dari partikel 𝑚. Salah satu contoh yang memiliki solusi
sederhana dan menarik akan dibahas berikut ini.

b. Titik Potong dengan Waktu Minimum

Misalkan 𝑚 merepresentasikan sebuah pesawat yang diharapkan berpotongan


dengan target 𝑃 dalam waktu yang minimum. 𝑃 memiliki posisi awal 𝑥1 dan

39
kecepatan konstan terhadap sumbu 𝑥 , yaitu 𝑉1 , sehingga persamaan posisi
pesawat terhadap sumbu 𝑥 pada saat 𝑡 adalah 𝑥1 + 𝑉1 𝑡 . Sedangkan posisi
terhadap sumbu 𝑦 bernilai konstan.

Karena objektif permasalahan ini adalah meminimalkan waktu, maka diharapkan


bahwa kontrol optimal dapat meminimalkan

𝑇
𝐽=𝑇= 0
1 𝑑𝑡 (3.5.19)

dan karena 𝐿 = 1, maka Hamiltonian menjadi

𝐻 𝑡 = 1 + 𝜆𝑥 𝑢 + 𝜆𝑦 𝑣 + 𝜆𝑢 𝑎 cos 𝛾 + 𝜆𝑣 𝑎 sin 𝛾 (3.5.20)

Bagaimanapun, karena nilai 𝐿 konstan, hasil yang diperolah pada bagian a tetap
valid.

Jika 𝑚 mulai bergerak saat 𝑡0 = 0 dan dimulai dari titik awal, kondisi awal dari
𝑚 adalah

𝑥 0 = 0, 𝑦 0 = 0, 𝑢 0 = 0, 𝑣 0 =0 (3.5.21)

Fungsi untuk final state adalah

𝑥 𝑇 − (𝑥1 + 𝑉1 𝑇)
𝜓 𝑋 𝑇 ,𝑇 = =0 (3.5.22)
𝑦 𝑇 −ℎ

sehingga

𝑥 𝑇 = 𝑥1 + 𝑉1 𝑇 (3.5.23)

𝑦 𝑇 =ℎ (3.5.24)

Untuk mencari kondisi akhir yang tersisa diperlukan untuk menggunakan syarat
kondisi batas pada tabel keoptimalan.

40
State akhir dan waktu akhir keduanya bernilai bebas. Oleh karena itu 𝑑𝑥 𝑇 ≠ 0
dan 𝑑𝑇 ≠ 0 . Bagaimanapun, dalam permasalahan ini 𝑑𝑥 𝑇 dan 𝑑𝑇 saling
independen sehingga syarat kondisi batas pada tabel keoptimalan menghasilkan
dua kondisi batas yang terpisah yaitu

(𝜙𝑋 + 𝜓𝑋𝑇 𝑣 − 𝜆) 𝑇 =0 (3.5.25)

(𝜙𝑡 + 𝜓𝑡𝑇 𝑣 + 𝐻) 𝑇 =0 (3.5.26)

dimana 𝑣 = 𝑣𝑥 𝑣𝑦 𝑇
adalah faktor pengali Lagrange yang baru.

Dengan memperhitungkan (3.5.22) dan memperhatikan bahwa 𝜙 𝑥 𝑇 , 𝑇 = 0,


maka persamaan (3.5.25) menjadi

1 0
𝜆 𝑇 = 0 1 𝑣𝑥
0 0 𝑣𝑦
0 0

atau

𝜆𝑥 𝑇 = 𝑣𝑥 (3.5.27)

𝜆𝑦 𝑇 = 𝑣𝑦 (3.5.28)

𝜆𝑢 𝑇 = 0 (3.5.29)

𝜆𝑣 𝑇 = 0 (3.5.30)

Perlu diperhatikan bahwa komponen-komponen dari 𝜆 𝑇 yang berkorespondensi


dengan komponen final state yang tetap, yaitu 𝑥(𝑇) dan 𝑦(𝑇), adalah variabel-
variabel yang belum diketahui, sedangkan komponen-komponen dari 𝜆 𝑇 yang
berkorespondensi dengan komponen final state yang bebas, yaitu 𝑢(𝑇) dan 𝑣(𝑇),
memiliki nilai tetap pada 0.

41
Dengan menggunakan kondisi (3.5.20) dan (3.5.22), kondisi akhir (3.5.26)
menjadi

𝑣𝑥
𝐻 𝑇 = −𝜓𝑡𝑇 𝑣 𝑇 = − −𝑉1 0 𝑣
𝑦

atau dengan menggunakan (3.5.27) – (3.5.30)

1 + 𝑣𝑥 𝑢 𝑇 + 𝑣𝑦 𝑣 𝑇 = 𝑉1 𝑣𝑥 (3.5.31)

Kemudian persamaan state (3.5.1) – (3.5.4) akan diselesaikan dengan


memperhitungkan (3.5.18) dan solusi costate (3.5.14) – (3.5.17) serta kondisi
batas (3.5.21), (3.5.23), (3.5.24), (3.5.27) – (3.5.30). Kondisi (3.5.31) juga
diperlukan untuk menyelesaikan waktu akhir optimal 𝑇 ∗ yang belum diketahui.

Dari persamaan (3.5.27) – (3.5.30) solusi costate adalah

𝜆𝑥 𝑡 = 𝑣𝑥 (3.5.32)

𝜆𝑦 𝑡 = 𝑣𝑦 (3.5.33)

𝜆𝑢 𝑡 = (𝑇 − 𝑡)𝑣𝑥 (3.5.34)

𝜆𝑣 𝑡 = (𝑇 − 𝑡)𝑣𝑦 (3.5.35)

Dimana faktor pengali terakhir 𝑣𝑥 , 𝑣𝑦 perlu ditentukan. Dengan demikian, hukum


tangent bilinear (3.5.18) dapat dibuat dalam bentuk yang lebih sederhana

𝑣𝑦
tan 𝛾 = (3.5.36)
𝑣𝑥

Untuk permasalahan titik potong dengan waktu minimum ini, sudut gaya dorong
yang optimal bernilai konstan.

42
Untuk mencari kontrol optimal atas sudut gaya dorong 𝛾 ∗ (𝑡), yang tersisa adalah
untuk mencari 𝑣𝑥 dan 𝑣𝑦 .

Karena 𝛾 bernilai konstan, sangat mudah untuk melakukan proses integrasi secara
maju dari 𝑡0 = 0 hingga diperoleh

𝑣 𝑡 = 𝑎𝑡 sin 𝛾 (3.5.37)

𝑢 𝑡 = 𝑎𝑡 cos 𝛾 (3.5.38)

𝑎𝑡 2
𝑦 𝑡 = sin 𝛾 (3.5.39)
2

𝑎𝑡 2
𝑥 𝑡 = cos 𝛾 (3.5.40)
2

dimana kondisi awal (3.5.21) telah dimasukkan dalam perhitungan.

Dengan menyelesaikan persamaan (3.5.39) dan (3.5.40) pada saat 𝑡 = 𝑇

𝑦 𝑇
tan 𝛾 = (3.5.41)
𝑥 𝑇

dan kondisi akhir (3.5.23) dan (3.5.24) kemudian memberikan persamaan untuk
kontrol dalam kondisi akhir :


tan 𝛾 = (3.5.42)
𝑥1 + 𝑉1 𝑇

Bagaimanapun, masih perlu ditentukan waktu akhir yang optimal 𝑇 ∗ untuk


digunakan dalam (3.5.42). Peran dari persamaan (3.5.31) adalah untuk
menyelesaikan 𝑇 ∗ , namun untuk menggunakannya dibutuhkan untuk mencari 𝑣𝑥

43
dan 𝑣𝑦 . Khusus dalam permasalahan ini dapat digunakan cara singkat dimana 𝑣𝑥 ,
𝑣𝑦 tidak diperlukan.

Dapat diperhatikan bahwa (3.5.39), (3.5.40), (3.5.23), dan (3.5.24) menghasilkan

2𝑦(𝑇) 2ℎ
sin 𝛾 = 2
= (3.5.43)
𝑎𝑇 𝑎𝑇 2

2𝑥 𝑇 2 𝑥1 + 𝑉1 𝑇
cos 𝛾 = 2
= (3.5.44)
𝑎𝑇 𝑎𝑇 2

Kemudian, sin2 𝛾 + cos2 𝛾 = 1, atau

4ℎ2 + 4(𝑥1 + 𝑉1 𝑇)2 = 𝑎2 𝑇 4 (3.5.45)

yang mana

𝑎2 𝑇 4
− + 𝑉12 𝑇 2 + 2𝑉1 𝑥1 𝑇 + 𝑥12 + ℎ2 = 0 (3.5.46)
4

Persamaan kuadrat ini dapat diselesaikan untuk 𝑇 ∗ dengan kondisi awal di sekitar
target 𝑥1 , 𝑉1 , ℎ diberikan. Hanya ada satu solusi untuk persamaan (3.5.46) yang
masuk akal secara fisis.

Kontrol optimal ditentukan dengan menyelesaikan persamaan (3.5.46) untuk 𝑇 ∗


dan kemudian menyelesaikan persamaan (3.5.42) untuk sudut gaya dorong
optimal 𝛾 ∗ .

Gambar di bawah ini merepreentasikan bahwa sisi miring dari segitiga


digambarkan dalam persamaan gerak target, sebagai

𝑑 2 = ℎ2 + (𝑥1 + 𝑉1 𝑇 ∗ )2 (3.5.47)

atau dalam persamaan gerak pesawat pengejar sebagai

44
2
1
𝑑2 = 𝑎 𝑇∗ 2
(3.5.48)
2

Gambar 3.5.2 Kontrol Input bagi Permasalahan Titik Potong dengan Waktu Minimum

Persamaan (3.5.45) hanyalah sebuah persamaan yang harus dipenuhi agar kedua
pesawat berada pada titik yang sama pada waktu akhir.

Tanpa melalui penurunan yang detail dari (3.5.45) maka tidak dapat disimpulkan
dari gambar apakah solusinya merupakan waktu akhir yang optimal.

45
3.6. Solusi Numerik Sistem Hamiltonian untuk Hukum Newton

Misalkan model pertumbuhan yang mengikuti Hukum Newton, dimana

𝑦=𝑣

𝑣=𝑢 (3.6.1)

dengan 𝑦 adalah vektor posisi, 𝑣 adalah vektor kecepatan, dan 𝑢 adalah input
percepatan. Vektor state adalah 𝑥 = [𝑦 𝑣]𝑇 . Kemudian pilih indeks performa :

𝑇
1
𝐽= 𝑢2 𝑡 𝑑𝑡 (3.6.2)
2 𝑡0

Model pertumbuhan akan dibawa mendekati final state 𝑥(𝑇) = [𝑦 𝑇 𝑣 𝑇 ]𝑇 tanpa


menggunakan terlalu banyak energi. Nilai sesungguhnya dari final state tidaklah
tetap, meskipun waktu akhir 𝑇 tetap.

Dalam 3.2. telah dibangun controller untuk model pertumbuhan ini, dan dalam 3.4.
telah dicari ekspresi analitik untuk controller feedback yang kontinu. Pada bagian ini
akan dicari kontrol optimal dengan menggunakan solusi numerik atas persamaan
state–costate.

Hamiltonian dan persamaan Euler sama seperti yang diberikan pada 3.4. yaitu

1 2
𝐻= 𝑢 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣
2

𝜕𝐻
𝜆𝑦 = − =0
𝜕𝑦

𝜕𝐻
𝜆𝑣 = − = −𝜆𝑦
𝜕𝑣

46
Kontrol optimal adalah

𝑢 = −𝜆𝑣 (𝑡) (3.6.3)

Dengan menggunakan kontrol optimal di atas dalam persamaan state, diperoleh


Hamiltonian dari sistem, yaitu

𝑦=𝑣

𝑣 = −𝜆𝑣

𝜆𝑦 = 0

𝜆𝑣 = −𝜆𝑦 (3.6.4)

Dengan menggunakan persamaan terakhir, diperoleh

𝜆𝑦 𝑡 = 𝑙

𝜆𝑣 𝑡 = exp −𝑡 𝑘

untuk suatu konstanta 𝑙 dan 𝑘.

Kondisi batas yang digunakan adalah

𝑦 0 = 𝑚 diberikan,

𝑣 0 = 𝑛 diberikan,

𝑦 𝑇 =0

𝑣 𝑇 =0 (3.6.5)

dengan 𝑚 dan 𝑛 merupakan tebakan untuk state awal, atau notasikan 𝑥 0 = [𝑚 𝑛]𝑇
sedangkan untuk state akhir, diinginkan agar 𝑥 𝑇 = [0 0]𝑇 .

47
Karena kondisi awal dari persamaan costate tidak diketahui, maka akan dibangun
suatu metode aproksimasi terhadap kondisi awal costate yang sesuai.

Misalkan 𝜙 = [𝑝 𝑞]𝑇 = [𝜆𝑦 0 𝜆𝑣 0 ]𝑇 adalah vektor tebakan untuk costate awal


untuk suatu 𝑝 ∈ 𝐑𝐧 , 𝑞 ∈ 𝐑𝐧 didapatkan

𝜆𝑦 𝑡 = 𝑝

𝜆𝑣 𝑡 = exp −𝑡 𝑞 (3.6.6)

Jika kita mengkhususkan perhatian pada final state 𝑣(𝑇) dengan 𝜆𝑣 0 = 𝑞 ,


diperoleh

𝑇
𝑣 𝑇; 𝑞 = − exp(−𝑡) 𝑑𝑡 𝑞
0

Tentu saja, lintasan dari 𝑥(𝑇) secara umum tidak berakhir pada 𝑥 𝑇 = [0 0]𝑇 .
Dengan kata lain, secara umum 𝑥(𝑇) ≠ 𝑥(𝑇).

Untuk menebak 𝜙 yang sesuai yang membuat 𝑥 dimulai tepat pada 𝑥 0 = [𝑚 𝑛]𝑇
dan berakhir di 𝑥 𝑇 = [0 0]𝑇 tidaklah mudah. Oleh karena itu, akan digunakan
algoritma berikut untuk menghampiri nilai 𝜙 yang sesuai. Algoritma tidak bertujuan
untuk mencari nilai 𝜙 yang presisi, namun diharapkan algoritma dapat menemukan 𝜙
yang meminimalkan fungsional berikut

2
𝐹 𝜙 = 𝑥 𝑇 − 𝑥(𝑇) (3.6.7)

dimana 𝑥(𝑇) adalah evaluasi atas 𝑥 saat 𝑇 dan (𝑥, 𝜙) adalah solusi atas sistem

persamaan diferensial (3.6.4) dengan kondisi awal 𝑥 0 , 𝜙 0 = 𝑥 0 ,𝜙 0 .

Fungsional 𝐹 akan diminimalkan dengan menggunakan metode Steepest Descent.


Program yang digunakan adalah MATLAB. Kemudian akan diperoleh lintasan state

48
dan costate 𝜆𝑦 (𝑡) dan 𝜆𝑣 (𝑡) , sehingga kontrol input dapat ditentukan dengan
menggunakan persamaan (3.6.3).

Algoritma untuk metode Steepest Descent dapat dideskripsikan sebagai berikut.


Pertama, pilih sebarang bilangan positif 𝜖 dan 𝛼, serta sebarang vektor

𝜙 0 = [𝑝 𝑞]𝑇
Dengan menggunakan nilai-nilai ini dan kondisi awal 𝑥 0 = [𝑚 𝑛]𝑇 permasalahan
nilai awal berikut dapat diselesaikan

𝑦=𝑣

𝑣 = −𝜆𝑣

𝜆𝑦 = 0

𝜆𝑣 = −𝜆𝑦

dimana (𝑥 0 , 𝜙 0 ) = (𝑥 0 , 𝜙 0 ). Kemudian, dapat dihitung final state 𝑥(𝑇) untuk


𝜙 0 tersebut. Lebih jauh lagi, dengan menggunakan nilai 𝑥(𝑇) ini, nilai skalar dari
𝐹(𝜙 0 ) dapat dihitung dengan persamaan (3.6.7). Berikutnya, akan dicari nilai 𝜙1
yang baru yang akan membuat nilai 𝐹(𝜙1 ) < 𝐹(𝜙 0 ).

Turunan parsial dari 𝐹 terhadap masing-masing 𝜆𝑦 dan 𝜆𝑣 di 𝜙 0 diaproksimasi


dengan

𝜕𝐹 𝐹 𝜙 0 + 𝜖(1,0) − 𝐹(𝜙 0 )
𝜙0 ≈ 𝐷1 ≈
𝜕𝜆𝑦 𝜖

𝜕𝐹 𝐹 𝜙 0 + 𝜖(0,1) − 𝐹(𝜙 0 )
𝜙0 ≈ 𝐷2 ≈
𝜕𝜆𝑣 𝜖

Sehingga, gradient dari 𝐹 di 𝜙 0 diaproksimasi dengan

49
𝜕𝐹 𝜕𝐹
∇𝐹 𝜙 0 = 𝜙0 , 𝜙0 ≈ (𝐷1 , 𝐷2 )
𝜕𝜆𝑦 𝜕𝜆𝑣

Berikutnya, bentuk

𝐸1 = 𝐹 𝜙 0 − α 𝐷1 , 𝐷2

α
𝐸2 = 𝐹 𝜙 0 − 𝐷 ,𝐷
2 1 2

Jika 𝐸1 < 𝐸2 , maka 𝜙1 = 𝜙 0 − 𝛼 𝐷1 , 𝐷2 . Dan jika sebaliknya, maka 𝜙1 = 𝜙 0 −


𝛼 𝜖 𝛼
𝐷1 , 𝐷2 dan ubah nilai 𝜖 dengan serta nilai 𝛼 dengan 2 . Kemudian lanjutkan
2 2

dengan mengulangi proses di atas menggunakan nilai 𝜙1 untuk variabel 𝜙 0 , sehingga


dapat diperoleh nilai 𝜙 2 . Jika proses iterasi ini terus dilanjutkan, maka akan

dihasilkan barisan vektor 𝜙 𝑚 𝑚 =0
.

50
********************************************************************

% program input Hamiltonian

function dy = hamiltonian(t,y)

dy = zeros(4,1);
% a column vector
dy(1) = y(2) ; % y dot
dy(2) = -y(4) ; % v dot
dy(3) = 0; % lambda y dot
dy(4) = -y(3); % lambda v dot
end

********************************************************************

% program utama

clear all;
clc;

toleransi = 0.001; %besar galat


epsilon1 = 0.001; %nilai awal untuk epsilon
epsilon2 = epsilon1/2;
alpha1 = 0.001; %nilai awal untuk alpha
alpha2 = alpha1/2;

tmin = 0; %waktu awal (t0)


tmax = 10; %waktu akhir (tf)
time = [tmin tmax];

% Syarat awal untuk state dan costate


a = 1; % syarat awal y

51
b = 1; % syarat awal v

L10 = 2; % tebakan awal costate lambda v


L20 = 2; % tebakan awal costate lambda y

ic = [a b L10 L20];

options = odeset('RelTol', 1e-10);


[T,Y] = ode45(@hamiltonian, time, ic, options);

ujung = length(T);

F(1) = (Y(ujung,1))^2+(Y(ujung,2))^2; %syarat akhir state (0,0,0)


i=1;
alpha = alpha1;
epsilon = epsilon1;
while F(i) > toleransi
L10_lama = L10(i);
L20_lama = L20(i);

% Initial condition partial


L10partial = L10_lama + epsilon;
ic = [a b L10partial L20_lama];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL1 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;

% Initial condition partial


L20partial = L20_lama + epsilon;
ic = [a b L10_lama L20partial];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL2 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;

52
normF = sqrt(partialL1^2 + partialL2^2);

% Initial condition
L10_baru = L10_lama - alpha * partialL1 / normF;
L20_baru = L20_lama - alpha * partialL2 / normF;

ic = [a b L10_baru L20_baru];

[T,Y] = ode45(@hamiltonian, time, ic, options);


ujung = length(T);
i=i+1;
F(i)= (Y(ujung,1))^2+(Y(ujung,2))^2;
if F(i)>=F(i-1)
alpha = alpha2;
epsilon = epsilon2;
else
alpha = alpha1;
epsilon = epsilon2;
end
L10 = [L10; L10_baru];
L20 = [L20; L20_baru];

end
figure(1)
plot(T, Y(:,1))
xlabel('t (s)')
ylabel('y (m)')
axis([0 10 0 10])
figure(2)
plot(T,Y(:,2))
xlabel('t (s)')
ylabel('v (m/s)')

53
figure (3)
plot(T,Y(:,1:2))
xlabel('t (s)')
ylabel('y (m) dan v (m/s)')
% Transpose
F = F.';
Hasil =[F L10 L20];

*********************************************************

54
Dengan menjalankan program di atas, diperoleh hasil plot lintasan state yang optimal
sebagai berikut

Gambar 3.6.1 Plot Lintasan 𝑦 ∗ terhadap t

Gambar 3.6.2 Plot Lintasan 𝑣 ∗ terhadap t

55
Gambar 3.6.3 Plot Lintasan 𝑦 ∗ dan 𝑣 ∗ terhadap t

Nilai costate yang optimal adalah

𝜆𝑦 𝑡 = 0.0738

𝜆𝑣 𝑡 = 0.4662 − 0.0738𝑡

Sehingga diperoleh kontrol input


𝑢∗ 𝑡 = −0.4662 + 0.0738𝑡

56
BAB 4

KESIMPULAN

Dalam tugas akhir ini, beberapa konsep dasar dari kalkulus variasi telah dipaparkan
dan kondisi keoptimalan telah diturunkan dengan menggunakan Pontryagin
Maximum Principle. Variasi pertama dari indeks performa telah dicari, dan nilai dari
setiap increment bebas pada saat nol adalah syarat perlu bagi persamaan state dan
costate untuk mencapai keoptimalan. Tabel 1 merangkum syarat perlu bagi kondisi
keoptimalan tersebut.

Beberapa contoh permasalahan sistemn kontinu nonlinear yang diselesaikan dengan


menggunakan kontrol optimal telah diselesaikan dengan cara mencari solusi analitik
dan solusi numerik. Pendekatan solusi numerik yang digunakan adalah metode
Steepest Descent.

57
DAFTAR PUSTAKA

1. Athans, M and P. Falb, Optimal Control, New York : McGraw-Hill, 1966


2. Bryson, A. E. and Ho, Y-C., Applied Optimal Control, Blaisdell Publishing
Company, Waltham, 1969
3. Kirk, D., Optimal Control Theory : An Introduction, Prentice Hall, 1970
4. Lewis, F. L., Optimal Control, New York : Wiley, 1995
5. Tjahjana, H., Pranoto, I., Muhammad, H., Naiborhu, J., On The Optimal
Control Computation of Linear Systems, J. Indonesian Math. Society Vol. 15,
No. 1 (2009), pp. 13 – 20
6. Tomlin, C. J., Lecture Notes 8 : Optimal Control and Dynamic Games, (2005)

58