Anda di halaman 1dari 42

OUTLINE

TEORI KONTROL LINEAR

Oleh:
Dr. Fatmawati, M.Si

Departemen Matematika
Fakultas Sains dan Teknologi
Universitas Airlangga
2012

Daftar Isi
1 Pendahuluan

1.1

Pengantar Teori Sistem Kontrol. . . . . . . . . . . . . . . . . . . . . . .

1.2

Masalah Kontrol Optimal. . . . . . . . . . . . . . . . . . . . . . . . . .

2 Ruang Keadaan dan Fungsi Transfer

2.1

Teori Kontrol Klasik dan Modern . . . . . . . . . . . . . . . . . . . . .

2.2

Representasi Ruang Keadaan . . . . . . . . . . . . . . . . . . . . . . .

2.3

Fungsi Transfer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.4

Turunan dan Integral Matriks . . . . . . . . . . . . . . . . . . . . . . .

2.5

Solusi Sistem Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Sifat-sifat Dasar Sistem


3.1

11

Keterkendalian dan Keterobservasian . . . . . . . . . . . . . . . . . . .

11

3.1.1

Keterkendalian . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

3.1.2

Keterobservasian . . . . . . . . . . . . . . . . . . . . . . . . . .

13

4 Kestabilan Sistem

15

5 Keterstabilan dan Keterdeteksian Sistem

17

5.1

Keterstabilan Sistem . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

5.2

Keterdeteksian Sistem . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

6 Optimasi Statis

19

6.1

Optimasi tanpa Constrains . . . . . . . . . . . . . . . . . . . . . . . . .

20

6.2

Optimasi dengan Constrains . . . . . . . . . . . . . . . . . . . . . . . .

21

7 Prinsip Pontryagin

24

7.1

Prinsip Pontryagin Minimum (Maksimum) . . . . . . . . . . . . . . . .

24

7.2

Ringkasan Prinsip Pontriyagin Minimum . . . . . . . . . . . . . . . . .

26

8 Kontrol optimal dengan Linear Quadratic Regulator (LQR)

27

8.1

Ongkos Optimal dengan Hukum Kontrol State-Feedback

. . . . . . . .

29

8.2

Ringkasan LQR Waktu Kontinu (Kasus State Akhir Free) . . . . . . .

30

8.3

Kontrol Lup-Terbuka (Kasus State Akhir Fixed ) . . . . . . . . . . . . .

31

8.4

Ringkasan LQR untuk kasus Lup-Terbuka (State Akhir Fixed ) . . . . .

33

8.5

Steady-State Feedback

34

. . . . . . . . . . . . . . . . . . . . . . . . . . .

9 Kontrol optimal untuk Tracking

36

Daftar Pustaka

39

Pendahuluan

1.1

Pengantar Teori Sistem Kontrol.

Beberapa terminologi dasar.


Sistem adalah kumpulan beberapa komponen yang saling berinteraksi untuk
suatu tujuan tertentu. Sebagai contoh misalkan sistem biologi, fisika dan
bisa juga sistem ekonomi.
Teori sistem merupakan bidang yang mempelajari fenomena input/output.
Sistem Kontrol merupakan bidang yang mengkaji pengaturan sistem sehingga berperilaku sesuai yang diinginkan dengan spesifikasi tertentu.
Obyek yang dikontrol/dikendalikan biasanya disebut plant.
Sistem kendali umpan balik (feedback ) adalah sistem kendali yang sinyal
keluarannya mempunyai pengaruh langsung pada aksi pengendalian.
Model Matematika
Prinsip pemodelan (melalui hukum Newton, Kirchoff, dsb)
Identifikasi sistem (melalui eksperimen)
Kombinasi prinsip pemodelan dan indentifikasi sistem untuk mendapatkan
model matematika.
Contoh Motivasi.

d(t): Jarak mobil dari O pada waktu t.


= (t) + (t),
d(t)
percepatan, : penambah kecepatan dan : rem
d:

x1 (t) := d(t): posisi dan x2 (t) := d(t):


kecepatan
1

u1 (t) := (t) dan u2 (t) := (t).


Persamaan state
x 1 (t)

= x2 (t)

x 2 (t) = u1 (t) + u2 (t).


Dalam notasi matriks

x(t)

dengan x(t) =

x1 (t)
x2 (t)

0 1
0 0

x(t) +

dan u(t) =

u1 (t)
u2 (t)

0 0
1 1

u(t)

(1)

Kendala Fisik.
Definisikan kendala atau constraint dari state x.
Diasumsikan mobil bergerak dari keadaan diam dan berhenti di titik e.
t0 : waktu pada saat meninggalkan O
tf : waktu pada saat tiba di e, sehingga diperoleh
x1 (t0 ) = 0 x1 (tf ) = e,
x2 (t0 ) = 0 x2 (tf ) = 0.
Dalam notasi matriks, syarat batas tersebut dapat ditulis sebagai


0
e
x(t0 ) = , x(tf ) = .
0
0

(2)

Syarat tambahan
0 x1 (t) e,

0 x2 (t).

(3)

Definisikan constraint dari input kontrol u.


Misalkan maksimum percepatan adalah M1 > 0 dan maksimum pelambatan
adalah M2 > 0, maka diperoleh
0 u1 (t) M1 ,
2

M2 u2 (t) 0.

(4)

Sebagai tambahan, misalkan mobil bergerak dengan G liter bensin, maka constraint lainnya adalah

tf

[k1 u1 (t) + k2 x2 (t)]dt G

(5)

t0

Ilustrasi konsep kontrol u yang diperkenankan (admissible).

Kriteria Performansi.
Untuk mengevaluasi performansi (kinerja) sistem, para desainer/perancang (designer ) memilih ukuran performasi.
Kontrol optimal didefinisikan sebagai salah satu alat untuk meminimumkan (memaksimumkan) ukuran performansi.
Misalkan performansi dari sistem dievaluasi berdasarkan ukuran dengan bentuk
sebagai berikut
Z

tf

J = h(x(tf ), tf ) +

g(x(t), u(t), t)dt,

(6)

t0

dengan t0 dan tf masing-masing adalah waktu awal dan akhir, h dan g adalah
fungsi skalar.
tf mungkin sudah ditentukan atau bisa juga bebas, tergantung pada permasalahan yang dibicarakan.
3

1.2

Masalah Kontrol Optimal.

Menentukan kontrol yang diperkenankan u yang menyebabkan sistem


x(t)

= g(x(t), u(t), t)
mengikuti trayektori yang diperkenankan x , yang meminimumkan ukuran performansi
Z

tf

g(x(t), u(t), t)dt.

J = h(x(tf ), tf ) +
t0

u disebut kontrol optimal dan x disebut trayektori optimal.

(7)

Ruang Keadaan dan Fungsi Transfer

2.1

Teori Kontrol Klasik dan Modern

.
Teori kontrol klasik berdasarkan pada transformasi Laplace yang dinyatakan
dalam bentuk fungsi transfer (domain frekuensi ) dan hanya memuat single-input
dan single-output (SISO).
Teori kontrol modern dinyatakan dalam bentuk ruang keadaan (domain waktu)
sehingga dapat diaplikasikan pada sistem dengan multi-input dan multi-output
(MIMO), linear atau nonlinear, time-invariant atau time-varying.
Fungsi transfer pada sistem linear, time-invariant (SISO) didefinisikan sebagai
hasil bagi (rasio) antara tranformasi Laplace dari output terhadap transformasi
Laplace dari input, dengan asumsi nilai awal nol dan dinyatakan sebagai
G(s) =

Y (s)
,
U (s)

(8)

dengan Y (s) adalah transformasi Laplace output y(t) dan


U (s) adalah transformasi Laplace input u(t).

2.2

Representasi Ruang Keadaan

Setiap persamaan diferensial biasa (PDB) linear dengan koefisien konstan dapat
dinyatakan dalam bentuk ruang keadaan berikut
x(t)

= Ax(t) + Bu(t),

y(t) = Cx(t) + Du(t),

(9)

dengan x(t) disebut vektor keadaan, u(t) vektor input, y(t) vektor output, dengan
x(t) Rn , u(t) Rm , y(t) Rp dan A, B, C dan D adalah matriks-matriks yang
ukurannya bersesuaian.
Diberikan persamaan diferensial sebagai berikut
q n (t) + a1 q (n1) (t) + a2 q (n2) (t) + ... + an1 q(t)
+ an q(t) = u,

(10)

dan disumsikan bahwa nilai awal q(0), q(0),

..., q (n1) (0) diketahui.


Jika didefinisikan x1 = q, x2 = q,
..., xn = q (n1) , maka kita dapat menuliskan
pers. (9) sebagai sistem persamaan diferensial berorde 1, katakanlah
x 1

= x2

x 2
..
.

= x3

x (n1)

= xn

x n = an x1 + a(n1) x2 ... a1 xn + u,
sehingga dapat ditulis dalam bentuk persamaan diferensial matriks

x 1

x 2

..

x (n1)

x n

x1

0 x2

..

1 x(n1)

xn
a1

0
..
.

0
..
.

..
.

an an1 a2

u.

1
0
..
.

Jika output sistem didefinisikan sebagai y = x1 , maka dapat dinyatakan sebagai bentuk
matriks berikut

y=

1 0 0 0 0

x1
x2
..
.
xn

Dari uraian di atas terlihat bahwa bentuk PDB (10) dapat dikonversi menjadi bentuk
sistem (9).

2.3

Fungsi Transfer

Transformasi Laplace
Transformasi Laplace dari fungsi kontinu f (t), dinotasikan dengan L[f (t)], didefinisikan sebagai
Z
L[f (t)] = F (s) =
0

f (t)est dt,

(11)

dengan s = + i, dan , adalah bilangan real.


Transformasi Laplace dari fungsi f (t) eksis jika
Z R
lim
f (t)est dt,
R

(12)

eksis untuk Re(s) > k yakni


lim |f (t)|ekt = 0.

(13)

Dari (11), f (t) disebut invers transformasi Laplace dari F (s), ditulis sebagai
L1 [F (s)] = f (t).
Transformasi Laplace bersifat linear yakni untuk konstanta , berlaku
L[f1 (t) + f2 (t)] = F1 (s) + F2 (s).
Fungsi Transfer
Diberikan sistem linear waktu kontinu, time-invariant berikut ini
x(t)

= Ax(t) + Bu(t),
y(t)

x1 (t)

x(0) = 0,

= Cx(t) + Du(t).

x2 (t)

Misalkan x(t) = .
.
..

xn (t)

L[x1 (t)]

L[x2 (t)]
Definisikan L[x(t)] =

..

L[xn (t)]

X (s)
1

X2 (s)
=

..

.

Xn (s)

Dengan definisi
tersebut,

maka

L[x 1 (t)]
sX1 (s) x1 (0)


L[x 2 (t)] sX2 (s) x2 (0)

=
L[x(t)]

=

..
..


.
.


L[x n (t)]
sXn (s) xn (0)
7

= X(s)

= sX(s) x(0).

(14)
(15)

Fungsi transfer dari u ke y untuk sistem (14)-(15) didefinisikan sebagai


Y (s) = G(s)U (s),
dengan U (s) dan Y (s) masing-masing adalah transformasi Laplace dari u(t) dan
y(t) dengan syarat awal x(0) = 0. Dari definisi tersebut dapat diperoleh
G(s) = C(sI A)1 B + D.
Jika (14)-(15) berupa sistem MIMO, maka G(s) disebut pula sebagai matriks
transfer.
Beberapa pengertian dasar:
Sistem G(s) disebut stricly proper jika G(s) 0 untuk s .
Sistem G(s) disebut semi-proper atau bi-proper jika G(s) D 6= 0 untuk
s .
Sistem G(s) yang stricly proper atau semi-proper disebut proper.
Sistem G(s) disebut improper jika G(s) untuk s .

2.4

Turunan dan Integral Matriks

Pada bagian ini akan diuraikan pengertian turunan dan integral pada matriks seprti
yang tertuang pada definisi berikut ini.
Definisi 1 Misalkan A(t) = [aij (t)], maka

d
A(t)
dt

=
= A(t)

A(t) =

R

d


(a
(t))
dan
ij
dt


aij (t)dt .

Contoh.

A(t) =

=
A(t)

6
2t

2 cos 2t
0

6t

sin 2t

t +2

maka,

, dan

A(t) =

dengan C adalah matriks konstan.


8

3t
1 3
t
3

+ 2t

12

cos 2t
3t

+ C,

Berdasarkan definisi tersebut, sifat-sifat turunan dan integral kalkulus juga dapat
diaplikasikan pada matriks.
Jika dan adalah konstanta dan diberikan matriks A(t) dan B(t). Maka,
i.

d
dt

+ B(t).

(A(t) + B(t)) = A(t)

ii.

Rb

(A(t) + B(t)) dt =

iii.

d
(A(t)B(t)
dt

Rb
a

A(t)dt +

Rb
a

B(t)dt.

= A(t)B(t)
+ A(t)B(t).

Eksponensial Matriks.
Berikut ini akan diberikan pengertian eksponsial matriks dan sifat-sifatnya.
Definisi 2 Misalkan A adalah matriks persegi berukuran n n, maka
eAt =

X
(At)n
n=0

n!

= I + At +

1 22 1 33
A t + A t + ...
2!
3!

dengan I = A0 .
Berdasarkan Definisi 2, beberapa sifat ekponensial dapat diterapkan pada eksponensial
matriks, antara lain:
i. eA(t+s) = eAt eAs .
ii. (eAt )1 = eAt
iii.

d
dt


eAt = AeAt = eAt A.

iv. Jika P matriks invertible, maka P eAt P 1 = eP AP

1 t

v. Jika A adalah matriks yang dapat didiagonalkan sehingga A = P DP 1 , maka


eAt = P eDt P 1

2.5

Solusi Sistem Linear

Pada bagian ini akan diuraikan solusi dari sistem persamaan (9). Persamaan tersebut
merupakan gabungan antara persamaan diferensial dan persamaan aljabar. Pandang
kembali sistem persamaan diferensial berikut
x(t)

= Ax(t) + Bu(t),
9

x(0) = x0 .

(16)

Solusi dari sistem (16) adalah


At

x(t) = e x0 +

e(t ) Bu( )d, t 0.

(17)

Langkah pembuktian (Metode langsung).


Kita dapat menuliskan persamaan (16) dalam bentuk
x(t)
Ax(t) = Bu(t)
Kalikan kedua ruas dengan matriks eAt , sehingga diperoleh
eAt (x(t)
Ax(t)) = eAt Bu(t), atau

d  At
e x(t) = eAt Bu(t).
dt
Dari sini, kita dapat mengintegralkan kedua ruas, sehingga didapat
Z t
At
e x(t) x(0) =
eA Bu( )d, sehingga
0
Z t
At
x(t) = e x0 +
eA(t ) Bu( )d.

(18)

Dengan demikian output y(t) pada persamaan (9) dapat dinyatakan sebagai


Z t
(ts)
At
e
Bu(s)ds + Du.
(19)
y(t) = C e x0 +
0

Matriks eksponensial eAt pada solusi (17) merupakan matriks transisi dari sistem
x(t)

= Ax(t), yang biasanya dinotasikan dengan


(t) = eAt .
Dengan notasi matriks transisi ini, persamaan (17) dapat pula dinyatakan sebagai
Z t
x(t) = (t)x0 +
(t )Bu( )d, t 0.
(20)
0

10

Sifat-sifat Dasar Sistem

3.1

Keterkendalian dan Keterobservasian

Konsep keterkendalian dan keterobservasian diperkenalkan oleh Kalman pada tahun


1960 sebagai dasar menuju teori kontrol modern. Pertanyaan fundamental untuk sistem
adalah sebagai berikut:
Dapatkah menentukan fungsi kontrol (kendali) u(t) yang akan mentransformasi
state awal x0 ke state final yang diinginkan xf untuk waktu berhingga?
Dapatkah menentukan state dari sistem dengan mengukur output sistem untuk
interval waktu yang berhingga?
Dua pertanyaan di atas berturut-turut akan mengarah pada sifat keterkendalian dan
keterobservasian sistem.
Perhatikan kembali sistem linear waktu kontinu (14)-(15) dengan x(t) Rn , u(t)
Rm dan y(t) Rp . Sedangkan A, B, C dan D adalah matriks-matriks konstan yang
ukurunnya bersesuaian.
Solusi dari sistem (14)-(15) dengan nilai awal x(0) = x0 akan ditulis sebagai x(t, x0 , u)
dan output yang bersesuaian dinyatakan dengan y(t, x0 , u) yakni
Rt
= eAt x0 + 0 eA(t ) Bu( )d
Rt
y(t, x0 , u) = CeAt x0 + 0 CeA(t ) Bu( )d + Du(t).

x(t, x0 , u)

(21)
(22)

Sistem (14)-(15) selanjutnya akan dinotasikan dengan sistem (A, B, C, D).

3.1.1

Keterkendalian

Pengertian keterkendalian sistem (A, B, C, D) diberikan pada definisi berikut.


Definisi 3 Sistem (A, B, C, D) dikatakan terkendali jika untuk setiap dua titik x0 dan
x1 dan t1 > 0, terdapat u(t) sedemikian sehingga berlaku x(t1 , x0 , u) = x1 .
Sifat-Sifat Keterkendalian
Keterkendalian sistem dapat diverifikasi melalui kriteria aljabar, seperti yang berikan
pada teorema berikut.
11

Teorema 1 Pernyataan berikut ekivalen


(i) Sistem (A, B, C, D) terkendali.
(ii) Matriks gramian keterkendalian
Z

Wc (t) =

eA BB eA d

definit positif untuk sebarang t > 0.


(iii) Matriks keterkendalian
C=

n1

B AB A B A

mempunyai rank baris penuh.


h
i
(iv) Matriks A I B mempunyai rank baris penuh untuk semua C.
(v) Misalkan dan x berturut-turut adalah nilai eigen dan vektor eigen dari A,
artinya x A = x , maka x B 6= 0.
Bukti. (i) (ii):
Misalkan Wc (t1 ) > 0 untuk suatu t1 > 0, dan definisikan input u( ) sebagai berikut
u( ) = B eA

(t )
1



Wc (t1 )1 eAt x0 x1 .

Substitusikan bentuk u tersebut ke solusi sistem (21), maka diperoleh x(t1 ) = x1 .


Karena x1 dipilih sebarang, maka terbukti pasangan (A, B) terkendali.
Selanjutnya akan ditunjukkan bahwa jika (A, B) terkendali, maka Wc (t) > 0 untuk
sebarang t > 0. Andaikan (A, B) terkendali tetapi Wc (t1 ) singular untuk suatu t1 > 0.

Karena eAt BB eA t 0 untuk semua t, maka terdapat vektor v 6= 0, dengan v Rn


sehingga berlaku

v eAt BB eA t v = 0,
Dari sini, diperoleh v eAt B = 0,

t [0, t1 ].

t [0, t1 ]. Kemudian, setting x(t1 ) = x1 = 0 dan

terapkan pada solusi (21), maka didapat


Z t1
At1
0 = e x(0) +
eA(t1 ) Bu( )d.

(23)

Kalikan (23) deari kiri dengan vektor v sehingga diperoleh 0 = v eAt1 x(0). Jika dipilih
nilai awal x(0) = eAt1 v, maka akan diperoleh v = 0 sehingga timbul kontradiksi.
Dengan demikian, terbukti bahwa Wc (t) > 0 untuk sebarang t > 0.
12

3.1.2

Keterobservasian

Selanjutnya akan diberikan pengertian keterobservasian sistem (A, B, C, D) seperti


yang tertuang pada definisi berikut.
Definisi 4 Sistem (A, B, C, D) dikatakan terobservasi jika untuk setiap u(t) terdapat
t1 > 0, sehingga untuk y(t, x0 , u) = y(t, x1 , u) mengakibatkan x0 = x1 .
Dengan kata lain, sistem (A, B, C, D) dikatakan terobservasi jika state x(0) dapat
dikonstruksi berdasarkan informasi dari u dan y pada interval [0, t1 ].
Berikutnya akan ditunjukkan bahwa keterobservasian sistem (A, B, C, D) hanya tergantung pada matriks A dan C, sehingga kadang-kadang disebut sebagai keterobservasian
dari pasangan (C, A).
Karakterisasi Keterobservasian
Seperti pada sifat keterkendalian sistem, sifat keterobservasian dapat dikarakterisasi
melalui kriteria aljabar sebagai berikut.
Teorema 2 Pernyataan berikut ekivalen
(i) Sistem (A, B, C, D) terobservasi.
(ii) Matriks gramian keterobservasian
Z t

Wo (t) =
eA C CeA d
0

definit positif untuk sebarang t > 0.


(iii) Matriks keterobservasian

CA

O = CA2

..

CAn1

mempunyai rank kolom penuh.


Bukti Teorema 2: Pada kasus ini akan ditunjukkan ekivalensi (i) dan (iii).
(i) (iii): Misalkan O mempunyai rank kolom penuh, sehingga rank(O) = n. Diambil
13

sebarang t1 > 0 dan input u sehingga berlaku y(t, x0 , u) = y(t, x1 , u) untuk semua
t [0, t1 ]. Karena y(t, x0 , u) = y(t, x1 , u), maka berakibat
Z t
Z t
A(t )
At
At
CeA(t ) Bu( )d + Du(t).
Ce
Bu( )d + Du(t) = Ce x1 +
Ce x0 +
0

Dari sini diperoleh CeAt x0 = CeAt x1 atau CeAt (x0 x1 ) = 0 untuk semua t [0, t1 ].
Kemudian integralkan CeAt (x0 x1 ) = 0 terhadap t sebanyak (n 1) kali, sehingga
diperoleh
CeAt (x0 x1 )
CAeAt (x0 x1 )

t = 0 C(x0 x1 ) = 0

= 0,
= 0,

CAn1 eAt (x0 x1 ) = 0,

t = 0 CA(x0 x1 ) = 0
..
.
t = 0 CAn1 (x0 x1 ) = 0.

Dari sini, diperoleh O(x0 x1 ) = 0. Karena rank(O) = n, maka ker(O) = 0. Akibatnya x0 x1 = 0 atau x0 = x1 . (i) (iii)
Misalkan rank(O) < n. Diambil dua vektor yang berbeda x0 dan x1 sedemikian sehingga x0 x1 ker(O). Maka
C(x0 x1 ) = CA(x0 x1 ) = . . . CAn1 (x0 x1 ) = 0.
Berdasarkan Teorema Cayley-Hamilton, akan diperoleh CAk (x0 x1 ) = 0, k = 0, 1, . . ..
Akibatnya
CeAt (x0 x1 ) =

X
tk
k=0

k!

CAk (x0 x1 ) = 0

untuk semua t. Hal ini ekivalen dengan y(t, x0 , u) = y(t, x1 , u) untuk semua t. Dari
sini dapat disimpulkan bahwa sistem (A, B, C, D) tidak terobservasi. 
Catatan: Teorema Cayley-Hamilton diberikan dalam teorema berikut.
Teorema 3 Misalkan A Cnn dengan polinomial karakteristik diberikan oleh p() =
det(I A). Maka A memenuhi p(A) = 0.
Dari sini dapat dikatakan bahwa An dapat dinyatakan sebagai kombinasi linear dari
Aj , j = 0, 1, . . . , n 1.

14

Konsep Dualitas
Walaupun sifat-sifat keterkendalian dan keterobservasian sangat berbeda, tetapi kondisi rank matriks keterkendalian dan keterobservasian sangat mirip, seperti yang tertuang dalam teorema berikut.
Teorema 4 Pasangan (A, B) terkendali jika dan hanya jika pasangan (B T , AT ) terobservasi. Demikian pula, Pasangan (C, A) terobservasi jika dan hanya jika pasangan
(AT , C T ) terkendali.
h
i
Bukti: (A, B) terkendali rank B AB A2 B An1 B = n
h
iT
2
n1
rank B AB A B A B
=n

BT

T
T

B A

T
T 2
rank
=n
B (A )

..

B T (AT )( n 1)
(B T , AT ) terobservasi.
Bagian kedua dapat dibuktikan secara similar. 
Berdasarkan teorema sebelumnya dapat disimpulkan bahwa sistem x(t)

= Ax(t) +
Bu(t) terkendali jika dan hanya jika sistem z(t)
= AT z(t), y(t) = B T z(t) terobservasi.
Transpos dari matriks adalah contoh sederhana dari konsep dualitas.
catatan:
Ruang dual dari Rn adalah himpunan semua fungsi-fungsi linear : Rn R dan
untuk kasus ini isomorfis dengan himpunan vektor-vektor baris berdimensi n. Ruang
dual ini biasanya ditulis sebagai (Rn ) yang dapat diidentifikasi sebagai Rn itu sendiri.

Kestabilan Sistem

Konsep kestabilan memegang peranan penting pada sistem. Berikut ini akan disajikan
definisi titik setimbang (titik stasioner, titik tetap).
Definisi 5 Diberikan sistem autonomous
x = f (x),
15

(24)

dengan x Rn . Titik setimbang dari persamaan autonomous adalah titik x yang


memenuhi f (
x) = 0.
Catat: sistem persamaan diferensial autonomous artinya fungsi f tidak memuat t
secara eksplisit.
Pengertian tentang kestabilan diberikan pada definisi berikut ini.
Definisi 6 Titik setimbang x dikatakan stabil jika diberikan > 0 terdapat > 0
sehingga untuk sebarang solusi x(t) dari (24) yang memenuhi k
x(t0 ) x(t0 )k <
maka k
x(t) x(t)k < untuk t > t0 .
Secara intuitif pengertian stabil adalah untuk kondisi awal yang diambil di sekitar
titik setimbang, maka solusi dari persamaan tersebut akan berada dipersekitaran
titik setimbang juga.
Pengertian stabil asimtotis diberikan pada definisi berikut
Definisi 7 Titik setimbang x dikatakan stabil asimtotis jika stabil dan jika terdapat konstanta b > 0 sehingga jika k
x(t0 )x(t0 )k < b maka limt k
x(t)x(t)k =
0.
Karakterisasi konsep kestabilan asimtotis diberikan pada Teorema berikut.
Teorema 5 Diberikan sistem persamaan diferensial linear x(t)

= Ax(t) dengan A
berukuran n n dengan nilai eigennya adalah i , i = 1, 2, ...n. Titik asal x = 0 stabil
asimtotis jika dan hanya jika Rei < 0.
Berikut ini akan disajikan karakterisasi kestabilan Lyapunov.
Teorema 6 Diberikan sistem persamaan diferensial linear x(t)

= Ax(t). Semua nilai


eigen dari matriks A mempunyai bagian real negatif jika dan hanya jika untuk setiap
matriks Q yang definit positif (Q > 0) terdapat matriks P > 0 sehingga memenuhi
A0 P + P A = Q.

16

(25)

Keterstabilan dan Keterdeteksian Sistem

5.1

Keterstabilan Sistem

Selain sifat kestabilan, pada sistem juga dikenal sifat keterstabilan. Hal ini biasanya
berkaitan dengan sistem yang tidak stabil, sehingga kita ingin mengubah perilaku
sistem yang tidak stabil tersebut menjadi sistem yang stabil.
Definisi 8 Sistem x(t)

= Ax(t) + Bu(t) dikatakan terstabilkan jika terdapat state


umpan balik u(t) = F x(t) sehingga A + BF stabil asimtotis, atau, nilai eigen dari
A + BF , Re() < 0.
Teorema berikut akan mendasari keterkaitan sifat keterkendalian dan keterstabilan
sistem.
Teorema 7 Sistem x(t)

= Ax(t) + Bu(t) dikatakan terkendali jika dan hanya jika


untuk setiap polinomial p() = n +pn1 n1 +. . .+p0 dengan koefisien real, sedemikian
sehingga terdapat matriks F yang menyebabkan det (I (A + BF )) = p().
Dari sini, jika (A, B) terkendali, maka polinomial karakteristik dari (A+BF ) dapat
dipilih sebarang sesuai dengan pemilihan F .
Dengan demikian, nilai eigen dari (A + BF ) dapat ditempatkan di sebarang lokasi.
Jika dipilih nilai eigen dari (A+BF ) sehingga Re() < 0, yaitu jika x(t)

= (A+BF )x
terkendali, maka sistem tersebut juga terstabilkan.
Teorema 7 dikenal juga sebagai Teori Penempatan Pole.

5.2

Keterdeteksian Sistem

Berikutnya akan diberikan pengertian keterdeteksian sistem yang merupakan sifat dual
dari keterstabilan sistem.
Definisi 9 Sistem x(t)

= Ax(t), y(t) = Cx(t) atau pasangan (C, A) dikatakan terdeteksi jika terdapat matriks L sehingga A + LC stabil asimtotis, atau, nilai eigen dari
A + LC, Re() < 0.

17

Konsep dualitas antara keterdeteksian dan keterstabilan dituangkan pada teorema


berikut ini.
Teorema 8 Pasangan (C, A) terdeteksi jika dan hanya jika pasangan (AT , C T ) terstabilkan.

18

Optimasi Statis
Misalkan x Cn adalah vektor, s C skalar dan f (x) Cm berupa fungsi vektor
dari x.
Diferensial terhadap x dan turunannya terhadap x berturut-turut adalah

dx1
dx1 /ds

dx2

dx
/ds
dx
2
,
.

dx =
=

..
..
ds

dxn
dxn /ds
Jika s adalah fungsi dari x, maka gradient dari s terhadap x berupa kolom vektor

s/x1

s/x2
s

.
sx =
=

..
x

s/xn
(Catatan: Beberapa referensi kadang dinyatakan dengan vektor baris.)
Diferensial total terhadap s dinyatakan sebagai
 T
n
X
s
s
ds =
dx =
dxi .
x
xi
i=1
Jika s adalah fungsi dari dua vektor x dan y, maka
 T
 T
s
s
ds =
dx +
dy.
x
y
Hessian dari s terhadap x adalah turunan kedua yaitu
 2 
s
2s
=
,
sxx =
x2
xi xj
yang tak lain berupa matriks simetri berukuran n n.
Ekspansi deret Taylor dalam bentuk gradient dan Hessian dari s(x) disekitar x0
adalah

s(x) = s(x0 ) +

s
x

T

1
2s
(x x0 ) + (x x0 )T 2 (x x0 ) + O(3),
2
x

dengan O(3) menyatakan sisa orde ke-3.


19

(26)

Jacobian dari f terhadap x adalah matriks berukuran m n


i
h
f
f
f
f
fx =
.
= x x . . . x
n
1
2
x

(27)

Diferensial total dari f adalah


n

X f
f
df =
dx =
dxi .
x
xi
i=1
Beberapa rumus turunan matriks yang sering digunakan adalah



xT y = y,
yTx
= x
x



xT AT y = AT y
y T Ax = x
x



y T f (x) = x
f T (x)y = fxT y,
x


xT Ax
= Ax + AT x,
x

(28)
(29)
(30)
(31)

Dan jika Q merupakan matriks simetri, maka berlaku

6.1

xT Qx
= 2Qx,
x

(x y)T Q(x y) = 2Q(x y).

(32)
(33)

Optimasi tanpa Constrains

Index performansi skalar L(u) diberikan sebagai fungsi dari kontrol atau vektor
keputusan u Rm . Tujuan kita adalah bagaimana memilih u sehingga L(u)
minimum.
Perhatikan ekspansi deret Taylor untuk increment (pertambahan) dalam L sebagai
1 T
dL = LT
u du + du Luu du + O(3),
2
dengan Lu =

L
u

adalah gradien L terhadap u dan Luu =

(34)
2L
u2

adalah matriks

Hessian.
Titik kritis (stasioner) dicapai ketika Lu = 0. Agar titik kritis bersifat minimum
lokal, maka
1
dL = duT Luu du + O(3)
2

positif untuk semua increment du.

Hal ini dicapai ketika Luu definit positif, yaitu Luu > 0.
20

(35)

Jika Luu definit negatif maka titik kritis Lu bersifat maksimum lokal.

6.2

Optimasi dengan Constrains

Sekarang pandang index performansi skalar L(x, u) sebagai fungsi dari vektor
kontrol u Rm dan vektor keadaan (state) x Rn . Permasalahannya adalah
bagaimana memilih u sehingga L(u) minimum dan memenuhi persamaan constraint
f (x, u) = 0,

(36)

dengan f adalah himpunan fungsi n persamaan skalar, sehingga f Rn .


Didefinisikan fungsi Hamiltonian
H(x, u, ) = L(x, u) + T f (x, u),

(37)

dengan Rn adalah pengali Lagrange.


Increment dari H tergantung pada increment dari x, u dan yakni
dH = HxT dx + HuT du + HT d.

(38)

Catat bahwa
H =

H
= f (x, u),

(39)

sehingga kita dapat memilih u dan mensyaratkan


H = 0.

(40)

Dari sini, x dapat ditentukan oleh u berdasarkan f (x, u) = 0, yang merupakan


syarat constraint. Dalam hal ini, Hamiltonian sama dengan indeks performansi
ketika
H|f =0 = L.

(41)

Hx = 0,

(42)

Pilih sehingga

21

sehingga diperoleh
H
= Lx + fxT = 0.
x

(43)

Jika (39) dan (42) terpenuhi, maka


dL = dH = HuT du,

(44)

karena dalam hal ini H = L.


Untuk mencapai titik stasioner, kita harus menentukan kondisi stasioner yaitu
Hu = 0.

(45)

Dengan demikian, syarat cukup titik minimum dari L(x, u) yang memenuhi constraint f (x, u) = 0 adalah
H

H
x
H
u

= f = 0,

(46)

= Lx + fxT = 0,

(47)

= Lu + fuT = 0,

(48)

dengan H(x, u, ) diberikan oleh (37).


Nilai sebenarnya merupakan variabel penghubung untuk menentukan nilai u, x
dan nilai minimum dari L.
Dengan mengenalkan pengali Lagrange, kita dapat mengganti persoalan meminimumkan L(x, u) dengan constraint f (x, u) = 0 menjadi persoalan meminimumkan Hamiltonian H(x, u, ) tanpa constraint.
Selanjutnya akan kita uji bahwa titik (46)-(48) adalah titik minimum. Tulis
ekspansi deret Taylor untuk increment L dan f sebagai berikut

 T T  dx


L
L
dx
xu
+ 1 dxT duT xx

+ O(3)
dL = Lx Lu
2
du
Lux Luu
du


 f
f
dx
dx
+ 1 dxT duT xx xu
+ O(3),
df = [fx fu ]
2
fux fuu
du
du
dengan fxu =

2f
,
ux

dst.
22

Untuk mengenalkan Hamiltonian, perhatikan persamaan berikut





dL
dx
H
H
dx
xu
= HxT HuT
+ 1 dxT duT xx

[1 T ]
2
df
du
Hux huu
du
+O(3).
Untuk mencapai titik stasioner kita memebutuhkan f = 0 dan juga orde pertama
dari dL sama dengan nol untuk semua increment dx, du. Karena f = 0, maka
df = 0, sehingga kondisi ini mengakibatkan Hx = 0 dan Hu = 0 sebagaimana
diberikan oleh (46)-(48).

23

Prinsip Pontryagin

7.1

Prinsip Pontryagin Minimum (Maksimum)

Prosedur untuk menyelesaikan masalah kontrol optimal dengan menggunakan Prinsip


Pontryagin Minimum adalah sebagai berikut:
Misalkan sistem yang akan dikontrol (plant) mempunyai model dinamik sebagai
berikut
x(t)

= f (x, u, t)

(49)

dengan state x(t) Rn dan input kontrol u(t) Rm .


Pada kasus ini dipilih Indeks Performansi
Z tf
J(t0 ) = (x(tf ), tf ) +
L(x(t), u(t), t)dt,

(50)

t0

dengan (x(tf ), tf ) adalah fungsi bobot akhir yang tergantung pada state akhir
x(tf ) dan waktu akhir tf . Sedangkan fungsi bobot L(x, u, t) tergantung pada
state dan input pada interval waktu [t0 , tf ].
Masalah optimal kontrol di sini adalah menentukan input kontrol u (t) pada
interval [t0 , tf ] sehingga akan membawa plant (49) sepanjang trayektori x (t)
sedemikian sehingga Indeks Performansi (50) minimum.
Input kontrol u(t) ini selanjutnya disebut Kontrol Optimal.
Kita akan menggunakan Pengali Lagrange untuk menggabungkan plant (49) dengan Indeks Performansi (50) ke dalam suatu fungsi skalar J 0 (t0 )
Z tf


0
J (t0 ) = (x(tf ), tf ) +
L(x(t), u(t), t) + T (t) (f (x, u, t) x)
dt.

(51)

t0

Karena persamaan (49) berlaku untuk setiap t [t0 , tf ], sehingga kita membutuhkan pengali Lagrange (t) Rn , yang merupakan fungsi terhadap waktu.
Jika didefinisikan Fungsi Hamiltonian sebagai berikut
H(x, u, t) = L(x(t), u(t), t) + T (t)f (x, u, t),
24

(52)

maka persamaan (51) dapat ditulis sebagai


Z tf


0
H(x, u, t) T (t)x dt.
J (t0 ) = (x(tf ), tf ) +

(53)

t0

Aturan Leibniz untuk fungsional menyatakan bahwa jika J(x(t)) =

R tf
t0

h(x(t), t)dt

adalah fungsional skalar


(J() dan h() adalah fungsi skalar), maka
Z

tf

dJ = h(x(tf ), tf )dtf h(x(t0 ), t0 )dt0 +


 T
hx (x(t), t)x dt,

(54)

t0

dengan
x(ta ) = dx(ta ) x(t
a )dta .

(55)

Dengan menggunakan aturan ini, maka total differensial dari fungsi J 0 (t0 ) pada
persamaan (53) adalah
T
T
T
dJ 0 (t0 ) = T

tf (H x)dt|
t0
x dx|tf + t dt|tf + (H x)dt|

Rt 
T dt.
+ t0f HxT x + HuT u T (t) x + (H x)

Perhatikan bahwa
Z tf
Z
T
T
T

(t) xdt
= x|tf + x|t0 +
t0

tf

T xdt.

(56)

(57)

t0

Jika persamaan (57) dan (55) disubstitusikan ke persamaan (56), maka diperoleh
dJ 0 (t0 ) = (x )T dx|tf + (t + H)dt|tf Hdt|t0 + T dx|t0
i
Rt h
T
T x + H T u + (H x)
+ t0f (Hx + )

dt.
u

(58)

Menurut Teori Lagrange, nilai minimum dari Indeks Performansi (50) dengan
kendala sistem (49) dicapai untuk nilai minimum dari fungsi tanpa kendala (51).
Fungsi (51) akan bernilai minimum apabila dJ 0 (t0 ) = 0.
Dengan membuat koefisien dari setiap differesial d() bernilai nol, maka kita
peroleh syarat cukup agar Indeks Performansi (51) bernilai minimum.

25

7.2

Ringkasan Prinsip Pontriyagin Minimum

Secara ringkas, langkah-langkah untuk menyelesaikan masalah kontrol optimal


dengan Prinsip Pontriyagin Minimum adalah sebagai berikut
1. Bentuk fungsi Hamiltonian
H(x(t), u(t), (t), t) = L(x(t), u(t), t) + T (t)f (x, u, t),

(59)

2. Minimumkan H terhadap u(t)


0=

L f T
H
=
+
.
u
u
u

(60)

sehingga diperoleh u (t)


3. Gunakan hasil dari Langkah 2 ke dalam Langkah 1, sehingga diperoleh H
optimal yang dinotasikan dengan H .
4. Selesaikan himpunan 2n persamaan diferensial berikut:
x(t)

H
= f (x, u, t),

t t0 .

(61)

yang merupakan Persamaan State dan

(t)
=

f T
L
H
=
+
,
x
x
x

t tf ,

(62)

merupakan Persamaan Costate.


Syarat awal x0 diberikan dan syarat akhir
(x )T |tf dx(tf ) + (t + H)|tf dtf = 0.

(63)

5. Subsititusikan solusi dari x(t) dan (t) dari Langkah 4 ke dalam ekspresi
kontrol optimal u (t) yang diperoleh dari Langkah 2.

26

Kontrol optimal dengan Linear Quadratic Regulator (LQR)


Secara umum, terdapat dua tujuan dari sistem kontrol, yaitu
1. Regulator system, yaitu pada sistem ini kontrol optimal bertujuan untuk
menstabilkan sistem, sehingga output dari sistem bernilai tetap atau stabil
2. Tracking, yaitu pada sistem ini kontrol optimal bertujuan untuk memaksa
output agar mengikuti trayektori yang diinginkan.
Salah satu Indeks Performansi yang banyak digunakan untuk menentukan optimal kontrol adalah bentuk kuadratik linear.
Misalkan diberikan sistem linear waktu kontinu yang berubah terhadap waktu
(time-varying) berikut
x(t)

= A(t)x(t) + B(t)u(t),

x(t0 ) diberikan,

(64)

y(t) = C(t)x(t).
yang bersesuaian dengan Indeks Performansi berikut
Z

1 T
1 tf  T
J(t0 ) = x (tf )S(tf )x(tf ) +
x Q(t)x + uT R(t)u dt,
2
2 t0

(65)

dengan S(tf ) dan Q(t) adalah matriks bobot yang bersifat simetri dan semidefinit
positif. Sedangkan R(t) adalah matriks simetri yang definit positif.
Kita akan menentukan hukum kontrol u(t) pada sistem (64) yang akan meminimumkan Indeks Performansi Kuadratik (65) dengan menggunakan persamaanpersamaan (61)-(63).
Bentuk fungsi Hamiltonian berikut
H(x, u, t) =


1 T
x Qx + uT Ru + T (t) (Ax + Bu) .
2

(66)

Persamaan state adalah


x =

H
= Ax + Bu.

27

(67)

Persamaan Costate
=

H
= Qx + AT .
x

(68)

Syarat Stasioner
0=

H
= Ru + B T .
u

(69)

Dari persamaan (69) diperoleh u sebagai fungsi costate, yaitu


u = R1 B T ,

(70)

Akibatnya persamaan state (67) menjadi


x = Ax BR1 B T .

(71)

Sementara itu, syarat batas x(t0 ) diberikan dan diasumsikan state final x(tf )
adalah bebas (free). Dengan demikian dx(tf ) 6= 0 dan dtf = 0, sehingga koefisien
dari dx(tf ) pada persamaan (63) haruslah nol yaitu
(tf ) =

|t = S(tf )x(tf ).
x f

(72)

Persamaan (72) merupakan syarat batas untuk menyelesaikan persamaan costate.


Untuk menentukan input kontrol optimal u(t) dari persamaan (70) kita harus
menentukan solusi dari persamaan costate (68) dengan syarat batas (72) dan
persamaan state (67) dengan syarat batas x(t0 ).
Untuk itu kita akan menggunakan metode Sweep untuk menentukan solusi keduanya. Diasumsikan bahwa state dan costate mempunyai hubungan seperti pada
(72) untuk semua t [t0 , tf ] yaitu
(t) = S(t)x(t).

(73)

+ S x = Sx
+ S(Ax BR1 B T Sx).
= Sx

(74)

Perhatikan bahwa

28

Substitusikan persamaan costate (68) ke persamaan (74), diperoleh


= (AT S + SA SBR1 B T S + Q)x.
Sx

(75)

Karena persamaan (75) dipenuhi untuk seluruh x(t) pada interval [t0 , tf ], maka
haruslah
S = AT S + SA SBR1 B T S + Q.

(76)

Persamaan (76) disebut persamaan Riccati.


Jika S adalah solusi dari persamaan Riccati (76), maka kontrol optimal dapat
dinyatakan sebagai
u(t) = R1 B T Sx(t).

(77)

Definisikan Gain Kalman sebagai


K(t) = R1 B T S(t),

(78)

sehingga diperoleh hukum kontrol state-feedback berikut


u(t) = K(t)x(t).

8.1

(79)

Ongkos Optimal dengan Hukum Kontrol State-Feedback

Selanjutnya akan ditentukan Indeks performansi (ongkos) optimal dengan menggunakan hukum kontrol state-feedback. Perhatikan bahwa
Z

1
1
1 tf d T
x (t)S(t)x(t) dt = xT (tf )S(tf )x(tf ) xT (t0 )S(t0 )x(t0 ).
2 t0 dt
2
2
Aplikasikan fungsi Ongkos (65) pada kesamaan (80), maka diperoleh
Z
1 T
1 tf T
J(t0 ) = x (t0 )S(t0 )x(t0 ) +
[x Q(t)x + uT R(t)u + x T S(t)x
2
2 t0

+xT S(t)x
+ xT S(t)x]dt.

(80)

(81)

Bentuk (81) dapat ditulis sebagai


1
1
J(t0 ) = xT (t0 )S(t0 )x(t0 ) +
2
2

tf



[xT S + Q + AT S + SA x

t0

+xT S(t)Bu + uT B T S(t)x + uT Ru]dt.


29

(82)

Karena S(t) memenuhi persamaan Riccati (76), maka diperoleh


= 12 xT (t0 )S(t0 )x(t0 )

J(t0 )
+ 12

(83)


R tf  T
x SBR1 B T Sx + xT S(t)Bu + uT B T S(t)x + uT Ru dt.
t0

Notasikan kvk2R = v T Rv sebagai norm-R dari vektor v (untuk R > 0), maka
bentuk (83) dapat ditulis sebagai
Z

1
1
J(t0 ) = xT (t0 )S(t0 )x(t0 ) +
2
2

tf

kR1 B T Sx + uk2R dt.

(84)

t0

Substitusikan hukum kontrol (77) pada (84), maka diperoleh nilai optimal sebagai
berikut
1
J(t0 ) = xT (t0 )S(t0 )x(t0 ).
2

8.2

(85)

Ringkasan LQR Waktu Kontinu (Kasus State Akhir Free)

Model sistem
x(t)

= A(t)x(t) + B(t)u(t),

t t0

Indeks Performansi
1
1
J(t0 ) = xT (tf )S(tf )x(tf ) +
2
2

tf


 T
x Q(t)x + uT R(t)u dt

t0

dengan asumsi
S(tf ) 0,

Q 0,

R > 0,

ketiganya simetri

Kontrol optimal feedback


S = AT S + SA SBR1 B T S + Q,
K = R1 B T S
u = Kx
1 T
J (t0 ) =
x (t0 )S(t0 )x(t0 )
2

30

t tf ,

S(tf ) diberikan

8.3

Kontrol Lup-Terbuka (Kasus State Akhir Fixed )

Diberikan sistem linear


x(t)

= Ax(t) + Bu(t),

t0 diberikan.

dan syarat akhir berupa nilai yang tetap yaitu x(tf ) = r(tf ).
Karena waktu akhir dan state akhir fixed, maka dtf = 0 dan dx(tf ) = 0.
Misalkan S(tf ) = 0 dan Q = 0, maka bentuk Indeks Performansi kuadratik (65)
dapat ditulis sebagai
1
J(t0 ) =
2

tf

uT R(t)udt.

(86)

t0

Dibentuk Hamiltonian
1
H(x, u, t) = uT Ru + T (t) (Ax + Bu) .
2

(87)

Persamaan state adalah


x =

H
= Ax + Bu.

(88)

Persamaan Costate
=

H
= AT .
x

(89)

Syarat Stasioner
0=

H
= Ru + B T .
u

(90)

Solusi dari (90) menghasilkan


u = R1 B T ,

(91)

Akibatnya persamaan state (88) menjadi


x = Ax BR1 B T .

31

(92)

Integralkan (89), sehingga diperoleh


= eA

T (t t)
f

(tf ),

(93)

dengan (tf ) belum diketahui. Substitusikan (93) terhadap (92) menghasilkan


x = Ax BR1 B T eA

T (t t)
f

(tf ),

(94)

Solusi dari sistem (94) adalah


A(tt0 )

x(t) = e

x(t0 )

eA(t ) BR1 B T eA

T (t )
f

(tf )d.

(95)

t0

Untuk menentukan nilai (tf ), evaluasi (95) pada saat tf , sehingga diperoleh
x(tf ) = eA(tf t0 ) x(t0 ) G(t0 , tf )(tf ),

(96)

dengan G(t0 , tf ) adalah Gramian keterkontrolan yaitu


Z tf
T
G(t0 , tf ) =
eA(tf ) BR1 B T eA (tf ) d.

(97)

t0

Sebelumnya telah diasumsikan bahwa x(tf ) = r(tf ), sehingga dari (96) didapat


(tf ) = G1 (t0 , tf ) r(tf ) eA(tf t0 ) x(t0 ) .

(98)

Selanjutnya, substitusikan (98) dan (93) pada hukum kontrol (91) sehingga diperoleh
u(t) = R1 B T eA

T (t t)
f



G1 (t0 , tf ) r(tf ) eA(tf t0 ) x(t0 ) .

(99)

Jika (A, B) terkontrol, maka terdapat kontrol energi-minimum yang menggerakkan state x(t0 ) ke r(tf ) yang diinginkan.
Kontrol seperti ini disebut Kontrol Lup-Terbuka (Open-loop control ), karena u(t)
tidak tergantung pada state x(t).
Perhatikan bahwa solusi dari persamaan Lyapunov berikut
P (t) = AP + P AT + BR1 B T ,

t > t0 ,

(100)

adalah
P (t) = e

A(tt0 )

P (t0 )e

AT (tt0 )

+
t0

32

eA(t ) BR1 B T eA

T (t )

d.

(101)

Dari sini, jika P (t0 ) = 0, maka G(t0 , t) = P (t).


Misalkan notasikan
d(t0 , tf ) = r(tf ) eA(tf t0 ) x(t0 ),
maka diperoleh fungsi ongkos minimum sebagai berikut
Z
1 tf T
T

J (t0 ) =
d (t0 , tf )G1 eA(tf t) BR1 RR1 B T eA (tf t) G1 d(t0 , tf )dt.
2 t0
Perhatikan bahwa d(t0 , tf ) dan G1 (t0 , tf ) tidak tergantung pada t, sehingga
didapat
1
J (t0 ) = dT (t0 , tf )G1 (t0 , tf )d(t0 , tf ),
2
atau
1
J (t0 ) = dT (t0 , tf )P 1 (tf )d(t0 , tf ),
2
dengan P (t) memenuhi persamaan Lyapunov (100).

8.4

Ringkasan LQR untuk kasus Lup-Terbuka (State Akhir


Fixed )

Model sistem
x(t)

= Ax(t) + Bu(t),

t t0 , x(t0 ) diberikan

Final state yang diinginkan


x(tf ) = r(tf ),

r(tf ) diberikan

Indeks Performansi
1
J(t0 ) =
2

tf

uT R(t)udt,

R>0

t0

Kontrol optimal Lup-Terbuka:


P = AP + P AT + BR1 B T ,
33

P (t0 ) = 0

Kontrol Lup-Terbuka
u(t) = R1 B T eA

T (t t)
f

P 1 (tf )d(t0 , tf ),

(102)

dengan d(t0 , tf ) = r(tf ) eA(tf t0 ) x(t0 )


Ongkos optimal adalah
1
J (t0 ) = dT (t0 , tf )P 1 (tf )d(t0 , tf ).
2

8.5

Steady-State Feedback

Misalkan diberikan plant (time-invariant) berikut


x(t)

= Ax(t) + Bu(t).
Pada bagian ini, Indeks Performansi yang diberikan berupa Infinite-time LQR
(infinite horizon) yaitu
1
J(t0 ) =
2


xT Qx + uT R(t)u dt,

dengan Q 0 dan R > 0.


Hukum kontrol seperti pada kasus kontrol Lup-Tertutup (State akhir free) masih
bisa diterapkan sehingga diperoleh kontrol optimal feedback sebagai berikut

S(t)
= 0 , sehingga diperoleh Persamaan Riccati berikut
0

= AT S + SA SBR1 B T S + Q,

= R1 B T S

= Kx

Persamaan Riccati ini


0 = AT S + SA SBR1 B T S + Q
disebut dengan Algebraic Riccati Equation (ARE)

34

(103)

Jika S adalah solusi dari ARE (103), maka optimal gain untuk kasus infinitehorizon berupa matriks konstan yaitu
K
u

= R1 B T S
= K x

J = 12 xT (0)S x(0).
Sedangkan plant dari lup-tertutup untuk kondisi ini (steady-state) mempunyai
bentuk dinamik sebagai berikut
x(t)

= (A BK )x(t) = Ac x,

(104)

dengan Ac = A BK .
Ada beberapa pertanyaan yang berkaitan dengan skema steady-state feedback
1. Kapan terdapat solusi limit terbatas S bagi persamaan Riccati untuk semua pemilihan fungsi bobot akhir S(tf )?
2. Secara umum, S tergantung pada S(tf ). Sedangkan untuk kasus steadystate, S(tf ) diabaikan. Jadi, pada saat kapan terdapat S yang tunggal
yang tidak tergantung pada pemilihan S(tf )?
3. Kapan plant lup-tertutup Ac bersifat stabil asimtotis?
Untuk menjawab ketiga pertanyaan di atas diperlukan teorema-teorem berikut
Teorema 9 Misalkan pasangan (A, B) terstabilkan. Maka untuk setiap S(tf )
terdapat solusi limit terbatas S untuk persamaan Riccati. Lebih lanjut, S
merupakan solusi yang bersifat semi-definit positif untuk persamaan Riccati Aljabar (ARE).
Teorema 10 Misalkan C sebarang matriks sehingga Q = C T C.
Misalkan pasangan (A, C) terobservasi. Maka pasangan (A, B) terstabilkan jika dan
hanya jika:

35

1. Terdapat dengan tunggal solusi limit S yang bersifat definit positif untuk persamaan Riccati. Lebih lanjut, S adalah solusi tunggal yang bersifat definit positif
untuk ARE (103).
2. Plant Lup-Tertutup (104) bersifat stabil asimtotis, dengan K = K diberikan
oleh K = R1 B T S .

Kontrol optimal untuk Tracking


Misalkan diberikan sistem linear waktu kontinu berikut
x(t)

= Ax(t) + Bu(t),
y(t)

x(t0 ) diberikan.

= Cx(t).

(105)
(106)

Untuk menjaga agar output (106) dengan trayektori r(t) Rs yang diinginkan,
maka dipilih Indeks Performansi Kuadratik berikut
1
2



(Cx(tf ) r(tf ))T P (Cx(tf ) r(tf )

Rt 
+ 21 t0f (Cx r)T Q(Cx r) + uT Ru dt,

J(t0 ) =

(107)

dengan P dan Q adalah matriks simetri yang semidefinit positif dan R adalah
matriks simetri yang definit positif.
Kita akan menentukan hukum kontrol u(t) pada sistem (105) yang akan meminimumkan Indeks Performansi Kuadratik (107) dengan menggunakan persamaanpersamaan (61)-(63).
Bentuk fungsi Hamiltonian berikut
H(x, u, t) =


1
(Cx r)T Q(Cx r) + uT Ru + T (t) (Ax + Bu) .
2

(108)

Persamaan state adalah


x =

H
= Ax + Bu.

(109)

Persamaan Costate
=

H
= AT + C T QCx C T Qr.
x
36

(110)

Syarat Stasioner
0=

H
= Ru + B T .
u

(111)

Dari persamaan (111) diperoleh u sebagai fungsi costate, yaitu


u = R1 B T ,

(112)

Akibatnya persamaan state (109) menjadi


x = Ax BR1 B T .

(113)

Sementara itu, syarat batas x(t0 ) diberikan dan agar syarat batas (63) dipenuhi,
maka haruslah berlaku hubungan berikut
(tf ) =

|t = C T P Cx(tf ) C T P r(tf ).
x f

(114)

Persamaan (114) merupakan syarat batas untuk menyelesaikan persamaan costate.


Untuk menentukan input kontrol optimal u(t) dari persamaan (112) kita harus
menentukan solusi dari persamaan costate (110) dengan syarat batas (114) dan
persamaan state (109) dengan syarat batas x(t0 ).
Untuk itu kita akan menggunakan metode Sweep untuk menentukan solusi keduanya. Diasumsikan bahwa state dan costate mempunyai hubungan seperti pada
(114) untuk semua t [t0 , tf ] yaitu
(t) = S(t)x(t) v(t),

(115)

dengan
S(tf ) = C T P C,

v(tf ) = C T P r(tf ).

(116)

Jika kita berhasil menentukan matriks S(t) dan v(t), maka asumsi bahwa costate
dapat dinyatakan sebagai persamaan (115) adalah benar.
Perhatikan bahwa
+ S x v = Sx
+ S(Ax BR1 B T ) v.
= Sx

37

(117)

Substitusikan persamaan costate (110) ke persamaan (117), diperoleh


(S + AT S + SA + C T QC SBR1 B T S)x + (v + SBR1 B T v AT v C T Qr) = 0.
(118)
Karena persamaan (118) dipenuhi untuk seluruh x(t) pada interval [t0 , tf ], maka
haruslah
S + AT S + SA + C T QC SBR1 B T S = 0.

(119)

v + SBR1 B T v AT v C T Qr = 0.

(120)

dan

Jika S(t) dan v(t) adalah solusi dari persamaan (119) dan (120) dengan syarat
batas diberikan pada persamaan (116), maka asumsi kita terhadap persamaan
(115) adalah benar.
Dari sini, maka fungsi kontrol input optimal u(t) yang dinyatakan oleh persamaan
(112) dapat dinyatakan sebagai
u = R1 B T = R1 B T Sx R1 B T v,

(121)

atau dapat dituliskan sebagai


u = Kx R1 B T v,

dengan K = R1 B T S.

38

(122)

Daftar Pustaka
[1] Olsder, G.J., and Vander Woude, J.W., 1994, Mathematical System Theor y, Lecture Notes, Delft.
[2] Burghes, D. N., and Graham, A., 1980, Introduction to Control Theory: Including
Optimal Control, John Wiley & Sons, New York.
[3] William II, R. L., and Lawrence, D. A., 2007, Linear State-Space Control Systems,
John Wiley & Sons, Inc, New York.
[4] Lewis, F. L., and Syrmos, V. L., 1994, Optimal Control, John Wiley & Sons, Inc,
Canada.

39

Anda mungkin juga menyukai