Anda di halaman 1dari 106

MODUL OPTIMISASI

RUANG VEKTOR DAN MATRIKS,


PENYELESAIAN PERSAMAAN LINIER, DAN
MASALAH OPTIMASI CONVEX

Kelompok 2:

Firda Ayu Setiawati (1147010025)

Lilis Serli Anjarsari (1147010037)

Nidya Ayu Safera (1147010051)

JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SGD BANDUNG

2017
STANDAR KOMPETENSI

Standar
Kompetisi Dasar Indikator
Kompetisi
2.1 Vektor dan  Mahasiswa mampu
Matriks memahami definisi
vektor dan matriks
 Mahasiswa mampu
menyelesaikan berbagai
persoalan vektor dan
matriks
2.2 Rank Matriks  Mahasiswa mampu
Bab 2. memahami rank matriks
Ruang dan dapat menyelesaikan
Vektor Dan persoalannya
Matriks 2.3 Persamaan  Mahasiswa mampu
memahami persamaan
Linear linier
2.4 Perkalian
 Mahasiswa mampu
Dalam dan mengoperasikan matriks
dan vektor dengan
Panjang menggunakan perkalian
dalam dan panjang

12.1 Analisis  Mahasiswa mampu


Kuadrat Mempertimbangkan
Terkecil sebuah system
persamaan linier
 Mahasiswa mampu
mengkarakteristikan
Bab 12. solusi kuadrat terkecil.
Penyelesaian
persamaan 12.2 Algoritma  Mahasiswa mampu
linier Kuadrat Menerapkan algoritma
Terkecil KTR dua kali
Rekursif
12.3 Solusi untuk  Mahasiswa mampu
Persamaan menemukan solusi unik
Linear dengan sebuah vector.
Bentuk
Minimum
12.4 Algoritma  Mahasiswa mampu
Kaczmarz Menunjukkan beberapa
iterasi algoritma
Kaczmarzdengan μ = 1
dan x ( 0 )  0 .
12.5 Memecahkan  Mahasiswamampumeme
Persamaan cahkansuatusistempersa
Linear Secara maan linier
Umum
22.1 Pendahuluan  Mahasiswa mampu
mempertimbangkan
masalah optimisasi
 Mahasiswa mampu
mendeskripsikan dimana
batasan minimize
22.2 Fungsi Konveks  Mahasiswa mampu
mendefinisikan fungsi
bernilai riil
 Mahasiswa mampu
mendefinisikan sebuah
fungsi konveks
 Mahasiswa mampu
mengilustrasikan grafik
Bab 22.
dan epigraf suatu fungus
Memahami
konveks
masalah
optimisasi
22.3 Masalah  Mahasiswa mampu
Konveks
Optimal Convex membuktikan apakah
sebuah fungsi tersebut
optimal fungsi convex
atau bukan
22.4 Pemrograman  Mahasiswa mampu
Semidefinite menjelaskan apa itu
Pemrograman
Semidefinite
 Mahasiswa mampu
menemukan solusi
apakah fungsi tersebut
Semidefinite atau bukan
 Mahasiswa mampu
menunjukkan
pemrograman
semidefinite
menggunakan LMI
 Mahasiswa mampu
menemukan solusi
fungsi tersebut
Semidefinite atau bukan
dengan menggunakan
LMI
 Mahasiswa mampu
menemukan solusi yang
layak dibawah kendala
LMI
DAFTAR ISI

Standar Kompetensi
BAB 2 Ruang Vektor dan Matriks
2.1 Vektor dan Matriks
2.2 Rank Matriks
2.3 Persamaan Linear
2.4 Perkalian Dalam dan Panjang
BAB 12 Penyelesaian Persamaan Linier
12.1 Analisis Kuadrat Terkecil
12.2 Algoritma Kuadrat Terkecil Rekursif
12.3 Solusi untuk Persamaan Linear dengan Bentuk Minimum
12.4 AlgoritmaKaczmarz
12.5 Memecahkan Persamaan Linear Secara Umum
BAB 22 Memahami Masalah Optimisasi Konveks
22.1 Pendahuluan
22.2 Fungsi Konveks
22.3 Masalah Optimisasi Convex
22.4 Pemrograman Semidefinite
Rangkuman
Suggestion Reading
Latihan
Daftar Istilah
BAB 2
RUANG VEKTOR DAN MATRIKS

2.1 Vektor dan Matriks

Kita mendefinisikan sebuah kolom n-vector menjadi array


sebanyak n, dinotasikan

 a1 
a 
a   2

 
a n 

ai disebut komponen ke i dari vektor a. Himpunan bilangan


real dinotasikan oleh ℝ dan himpunan vektor n-kolom
dengan komponen bilangan riil dinotasikan oleh ℝ𝑛 . Kita
menyebut ℝ𝑛 ruang vektor riil n dimensi. Kami biasanya
menotasikan elemen ℝ𝑛 dengan huruf kecil tebal (mis., x).
Komponen x ∈ ℝ𝑛 dinotasikan x1, ..., xn.

Kita mendefinisikan vector n baris sebagai

a1 , a2 ,..., an  .

Transpos dari vektor kolom a adalah vektor baris dengan


elemen yang sesuai, dilambangkan aT. Misalnya, jika
 a1 
a 
a   2

 
a n 

Maka

a T  a1 , a 2 ,..., a n  .

Secara ekivalen, kita bisa menulis a  a1 , a2 ,..., an  . Dua


T

vektor a  a1 , a2 ,..., an  dan b  b1 , b2 ,..., bn  sama jika ai


T T

= bi, i = 1, 2, ..., n. Jumlah vektor a dan b, dilambangkan a


+ b, adalah vektornya

a  b  a1  b1 , a2  b2 ,..., an  bn  .
T

Pengoperasian penambahan vektor memiliki sifat berikut:

1. Operasi bersifat komutatif


a + b = b + a.
2. Operasi bersifat asosiatif
(a+b)+c=a+(b+c)
3. Terdapat vektor nol
0 = [ 0 , 0 , ... , 0 ]T
Sedemikian sehingga

a+0=0+a=a

Vektornya
a1  b1 , a2  b2 ,..., an  bn T
disebut perbedaan antara a dan b dan dinotasikan a - b.
Vektor 0 - b dinotasikan - b. Perhatikan bahwa
Vektor b-a adalah solusi unik dari persamaan vektor.
b  ( a  b)  a,
 (b)  b,
 (a  b)  b  a.

Misalkan x  x1 , x2 ,..., xn  adalah solusi untuk a + x = b.


T

Kemudian,
a1  x1  b1 ,
a 2  x 2  b2 ,

a n  bn  bn ,
Dan dengan demikian
x  b  a.
Kami mendefinisikan operasi perkalian vektor a𝝐ℝ𝒏
dengan skalar riil 𝑎𝜖ℝ sebagai

aa  aa1 , aa2 ,..., aan  .


T

Operasi ini memiliki sifat berikut:


1. Operasi bersifat distributif: untuk skalar riil α dan β,
a (a  b)  aa  ab,
(a   )a  aa  a.
2. Operasi adalah asosiatif:
a( a)  (a )a.

3. Skalar 1 memenuhi
1a  a.
4. Setiap skalar α memenuhi
a0  0
5. Skalar 0 memenuhi
0a  0
6. Skalar -1 memenuhi
(1)a   a

Perhatikan bahwa αa=0 jika dan hanya jika α=0 atau a=0.
Amati bahwa αa=0 sama dengan αa = αa2 = ··· = αan = 0.
Jika α=0 atau a=0, maka αa=0. Jika a≠0, maka setidaknya
satu dari komponen ak≠0. Untuk komponen ini, αak=0, dan
karenanya kita harus memiliki α=0. Argumen serupa dapat
diterapkan pada kasus ketika α≠0.

Kumulan vektor {a1, ..., ak} dikatakan bebas linear Jika


persamaan tersebut menyiratkan bahwa semua koefisien αi,
i = 1, ..., k, sama dengan nol.

Kumpulan vektor {a1, ..., ak} bergantung linear jika tidak


bebas linear. Sebuah vektor a dikatakan sebagai kombinasi
linear dari vektor a1, a2, ..., jika ada skalar α1, ..., αk
sedemikian rupa sehingga

a  a1 a1  a 2 a 2    a k a k

Proposisi 2.1 Kumpulan vektor {a1, a2, ..., ak} adalah


bergantung linier jika dan hanya jika salah satu vektor dari
himpunan adalah kombinasi linear dari vektor-vektor yang
tersisa.
Proposisi 2.2 Jika {a1, a2, ..., ak} adalah basis  , maka
setiap vektor a dapat diwakili secara unik seperti

a  a1 a1  a 2 a 2    a k a k ,

di mana αi, i = 1, 2, ..., k.

Natural basis untuk ℝn adalah himpunan vektor

1  0  0 
0  1  0 
     
0  0  0 
e1    , e2    , ..., en   
  
0  0  0 
     
0 0 1
Basis alaminya adalah

 x1 
x 
x   2   x1e1  x 2 e 2    x n e n

 
 xn 
Kita juga bisa mendefinisikan ruang vektor kompleks.
Untuk ini, ℂ notasi himpunan bilangan kompleks dan ℂn
himpunan vektor n-kolom dengan komponen kompleks.
Matriks adalah kumpulan bilangan persegi panjang, yang
biasanya dilambangkan dengan huruf tebal huruf besar
(mis., A). Matriks dengan m baris dan n kolom disebut
matriks m × n, dan kita menulis
a11 a12  a1n
a a 22  a 2n
A  21
   
a m1 a m 2  a mn

Nomor sebenarnya aij yang terletak di kolom ke i dan


kolom ke j disebut entri ke (i, j).

Perhatikan matriks m × n A di atas. Transpos matriks A,


dinotasikan AT, adalah matriks n × m

 a11 a 21  a m1 
a a 22  a m 2 
T  12
A ;
     
 
a1n a 2 n  a mn 

Artinya, kolom A adalah baris AT, dan sebaliknya.

Biarkan simbol ℝm×n menunjukkan himpunan matriks mxn


yang entri adalah bilangan real. Dengan demikian,
transposisi vektor hanyalah kasus transposisi matriks yang
khusus, dan kita tidak akan lagi membedakan keduanya.
Perhatikan bahwa ada sedikit ketidakkonsistenan dalam
notasi vektor baris ketika diidentifikasi sebagai matriks
1×n: Kami memisahkan komponen vektor baris dengan
koma, sedangkan dalam notasi matriks kami biasanya tidak
menggunakan koma. Namun, penggunaan koma dalam
memisahkan elemen berturut-turut membantu
mengklarifikasi pemisahan mereka. Kami menggunakan
koma seperti itu bahkan dalam memisahkan matriks yang
disusun dalam baris horizontal.
2.2 Rank Matriks

Perhatikan matriks m × n

 q11 a12  a1n 


a a 22  a 2 n 
A   21
     
 
a m1 am2  a mn 

Mari kita menunjukkan kolom ke k dari A dengan ak:

 a1k 
a 
a k   2k 
  
 
a mk 
Jumlah maksimal kolom bebas linear dari A disebut
rangking matriks A, dinotasikan rank A. Perhatikan bahwa
rank A adalah dimensi membentang [a1, ..., an].

Proposisi 2.3 Rank matriks A adalah invarian pada operasi


berikut:

1. Perkalian kolom A dengan sketsa taknol.


2. Interchange kolom.
3. Menambahkan kolom tertentu kombinasi linear kolom
lainnya.

Matriks A dikatakan matriks persegi jika jumlah barisnya


sama dengan jumlah kolomnya (yaitu n × n). Terkait
dengan masing-masing matriks bujursangkar A adalah
skalar yang disebut determinan matriks A, dilambangkan
det A atau | A |.

Penentu matriks bujursangkar adalah fungsi kolomnya dan


memiliki sifat berikut:

1. Determinan matriks A = [a1, a2, ..., an] adalah fungsi


linier dari setiap kolom.
2. Jika untuk beberapa k kita memiliki ak = ak + 1, maka
det A  deta1 ,..., ak , ak 1 ,..., an   deta1 ,..., ak , ak ,..., an   0

3. Misalkan
1 0  0
0 1  0
I n  e1 , e2 ,..., en   
   
 
0 0  1
dimana {e1, ..., en} adalah dasar alami untuk ℝn. Maka
det In = 1.

Proposisi 2.4 Jika matriks m × n (m ≥ n) A memiliki


nn-orde minor, maka kolom A bebas linear; Yaitu,
peringkat A = n.

Matriks nonsingular (atau invertible) adalah matriks


bujursangkar yang determinannya tidak nol
2.3 Persamaan Linear

Misalkan kita diberi persamaan dalam n yang tidak


diketahui bentuknya

a11 x1  a12 x 2    a1n x n  b1 ,


a 21 x1  a 22 x 2    a 2 n x n  b2 ,

a m1 x1  a m 2 x 2    a mn x n  bm .

Kita dapat mewakili himpunan persamaan di atas sebagai


persamaan vektor

x1 a1  x 2 a 2    x n a n  b,

dimana

 a ij   b1 
a  b 
aj   2j 
, b 2
    
   
 a mj  bm 

Terkait dengan sistem persamaan ini adalah matriksnya


A  a1 , a 2 ,..., a n  ,

Dan matriks yang diperbesar

A, b  a1 , a 2 ,..., an , b.

Kita juga bisa merepresentasikan sistem persamaan diatas


sebagai Ax  b
dimana

 x1 
x 
x   2

 
xn 

Teorema 2.1 Sistem persamaan Ax = b memiliki solusi jika


dan hanya jika rank A = rank[A,b].

Teorema 2.2 Perhatikan persamaan Ax = b, di mana A ∈


ℝmxn dan rank A = m. Solusi untuk Ax = b dapat diperoleh
dengan menetapkan nilai untuk variabel n-m dan
pemecahan untuk yang tersisa.

2.4 Perkalian Dalam dan Panjang

Nilai absolut dari bilangan real a, dilambangkan |a|,


didefinisikan sebagai

 a jika a  0
a 
 a jika a  0.
Rumus berikut ini:

1. | a | = | -a |.
2. - | a | ≤ a ≤ | a |.
3. | a + b | ≤ | a | + | b |.
4. || a | - | b || ≤ | a - b | ≤ | a | + | b |.
5. | ab | = | a || b |.
6. | a | ≤ c dan | b | ≤ d menyiratkan bahwa | a + b | ≤ c +
d.
7. Ketidaksamaan | a | <b sama dengan -b <a <b (yaitu, a
<b dan -a <b).
Hal yang sama berlaku jika kita mengganti setiap
kejadian "<" oleh "≤."
8. Ketidaksamaan | a | > b sama dengan a> b atau -a> b.
Hal yang sama berlaku jika kita mengganti setiap
kemunculan ">" oleh "≥."
Untuk x, y, ℝn, kita mendefinisikan produk dalam
Euclidean oleh
n
x, y   xi y i  x T y.
i 1

Perkalian dalam adalah fungsi bernilai real: ℝn×ℝn→ℝ


memiliki sifat berikut:
1. Positivity: (x, x) ≥ 0, (x, x) = 0 jika dan hanya jika x=0.
2. Simetri: (x, y) = (y, x).
3. Aditif: (x + y, z) = (x, z )+( y, z).
4. Homogenitas: (rx, y) = r(x, y) untuk setiap r ∈ ℝ.
Sifat aditif dan homogenitas pada vektor kedua juga
berlaku.
Vektor x dan y dikatakan ortogonal jika x, y = 0.
Panjang Euclidean dari vektor x didefinisikan sebagai

x  ( x, x)  xT x .
Teorema 2.3 Ketidakseimbangan Cauchy-Schwarz.
Untuk dua vektor x dan y dalam ℝn, ketidaksamaan
Cauchy-Schwarz
( x, y)  x y .

Selanjutnya, persamaan berlaku jika dan hanya jika x = αy


untuk beberapa α∈ ℝ

Panjang Euclidean dari sebuah vektor || x || Memiliki sifat


berikut:
1. Positivity: || x || ≥ 0, || x || = 0 jika dan hanya jika x = 0.
2. Homogenitas: || rx || = | R | || x ||, r∈ ℝ.
3. Ketidaksamaan segitiga: || x + y || ≤ || x || + || y ||.
Ketidaksamaan segitiga dapat dibuktikan dengan
menggunakan ketidaksamaan Cauchy-Schwarz.

Untuk ruang vektor kompleks ℂn, kita mendefinisikan


n
perkalian dalam (x, y) menjadi i 1
xi yi , di mana bar

menunjukkan konjugasi kompleks. Perkalian dalam pada ℂn


adalah fungsi bernilai kompleks yang memiliki sifat
berikut:
1. (x, x) ≤ 0, (x, x) = 0 jika dan hanya jika x = 0.
2.  
( x, y )  y , x .
3. (x + y, z) = (x, z + y, z).
4. (rx, y) = r(x, y), dimana r∈ ℝ.
BAB 12

PENYELESAIAN PERSAMAAN LINIER

12.1 Analisis Kuadrat Terkecil

Mempertimbangkan sebuah sistem persamaan linier

𝑨x= b,

Dimana 𝑨𝜖 ℝmxn, b𝜖ℝm,m ≥ n , dan rank 𝑨= n. Perhatikan


bahwa jumlah yang tidak diketahui, n,Tidak lebih besar dari
jumlah persamaan,m.Jika b tidak termasuk dalam kisaran 𝑨,
maka jika b∉ 𝑅(A), Maka sistem persamaan ini dikatakan
tidak konsisten atau terlalu ditentukan. Dalam hal ini tidak
ada solusi untuk persamaan di atas. Tujuan kita kemudian
adalah menemukan vektor (atau vektor) xmeminimalkan
||𝑨x - b||2.Masalah ini adalah kasus khusus dari masalah
kuadrat terkecil nonlinier yang dibahas di Bagian 9.4.

Misalkan x*menjadi vektor yang meminimalkan


||𝑨x - b||2; Artinya, untuk semua x 𝜖ℝn,

||𝑨x - b||2 ≥ ||𝑨x* - b||2.

Kita mengacu pada vektor x* sebagai solusi kuadrat


terkecil untuk 𝑨x= b. Dalam kasus di mana 𝑨x= b memiliki
solusi, maka solusinya adalah solusi kuadrat terkecil. Jika
tidak, solusi kuadrat terkecil meminimalkan perbedaan
bilangan antara sisi kiri dan kanan dari persamaan 𝑨x= b.
Untuk mengkarakterisasi solusi kuadrat terkecil, kita
membutuhkan lemma berikut.

Lemma 12.1 Misalkan 𝑨 𝜖 ℝmxn , m ≥ n. Maka, rank 𝑨= n


jika dan hanya jika rank 𝑨⊺ 𝑨= n(yaitu, matriks persegi
𝑨⊺ 𝑨adalah nonsingular).

Bukti. ⇒: Misalkan bahwa rank 𝑨= n. Untuk menunjukkan


rank 𝑨⊺ 𝑨= n,Itu ekuivalen dengan menunjukkan 𝒩(𝑨⊺ 𝑨) =
{0}. Untuk melanjutkan, misalkan x𝜖 𝒩(𝑨⊺ 𝑨); itu adalah,
𝑨⊺ 𝑨x =0. Karena itu,

||𝑨x||2 = 𝒙⊺ 𝑨⊺ 𝑨x = 0,

Yang menunjukkan bahwa 𝑨x = 0. Karena rank 𝑨= n, kita


memiliki x = 0.

⇐ Misalkan itu rank 𝑨⊺ 𝑨= n; yaitu, 𝒩(𝑨⊺ 𝑨) = {0}. Untuk


menunjukkan rank 𝑨= n, Itu ekuivalen untuk menunjukkan
bahwa 𝒩(𝑨) = {0}. Untuk melanjutkan, misalkan
x𝜖 𝒩(𝑨); itu adalah 𝑨x = 0. Maka, 𝑨⊺ 𝑨x = 0, oleh karena
itu x = 0.

Ingatlah bahwa kita asumsikan semua rank A = n.


Oleh Lemma 12.1 kita menyimpulkan bahwa (𝑨⊺ 𝑨)-1 ada.
Teorema berikut mengkarakteristikan solusi kuadrat
terkecil.
Teorema 12.1 Vektor unik x* yang meminimalkan ||𝑨x -
b||2 diberikan solusi terhadap persamaan 𝑨⊺ 𝑨x = 𝑨⊺ b; yaitu,
x* = (𝑨⊺ 𝑨)-1 𝑨⊺ b.

Buktikan. Misalkan x* = (𝑨⊺ 𝑨)-1 𝑨⊺ b. Pertama mengamati


bahwa

||𝑨x - b||2 = ||𝑨(x - x*) + (𝑨x* - b)||2

= (𝑨(x - x*) + (𝑨x* - b))T(𝑨(x - x*) + (𝑨x*-b))

= ||𝑨(x-x*)||2+||𝑨x*-b||2 +2[𝑨(x-x*)]T(𝑨x* - b).

Sekarang kita menunjukkan bahwa istilah terakhir dalam


persamaan ini adalah nol. Benar, ganti ungkapan di atas
untuk x*,

[𝑨(x - x*)] T (𝑨x* - b) = (x - x*)TAT[A(AT A)-1 AT - In]b

=(x - x*)T [(AT A)(AT A)-1 AT - AT]b

= (x - x*)T (AT - AT)b

= 0,

Karena itu,

||𝑨x - b||2 = ||𝑨(x - x*)||2 + ||𝑨x* - b||2.

Jika x ≠ x*, maka ||𝑨(x - x*)||2> 0, karena rank A = n. Jadi,


jika x ≠ x*, kita punya

||𝑨x - b||2>||𝑨x* - b||2.


Jadi, x*=(ATA-1)ATb adalah minimasi khusus dari||𝑨x-b||2.

Gambar 12.1 Proyeksi ortogonal b pada subruang (A).

Untuk melanjutkan, kita tulis A = [𝑎1 , … , 𝑎𝑛 ], dimana


𝑎1 , … , 𝑎𝑛 adalah kolom dari A. Vektor e ortogonal terhadap
ℛ(A) jika dan hanya jika ortogonal pada masing-masing
kolom 𝑎1 , … , 𝑎𝑛 dari A. Untuk melihat ini, perhatikan
bahwa

〈𝒆, 𝒂𝒊 〉 = 0 , i = 1, ..., n

Proposisi 12.1 Misalkanh 𝜖 ℛ(A) Sedemikian rupa


sehingga h - bbersifat ortogonal ℛ(A). Maka, h= 𝑨x*=
𝑨(AT A)-1 ATb.

Bukti. Karena h𝜖 ℛ(A) = rentang [𝑎1, .... , 𝑎n],Itu memiliki


bentuk h = x1𝑎1 + ... + xn𝑎n, dimana x1, ... , xn ,Kita
menggunakan asumsi bahwa e = h - b adalah ortogonal
terhadap rentang [𝑎1, .... , 𝑎n]; Yaitu, untuk semua i = 1, ... ,
n, kita punya
〈𝒉 – 𝒃, 𝒂𝒊 〉 = 0,

Atau, secara ekuivalen,

〈𝒉, 𝒂𝒊 〉 = 〈𝒃, 𝒂𝒊 〉.

Dengan mensubstitusikan h ke persamaan di atas, kita


mendapatkan satu himpunan n persamaan linier dari bentuk

〈𝑎1 , 𝑎𝑖 〉𝑥1 + ... + 〈𝑎𝑛 , 𝑎𝑖 〉𝑥𝑛 = 〈𝑏, 𝑎𝑖 〉, i = 1, ..., n

Dalam notasi matriks, sistem persamaan n dapat


direpresentasikan sebagai

 a1 , a1  a n , a1   x1   b, a1 
    =  
       
 a1 , a n  an , an   x n   b, a n 

Perhatikan bahwa kita bisa tulis

 a1 , a1  a n , a1   a1T 
   
   = 𝐴𝑇 𝐴 =   
 a1 , a n  an , an   a nT 
 
a1  an .

Kita tulis juga seperti ini


 b, a1   a1T 
  𝑇  
   =𝐴 𝑏=    b.
 b, a n   a nT 
 

Karena rank 𝑨 = 𝑛, 𝑨𝑻 Atidak terbentuk nonsingular, dan


dengan demikian kita simpulkan

 x1 
 
x      AT A AT b  x *
1

 xn 

Perhatikan bahwa matriksnya

 a1 , a1  a n , a1 
 
A A  
T
 
 a1 , a n  an , an 

Contoh 12.1 Misalkan kita diberi dua jenis beton yang


berbeda. Jenis pertama mengandung semen 30%, kerikil
40%, dan pasir 30% (semua persentase berat). Tipe kedua
mengandung semen 10%, kerikil 20%, dan pasir 70%.
Berapa kilogram tiap jenis beton yang harus kita
campurkan sehingga kita mendapatkan campuran beton
yang sedekat mungkin dengan total 5 pon, 3 pon kerikil,
dan 4 pon pasir?

Masalahnya bisa diformulasikan sebagai masalah kuadrat-


terkecil
0.3 0.1 5 
 
A  0.4 0.2 , b  3
0.3 0.7 4

Dimana variabel keputusannya adalah x = [x1, x2]T dan x1


dan x2 adalah jumlah beton tipe pertama dan kedua, masing-
masing. Secara aljabar, kita mendapatkan solusinya:

 
x *  AT A 1 AT b

1  0.54  0.32 3.9


0.340.54  0.32  0.32 0.34  3.9
= 2

 10.6 
=  
0.961

(Untuk variasi masalah ini diselesaikan dengan


menggunakan metode yang berbeda, lihat Contoh 15.7.)
kita sekarang memberikan contoh di mana analisis kuadrat-
terkecil digunakan untuk menyesuaikan pengukuran dengan
garis lurus.

12.2 Algoritma Kuadrat Terkecil Rekursif

Untuk mendapatkan algoritma KTR, pertama


pertimbangkan masalah meminimalkan ‖𝑨0 𝒙 − 𝑏 (0) ‖2.Kita
tahu bahwa solusi untuk ini diberikan oleh 𝑥 (0) =
𝐺0−1 𝐴0𝑇 𝑏 (0) , dimana 𝐺0 = 𝐴0𝑇 𝐴0 . Misalkan sekarang kita
diberi lebih banyak data, dalam bentuk matriks 𝐴1 dan
sebuah vektor 𝑏 (1) .

Lemma 12.2 Misalkan A adalah matriks nonsingular.


Misalkan U dan V adalah matriks seperti I + V𝐴−1U adalah
nonsingular. Maka, 𝐴 + 𝑈𝑉adalah nonsingular, dan

(𝐴 + 𝑈𝑉)-1 = 𝐴−1 − (𝐴−1 𝑈)(𝐼 + 𝑉𝐴−1 𝑈)−1 (𝑉𝐴−1 ).

Bukti. Kita bisa membuktikan hasilnya dengan mudah


dengan verifikasi.

Menggunakan Lemma 12.2 kita dapatkan

−1
𝐺𝑘+1 = (𝐺𝑘 + 𝐴𝑇𝑘+1 𝐴𝑘+1 )−1

= 𝐺𝑘−1 − 𝐺𝑘−1 𝐴𝑇𝑘+1 (𝐼 + 𝐴𝑘+1 𝐺𝑘−1 𝐴𝑇𝑘+1 )-1𝐴𝑘+1 𝐺𝑘−1 .

Contoh 12.6 Misalkan

1 0 1
A0  0 1 b ( 0)  1
1 1 1

A1  a1T  2 1 , b (1)  b1  3 ,

A2  a2T  3 1 , b ( 2)  b2  4.

Pertama hitung vektornya 𝑥 (0) Meminimalkan ‖𝑨0 𝒙 −


b (0) ‖2. Maka, Gunakan algoritma KTR untuk menemukan
𝑥 (2) minimasi.
2
 A0  b ( 0 ) 
A  x   (1) 
 1 b 
 A2  b ( 2 ) 
 

Kita punya

 2 / 3  1 / 3

P0  A0T A0   
 1 / 3 2 / 3 

2 / 3
x ( 0)  P0 A01b ( 0)   
2 / 3

Menerapkan algoritma KTR dua kali, kita dapatkan

P0 a1a1T P0  1 / 3  1 / 3
P1  P0  =  ,
1  a1 P0 a1  1 / 3 2 / 3 
T

 1 
 
x (1)  x ( 0)  P1a1 b1  a1T x (0) =  ,
2 / 3

P1a 2 a 2T P1  1 / 6  1 / 4
P2  P1  =  ,
1  a 2 P1a 2  1 / 4 5 / 8 
T

13 / 12
 
x ( 2)  x (1)  P2 a2 b2  a2T x (1) =  
 5/8 

Kita dapat dengan mudah memeriksa solusi kita dengan


menghitung x secara langsung dengan menggunakan rumus
𝑥 (2) = (AT A-1) AT b, dimana
 A0  b ( 0 ) 
 
A   A1  , b   b (1) 
 A2  b ( 2 ) 
 

12.3 Solusi untuk Persamaan Linear dengan Bentuk


Minimum

Teorema 12.2 Solusi unik x* untuk Ax = b yang


meminimalkan bentuk|| x || diberikan oleh

x *  AT AAT  
1
b.

Buktikan.Misalkan x *  AT AAT  
1
b. Perhatikanbahwa

x
2

 x  x*  x*  2


= x  x*  x*   x  x   x 
T * *

= x  x * + x * + 2 x * x  x * 
2 2 T

sekarangkitamenunjukkanbahwa

x* ( x  x* )  0
T

bahkan,


x* ( x  x* ) = AT ( AAT ) 1 b x  AT ( AAT ) 1 b
T T


= bT ( AAT ) 1 Ax  ( AAT )( AAT ) 1 b
= bT ( AAT ) 1 b  b  0 .

jadi,

2 2
 x*  x  x* .
2
x

karena

2
x  x*  0 untuksemua𝑥 ≠ 𝑥 ∗ , dan untuk semua itu

𝑥 ≠ 𝑥∗,

2
 x* ,
2
x

yangberartibahwa

x  x*

Contoh 12.7 Tentukan titik yang paling dekat dengan titik


asalℝ3 Pada titikpotongduagaris bidang yang didefinisikan
oleh dua persamaan berikut ini:

x1  2 x2  x3  1,
4 x1  x2  3x3  0.

Perhatikan bahwa masalah ini setara dengan masalah

x
bagianterkecil

bergantungpada Ax  b,

dimana
1 2  1 1 
A  , b 
4 1 3 0 

jadi, solusi untuk masalah ini adalah

 0.0952 
x  A ( AA ) b   0.3333 
* T T 1

 0.2381

Pada bagian selanjutnya kita membahas algoritma iteratif


untuk memecahkan 𝐴𝑥 = 𝑏

12.4 Algoritma Kaczmarz

Seperti pada Bagian 12.3, let A  ℝ𝑚𝑥𝑛 , 𝑏 𝜖ℝ𝑚 , 𝑚 ≤ 𝑛 dan


rank 𝐴 = 𝑚. Kita sekarang membahas algoritma iteratif
untuk memecahkan𝐴𝑥 = 𝑏, yang awalnya dianalisis oleh
Kaczmarz pada tahun 1937 [70]. Algoritma konvergen ke
vektor 𝑥 ∗ = 𝐴𝑇 (𝐴𝐴𝑇 )−1 𝑏 tanpa secara eksplisit harus
membalikkan matriks 𝐴𝐴𝑇 . Hal ini penting dari sudut
pandang praktis, terutama bila A memiliki banyak baris.

Misalkan𝑎𝑗𝑇 dinotasikan jthbarisdariA, dan𝑏𝑗


komponen 𝑗thdari 𝑏, dan μ skalar positif, 0 <μ< 2. Dengan
notasi ini, algoritma Kaczmarz adalah:

1. Himpunan𝑖 ≔ 0, kondisi awal x ( 0 ) .


2. Untuk j  1,....., m, himpunan
aj
x (im j )  x (im j 1)   (bj  a Tj x (im j 1) ) .
a Tj a j
3. Himpunan𝑖 ∶= 𝑖 + 1; lanjutkan ke langkah 2.

Dengan kata lain, algoritma Kaczmarz bekerja sebagai


berikut. Untuk iterasi pertama (𝑘 = 0, … , 𝑚 − 1), kita
punya
a
x ( k 1)  x ( k )   (bk 1  akT1 x ( k ) ) T
k 1
.
a a
k 1 k 1

Kita lanjutkan dengan (𝑚 + 2) menggunakan iterasi kedua


komponen A dan kedua dari b, dan seterusnya, mengulangi
siklus setiap pengulangan. Kita dapat melihat skalar μ
sebagai ukuran langkah dari algoritma. Alasan untuk
mewajibkan μ antara 0 dan 2 akan terlihat dari analisis
konvergensi.
Kami sekarang membuktikan konvergensi algoritma
Kaczmarz, menggunakan gagasan dari kertas asli Kaczmarz
[70] dan eksposisi berikutnya oleh Parks [102].

Contoh 12.8 Misalkan

1  1  2
A  ,b .
0 1   3

x *  5, 3 Gambar
T
Padakasusini, 12.4 menunjukkan
beberapa iterasi algoritma Kaczmarz dengan μ = 1 dan
x ( 0 )  0 . Kita punya a1T  1,  1, a2  0 1, b1  2, b2  3.

Pada Gambar 12.4,garis diagonal yang melaluititik


2, 
0 sesuaidenganhimpunan x : a1T x  b1 , dan
T
 garis
horisontal yang melewati titik [0, 3] sesuai dengan
himpunan x : a 2T x  b2 , untuk mengilustrasikan algoritma,
kami melakukan tiga iterasi :

Gambar 12.4 Iterasi algoritma Kaczmarz pada Contoh


12.8.

0  11 1
x (1)     (2  0)     ,
0  2  1  1
1 0 1
x ( 2 )     (3  (1))     ,
 1 1 3
1 1  1  3
x ( 3)     (2  (2))     
3 2  1 1
Seperti Gambar 12.4 mengilustrasikan, sifat
𝑎ℛ(𝑘)+1 (𝑥 (𝑘+1) − 𝑥 ∗ ) = 0

Memegang setiap iterasi. Perhatikan konvergensi iterasi


algoritma ke solusinya.
12.5 Memecahkan Persamaan Linear Secara Umum

Contoh 12.9 Misalkan A diberikan oleh

2 1  2 5
A  1 0  3 2
3  1  13 5

Perhatikan bahwa Rank 𝐴 = 2. Kita dapat menulis


faktorisasi penuh-rankA berdasarkan bukti Lemma 12.3:

 2 1
1 0  3 2
A   1 0    BC .
 0 1 4 1
3  1

Sekarangkita memperkenalkan Moore-Penrose inverse dan


mendiskusikan keberadaan dan keunikannya. Untuk ini,
pertama kita perhatikan persamaan matriks

𝑨 𝑿 𝑨 = 𝑨.

Dimana A  ℝ𝑚𝑥𝑛 adalah matriks yang diberikan dan X 


ℝ𝑛𝑥𝑚 adalah matriks yang ingin kita tentukan. Amati bahwa
jika A adalah matriks bujur sangkar nonsingular, maka
persamaan di atas memiliki solusi unik 𝑋 = 𝐴−1. Kita
sekarang mendefinisikan terbalik Moore-Penrose, juga
disebut pseudoinverseatau inverse umum.
BAB 22

MASALAH OPTIMASI CONVEX

22.1 Pendahuluan

Masalah optimasi yang diajukan pada awal bagian ini, pada


umumnya sangat sulit dipecahkan. Sumber kesulitan ini
mungkin berada dalam fungsi objektif atau kendala.
Sekalipun fungsi obyektifnya sederhana dan "berperilaku
baik," sifat kendala bisa membuat masalah sulit dipecahkan.
Kami menggambarkan beberapa kesulitan ini dalam contoh
berikut.

Contoh 22.1 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22


𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑥2 − 𝑥1 − 2 ≤ 0
𝑥12 − 𝑥2 − 4 ≤ 0

Masalahnya digambarkan pada Gambar 22.1, dimana,


seperti yang bisa kita lihat, minimizer terbatas sama dengan
minimizer yang tidak dibatasi. Pada minimizer, semua
kendala tidak aktif. Jika kita hanya mengetahui fakta ini,
kita bisa mendekati masalah ini sebagai masalah optimasi
tanpa kendala dengan menggunakan teknik dari Bagian II.

Gambar 22.1 Situasi dimana dibatasi dan tak terbatas


adalah sama.
Contoh 22.2 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22


𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑥1 − 10 ≤ 0
𝑥1 − 𝑥22 − 4 ≥ 0

Masalahnya digambarkan pada Gambar 22.2. Pada


solusinya, hanya satu kendala yang aktif. Jika kita hanya
mengetahui hal ini, kita bisa menangani masalah ini sebagai
masalah optimasi yang dibatasi dengan menggunakan
metode multiplier Lagrange.

Gambar 22.2 Situasi dimana hanya satu kendala yang aktif


.

Contoh 22.3 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22


𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 4 − 𝑥1 − 𝑥22 ≤ 0
3𝑥2 − 𝑥1 ≤ 0
−3𝑥2 − 𝑥1 ≤ 0

Masalahnya digambarkan pada Gambar 22.3. Contoh ini


menggambarkan situasi di mana kendala memperkenalkan
minimizer lokal, walaupun fungsi objektif itu sendiri hanya
memiliki satu penambah global tak terbatas.

Gambar 22.3 Situasi dimana kendala memperkenalkan


minimizer lokal.
Beberapa kesulitan yang diilustrasikan dalam contoh di atas
dapat dieliminasi jika kita membatasi masalah kita pada
area yang sesuai. Diakuinya, beberapa masalah kehidupan
nyata yang penting tidak sesuai dengan kerangka kerja ini.
Di sisi lain, adalah mungkin untuk memberikan hasil sifat
global untuk masalah optimasi kelas ini. Pada bagian
selanjutnya, kami memperkenalkan gagasan tentang fungsi
cembung, yang memegang peranan penting dalam
penanganan masalah tersebut selanjutnya.

22.2 Fungsi Konveks

Kita mulai dengan definisi grafik fungsi bernilai riil.

Definisi 22.1 Grafik dari 𝑓: Ω → ℝ , Ω ⊂ ℝ𝑛 , adalah


himpunan di titik Ω × ℝ , Ω ⊂ ℝ𝑛+1 diberikan oleh
𝑥
{[𝑓(𝑥)] : 𝑥 𝜖 Ω}.
Kita dapat memvisualisasikan grafik f sebagai seperangkat
titik pada "plot" f (x) versus x (lihat Gambar 22.4). Kami
selanjutnya mendefinisikan epigraf dari fungsi bernilai riil.

Gambar 22.4 Grafik dan epigraf suatu fungsi 𝑓: ℝ → ℝ

Definisi 22.2 Epigraf sebuah fungsi 𝑓: Ω → ℝ , Ω ⊂ ℝ𝑛 ,


Dilambangkan 𝑒𝑝𝑖(𝑓), adalah himpunan dititik Ω × ℝ
𝑥
diberikan oleh 𝑒𝑝𝑖(𝑓) = {[𝛽 ] : 𝑥 𝜖 Ω , β ϵ ℝ , β ≥ f(x)}.

Epigraph 𝑒𝑝𝑖(𝑓), dari fungsi f hanyalah himpunan dititik


Ω × ℝ pada atau di atas grafik f (lihat Gambar 22.4). Kita
juga bisa memikirkan epi (f) sebagai subset dari ℝ𝑛+1 .

Ingat itu satu set Ω ⊂ ℝ𝑛 cembung jika untuk setiap


𝑥1 , 𝑥2 𝜖 Ω dan 𝛼 𝜖 (0,1), 𝛼𝑥1 + (1 − 𝛼)𝑥2 𝜖 Ω (Lihat
Bagian 4.3). Kami sekarang memperkenalkan gagasan
tentang fungsi cembung.

Definisi 22.3 Sebuah fungsi 𝑓: Ω → ℝ, Ω ⊂ ℝ𝑛 , adalah


cembung pada Ω jika epigrafnya adalah satu cembung.
Teorema 22.1 Jika fungsi 𝑓: Ω → ℝ, Ω ⊂ ℝ𝑛 , adalah
cembung pada Ω, maka Ω adalah konveks.

Bukti. Kami membuktikan teorema ini dengan cara


kontraksi. Misalkan Ω bukan satu konveks. Kemudian, ada
dua titik 𝑦1 dan 𝑦2 sehingga untuk beberapa 𝛼 𝜖 (0,1),

𝑧 = 𝛼𝑦1 + (1 − 𝛼)𝑦2 ∉ Ω

diberikan

𝛽1 = 𝑓(𝑦1 ), 𝛽2 = 𝑓(𝑦2 )

Lalu, pasang

𝑦1 𝑦2
[𝛽 ] , [𝛽 ]
1 2

Termasuk grafik f, dan karenanya juga epigraf f.


Membiarkan

𝑦1 𝑦2
𝓌 = 𝛼 [𝛽 ] + (1 − 𝛼) [𝛽 ]
1 2

kita mempunyai

𝑧
𝓌 = [𝛼𝛽 + (1 − 𝛼)𝛽 ]
1 2

Tapi perhatikan itu w epi (f), karena z Ω. Oleh karena itu,


epi (f) tidak cembung, dan karenanya f bukan fungsi
konveks.
Teorema berikutnya memberikan karakterisasi fungsi
cembung yang sangat berguna. Karakterisasi ini sering
digunakan sebagai definisi untuk fungsi cembung.

Teorema 22.2 Fungsi 𝑓: Ω → ℝ , didefinisikan cembung


pada set Ω ⊂ ℝ𝑛 , adalah cembung jika dan hanya jika
untuk semua 𝑥, 𝑦 ∈ Ω dan semua 𝛼 𝜖 (0,1), kita miliki

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).

Bukti. ⇐: Asumsikan bahwa untuk semua 𝑥, 𝑦 ∈ Ω dan


𝛼 𝜖 (0,1),

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).

Diberikan [𝑥 𝑇 , 𝑎]𝑇 dan [𝑦 𝑇 , 𝑏]𝑇 dengan dua titik di


𝑒𝑝𝑖(𝑓),dimana 𝑎, 𝑏 ∈ ℝ . Dari definisi 𝑒𝑝𝑖(𝑓) diikuti
dengan

𝑓(𝑥) ≤ 𝑎, 𝑓(𝑦) ≤ 𝑏.

Karena itu, dengan menggunakan ketimpangan pertama di


atas, kita miliki

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑎(𝑥) + (1 − 𝛼)𝑏.

Karena Ω adalah cembung, αx + (1 - α) y Ω. Karenanya,

𝛼𝑥 + (1 − 𝛼)𝑦
[ ] 𝜖 𝑒𝑝𝑖(𝑓),
𝛼𝑎 + (1 − 𝛼)𝑏

Yang menyiratkan bahwa epi (f) adalah himpunan


cembung, dan karenanya f adalah fungsi cembung
⇒: Asumsikan bahwa 𝑓: Ω → ℝ adalah fungsi konveks.
Biarkan 𝑥, 𝑦 ∈ Ω dan

𝑓(𝑥) = 𝑎, 𝑓(𝑦) = 𝑏.

sehingga,

𝑥 𝑦
[ ] , [ ] ∈ 𝑒𝑝𝑖(𝑓).
𝑎 𝑏

Karena 𝑓 adalah fungsi konveks, epigrafnya adalah subset


konveks ℝ𝑛+1 . Oleh karena itu, untuk semua 𝛼 ∈ (0,1),
kita mempunyai

𝑥 𝑦 𝛼𝑥 + (1 − 𝛼)𝑦
𝛼 [ ] + (1 − 𝛼) [ ] = [ ] ∈ 𝑒𝑝𝑖(𝑓).
𝑎 𝑏 𝛼𝑎 + (1 − 𝛼)𝑏

Hal di atas menyiratkan bahwa untuk semua 𝛼 ∈ (0,1),

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑎(𝑥) + (1 − 𝛼)𝑏 = 𝛼𝑓(𝑥) +


(1 − 𝛼)𝑓(𝑦).

dan pernyataan tersebut terbukti.

Interpretasi geometrik Teorema 22.2 diberikan pada


Gambar 22.5. Teorema menyatakan bahwa jika 𝑓: Ω → ℝ
adalah fungsi cembung di atas set cembung Ω, maka untuk
semua x, y Ω, titik pada segmen garis di ℝ𝑛+1
menghubungkan [𝑥 𝑇 , 𝑓(𝑥)]𝑇 dan [𝑦 𝑇 , 𝑓(𝑦)]𝑇 harus terletak
pada atau di atas grafik f.

Gambar 22.5 Interpretasi geometrik Teorema 22.2.


Dengan menggunakan Teorema 22.2, sangat mudah
untuk menunjukkan bahwa penskalaan fungsi cembung
nonnegatif bersifat konveks, dan bahwa jumlah fungsi
konveks adalah konveks.

Teorema 22.3 Misalkan 𝑓, 𝑓1 , 𝑑𝑎𝑛 𝑓2 adalah fungsi


konveks. Kemudian, untuk setiap 𝑎 ≥ 0, fungsi 𝑓 adalah
cembung. Selain itu, 𝑓1 + 𝑓2 adalah konveks.

Bukti. Misalkan 𝑥, 𝑦 ∈ Ω dan 𝛼 ∈ (0,1). Perbaiki 𝑎 ≥ 0.


Untuk kenyamanan, tuliskan 𝒇̅ = 𝑎𝑓. Kita mempunyai

𝑓 (̅ 𝛼𝑥 + (1 − 𝛼)𝑦) = 𝑎𝑓(𝛼𝑥 + (1 − 𝛼)𝑦)


≤ 𝑎(𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦)) karena f
adalah konveks dan 𝑎 ≥ 0.
= 𝛼(𝑎𝑓(𝑥)) + (1 − 𝛼)(𝑎𝑓(𝑦))
= 𝛼𝑓 (̅ 𝑥) + (1 − 𝛼)𝑓(̅ 𝑦),
menunjukkan benar bahwa 𝒇̅ adalah konveks.

Selanjutnya,ubah 𝑓3 = 𝑓1 + 𝑓2 . Kita mempunyai

𝑓3 (𝛼𝑥 + (1 − 𝛼)𝑦)
= 𝑓1 (𝛼𝑥 + (1 − 𝛼)𝑦) + 𝑓2 (𝛼𝑥 + (1 − 𝛼)𝑦)
≤ (𝛼𝑓1 (𝑥) + (1 − 𝛼)𝑓1 (𝑦)) +
(𝛼𝑓2 (𝑥) + (1 − 𝛼)𝑓2 (𝑦))

konveks dari 𝑓1 𝑑𝑎𝑛 𝑓2


= 𝛼(𝑓1 (𝑥) + 𝑓2 (𝑥)) + (1 − 𝛼)(𝑓1 (𝑦) + 𝑓2 (𝑦))
= 𝛼𝑓3 (𝑥) + (1 − 𝛼)𝑓3 (𝑦),

menunjukkan benar bahwa 𝑓3 adalah konveks.

Definisi 22.4 Fungsi 𝑓: Ω → ℝ konveks pada saat Ω ⊂ ℝ𝑛


benar-benar konveks jika untuk semua 𝑥, 𝑦 ∈ Ω, 𝑥 ≠ 𝑦,dan
𝛼 𝜖 (0,1), kita mempunyai

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) < 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).

Dari definisi ini, kita melihat bahwa a untuk fungsi konveks


yang ketat, semua titik pada segmen garis terbuka yang
menghubungkan titik-titik [𝑥 𝑇 , 𝑓(𝑥)]𝑇 dan [𝑦 𝑇 , 𝑓(𝑦)]𝑇
terletak (ketat) di atas grafik f.

Definisi 22.5 Suatu fungsi 𝑓: Ω → ℝ konveks pada saat


Ω ⊂ ℝ𝑛 adalah (hanya) cekung jika-f (benar-benar)
konveks.
Perhatikan bahwa grafik fungsi cekung ketat selalu berada
di atas garis segmen yang menghubungkan dua titik pada
grafiknya.

Untuk menunjukkan bahwa suatu fungsi tidak konveks, kita


hanya perlu menghasilkan sepasang titik 𝑥, 𝑦 ∈ Ω dan
𝛼 𝜖 (0,1) sehingga ketidaksetaraan dalam Teorema 22.2
dilanggar.

Contoh 22.4 Misalkan 𝑓(𝑥) = 𝑥1 𝑥2 . Apakah f konveks di


Ω = {𝑥: 𝑥1 ≥ 0, 𝑥2 ≥ 0} ?

Jawabannya adalah tidak. Ambil, misalnya, 𝑥 = [1,2]𝑇 ∈ Ω


dan 𝑦 = [2,1]𝑇 ∈ Ω. Kemudian,

2−𝛼
𝛼𝑥 + (1 − 𝛼)𝑦 = [ ].
1+𝛼

Oleh sebab itu,

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) = (2 − 𝛼)(1 + 𝛼 = 2 + 𝛼 − 𝛼 2

dan

𝑎𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦) = 2.

1
Jika, misalnya, 𝛼 = 2 ∈ (0,1), maka

1 1 9 1 1
𝑓 ( 𝑥 + 𝑦) = > 𝑓(𝑥) + 𝑓(𝑦),
2 2 4 2 2
Yang menunjukkan bahwa f tidak konveks di Ω .

Contoh 22.5 Pada Contoh 22.4, 𝑓(𝑥) = 𝑥1 𝑥2 , yang dapat


ditulis sebagai 𝑓(𝑥) = 𝑥 𝑇 𝑄𝑥, dimana

1 0 1
𝑄 = 2[ ].
1 0

Misalkan Ω = {𝑥: 𝑥 ≥ 0}, dan 𝑥 = [2,2]𝑇 ∈ Ω, 𝑦=


[1,3]𝑇 ∈ Ω. Kita mempunyai

−1
𝑦−𝑥 =[ ]
1

dan

1
(𝑦 − 𝑥)𝑇 𝑄(𝑦 − 𝑥) = [−1.1] [1 0 −1
] [ ] = −1 < 0.
2 0 1 1

Oleh sebab itu, f tidak konveks pada Ω.

Membedakan fungsi konveks dapat dicirikan dengan


menggunakan teorema berikut.

Teorema 22.4 Misalkan : Ω → ℝ, 𝑓 ∈⊂1 , didefinisikan


konveks pada saat Ω ∈ ℝ𝑛 . Kemudian, f adalah konveks
pada Ω jika dan hanya jika untuk semua 𝑥, 𝑦 𝜖 Ω,

𝑓(𝑦) ≥ 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥).

Bukti. ⇒ Misalkan 𝑓: Ω → ℝ berdiferensiasi dan konveks.


Kemudian, dengan Teorema 22.2, untuk setiap 𝑦, 𝑥 ∈ Ω
dan 𝛼 𝜖 (0,1), kita mempunyai
𝑓(𝛼𝑦 + (1 − 𝛼)𝑥) ≤ 𝛼𝑓(𝑦) + (1 − 𝛼)𝑓(𝑥).

atur kembali,dan menghasilkan

𝑓(𝑥 + 𝛼(𝑦 − 𝑥)) − 𝑓(𝑥) ≤ 𝛼(𝑓(𝑦) − 𝑓(𝑥)).

Setelah membagi kedua sisi ketidaksetaraan ini dengan α,


kita dapatkan

𝑓(𝑥+𝛼(𝑦−𝑥))−𝑓(𝑥)
≤ 𝑓(𝑦) − 𝑓(𝑥).
𝛼

Jika kita sekarang mengambil batas sebagai α → 0 dan


menerapkan definisi turunan directional f pada 𝑥 ke arah
𝑦 − 𝑥 (lihat Bagian 6.2), kita mendapatkan

𝐷𝑓(𝑥)(𝑦 − 𝑥) ≤ 𝑓(𝑦) − 𝑓(𝑥)

atau

𝑓(𝑦) ≥ 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥).

⇐: Asumsikan bahwa Ω adalah konveks, 𝑓: Ω → ℝ dapat


dibedakan, dan untuk semua 𝑥, 𝑦 𝜖 Ω.

𝑓(𝑦) ≥ 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥).

Misalkan 𝑢, 𝑣 ∈ Ω dan 𝛼 ∈ (0,1). Karena Ω adalah


konveks.

𝑤 = 𝛼𝑢 + (1 − 𝛼)𝑣 ∈ Ω.

Lalu kita mempunyai


𝑓(𝑢) ≥ 𝑓(𝑤) + 𝐷𝑓(𝑤)(𝑢 − 𝑤)

dan

𝑓(𝑣) ≥ 𝑓(𝑤) + 𝐷𝑓(𝑤)(𝑣 − 𝑤)

Mengalikan yang pertama dari ketidaksetaraan ini dengan α


dan yang kedua dengan (1 - α) dan kemudian
menambahkannya bersama-sama menghasilkan

𝛼𝑓(𝑢) + (1 − 𝛼)𝑓(𝑣)
≥ 𝑓(𝑤) + 𝐷𝑓(𝑤)(𝛼𝑢 + (1 − 𝛼)𝑣 − 𝑤)

tetapi

𝑤 = 𝛼𝑢 + (1 − 𝛼)𝑣.

oleh sebab itu,

𝛼𝑓(𝑢) + (1 − 𝛼)𝑓(𝑣) ≥ 𝑓(𝛼𝑢 + (1 − 𝛼)𝑣).

Oleh sebab itu,dari Teorema 22.4,f adalah fumgsi konveks.

Gambar 22.6 Interpretasi Geometri dari Teorema 22.4


Teorema 22.5 Misalkan 𝑓: Ω → ℝ, 𝑓 ∈⊂2 , didefinisikan
konveks terbuka pada set Ω ⊂ ℝ𝑛 . Kemudian, f adalah
konveks pada Ω jika dan hanya jika untuk masing-masing
𝑥 ∈ Ω, 𝐻𝑒𝑠𝑠𝑖𝑎𝑛 𝐹(𝑥) fungsi f pada x adalah matriks
semidefinite positif.

Bukti. ⇐ Biarkan 𝑥, 𝑦 ∈ Ω. Karena 𝑓 ∈⊂2 , dengan teorema


Taylor ada 𝛼 ∈ (0,1) sedemikian rupa sehingga

1
𝑓(𝑦) = 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥) + 2 (𝑦 − 𝑥)𝑇 𝐹(𝑥 +

𝛼(𝑦 − 𝑥))(𝑦 − 𝑥).

Karena 𝐹(𝑥 + 𝛼(𝑦 − 𝑥)) adalah semidefinite positif,

(𝑦 − 𝑥)𝑇 𝐹(𝛼𝑦 + (1 − 𝛼)𝑥)(𝑦 − 𝑥) ≥ 0.

Karena itu, kita mempunyai


𝑓(𝑦) ≥ 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥),

Yang menyiratkan bahwa f adalah konveks, dengan


Teorema 22.4.

⇒ Kita menggunakan contraposition. Asumsikan bahwa


ada 𝑥 ∈ Ω sehingga 𝐹(𝑥) tidak semidefinite positif. Oleh
karena itu, ada 𝑑 𝜖 ℝ𝑛 sedemikian sehingga 𝑑 𝑇 𝐹(𝑥)𝑑 < 0
. Dengan asumsi, Ω terbuka; Dengan demikian, titik x
adalah titik interior. Dengan kontinuitas matriks Hessian,
ada sebuah nol 𝑠 ∈ ℝ seperti 𝑥 + 𝑠𝑑 ∈ Ω, dan jika kita
menulis 𝑦 = 𝑥 + 𝑠𝑑, maka untuk semua titik z pada
segmen garis bergabung 𝑥 dan 𝑦, kita memiliki 𝑑 𝑇 𝐹(𝑧) <
0. Dengan teorema Taylor ada 𝛼 ∈ (0,1) sedemikian rupa
sehingga

𝑓(𝑦) = 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥)


1
+ (𝑦 − 𝑥)𝑇 𝐹(𝑥 + 𝛼(𝑦 − 𝑥))(𝑦 − 𝑥)
2
1
= 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥) + 2 𝑠 2 𝑑 𝑇 𝐹(𝑥 + 𝛼𝑠𝑑)𝑑,

Karena 𝛼 ∈ (0,1), titik 𝑥 + 𝛼𝑠𝑑 ada pada segmen garis


yang bergabung dengan 𝑥 dan 𝑦, dan oleh karena itu

𝑑 𝑇 𝐹(𝑥 + 𝛼𝑠𝑑)𝑑 < 0.

Karena s ≠ 0, kita memiliki𝑆 2 > 0 , dan karenanya

𝑓(𝑦) < 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥).


Oleh karena itu, dengan Teorema 22.4, 𝑓 bukanlah fungsi
konveks.

Teorema 22.5 dapat diperkuat untuk memasukkan


himpunan nonopen dengan memodifikasi kondisi menjadi
(𝑦 − 𝑥)𝑇 𝐹(𝑥)(𝑦 − 𝑥) ≥ 0 untuk semua 𝑥, 𝑦 ∈ Ω (dan
mengasumsikan bahwa 𝑓 ∈⊂2 pada beberapa rangkaian
terbuka yang berisi Ω ; misalnya, 𝑓 ∈⊂2 pada ℝ𝑛 ). Sebuah
bukti yang serupa dengan yang di atas bisa digunakan
dalam kasus ini.

Perhatikan bahwa dengan definisi konveks, fungsi 𝑓: Ω →


ℝ, 𝑓 ∈⊂2, diketuai konveks pada saat Ω ⊂ ℝ𝑛 , jika dan
hanya jika untuk semua 𝑥 𝜖 Ω, Hessian 𝐹(𝑥) dari 𝑓 adalah
semidefinite negatif.

22.3 Masalah Optimal Convex

Teorema 22.6 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks


yang didefinisikan pada set Convex Ω ⊂ ℝ𝑛 . Kemudian,
satu titik adalah alat peningkat global 𝑓 over Ω. Jika dan
hanya jika itu adalah alat minimal lokal 𝑓.

Bukti. ⇒ Ini sudah jelas.

⇐ Kami membuktikan ini dengan cara kontraksi. Misalkan


𝑥 ∗ bukan alat peningkat global 𝑓 over Ω. Kemudian, untuk
beberapa 𝑦 𝜖 Ω, kita memiliki 𝑓(𝑦) < 𝑓(𝑥 ∗ ). Dengan
asumsi, fungsi 𝑓 adalah konveks, dan karenanya untuk
semua 𝛼 ∈ (0,1),

𝑓(𝛼𝑦) + (1 − 𝛼)𝑥 ∗ ) ≤ 𝛼𝑓(𝑦) + (1 − 𝛼)𝑓(𝑥 ∗ ).

Karena 𝑓(𝑦) < 𝑓(𝑥 ∗ ), kita mempunyai

𝛼𝑓(𝑦) + (1 − 𝛼)𝑓(𝑥 ∗ ) = 𝛼(𝑓(𝑦) − 𝑓( 𝑥 ∗ )) + 𝑓(𝑥 ∗ ) <


𝑓(𝑥 ∗ ).

Jadi, untuk semua 𝛼 ∈ (0,1)

𝑓(𝛼𝑦 + (1 − 𝛼)𝑥 ∗ ) < 𝑓(𝑥 ∗ ).

Oleh karena itu, ada titik-titik yang sewenang-wenang


mendekati 𝑥 ∗ dan memiliki nilai fungsi obyektif yang lebih
rendah. Misalnya, urutan {yn} titik yang diberikan oleh

1 1
𝑦𝑛 = 𝑦 + (1 − ) 𝑥 ∗
𝑛 𝑛

Konvergen ke 𝑥 ∗ , dan 𝑓(𝑦) < 𝑓(𝑥 ∗ ). Makanya, 𝑥 ∗ bukan


minimizer lokal, yang melengkapi buktinya.

Kami sekarang menunjukkan bahwa set pengoptimalan


global bersifat konveks. Untuk ini, kita butuh lemma
berikut.

Lemma 22.1 Misalkan 𝑔: Ω → ℝ, menjadi fungsi konveks


yang didefinisikan konveks pada set Ω ⊂ ℝ𝑛 . Kemudian,
untuk masing-masing 𝑐 𝜖 ℝ, himpunan

Γ𝑐 = {𝑥 ∈ Ω: 𝑔(𝑥) ≤ 𝑐}
adalah himpunan konveks.

Bukti. Biarkan 𝑥, 𝑦 𝜖 Γ𝑐 . Kemudian, 𝑔(𝑥) ≤ 𝑐 dan 𝑔(𝑦) ≤


𝑐. Karena 𝑔 adalah konveks, untuk semua 𝛼 ∈ (0,1),

𝑔(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑔(𝑥) + (1 − 𝛼)𝑔(𝑦) ≤ 𝑐.

Oleh karena itu, 𝛼𝑥 + (1 − 𝛼)𝑦 𝜖 Γ𝑐 , yang menyiratkan


bahwa Γ𝑐 adalah konveks.

Konsekuensi 22.1 Misalkan 𝑓: Ω → ℝ menjadi fungsi


cembung yang didefinisikan konveks pada saat Ω ℝ𝑛 .
Kemudian, himpunan semua alat penentu global 𝑓 over Ω
adalah satu konveks.

Bukti. Hasilnya langsung dari Lemma 22.1 dengan setting

𝑐 = min 𝑓(𝑥).
𝑥∈Ω

Kami sekarang menunjukkan bahwa jika fungsi objektif


terdiferensialkan terus menerus dan konveks, maka kondisi
prima yang diperlukan (lihat Teorema 6.1) untuk satu titik
menjadi minimizer juga cukup. Kami menggunakan lemma
berikut.

Lemma 22.2 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks


yang didefinisikan konveks pada saat Ω ⊂ ℝ𝑛 dan 𝑓 ∈⊂1
pada set konveks terbuka yang mengandung Ω. Misalkan
titik 𝑥 ∗ 𝜖 Ω sedemikian sehingga untuk semua 𝑥𝜖Ω, 𝑥 ≠ 𝑥 ∗ ,
kita mempunyai
𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) ≥ 0.

Kemudian, 𝑥 ∗ adalah alat peningkat global 𝑓 over Ω.

Bukti. Karena fungsi 𝑓 adalah konveks, dengan Teorema


22.4, untuk semua 𝑥 𝜖 Ω, kita mempunyai

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) + 𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ).

Oleh karena itu, kondisi 𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) ≥ 0 menyiratkan


bahwa 𝑓(𝑥) < 𝑓(𝑥 ∗ ).

Perhatikan bahwa untuk 𝑥 𝜖 Ω, vektor 𝑥 − 𝑥 ∗ dapat


diartikan sebagai arah yang layak pada 𝑥 ∗ (lihat Definisi
6.2). Menggunakan Lemma 22.2, kita memiliki teorema
berikut (bandingkan dengan Teorema 6.1).

Teorema 22.7 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks


yang didefinisikan pada set konveks Ω ⊂ ℝ𝑛 , dan 𝑓 ∈⊂1
pada set komveks terbuka yang mengandung Ω. Misalkan
titik 𝑥 ∗ 𝜖 Ω sedemikian sehingga untuk setiap arah yang
layak d pada 𝑥 ∗ , kita mempunyai

𝑑 𝑇 ∇𝑓(𝑥 ∗ ) ≥ 0.

dimana 𝑥 ∗ adalah global minimal dari 𝑓 over Ω.

Bukti. Misalkan 𝑥 𝜖 Ω, 𝑥 ≠ 𝑥 ∗ . Dengan konveksitas Ω,

𝑥 ∗ + 𝛼(𝑥 − 𝑥 ∗ ) = 𝛼𝑥 + (1 − 𝛼)𝑥 ∗ ∈ Ω
untuk semua 𝛼 ∈ (0,1). Oleh karena itu, vektor 𝑑 = 𝑥 − 𝑥 ∗
adalah arah yang layak pada 𝑥 ∗ (lihat Definisi 6.2). Dengan
asumsi,

𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) = 𝑑𝑇 ∇𝑓(𝑥 ∗ ) ≥ 0.

Oleh karena itu, oleh Lemma 22.2, 𝑥 ∗ adalah alat peningkat


global 𝑓 over Ω.

Dari Teorema 22.7, kita dengan mudah menyimpulkan


akibat wajar berikut ini (bandingkan dengan Corollary 6.1).

Konsekuensi 22.2 Misalkan 𝑓: Ω → ℝ, 𝑓 ∈⊂1 , jadilah


fungsi konveks yang didefinisikan pada set konveks Ω ⊂
ℝ𝑛 . Misalkan titik 𝑥 ∗ 𝜖 Ω itu seperti itu

∇𝑓(𝑥 ∗ ) = 0.

dimana 𝑥 ∗ adalah global minimal dari 𝑓 over Ω.

Kami sekarang mempertimbangkan masalah optimasi yang


dibatasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑓(𝑥)
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 ℎ(𝑥) = 0

Kami berasumsi bahwa set yang layak adalah konveks.


Contoh di mana hal ini terjadi adalah kapan

ℎ(𝑥) = 𝐴𝑥 − 𝑏.
Teorema berikut menyatakan bahwa yang disediakan set
yang layak adalah konveks, kondisi Lagrange adalah Cukup
untuk satu titik menjadi minimizer.

Teorema 22.8 Misalkan 𝑓: ℝ𝑛 → ℝ, 𝑓 ∈⊂1 , menjadi fungsi


konveks pada himpunan titik layak

Ω = {𝑥 ∈ ℝ𝑛 ∶ ℎ(𝑥) = 0},

Dimana ℎ ∶ ℝ𝑛 → ℝ𝑚 , ℎ ∈⊂1 , dan Ω adalah konveks.


Misalkan ada 𝑥 ∗ 𝜖 Ω dan 𝜆∗ ∈ ℝ𝑚 sedemikian sehingga

Kemudian, 𝑥 ∗ adalah alat peningkat global 𝑓 over Ω.

Bukti. Dengan Teorema 22.4, untuk semua 𝑥 𝜖 Ω, kita


mempunyai

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) + 𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ).

substitusi 𝐷𝑓(𝑥 ∗ ) = −𝜆∗𝑇 𝐷ℎ(𝑥 ∗ ) Ke dalam


ketidaksetaraan di atas hasil tersebut.

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) − 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) .

dikarenakan Ω adalah konveks, (1 − 𝛼)𝑥 ∗ + 𝛼𝑥 ∈ Ω untuk


setiap 𝛼 ∈ (0,1),dengan demikian

ℎ(𝑥 ∗ + 𝛼(𝑥 − 𝑥 ∗ )) = ℎ((1 − 𝛼) + 𝛼𝑥) = 0

untuk setiap 𝛼 ∈ (0,1). Premultiplying oleh 𝜆∗𝑇 , substitusi


𝜆∗𝑇 ℎ(𝑥 ∗ ) = 0, and membagi dengan 𝛼,kita mendapatkan
𝜆∗𝑇 ℎ(𝑥 ∗ + 𝛼(𝑥 − 𝑥 ∗ )) − 𝜆∗𝑇 ℎ(𝑥 ∗ )
=0
𝛼

untuk setiap 𝛼 ∈ (0,1). Jika kita sekarang mengambil batas


sebagai 𝛼 → 0 dan menerapkan definisi derivatif 𝜆∗𝑇 ℎ pada
𝑥 ∗ directional ke arah 𝑥 − 𝑥 ∗ (lihat Bagian 6.2), kita
mendapatkan

𝜆∗𝑇 𝐷ℎ(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) = 0.

karenanya,

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ),

Yang menyiratkan bahwa 𝑥 ∗ adalah alat peningkat global 𝑓


over Ω.

Pertimbangkan masalah optimasi yang dibatasi secara


umum

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑓(𝑥)
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 ℎ(𝑥) = 0
𝑔(𝑥) ≤ 0

Seperti sebelumnya, kita asumsikan bahwa set yang layak


adalah konveks. Ini adalah kasus jika, misalnya, dua
himpunan {𝑥: ℎ(𝑥) = 0} dan {𝑥: 𝑔(𝑥) = 0} adalah konveks,
karena himpunan yang layak adalah persimpangan kedua
rangkaian ini (lihat juga Teorema 4.1). Kita telah melihat
contoh di mana himpunan {𝑥: ℎ(𝑥) = 0} adalah konveks.
Di sisi lain, contoh di mana himpunan {𝑥: 𝑔(𝑥) ≤ 0} adalah
konveks ketika komponen 𝑔 = [𝑔1 , … , 𝑔𝑝 ]𝑇 adalah semua
fungsi konveks. Memang, himpunan {𝑥: 𝑔(𝑥) ≤ 0} adalah
perpotongan dari himpunan {𝑥: 𝑔𝑖 (𝑥) ≤ 0}, 𝑖 = 1, … , 𝑝.
Karena masing-masing set ini konveks (oleh Lemma 22.1),
persimpangan mereka juga konveks.

Kami sekarang membuktikan bahwa kondisi Karush-Kuhn-


Tucker (KKT) sudah cukup untuk meminimalkan potensi
masalah di atas.

Teorema 22.9. Misalkan 𝑓: ℝ𝑛 → ℝ, 𝑓 ∈⊂1 , Jadilah fungsi


konveks pada set poin yang layak

Ω = {𝑥 𝜖 ℝ𝑛 : ℎ(𝑥) = 0, 𝑔(𝑥) ≥ 0},

dimana ℎ ∶ ℝ𝑛 → ℝ𝑚 , 𝑔 ∶ ℝ𝑛 → ℝ𝑝 , ℎ, 𝑔 ∈⊂1, dan Ω


adalah konveks. Misalkan ada 𝑥 ∗ 𝜖 Ω, 𝜆∗ ∈ ℝ𝑚 , dan
𝜇 ∗ 𝜖 ℝ𝑝 , begitulah

1. 𝜇 ∗ ≥ 0.
2. 𝐷𝑓(𝑥 ∗ ) + 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ ) + 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ ) = 0𝑇 .
3. 𝜇 ∗𝑇 𝑔(𝑥 ∗ ) = 0.

dengan demikian, 𝑥 ∗ adalah global minimal dari 𝑓 over Ω.

Bukti. Misalkan 𝑥 𝜖 Ω. Dengan konveksitas 𝑓 dan Teorema


22.4,

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) + 𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ).

Dengan menggunakan kondisi 2, kita dapatkan


𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) − 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) − 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ )(𝑥 −
𝑥 ∗ ).

Seperti dalam bukti Teorema 22.8, kita dapat menunjukkan


bahwa 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) = 0. Kita sekarang mengklaim
bahwa 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) ≤ 0. Untuk melihat Ini,
perhatikan bahwa karena Ω adalah konveks, (1 − 𝛼)𝑥 ∗ +
𝛼𝑥 ∈ Ω untuk semua 𝑥 ∈ (0,1). Demikian,

𝑔(𝑥 ∗ + 𝛼(𝑥 − 𝑥 ∗ )) = 𝑔((1 − 𝛼)𝑥 ∗ + 𝛼𝑥) ≤ 0

untuk setiap 𝑥 ∈ (0,1). Premultiplying oleh 𝜇 ∗𝑇 ≥ 0𝑇 (dari


kondisi 1), substitusi 𝜇 ∗𝑇 𝑔(𝑥 ∗ ) = 0 ( dari kondisi 3), dan
memisahkan 𝛼, kita mendapatkan

𝜇 ∗𝑇 𝑔(𝑥 ∗ +𝛼(𝑥−𝑥 ∗ ))−𝜇 ∗𝑇 𝑔(𝑥 ∗ )


≤ 0.
𝛼

Kita sekarang mengambil batas sebagai 𝛼 → 0 untuk


mendapatkan 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) ≤ 0.

Dari hal diatas, kita mempunyai

𝑓(𝑥) ≥ 𝑓(𝑥 ∗ ) − 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) − 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ )(𝑥 − 𝑥 ∗ )


≥ 𝑓(𝑥 ∗ )

untuk setiap 𝑥 ∈ Ω, Yang melengkapi buktinya.

Contoh 22.7 Rekening bank dimulai dengan 0 dollar. Pada


awal setiap bulan, kami menyimpan sejumlah uang ke
rekening bank. Diketahui oleh 𝑥𝑘 jumlah yang disetorkan
pada bulan ke 𝑘, 𝑘 = 1,2, … Misalkan tingkat bunga
bulanan adalah 𝑟 > 0 dan bunga dibayarkan ke rekening
pada akhir setiap bulan (dan digabungkan). Kami ingin
memaksimalkan jumlah total akumulasi uang pada akhir n
bulan, sehingga total uang yang disetorkan selama n bulan
tidak melebihi nilai D dolar (di mana 𝐷 > 0).

Untuk mengatasi masalah ini, pertama-tama kita


tunjukkan bahwa masalahnya dapat diajukan sebagai
program linier, dan oleh karena itu merupakan masalah
optimasi konveks. Biarkan 𝑦𝑘 menjadi jumlah total di bank
pada akhir bulan ke-k. Kemudian, 𝑦𝑘 = (1 + 𝑟)(𝑦𝑘−1 +
𝑥𝑘 ), 𝑘 ≥ 1, dengan 𝑦0 = 0. Oleh karena itu, kita ingin
memaksimalkan 𝑦𝑛 tunduk pada batasan bahwa 𝑥𝑘 > 0,
𝑘 = 1, … , 𝑛, dan 𝑥1 + ⋯ + 𝑥𝑛 . Mudah untuk
menyimpulkannya

𝑦𝑛 = (1 + 𝑟)𝑛 𝑥1 + (1 + 𝑟)𝑛−1 𝑥2 + ⋯ + (1 + 𝑟)𝑥𝑛 .

Misalkan 𝑐 𝑇 = [(1 + 𝑟)𝑛 , (1 + 𝑟)𝑛−1 , … , (1 + 𝑟)], 𝑒 𝑇 =


[1, … 1],dan 𝑥 = [𝑥1 , … , 𝑥𝑛 ]𝑇 maka, kita bisa menulis
masalah sebagai

𝑚𝑎𝑥𝑖𝑚𝑖𝑧𝑒 𝑐 𝑇 𝑥
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑒 𝑇 𝑥 ≤ 𝐷
𝑥 ≥ 0,

Yang merupakan program linier.

Secara intuitif jelas bahwa strategi yang optimal adalah


menyetor D dolar di bulan pertama. Untuk menunjukkan
bahwa strategi ini memang optimal, kita menggunakan
Teorema 22.9. Misalkan 𝑥 ∗ = [𝐷, 0, … ,0]𝑇 ∈ ℝ𝑛 . Karena
masalahnya adalah masalah pemrograman cembung, cukup
untuk menunjukkan bahwa 𝑥 ∗ memenuhi kondisi KKT
(lihat Teorema 22.9). Kondisi KKT untuk masalah ini
adalah

−𝑐 𝑇 + 𝜇 (1) 𝑒 𝑇 − 𝜇 (2)𝑇 = 0,
𝜇 (1) (𝑒 𝑇 𝑥 ∗ − 𝐷) = 0,
𝜇 (2)𝑇 𝑥 ∗ = 0,
𝑒 𝑇 𝑥 ∗ − 𝐷 ≤ 0,
−𝑥 ∗ ≤ 0,
𝜇 (1) ≥ 0,
𝜇 (2) ≥ 0,
𝑒 𝑇 𝑥 ≤ 𝐷,
𝑥 ≥ 0,

Dimana 𝜇 (1) ∈ ℝ𝑛 dan 𝜇 (2) ∈ ℝ𝑛 . Misalkan 𝜇 (1) =


(1 + 𝑟)𝑛 dan 𝜇 (1) = (1 + 𝑟)𝑛 𝑒 − 𝑐. Kemudian, jelas
kondisi KKT sudah terpenuhi. Oleh karena itu, 𝑥 ∗ adalah
global minimizer.

22.4 Pemrograman Semidefinite

Pemrograman semidefinite adalah subfield dari optimasi


konveks yang berkaitan dengan meminimalkan fungsi
objektif linier yang memiliki ketidaksetaraan matriks linier.
Ketidaksetaraan matriks linier mendefinisikan himpunan
konveks yang layak ditetapkan dimana fungsi tujuan linier
dapat diminimalkan. Pemrograman semidefinite dapat
dipandang sebagai perpanjangan dari pemrograman linier,
di mana ketidaksetaraan komponen pada vektor digantikan
oleh ketidaksetaraan matriks (lihat Latihan 22.20). Untuk
bacaan lebih lanjut mengenai pemrograman semidefinite,
kami merekomendasikan sebuah makalah survei yang
sangat bagus oleh Vandenberghe dan Boyd [128].

Ketidaksamaan dan Sifat Linear Matrix

Pertimbangkan n + 1 matriks simetris nyata

𝐹𝑖 = 𝐹𝑖𝑇 ∈ ℝ𝑚 𝑥 𝑚 , 𝑖 = 0,1, … , 𝑛

Dan sebuah vektor

𝑥 = [𝑥1 , … , 𝑥𝑛 ]𝑇 ∈ ℝ𝑛 .

Kemudian,

𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛

= 𝐹0 + ∑ 𝑥𝑖 𝐹𝑖
𝑖=1

Adalah fungsi affine dari x, karena 𝐹(𝑥) terdiri dari istilah


linier ∑𝑛𝑖=1 𝑥𝑖 𝐹𝑖 dan istilah konstan 𝐹0 .

Pertimbangkan sekarang sebuah batasan ketidaksetaraan


formulir
𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛 ≥ 0

Ketidaksamaan kendala di atas adalah untuk ditafsirkan


sebagai himpunan vektor x seperti itu

𝑧 𝑇 𝐹(𝑥)𝑧 ≥ 0 𝑢𝑛𝑡𝑢𝑘 𝑠𝑒𝑚𝑢𝑎 𝑧 ∈ ℝ𝑚 ;

Artinya, 𝐹(𝑥) adalah semidefinite positif [atau, dalam


notasi biasa, 𝐹(𝑥) ≥ 0]. Ingatlah bahwa istilah 𝐹𝑖 mewakili
matriks konstan, x tidak diketahui, dan 𝐹(𝑥) = 𝐹(𝑥)𝑇
adalah fungsi affine x. Ekspresi 𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ +
𝑥𝑛 𝐹𝑛 ≥ 0 Disebut dalam literatur sebagai ketidaksetaraan
matriks linier (LMI), meski istilah ketidaksetaraan matriks
affine nampaknya lebih tepat. Mudah untuk memverifikasi
itu set {𝑥 ∶ 𝐹(𝑥) ≥ 0} konveks (lihat Latihan 22.20).

Kita bisa berbicara sama dengan LMI dari bentuk 𝐹(𝑥) ≥


0, dimana persyaratannya adalah untuk 𝐹(𝑥) menjadi
positif definitif (bukan hanya semidefinite positif). Sekali
lagi mudah untuk melihat bahwa himpunan {𝑥 ∶ 𝐹(𝑥) ≥ 0}
adalah konveks.

Sebuah sistem LMI

𝐹1 (𝑥) ≥ 0, 𝐹2 (𝑥) ≥ 0, … , 𝐹𝑘 (𝑥) ≥ 0

Dapat direpresentasikan sebagai satu single LMI:


𝐹1 (𝑥)
𝐹2 (𝑥)
𝐹(𝑥) = ≥ 0.

[ 𝐹𝑘 (𝑥)]

Sebagai contoh, sebuah ketidaksetaraan linier yang


melibatkan 𝑚 𝑥 𝑛 matriks real konstan A dari bentuknya
𝐴𝑥 ≤ 𝑏

Dapat diwakili sebagai m LMI:

𝑏𝑖 − 𝑎𝑖𝑇 𝑥 ≥ 0, 𝑖 = 1,2, … , 𝑚,

Dimana 𝑎𝑖𝑇 adalah baris ke-i dari matriks A. Kita dapat


melihat setiap ketidaksamaan skalar sebagai LMI. Kami
kemudian mewakili m LMI sebagai satu LMI:

Matriks

Dengan fakta di atas sebagai latar belakang, sekarang kita


bisa memberikan contoh pemrograman semidefinite:

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑐 𝑇 x
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝐹(𝑥) ≥ 0.

Properti matriks yang kita bahas selanjutnya berguna saat


mengubah LMI tertentu atau ketidaksetaraan matriks
nonlinear menjadi LMI yang setara. Kita mulai dengan
pengamatan sederhana. Misalkan 𝑃 menjadi nonsingular
𝑛 𝑥 𝑛 matriks dan misalkan 𝑥 = 𝑀𝑧, dimana 𝑀 ∈ ℝ𝑛 𝑥 𝑛
sehingga det 𝑀 ≠ 0. Kemudian, kita miliki
𝑥 𝑇 𝑃(𝑥) ≥ 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝑧 𝑇 𝑀𝑇 𝑃𝑀𝑧 ≥ 0;

itu adalah,

𝑃 ≥ 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝑀𝑇 𝑃𝑀 ≥ 0

Demikian pula,

𝑃 > 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝑀𝑇 𝑃𝑀 > 0

Misalkan kita memiliki matriks bujursangkar

𝐴 𝐵
[ ]
𝐵𝑇 𝐷

Kemudian, dengan pengamatan di atas,

𝐴 𝐵
[ ]≥
𝐵𝑇 𝐷
0 𝐼 𝐴 𝐵 0 𝐼
0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 [ ][ ][ ] ≥ 0,
𝐼 0 𝐵𝑇 𝐷 𝐼 0

Dimana 𝐼 adalah matriks identitas dari dimensi yang sesuai.


Dengan kata lain,

[
𝐴 𝐵
] ≥ 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 [𝐷 𝐵 𝑇 ] ≥ 0.
𝐵𝑇 𝐷 𝐵 𝐴

Kami sekarang memperkenalkan konsep pelengkap Schur,


berguna dalam mempelajari LMI. Pertimbangkan matriks
bujursangkar dari bentuknya

𝐴11 𝐴12
[ ],
𝐴21 𝐴22
Dimana 𝐴11 dan 𝐴22 adalah submatriks persegi. Misalkan
matriks 𝐴11 dapat dibalik. Lalu, kita punya

𝐼 0 𝐴11 𝐴12 𝐼 −1
−𝐴11 𝐴12 ] =
[ −1 ][ ][
−𝐴21 𝐴11 𝐼 𝐴21 𝐴22 0 𝐼
𝐴11 0
[ −1 ].
0 𝐴22 − 𝐴21 𝐴11 𝐴12

Membiarkan

−1
△11 = 𝐴22 − 𝐴21 𝐴11 𝐴12 ,

Yang disebut komplemen Schur dari 𝐴11 . Untuk kasus


ketika 𝐴12 = 𝐴𝑇 21 , kita miliki

𝐼 0 𝐴11 𝐴𝑇21 𝐼 𝐴21 ] = [𝐴11


−1 𝑇
−𝐴11 0
[ −1 ][ ][ ],
−𝐴21 𝐴11 𝐼 𝐴21 𝐴22 0 𝐼 0 △11

dimana

−1 𝑇
△11 = 𝐴22 − 𝐴21 𝐴11 𝐴21

Karenanya,

𝐴11 𝐴𝑇21 𝐴 0
[ ] > 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 [ 11 ] > 0;
𝐴21 𝐴22 0 △11

itu adalah,

𝐴11 𝐴𝑇21
[ ] > 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝐴11 > 0 𝑑𝑎𝑛 △11 >
𝐴21 𝐴22
0.

Diberikan
𝐴11 𝐴12
[ ],
𝐴21 𝐴22

Kita juga bisa mendefinisikan komplemen Schur dari 𝐴22 ,


dengan asumsi bahwa 𝐴22 dapat dibalik. Kita punya

−𝐴12 𝐴−1 𝐴 𝐴12 𝐼 0 △ 0


[𝐼 22 ] [ 11 ] [ −1 ] = [ 22 ],
0 𝐼 𝐴21 𝐴22 −𝐴22 𝐴21 𝐼 0 𝐴22

Dimana △22 = 𝐴11 − 𝐴12 𝐴−1


22 𝐴21 adalah komplemen Schur

dari 𝐴22 . Jadi, untuk kasus di mana 𝐴12 = 𝐴𝑇 21 ,

𝐴11 𝐴𝑇21
[ ] > 0 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 ℎ𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝐴22 > 0 𝑑𝑎𝑛 △22 >
𝐴21 𝐴22
0.

Banyak masalah optimasi, desain kontrol, dan pemrosesan


sinyal dapat dirumuskan dalam bentuk LMI. Untuk
menentukan ada tidaknya titik 𝑥 sehingga 𝐹(𝑥) > 0 disebut
kelayakan masalah. Kami mengatakan bahwa LMI tidak
layak jika tidak ada solusi semacam itu.

Contoh 22.8 Kami sekarang menyajikan contoh sederhana


yang menggambarkan masalah kelayakan LMI. Misalkan
𝐴 ∈ ℝ𝑚×𝑚 adalah matriks kuadrat konstan nyata. Misalkan
kita ingin menentukan apakah 𝐴 memiliki semua nilai
eigennya di bidang setengah kompleks kiri terbuka. Telah
diketahui dengan baik bahwa kondisi ini benar jika dan
hanya jika ada matriks definit positif simetris yang nyata 𝑃
sedemikian rupa sehingga
𝐴𝑇 𝑃 + 𝑃𝐴 < 0,

Atau, secara ekuivalen,

−𝐴𝑇 𝑃 − 𝑃𝐴 > 0

(Juga disebut ketidaksamaan Lyapunov; lihat [16]). Dengan


demikian, lokasi semua nilai eigen dari A berada di bidang
setengah kompleks kiri terbuka setara dengan kelayakan
ketidaksetaraan matriks berikut:

𝑃 0
[ ] > 0;
0 −𝐴𝑇 𝑃 − 𝑃𝐴

Artinya, keberadaan 𝑃 = 𝑃𝑇 > 0 sehingga 𝐴𝑇 𝑃 + 𝑃𝐴 < 0.

Kami sekarang menunjukkan bahwa menemukan 𝑃 = 𝑃𝑇 >


0 sehingga 𝐴𝑇 𝑃 + 𝑃𝐴 < 0 benar-benar sebuah LMI. Untuk
ini, misalkan

𝑥1 𝑥2 … 𝑥𝑚
𝑥2 𝑥𝑚+1 … 𝑥2𝑚−1
𝑃=[ ⋮ ⋮ ],
⋱ ⋮
𝑥𝑚 𝑥2𝑚−1 ⋯ 𝑥𝑛

dimana

𝑛 = 𝑚(𝑚+1)
2
.

Selanjutnya kita definisikan matriks berikut ini:


1 0 0 ⋯ 0
0 0 0 ⋯ 0
𝑃1 = 0 0 0 ⋯ 0,
⋮ ⋮ ⋮ ⋱ ⋮
[0 0 0 ⋯ 0]

0 1 0 ⋯ 0
1 0 0 ⋯ 0
𝑃2 = 0 0 0 ⋯ 0,
⋮ ⋮ ⋮ ⋱ ⋮
[0 0 0 ⋯ 0]

0 0 0 ⋯ 0
0 0 0 ⋯ 0
𝑃𝑛 = 0 0 0 ⋯ 0.
⋮ ⋮ ⋮ ⋱ ⋮
[0 0 0 ⋯ 1]

Perhatikan bahwa 𝑃𝑖 hanya memiliki elemen tak-nol yang


sesuai dengan 𝑥𝑖 di 𝑃. Misalkan

𝐹𝑖 = −𝐴𝑇 𝑃𝑖 − 𝑃𝑖 𝐴, 𝑖 = 1,2, … , 𝑛.

Kita kemudian bisa menulis

𝐴𝑇 𝑃 + 𝑃𝐴 = 𝑥𝑖 (𝐴𝑇 𝑃1 + 𝑃1 𝐴) + 𝑥2 (𝐴𝑇 𝑃2 + 𝑃2 𝐴) + ⋯
+ 𝑥𝑛 (𝐴𝑇 𝑃𝑛 + 𝑃𝑛 𝐴)

= −𝑥1 𝐹1 − 𝑥2 𝐹2 − ⋯ − 𝑥𝑛 𝐹𝑛 < 0

Membiarkan

𝐹(𝑥) = 𝑥1 𝐹1 + 𝑥2 𝐹2 + ⋯ + 𝑥𝑛 𝐹𝑛 .

Kemudian,
𝑃 = 𝑃𝑇 > 0 𝑑𝑎𝑛 𝐴𝑇 𝑃 + 𝑃𝐴 < 0

jika dan hanya jika

𝐹(𝑥) > 0

Perhatikan bahwa LMI ini melibatkan ketimpangan yang


ketat. Kebanyakan pemecah angka tidak menangani
ketidaksetaraan yang ketat. Pemecah semacam itu hanya
memperlakukan ketidaksetaraan yang ketat (>) sebagai
ketidaksetaraan yang tidak ketat (≥).

LMI pemecah

Ketidaksamaan 𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛 ≥ 0 disebut


representasi kanonik dari sebuah LMI. Pemecah LMI
numerik tidak berurusan langsung dengan LMI dalam
bentuk kanonik karena berbagai inefisiensi. Sebagai
gantinya, pemecah LMI menggunakan representasi LMI
yang terstruktur.

Kita bisa menggunakan toolbox MATLAB's LMI untuk


menyelesaikan LMI secara efisien. Toolbox ini memiliki
tiga jenis pemecah LMI, yang akan kita bahas selanjutnya.

Menemukan Solusi yang Layak Di Bawah Kendala LMI

Pertama, kita membahas pemecah LMI MATLAB untuk


memecahkan masalah kelayakan yang didefinisikan oleh
sistem batasan LMI yang diberikan. Dengan menggunakan
pemecah ini, kita bisa menyelesaikan sistem LMI dalam
bentuk apapun

𝑁 𝑇 ℒ(𝑋1 , … , 𝑋𝑘 )𝑁 ≤ 𝑀𝑇 ℛ(𝑋1 , … , 𝑋𝑘 )𝑀,

Dimana 𝑋1 , … , 𝑋𝑘 adalah variabel matriks, N adalah faktor


luar kiri, M adalah faktor luar yang tepat, ℒ (X1, ..., Xk)
adalah faktor dalam kiri, dan ℛ(𝑋1 , … , 𝑋𝑘 ) adalah faktor
dalam yang tepat. Matriks ℒ (·) dan ℛ (·), secara umum,
matriks blok simetris. Kami mencatat bahwa istilah sisi kiri
mengacu pada apa yang ada di sisi "lebih kecil" dari
ketidaksetaraan 0 ≤ 𝑋. Dengan demikian di 𝑋 ≥ 0, matriks
𝑋 masih berada di sisi kanan karena berada pada "lebih
besar "Sisi ketidaksetaraan.

Kami sekarang memberikan deskripsi tentang pendekatan


yang dapat digunakan untuk menyelesaikan masalah
kelayakan sistem LMI yang diberikan. Untuk
menginisialisasi deskripsi sistem LMI, kita mengetikkan
setlmis ([]). Kemudian kita mendeklarasikan variabel
matriks dengan menggunakan perintah lmivar. Perintah
lmiterm memungkinkan kita untuk menentukan LMI yang
merupakan sistem LMI yang sedang dipertimbangkan.
Selanjutnya, kita perlu mendapatkan representasi internal
menggunakan perintah getlmis. Kami selanjutnya
menghitung solusi yang layak untuk sistem LMI dengan
menggunakan perintah pegang. Setelah itu, kita ekstrak
nilai variabel matriks dengan perintah dec2mat. Singkatnya,
struktur umum program MATLAB untuk menemukan
solusi yang layak untuk rangkaian LMI bisa berbentuk

setlmis ( [ ] )

lmivar

kmiterm

lmiterm

getlmis

feasp

dec2mat

Kami sekarang menganalisis perintah ini secara mendetail


sehingga pembaca dapat menulis program MATLAB
sederhana untuk menyelesaikan LMI setelah menyelesaikan
bagian ini.

Pertama, untuk membuat variabel dengan nilai matriks


baru, katakanlah, X, pada sistem LMI yang diberikan, kita
menggunakan perintahnya

X = lmivar (type,structure)
Tipe input menentukan struktur dari variabel X. Mungkin
ada tiga struktur variabel matriks. Bila tipe = 1, kita
memiliki matriks matriks diagonal simetris. Tipe input = 2
mengacu pada variabel matriks persegi panjang penuh.
Akhirnya, tipe = 3 mengacu pada kasus lain. Struktur
masukan kedua memberi informasi tambahan mengenai
struktur variabel matriks X. Misalnya, variabel matriks X
bisa berbentuk

𝐷1 𝑂 … 𝑂
𝑂 𝐷2 … 𝑂
𝑋=[ ],
⋮ ⋮ ⋱ ⋮
𝑂 𝑂 … 𝐷𝑟

Dimana masing-masing 𝐷1 adalah matriks simetris persegi.


Untuk contoh di atas kita akan menggunakan type = l.
Variabel matriks di atas memiliki blok 𝑟. Struktur input
adalah matriks r  2 yang barisnya menguraikan blok 𝑖th,
dimana komponen pertama dari setiap baris memberikan
ukuran blok yang sesuai, sedangkan elemen kedua dari
setiap baris menentukan tipe blok. Sebagai contoh,

X = lmivar(1,[3 1])

Menentukan variabel matriks 3x3 simetris penuh. Di


samping itu,

X = lmivar(2,[2 3])

Menentukan variabel matriks 2 x 3 persegi. Akhirnya,


matriks variabel 𝑺 dari bentuk
𝑠1 0 0 0
0 𝑠1 0 0
𝑺=[ 𝑠2 𝑠3 ]
0 0
0 0 𝑠3 𝑠4

dapat dinyatakan sebagai berikut :

s = lmivar(1,[2 0;2 1])

Perhatikan di atas bahwa komponen kedua dari baris


pertama dari input kedua memiliki nilai nol; yaitu, struktur
(1,2) = 0. Ini menggambarkan matriks blok skalar dari
bentuknya

𝐷1 = 𝑠1 𝐼2.

Perhatikan bahwa blok kedua adalah blok penuh 2x2


simetris.

Selanjutnya kita melihat lebih dekat pada sebuah perintah


yang tujuannya adalah untuk menentukan persyaratan
sistem kepentingan LMI. Perintah ini dari

lmiterm(termind,A,B,flag)

Empat elemen yang menentukan syarat masing-masing


LMI dari sistem LMI. Kami memiliki termid (1) = n untuk
menentukan sisi kiri LMI ke-n. Kami menggunakan termid
(1) = - n untuk menentukan sisi kanan LMI ke-n. Dua
elemen tengah dari input termid menentukan lokasi blok.
Jadi termid (2,3) = [i j] mengacu pada istilah yang termasuk
dalam blok (i, j) dari LMI yang ditentukan oleh komponen
pertama. Akhirnya,

Termid (4) = 0 untuk istilah konstan, termid (4) = X untuk


variabel term dalam bentuk AXB, sedangkan termid (4) = -
X untuk variabel term dalam bentuk AX B. Input kedua dan
ketiga dari Perintah lmiterm memberi nilai faktor luar kiri
dan kanan; Artinya, A dan B memberikan nilai faktor
terluar konstan pada variabel syarat AXB dan AX B.
Akhirnya, keempat input ke lmiterm berfungsi sebagai cara
ringkas untuk menentukan ungkapan

𝑨𝑿𝑩 + (𝑨𝑿𝑩)𝑻 .

Dengan demikian, flag = 's' dapat digunakan untuk


menunjukkan ekspresi simetris. Kami sekarang
menggambarkan perintah di atas pada LMI berikut ini :

𝑷𝑨 + (𝑷𝑨)𝑻 ≤ 𝟎.

Kami memiliki satu LMI dengan dua syarat. Kita bisa


menggunakan deskripsi LMI berikut ini :

lmiterm ([1 1 1 p],1,A)

lmiterm ([1 1 1 –p],𝐴′ ,1)

Di sisi lain, kita bisa menggambarkan LMI ini dengan


kompak menggunakan bendera sebagai berikut:

lmiterm ([1 1 1 p],1,A,’S’)


Nah, untuk mengatasi masalah kelayakan yang bisa kita
ketik

[tmin,xfeas]= feas(lmis)

Secara umum, untuk masalah kelayakan LMI yang


diberikan dalam bentuknya

𝑓𝑖𝑛𝑑 𝑥
𝑠𝑢𝑐ℎ 𝑡ℎ𝑎𝑡 𝐿(𝑥) ≤ 𝑅(𝑥),

Tipuan perintah memecahkan masalah cembung tambahan

𝑚𝑖𝑛𝑖𝑚𝑧𝑒 𝑡
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝐿(𝑥) ≤ 𝑅(𝑥) + 𝑡𝐼.

Sistem LMI layak jika minimal t negatif. Kami


menambahkan bahwa nilai saat ini t ditampilkan dengan
cara pada setiap iterasi.

Akhirnya, kita mengubah output pemecah LMI menjadi


variabel matriks dengan menggunakan perintah

P = dec2mat(lmis,xfeas,P).

Contoh 22.9 Misalkan

−1 0 −2 0
𝐴1 = [ ] dan 𝐴2 = [ ].
0 −1 1 −1

Kami menggunakan perintah dari LMI Control Toolbox


yang dibahas di atas untuk menulis sebuah program yang
menemukan 𝑃 sedemikian sehingga 𝑃 > 0,5𝐼2 dan
𝐴1𝑇 𝑃 + 𝑃𝐴1 ≤ 0,

𝐴𝑇2 𝑃 + 𝑃𝐴2 ≤ 0.

Programnya adalah sebagai berikut :

A_1 = [−1 0;0 −1];


A_2 = [−2 0;1 −1];
setlmis([])
P = lmivar(1,[2,1])
lmiterm([1 1 1 P],A_1’,1,’s’)
lmiterm([2 1 1 P],A_2’,1,’s’)
lmiterm([3 1 1 0],.5)
lmiterm([−3 1 1 P],1,1)
lmis=getlmis;
[tmin,xfeas] = feasp(lmis);
P = dec2mat(lmis,xfeas,P)

Meminimalkan Tujuan Linear di Bawah Kendala LMI

Pemecah berikutnya yang kita bahas memecahkan


masalah optimasi konveks

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑐 𝑇 𝑥
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝐴(𝑥) ≤ 𝐵(𝑥).

Notasi 𝐴(𝑥) ≤ 𝐵(𝑥) adalah notasi singkat untuk sistem


LMI terstruktur secara umum.

Pemecah ini dipanggil menggunakan fungsi mincx.


Dengan demikian, untuk mengatasi masalah mincx, selain
menentukan batasan LMI seperti pada masalah tegang,
kami juga menyatakan fungsi objektif linier. Kemudian kita
memanggil fungsi mincx. Kami menggambarkan dan
membedakan pemikir dan pemecah mincx dalam contoh
berikut.

Contoh 22.10 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑐 𝑇 𝑥
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝐴𝑥 ≤ 𝑏,

dimana

𝑐 𝑇 𝑥 = [4 5],
1 1 8
𝐴 = [1 3] , 𝑏 = [18].
2 1 14

Kami pertama kali memecahkan masalah kelayakan;


Artinya, kita menemukan sebuah 𝑥 sedemikian sehingga
𝐴𝑥 ≤ 𝑏, menggunakan pemecah tapak. Setelah itu, kami
menyelesaikan masalah minimisasi diatas dengan
menggunakan mincx solver. Kode MATLAB sederhana
yang menyelesaikan tugas ini ditunjukkan di bawah ini.

% Enter problem data


A = [1 1;1 3;2 1];
b = [8 18 14]’;
c = [−4 −5]’;
setlmis([]);
X = lmivar(2,[2 1]);
lmiterm([1 1 1 X],A(1,:),1);
lmiterm([1 1 1 0],−b(1));
lmiterm([1 2 2 X],A(2,:),1);
lmiterm([1 2 2 0],−b(2));
lmiterm([1 3 3 X],A(3,:),1);
lmiterm([1 3 3 0],−b(3));
lmis = getlmis;
%---------------------------------
disp(’------------feasp result-------------’)
[tmin,xfeas] = feasp(lmis);
x_feasp = dec2mat(lmis,xfeas,X)
disp(’---------mincx result----------’)
[objective,x_mincx] = mincx(lmis,c,[0.0001 1000 0 0 1])

Fungsi feasp menghasilkan

−64,3996
𝑥𝑓𝑒𝑎𝑠𝑝 = [ ].
−25,1712

Fungsi mincx menghasilkan

3,0000
𝑥𝑚𝑖𝑛𝑐𝑥 = [ ].
5,0000

Pada contoh berikut, kita membahas fungsi defcx, yang bisa


kita gunakan untuk membangun vektor c yang digunakan
oleh LMI solver mincx.

Contoh 22.11 Misalkan kita ingin menyelesaikan masalah


optimasi
𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑡𝑟𝑎𝑐𝑒(𝑷)
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑨𝑻 𝑷 + 𝑷𝑨 ≤ 𝟎
𝑷 ≥0

Dimana jejak (𝑷) adalah jumlah elemen diagonal 𝑷. Kita


bisa menggunakan fungsinya Mincx untuk memecahkan
masalah ini Namun, untuk menggunakan mincx, kita
membutuhkan vektor𝑐 sedemikian sehingga

𝑐 𝑇 𝑥 = 𝑡𝑟𝑎𝑐𝑒(𝑃).

Setelah menentukan LMI dan mendapatkan representasi


internal mereka dengan menggunakan, misalnya, perintah
lmisys = getlmis, kita dapat memperoleh c yang diinginkan
dengan kode MATLAB berikut,

q = decnbr(lmisys);
c = zeros(q,1);
for j = 1:q
Pj = defcx(lmisys,j,P);
c(j) = trace(Pj);
end

Setelah memperoleh vektor c, kita bisa menggunakan


fungsi mincx untuk mengatasi masalah optimasi.

Meminimalkan Nilai Eigen Generalized Berdasarkan


Kendala LMI

Masalah ini dapat dinyatakan sebagai


𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝜆
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝐶(𝑥) ≤ 𝐷(𝑥)
0 ≤ 𝐵(𝑥)
𝐴(𝑥) ≤ 𝜆𝐵(𝑥).

Di sini, kita perlu membedakan antara batasan standar LMI


dengan bentuk 𝐶(𝑥) ≤ 𝐷(𝑥) dan LMI linearfraktori dengan
bentuk 𝐴(𝑥) ≤ 𝜆𝐵(𝑥), yang berkaitan dengan nilai eigen
umum λ. Masalah minimasi nilai eigenvalue generik di
bawah batasan LMI dapat dipecahkan dengan
menggunakan pemecah ganjil. Struktur dasar pemecah gevp
memiliki bentuk

[lopt,xopt] = gep{lmisys,nflc}

Yang mengembalikan lopt, minimum global dari nilai eigen


umum, dan xopt, variabel vektor keputusan yang optimal.
Argumen lmisys adalah sistem LMI, 𝐶(𝑥) ≤ 𝐷(𝑥), 𝐶(𝑥) ≤
𝐷(𝑥), dan 𝐴(𝑥) ≤ 𝜆𝐵(𝑥) untuk 𝜆 = 1. Seperti pada
pemecah sebelumnya, Nilai optimal variabel matriks yang
sesuai diperoleh dengan menggunakan dec2mat. Jumlah
kendala linier-pecahan ditentukan dengan nflc. Ada
masukan lain untuk dipungkiri tapi bersifat opsional. Untuk
informasi lebih lanjut tentang jenis pemecah LMI ini, kami
mengarahkan pembaca ke Lab LMI di panduan pengguna
Robust Control Toolbox MATLAB.

Contoh 22.12 Pertimbangkan masalah menemukan α


terkecil sehingga di mana
𝑷>0
𝑨𝑻 𝑷 + 𝑷𝑨 ≤ −𝜶𝑷,

Masalah ini terkait dengan menemukan tingkat peluruhan


persamaan diferensial linier stabil = 𝑥 = 𝐴𝑥. Menemukan α
yang memecahkan masalah optimasi di atas dapat
dilakukan dengan menggunakan LMI berikut ini :

A = [−1.1853 0.9134 0.2785


0.9058 −1.3676 0.5469
0.1270 0.0975 −3.0000];
setlmis([]);
P = lmivar(1,[3 1])
lmiterm([−1 1 1 P], 1,1) % P
lmiterm([1 1 1 0],.01) % P ≥= 0.01*I
lmiterm([2 1 1 P],1,A,’s’) % linear fractional constraint—
LHS
lmiterm([−2 1 1 P], 1,1) % linear fractional constraint—
RHS
lmis = getlmis;
[gamma,P_opt] = gevp(lmis,1);
P = dec2mat(lmis,P_opt,P)
alpha = −gamma

Hasilnya adalah

0,6996 −0,7466 −0,0296


𝛼 = 0,6561 dan 𝑃 = [−0,7466 0,8537 −0,2488]
−0,0296 −0,2488 3,2307
Perhatikan bahwa kita menggunakan 𝑃 ≥ 0,01I di tempat
𝑃 > 0.

Lebih banyak contoh ketidaksetaraan matriks linier dalam


teori sistem dan kontrol dapat ditemukan dalam buku oleh
Boyd et al. [16].

Pengenalan singkat pada toolbox MATLAB's LMI adalah


tutorial yang bisa diakses dengan perintah lmidem dalam
MATLAB. Selain kotak peralatan LMI MATLAB, ada
toolbox lain untuk menyelesaikan LMI yang bernama
LMITOOL, paket perangkat lunak built-in di kotak
peralatan Scilab, yang dikembangkan di INRIA di Prance.
Scilab menawarkan perangkat lunak gratis untuk
pengoptimalan numerik. Ada versi LMITOOL untuk
MATLAB yang bisa didapat dari website Scilab
Consortium.

Paket LMI lainnya, YALMIP, untuk menyelesaikan LMI


dikembangkan di Swiss di Laboratorium Kontrol Otomatis
di ETH. YALMIP adalah "bahasa pemodelan intuitif dan
fleksibel untuk memecahkan masalah optimasi di
MATLAB."

LMI adalah alat pengoptimalan modern. Kutipan berikut


pada aljabar linear numerik dari Gill, Murray, dan Wright
[52, hlm. 2] berlaku juga untuk isi bab ini: "Di jantung
metode pengoptimalan modern adalah teknik yang terkait
dengan aljabar linear. Aljabar linier numerik berlaku tidak
hanya dalam pengoptimalan, namun di semua bidang
perhitungan ilmiah, termasuk aproksimasi, persamaan
diferensial biasa, dan persamaan diferensial parsial.
Pentingnya aljabar linier numerik untuk komputasi ilmiah
modern tidak dapat dilebih-lebihkan. Tanpa blok bangunan
aljabar linier yang cepat dan andal, tidak mungkin untuk
mengembangkan metode pengoptimalan yang efektif tanpa
mengetahui masalah mendasar dalam aljabar linier, tidak
mungkin untuk memahami apa yang terjadi selama transisi
dari persamaan dalam buku teks ke perhitungan aktual. "

RANGKUMAN

BAB 2
Ruang Vektor dan Matriks

2.1 Vektor dan Matriks

Kita mendefinisikan sebuah kolom n-vector menjadi array


sebanyak n, dinotasikan
 a1 
a 
a   2

 
a n 

ai disebut komponen ke i dari vektor a.

Kita mendefinisikan vector n baris sebagai

a1 , a2 ,..., an  .

Matriks adalah kumpulan bilangan persegi panjang, yang


biasanya dilambangkan dengan huruf tebal huruf besar
(mis., A). Matriks dengan m baris dan n kolom disebut
matriks m × n, dan kita menulis

a11 a12  a1n


a a 22  a 2n
A  21
   
a m1 a m 2  a mn

Nomor sebenarnya aij yang terletak di kolom ke i dan


kolom ke j disebut entri ke (i, j).

2.2 Rank Matriks

Perhatikan matriks m × n
 q11 a12  a1n 
a a 22  a 2 n 
A   21
     
 
a m1 am2  a mn 

Mari kita menunjukkan kolom ke k dari A dengan ak:

 a1k 
a 
a k   2k 
  
 
a mk 
Jumlah maksimal kolom bebas linear dari A disebut
rangking matriks A, dinotasikan rank A. Perhatikan bahwa
rank A adalah dimensi membentang [a1, ..., an].

2.3 Persamaan Linear

Misalkan kita diberi persamaan dalam n yang tidak


diketahui bentuknya

a11 x1  a12 x 2    a1n x n  b1 ,


a 21 x1  a 22 x 2    a 2 n x n  b2 ,

a m1 x1  a m 2 x 2    a mn x n  bm .

Kita dapat mewakili himpunan persamaan di atas sebagai


persamaan vektor

x1 a1  x 2 a 2    x n a n  b,

dimana
 a ij   b1 
a  b 
aj   2j 
, b 2
    
   
 a mj  bm 

Terkait dengan sistem persamaan ini adalah matriksnya


A  a1 , a 2 ,..., a n  ,

Dan matriks yang diperbesar

A, b  a1 , a 2 ,..., an , b.

Kita juga bisa merepresentasikan sistem persamaan diatas


sebagai Ax  b

dimana

 x1 
x 
x   2

 
xn 

2.4 Perkalian Dalam dan Panjang

Perkalian dalam adalah fungsi bernilai real: ℝn×ℝn→ℝ


memiliki sifat berikut:
5. Positivity: (x, x) ≥ 0, (x, x) = 0 jika dan hanya jika x=0.
6. Simetri: (x, y) = (y, x).
7. Aditif: (x + y, z) = (x, z )+( y, z).
8. Homogenitas: (rx, y) = r(x, y) untuk setiap r ∈ ℝ.
Panjang Euclidean dari vektor x didefinisikan sebagai

x  ( x, x)  xT x .

Panjang Euclidean dari sebuah vektor || x || Memiliki sifat


berikut:
4. Positivity: || x || ≥ 0, || x || = 0 jika dan hanya jika x = 0.
5. Homogenitas: || rx || = | R | || x ||, r∈ ℝ.

Ketidaksamaan segitiga: || x + y || ≤ || x || + || y ||.


Ketidaksamaan segitiga dapat dibuktikan dengan
menggunakan ketidaksamaan Cauchy-Schwarz.

BAB 12
Penyelesaian persamaan linier
12.1 Analisis Kuadrat Terkecil
Teorema 12.1 Vektor unik x* yang meminimalkan ||𝑨x - b||2
diberikan solusi terhadap persamaan 𝑨⊺ 𝑨x = 𝑨⊺ b; yaitu, x* =
(𝑨⊺ 𝑨)-1 𝑨⊺ b.

Buktikan. Misalkan x* = (𝑨⊺ 𝑨)-1 𝑨⊺ b. Pertama mengamati


bahwa

||𝑨x - b||2 = ||𝑨(x - x*) + (𝑨x* - b)||2

= (𝑨(x - x*) + (𝑨x* - b))T(𝑨(x - x*) + (𝑨x*


- b))
= ||𝑨(x - x*)||2 + ||𝑨x* - b||2 + 2 [𝑨(x - x*)] T
(𝑨x* - b).

Sekarang kita menunjukkan bahwa istilah terakhir dalam


persamaan ini adalah nol. Benar, ganti ungkapan di atas untuk
x*,
[𝑨(x - x*)] T (𝑨x* - b) = (x - x*)TAT[A(AT A)-1 AT -
In]b

= (x - x*)T [(AT A)(AT A)-1 AT -


AT]b

= (x - x*)T (AT - AT)b

= 0,

Karena itu,

||𝑨x - b||2 = ||𝑨(x - x*)||2 + ||𝑨x* - b||2.

Jika x ≠ x*, maka ||𝑨(x - x*)||2> 0, karena rank A = n. Jadi, jika


x ≠ x*, kita punya

||𝑨x - b||2>||𝑨x* - b||2.

Jadi, x* = (AT A-1) AT b adalah minimasi khusus dari ||𝑨x -


b||2.
Contoh 12.1 Misalkan kita diberi dua jenis beton yang
berbeda. Jenis pertama mengandung semen 30%, kerikil
40%, dan pasir 30% (semua persentase berat). Tipe kedua
mengandung semen 10%, kerikil 20%, dan pasir 70%.
Berapa kilogram tiap jenis beton yang harus kita campurkan
sehingga kita mendapatkan campuran beton yang sedekat
mungkin dengan total 5 pon, 3 pon kerikil, dan 4 pon pasir?
Masalahnya bisa diformulasikan sebagai masalah kuadrat-
terkecil

0.3 0.1 5 
 
A  0.4 0.2 , b  3
0.3 0.7 4

Dimana variabel keputusannya adalah x = [x1, x2]T dan x1


dan x2 adalah jumlah beton tipe pertama dan kedua, masing-
masing. Secara aljabar, kita mendapatkan solusinya:

 
x *  AT A 1 AT b

1  0.54  0.32 3.9


=
0.340.54  0.32  0.32 0.34  3.9
2

 10.6 
=  
0.961

(Untuk variasi masalah ini diselesaikan dengan


menggunakan metode yang berbeda, lihat Contoh 15.7.) kita
sekarang memberikan contoh di mana analisis kuadrat-
terkecil digunakan untuk menyesuaikan pengukuran dengan
garis lurus.

12.2 Algoritma Kuadrat Terkecil Rekursif


Lemma 12.2 Misalkan A adalah matriks nonsingular.
Misalkan U dan V adalah matriks seperti I + V𝐴−1 U adalah
nonsingular. Maka, 𝐴 + 𝑈𝑉adalah nonsingular, dan

(𝐴 + 𝑈𝑉)-1 = 𝐴−1 − (𝐴−1 𝑈)(𝐼 + 𝑉𝐴−1 𝑈)−1 (𝑉𝐴−1 ).


Bukti. Kita bisa membuktikan hasilnya dengan mudah
dengan verifikasi.

Menggunakan Lemma 12.2 kita dapatkan


−1
𝐺𝑘+1 = (𝐺𝑘 + 𝐴𝑇𝑘+1 𝐴𝑘+1 )−1

= 𝐺𝑘−1 − 𝐺𝑘−1 𝐴𝑇𝑘+1 (𝐼 + 𝐴𝑘+1 𝐺𝑘−1 𝐴𝑇𝑘+1 )-1𝐴𝑘+1 𝐺𝑘−1 .

Contoh 12.6 Misalkan

1 0 1

A0  0 1 b  1
 (0)

1 1 1

A1  a1T  2 1 , b (1)  b1  3 ,

A2  a2T  3 1 , b ( 2)  b2  4.

Pertama hitung vektornya 𝑥 (0) Meminimalkan ‖𝑨0 𝒙 −


b (0) ‖2. Maka, Gunakan algoritma KTR untuk menemukan
𝑥 (2) minimasi.
2
 A0  b ( 0 ) 
A  x   (1) 
 1 b 
 A2  b ( 2 ) 
 

Kita punya

 2 / 3  1 / 3

P0  A0T A0   
 1 / 3 2 / 3 

2 / 3
x ( 0)  P0 A01b ( 0)   
2 / 3
Menerapkan algoritma KTR dua kali, kita dapatkan

P0 a1a1T P0  1 / 3  1 / 3
P1  P0  =  ,
1  a1 P0 a1  1 / 3 2 / 3 
T

 1 

x (1)  x ( 0)  P1a1 b1  a1T x (0) =  
,
2 / 3

P1a 2 a 2T P1  1 / 6  1 / 4
P2  P1  =  ,
1  a 2 P1a 2  1 / 4 5 / 8 
T

13 / 12

x ( 2)  x (1)  P2 a2 b2  a2T x (1) =   
 5/8 

Kita dapat dengan mudah memeriksa solusi kita dengan


menghitung x secara langsung dengan menggunakan rumus
𝑥 (2) = (AT A-1) AT b, dimana

 A0  b ( 0 ) 
 
A   A1  , b   b (1) 
 A2  b ( 2 ) 
 

12.3 Solusi untuk Persamaan Linear dengan


BentukMinimum
Teorema 12.2 Solusi unik x* untuk Ax = b yang meminimalkan
bentuk|| x || diberikan oleh

x *  AT AAT  1
b.

Buktikan.Misalkan x *  AT AAT  
1
b. Perhatikanbahwa

x
2

 x  x*  x*  2

= x  x*  x*   x  x   x 
T * *

= x  x * + x * + 2 x * x  x * 
2 2 T

sekarangkitamenunjukkanbahwa

x* ( x  x* )  0
T

bahkan,


x* ( x  x* ) = AT ( AAT ) 1 b x  AT ( AAT ) 1 b
T T


= b T ( AAT ) 1 Ax  ( AAT )( AAT ) 1 b

= b T ( AAT ) 1 b  b  0 .

jadi,

2 2
 x*  x  x* .
2
x

karena
2
x  x*  0 untuksemua𝑥 ≠ 𝑥 ∗ , dan untuk semua itu 𝑥 ≠ 𝑥 ∗ ,

2
 x* ,
2
x

yangberartibahwa

x  x*

Contoh 12.7 Tentukan titik yang paling dekat dengan titik asalℝ3
Pada titikpotongduagaris bidang yang didefinisikan oleh dua persamaan
berikut ini:
x1  2 x2  x3  1,
4 x1  x2  3x3  0.

Perhatikan bahwa masalah ini setara dengan masalah

x
bagianterkecil

bergantungpada Ax  b,

dimana

1 2  1 1 
A  , b 
4 1 3 0 

jadi, solusi untuk masalah ini adalah

 0.0952 
x  A ( AA ) b   0.3333 
* T T 1

 0.2381

Pada bagian selanjutnya kita membahas algoritma iteratif untuk


memecahkan 𝐴𝑥 = 𝑏

12.4 Algoritma Kaczmarz


Kami sekarang membuktikan konvergensi algoritma Kaczmarz,
menggunakan gagasan dari kertas asli Kaczmarz [70] dan eksposisi
berikutnya oleh Parks [102].

Contoh 12.8 Misalkan

1  1  2
A  , b   3 .
0 1   

x *  5, 3 Gambar 12.4 menunjukkan beberapa


T
Padakasusini,
iterasi algoritma Kaczmarz dengan μ = 1 dan x ( 0 )  0 . Kita punya
a1T  1,  1, a2  0 1, b1  2, b2  3. Pada Gambar 12.4,garis
melaluititik 2, 0 sesuaidenganhimpunan
T
diagonal yang
x : a
T
1 
x  b1 , dan garis horisontal yang melewati titik [0, 3] sesuai
 
dengan himpunan x : a 2T x  b2 , untuk mengilustrasikan algoritma,
kami melakukan tiga iterasi :

Gambar 12.4 Iterasi algoritma Kaczmarz pada Contoh 12.8.

0  11 1
x (1)     (2  0)     ,
0  2  1  1
1 0 1
x ( 2 )     (3  (1))     ,
 1 1 3
1 1  1  3
x ( 3)     (2  (2))     
3 2  1 1
Seperti Gambar 12.4 mengilustrasikan, sifat
𝑎ℛ(𝑘)+1 (𝑥 (𝑘+1) − 𝑥 ∗ ) = 0

Memegang setiap iterasi. Perhatikan konvergensi iterasi algoritma ke


solusinya.

12.5 Memecahkan Persamaan Linear Secara Umum


Contoh 12.9 Misalkan A diberikan oleh
2 1  2 5
A  1 0  3 2
3  1  13 5

Perhatikan bahwa Rank 𝐴 = 2. Kita dapat menulis faktorisasi penuh-


rankA berdasarkan bukti Lemma 12.3:

 2 1
1 0  3 2
A   1 0    BC .
 0 1 4 1
3  1

Sekarangkita memperkenalkan Moore-Penrose inverse dan


mendiskusikan keberadaan dan keunikannya. Untuk ini, pertama kita
perhatikan persamaan matriks

𝑨 𝑿 𝑨 = 𝑨.

Dimana A  ℝ𝑚𝑥𝑛 adalah matriks yang diberikan dan X  ℝ𝑛𝑥𝑚 adalah


matriks yang ingin kita tentukan. Amati bahwa jika A adalah matriks
bujur sangkar nonsingular, maka persamaan di atas memiliki solusi
unik 𝑋 = 𝐴−1 . Kita sekarang mendefinisikan terbalik Moore-Penrose,
juga disebut pseudoinverseatau inverse umum.

BAB 22
MASALAH OPTIMASI CONVEX
22.1 Pendahuluan
Masalah optimasi yang diajukan pada awal bagian ini, pada
umumnya sangat sulit dipecahkan. Sumber kesulitan ini mungkin
berada dalam fungsi objektif atau kendala. Sekalipun fungsi
obyektifnya sederhana dan "berperilaku baik," sifat kendala bisa
membuat masalah sulit dipecahkan. Kami menggambarkan
beberapa kesulitan ini dalam contoh berikut.
Contoh 22.1 Pertimbangkan masalah optimasi
𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22
𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑥2 − 𝑥1 − 2 ≤ 0
𝑥12 − 𝑥2 − 4 ≤ 0
Masalahnya digambarkan pada Gambar 22.1, dimana, seperti
yang bisa kita lihat, minimizer terbatas sama dengan minimizer
yang tidak dibatasi. Pada minimizer, semua kendala tidak aktif.
Jika kita hanya mengetahui fakta ini, kita bisa mendekati masalah
ini sebagai masalah optimasi tanpa kendala dengan menggunakan
teknik dari Bagian II.
Gambar 22.1 Situasi dimana dibatasi dan tak terbatas adalah
sama.

Contoh 22.2 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22


𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝑥1 − 10 ≤ 0
𝑥1 − 𝑥22 − 4 ≥ 0
Masalahnya digambarkan pada Gambar 22.2. Pada solusinya,
hanya satu kendala yang aktif. Jika kita hanya mengetahui hal ini,
kita bisa menangani masalah ini sebagai masalah optimasi yang
dibatasi dengan menggunakan metode multiplier Lagrange.
Gambar 22.2 Situasi dimana hanya satu kendala yang aktif
.
Contoh 22.3 Pertimbangkan masalah optimasi

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑒 𝑥12 + 𝑥22


𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 4 − 𝑥1 − 𝑥22 ≤ 0
3𝑥2 − 𝑥1 ≤ 0
−3𝑥2 − 𝑥1 ≤ 0
Masalahnya digambarkan pada Gambar 22.3. Contoh ini
menggambarkan situasi di mana kendala memperkenalkan
minimizer lokal, walaupun fungsi objektif itu sendiri hanya
memiliki satu penambah global tak terbatas.
Gambar 22.3 Situasi dimana kendala memperkenalkan minimizer
lokal.
Beberapa kesulitan yang diilustrasikan dalam contoh di atas dapat
dieliminasi jika kita membatasi masalah kita pada area yang
sesuai. Diakuinya, beberapa masalah kehidupan nyata yang
penting tidak sesuai dengan kerangka kerja ini. Di sisi lain,
adalah mungkin untuk memberikan hasil sifat global untuk
masalah optimasi kelas ini. Pada bagian selanjutnya, kami
memperkenalkan gagasan tentang fungsi cembung, yang
memegang peranan penting dalam penanganan masalah tersebut
selanjutnya.
22.2 Fungsi Konveks

Definisi 22.1 Grafik dari 𝑓: Ω → ℝ , Ω ⊂ ℝ𝑛 , adalah himpunan di


𝑥
titik Ω × ℝ , Ω ⊂ ℝ𝑛+1 diberikan oleh {[𝑓(𝑥)] : 𝑥 𝜖 Ω}.

Definisi 22.1 Grafik dari 𝑓: Ω → ℝ , Ω ⊂ ℝ𝑛 , adalah himpunan di


𝑥
titik Ω × ℝ , Ω ⊂ ℝ𝑛+1 diberikan oleh {[𝑓(𝑥)] : 𝑥 𝜖 Ω}.

Definisi 22.3 Sebuah fungsi 𝑓: Ω → ℝ, Ω ⊂ ℝ𝑛 , adalah


cembung pada Ω jika epigrafnya adalah satu cembung.

Teorema 22.1 Jika fungsi 𝑓: Ω → ℝ, Ω ⊂ ℝ𝑛 , adalah cembung


pada Ω, maka Ω adalah konveks.
Bukti. Kami membuktikan teorema ini dengan cara kontraksi.
Misalkan Ω bukan satu konveks. Kemudian, ada dua titik 𝑦1 dan
𝑦2 sehingga untuk beberapa 𝛼 𝜖 (0,1),

𝑧 = 𝛼𝑦1 + (1 − 𝛼)𝑦2 ∉ Ω
diberikan

𝛽1 = 𝑓(𝑦1 ), 𝛽2 = 𝑓(𝑦2 )
Lalu, pasang
𝑦1 𝑦2
[𝛽 ] , [𝛽 ]
1 2

Termasuk grafik f, dan karenanya juga epigraf f. Membiarkan


𝑦1 𝑦2
𝓌 = 𝛼 [𝛽 ] + (1 − 𝛼) [𝛽 ]
1 2

kita mempunyai
𝑧
𝓌 = [𝛼𝛽 + (1 − 𝛼)𝛽 ]
1 2

Tapi perhatikan itu w epi (f), karena z Ω. Oleh karena itu, epi (f)
tidak cembung, dan karenanya f bukan fungsi konveks.

Teorema 22.2 Fungsi 𝑓: Ω → ℝ , didefinisikan cembung pada


set Ω ⊂ ℝ𝑛 , adalah cembung jika dan hanya jika untuk semua
𝑥, 𝑦 ∈ Ω dan semua 𝛼 𝜖 (0,1), kita mempunyai

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).

Bukti. ⇐: Asumsikan bahwa untuk semua 𝑥, 𝑦 ∈ Ω dan


𝛼 𝜖 (0,1),

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).

Diberikan [𝑥 𝑇 , 𝑎]𝑇 dan [𝑦 𝑇 , 𝑏]𝑇 dengan dua titik di


𝑒𝑝𝑖(𝑓),dimana 𝑎, 𝑏 ∈ ℝ . Dari definisi 𝑒𝑝𝑖(𝑓) diikuti dengan

𝑓(𝑥) ≤ 𝑎, 𝑓(𝑦) ≤ 𝑏.
Karena itu, dengan menggunakan ketimpangan pertama di atas,
kita miliki

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑎(𝑥) + (1 − 𝛼)𝑏.


Karena Ω adalah cembung, αx + (1 - α) y Ω. Karenanya,
𝛼𝑥 + (1 − 𝛼)𝑦
[ ] 𝜖 𝑒𝑝𝑖(𝑓),
𝛼𝑎 + (1 − 𝛼)𝑏
Yang menyiratkan bahwa epi (f) adalah himpunan cembung, dan
karenanya f adalah fungsi cembung

⇒: Asumsikan bahwa 𝑓: Ω → ℝ adalah fungsi konveks. Biarkan


𝑥, 𝑦 ∈ Ω dan

𝑓(𝑥) = 𝑎, 𝑓(𝑦) = 𝑏.
sehingga,
𝑥 𝑦
[ ] , [ ] ∈ 𝑒𝑝𝑖(𝑓).
𝑎 𝑏
Karena 𝑓 adalah fungsi konveks, epigrafnya adalah subset
konveks ℝ𝑛+1. Oleh karena itu, untuk semua 𝛼 ∈ (0,1), kita
mempunyai
𝑥 𝑦 𝛼𝑥 + (1 − 𝛼)𝑦
𝛼 [ ] + (1 − 𝛼) [ ] = [ ] ∈ 𝑒𝑝𝑖(𝑓).
𝑎 𝑏 𝛼𝑎 + (1 − 𝛼)𝑏
Hal di atas menyiratkan bahwa untuk semua 𝛼 ∈ (0,1),

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) ≤ 𝛼𝑎(𝑥) + (1 − 𝛼)𝑏 = 𝛼𝑓(𝑥) +


(1 − 𝛼)𝑓(𝑦).

dan pernyataan tersebut terbukti.


Interpretasi geometrik Teorema 22.2 diberikan pada Gambar
22.5. Teorema menyatakan bahwa jika 𝑓: Ω → ℝ adalah fungsi
cembung di atas set cembung Ω, maka untuk semua x, y Ω, titik
pada segmen garis di ℝ𝑛+1 menghubungkan [𝑥 𝑇 , 𝑓(𝑥)]𝑇 dan
[𝑦 𝑇 , 𝑓(𝑦)]𝑇 harus terletak pada atau di atas grafik f.

Gambar 22.5 Interpretasi geometrik Teorema 22.2.


Dengan menggunakan Teorema 22.2, sangat mudah untuk
menunjukkan bahwa penskalaan fungsi cembung nonnegatif
bersifat konveks, dan bahwa jumlah fungsi konveks adalah
konveks.

Teorema 22.3 Misalkan 𝑓, 𝑓1 , 𝑑𝑎𝑛 𝑓2 adalah fungsi konveks.


Kemudian, untuk setiap 𝑎 ≥ 0, fungsi 𝑓 adalah cembung. Selain
itu, 𝑓1 + 𝑓2 adalah konveks.

Definisi 22.4 Fungsi 𝑓: Ω → ℝ konveks pada saat Ω ⊂ ℝ𝑛 benar-


benar konveks jika untuk semua 𝑥, 𝑦 ∈ Ω, 𝑥 ≠ 𝑦,dan 𝛼 𝜖 (0,1),
kita mempunyai

𝑓(𝛼𝑥 + (1 − 𝛼)𝑦) < 𝛼𝑓(𝑥) + (1 − 𝛼)𝑓(𝑦).


Dari definisi ini, kita melihat bahwa a untuk fungsi konveks yang
ketat, semua titik pada segmen garis terbuka yang
menghubungkan titik-titik [𝑥 𝑇 , 𝑓(𝑥)]𝑇 dan [𝑦 𝑇 , 𝑓(𝑦)]𝑇 terletak
(ketat) di atas grafik f.

Definisi 22.5 Suatu fungsi 𝑓: Ω → ℝ konveks pada saat Ω ⊂ ℝ𝑛


adalah (hanya) cekung jika-f (benar-benar) konveks.

Teorema 22.4 Misalkan : Ω → ℝ, 𝑓 ∈⊂1 , didefinisikan konveks


pada saat Ω ∈ ℝ𝑛 . Kemudian, f adalah konveks pada Ω jika dan
hanya jika untuk semua 𝑥, 𝑦 𝜖 Ω,

𝑓(𝑦) ≥ 𝑓(𝑥) + 𝐷𝑓(𝑥)(𝑦 − 𝑥).

Teorema 22.5 Misalkan 𝑓: Ω → ℝ, 𝑓 ∈⊂2 , didefinisikan konveks


terbuka pada set Ω ⊂ ℝ𝑛 . Kemudian, f adalah konveks pada Ω
jika dan hanya jika untuk masing-masing 𝑥 ∈ Ω, 𝐻𝑒𝑠𝑠𝑖𝑎𝑛 𝐹(𝑥)
fungsi f pada x adalah matriks semidefinite positif.

22.3 Masalah Optimal Convex

Teorema 22.6 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks yang


didefinisikan pada set Convex Ω ⊂ ℝ𝑛 . Kemudian, satu titik
adalah alat peningkat global 𝑓 over Ω. Jika dan hanya jika itu
adalah alat minimal lokal 𝑓.
Lemma 22.1 Misalkan 𝑔: Ω → ℝ, menjadi fungsi konveks yang
didefinisikan konveks pada set Ω ⊂ ℝ𝑛 . Kemudian, untuk
masing-masing 𝑐 𝜖 ℝ, himpunan

Γ𝑐 = {𝑥 ∈ Ω: 𝑔(𝑥) ≤ 𝑐}
adalah himpunan konveks.

Lemma 22.2 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks yang


didefinisikan konveks pada saat Ω ⊂ ℝ𝑛 dan 𝑓 ∈⊂1 pada set
konveks terbuka yang mengandung Ω. Misalkan titik 𝑥 ∗ 𝜖 Ω
sedemikian sehingga untuk semua 𝑥𝜖Ω, 𝑥 ≠ 𝑥 ∗ , kita mempunyai

𝐷𝑓(𝑥 ∗ )(𝑥 − 𝑥 ∗ ) ≥ 0.

Kemudian, 𝑥 ∗ adalah alat peningkat global 𝑓 over Ω.

Teorema 22.7 Misalkan 𝑓: Ω → ℝ menjadi fungsi konveks yang


didefinisikan pada set konveks Ω ⊂ ℝ𝑛 , dan 𝑓 ∈⊂1 pada set
komveks terbuka yang mengandung Ω. Misalkan titik 𝑥 ∗ 𝜖 Ω
sedemikian sehingga untuk setiap arah yang layak d pada 𝑥 ∗ , kita
mempunyai

𝑑 𝑇 ∇𝑓(𝑥 ∗ ) ≥ 0.

dimana 𝑥 ∗ adalah global minimal dari 𝑓 over Ω.

Teorema 22.8 Misalkan 𝑓: ℝ𝑛 → ℝ, 𝑓 ∈⊂1 , menjadi fungsi


konveks pada himpunan titik layak

Ω = {𝑥 ∈ ℝ𝑛 ∶ ℎ(𝑥) = 0},

Dimana ℎ ∶ ℝ𝑛 → ℝ𝑚 , ℎ ∈⊂1 , dan Ω adalah konveks. Misalkan


ada 𝑥 ∗ 𝜖 Ω dan 𝜆∗ ∈ ℝ𝑚 sedemikian sehingga

Kemudian, 𝑥 ∗ adalah alat peningkat global 𝑓 over Ω.

Teorema 22.9. Misalkan 𝑓: ℝ𝑛 → ℝ, 𝑓 ∈⊂1 , Jadilah fungsi


konveks pada set poin yang layak

Ω = {𝑥 𝜖 ℝ𝑛 : ℎ(𝑥) = 0, 𝑔(𝑥) ≥ 0},

dimana ℎ ∶ ℝ𝑛 → ℝ𝑚 , 𝑔 ∶ ℝ𝑛 → ℝ𝑝 , ℎ, 𝑔 ∈⊂1 , dan Ω adalah


konveks. Misalkan ada 𝑥 ∗ 𝜖 Ω, 𝜆∗ ∈ ℝ𝑚 , dan 𝜇 ∗ 𝜖 ℝ𝑝 , begitulah
1. 𝜇 ∗ ≥ 0.
2. 𝐷𝑓(𝑥 ∗ ) + 𝜆∗𝑇 𝐷ℎ(𝑥 ∗ ) + 𝜇 ∗𝑇 𝐷𝑔(𝑥 ∗ ) = 0𝑇 .
3. 𝜇 ∗𝑇 𝑔(𝑥 ∗ ) = 0.

dengan demikian, 𝑥 ∗ adalah global minimal dari 𝑓 over Ω.

22.4 Pemrograman Semidefinite

Ketidaksamaan dan Sifat Linear Matrix


Pertimbangkan n + 1 matriks simetris nyata

𝐹𝑖 = 𝐹𝑖𝑇 ∈ ℝ𝑚 𝑥 𝑚 , 𝑖 = 0,1, … , 𝑛
Dan sebuah vektor

𝑥 = [𝑥1 , … , 𝑥𝑛 ]𝑇 ∈ ℝ𝑛 .
Kemudian,

𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛
𝑛

= 𝐹0 + ∑ 𝑥𝑖 𝐹𝑖
𝑖=1

Adalah fungsi affine dari x, karena 𝐹(𝑥) terdiri dari istilah linier
∑𝑛𝑖=1 𝑥𝑖 𝐹𝑖 dan istilah konstan 𝐹0 .

Pertimbangkan sekarang sebuah batasan ketidaksetaraan formulir

𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛 ≥ 0
Ketidaksamaan kendala di atas adalah untuk ditafsirkan sebagai
himpunan vektor x seperti itu

𝑧 𝑇 𝐹(𝑥)𝑧 ≥ 0 𝑢𝑛𝑡𝑢𝑘 𝑠𝑒𝑚𝑢𝑎 𝑧 ∈ ℝ𝑚 ;


Artinya, 𝐹(𝑥) adalah semidefinite positif [atau, dalam notasi
biasa, 𝐹(𝑥) ≥ 0]. Ingatlah bahwa istilah 𝐹𝑖 mewakili matriks
konstan, x tidak diketahui, dan 𝐹(𝑥) = 𝐹(𝑥)𝑇 adalah fungsi
affine x. Ekspresi 𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛 ≥ 0 Disebut
dalam literatur sebagai ketidaksetaraan matriks linier (LMI),
meski istilah ketidaksetaraan matriks affine nampaknya lebih
tepat. Mudah untuk memverifikasi itu set {𝑥 ∶ 𝐹(𝑥) ≥ 0} konveks
(lihat Latihan 22.20).

LMI pemecah
Ketidaksamaan 𝐹(𝑥) = 𝐹0 + 𝑥1 𝐹1 + ⋯ + 𝑥𝑛 𝐹𝑛 ≥ 0 disebut
representasi kanonik dari sebuah LMI. Pemecah LMI numerik
tidak berurusan langsung dengan LMI dalam bentuk kanonik
karena berbagai inefisiensi. Sebagai gantinya, pemecah LMI
menggunakan representasi LMI yang terstruktur.
Kita bisa menggunakan toolbox MATLAB's LMI untuk
menyelesaikan LMI secara efisien. Toolbox ini memiliki tiga
jenis pemecah LMI, yang akan kita bahas selanjutnya.

Menemukan Solusi yang Layak Di Bawah Kendala LMI


Pertama, kita membahas pemecah LMI MATLAB untuk
memecahkan masalah kelayakan yang didefinisikan oleh sistem
batasan LMI yang diberikan. Dengan menggunakan pemecah ini,
kita bisa menyelesaikan sistem LMI dalam bentuk apapun

𝑁 𝑇 ℒ(𝑋1 , … , 𝑋𝑘 )𝑁 ≤ 𝑀𝑇 ℛ(𝑋1 , … , 𝑋𝑘 )𝑀,

Dimana 𝑋1 , … , 𝑋𝑘 adalah variabel matriks, N adalah faktor luar


kiri, M adalah faktor luar yang tepat, ℒ (X1, ..., Xk) adalah faktor
dalam kiri, dan ℛ(𝑋1 , … , 𝑋𝑘 ) adalah faktor dalam yang tepat.
Matriks ℒ (·) dan ℛ (·), secara umum, matriks blok simetris.
Kami mencatat bahwa istilah sisi kiri mengacu pada apa yang ada
di sisi "lebih kecil" dari ketidaksetaraan 0 ≤ 𝑋. Dengan demikian
di 𝑋 ≥ 0, matriks 𝑋 masih berada di sisi kanan karena berada
pada "lebih besar "Sisi ketidaksetaraan.
SUGGESTION READING
DAFTAR ISTILAH

Matriks Susunan bilangan-bilangan dalam bentuk persegi


panjang dan diapit dengan tanda kurung “()” atau
kurung siku “[]”. Suatu matriks dinotasikan dengan
huruf kapital.

Vektor Besaran yang mempunyai besar dan arah.


Kombinasi Linier Penjumlahan hasil kali anggota himpunan pasangan
berurutan.

Bebas Linier Suatu himpunan vektor dikatakan bebas linier jika


kombinasi linier nol atas vektor-vektor tersebut
hanya dipenuhi solusi trivial.

Bergantung Linier Suatu himpunan vektor dikatakan bergantung linier


jika kombinasi linier tidak nol atas vektor-vektor
tersebut.

Anda mungkin juga menyukai