Bab 8 Program Dinamik Stokastik
Bab 8 Program Dinamik Stokastik
Alkaff
Penyelidikan Operasi
𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛
Deterministik: 𝑆𝑡𝑎𝑡𝑒 𝑆𝑡𝑎𝑡𝑒 𝑆𝑡𝑎𝑡𝑒
𝑋𝑁 𝑋𝑁+1
𝑆𝑁 𝑆𝑁+1 𝑆𝑁+2
Stokastik:
𝑜𝑢𝑡𝑐𝑜𝑚𝑒 1 1 1
𝑠𝑡𝑎𝑡𝑒 𝑆𝑛+1 𝑓𝑛+ 1 𝑆𝑛+1 𝑑𝑒𝑛𝑔𝑎𝑛 𝑝𝑟𝑜𝑏 𝑝1
𝑝𝑟𝑜𝑏 = 𝑝1
Persamaan Rekursif
𝑖
𝑓𝑛 𝑆𝑛 = 𝑜𝑝𝑡 𝐶𝑛 (𝑋𝑛 , 𝑆𝑛 , 𝜔𝑛 ) + 𝑝𝑖 𝑓𝑛+1 (𝑆𝑛+1 )
𝑋𝑛
Abe Alkaff
Contoh Permasalahan
Toko elektronik menjual TV dengan spesifikasi tertentu. Toko
tersebut menyediakan stok TV tersebut maksimum 2 unit. TV dipesan
toko dari pemasok. Pesanan tersebut datang pada hari yang sama. Biaya
pembelian adalah 5 + 10𝑥, dimana 𝑥 menyatakan banyaknya yang dibeli
oleh toko dari pemasok. Banyaknya pembeli yang datang ke toko dalam
satu minggu adalah acak dengan probabilitas sebagai berikut:
Pembeli 0 1 2
Probabilitas 0.3 0.5 0.2
Abe Alkaff
Persyaratan
TV yang tidak laku pada suatu minggu disimpan untuk minggu depan
dengan biaya penyimpan = 2/TV/minggu
Maksimum stok TV = 2 unit
TV dijual dengan harga 20
Bila ada pembeli tetapi stok kosong, toko mengalami kerugian
kesempatan = 3/TV
Toko akan membuat rencana pemesanan dalam 1 bulan (4 minggu)
sehingga keuntungannya maksimal.
Pada awal bulan tidak ada stok.
Abe Alkaff
𝑠𝑛+1 = 𝑔(𝑠𝑛 , 𝑥𝑛 , 𝑤𝑛 )
Aksi Kontrol yang mengoptimalkan suatu nilai kriteria disebut kontrol Optimal
atau Pengaturan Optimal
Abe Alkaff
𝐾 = 𝐶𝑛 (𝑠𝑛 , 𝑥𝑛 , 𝑤𝑛 )
𝑛=1
Dengan demikian aksi kontrol optimal adalah 𝑥𝑛 yang mengoptimalkan K
𝑁
Secara umum, suatu Strategi Kontrol dinyatakan dalam suatu fungsi yang
manyatakan hubungan antara 𝑥 dan 𝑠 yang berlaku untuk semua 𝑛 = 1,2,… 𝑁
𝑥𝑛 = 𝑓 𝑠𝑛 , 𝑤𝑛 𝑛 = 1,2, … , 𝑁
Abe Alkaff
𝐾 = 𝑓𝑁 𝑠𝑁 + 𝐶𝑛 (𝑠𝑛 , 𝑥𝑛 , 𝑤𝑛 )
𝑛=1
Dimana 𝑓𝑁 𝑆𝑁 adalah hasil optimasi 𝐶𝑁 𝑠𝑁 , 𝑥𝑁 , 𝑤𝑁 terhadap 𝑥𝑁 , atau
𝑓𝑁 𝑠𝑁 = 𝑂𝑝𝑡 {𝐶𝑁 𝑠𝑁 , 𝑥𝑁 , 𝑤𝑁 }
𝑥𝑁
Sehingga 𝑁−1
Contoh : Persediaan TV
𝑠𝑛 = Banyak stok TV pada awal minggu ke-𝑛
𝑥𝑛 = Banyaknya TV yang dipesan pada awal minggu ke-𝑛
𝑤𝑛 = Penjualan TV dalam minggu ke-𝑛
𝑠𝑛+1 = max(0, 𝑠𝑛 + 𝑥𝑛 − 𝑤𝑛 )
𝑥𝑛 = 𝑓 𝑠𝑛 , 𝑤𝑛
𝑥𝑛 dapat dicari dengan pemrograman dinamik untuk 𝑁 tertentu
(untuk contoh ini 𝑁 = 4 )
Contoh : Persediaan TV
Strategi 1
Tahap 4 – Minggu Keempat
𝑺𝟒 𝑿𝟒 𝒇𝟒 (𝑺𝟒 ) = 𝑪𝟒 𝑺𝟒 , 𝑿𝟒 + 𝒇𝟓 (𝑺𝟓 ) = 𝑪𝟒 (𝑺𝟒 , 𝑿𝟒 )
0 2 (0.2)(15)+(0.5)(-7)+(0.3)(-29)= -9.2
1 0 (0.5)(20)+(0.2)(17)+(0.3)(-2)=12.8
2 0 (0.2)(40)+(0.5)(18)+(0.3)(-4)=15.8
Abe Alkaff
Contoh : Persediaan TV
Strategi 1
Contoh : Persediaan TV
Strategi 1
Contoh : Persediaan TV
Strategi 1
Strategi 2
Rumusan strategi kontrolnya adalah:
𝑥𝑛 = 2 − 𝑠𝑛
Contoh : Persediaan TV
Strategi 2
Contoh : Persediaan TV
Strategi 2
Contoh : Persediaan TV
Strategi 2
Contoh : Persediaan TV
Strategi 2
𝑓1 (𝑠1 ) Strategi 1
𝑓1 (𝑠1 ) Strategi 2
Abe Alkaff
Strategi kontrol:
1. Investasi di B jika uang tersedia ≥ 20000, investasi di A jika uang tersedia 10000
2. Hanya berinvestasi di B
Abe Alkaff
Tabel Probabilitas
Tahap 3
𝑆3 𝑋3 𝑬[𝑓3 𝑆3 ]
30.000 B (30.000-10.000+10.000)(0,9) + (30.000-10.000+20.000)(0.1) = 31.000
20.000 B (20.000-10.000+10.000)(0,9) + (20.000-10.000+20.000)(0.1) = 21.000
10.000 A Tidak mungkin ke state ini
Tahap 2
𝑆2 𝑋2 𝑬[𝑓2 𝑆2 ]
20.000 B (20.000-10.000+10.000+21.000)(0,9) + (20.000-10.000+20.000+31.000)(0.1) = 43.000
10.000 A Tidak mungkin ke state ini
0 - -
Abe Alkaff
Strategi 2
Tahap 3
𝑆3 𝑋3 𝑬[𝑓3 𝑆3 ]
30.000 B (30.000-10.000+10.000)(0,9) + (30.000-10.000+20.000)(0.1) = 31.000
20.000 B (20.000-10.000+10.000)(0,9) + (20.000-10.000+20.000)(0.1) = 21.000
10.000 B (10.000-10.000+10.000)(0,9) + (10.000-10.000+20.000)(0.1) = 11.000
Abe Alkaff
Tahap 1
𝑆1 𝑋1 𝑬[𝑓1 𝑆1 ]
10.000 B (10.000-10.000+10.000+21.000)(0,9) + (10.000-10.000+20.000+43.000)(0.1) = 34.200
Abe Alkaff
Ambil satu contoh persoalan pengaturan optimal semacam ini dari buku
referensi atau yang lain atau buat sendiri dan kerjakan sesuai dengan langkah-
langkah pada bahan kuliah ini
Abe Alkaff
(Π0 𝑛 + 1 Π1 𝑛 + 1 Π2 𝑛 + 1 ) = (Π0 𝑛 Π1 𝑛 Π2 𝑛 𝑃
Abe Alkaff
Π 𝑛+1 =Π 𝑛 𝑃
Dimana 𝑃00 𝑃01 𝑃02
Π 𝑛 = (Π0 𝑛 Π1 𝑛 Π2 𝑛 𝑃 = 𝑃10 𝑃11 𝑃12
𝑃20 𝑃21 𝑃22
Bila system stabil, maka akan mencapai kondisi steady state yaitu kondisi dimana
probabilitas berada pada satu state tertentu tidak lagi merupakan fungsi waktu:
lim Π 𝑛 = Π
𝑛→∞
sehingga
Π = Π𝑃
Π(𝐼 − 𝑃) = 0
Abe Alkaff
Untuk contoh Toko TV dengan strategi 1 (order hanya kalau habis) diperoleh:
0.2 0.5 0.3
𝑃 = 0.7 0.3 0
0.2 0.5 0.3
Dari persamaan Π 𝐼 − 𝑃 = 0, nilai Π dapat dihitung
Abe Alkaff
Π𝑖 𝐾𝑖
𝑖=1
Strategi 1:
𝐾1 = −9.2; 𝐾2 = 12.8; 𝐾3 = 15.8
98 100 42
= . −9.2 + . 12.8 + . 15.8
240 240 240
= 𝟒. 𝟑𝟒𝟏𝟕
Strategi 2 Nilai pada strategi 1 > Nilai Strategi 2
𝐾1 = −9.2; 𝐾2 = 0.8; 𝐾3 = 15.8 Sehingga strategi 1 lebih baik daripada
2 5 3 strategi 2
= . −9.2 + . 0.8 + . 15.8
10 10 10
= 𝟑. 𝟑
Abe Alkaff
Terdapat keadaan overhaul, yaitu maintenance mesin agar peformanya bisa naik 1
state. Overhaul hanya berlaku pada mesin dalam kondisi state 2 dan
mengubahnya menjadi state 1. Overhaul membutuhkan biaya 2000 dan memakan
waktu 1 minggu yang menyebabkan kehilangan kuntungan produksi sebesar 2000.
Kebijakan 1 Kebijakan 2
Kebijakan
K1 K2 K3 K4
\State State 0 1 2 3 State 0 1 2 3
1 0 1000 3000 6000 0 0 7/8 1/16 1/16 0 0 7/8 1/16 1/16
1 0 3/4 1/4 1/4 1 1 0 0 0
2 0 1000 4000 6000
2 1 0 0 0 2 1 0 0 0
3 0 1000 6000 6000 3 1 0 0 0 3 1 0 0 0
4 0 6000 6000 6000
Abe Alkaff
Kesimpulan
Dari Perhitungan diatas dapat disimpulkan bahwa biaya paling minimum dapat
dicapai dengan menggunakan kebijakan ke 2 yaitu:
1. Mengganti mesin yang berada pada state 3
2. Overhaul mesin yang berada pada state 2
Dengan total biaya yang dikeluarkan sebesar $ 1667
Ambil satu contoh persoalan proses keputusan markov semacam ini dari buku
referensi atau yang lain atau buat sendiri dan kerjakan sesuai dengan langkah-
langkah pada bahan kuliah ini
Abe Alkaff
Tugas 8
Kerjakan tugas-tugas yang diberikan pada bahan paparan ini