Bab 8 Program Dinamik Stokastik
Bab 8 Program Dinamik Stokastik
Alkaff
Penyelidikan Operasi
𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛
Deterministik: 𝑆𝑡𝑎𝑡𝑒 𝑋
𝑆𝑡𝑎𝑡𝑒 𝑋 𝑁 +1
𝑆𝑡𝑎𝑡𝑒
𝑁
𝑆 𝑁 𝑆 𝑁 +1 𝑆 𝑁 +2
𝑓 𝑛 (𝑆 𝑛 ) 𝐶
𝑛 ( 𝑋 𝑛 , 𝑆 𝑛 ) 𝑓 𝑛+1 (𝑆𝑛+1) 𝐶 𝑛+1 (𝑋 𝑛 +1 , 𝑆𝑛+1 )
Keadaan pada tahap berikutnya ditentukan dengan pasti berdasarkan
keadaan dan keputusan pada tahap sebelumnya
Abe Alkaff
Stokastik:
𝑠𝑡𝑎𝑡𝑒 𝑆 1𝑛+1 𝑓 1
𝑛+¿ 1 ( 𝑆 𝑛+ 1 ) 𝑑𝑒𝑛𝑔𝑎𝑛 𝑝𝑟𝑜𝑏 𝑝 1¿
𝑠𝑡𝑎𝑡𝑒
𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛
𝑒𝑣𝑒𝑛𝑡
𝑆 𝑛 𝑋 𝑛 𝜔
𝑛 𝑠𝑡𝑎𝑡𝑒 𝑆 2𝑛+1 𝑓 𝑛+1 ( 𝑆
2
𝑛+1 ) 𝑑𝑒𝑛𝑔𝑎𝑛 𝑝𝑟𝑜𝑏 𝑝 2
𝑓 𝑛 (𝑆 𝑛 ) 𝐶 𝑛 (𝑋 𝑛 , 𝑆 𝑛 , 𝜔𝑛 )
𝑓
𝑠𝑡𝑎𝑡𝑒 𝑆 3𝑛+1 3
𝑛+¿ 1 ( 𝑆 𝑛+ 1 ) 𝑑𝑒𝑛𝑔𝑎𝑛 𝑝𝑟𝑜𝑏 𝑝 3 ¿
𝑖
𝑓 𝑛+1 ( 𝑆 𝑛+1 )=∑ 𝑝𝑖 𝑓 𝑛+1 ( 𝑆
Ekspektasi
𝑛+1 )
Abe Alkaff
Persamaan Rekursif
Contoh Permasalahan
Toko elektronik menjual TV dengan spesifikasi tertentu. Toko
tersebut menyediakan stok TV tersebut maksimum 2 unit. TV dipesan
toko dari pemasok. Pesanan tersebut datang pada hari yang sama. Biaya
pembelian adalah dimana menyatakan banyaknya yang dibeli oleh toko
dari pemasok. Banyaknya pembeli yang datang ke toko dalam satu
minggu adalah acak dengan probabilitas sebagai berikut:
Pembeli
Probabilitas
Abe Alkaff
Persyaratan
TV yang tidak laku pada suatu minggu disimpan untuk minggu depan
dengan biaya penyimpan = 2/TV/minggu
Maksimum stok TV = 2 unit
TV dijual dengan harga 20
Bila ada pembeli tetapi stok kosong, toko mengalami kerugian
kesempatan = 3/TV
Toko akan membuat rencana pemesanan dalam 1 bulan (4 minggu)
sehingga keuntungannya maksimal.
Pada awal bulan tidak ada stok.
Abe Alkaff
Hasil Penjualan
𝐵=
{ 0 , 𝑋 𝑛=0 (yg tdk terlayani minggu itu)
0
0 0
0 0
0 0
0 0
0
0
0 0
0 1
1 -3
-3 -3
-3 -2,7
-2,7
0
0 0
0 2
2 -6
-6 -6
-6
1 0 0 -2 -2
1 0 0 -2 -2
1 0 1 20 20 12,8
1 0 1 20 20 12,8
1 0 2 17 17
1 0 2 17 17
2 0 0 -4 -4
2 0 0 -4 -4
2 0 1 18 18 15,8
2 0 1 18 18 15,8
2 0 2 40 40
2 0 2 40 40
Abe Alkaff
0 1 0 -17 -17
0 1 1 5 5 -2,2
0 1 2 2 2
1 1 0 -19 -19
1 1 1 3 3 0,8
1 1 2 25 25
2 1 0 - -
2 1 1 1 1 4,7
2 1 2 21 21
Abe Alkaff
0
0 2
2 0
0 -29
-29 -29
-29
0
0 2
2 1
1 -7
-7 -7
-7 -9,2
-9,2
0
0 2
2 2
2 15
15 15
15
1
1 2
2 0
0 -- --
1
1 2
2 1
1 -9
-9 -9
-9 -1,9
-1,9
1
1 2
2 2
2 13
13 13
13
2
2 2
2 0
0 -- --
2
2 2
2 1
1 -- -- 2,2
2,2
2
2 2
2 2
2 11
11 11
11
Abe Alkaff
0
0 0
0 0
0 0
0 -2,2
-2,2
0
0 0
0 1
1 -3
-3 -5,2
-5,2 -4,9
-4,9
0
0 0
0 2
2 -6
-6 -8,2
-8,2
1
1 0
0 0
0 -2
-2 10,8
10,8
1
1 0
0 1
1 20
20 17,8
17,8 15,1
15,1
1
1 0
0 2
2 17
17 14,8
14,8
2
2 0
0 0
0 -4
-4 11,8
11,8
2
2 0
0 1
1 18
18 30,8
30,8 26,5
26,5
2
2 0
0 2
2 40
40 37,8
37,8
Abe Alkaff
0 1 0 -17 -19,2
0 1 1 5 2,8 -4,4
0 1 2 2 -0,2
1 1 0 -19 -3,2
1 1 1 3 15,8 11,5
1 1 2 25 22,8
2 1 0 - -
2 1 1 1 16,8 12,16
2 1 2 21 18,8
Abe Alkaff
0
0 2
2 0
0 -29
-29 -13,2
-13,2
0
0 2
2 1
1 -7
-7 5,8
5,8 1,5
1,5
0
0 2
2 2
2 15
15 12,8
12,8
1
1 2
2 0
0 -- --
1
1 2
2 1
1 -9
-9 6,8
6,8 8,56
8,56
1
1 2
2 2
2 13
13 25,8
25,8
2
2 2
2 0
0 -- --
2
2 2
2 1
1 -- -- 5,36
5,36
2
2 2
2 2
2 11
11 26,8
26,8
Abe Alkaff
0
0 0
0 0
0 0
0 1.5
1.5
0
0 0
0 1
1 -3
-3 -1.5
-1.5 -1.2
-1.2
0
0 0
0 2
2 -6
-6 -4.5
-4.5
1
1 0
0 0
0 -2
-2 13.1
13.1
1
1 0
0 1
1 20
20 21.5
21.5 18.38
18.38
1
1 0
0 2
2 17
17 18.5
18.5
2
2 0
0 0
0 -4
-4 22.5
22.5
2
2 0
0 1
1 18
18 33.1
33.1 31.6
31.6
2
2 0
0 2
2 40
40 41.5
41.5
Abe Alkaff
0 1 0 -17 -1,9
0 1 1 5 6,5 2,28
0 1 2 2 3,5
1 1 0 -19 7,5
1 1 1 3 18,1 16,6
1 1 2 25 26,5
2 1 0 - -
2 1 1 1 27,5 20,97
2 1 2 21 36,1
Abe Alkaff
0 2 0 -29 -2,5
0 2 1 -7 8,1 6,6
0 2 2 15 16,5
1 2 0 - -
1 2 1 -9 6,1 8,67
1 2 2 13 28,1
2 2 0 - -
2 2 1 - - 7,5
2 2 2 11 37,5
Abe Alkaff
0 0 0 0 6,6
0 0 1 -3 3,6 3,65
Ulangi iterasi ini
0 0 2 -6 0,6 dengan
0 1 0 -17 1,38 menggunakan S
0 1 1 5 11,6 7,934 sebagai variable
utama (S tetap,
0 1 2 2 8,6 X berubah). Apa
0 2 0 -29 2,6 bisa? Apakah
0 2 1 -7 11,38 6,79 lebih mudah?
0 2 2 15 1,6
Abe Alkaff
𝑠 𝑛+1 =𝑔( 𝑠𝑛 , 𝑥 𝑛 , 𝑤𝑛 )
Aksi
Kontrol adalah keputusan yang diambil untuk mempengaruhi
perubahan state
Aksi kontrol pada saat n
Aksi Kontrol yang mengoptimalkan suatu nilai kriteria disebut kontrol Optimal
atau Pengaturan Optimal
Abe Alkaff
𝑁
𝐾 =∑ 𝐶 𝑛 (𝑠𝑛 , 𝑥 𝑛 , 𝑤𝑛 )
𝑛=1
Dengan demikian aksi kontrol optimal adalah yang mengoptimalkan K
𝑁
𝑂𝑝𝑡 𝐾=𝑂𝑝𝑡 ∑ 𝐶𝑛 (𝑠 𝑛 , 𝑥 𝑛 , 𝑤 𝑛)
𝑥 𝑛 𝑥 𝑛
𝑛 =1
Abe Alkaff
Secara
umum, suatu Strategi Kontrol dinyatakan dalam suatu fungsi yang
manyatakan hubungan antara dan yang berlaku untuk semua = 1,2,…
𝑥 𝑛= 𝑓 ( 𝑠 𝑛 , 𝑤 𝑛 ) 𝑛=1,2 , … , 𝑁
Abe Alkaff
Contoh : Persediaan TV
Banyak stok TV pada awal minggu ke-
Banyaknya TV yang dipesan pada awal minggu ke-
Penjualan TV dalam minggu ke-
Abe Alkaff
Contoh : Persediaan TV
Strategi 1
Tahap 4 – Minggu Keempat
0
0 2
2 (0.2)(15)+(0.5)(-7)+(0.3)(-29)=
(0.2)(15)+(0.5)(-7)+(0.3)(-29)= -9.2
-9.2
1
1 0
0 (0.5)(20)+(0.2)(17)+(0.3)(-2)=12.8
(0.5)(20)+(0.2)(17)+(0.3)(-2)=12.8
2
2 0
0 (0.2)(40)+(0.5)(18)+(0.3)(-4)=15.8
(0.2)(40)+(0.5)(18)+(0.3)(-4)=15.8
Abe Alkaff
Contoh : Persediaan TV
Strategi 1
0
0 2
2 (0.2)(15-9.2)+(0.5)(-7+12.8)+(0.3)(-29+15.8)=
(0.2)(15-9.2)+(0.5)(-7+12.8)+(0.3)(-29+15.8)= 0.1
0.1
1
1 0
0 (0.5)(20-9.2)+(0.2)(17-9.2)+(0.3)(-2+12.8)=10.2
(0.5)(20-9.2)+(0.2)(17-9.2)+(0.3)(-2+12.8)=10.2
2
2 0
0 (0.2)(40-9.2)+(0.5)(18+12.8)+(0.3)(-4+15.8)=25.1
(0.2)(40-9.2)+(0.5)(18+12.8)+(0.3)(-4+15.8)=25.1
Abe Alkaff
Contoh : Persediaan TV
Strategi 1
0
0 2
2 (0.2)(15+0.1)+(0.5)(-7+10.2)+(0.3)(-29+25.1)=
(0.2)(15+0.1)+(0.5)(-7+10.2)+(0.3)(-29+25.1)= 3.39
3.39
1
1 0
0 (0.5)(20+0.1)+(0.2)(17+0.1)+(0.3)(-2+10.2)=15.93
(0.5)(20+0.1)+(0.2)(17+0.1)+(0.3)(-2+10.2)=15.93
2
2 0
0 (0.2)(40+0.1)+(0.5)(18+10.2)+(0.3)(-4+25.1)=28.45
(0.2)(40+0.1)+(0.5)(18+10.2)+(0.3)(-4+25.1)=28.45
Abe Alkaff
Contoh : Persediaan TV
Strategi 1
Strategi 2
Rumusan strategi kontrolnya adalah:
𝑥 𝑛=2 − 𝑠 𝑛
Contoh : Persediaan TV
Strategi 2
0
0 2
2 (0.2)(15)+(0.5)(-7)+(0.3)(-29)=
(0.2)(15)+(0.5)(-7)+(0.3)(-29)= -- 9.2
9.2
1
1 1
1 (0.2)(25)+(0.5)(3)+(0.3)(-19)=
(0.2)(25)+(0.5)(3)+(0.3)(-19)= 0.8
0.8
2
2 0
0 (0.2)(40)+(0.5)(18)+(0.3)(-4)=15.8
(0.2)(40)+(0.5)(18)+(0.3)(-4)=15.8
Abe Alkaff
Contoh : Persediaan TV
Strategi 2
0
0 2
2 (0.2)(15-9.2)+(0.5)(-7+0.8)+(0.3)(-29+15.8)=
(0.2)(15-9.2)+(0.5)(-7+0.8)+(0.3)(-29+15.8)= -5.9
-5.9
1
1 1
1 (0.2)(25-9.2)+(0.5)(3+0.8)+(0.3)(-19+15.8)=
(0.2)(25-9.2)+(0.5)(3+0.8)+(0.3)(-19+15.8)= 4.1
4.1
2
2 0
0 (0.2)(40-9.2)+(0.5)(18+0.8)+(0.3)(-4+15.8)=19.1
(0.2)(40-9.2)+(0.5)(18+0.8)+(0.3)(-4+15.8)=19.1
Abe Alkaff
Contoh : Persediaan TV
Strategi 2
0
0 2
2 (0.2)(15-5.9)+(0.5)(-7+4.1)+(0.3)(-29+19.1)=
(0.2)(15-5.9)+(0.5)(-7+4.1)+(0.3)(-29+19.1)= -2.6
-2.6
1
1 1
1 (0.2)(25-5.9)+(0.5)(3+4.1)+(0.3)(-19+19.1)=
(0.2)(25-5.9)+(0.5)(3+4.1)+(0.3)(-19+19.1)= 7.4
7.4
2
2 0
0 (0.2)(40-5.9)+(0.5)(18+4.1)+(0.3)(-4+19.1)=22.4
(0.2)(40-5.9)+(0.5)(18+4.1)+(0.3)(-4+19.1)=22.4
Abe Alkaff
Contoh : Persediaan TV
Strategi 2
Strategi 1
Strategi 2
Abe Alkaff
Strategi kontrol:
1. Investasi di B jika uang tersedia , investasi di A jika uang tersedia
2. Hanya berinvestasi di B
Abe Alkaff
Tabel Probabilitas
Uang Tersedia Tahun
Aksi Berikutnya
Uang Tersedia
Kontrol
A 0,25 - 0,75
B - 0,9 0,1
A 0,25 - 0,75
B - 0,9 0,1
Abe Alkaff
Tahap 3
Tahap 2
Strategi 2
Tahap 3
Tahap 1
Ambil satu contoh persoalan pengaturan optimal semacam ini dari buku
referensi atau yang lain atau buat sendiri dan kerjakan sesuai dengan langkah-
langkah pada bahan kuliah ini
Abe Alkaff
.3
Abe Alkaff
Abe Alkaff
Dimana 𝑃 00 𝑃 01 𝑃02
(
𝑃= 𝑃 10
𝑃 20
𝑃1 1
𝑃21
𝑃1 2
𝑃 22 )
Bila
system stabil, maka akan mencapai kondisi steady state yaitu kondisi dimana
probabilitas berada pada satu state tertentu tidak lagi merupakan fungsi waktu:
sehingga
Abe Alkaff
98
𝜋 0=
240
Abe Alkaff
2
𝜋 0=
10
Abe Alkaff
Strategi 1:
Strategi 2
Mesin dalam kondisi state 3 harus diganti. Penggantian mesin (bisa dalam state
1,2, dan 3) memakan biaya sebesar 4000, selain itu penggantian membutuhkan
waktu 1 minggu yang menyebabkan kehilangan kuntungan produksi sebesar 2000
Terdapat keadaan overhaul, yaitu maintenance mesin agar peformanya bisa naik 1
state. Overhaul hanya berlaku pada mesin dalam kondisi state 2 dan
mengubahnya menjadi state 1. Overhaul membutuhkan biaya 2000 dan memakan
waktu 1 minggu yang menyebabkan kehilangan kuntungan produksi sebesar 2000.
Kebijakan 1 Kebijakan 2
Kebijakan
K1 K2 K3 K4
\State State 0 1 2 3 State 0 1 2 3
1 0 1000 3000 6000 0 0 7/8 1/16 1/16 0 0 7/8 1/16 1/16
𝜋0+𝜋1+𝜋2+𝜋3=1
( 1 ) 𝜋 0 =𝜋 3
Abe Alkaff
𝜋0+𝜋1+𝜋2+𝜋3=1
Abe Alkaff
𝜋0+𝜋1+𝜋2+𝜋3=1
Abe Alkaff
𝜋0+𝜋1+𝜋2+𝜋3=1
Abe Alkaff
1 ,,
1
2
3
2
4
3
4
Abe Alkaff
Kesimpulan
Dari Perhitungan diatas dapat disimpulkan bahwa biaya paling minimum dapat
dicapai dengan menggunakan kebijakan ke 2 yaitu:
1. Mengganti mesin yang berada pada state 3
2. Overhaul mesin yang berada pada state 2
Dengan total biaya yang dikeluarkan sebesar $ 1667
Ambil satu contoh persoalan proses keputusan markov semacam ini dari buku
referensi atau yang lain atau buat sendiri dan kerjakan sesuai dengan langkah-
langkah pada bahan kuliah ini
Abe Alkaff
Tugas 8
Kerjakan tugas-tugas yang diberikan pada bahan paparan ini