Anda di halaman 1dari 31

TIA-310

Metode Stokastik

Pemrograman Dinamis

Universitas Andalas
2009
TIA-310 Metode STokastik 1
Hasil Pembelajaran
Umum
Mahasiswa mampu menerapkan model
matematik dan teknik Penelitian Operasional
Lanjut

Khusus
Memahami dan mampu menggunakan konsep
Pemrograman Dinamis

TIA-310 Metode STokastik 2
Permasalahan Nyata
Pemrograman dinamis adalah suatu teknik matematis
untuk pembuatan serangkaian keputusan yang saling
berhubungan; merupakan prosedur sistematis untuk
menentukan kombinasi keputusan yang optimal.
Masalah Perjalanan Kereta. Abdel akan pergi dari
kota A ke kota J, melewati berbagai keadaan (state,
kota) lain dengan berbagai pilihan sebagaimana terlihat
di gambar. Tingkat keamanan masing-masing lintasan
berbeda. Demi keamanan maka Abdel membeli polis
asuransi yang nilainya berbeda; semakin aman maka
polis akan semakin murah.
TIA-310 Metode STokastik 3
Permasalahan Nyata
B C D
A 2 4 3
TIA-310 Metode STokastik
2
2
3
7
4
1
1
4
3
3
3
A
H

I

J

5
E

F

G

6
B

C

D

3
4
4
4
4 6
3
E F G
B 7 4 6
C 3 2 4
D 4 1 5
H I
E 1 4
F 6 3
G 3 3
J
H 3
I 4
4
Ciri-ciri Masalah Pemrograman Dinamis
1. Permasalahan dapat dibagi dalam tahap-tahap (stages), dengan
suatu keputusan kebijaksanaan diperlukan di setiap tahap.
2. Setiap tahap memiliki sejumlah keadaan (states) yang
bersesuaian.
3. Pengaruh keputusan kebijakan pada setiap tahap adalah untuk
mengubah keadaan sekarang yang berkaitan dengan tahap
berikutnya (mungkin menurut suatu distribusi peluang tertentu).
4. Prosedur penyelesaian dirancang untuk menemukan suatu
kebijakan optimal untuk keseluruhan masalah, yaitu pemberian
keputusan kebijakan optimal pada setiap tahap untuk setiap
kemungkinan keadaan.
5. Bila diketahui keadaan sekarang, kebijakan optimal untuk tahap-
tahap yang tersisa adalah bebas terhadap kebijakan yang dipakai
pada tahap-tahap sebelumnya. (Ini adalah prinsip keoptimalan
dalam pemrograman dinamis)
TIA-310 Metode STokastik 5
Ciri-ciri Masalah Pemrograman Dinamis
6. Prosedur penyelesaian dimulai dengan menemukan kebijakan optimal
untuk tahap terakhir.
7. Tersedia hubungan rekursif yang mengidentifikasi kebijakan optimal pada
tahap n, bila diketahui kebijakan optimal untuk tahap (n + 1).
Bentuk pasti dari hubungan rekursif berbeda-bedadiantara masalah-
masalah pemrograman dinamis, tetapi secara umum notasi yang dipakai
aalah:
N = banyaknya tahap
n = label untuk tahap sekarang (n = 1, 2, , N)
s
n
= keadaan sekarang untuk tahap n
x
n
= peubah keputusan untuk tahap n
x
n
*
= nilai optimal x
n
(diketahui s
n
)
f
n
(s
n
,x
n
) = kontribusi tahap n, n+1, , N kepada fungsi tujuan bila sistem dimulai
dari keadaan s
n
pada tahap n, keputusan sekarang adalah x
n
dan keputusan
optimal dibuat sesudahnya.
f
n
*
(s
n
) = f
n
(s
n
,x
n
*
)

TIA-310 Metode STokastik 6
Ciri-ciri Masalah Pemrograman Dinamis
Hubungan rekursif akan selalu memiliki bentuk


8.Bila kita gunakan hubungan rekursif ini,
prosedur penyelesaian bergerak mundur
tahap demi tahap setiap kali menemukan
kebijakan optimal untuk tahap tersebut
sampai ditemukan kebijakan optimal yang
dimulai dari tahap awal.
TIA-310 Metode STokastik
( ) ( ) { } ( ) ( ) { }
n n n
x
n
*
n n n n
x
n
*
n
x , s f min s f atau x , s f max s f
n n
= =
7
Pemrograman Dinamis Deterministik (PDD)
Keadaan pada tahap berikut ditentukan
sepenuhnya oleh keadaan dan keputusan
kebijakan pada tahap sekarang.
PDD dapat diuraikan dengan diagram berikut:

TIA-310 Metode STokastik
Tahap n Tahap n+1
s
n
s
n+1

Kontribusi
dari x
n

f
n
(s
n
, x
n
) f
n+1
*
(s
n+1
)
Keadaan:
8
Pemrograman Dinamis Deterministik
Pada tahap n, proses akan berada pada suatu keadaan s
n
.
Pembuatan keputusan kebijakan x
n
selanjutnya menggerakkan
proses ke keadaan s
n+1
pada tahap (n+1).
Kontribusi sesudahnya terhadap fungsi tujuan di bawah kebijakan
optimal telah dihitung sebelumnya sebagai f
n+1
*
(s
n+1
).
Keputusan kebijakan x
n
juga memberi beberapa kontribusi kepada
fungsi tujuan.
Kombinasi kedua nilai ini dengan benar akan memberikan f
n
(s
n
,x
n
),
yaitu kontribusi n tahap ke depan kepada fungsi.
Pengoptimalan terhadap x
n
dan f
n
*
(s
n
,x
n
) = f
n

(s
n
,x
n
*
).
Setelah ditemukan x
n
*
dan f
n
*
(s
n
) untuk setiap nilai s
n
, prosedur
penyelesaian sekarang siap bergerak mundur satu tahap.
Fungsi tujuan: meminimumkan atau memaksimumkan.
TIA-310 Metode STokastik 9
Pemrograman Dinamis Deterministik
Contoh 1: Masalah Perjalanan Kereta
Peubah keputusan: x
n
(n = 1, 2, 3, 4)adalah tujuan sekarang pada tahap ke-
n (perjalanan kereta ke-n). Jadi rute yang dipilih adalah A x
1
x
2
x
3

x
4
(dengan x
4
= j).
Misalkan f
n
(s, x
n
) adalah total biaya seluruh polis terbaik untuk tahap-tahap
tersisa, bila dianggap Abdel berada pada kadaan s, sedang bersiap untuk
memulai tahap ke-n, dan memilih x
n
sebagai tujuan sekarang. Dengan
menganggap s
n
dan n diketahui, misalkan x
n
*
melambangkan nilai yang
meminimumkan x
n
dan misalkan f
n
(s, x
n
) adalah nilai minimum dari f
n
(s,
x
n
). Dengan demikian:
f
n
*
(s
n
)= min f
n
(s
n
, x
n
) = f
n
(s
n
, x
n
*
)
dengan
f
n
(s
n
, x
n
) = biaya sek. (tahap n) + biaya min. mendatang (tahap n+1)
= c
sxn
+ f
n+1
*
(s
n
, x
n
)
Tujuan: menemukan f
1
*
(s
1
=A) dan rute yang sesuai, yang dilakukan secara
berurutan dengan menemukan f
4
*
(s
4
), f
3
*
(s
3
), f
2
*
(s
2
) untuk setiap keadaan s
yang mungkin dan kemudian menggunakan f
2
*
(s) untuk mencari f
1
*
(A)
TIA-310 Metode STokastik 10
Pemrograman Dinamis Deterministik
Prosedur penyelesaian:
Ketika Abdel tinggal memiliki satu tahap lagi (n = 4), rute kemudian
ditentukan sepenuhnya oleh keadaan sekarang s (entah H atau I) dan
tujuan akhir x
4
= j, sehingga rute tahap terakhir adalah sj. Jadi:

n = 4

Untuk n = 3, maka:

n = 3

TIA-310 Metode STokastik
s f
4
*
(s) x
4
*

H 3 J
I 4 J
x
3

s f
3
(s,x
3
)=c
sx3
+ f
4
*
(x
3
) f
3
*
(s) x
3
*

H I
E 4 8 4 H
F 9 7 7 I
G 6 7 6 H
11
Pemrograman Dinamis Deterministik
Untuk n = 2, maka







Untuk n = 1, maka

TIA-310 Metode STokastik
x
2

s f
2
(s,x
2
)=c
sx2
+ f
3
*
(x
2
) f
2
*
(
s)
x
2
*

E F G
B 7+4=11 4+7=
11
6+6=
12
11 E or F
C 3+4=7 2+7=
9
4+6=
10
7 E
D 4+4=8 1+7=
8
5+6=
11
8 E or F
x
1

s f
1
(s,x
1
)=c
sx1
+ f
2
*
(x
2
) f
1
*
(s) x
1
*

B C D
A 2+11=1
3
4+7=
11
3+8=11 11 C or
D
12
Pemrograman Dinamis Deterministik
Contoh 2: pendistribusian kelompok medis
Dewan Kesehatan Dunia memiliki lima kelompok medis yang
dialokasikan kepada tiga negara untuk meningkatkan pelayanan medis,
pendidikan kesehatan, dan program-program training. Jadi dewan
tersebut perlu menentukan berapa banyak kelompok (jika ada) untuk
dialokasikan ke setiap negara guna memaksimumkan keefektifan total
dari kelima kelompok. Kelompok-kelompok tersebut harus tetap utuh
sehingga banyaknya kelompok yang dialokasikan adalah bilangan bulat.
Ukuran yang digunakan adalah tambahan hidup perorangan (untuk
negara-negara tertentu, ukuran ini sama dengan kenaikan harapan
hidup negara tersebut dalam tahun dikalikan populasinya).
Tabel 11-1 memberikan dugaan tambahan tahun hidup perorangan
(dalam kelipatan 1000) pada setiap negara untuk setiap kemungkinan
alokasi kelompok medis.
Masalah: Alokasi manakah yang memaksimumkan ukuran tersebut.
TIA-310 Metode STokastik 13
Pemrograman Dinamis Deterministik




Kita definisikan:
x
n
= banyaknya kelompok yang dialokasikan ke tahap (negara) n.
s
n
= banyaknya kelompok medis yang tetap tersedia untuk alokasi
pada negara yang tersisa (n, , 3)
p
i
(x
i
) = ukuran pengalokasian x kelompok medis ke negara i.
Jadi, tujuannya adalah menemukan x
1
, x
2
, x
3
sehingga:

TIA-310 Metode STokastik
Banyaknya kelompok
medis
Tambahan Tahun Hidup (dalam ribuan)
Negara
1 2 3
0 0 0 0
1 45 20 50
2 70 45 70
3 90 75 80
4 105 110 100
5 120 150 130
14
Pemrograman Dinamis Deterministik
Memaksimumkan

dengan kendala

dan x
i
adalah bilangan bulat tak negatif.
Maka f
n

(s
n
,x
n
) adalah:

di mana nilai maksimum tersebut diambil untuk x
n+1
, , x
3
sedemikian
sehingga:

dan x
n
adalah bilangan bulat tak negatif untuk n = 1, 2, 3. Kemudian:


TIA-310 Metode STokastik
( )

=
3
1 i
i i
x p
5
3
1
=

= i
i
x
( ) ( ) ( )

+ =
+ =
3
1 n i
i i n n n n n
x p kan memaksimum x p x , s f
n
i
i
s x =

=
3
1
( ) ( )
n n n
s x
n n
x s f s f
n n
, max
,..., 1 , 0
*
=
=
15
Tahap n
Tahap
n+1
s
n

s
n
- x
n

p
n

(x
n
)

Nilai: f
n
(s
n
, x
n
)= p
n
(x
n
)+

f
n+1
*
( s
n
- x
n
) f
n+1
*
(s
n+1
)
Keadaan:
Pemrograman Dinamis Deterministik
Jadi,

(dengan f
4
*
= 0). Hubungan dasar ini diringkaskan di gambar bawah.



Akibatnya, hubungan rekursif untuk masalah ini adalah:


Untuk tahap terakhir (n = 3):
TIA-310 Metode STokastik
( ) ( ) ( )
n n n n n n n n
x s f x p x , s f + =
+1
( ) ( ) ( ) { } 2 1
1
1 0
, n untuk , x s f x p max s f
n n
*
n n n
s ,..., , x
n
*
n
n n
= + =
+
=
( ) ( )
3 3
1 0
3 3
3
x p max s f
s ,..., , x
*
n
=
=
16
Pemrograman Dinamis Deterministik

n =3


Kita sekarang bergerak mundur untuk mulai dari tahap sebelum akhir (n=2).
Di sini menemukan x
2
*
perlu perhitungan dan pembandingan f
2
(s
2
, x
2
) untuk
alternatif nilai-nilai x
2
, yaitu x
2
= 0, 1, , s
2
. Didapat:


n = 2
TIA-310 Metode STokastik
s
3
f
3
*
(s
3
) x
3
*

1 50 1
2 70 2
3 80 3
4 100 4
5 130 5

s
2

x
2

f
2
*
(s
2
)

x
2
*
f
2
(s
2
, x
2
) = p
2
( x
2
) + f
3
*
(s
2
- x
2
)
0 1 2 3 4 5
0 0 0 0
1 50 20 50 0
2 70 70 45 70 0 atau 1
3 80 90 95 75 95 2
4 100 100 115 125 110 125 3
5 130 120 125 145 160 150 160 4
17
Pemrograman Dinamis Deterministik
Akhirnya, untuk n = 1, kita dapatkan

n=1

Jadi, penyelesaian optimal memiliki x
1
*
= 1 yang membuat s
2
= 5 -
1 = 4, sehingga x
2
*
= 3, dan ini membuat s
3
= 4 - 3 = 1, sehingga x
3
*

= 1.
Karena f
1
*
(5)= 170, maka alokasi (1,3,1) kelompok medis ke tiga
negara akan menghasilkan sejumlah 170.000 tambahan tahun
hidup perorangan, yang paling tidak 5.000 lebih banyak daripada
sembarang alokasi lainnya.
TIA-310 Metode STokastik

s
1

x
1

f
1
*
(s
1
)

x
1
*
f
1
(s
1
, x
1
) = p
1
( x
1
) + f
2
*
(s
1
- x
1
)
0 1 2 3 4 5
5 160 170 165 160 155 120 170 1
18
Pemrograman Dinamis Deterministik
Contoh 3: Pendistribusian Ahli ke Kelompok Penelitian
Suatu proyek luar angkasa pemerintah mengadakan penelitian pada suatu
masalah teknis yang harus dipecahkan sebelum orang dapat terbang dengan
aman ke Mars.
Tiga kelompok penelitian sedang mencoba tiga macam pendekatan untuk
memecahkan masalah ini. Suatu perkiraan dibuat, di bawah keadaan sekarang,
peluang bahwa masing-masing kelompok namakan 1, 2, dan 3 tidak
berhasil adalah berturut-turut 0,40; 0,60; dan 0,80. Jadi peluang sekarang
bahwa ketiga kelompok akan gagal adalah (0,40)(0,60)(0,80) = 0,192.
Karena tujuannya adalah untuk meminimumkan peluang kegagalan maka dua
orang peneliti ahli terkenal ditugaskan ke proyek tersebut.
Tabel di bawah memberikan dugaan peluang bahwa kelompok-kelompok
tersebut akan gagal ketika 0, 1, atau 2 tambahan peneliti diberikan kepada
kelompok tersebut.
Tahap n (n = 1,2,3) berpadanan dengan kelompok penelitian n
Keadaan s
n
adalah banyaknya ahli yang masih tersedia untuk dialokasikan ke
kelompok yang tersisa.
TIA-310 Metode STokastik 19
Pemrograman Dinamis Deterministik
Peubah keputusan x
n
adalah banyaknya tambahan ahli yang dialokasikan ke
kelompok n.




Misalkan p
i
(x
i
) melambangkan peluang kegagalan untuk kelompok i, bila
diberikan tambahan x
i
ahli.
Tujuan pemerintah adalah untuk memilih x
1
, x
2
, x
3
sehingga dapat digunakan
untuk:

Dengan kendala

dan x
i
adalah bilangan bulat tak negatif.
TIA-310 Metode STokastik
Banyak
ahli baru
Peluang kegagalan
Kelompok
1 2 3
0 0,40 0,60 0,80
1 0,20 0,40 0,50
2 0,15 0,20 0,30
( ) ( ) ( ) ( )
3 3 2 2 1 1
3
1
x p x p x p x p imumkan min Me
i
i i
=
[
=
2
3
1
=

= i
i
x
20
Pemrograman Dinamis Deterministik
Akibatnya f
n
(s
n
, x
n
) untuk masalah ini adalah:

Dengan minimumnya diambil menurut x
n+1
, , x
3
sedemikian sehingga


Jadi:

Dengan demikian:


(dengan f
4
*
didefinisikan sebagai satu). Gambar di bawah meringkaskan
hubungan dasar ini.

TIA-310 Metode STokastik
( ) ( ) ( )
[
+ =
=
1 n i
i i n n n n n
x p imum min . x p x , s f
n
i
i
s x =

=
3
1
( ) ( )
n n n n
*
n
x , s f imum min s f =
( ) ( ) ( )
n n
*
n n n n n n
x s f . x p x , s f =
+1
21
Pemrograman Dinamis Deterministik





Jadi, hubungan rekursif yang berkaitan dengan fungsi f
n
, dan pada kasus ini
adalah:

Dan bila n = 3,

Didapat:

n = 3
TIA-310 Metode STokastik
Tahap n
Tahap
n+1
s
n

s
n
- x
n

p
n

(x
n
)

Nilai: f
n
(s
n
, x
n
)= p
n
(x
n
).

f
n+1
*
( s
n
- x
n
) f
n+1
*
(s
n+1
)
Keadaan:
( ) ( ) ( ) { } 2 1
1
, n untuk , x s f . x p min s f
n n
*
n n n
s x
n
*
n
n n
= =
+
s
( ) ( )
3 3 3 3
3 3
x p imum min s f
s x
*
s
=
s
3
f
3
*
(s
3
) x
3
*

0 0,80 0
1 0,50 1
2 0,30 2
22
Pemrograman Dinamis Deterministik


n = 2





n = 1




Jadi, penyelesaian optimal adalah: x
1
*
= 1, yang membuat s
2
= 2 -1 = 1, sehingga x
2
*

= 0, yang membuat s
3
= 1 0 = 1, sehingga x
3
*
= 1. Artinya Kelompok 1 dan 3
masing-masing harus menerima satu orang tenaga ahli tambahan. Peluang ketiga
kelompok akan gagal adalah 0,060.
TIA-310 Metode STokastik

s
2

X
2

f
2
*
(s
2
)

x
2
*
f
2
(s
2
, x
2
) = p
2
( x
2
) . f
3
*
(s
2
- x
2
)
0 1 2
0 0,48 0,48 0
1 0,30 0,32 0,30 0
2 0,18 0,20 0,16 0,16 2

s
1

x
1

f
1
*
(s
1
)

x
1
*
f
1
(s
1
, x
1
) = p
1
( x
1
) . f
2
*
(s
1
- x
1
)
0 1 2
2 0.064 0,060 0,072 0,060 1
23
Pemrograman Dinamis Probabilistik
Keadaan pada tahap berikutnya tidak seluruhnya ditentukan oleh keadaan
dan keputusan kebijakan pada tahap sekarang.
Ada suatu sebaran probabilitas tentang keadaan mendatang, walaupun
sebaran peluang ini tetap ditentukan sepenuhnya oleh keadaan dan
keputusan kebijakan pada keadaan sekarang. Lihat gambar.
S : banyaknya keadaan yang mungkin pada tahap n+1.
Sistem bergerak ke keadaan i dengan peluang p
i
(i = 1,2,,S) bila diketahui
keadaan s
n
dan keputusan x
n
pada tahap n.
Bila sistem bergerak ke keadaan i, maka C
i
adalah kontribusi tahap n ke
fungsi tujuannya.
Hubungan antara f
n
(s
n
, x
n
) dan f
n+1
*
(s
n
, x
n
) agak lebih rumit daripada untuk
pemrograman dinamis deterministik. Bentuk yang tepat dari hubungan
tergantung pada bentuk fungsi secara umum. Misalkan tujuannya adalah
meminimumkan jumlah yang diharapkan dari kontribusi tahap-tahap
secara terpisah. Pada kasus ini f
n
(s
n
, x
n
) menggambarkan jumlah minimum
yang diharapkan dari tahap n dan seterusnya, bila diketahui bahwa
keadaan dan keputusan kebijakan pada tahap n adalah s
n
dan x
n
.
TIA-310 Metode STokastik 24
Pemrograman Dinamis Probabilistik







Akibatnya:

Dengan


Di mana peminimuman ini dibuat di atas nilai kelayakan bagi x
n+1
.
TIA-310 Metode STokastik
Tahap n
kontribusi
tahapan n
s
n

1


Keputusan

f
n
(s
n
, x
n
)
f
n+1
*
(1)
Keadaan:
x
n

2


S


f
n+1
*
(2)
f
n+1
*
(S)
p
1

C
1

p
2

P
S

C
2

C
S



Probabiitas
( ) ( ) | |

=
+
+ =
s
i
*
n i i n n n
i f C p x , s f
1
1
( ) ( )
1 1 1
1
+ + +
+
=
n n
x
*
n
x , i f imum min i f
n
25
Pemrograman Dinamis Probabilistik
Contoh 1: Penentuan Kelonggaran Penolakan
PT Aku Suka telah menerima pesanan untuk satu jenis barang tipe tertentu.
Akan tetapi pembelinya telah menentukan kualitas dengan tegas bahwa pabrik
tersebut harus memproduksi lebih dari satu barang untuk mendapatkan
barang yang diinginkan. Banyaknya kelebihan barang yang diproduksi dalam
satu masa produksi disebut sebagai kelonggaran penolakan.
Produsen memperkirakan bahwa setiap barang tipe ini yang diproduksi akan
dapat diterima dengan peluang dan rusak (tanpa kemungkinan diperbaiki)
dengan peluang . Jadi banyaknya barang dapat diterima yang diproduksi
dalam suatu lot berukuran L akan memiliki sebaran binomial; yaitu, peluang
memproduksi nol barang dapat diterima adalah ( )
L

Biaya produksi marginal untuk produk ini diperkirakan $100 per unit
(walaupun barang itu rusak) dan barang yang berlebih tidak berharga.
Biaya penyusunan sebesar $300 harus ada bilamana proses produksi dijalankan
untuk produk ini, dan susunan baru dengan biaya sama diperlukan untuk setiap
masa produksi apabila inspeksi menyeluruh menemukan bahwa suatu lot
lengkap belum mencapai barang yang dapat diterima.
TIA-310 Metode STokastik 26
Pemrograman Dinamis Probabilistik
Produsen memiliki waktu untuk menjalankan tidak lebih dari tiga masa
produksi. Bila barang yang dapat diterima belum dapat dipenuhi sampai
dengan akhir masa produksi ketiga, biaya produsen dalam kehilangan
pendapatan penjualan dan biaya denda adalah $1.600.
Tujuan masalah ini adalah untuk menentukan kebijakan tentang ukuran lot
(1 + kelonggaran penolakan) untuk masa produksi yang diperlukan yang
meminimumkan total biaya yang diperkirakan oleh produsen.
Perumusan:
Tahap n = masa produksi n (n = 1, 2, 3)
x
n
= ukuran lot untuk tahap n
Tahap s
n
= banyaknya barang dapat diterima yang masih diperlukan
(satu atau nol) pada saat memulai tahap n.
Jadi, pada tahap 1, keadaan s
1
= 1. Bila sesudahnya paling tidak diperoleh
satu barang dapat diterima, keadaan berubah menjadi s
n
= 0, di mana
biaya tambahan tidak perlu dibayarkan.

TIA-310 Metode STokastik 27
Pemrograman Dinamis Probabilistik
Maka:
f
n
(s
n
,x
n
) = total biaya yang diperkirakan untuk tahap n, , 3 bila sistem
mulai dalam keadaan s
n
pada tahap n, keputusan sekarang
adalah x
n
, dan keputusan optimal dapat dibuat sesudahnya.


dengan f
n
*
(0) = 0. Menggunakan $100 sebagai satuan uang, kontribusi ke
biaya dari tahap n adalah (K + x
n
) tanpa memperhatikan keadaan
berikutnya, dengan


Dengan demikian, untuk s
n
= 1,

TIA-310 Metode STokastik
( ) ( )
n n n
,... , x
n
*
n
x , s f imum min s f
n
1 0 =
=

>
=
=
0 3
0
n
n
x jika ,
x jika , o
K
( ) ( ) 1
2
1
1
1
*
n
x
n n n
f x K x , f
n
+
|
.
|

\
|
+ + =
28
Pemrograman Dinamis Probabilistik
Dengan f
4
*
(1) didefinisikan 16, yaitu biaya akhir bila tidak dihasilkan
barang yang dapat diterima. Ringkasan dari masalah ini lihat Gambar.
Akibatnya, hubungan rekursif adalah:




n = 3
TIA-310 Metode STokastik
( ) ( ) 3 2 1 1
2
1
1
1
1 0
, , n untuk f x K imum min f
*
n
x
n
,... , x
*
n
n
n
=

|
.
|

\
|
+ + =
+
=

S
3

X
3

f
3
*
(s
3
)

x
3
*
f
3
(1, x
3
) = K+ x
3
+16()
x
3

0 1 2 3 4 5
0 0 0 0
1 16 12 9 8 8 8 8 3 atau 4
29
Pemrograman Dinamis Probabilistik

TIA-310 Metode STokastik
Tahap n
kontribusi
tahapan n
1
0


Keputusan

f
n
(1, x
n
)=K+x
n
+()
x
n
f
n+1

*
(1)
f
n+1
*
(0)=
0
Keadaan:
x
n

1


f
n+1
*
(1)
1-()
x
n

K+x
n

Probabiitas
K+x
n

()
x
n

Keadaan n+1
30
Pemrograman Dinamis Probabilistik


n = 2





n = 1

Jadi, kebijakan optimal adalah untuk memproduksi dua barang pada masa
produksi pertama, jika tidak ada yang dapat diterima, maka memproduksi
dua atau tiga barang pada masa produksi kedua; bila tidak ada yang dapat
diterima, maka memproduksi tiga atau empat barang pada masa produksi
ketiga. Biaya total yang diperkirakan untuk kebijakan ini adalah $675.
TIA-310 Metode STokastik

S
2

X
2

f
2
*
(s
2
)

x
2
*
f
2
(1, x
2
) = K+ x
2
+f
3
*
()
x
2

0 1 2 3 4
0 0 0 0
1 8 8 7 7 7

7 2 atau 3

S
1

X
1

f
1
*
(s
1
)

x
1
*
f
1
(1, x
1
) = K+ x
1
+f
2
*
()
x
1

0 1 2 3 4
1 7 7

63/4 6 77/16 63/4 2
31