Besok
Sekarang Narik Mogok
Narik 0,32
narik
0,4 0,8
0,4
Mogok 0,08
0,2 Mogok
Analisis Markov
Hari 1 Hari 2 Hari 3
0,48
Narik
0,6
0,8
Narik
0,8 0,32
0,4 Mogok
Mogok 0,16
narik
0,2 0,8
0,2
Mogok 0,04
0,2 Mogok
Kesimpulan
Probabilitas angkot narik pada hari ke-3 jika hari ke 1
narik adalah : 0,36 + 0,32 = 0,68
Probabilitas angkot mogok pada hari ke-3 jika hari ke
1 narik adalah : 0,24 + 0,08 = 0,32
Probabilitas angkot narik pada hari ke-3 jika hari ke 1
mogok adalah : 0,48 + 0,16 = 0,64
Probabilitas angkot mogok pada hari ke-3 jika hari ke
1 mogok adalah : 0,32 + 0,04 = 0,36
Pendahuluan
Misalkan
Kondisi sebuah mesin yang digunakan dalam suatu proses produksi diketahui
menurun dengan cepat, baik dalam kualitas maupun outpunya. Karena itu, thd mesin
dilakukan pemeriksaan secara periodik, yaitu pada setiap akhir bulan. Kondisi mesin
dicatat dan diklasifikasikan ke dalam tiga keadaan (state)
State Kondisi
1 Baik
2 Cukup
3 Rusak
Jika Xt adalah state mesin setelah dilakukan pemeriksaan pada akhir bulan ke-t,
maka urutan dari state {Xt} dapat dipandang sbgi proses stochastic.
Probabilitas Transisi selama periode 1 bulan adalah:
State bulan
1 YAD 2 3
(baik (cukup (rusak
State 1 ) 0. ) 0. ) 0.
pada (Baik)
2 2 5 3
bulan (cukup) 0 0. 0.
ini 5 5
P1=
3
Dari matrik P1 di atas jelas bahwa sekali mesin itu rusak (State 3) maka akan tetap
rusak. Kondisi akan berubah bila ada perbaikan (overhaul), maka matrsik transisinya
adalah P2 sebagai berikut:
1 2 3
State pada 1 0. 0. 0.
bulan ini 2 3
0. 6
0. 1
0.
P2= 1 6 3
3 0.0 0. 0.5
5 4 5
Contoh:
Stationary Policy untuk melakukan overhaul hanya jika mesin dalam kondisi rusak (state 3),
matriks transisi dan matriks ongkosnya adalah P dan R sebagai berikut:
1 2 3
1 2 3
1 0. 0. 0.
P 1 7 6 3
2 5 3 R
= 2 0 0. 0.
= 2 0 5 1
5 5
3 0.0 0. 0.5
3 6 3 -
5 4 5
2
Matriks P dan R berbeda dari matrik P1 dan R1 hanya baris ketiga yang diambil lansung dari P2
dan R2. Alasannya matriks-matriks yang dihasilkan apabila overhaul dilakukan pada
setiap state
Langkah 3.
Tentukan yaitu ekspektasi pendapatan dari policy s untuk setiap langkah
transisi
(Periode) dengan menggunakan persamaan
METODE ENUMERASI SEMPURNA
Langkah 4.
Policy Optimum S* ditentukan dengan:
Contoh:
Pada perosalan perbaikan mesin ada 8 stationary policy sbb:
Stationary policy sTindakan
1 Tidak melakukan overhaul sama sekali
2 Overhaul tanpa memperhatikan state
3 Overhaul jika sistem dalam state 1
4 Overhaul jika sistem dalam state 2
5 Overhaul jika sistem dalam state 3
6 Overhaul jika sistem dalam state 1 atau 2
7 Overhaul jika sistem dalam state 1 atau 3
8 Overhaul jika sistem dalam state 2 atau 3
Maka diperoleh:
Langkah 1. Nilai nya dihitung sebagai berikut:
C ontoh: perhitungan pada state 1 dengan tindakan tidak melakukan overhaul
s ama sekali, maka nilai adalah:
V11
S P S S Di mana
S ( 1S , 2S ,..., mS 1)
... 1
S
1
S
2
S
m
Sebagai contoh, jika s = 2 maka dipeorleh
0 , 3 1 0 ,1 2 0 , 05 3 1
0 , 6 1 0 , 6 2 0 , 4 3 2
0 ,1 1 0 , 3 2 0 , 55 3 3
1 2 3 1
2 31 / 59
2 i
3
E 2 i2Vi 21/59
(6x4,7+31x3,1+22x0,4) = 2,256
2 / 59
2
3 E S
i 1
i dan
Dengan cara yang sama, maka dapat diketahui nilai
S
ES sebagai
berikut:
Latihan soal metode enumerasi sempurna
Sebuah perusahaan sedang memikirkan media massa di antara Radio, TV, atau Koran yang
sebaiknya digunakan untuk media advertensinya. Perusahaan dapat mengklasifikasikan volume
penjualan per minggunya sebagai:
1.Cukup
2.Baik
3.Sangat memuaskan
Probabilitas transisi untuk ketiga media advertensinya di ketahui sebagai berikut:
1 2 3 1 2 3 1 2 3
1 0, 0, 0, 1 0, 0, 0, 1 0, 0, 0,
Radi 3 4 1 Kora 2 4 2 T 6 2 1
o 2 0, 0, 0, n 2 0, 0, 0, V 2 0, 0, 0,
1 6 2 1 6 2 2 5 1
3 0, 0, 0, 3 0 0, 0, 3 0, 0, 0,
1 2 6 1 7 1 6 2
Maka:
Langkah 2 Tentukan nilai probabilitas steady state dari masing-masing media.
Probabilitas steady state untuk radio
METODE POLICY ITERASI
METODE POLICY ITERATION TANPA POTONGAN
Metode policy iteration didasarkan aturan berikut:
1.Untuk satu policy tertentu, ekspektasi pendapatan total stage pada n
dinyatakan oleh persamaan rekursif:
m
f n (i ) Vi p i f n 1 ( j ) di mana i = 1, 2, ..., m
j 1
m
E S
i 1
iS V i S
Untuk yang sangat besar:
f E f ( )
Sehingga persamaan rekursifnya menjadi:
m
E f (i) Vi pi ( 1)E f ( jatau
m
) E V i p i f ( j ) f (i )
j 1 j 1
P
Kemudian secara sembarang asumsikan f s(m) = 0 selesaikan R
persamaan berikut:
m
E Vi
S
p iS f S
( j) f S
(i )
j 1
1.Langkah Penentuan
Nilai suatu policy s secara sembarang. Gunakan matriks Ps dan Rs
Pilihlah
selesaikan m persamaan berikut:
m
f S
(i) V i S
p iS f ( j )
j 1
2.Langkah perbaikan
policy
Untuk setiap state i tentukan alternatif k yang
menghasilkan:
m
Mak V k
K
p i
S
f s
( j) di mana i = 1,2,.., m
s
K
j 1
Dimana fs (j) adalah hasil yang diperoleh pada langkah penentuan
nilai. Jika policy t yang dihasilkan sama dengan s, stop; t adalah policy
optimum. Jika tidak, tetapkan s=t, dan kembali pada langkah
penentuan nilai
Contoh:
1 2 3 1 2 3
1 0, 0, 0, 1 7 6 3
P 20 5 3 R=
= 2 0, 0, 2 0 5 1
3 0 50 51 3 0 0 -
Sehingga diperoleh persamaan 1
f(1) -0,6 { 0,2 f(1) + 0,5 f(2) + 0,3 f(3) } =
5,3
f(2) – 0,6 { 0,5 f(2) + 0,5 f(3) } = 3
f (3) -0,6 { f(3) } = -
1
Solusinya
f(1) = 6,6, f(2) = 3,21; f(3) = -2,5
Kembali kepada langkah penentuan nilai dengan matriks
Bila policy berbeda dari policy sebelumnya, maka langkah penentuan nilai
diulang dengan matrik P dan R sebagai berikut