Modul OR 2

PROGRAM DINAMIS
(Pak Ilham)
Program Dinamis adalah suatu teknik matematis yang biasanya digunakan untuk
membuat suatu keputusan dari serangkaian keputusan yang saling berkaitan.
Tujuan utama dari model ini adalah untuk memudahkan penyelesaian persoalan
optimasi yang mempunyai karakter tertentu.
Ide dasar program dinamis adalah membagi persoalan menjadi beberapa bagian
yang lebih kecil sehingga memudahkan penyelesaiannya. Akan tetapi, berbeda
dengan program linier. Pada persoalan program dinamis ini tidak ada formulasi
matematis yang standar. Karena itu, persamaan-persamaan yang terpilih untuk
digunakan harus dikembangkan agar dapat memenuhi masing-masing situasi yang
dihadapi. Dengan demikian, maka antara persoalan yang satu dan persoalan yang
lainnya dapat mempunyai stuktur penyelesaiaan soal yang berbeda.
Terdapat tiga hal penting dalam Program Dinamis:
 STAGE (tahapan) dari persoalan yang dihadapi dan ingin dicari solusinya.
 STATE (kondisi) yang menjadi faktor penentu keputusan dari tiap tahapan.
 DECISION (keputusan) yang harus diambil dari tiap tahap untuk sampai
kepada solusi keseluruhan.
Gambar 1. Hubungan Stage, State, dan Decision

Keputusan tahap N sangat ditentukan oleh keputusan pada tahap-tahap sebelumnya.
Tergantung pada jenis persoalan yang dihadapi, model/formulasi tujuan yang
diharapkan pun akan berbeda.
1.1 Ilustrasi Program Dinamis

Misalkan Seorang pedagang akan memilih rute angkutan barang dengan truk
dari kota asal (A) ke kota tujuan (K). Persoalan lebih disederhanakan dengan
memilah tahapan yang dapat ditempuh dengan lama waktu tempuh antar
kota yang dilewati, sebagai berikut:
Tahap 1 Tahap 2 Tahap 3 Tahap 4
Gambar 2. Tahapan dari kota A ke kota K

Waktu tempuh antar kota (dalam hari) adalah sebagai berikut:
Tabel. 1 Waktu Tempuh Antar Kota
Meskipun kota awal dan kota tujuan akhir diketahui, untuk tiap kota yang akan
ditempuh, pedagang tersebut memiliki beberapa alternatif dengan ongkos yang
berbeda-beda. Rute manakah yang memiliki jarak tempuh tersingkat?
Salah satu pendekatan yang dapat dilakukan untuk menyelesaikan persoalan ini
adalah dengan menggunakan cara coba-coba (trial dan error). Akan tetapi , jumlah
rute yang dapat dilalui cukup banyak sehingga menghitung total waktu tempuh
untuk masing-masing rute akan sangat membosankan. Dengan program Dinamis,
persoalan itu dapat diselesaikan secara lebih sederhana.
Perhatikan kembali ilustrasi persoalan di atas. Tetapkan variabel-variabel
keputusan 𝑥𝑛 sebagai tempat persinggahan pada stage 𝑛 ( 𝑛 = 1,2,3,4). Maka rute
yang dijalani adalah 1 → 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4 . Dimana 𝑥4 adalah kota (state) K
atau 𝑥4 = 𝐾. Selanjutnya tetapkan pula variabel-variabel berikut ini:
1. 𝑓𝑛 (𝑠, 𝑥𝑛 ) = waktu tempuh dari kota 𝑠 dan memilih 𝑥𝑛 sebagai tempat
persinggahan berikutnya.
2. Untuk 𝑠 dan 𝑛 tertentu, 𝑥𝑛∗ adalah nilai 𝑥𝑛 meminimumkan 𝑓𝑛 (𝑠, 𝑥𝑛 ).
3. 𝑓𝑛∗ (𝑆) = nilai minimum dari 𝑓𝑛 (𝑠, 𝑥𝑛 ) sehingga 𝑓𝑛∗ (𝑠) = 𝑓𝑛 (𝑠, 𝑥𝑛∗ ).
Tujuannya adalah untuk mendapatkan 𝑓1∗ (1) dengan cara mencari 𝑓4∗ (𝑠), 𝑓3∗ (𝑠),
dan 𝑓2∗ (𝑠) terlebih dahulu. Jadi program dinamis menyelesaikan persoalan dengan
melakukan perhitungan mundur walaupun untuk persoalan tertentu bisa dengan
perhitungan maju.
Berikut adalah solusi untuk persoalan di atas dengan perhitungan mundur:
Tahap 4 : min{𝑓4∗ (𝑥4 )}
Dari \ Ke K 𝑓4 (𝑥4 ) 𝑥4∗
H 15 15 HK
I 13 13 IK
J 10 10 JK
Tahap 3 : min{𝑓3 (𝑥3 ) + 𝑓4∗ (𝑥4 )}

Dari \ Ke H I J 𝑓3 (𝑥3 ) 𝑥3∗
(15) (13) (10)
D 27 27 26 26 DJ
E 32 32 23 23 EJ
F 30 31 30 30 FH, FJ
G 30 26 25 25 GJ
Contoh menghitung cell DH,

𝑓3 (𝐷, 𝐻)= 𝑓3 (𝑥3 ) + 𝑓4∗ (𝑥4 ) = 𝑓3 (𝐷) + 𝑓4∗ (𝐻)=12+15=27
Tahap 2: min{𝑓2 (𝑥2 ) + 𝑓3∗ (𝑥3 )}
Dari \ Ke D E F G 𝑓2 (𝑥2 ) 𝑥2∗
(26) (23) (30) (25)
B 46 40 48 42 40 BE
C 44 58 50 45 44 CD
Tahap 1: min{𝑓1 (𝑥1 ) + 𝑓2∗ (𝑥2 )}

Dari \ Ke B C 𝑓1 (𝑥1 ) 𝑥1∗
(40) (44)
A 55 56 55 AB
Jadi dapat disimpulkan bahwa total waktu terpendek jarak tempuh dari kota A ke K
adalah 55 jam. Dengan rute A-B-E-J-K.
Latihan :
Seorang salesman harus berangkat dari satu kota ke kota lainnya. Diantara kota asal
dan kota tujuan terdapat beberapa kota lain yang dapat digunakan sebagai tempat
persinggahan sementara. Kota-kota yang dapat dilewati tersebut dapat digambarkan
sebagai berikut.
2 5
8
1 3 6 1
9 0
4 7
Data ongkos yang harus dibayar jika salesmen itu meningggalkan kota i dan
menuju kota 𝑐𝑖𝑗 adalah sebagai berikut:
1 2 3 4 5 6 7 8 9 10
1 2 4 3
2 7 4 6
3 3 2 4
4 4 1 5
5 1 4
6 6 3
7 3 3
8 3
9 4
10
Rute manakah yang menimbulkan ongkos terkecil?
1.2 Karakteristik Persoalan Program Dinamis
Berikut ini beberapa gambaran dasar yang menandai (ciri) persoalan program
dinamis:
a. Persoalan dapat dibagi menjadi beberapa tahap (stage), yang pada masing-
masing stage diperlukan adanya satu keputusan. Pada ilustrasi di atas,
persoalan dibagi menjadi 4 stage. Keputusan pada tiap stage adalah
menetapkan kota tujuan berikutnya yang harus ditempuh. Pada persoalan
yang lain, stage ini dapat berupa satuan waktu, volume, atau satuan fisik
lainnya.
b. Masing-masing stage terdiri dari sejumlah state yang berhubungan dengan
stage yang bersangkutan. Pada ilustrasi di atas, stage yang berhubungan
dengan masing-masing stage adalah kota-kota yang disinggahi pada
masing-masing tahap perjalanan. Jumlah state ini bisa terbatas, bisa pula
tidak terbatas.
c. Hasil keputusan yang diambil pada setiap stage ditransformasikan dari state
yang bersangkutan ke state yang berikutnya.
d. Keputusan terbaik pada suatu stage bersifat independen terhadap keputusan
yang dilakukan pada stage sebelumnya.
e. Prosedur pemecahan persoalan yang dilakukan dimulai dengan
mendapatkan cara(keputusan) terbaik untuk setiap state dari stage terakhir.
f. Ada hubungan timbal balik yang mengidentifikasi keputusan terbaik untuk
setiap state pada stage n, berdasarkan keputusan terbaik untuk setiap state
pada stage (n+1). Pada ilustrasi di atas hubungan ini adalah:
∗ (𝑥 ).
𝑓𝑛∗ (𝑠) = min{𝑓𝑛 (𝑠) + 𝑓𝑛+1 𝑛
1.3 Program Dinamis Deterministik
Pendekatan program dinamis sebagai persoalan deterministik, dimana state

pada stage berikutnya sepenuhnya ditentukan oleh state dan keputusan pada
stage saat ini.
Contoh soal:
Badan Kesehatan Dunia (WHO) bermaksud akan menyempurnakan pelayanan
kesehatan di negara-negara yang sedang berkembang. Saat ini WHO
mempunyai 5 tim kesehatan yang harus ditempatkan ke tiga negara. Dengan
demikian WHO perlu menentukan berapa tim yang harus dikirim ke tiap-tiap
negara, sehingga keefektifan total dari kelima tim itu dapat maksimum. Sebagai
ukuran dari keefektifan tersebut ialah pertambahan umur (yaitu berapa tahun
umur orang akan bertambah dengan adanya tim tersebut).
Tabel 2. Taksiran Pertambahan Umur (Tahun) dalam Satuan Ribu untuk
Setiap Negara dan Tiap Alokasi Team yang Mungkin Dilakukan.
Jumlah Tim Pertumbuhan Umur

Negara 1 Negara 2 Negara 3
0 0 0 0
1 45 20 50
2 70 45 70
3 90 75 80
4 105 110 100
5 120 150 130
Solusi :
Misalkan 𝑝𝑖 (𝑥𝑖 ) adalah ukuran keefektifan dari pengalkasian sebanyak 𝑥𝑖 tim
kesehatan pada negara 𝑖. Maka fungsi tujuan adalah memilih 𝑥1 , 𝑥2 , atau 𝑥3
sehingga:
Memaksimumkan: ∑3𝑖=1 𝑝𝑖 (𝑥𝑖 )
Kendala ∑3𝑖=1 𝑥𝑖 = 5 𝑥𝑖 integer nonegatif
Dengan demikian maka:
𝑓𝑛 (𝑠, 𝑥𝑛 ) = 𝑝𝑛 (𝑥𝑛 ) + 𝑚𝑎𝑘𝑠 ∑ 𝑝𝑖 (𝑥𝑖 )

𝑖=𝑛+1
Sehingga
∑ 𝑥𝑖 = 𝑠
𝑖=𝑛
𝑥𝑖 integer nonegatif, 𝑛 = 1,2,3
Kita tahu bahwa 𝑓𝑛∗ (𝑠)=maks 𝑓𝑛 (𝑠, 𝑥𝑛 ), 𝑑𝑖𝑚𝑎𝑛𝑎 𝑥𝑛 = 0,1,2, … , 𝑠
Oleh karena itu, maka
∗ (𝑠
𝑓𝑛 (𝑠, 𝑥𝑛 ) = 𝑝𝑛 (𝑥𝑛 ) + 𝑓𝑛+1 − 𝑥𝑛 ) , 𝑑𝑖𝑚𝑎𝑛𝑎 𝑓4∗ = 0
Akibat hubungan timbal balik dari fungsi 𝑓1∗ , 𝑓2∗ , 𝑑𝑎𝑛 𝑓3∗ untuk persoalan ini
menjadi.
∗ (𝑠
𝑓𝑛 ∗ (𝑠) = maks{𝑝𝑛 (𝑥𝑛 ) + 𝑓𝑛+1 − 𝑥𝑛 ) }, untuk 𝑛 = 1,2, 𝑥𝑛 = 0,1,2 … , 𝑠)
Untuk stage terakhir (n=3), maka 𝑓3∗ (𝑠) = maks 𝑝3 (𝑥3 ). 𝑥3 = 0,1, . . , 𝑠
Berikut adalah hasil perhitungan seluruhnya, dimulai dari stage terakhir n=3
dan bergerak mundur hinga stage n=1
n=3
s 𝑓3∗ (𝑠) 𝑥3∗
0 0 0
1 50 1
2 70 2
3 80 3
4 100 4
5 130 5
n=2
𝑠 \ 𝑥2 𝑓2 (𝑠, 𝑥2 ) = 𝑝2 (𝑥2 ) + 𝑓3∗ (𝑠 − 𝑥2 ) 𝑓2∗ (𝑠) 𝑥2∗
0 1 2 3 4 5
0 0 0 0
1 50 20 50 0
2 70 70 45 70 0,1
3 80 90 95 75 95 2
4 100 100 115 125 110 125 3
5 130 120 125 145 160 150 160 4
Contoh menghitung cell (3,2)

𝑓2 (3,2) = 𝑝2 (2) + 𝑓3∗ (3 − 2) = 45 + 50 = 95
n=1
𝑠 \ 𝑥1 𝑓1 (𝑠, 𝑥1 ) = 𝑝1 (𝑥1 ) + 𝑓2∗ (𝑠 − 𝑥1 ) 𝑓1∗ (𝑠) 𝑥1∗
0 1 2 3 4 5
5 160 170 165 160 155 120 170 1
Contoh menghitung cell (5,2)
𝑓1 (5,2) = 𝑝1 (2) + 𝑓2∗ (5 − 2) = 70 + 95 = 165
Jadi solusi optimum dari persoalan di atas adalah 𝑥1∗ = 1, 𝑥2∗ = 3, dan 𝑥3∗ = 1.
Maka alokasi tim kesehatan ketiga negara tersebutberturut-turut adalah 1 tim ke
negara 1, 3 tim ke negara 2, dan 1 tim ke negara 1 yang akan menghasilkan taksiran
total 170.000 penambahan tahun orang.
Latihan :
1. Seorang pengarah jalan ingin menentukan rute terpendek antara dua kota (A dan I)
berdasarakan rute alternatif yang tersedia. Berikut gambar alternatif rute yang dapat
ditempuh dari kota A ke kota I dan biaya yang harus dikeluarkan untuk menempuh
setiap kota tujuan.
Bantulah pengarah jalan tersebut menemukan rute terpendek yang ditandai dengan
minimumnya biaya yang harus dikeluarkan.
2. Sebuah perusahaan membagi daerah pemasarannya menjadi tiga, yakni : utara,

timur, dan selatan. Perusahaan tersebut memiliki 3 salesman yang akan
dialokasikan ke tiga wilayah tersebut. Berikut adalah tabel tingkat return
keuntungan dari masing-masing daerah.
Alternatif Tingkat return

Keputusan alokasi keuntungan/daerah
jumlah salesman Utara Timur Selatan
0 0 0 2
1 7 9 6
2 12 15 10
3 20+x 18+x 16+x
Catatan:
x = satu digit terakhir NPM anda
Tentukan keputusan alokasi jumlah salesmen untuk masing-masing daerah yang

harus dipilih, agar memaksimalkan keuntungan yang diperoleh.
3. Seorang kandidat presiden ingin mendapatkan dukungan suara

terbanyak dalam rangka pemilihan umum. Untuk maksud tersebut
dia harus mengeluarkan uang untuk kampanye. Probabilitas
perolehan suara sangat bergantung kepada alokasi dana yang
disiapkan untuk tiap wilayah pemilihan/kampanye. Total dana yang
dimiliki adalah 10 M.
Perkiraan prosentase dukungan suara untuk tiap pengeluaran

uang di tiap wilayah serta jumlah suara total di tiap wilayah
adalah sebagai berikut:
Jika sang kandidat ingin mendapat suara terbanyak, bagaimana strategi alokasi
tim kampanye yang sebaiknya dilakukan dan lokasi dana per wilayah?
4. Keuntungan pada empat macam kegiatan merupakan fungsi jam kerja yang
dialokasikan pada masing-masing kegiatan seperti tabel berikut. Jika setiap hari
tersedia 4 jam kerja, bagaimana alokasi waktu sehingga keuntungan per hari
maksimum ?
5. Seorang mahasiswa mempunyai 7 hari persiapan sebelum UAS dimulai, pada 4

mata kuliah. Estimasi dari alternatif pengalokasian dari tiap mata kuliah
menghasilkan nilai-nilai sebagaimana tabel berikut. Bagaimana alokasi waktu
yang sebaiknya ia mencapai nilai yang maksimal ?
6. Menghadapi pemilihan Gubernur DKI Jakarta yang akan dilaksanakan Februari

2017 , seorang calon kandidat Gubernur DKI Jakarta menugaskan jurukampanye
untuk berkampanye di 4 wilayah pemilihan. Dia berpendapat, tidak efisien bila
menugaskan seorang jurukampanye ke lebih dari satu wilayah pemilihan. Tetapi,
dia tidak ingin menugaskan seorang jurukampanye ke satu wilayah pemilihan
tertentu bila jurukampanye tersebut dapat melakukan lebih baik di wilayah
pemilihan yang lain. Tabel berikut ini memperlihatkan perkiraan banyaknya
penambahan pemilih bagi calon Gubernur tersebut pada tiap wilayah pemilihan
jika dialokasikan berbagai jumlah jurukampanye.
Jumlah
Wilayah pemilihan
Juru
Kampanye 1 2 3 4
0 0 0 0 0
1 25 20 33 13
2 42 38 43 24
3 55 54 47 32
4 63 65 50 39
5 69 73 52 45
6 74 80 53 50
Tentukan jumlah alokasi jurus kampanye untuk setiap wilayah pemilihan agar
dicapai total penambahan pemilih yang optimal.
1.4 Program Dinamis Probabilistik

Berbeda dengan program dinamis deterministik, pada program dinamis
probabilistik ini stage berikutnya tidak dapat seluruhnya ditentukan oleh state dan
keputusan pada stage saat ini, tetapi ada suatu distribusi kemungkinan mengenai
apa yang akan terjadi. Namun, distribusi kemungkinan ini masih seluruhnya
ditentukan oleh state dan keputusan pada stage saat ini.
Contoh soal:
Sebuah perusahaan mendapat order untuk menyuplai suatu item tipe tertentu.
Karena langganan menginginkan kualitas yang tinggi, maka perusahaan tersebut
harus memproduksi lebih dari satu item untuk memperoleh item yang dpat diterima.
Perusahaan ini memperkirakan bahwa setiap item diproduksinya itu akan diterima
1
dengan probabilitas 2, dan akan rusak (tanpa kemungkinan diperbaiki) dengan
1
probabilitas 2. Dengan demikian, maka banyak item yang dapat diterima dari suatu
lot yang berukuran L akan mempunyai distribusi binomial, artinya probabilitas
1 2
bahwa tidak ada item yang diterima dari lot tersebut adalah (2) .
Ongkos produksi marginal untuk produk ini ditaksir sebesar $ 100 per item
(walaupun rusak), dan kelebihan item dianggap tidak berharga. Sebagai tambahan,
jika proses produksi untuk produk ini di set up, maka harus disediakan ongkos set-
up sebesar $300. Jika pemeriksaan menyatakan bahwa seluruh lot yang dihasilkan
tidak ada yang dapat diterima, maka proses produksinya harus di set-up dengan
tambahan ongkos sebesar $ 300. Perusahaan ini hanya mempunyai waktu untuk
membuat tidak lebih dari 3 siklus produksi. Jika suatu item yang dapat diterima
belum dihasilkan pada akhir siklus produksi yang ketiga, maka kerugian karena
hilangnya penerimaan dari penjualan ini ditambahkan dengan denda yang harus
dibayar adalah sebesar $ 1600.
Tujuan persoalan ini adalah untuk menentukan ukuran lot pada siklus produksi yang
diperlukan sehingga diperoleh ekspektasi ongkos pembuatan yang minimum.
Jawaban :
Stage dari persoalan ini adalah siklus produksi, sedangkan variabel keputusan
𝑥𝑛 (𝑛 = 1,2,3) adalah ukuran lot produksi pada stage 𝑛. Banyaknya item yang dapat
diterima (yaitu nol atau satu) adalah stage dari sistem pada setiap stage. Jadi state
𝑠 = 1 pada stage 1. Jika paling sedikit satu item yang dapat diterima telah
dihasilkan, maka state berubah menjadi 𝑠 = 0. Dan setelah itu tidak ada lagi ongkos
tambahan yang diperlukan. Dalam hal ini 𝑓𝑛 (𝑠, 𝑥𝑛 ) adalah ekspektasi ongkos total
yang minimum untuk stage n ke depan, berdasarkan state n.
Maka :
𝑓𝑛∗ (𝑠) = min 𝑓𝑛 (𝑠, 𝑥𝑛 ) 𝑥𝑛 = 0,1, …
Dimana :
𝑓𝑛∗ (0) = 0
Dengan menggunakan $ 100 sebagai satuan uang, maka kontribusi terhadap
ongkos dari stage n adalah (𝐾 + 𝑥𝑛 ) dimana:
0 𝑗𝑖𝑘𝑎 𝑥𝑛 = 0
𝐾{
3 𝑗𝑖𝑘𝑎 𝑥𝑛 > 0
Untuk s=1, maka
1 𝑥𝑛 ∗ 1 𝑥𝑛 ∗
𝑓𝑛 (1, 𝑥𝑛 ) = (𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1) + [1 − ( ) ]𝑓𝑛+1 (0)
2 2
1 𝑥𝑛 ∗
= (𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1)
2
Dengan 𝑓4∗ (1) = 16, yaitu terminal ongkos jika tidak dihasilkan item yang dapat
diterima.
Hubungan timbal baliknya adalah:
1 𝑥𝑛 ∗
𝑓𝑛∗ (1) = min {(𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1)} 𝑥𝑛 = 0,1, ..
2
Untuk 𝑛 = 1,2,3
Perhitungan selengkapnya adalah sebagai berikut:
n=3
𝑥3 1 𝑥3 𝑓3∗ (𝑠) 𝑥3∗

𝑓3 (1, 𝑥3 ) = 𝐾 + 𝑥3 + 16 ( )
2
s 0 1 2 3 4
0 0 0 0
1 16 12 9 8 8 8 3,4
n=2
𝑥2 1 𝑥2 𝑓2∗ (𝑠) 𝑥2∗

𝑓2 (1, 𝑥2 ) = 𝐾 + 𝑥2 + 16 ( )
2
s 0 1 2 3 4
0 0 0 0
1 8 8 7 7 1 7 2, 3
72
n=1
𝑥1 1 𝑥1 𝑓1∗ (𝑠) 𝑥1∗

(1, )
𝑓1 𝑥1 = 𝐾 + 𝑥1 + 16 ( )
2
s 0 1 2 3 4
1 7 1 3 7 1 3 2
72 6 6 716 6
4 8 4
Dengan demikian, maka kebijakan optimum adalah memproduksi 2 item pada

siklus produksi pertama. Jika tidak ada yang dapat diterima, maka buatlah sebanyak
2 atau 3 item pada siklus produksi kedua. Jika tidak ada yang dapat diterima, maka
buatlah 3 atau 4 item pada siklus produksi ketiga. Ekspektasi ongkos total untuk
kebijakan ini adalah $ 675.
Latihan :
1. Sebuah proyek ruang angkasa sedang melakukan penelitian teknologi. Tiga tim
peneliti A,B, dan C mencoba melakukan pendekatan berbeda. Menurut perkiraan,
dalam keadaan seperti ini, kemungkinan terjadi kegagalan ketiga tim ini adalah 0.4,
0.6, dan 0.8 untuk A,B, dan C berturut-turut. Karena ingin memperkecil
kemungkinan gagal, maka diputuskan untuk menambah 2 orang ilmuan terkemuka
pada ketiga tim tersebut. Kemungkinan gagal ketiga tim setelah ditambah 0, 1, 2
ilmuan adalah :
Jumlah Ilmuan Probabilitas gagal
A B C
0 0.4 0.6 0.8
1 0.2 0.4 0.5
2 0.15 0.2 0.3
Bagaimanakah sebaiknya kedua ilmuan tersebut dialokasikan agar kemungkinan

gagal menjadi minimum?
2. Sebuah perusahaan angkutan laut mendapat order untuk mengangkut 3 jenis

barang dengan data sebagai berikut:
Jenis Barang Berat (ton) Nilai (juta Rp)
1 2 40
2 1 20
3 4 70
Jika kapal yang memuat barang tersebut hanya mampu membawa maksimum 6 ton,
barang-barang mana saja yang sebagiknya diangkut agar diperoleh nilai maksimum
tanpa melangga beban maksimum? Selesaikan dengan program dinamis.
3. Suatu sistemelektronik terdiri dari 4 komponen. Setiap komponen tersebut harus

berfungsi agar sistem berfungsi. Reliabilitas sistem dapat ditingkatkan dengan
memasang komponen lain yang dipasang secara paralel pada satu atau lebih
komponen tersebut. Tabel tersebut memperlihatkan probabilitas bahwa komponen
tertentu akan berfungsi jika dipasang 1,2, atau 3 komponen lain yang paralel
tersebut.
Jenis Komponen Probabilitas Komponen Berfungsi

Komp. 1 Komp. 2 Komp. 3 Komp. 4
1 0.6 0.4 0.7 0.5
2 0.75 0.65 0.9 0.6
3 0.85 0.8 0.95 0.8
Ongkos memasang 1,2,3 komponen lain pada setiap komponen adalah sebagai
berikut:
Jenis Komponen Ongkos (Rp. 1000)
Komp. 1 Komp. 2 Komp. 3 Komp. 4
1 6 10 5 8
2 11 16 10 13
3 15 22 14 17
Bila dana yang tersedia adalah Rp. 45.000.000, berapakah komponen lain yang
harus dipasang pada setiap komponen agar probabilitas sistem tersebut berfungsi
maksimal?
4. Sebuah perusahaan memiliki kapasitas produksi sebesar 700 ton per bulan.
Distribusi produk dilakukan melalui transportasi darat, dan untuk menghemat biaya
pengiriman, telah ditentukan volume pengiriman sebesar 100 ton setiap
pengirimannya. Pasar yang dituju adalah pasar A, B, dan C. Dari pengalaman yang
ada, return dari setiap pasar dapat dilihat pada tabel berikut ini :
Bagaiman distribusi produk harus dilakukan oleh perusahaan agar diperoleh hasil
atau return yang paling optimal ?
Sumber:
Tarliah Dimyati, Tjutju.2015. Operations Research: Model-model pengambilan
Keputusan. Jakarta: Sinar Baru Algesindo .
Winstone,Wayne.2006.Operation Research. Elsevier.
Ristono, Agus.2011. Penelitian Operasional Lanjut. Jakarta: Graha Ilmu.
RANTAI MARKOV
(Bu Mirani)
Terkadang kita tertarik pada perubahan yang terjadi dari suatu peubah acak seiring
berjalannya waktu. Kita mungkin ingin tahu bagaimana harga saham atau pangsa
pasar perusahaan berkembang. Studi tentang bagaimana suatu peubah acak berubah
seiring berjalannya waktu termasuk proses stokastik yang dijelaskan dalam bab 2
ini. Khususnya, kita fokus pada jenis proses stokastik yang dikenal sebagai rantai
Markov. Rantai Markov telah diterapkan di berbagai bidang seperti pendidikan,
pemasaran, kesehatan, layanan, keuangan, akuntansi, dan produksi. Kita mulai bab
ini dengan mendefinisikan konsep proses stokastik.
2.1 Proses Stokastik
Dalam pengambilan keputusan suatu masalah, seringkali kita dihadapkan dengan

ketidakpastian. Permasalahan ini dapat dimodelkan secara matematis asalkan
ketikdakpastian tersebut memiliki pola yang teratur. Jika memiliki pola
ketidakpastian yang teratur, maka masalah tersebut dikatakan memiliki proses
stokastik/probabilistik.
Proses stokastik dapat didefinisikan sebagai kumpulan peubah acak berindeks
(𝑋𝑡 ), dimana indeks 𝑡 bergerak sepanjang himpunan 𝑇 yang diberikan. Seringkali
𝑇 merupakan himpunan bilangan bulat tak negatif dan 𝑋𝑡 mewakili suatu
karakteristik yang terukur pada waktu 𝑡. Jika 𝑇 adalah himpunan yang dapat
dihitung (countable set), maka proses stokastik tersebut dikatakan sebagai proses
stokastik dengan waktu diskrit, misalnya {𝑋𝑡 , 𝑡 = 0,1,…}. Jika 𝑇 adalah suatu
interval pada garis real, maka proses stokastik tersebut dikatakan sebagai proses
stokastik dengan waktu kontinu, misalnya {𝑋𝑡 , 𝑡 ≥ 0}.
Secara ringkas proses stokastitik dapat didefinisikan sebagai serangkaian peubah
acak yang berubah terhadap waktu pengamatan. Proses tersebut dapat dinyatakan
sebagai:
{ 𝑋𝑡 , 𝑡 ∈ 𝑇}
𝑋𝑡 = status pada saat 𝑡 dan 𝑡 = waktu (langkah).
Sebagai contoh, suatu proses stokastik 𝑋1, 𝑋2, 𝑋3, ... adalah suatu proses
stokastik yang menyatakan kumpulan tingkat persediaan mingguan (atau bulanan)
dari suatu produk atau kumpulan dari permintaan mingguan produk tersebut.
2.2 Rantai Markov
Proses stokastik dengan waktu diskrit adalah rantai Markov, jika untuk
𝑡 = 0,1, … peluang kejadian dari proses tersebut dapat dinyatakan sebagai berikut:
𝑃(𝑋𝑡+1 = 𝑖𝑡+1 |𝑋𝑡 = 𝑖𝑡 , 𝑋𝑡−1 = 𝑖𝑡−1 . . 𝑋1 = 𝑖1 , 𝑋0 = 𝑖0 ) = 𝑃(𝑋𝑡+1 = 𝑖𝑡+1 |𝑋𝑡 = 𝑖𝑡 )

Artinya, peluang status pada waktu mendatang (𝑖𝑡+1) hanya bergantung pada
status saat ini (𝑖𝑡 ) dan tidak bergantung pada masa lalu.
Selanjutnya diasumsikan untuk setiap status 𝑖 dan 𝑗, serta waktu 𝑡 berlaku
𝑃(𝑋𝑡+1 = 𝑗|𝑋𝑡 = 𝑖) = 𝑝𝑖𝑗 .
Dengan 𝑝𝑖𝑗 menyatakan peluang sistem berada pada status 𝑖 saat 𝑡 kemudian
akan berada pada status 𝑗 saat 𝑡 + 1.
Pengetahuan tentang matriks peluang transisi dari rantai Markov diskrit dapat
diaplikasikan dalam berbagai hal, diantaranya:
 Menentukan cuaca esok hari yang dimanfaatkan oleh sebuah restoran sehingga
membantu memperkirakan laba harian.
 Mempelajari perilaku inventaris dari toko komputer.
 Meramalkan status akun pemegang polis bagi perusahaan asuransi.
 Menentukan pangsa pasar jangka panjang untuk toko tertentu.
2.3 Matriks Peluang Transisi
Jika sistem berpindah dari status 𝑖 selama satu periode ke status 𝑗 selama periode
berikutnya, kita katakan bahwa telah terjadi transisi dari 𝑖 ke 𝑗. Peluang transisi
pada rantai Markov sering dinyatakan dengan 𝑝𝑖𝑗 .
Pada sebagian besar aplikasinya, peluang transisi dinyatakan dalam matriks

peluang transisi 𝑃 yang berukuran 𝑠 × 𝑠. Matriks peluang transisi 𝑃 dapat dituliskan
sebagai berikut.
𝑝11 𝑝12 ⋯ 𝑝1𝑠

𝑝21 𝑝22 ⋯ 𝑝2𝑠
𝑃=[ ⋮ ⋮ ⋯ ⋮ ]
𝑝𝑠1 𝑝𝑠2 ⋯ 𝑝𝑠𝑠
Setiap status 𝑖 pada saat 𝑡 akan berada entah pada status 𝑗 yang mana pada saat
𝑡 + 1. Artinya, untuk setiap status 𝑖 berlaku
𝑠
∑ 𝑝𝑖𝑗 = 1
𝑗=1
Setiap elemen dari matriks 𝑃 haruslah bernilai tidak negatif dan jumlah nilai
peluang pada setiap baris adalah 1.
Berikut diberikan ilustrasi penentuan matriks peluang transisi dari permasalahan

yang memiliki proses rantai Markov.
Contoh 1.
Di akhir hari, nilai saham dicatat; bila naik, maka peluang esok hari nilainya juga
naik = 0,7. Jika nilai saham diakhir hari turun, maka peluang esok hari akan turun
juga = 0,5. Kejadian-kejadian tersebut merupakan rantai Markov dan status 0
menyatakan nilai saham naik dan status 1 menyatakan nilai saham turun, maka
matriks peluang transisinya adalah.
0,7 0,3
𝑃=[ ]
0,5 0,5
Contoh 2.
Model dari kondisi suatu stok barang tertentu. Pada akhir suatu hari tertentu kondisi
sutau stok dicatat. Jika stok meningkat hari ini maka peluang bahwa stok esok hari
meningkat adalah 0,6. Jika stok hari ini menurun maka peluang bahwa stok esok
hari meningkat adalah 0,3.
Model ini merupakan rantai markov dengan keterangan:
Status 0 : stok meningkat
Status 1 : stok menurun
Maka matriks transisinya adalah.
0,6 0,4
𝑃=[ ]
0,3 0,7
Contoh 3
Andaikan contoh saham sebelumnya diubah sebagai berikut: Nilai saham esok hari
tidak hanya tergantung pada nilai saham hari ini, namun juga kemarin.
 Jika nilai saham dua hari berturut-turut (hari ini dan kemarin) naik, maka nilainya
besok juga akan naik dengan peluang 0,9.
 Jika nilainya hari ini naik, tetapi kemarin turun, maka peluang besok nilainya akan
naik sebesar 0,6.
 Jika hari ini nilainya turun, tetapi kemarin naik, maka peluang besok nilai saham
akan naik sebesar 0,5.
 Jika nilai saham hari ini dan kemarin turun, peluang besok nilainya akan naik
sebesar 0,3.
Sistem tersebut dapat dipandang sebagai rantai Markov bila definisi statusnya
sebagai berikut.
Status 0 : Nilai saham hari ini naik, kemarin juga naik
Status 1 : Nilai saham hari ini naik, kemarin turun
Status 2 : Nilai saham hari ini turun, kemarin naik
Status 3 : Nilai saham hari ini turun, kemarin juga turun.
Matriks peluang transisinya adalah

Contoh 4
Seseorang mempunyai $1 yang dipertaruhkan dalam permainan judi. Pemain judi
ini akan mendapatkan $1 bila menang, dan kehilangan $1 bila kalah. Peluang
pemain untuk menang adalah p > 0, dan peluang kalahnya adalah (1-p). Permainan
judi ini akan berakhir bila pemain telah memiliki $3 atau uangnya habis. Model
permainan ini merupakan rantai Markov dengan status 0, 1, 2, dan 3 yang
menyatakan uang yang dimiliki pemain berturut-turut sebesar 0, $1, $2, dan $3,
dengan matriks peluang transisi berikut.
2.4 Persamaan Chapman-Kolmogorov
Persamaan Chapman-Kolmogorov digunakan untuk menentukan peluang transisi

(𝑛)
𝑛-step, untuk setiap 𝑖, 𝑗, 𝑛, dan 0 ≤ 𝑚 ≤ 𝑛 nilai 𝑝𝑖𝑗 dapat dihitung sebagai berikut.
𝑚
(𝑛) (𝑚) (𝑛−𝑚)
𝑝𝑖𝑗 = ∑ 𝑝𝑖𝑘 𝑝𝑘𝑗
𝑘=0
Persamaan tersebut menyatakan bahwa untuk bertransisi dari status 𝑖 ke status 𝑗

dalam 𝑛-step, maka prosesnya akan berada di status 𝑘 dalam 𝑚-step (𝑚 lebih kecil
(𝑚) (𝑛−𝑚)
dari 𝑛). Jadi, 𝑝𝑖𝑘 𝑝𝑘𝑗 merupakan peluang kondisional dari sistem yang berubah
dari status 𝑖 ke status 𝑘 setelah 𝑚-step, dan kemudian berpindah ke status 𝑗 setelah
(𝑛 − 𝑚) step. Dengan menjumlahkan peluang kondisional ini untuk semua nilai 𝑘
(𝑛)
yang mungkin, akan diperoleh 𝑝𝑖𝑗 .
Bentuk khusus dari persamaan di atas untuk setiap 𝑖, 𝑗, dan 𝑛 sebagai berikut.
Ketika 𝑚 = 1
𝑚
(𝑛) (𝑛−1)
𝑘=0
Ketika 𝑚 = (𝑛 − 1)
𝑚
(𝑛) (𝑛−1)
𝑘=0
(𝑛)
Dengan demikian 𝑝𝑖𝑗 dapat dihitung dari 𝑝𝑖𝑗 secara berurutan. Untuk setiap 𝑖,
𝑗, dan 𝑛 = 2, maka persamaan Chapman-Kolmogorov menjadi:
𝑚
(2)
𝑘=0
(2)
Perhatikan bahwa 𝑝𝑖𝑗 sama dengan matriks 𝑃2 yang diperoleh dari perkalian
matriks peluang transisi 1-step dengan dirinya sendiri.
𝑃 (2) = 𝑃. 𝑃 = 𝑃2
𝑝00 𝑝01 𝑝02 𝑝03 𝑝00 𝑝01 𝑝02 𝑝03
𝑝 𝑝11 𝑝12 𝑝13 𝑝10 𝑝11 𝑝12 𝑝13
𝑃2 = [𝑝10 𝑝21 𝑝22 𝑝23 ] [𝑝20 𝑝21 𝑝22 𝑝23 ]
20
𝑝30 𝑝31 𝑝32 𝑝33 𝑝30 𝑝31 𝑝32 𝑝33
Jika diinginkan nilai peluang transisi dari status 1 ke status 3 dalam 2-step, maka
𝑝13 2 = 𝑝10 . 𝑝03 + 𝑝11 . 𝑝13 + 𝑝12 . 𝑝23 + 𝑝13 . 𝑝33
Untuk bentuk yang lebih umum, matriks peluang transisi 𝑛-step dapat diperoleh
dari persamaan berikut.
𝑃 (𝑛) = 𝑃𝑛 = 𝑃. 𝑃(𝑛−1) = 𝑃 (𝑛−1) . 𝑃
Jadi, matriks peluang transisi 𝑛-step dapat diperoleh dengan mengalikan matriks
peluang transisi 1-step sebanyak 𝑛 kali.
Ilustrasi
1. Diberikan matriks peluang transisi sebagai berikut.
0,8 0,2
𝑃=[ ]
0,6 0,4
Matriks peluang transisi 2-step
0,8 0,2 0,8 0,2 0,76 0,24

𝑃2 = [ ][ ]=[ ]
0,6 0,4 0,6 0,4 0,72 0,28
0,8 0,2 0,76 0,24 0,752 0,248

𝑃3 = [ ][ ]=[ ]
0,6 0,4 0,72 0,28 0,744 0,256
0,8 0,2 0,752 0,248 0,75 0,25

𝑃4 = [ ][ ]=[ ]
0,6 0,4 0,744 0,256 0,749 0,251
2. Diberikan matriks peluang transisi sebagai berikut.
0,080 0,184 0,368 0,368

0,632 0,368 0 0
𝑃=[ ]
0,264 0,368 0,368 0
0,080 0,184 0,368 0,368
Sehingga matriks peluang transisi 2-step dapat dihitung dengan cara seperti
berikut.
0,080 0,184 0,368 0,368 0,080 0,184 0,368 0,368

0,632 0,368 0 0 0,632 0,368 0 0
𝑃2 = [ ][ ]
0,264 0,368 0,368 0 0,264 0,368 0,368 0
0,080 0,184 0,368 0,368 0,080 0,184 0,368 0,368
0,249 0,286 0,300 0,165

0,283 0,252 0,233 0,233
=[ ]
0,351 0,319 0,233 0,097
0,249 0,286 0,300 0,165
Latihan :
1. Jika hari ini hujan maka besok akan hujan dengan peluang 𝛼 = 0,7. Jika hari
ini tidak hujan maka besok akan hujan dengan peluang 𝛽 = 0,4. Matriks
peluang transisi 4 langkah adalah...
2. Keadaan hujan pada suatu hari bergantung pada keadaan hujan dalam dua hari
terakhir. Jika dalam dua hari terakhir hujan maka besok akan hujan dengan
peluang 0,7. Jika hari ini hujan dan kemarin tidak hujan maka besok akan
hujan dengan peluang 0,5. Jika hari ini tidak hujan dan kemarin hujan maka
besok akan hujan dengan peluang 0,4. Jika dalam dua hari terakhir tidak hujan
maka besok hujan dengan peluang 0,2. Matriks peluang transisi 2 langkah
adalah...
3. Model dari kondisi suatu stok barang tertentu. Pada akhir suatu hari tertentu
kondisi sutau stok dicatat. Jika stok meningkat hari ini maka peluang bahwa
stok esok hari meningkat adalah 0,7. Jika stok hari ini menurun maka peluang
bahwa stok esok hari meningkat adalah 0,5. Matriks peluang transisi 3 langkah
adalah...
4. Jika model di atas dikembangkan bahwa kondisi stok esok berubah atau tidak
tergantung pada hari ini dan kemarin maka kemungkinan-kemungkinan yang
ada adalah sebagai berikut: Jika dalam 2 hari terakhir stok meningkat, besok
akan meningkat dengan peluang 0,9. Jika hari ini meningkat, kemarin
menurun, besok akan meningkat dengan peluang 0,6. Jika hari ini menurun,
kemarin meningkat, besok akan meningkat dengan peluang 0,5. Jika dalam 2
hari terakhir stok menurun, besok akan meningkat dengan peluang 0,3.
Matriks peluang transisi 2 langkah adalah...
2.5 Analisis Rantai Markov pada Peramalan Pangsa Pasar
Pangsa pasar (market share) menurut O'Neal adalah persentase atau proporsi dari
total tersedia pasar atau segmen pasar yang sedang dilayani oleh sebuah perusahaan
yang dapat dinyatakan sebagai pendapatan penjualan perusahaan (dari pasar) dibagi
dengan total pendapatan penjualan yang tersedia di pasar. Hal ini juga dapat
dinyatakan sebagai volume unit penjualan (di pasar) dibagi dengan total volume
unit yang dijual di pasar tersebut. Hal ini umumnya diperlukan untuk riset pasar
komisi untuk memperkirakan ukuran pasar total dan pangsa pasar perusahaan.
Faktor-faktor yang mempengaruhi pangsa pasar adalah inovasi tiada henti,
layanan kepada pelanggan, efektifitas distribusi dan menekan biaya
2.5.1 Pola Perpindahan Konsumen (Customer Switching)
Secara konseptual customer switching yaitu perilaku konsumen yang telah

berpindah dari sebuah merek produk barang atau jasa kepada merek produk barang
atau jasa lainnya karena faktor – faktor tertentu.
2.5.2 Analisis Rantai Markov
Analisis Markov adalah salah satu analisis pengambilan keputusan yang

menggunakan model peluang. Dalam pemasaran, analisis Markov digunakan untuk
memprediksi kemungkinan seorang konsumen yang sekarang menggunakan merek
A akan berpindah ke merek B yang disebut dengan perpindahan merek (Brand
Switching). Dengan analisis ini dapat diketahui apakah konsumen tetap memakai
produk merek yang bersangkutan dan berapa besar kemungkinan seorang
konsumen melakukan perpindahan.
2.5.3 Prediksi Pangsa Pasar
Setelah mengetahui matriks peluang transisi, maka langkah selanjutnya dapat

dilakukan prediksi (peramalan) pangsa pasar berdasarkan peluang perpindahan
pengguna dari sebuah produk tertentu. Seperti yang telah dijelaskan pada bab
sebelumnya, pangsa pasar dapat diprediksi untuk beberapa periode berikutnya.
Sehingga prediksi pangsa pasar pada 𝑛 + 1 periode berikutnya dari tahun awal
menggunakan rumus :
𝑃 × 𝑄 𝑛 = 𝑄 𝑛+1
Keterangan :
𝑄 𝑛+1: Prediksi pangsa pasar periode 𝑛 + 1 dari tahun awal
𝑃: Matriks peluang transisi 𝑝𝑖𝑗

𝑄 𝑛 : Pangsa pasar periode 𝑛
Contoh 1
Pada suatu kota kecil terdapat dua pasar swalayan W dan L. Diasumsikan setiap
pembeli di kota tersebut melakukan kunjungan belanja satu kali per minggu. Dalam
sembarang minggu seorang pembeli hanya berbelanja di W atau L saja, dan tidak
dikeduanya. Kunjungan belanja disebut percobaan dari proses dan toko yang dipilih
disebut keadaan dari proses. Suatu sampel 100 pembeli diambil dalam periode 10
minggu, kemudian data dikompilasikan.
Dalam menganalisis data, terlihat bahwa dari seluruh pembeli yang berbelanja
di W dalam suatu minggu, 90 persen tetap berbelanja di toko W pada minggu
berikutnya, sedangkan sisanya berpindah belanja pada toko L. 80 persen dari yang
berbelanja di toko L dalam suatu minggu tetap berbelanja di toko L, sedangkan 20
persen berpindah belanja pada toko W. Informasi tersebut disusun pada Tabel 1
berikut.
Tabel 1 : Matriks Kemungkinan Transisi
Pilihan minggu berikutnya

Pilihan pada suatu minggu
W L
W 90 10
L 20 80
Tentukan:
a. Matriks peluang transisi
b. Prediksi pangsa pasar minggu berikutnya, jika diketahui pangsa pasar minggu
ini adalah
0,7
𝑄1 = [ ]
0,3
Penyelesaian:
a. Karena terdapat 100 sampel pembeli, maka matriks peluang transisinya adalah
90 10
𝑃 = [100 100] = [0,9 0,1]
20 80 0,2 0,8
100 100
b. Prediksi pangsa pasar minggu berikutnya adalah
0,9 0,1 0,7 0,66

𝑄2 = [ ][ ] = [ ]
0,2 0,8 0,3 0,38
Contoh 2
Dua buah produk bersaing seimbang di pasar. Perubahan strategi pemasaran salah
satu produk menghasilkan peluang transisi sebagai berikut.
0,7 0,3
[ ]
0,4 0,6
Prediksi kemungkinan perkembangan pangsa pasar kedua produk tersebut selama
3 periode ke depan.
Penyelesaian:
Karena dua produk tersebut bersaing seimbang, maka pangsa pasarnya saat ini
0,5
adalah 𝑄 = [ ].
0,5
Prediksi pangsa pasar 1 periode adalah
0,7 0,3 0,5 0,5

𝑄1 = 𝑃 × 𝑄 = [ ][ ] = [ ]
0,4 0,6 0,5 0,5
0,7 0,3 0,5 0,5

𝑄 2 = 𝑃 × 𝑄1 = [ ][ ] = [ ]
0,4 0,6 0,5 0,5
0,7 0,3 0,5 0,5

𝑄3 = 𝑃 × 𝑄2 = [ ][ ] = [ ]
0,4 0,6 0,5 0,5
2.6 Klasifikasi Status Rantai Markov
Diberikan matriks peluang transisi sebagai berikut.
Gambar 1. Grafik representasi matriks peluang transisi

Berdasarkan ada tidaknya koneksi maka setiap status pada rantai Markov dapat
diklasifikasikan menjadi beberapa jenis, diantaranya:
Reachable
 Status 𝑗 dikatakan reachable dari status 𝑖 jika terdapat path (jalur) dari 𝑖 menuju 𝑗
 Status 5 adalah reachable dari status 3 melaui 3-4-5
Communicate
 Status 𝑗 dikatakan communicate dengan status 𝑖 jika status 𝑖 reachable dari 𝑗 dan
𝑗 reachable dari 𝑖.
Closed Set
 Himpunan status dikatakan sebagai closed set jika tidak terdapat status diluar
himpunan yang dapat dicapai oleh status anggota himpunan tersebut.
 Status 1 dan 2 adalah closed set
 Status 3,4 dan 5 adalah closed set
Absorbing State
 Status 𝑖 dikatakan sebagai absorbing state jika 𝑝𝑖𝑖 = 1
Transient State
 Status 𝑖 dikatakan sebagai transient state jika terdapat status 𝑗 yang dapat dicapai
dari 𝑖 namun 𝑖 tidak dapat dicapai melalui 𝑗.
 Terdapat cara untuk meninggalkan status 𝑖 tanpa bisa kembali ke status 𝑖
Gambar 2. Grafik Representasi Absorbing State dan Transient State
Klasifikasi status dari grafik pada gambar 2 adalah:

 Stasus 1, status 2, dan status 3 adalah transient state
 Status 0 dan status 4 adalah absorbing state
 Status 1, status 2, dan status 3 dapat menuju status 0 dan status 4 dan tidak akan
dapat kembali.
Recurrent State
 Jika bukan transient state maka status tersebut dapat dikatakan sebagai recurrent
state.
 Semua status pada contoh pada gambar 1 merupakan recurrent state.
Diberikan matriks peluang transisi sebagai berikut.
Gambar 3. Grafik representasi matriks peluang transisi
Periodic State
 Semua path yang berasal dari 𝑖 hanya bisa kembali ke 𝑖 dalam kelipatan 𝑘 > 1.
 Jika kita mulai dengan status 1 maka satu-satunya cara untuk kembali ke status 1
adalah minimal setelah 3 periode.
 Status 1 memiliki periode 3.
 Recurrent state yang bukan periodic state disebut sebagai aperiodic state.
Ergodic (Ireducible)
 Jika semua status merupakan recurrent, aperiodic, dan communicate, maka rantai
Markov tersebut dapat dikatakan sebagai Ergodic.
2.7 First Passage Time
First Passage Time (FPT) adalah waktu yang dibutuhkan oleh suatu proses untuk
menuju status 𝑗 dari status 𝑖 untuk pertama kali. Secara umum FPT merupakan
perubah acak dan memiliki distribusi peluang yang bersesuaian dengan mereka.
Distribusi peluang ini bergantung pada peluang transisi dari proses.
Misalkan: 𝐹𝑖𝑗𝑛 merupakan peluang bahwa FPT dari status 𝑖 ke status 𝑗 sama
dengan 𝑛. Dapat ditunjukkan bahwa peluang memenuhi hubungan rekursif sebagai
berikut:
𝑛−1
𝑓𝑖𝑗𝑛 = 𝑛
𝑝𝑖𝑗 − ∑ 𝑓𝑖𝑗𝑘 ∙ 𝑝𝑗𝑗
𝑛−𝑘
𝑘=1
Jadi peluang dari suatu FPT dari status 𝑖 ke status 𝑗 dalam langkah 𝑛 dapat
dihitung secara rekursif dari peluang transisi satu langkah.
Menghitung 𝑓𝑖𝑗𝑛 untuk seluruh 𝑛 mungkin sulit, relatif lebih sederhana untuk
menghitung FPT harapan dari status 𝑖 ke status 𝑗.
Diberikan nilai harapan 𝜇𝑖𝑗 yang didefinisiakan sebagai berikut:
∞ 𝑗𝑖𝑘𝑎 ∑ 𝑓𝑖𝑗𝑛 < 1

𝑛=1
𝜇𝑖𝑗 = ∞ ∞
∑ 𝑛𝑓𝑖𝑗𝑛 𝑗𝑖𝑘𝑎 ∑ 𝑓𝑖𝑗𝑛 = 1

{ 𝑛=1 𝑛=1
𝑛
Bila ∑∞
𝑛=1 𝑓𝑖𝑗 = 1, maka 𝜇𝑖𝑗 memenuhi persamaan berikut secara unik.
𝜇𝑖𝑗 = 1 + ∑ 𝑝𝑖𝑘 ∙ 𝜇𝑘𝑗

𝑘≠𝑗
jika 𝑖 = 𝑗, maka 𝜇𝑖𝑖 disebut recurrent time harapan.
Contoh
Sebuah toko kamera memiliki stok kamera yang dapat dipesan mingguan.
Asumsikan 𝑋0 = 3. Kasus ini merupakan proses stokastik {𝑋𝑡 } dengan t = 0,1,2,3
mewakili jumlah kamera yang mungkin ada pada akhir minggu.
Dengan matriks peluang transisi sebagai berikut:
0,080 0,184 0,368 0,368

0,632 0,368 0 0
𝑃=[ ]
0,264 0,368 0,368 0
0,080 0,184 0,368 0,368
Tentukan waktu yang dibutuhkan agar jumlah kamera kembali seperti semula
untuk pertama kalinya (FPT).
Penyelesaian
𝜇30 dapat dicapai karena seluruh status recurrent, maka:
𝜇30 = 1 + 𝑝31 𝜇10 + 𝑝32 𝜇20 + 𝑝33 𝜇30

𝜇20 = 1 + 𝑝21 𝜇10 + 𝑝22 𝜇20 + 𝑝23 𝜇30
𝜇10 = 1 + 𝑝11 𝜇10 + 𝑝12 𝜇20 + 𝑝13 𝜇30
atau
𝜇30 = 1 + 0,184 𝜇10 + 0,368 𝜇20 + 0,368 𝜇30

𝜇20 = 1 + 0,368 𝜇10 + 0,368 𝜇20
𝜇10 = 1 + 0,368 𝜇10
Diperoleh:
𝜇10 = 1,58 minggu
𝜇20 = 2,51 minggu, dan
𝜇30 = 3,50 minggu.
Kesimpulan: Waktu yang dibutuhkan agar jumlah kamera kembali seperti semula
adalah 3,5 minggu.
2.8 Steady State
Suatu proses akan berada pada kondisi steady state manakala proses terebut akan
konvergen ke suatu nilai yang sama untuk 𝑛 → ∞. Untuk rantai Markov yang
ergodik dan tidak dapat direduksi, lim 𝑃𝑖𝑗𝑛 ada dan saling bebas dari 𝑖.
𝑛→∞
Misalkan
𝜋𝑗 = lim 𝑃𝑖𝑗𝑛 , 𝑗 ≥ 0
𝑛→∞
maka 𝜋𝑗 adalah solusi nonnegatif tunggal dari
𝜋𝑗 = ∑ 𝜋𝑖 𝑃𝑖𝑗𝑛 , 𝑗 ≥ 0
𝑖=1
dengan ∑∞𝑗=0 𝜋𝑗 = 1.
𝜋𝑗 disebut sebagai peluang pada keadaan stabil dari rantai markov dan memiliki
hubungan resiprokal terhadap waktu recurrent harapan.
1
𝜋𝑗 = 𝜇 , 𝑗 = 1,2, … 𝑀
𝑗𝑗
Contoh
Seperti contoh masalah FPT untuk menentukan stok kamera yang dimiliki oleh toko
kamera, maka untuk jangka waktu panjang lamanya waktu yang dibutuhkan agar
jumlah kamera kembali seperti semula (steady state) adalah...
Penyelesaian
𝜋0 = 𝑝00 𝜋0 + 𝑝10 𝜋1 + 𝑝20 𝜋2 + 𝑝30 𝜋3

𝜋1 = 𝑝01 𝜋0 + 𝑝11 𝜋1 + 𝑝21 𝜋2 + 𝑝31 𝜋3
𝜋2 = 𝑝02 𝜋0 + 𝑝12 𝜋1 + 𝑝22 𝜋2 + 𝑝32 𝜋3
𝜋3 = 𝑝03 𝜋0 + 𝑝13 𝜋1 + 𝑝23 𝜋2 + 𝑝33 𝜋3
1 = 𝜋0 + 𝜋1 + 𝜋2 + 𝜋3
Subtitusikan nilai 𝑝𝑖𝑗 ke persamaan di atas.
𝜋0 = 0,080 𝜋0 + 0,632 𝜋1 + 0,264 𝜋2 + 0,080 𝜋3

𝜋1 = 0,184 𝜋0 + 0,368 𝜋1 + 0,368 𝜋2 + 0,184 𝜋3
𝜋2 = 0,368 𝜋0 + 0,368 𝜋2 + 0,368 𝜋3
𝜋3 = 0,368 𝜋0 + 0,368 𝜋3
1 = 𝜋0 + 𝜋1 + 𝜋2 + 𝜋3
Sehingga diperoleh:
1
𝜋0 = 0,285 → 𝜇00 = 𝜋 = 3,51 minggu
0
1
𝜋1 = 0,285 → 𝜇11 = = 3,51 minggu
𝜋1
1
𝜋2 = 0,264 → 𝜇22 = 𝜋 = 3,79 minggu
2
1
𝜋3 = 0,166 → 𝜇33 = 𝜋 = 6,02 minggu
3
Jadi, agar jumlah kamera kembali seperti semula (steady state) pada jangka
waktu panjang adalah 6,02 minggu.
Referensi
1. Hillier, Frederick and Lieberman, Gerald J. 2001. Introduction to Operations
Research, 7th ed. McGraw-Hill: New York.
2. Taha, Hamdy. 2007. Operation Research : An Introduction, 8th ed. Pearson
Education Inc.: NJ.
3. Winston, Wayne L. 2003. Operations Research: Application & Algorithms, 4th
ed. Thomson Learning: Belmont – CA.
4. Hartanto, D. PPT: Rantai Markov (Markov Chain), KOI. Teknik Industri: ITS.
5. Siswanto. 2007. Operations Research Jilid II. Jakarta: Erlangga.
TEORI PERMAINAN
(Pak Ramli)
Teori Permainan atau Game Theory dikemukakan oleh seorang ahli matematika
Perancis yang bernama Emile Borel pada tahun 1921. Kemudian dikembangkan
lebih lanjut oleh Jhon Von Neumann dan Oskar Morgenstren, yang digunakan
sebagai alat untuk merumuskan prilaku ekonomi yang bersaing. Contoh nyata
penerapan Teori Permainan atau Game Theory adalah aplikasi-aplikasi dalam dunia
militer, pembuatan kontrak, dan penetapan harga-harga. Dalam bab-bab
sebelumnya, kita telah menemui banyak situasi di mana satu pengambil keputusan
memilih keputusan yang optimal tanpa mengacu pada efek keputusan terhadap
pembuat keputusan lain (dan tanpa mengacu pada efek keputusan orang lain
terhadap dirinya) Dalam banyak situasi bisnis, penerapan teori permainan dua atau
lebih pengambilan keputusan secara bersamaan memilih suatu tindakan, dan
tindakan yang dipilih oleh setiap pemain mempengaruhi imbalan yang diterima
oleh pemain lain. Sebagai contoh, setiap perusahaan makanan cepat saji harus
menentukan iklan dan kebijakan harga untuk produknya, dan keputusan masing-
masing perusahaan akan mempengaruhi pendapatan dan laba perusahaan makanan
cepat saji lainnya. Teori permainan berguna untuk membuat keputusan dalam kasus
di mana dua atau lebih pengambil keputusan memiliki kepentingan yang
bertentangan. Sebagian besar studi tentang teori permainan ditawarkan dengan
situasi di mana hanya ada dua pengambil keputusan (atau pemain), dan sebagian
kecil teori permainan n-orang (di mana n > 2)
Pengertian teori permainan atau Game Theory sangatlah beragam, tetapi memiliki
arti yang sama. Berikut ini adalah pengertian dari Teori Permainan atau Game
Theory menurut beberapa ahli.
1. Teori Permainan atau Game Theory merupakan teori matematika yang

mempelajari secara formal sifat-sifat dari situasi kompetisi, terutama proses
pengambilan keputusan lawan (Rangkuti, 2012).
2. Teori Permainan atau Game Theory merupakan bagian dari suatu ilmu
pengetahuan yang berkaitan dengan pembuatan keputusan pada saat dua
pihak atau lebih berada dalam kondisi persaingan atau konflik (Dimyati,
2006).
3. Teori Permainan atau Game Theory merupakan teori yang menggunakan
pendekatan matematis dalam merumuskan situasi persaingan dan konflik
antara berbagai kepentingan (Kartono, 1994).
4. Teori Permainan atau Game Theory merupakan suatu pendekatan matematis
untuk merumuskan situasi persaingan dan konflik antara berbagai
kepentingan (Subagyo, 1984).
Berdasarkan dari keempat pengertian para ahli dapat ditarik sebuah kesimpulan
pengertian dari Teori Permainan atau Game Theory. Teori Permainan atau Game
Theory merupakan suatu ilmu pengetahuan berupa teori matematis yang digunakan
untuk menentukan, merumuskan, dan mempelajari situasi konflik atau kompetisi
yang melibatkan dua atau lebih kepentingan guna mendapatkan suatu keputusan
yang terbaik untuk setiap pemain.
Model-model Teori Permainan atau Game Theory dapat diklasifikasikan dalam
beberapa cara, bergantung pada faktor-faktor, yaitu banyaknya pemain, jumlah
keuntungan dan kerugian, dan banyaknya strategi yang dilakukan dalam permainan.
B. Unsur-unsur Dasar Teori Permainan atau Game Theory

Mengetahui unsus-unsur dasar sangantlah membantu dalam menyelesaikan suatu
kasus. Berikut ini adalah penjelasan darisetiap unsur dasar Teori Permainan atau
Game Theory.
a. Suatu strategi dari sebuah pemain/perusahaan dianggap tidak dapat dirusak
oleh perusahaan lainnya.
b. Setiap pemain atau perusahaan akan memilih strategi-strategi tersebut
secara terus menerus selama perusahaan masih memiliki keinginan
melanjutkan usahanya
c. Suatu permainan/persaingan dikatakan adil atau ‘fair’ apabila hasil akhir
permainan atau persaingan menghasilkan nilai nol (0), atau tidak ada
pemain atau perusahaan yang menang/kalah atau mendapat keuntungan atau
kerugian.
d. Suatu strategi dikatakan dominan terhadap strategi lainnya apabila memiliki
nilai pay off yang lebih baik dari strategi lainnya. Maksudnya, bagi pemain
atau perusahaan baris, nilai positif (keuntungan) yang diperoleh dari suatu
strategi yang digunakan, menghasilkan nilai positif yang lebih besar dari
hasil penggunaan strategi lainnya. Bagi pemain kolom, nilai negatif
(kerugaian) yang diperoleh dari suatu strategi yang digunakan,
menghasilkan nilai negatif yang lebih kecil dari hasil penggunaan strategi
lainnya.
e. Tujuan dari teori permainan ini adalah mengidentifikasi strategi yang paling
optimal untuk setiap perusahaan.
C. Two Person Zero Sum dan Non zero-Sum Game

1. Two Person Zero-Sum Game jika jumlah kerugian dan keuntungan dari
pemainnya adalah nol, disebut sebagai permainan berjumlah nol (zero-sum game)
atau permainan berjumlah konstan (constant-sum game). Sebaliknya, jika jumlah
kerugian dan keuntungan dari pemainnya adalah bukan nol, maka disebut
permainan berjumlah bukan nol (Nonzero-sum game).
1). Two Person Zero Sum and Constant Sum Games: Saddle Point
Jika banyaknya pemain adalah dua pihak (baik individu maupun kelompok), maka
permainannya disebut sebagai permainan dua orang (two-person game).
Karakteristik Two Zero Sum Game.
a) Ada dua pemain (disebut pemain baris dan pemain kolom)
b) Pemain baris harus memilih 1 dari m strategi .Secara bersamaan, pemain
kolom harus memilih 1 dari n strategi.
c) Jika pemain baris memilih strategi ke-i dan pemain kolom memilih strategi
ke j, maka pemain baris menerima hadiah atau keuntungan sebesar aij dan
pemain kolom menerima kekalahan dengan mendapat kerugian sebesar aij
sejumlah keuntungan yang diperoleh pemain baris. Permainan semacam ini
disebut zero-sum game dua pemain yang diwakili oleh matrix pada Tabel 1
Tabel 1 The Game Reward Matrik
antara Perusahaan A dan Perusahaan B
Strategi B1 B2 …. Bn
A1 a11 a12 …. a1n
A2 a21 a22 …. a2n
.. … .. … ..
Am am1 am2 ..... amn
Contoh tabel 2 matrik pay off (matrik permainan) berikut, dapat dijelaskan
beberapa ketentuan dasar yang terpenting dalam teori permainan.
Tabel 2. Tabel Matrik Pay Off (Matrik Permainan) Perusahaan A dan

Perusahaan B
Strategi B1 B2 B3 B4
A1 1 9 2 7
A2 8 5 4 3
A3 6 8 10 5
A4 7 9 8 6
Nilai-nilai yang ada dalam tabel tersebut (yakni angka 1, 9, 2 ,7 di baris pertama,
8.5.4.3 di baris kedua 6,8,10,5 dibaris ketiga dan 7, 9, 8,6 di baris keempay),
merupakan hasil yang diperoleh dari penggunaan berbagai strategi yang dipilih oleh
kedua perusahaan. Satuan nilai tersebut merupakan efektifitas yang dapat berupa
uang, persentase pangsa pasar, jumlah pelanggan dan sejenisnya. Nilai positif
menunjukkan keuntungan bagi pemain baris dan kerugian bagi pemain kolom,
begitu pula sebaliknya nilai negatif menunjukkan kerugian bagi pemain baris dan
keuntungan bagi pemain kolom. Sebagai contoh nilai 9 pada sel C12 menunjukkan
apabila pemain/perusahaan A menggunakan strategi A1 dan perusahaan B
meresponnya dengan strategi B2, maka perusahaan A akan mendapatkan
keuntungan sebesar 9 yang berarti perusahaan B akan mengalami kerugian sebesar
9 jadi pemaun A dan pemain B berada dalam kondisi bertentangan atau bersaing
dan tidak ada kerjasama antara keduanya.
Asumsi menurut John von Neumann and Oskar Morgenstern untuk teori zero-sum
games menggunakan prinsip minimaks dan maksimin.
2). Program Liner

Program liner dengan tujuan A memperoleh hadiah atau keuntungan terbesar dan
B berusahan meminimumkan kekalahan dari kasus berikut misalnya (Tabel 3)
Tabel 3. Tabel Matrik Pay Off

Strategi B1 B2
A1 1 9
A2 8 5
X1 = probabilita A menang menggunakan strategi A1

X2 = probabilita A menang menggunakan strategi A2
Y1 = probabilita perusahaan B dengan strategi B1
Y2 = probabilita perusahaan B dengan strategi B2
Pemain baris A:
Maks Z = v
V ≤ X1+8X2 (Batasan Strategi A1)
V ≤ 9X1+5X2 (Batasan Strategi A2)
X1 + X2 = 1
X1 ≥ 0; X2 ≥ 0 ; V urs
Pemain Kolom B:
Min Z = w
w ≤ Y1+9Y2 (Batasan Strategi B1)
w ≤ 8X1+5X2 (Batasan Strategi B2)
Y1 + Y2 = 1
Y1 ≥ 0; Y2 ≥ 0
3). Strategi Permainan
Tedapat dua strategi dalam menyelesaikan kasus Teori Permainan atau Game
Theory. yaitu strategi murni dan strategi campuran.
a). Strategi Murni (Pure Strategy)

Penyelesaian masalah dengan strategi murni dilakukan dengan menggunakan
konsep maximin untuk pemain atau perusahaan baris dan konsep minimax untuk
pemain atau perusahaan kolom. Dalam strategi ini seorang pemain atau perusahaan
akan menggunakan satu strategi atau strategi tunggal untuk mendapatkan hasil optimal
(sadle point yang sama).
Setiap pemain memilih strategi yang memungkinkan dia untuk melakukan yang
terbaik yang dia bisa, mengingat bahwa dia tahu strategi yang dia ikuti. Mari kita
gunakan asumsi ini untuk menentukan bagaimana pemain baris dan kolom harus
memainkan zero-sum game (Tabel 4) Bagaimana seharusnya pemain baris
memainkan game ini? Jika dia memilih baris 1, maka asumsi tersebut
mengimplikasikan bahwa pemain kolom akan memilih kolom yaitu kolom 2 dan
menghindari pemain baris mendapat keuntungan empat unit (angka terkecil di baris
1 dari matriks permainan), Demikian pula, jika pemain baris memilih baris 2, maka
asumsi tersebut mengimplikasikan bahwa pemain kolom akan memilih kolom 3 dan
menghindari hadiah pemain baris ke satu unit ( terkecil) atau minimum.
Tabel 4. Matrik Pay Off Perusahaan A dan Perusahaan B

Strategi B1 B2 B3
A1 4 4 10
A2 2 3 1
A3 6 5 7
Dengan prinsip maximin dan minimax diperoleh hasil berikut:
Strategi B1 B2 B3 Minimum
A1 4 4 10 4
A2 2 3 1 1
A3 6 5 7 5 Maksimin
Maksimum 6 5Minimaks 10
Konsep maksimin yaitu nilai maksimum keuntungan dari minimum keuntungan

pemain baris yang akan diperoleh adalah 5 dan konsep minimaks yaitu nilai
minimum kerugian dari maksimum kerugiann yang dapat dihindari pemain kolom
adalah 5. Nilai permaian pada titik keseimbangan (sadle point) adalah 5 unit.
b). Strategi Campuran (Mixed Strategy)

Penyelesaian masalah dengan strategi campuran dilakukan apabila terjadi
Nonzero-sum game menggunakan strategi murni. Strategi murni belum mampu
menyelesaikan masalah permainan atau belum mampu memberikan pilihan strategi
yang optimal bagi masing-masing pemain atau perusahaan. Dalam strategi ini
seorang pemain atau perusahaan akan menggunakan campuran atau lebih dari satu
strategi untuk mendapatkan hasil optimal. Agar sebuah permainan atau persaingan
menjadi optimal, setiap strategi yang dipergunakan berusaha untuk mendapatkan
nilai permainan (sadle point) yang sama.Berdasarkan kasus pada Tabel 3
Tabel 5. Maksimin dan Minimaks Matrik Pay Off

Strategi B1 B2 Minimum
A1 1 9 1
A2 8 5 5
Maksimum 8 9
Maksimim = 5 dan minimaks = 8 tidak memiliki nilai permainan

(saddle point) maka pemecahan dengan startegi acak adalah sebagai
berikut:
Solusi permasalahan diatas peluang keuntungan yang akan diperoleh A atau X1

dimana B menggunkan strategi B1 yaitu:
X1 + 8X2 = X1 + 8(1-X1) = 8-7X1 …………(1)
Keuntungan yang akan diperoleh A dan B menggunkan strategi B2 yaitu:

9X1 + 5X2 = 9X1 + 5(1-X1) = 5+4X1 ….…..(2)
Solusi kedua persamaan diatas:

8-7X1= 5+4X1  X1= 3/11
Maka titik keseimbangan (saddle point) keuntungan yang diharapkan A

menggunakan strategi campuran yaitu: 8-7(3/11) = 5+4(3/11) = 67/11 = 6,09
Grafik: Strategi Optimal Pemain A
Kerugian yang akan diperoleh B dimana A menggunkan strategi A1 yaitu:
Y1 + 9Y2 = Y1 + 9(1-Y1) = 9-8Y1 ………...(3)
Kerugian yang akan diperoleh B dimana A menggunkan strategi A2 yaitu:
8Y1 + 5Y2 = 8Y1 + 5(1-Y1) = 5+3Y1 ……..(2)

Solusi kedua persamaan diatas:
9-8Y1 = 5+3Y1  Y1= 4/11
Titik keseimbangan kerugian yang diharapkan diperoleh B menggunakan strategi

campuran yaitu: 9-8(4/11) = 5+3(4/11) = 67/11 = 6,09
Grafik Strategi Optimal Pemain B
Kesimpulan dari kasus diatas adalah peluang perusahaan menang 3/11 dan
peluang perusahaan B kalah adalah 4/11 dengan nilai permaianan (saddle point)
6.09
4). Two-Person Zero Sum-Game:Dominasi
Jika Strategi Murni tidak dapat diterapkan dan permainan belum berakhir karena
belum ditemukan titik pelana. Oleh karena itu kita perlu menerapkan Strategi
Campuran, dengan menerapkan terlebih dulu aturan Dominan (bertujuan untuk
mengurang ukuran Matrik dengan ukuran terkecil yaitu 2x2).
Tabel 6. Tabel Matrik Pay Off (Matrik Permainan)

Perusahaan A dan Perusahaan B
Strategi B1 B2 B3
A1 1 2 7
A2 8 4 3
A3 6 10 5
Dari Tabel 6 pada diketahui bahwa Strategi B1 mendominasi B2 dan B3, sehingga
B3 bisa dihilangkan dari Matrik. Diketahui juga bahwa Strategi A2 mendominasi
strategi A1 maupun A3, maka Strategi A1 dapat dihilangkan dari tabel.Matriks 2x2
menjadi (Tabel 7);
Tabel 7. Reduce Games Matrix

Strategi B1 B2
A2 8 4
A3 6 10
Tabel 7 dapat diselesaikan dengan strategi campuran seperti yang dijelaskan

sebelumnya.
Dengan prinsip maksimin dan minimaks untuk menentukan sadle point sebagai
berikut:
Tabel 7. Reduce Games Matriv

Strategi B1 B2 Minimum
A2 8 4 4
A3 6 10 6
Maksimum 8 10
Maksimin = Minimaks
Maksimum (minimum semua baris ) = Minimum (maksimum semua kolom)
8≠6
2. N-person Game
Jika banyaknya pemain adalah N pihak (N ≥ 3), permanannya disebut permainan N

orang (N-person game).
To be continued?
Sumber:
Anoname: Teori Permainan.2006
Winstone,Wayne.2006.Operation Research :Game Theory Chapter 14.p 804
TEORI ANTRIAN
(Pak Ikrar)

Modul OR 2

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul OR 2

Diunggah oleh

Hak Cipta:

Format Tersedia

PROGRAM DINAMIS

Gambar 1. Hubungan Stage, State, dan Decision

1.1 Ilustrasi Program Dinamis

Gambar 2. Tahapan dari kota A ke kota K

Tabel. 1 Waktu Tempuh Antar Kota

Tahap 3 : min{𝑓3 (𝑥3 ) + 𝑓4∗ (𝑥4 )}

Contoh menghitung cell DH,

Tahap 1: min{𝑓1 (𝑥1 ) + 𝑓2∗ (𝑥2 )}

1.3 Program Dinamis Deterministik

Pendekatan program dinamis sebagai persoalan deterministik, dimana state

Jumlah Tim Pertumbuhan Umur

Memaksimumkan: ∑3𝑖=1 𝑝𝑖 (𝑥𝑖 )

Kendala ∑3𝑖=1 𝑥𝑖 = 5 𝑥𝑖 integer nonegatif

Dengan demikian maka:

𝑓𝑛 (𝑠, 𝑥𝑛 ) = 𝑝𝑛 (𝑥𝑛 ) + 𝑚𝑎𝑘𝑠 ∑ 𝑝𝑖 (𝑥𝑖 )

Contoh menghitung cell (3,2)

2. Sebuah perusahaan membagi daerah pemasarannya menjadi tiga, yakni : utara,

Alternatif Tingkat return

Tentukan keputusan alokasi jumlah salesmen untuk masing-masing daerah yang

3. Seorang kandidat presiden ingin mendapatkan dukungan suara

Perkiraan prosentase dukungan suara untuk tiap pengeluaran

5. Seorang mahasiswa mempunyai 7 hari persiapan sebelum UAS dimulai, pada 4

6. Menghadapi pemilihan Gubernur DKI Jakarta yang akan dilaksanakan Februari

1.4 Program Dinamis Probabilistik

𝑥3 1 𝑥3 𝑓3∗ (𝑠) 𝑥3∗

𝑥2 1 𝑥2 𝑓2∗ (𝑠) 𝑥2∗

𝑥1 1 𝑥1 𝑓1∗ (𝑠) 𝑥1∗

Dengan demikian, maka kebijakan optimum adalah memproduksi 2 item pada

Bagaimanakah sebaiknya kedua ilmuan tersebut dialokasikan agar kemungkinan

2. Sebuah perusahaan angkutan laut mendapat order untuk mengangkut 3 jenis

3. Suatu sistemelektronik terdiri dari 4 komponen. Setiap komponen tersebut harus

Jenis Komponen Probabilitas Komponen Berfungsi

2.1 Proses Stokastik

Dalam pengambilan keputusan suatu masalah, seringkali kita dihadapkan dengan

𝑋𝑡 = status pada saat 𝑡 dan 𝑡 = waktu (langkah).

2.2 Rantai Markov

𝑃(𝑋𝑡+1 = 𝑖𝑡+1 |𝑋𝑡 = 𝑖𝑡 , 𝑋𝑡−1 = 𝑖𝑡−1 . . 𝑋1 = 𝑖1 , 𝑋0 = 𝑖0 ) = 𝑃(𝑋𝑡+1 = 𝑖𝑡+1 |𝑋𝑡 = 𝑖𝑡 )

Selanjutnya diasumsikan untuk setiap status 𝑖 dan 𝑗, serta waktu 𝑡 berlaku

𝑃(𝑋𝑡+1 = 𝑗|𝑋𝑡 = 𝑖) = 𝑝𝑖𝑗 .

2.3 Matriks Peluang Transisi

Pada sebagian besar aplikasinya, peluang transisi dinyatakan dalam matriks

𝑝11 𝑝12 ⋯ 𝑝1𝑠

Berikut diberikan ilustrasi penentuan matriks peluang transisi dari permasalahan

Matriks peluang transisinya adalah

2.4 Persamaan Chapman-Kolmogorov

Persamaan Chapman-Kolmogorov digunakan untuk menentukan peluang transisi

Persamaan tersebut menyatakan bahwa untuk bertransisi dari status 𝑖 ke status 𝑗

𝑝13 2 = 𝑝10 . 𝑝03 + 𝑝11 . 𝑝13 + 𝑝12 . 𝑝23 + 𝑝13 . 𝑝33

𝑃 (𝑛) = 𝑃𝑛 = 𝑃. 𝑃(𝑛−1) = 𝑃 (𝑛−1) . 𝑃

Matriks peluang transisi 2-step

0,8 0,2 0,8 0,2 0,76 0,24

Matriks peluang transisi 3-step

0,8 0,2 0,76 0,24 0,752 0,248

0,8 0,2 0,752 0,248 0,75 0,25

2. Diberikan matriks peluang transisi sebagai berikut.

0,080 0,184 0,368 0,368

0,080 0,184 0,368 0,368 0,080 0,184 0,368 0,368

0,249 0,286 0,300 0,165

2.5 Analisis Rantai Markov pada Peramalan Pangsa Pasar

2.5.1 Pola Perpindahan Konsumen (Customer Switching)

Secara konseptual customer switching yaitu perilaku konsumen yang telah

2.5.2 Analisis Rantai Markov