(Pak Ilham)
Program Dinamis adalah suatu teknik matematis yang biasanya digunakan untuk
membuat suatu keputusan dari serangkaian keputusan yang saling berkaitan.
Tujuan utama dari model ini adalah untuk memudahkan penyelesaian persoalan
optimasi yang mempunyai karakter tertentu.
Ide dasar program dinamis adalah membagi persoalan menjadi beberapa bagian
yang lebih kecil sehingga memudahkan penyelesaiannya. Akan tetapi, berbeda
dengan program linier. Pada persoalan program dinamis ini tidak ada formulasi
matematis yang standar. Karena itu, persamaan-persamaan yang terpilih untuk
digunakan harus dikembangkan agar dapat memenuhi masing-masing situasi yang
dihadapi. Dengan demikian, maka antara persoalan yang satu dan persoalan yang
lainnya dapat mempunyai stuktur penyelesaiaan soal yang berbeda.
Terdapat tiga hal penting dalam Program Dinamis:
STAGE (tahapan) dari persoalan yang dihadapi dan ingin dicari solusinya.
STATE (kondisi) yang menjadi faktor penentu keputusan dari tiap tahapan.
DECISION (keputusan) yang harus diambil dari tiap tahap untuk sampai
kepada solusi keseluruhan.
Meskipun kota awal dan kota tujuan akhir diketahui, untuk tiap kota yang akan
ditempuh, pedagang tersebut memiliki beberapa alternatif dengan ongkos yang
berbeda-beda. Rute manakah yang memiliki jarak tempuh tersingkat?
Salah satu pendekatan yang dapat dilakukan untuk menyelesaikan persoalan ini
adalah dengan menggunakan cara coba-coba (trial dan error). Akan tetapi , jumlah
rute yang dapat dilalui cukup banyak sehingga menghitung total waktu tempuh
untuk masing-masing rute akan sangat membosankan. Dengan program Dinamis,
persoalan itu dapat diselesaikan secara lebih sederhana.
Perhatikan kembali ilustrasi persoalan di atas. Tetapkan variabel-variabel
keputusan 𝑥𝑛 sebagai tempat persinggahan pada stage 𝑛 ( 𝑛 = 1,2,3,4). Maka rute
yang dijalani adalah 1 → 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4 . Dimana 𝑥4 adalah kota (state) K
atau 𝑥4 = 𝐾. Selanjutnya tetapkan pula variabel-variabel berikut ini:
1. 𝑓𝑛 (𝑠, 𝑥𝑛 ) = waktu tempuh dari kota 𝑠 dan memilih 𝑥𝑛 sebagai tempat
persinggahan berikutnya.
2. Untuk 𝑠 dan 𝑛 tertentu, 𝑥𝑛∗ adalah nilai 𝑥𝑛 meminimumkan 𝑓𝑛 (𝑠, 𝑥𝑛 ).
3. 𝑓𝑛∗ (𝑆) = nilai minimum dari 𝑓𝑛 (𝑠, 𝑥𝑛 ) sehingga 𝑓𝑛∗ (𝑠) = 𝑓𝑛 (𝑠, 𝑥𝑛∗ ).
Tujuannya adalah untuk mendapatkan 𝑓1∗ (1) dengan cara mencari 𝑓4∗ (𝑠), 𝑓3∗ (𝑠),
dan 𝑓2∗ (𝑠) terlebih dahulu. Jadi program dinamis menyelesaikan persoalan dengan
melakukan perhitungan mundur walaupun untuk persoalan tertentu bisa dengan
perhitungan maju.
Berikut adalah solusi untuk persoalan di atas dengan perhitungan mundur:
Tahap 4 : min{𝑓4∗ (𝑥4 )}
Dari \ Ke K 𝑓4 (𝑥4 ) 𝑥4∗
H 15 15 HK
I 13 13 IK
J 10 10 JK
Jadi dapat disimpulkan bahwa total waktu terpendek jarak tempuh dari kota A ke K
adalah 55 jam. Dengan rute A-B-E-J-K.
Latihan :
Seorang salesman harus berangkat dari satu kota ke kota lainnya. Diantara kota asal
dan kota tujuan terdapat beberapa kota lain yang dapat digunakan sebagai tempat
persinggahan sementara. Kota-kota yang dapat dilewati tersebut dapat digambarkan
sebagai berikut.
2 5
8
1 3 6 1
9 0
4 7
Data ongkos yang harus dibayar jika salesmen itu meningggalkan kota i dan
menuju kota 𝑐𝑖𝑗 adalah sebagai berikut:
1 2 3 4 5 6 7 8 9 10
1 2 4 3
2 7 4 6
3 3 2 4
4 4 1 5
5 1 4
6 6 3
7 3 3
8 3
9 4
10
Rute manakah yang menimbulkan ongkos terkecil?
1.2 Karakteristik Persoalan Program Dinamis
Berikut ini beberapa gambaran dasar yang menandai (ciri) persoalan program
dinamis:
a. Persoalan dapat dibagi menjadi beberapa tahap (stage), yang pada masing-
masing stage diperlukan adanya satu keputusan. Pada ilustrasi di atas,
persoalan dibagi menjadi 4 stage. Keputusan pada tiap stage adalah
menetapkan kota tujuan berikutnya yang harus ditempuh. Pada persoalan
yang lain, stage ini dapat berupa satuan waktu, volume, atau satuan fisik
lainnya.
b. Masing-masing stage terdiri dari sejumlah state yang berhubungan dengan
stage yang bersangkutan. Pada ilustrasi di atas, stage yang berhubungan
dengan masing-masing stage adalah kota-kota yang disinggahi pada
masing-masing tahap perjalanan. Jumlah state ini bisa terbatas, bisa pula
tidak terbatas.
c. Hasil keputusan yang diambil pada setiap stage ditransformasikan dari state
yang bersangkutan ke state yang berikutnya.
d. Keputusan terbaik pada suatu stage bersifat independen terhadap keputusan
yang dilakukan pada stage sebelumnya.
e. Prosedur pemecahan persoalan yang dilakukan dimulai dengan
mendapatkan cara(keputusan) terbaik untuk setiap state dari stage terakhir.
f. Ada hubungan timbal balik yang mengidentifikasi keputusan terbaik untuk
setiap state pada stage n, berdasarkan keputusan terbaik untuk setiap state
pada stage (n+1). Pada ilustrasi di atas hubungan ini adalah:
∗ (𝑥 ).
𝑓𝑛∗ (𝑠) = min{𝑓𝑛 (𝑠) + 𝑓𝑛+1 𝑛
Contoh soal:
Badan Kesehatan Dunia (WHO) bermaksud akan menyempurnakan pelayanan
kesehatan di negara-negara yang sedang berkembang. Saat ini WHO
mempunyai 5 tim kesehatan yang harus ditempatkan ke tiga negara. Dengan
demikian WHO perlu menentukan berapa tim yang harus dikirim ke tiap-tiap
negara, sehingga keefektifan total dari kelima tim itu dapat maksimum. Sebagai
ukuran dari keefektifan tersebut ialah pertambahan umur (yaitu berapa tahun
umur orang akan bertambah dengan adanya tim tersebut).
Tabel 2. Taksiran Pertambahan Umur (Tahun) dalam Satuan Ribu untuk
Setiap Negara dan Tiap Alokasi Team yang Mungkin Dilakukan.
Solusi :
Misalkan 𝑝𝑖 (𝑥𝑖 ) adalah ukuran keefektifan dari pengalkasian sebanyak 𝑥𝑖 tim
kesehatan pada negara 𝑖. Maka fungsi tujuan adalah memilih 𝑥1 , 𝑥2 , atau 𝑥3
sehingga:
∑ 𝑥𝑖 = 𝑠
𝑖=𝑛
𝑥𝑖 integer nonegatif, 𝑛 = 1,2,3
Kita tahu bahwa 𝑓𝑛∗ (𝑠)=maks 𝑓𝑛 (𝑠, 𝑥𝑛 ), 𝑑𝑖𝑚𝑎𝑛𝑎 𝑥𝑛 = 0,1,2, … , 𝑠
Oleh karena itu, maka
∗ (𝑠
𝑓𝑛 (𝑠, 𝑥𝑛 ) = 𝑝𝑛 (𝑥𝑛 ) + 𝑓𝑛+1 − 𝑥𝑛 ) , 𝑑𝑖𝑚𝑎𝑛𝑎 𝑓4∗ = 0
Akibat hubungan timbal balik dari fungsi 𝑓1∗ , 𝑓2∗ , 𝑑𝑎𝑛 𝑓3∗ untuk persoalan ini
menjadi.
∗ (𝑠
𝑓𝑛 ∗ (𝑠) = maks{𝑝𝑛 (𝑥𝑛 ) + 𝑓𝑛+1 − 𝑥𝑛 ) }, untuk 𝑛 = 1,2, 𝑥𝑛 = 0,1,2 … , 𝑠)
Untuk stage terakhir (n=3), maka 𝑓3∗ (𝑠) = maks 𝑝3 (𝑥3 ). 𝑥3 = 0,1, . . , 𝑠
Berikut adalah hasil perhitungan seluruhnya, dimulai dari stage terakhir n=3
dan bergerak mundur hinga stage n=1
n=3
s 𝑓3∗ (𝑠) 𝑥3∗
0 0 0
1 50 1
2 70 2
3 80 3
4 100 4
5 130 5
n=2
𝑠 \ 𝑥2 𝑓2 (𝑠, 𝑥2 ) = 𝑝2 (𝑥2 ) + 𝑓3∗ (𝑠 − 𝑥2 ) 𝑓2∗ (𝑠) 𝑥2∗
0 1 2 3 4 5
0 0 0 0
1 50 20 50 0
2 70 70 45 70 0,1
3 80 90 95 75 95 2
4 100 100 115 125 110 125 3
5 130 120 125 145 160 150 160 4
n=1
𝑠 \ 𝑥1 𝑓1 (𝑠, 𝑥1 ) = 𝑝1 (𝑥1 ) + 𝑓2∗ (𝑠 − 𝑥1 ) 𝑓1∗ (𝑠) 𝑥1∗
0 1 2 3 4 5
5 160 170 165 160 155 120 170 1
Contoh menghitung cell (5,2)
𝑓1 (5,2) = 𝑝1 (2) + 𝑓2∗ (5 − 2) = 70 + 95 = 165
Jadi solusi optimum dari persoalan di atas adalah 𝑥1∗ = 1, 𝑥2∗ = 3, dan 𝑥3∗ = 1.
Maka alokasi tim kesehatan ketiga negara tersebutberturut-turut adalah 1 tim ke
negara 1, 3 tim ke negara 2, dan 1 tim ke negara 1 yang akan menghasilkan taksiran
total 170.000 penambahan tahun orang.
Latihan :
1. Seorang pengarah jalan ingin menentukan rute terpendek antara dua kota (A dan I)
berdasarakan rute alternatif yang tersedia. Berikut gambar alternatif rute yang dapat
ditempuh dari kota A ke kota I dan biaya yang harus dikeluarkan untuk menempuh
setiap kota tujuan.
Bantulah pengarah jalan tersebut menemukan rute terpendek yang ditandai dengan
minimumnya biaya yang harus dikeluarkan.
Jumlah
Wilayah pemilihan
Juru
Kampanye 1 2 3 4
0 0 0 0 0
1 25 20 33 13
2 42 38 43 24
3 55 54 47 32
4 63 65 50 39
5 69 73 52 45
6 74 80 53 50
Tentukan jumlah alokasi jurus kampanye untuk setiap wilayah pemilihan agar
dicapai total penambahan pemilih yang optimal.
Ongkos produksi marginal untuk produk ini ditaksir sebesar $ 100 per item
(walaupun rusak), dan kelebihan item dianggap tidak berharga. Sebagai tambahan,
jika proses produksi untuk produk ini di set up, maka harus disediakan ongkos set-
up sebesar $300. Jika pemeriksaan menyatakan bahwa seluruh lot yang dihasilkan
tidak ada yang dapat diterima, maka proses produksinya harus di set-up dengan
tambahan ongkos sebesar $ 300. Perusahaan ini hanya mempunyai waktu untuk
membuat tidak lebih dari 3 siklus produksi. Jika suatu item yang dapat diterima
belum dihasilkan pada akhir siklus produksi yang ketiga, maka kerugian karena
hilangnya penerimaan dari penjualan ini ditambahkan dengan denda yang harus
dibayar adalah sebesar $ 1600.
Tujuan persoalan ini adalah untuk menentukan ukuran lot pada siklus produksi yang
diperlukan sehingga diperoleh ekspektasi ongkos pembuatan yang minimum.
Jawaban :
Stage dari persoalan ini adalah siklus produksi, sedangkan variabel keputusan
𝑥𝑛 (𝑛 = 1,2,3) adalah ukuran lot produksi pada stage 𝑛. Banyaknya item yang dapat
diterima (yaitu nol atau satu) adalah stage dari sistem pada setiap stage. Jadi state
𝑠 = 1 pada stage 1. Jika paling sedikit satu item yang dapat diterima telah
dihasilkan, maka state berubah menjadi 𝑠 = 0. Dan setelah itu tidak ada lagi ongkos
tambahan yang diperlukan. Dalam hal ini 𝑓𝑛 (𝑠, 𝑥𝑛 ) adalah ekspektasi ongkos total
yang minimum untuk stage n ke depan, berdasarkan state n.
Maka :
𝑓𝑛∗ (𝑠) = min 𝑓𝑛 (𝑠, 𝑥𝑛 ) 𝑥𝑛 = 0,1, …
Dimana :
𝑓𝑛∗ (0) = 0
Dengan menggunakan $ 100 sebagai satuan uang, maka kontribusi terhadap
ongkos dari stage n adalah (𝐾 + 𝑥𝑛 ) dimana:
0 𝑗𝑖𝑘𝑎 𝑥𝑛 = 0
𝐾{
3 𝑗𝑖𝑘𝑎 𝑥𝑛 > 0
Untuk s=1, maka
1 𝑥𝑛 ∗ 1 𝑥𝑛 ∗
𝑓𝑛 (1, 𝑥𝑛 ) = (𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1) + [1 − ( ) ]𝑓𝑛+1 (0)
2 2
1 𝑥𝑛 ∗
= (𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1)
2
Dengan 𝑓4∗ (1) = 16, yaitu terminal ongkos jika tidak dihasilkan item yang dapat
diterima.
Hubungan timbal baliknya adalah:
1 𝑥𝑛 ∗
𝑓𝑛∗ (1) = min {(𝐾 + 𝑥𝑛 ) + ( ) 𝑓𝑛+1 (1)} 𝑥𝑛 = 0,1, ..
2
Untuk 𝑛 = 1,2,3
Perhitungan selengkapnya adalah sebagai berikut:
n=3
n=2
n=1
Latihan :
1. Sebuah proyek ruang angkasa sedang melakukan penelitian teknologi. Tiga tim
peneliti A,B, dan C mencoba melakukan pendekatan berbeda. Menurut perkiraan,
dalam keadaan seperti ini, kemungkinan terjadi kegagalan ketiga tim ini adalah 0.4,
0.6, dan 0.8 untuk A,B, dan C berturut-turut. Karena ingin memperkecil
kemungkinan gagal, maka diputuskan untuk menambah 2 orang ilmuan terkemuka
pada ketiga tim tersebut. Kemungkinan gagal ketiga tim setelah ditambah 0, 1, 2
ilmuan adalah :
Jumlah Ilmuan Probabilitas gagal
A B C
0 0.4 0.6 0.8
1 0.2 0.4 0.5
2 0.15 0.2 0.3
Jika kapal yang memuat barang tersebut hanya mampu membawa maksimum 6 ton,
barang-barang mana saja yang sebagiknya diangkut agar diperoleh nilai maksimum
tanpa melangga beban maksimum? Selesaikan dengan program dinamis.
Ongkos memasang 1,2,3 komponen lain pada setiap komponen adalah sebagai
berikut:
Jenis Komponen Ongkos (Rp. 1000)
Komp. 1 Komp. 2 Komp. 3 Komp. 4
1 6 10 5 8
2 11 16 10 13
3 15 22 14 17
Bila dana yang tersedia adalah Rp. 45.000.000, berapakah komponen lain yang
harus dipasang pada setiap komponen agar probabilitas sistem tersebut berfungsi
maksimal?
4. Sebuah perusahaan memiliki kapasitas produksi sebesar 700 ton per bulan.
Distribusi produk dilakukan melalui transportasi darat, dan untuk menghemat biaya
pengiriman, telah ditentukan volume pengiriman sebesar 100 ton setiap
pengirimannya. Pasar yang dituju adalah pasar A, B, dan C. Dari pengalaman yang
ada, return dari setiap pasar dapat dilihat pada tabel berikut ini :
Bagaiman distribusi produk harus dilakukan oleh perusahaan agar diperoleh hasil
atau return yang paling optimal ?
Sumber:
Tarliah Dimyati, Tjutju.2015. Operations Research: Model-model pengambilan
Keputusan. Jakarta: Sinar Baru Algesindo .
Winstone,Wayne.2006.Operation Research. Elsevier.
Ristono, Agus.2011. Penelitian Operasional Lanjut. Jakarta: Graha Ilmu.
RANTAI MARKOV
(Bu Mirani)
Terkadang kita tertarik pada perubahan yang terjadi dari suatu peubah acak seiring
berjalannya waktu. Kita mungkin ingin tahu bagaimana harga saham atau pangsa
pasar perusahaan berkembang. Studi tentang bagaimana suatu peubah acak berubah
seiring berjalannya waktu termasuk proses stokastik yang dijelaskan dalam bab 2
ini. Khususnya, kita fokus pada jenis proses stokastik yang dikenal sebagai rantai
Markov. Rantai Markov telah diterapkan di berbagai bidang seperti pendidikan,
pemasaran, kesehatan, layanan, keuangan, akuntansi, dan produksi. Kita mulai bab
ini dengan mendefinisikan konsep proses stokastik.
{ 𝑋𝑡 , 𝑡 ∈ 𝑇}
Sebagai contoh, suatu proses stokastik 𝑋1, 𝑋2, 𝑋3, ... adalah suatu proses
stokastik yang menyatakan kumpulan tingkat persediaan mingguan (atau bulanan)
dari suatu produk atau kumpulan dari permintaan mingguan produk tersebut.
Proses stokastik dengan waktu diskrit adalah rantai Markov, jika untuk
𝑡 = 0,1, … peluang kejadian dari proses tersebut dapat dinyatakan sebagai berikut:
Dengan 𝑝𝑖𝑗 menyatakan peluang sistem berada pada status 𝑖 saat 𝑡 kemudian
akan berada pada status 𝑗 saat 𝑡 + 1.
Pengetahuan tentang matriks peluang transisi dari rantai Markov diskrit dapat
diaplikasikan dalam berbagai hal, diantaranya:
Menentukan cuaca esok hari yang dimanfaatkan oleh sebuah restoran sehingga
membantu memperkirakan laba harian.
Mempelajari perilaku inventaris dari toko komputer.
Meramalkan status akun pemegang polis bagi perusahaan asuransi.
Menentukan pangsa pasar jangka panjang untuk toko tertentu.
Jika sistem berpindah dari status 𝑖 selama satu periode ke status 𝑗 selama periode
berikutnya, kita katakan bahwa telah terjadi transisi dari 𝑖 ke 𝑗. Peluang transisi
pada rantai Markov sering dinyatakan dengan 𝑝𝑖𝑗 .
Setiap status 𝑖 pada saat 𝑡 akan berada entah pada status 𝑗 yang mana pada saat
𝑡 + 1. Artinya, untuk setiap status 𝑖 berlaku
𝑠
∑ 𝑝𝑖𝑗 = 1
𝑗=1
Setiap elemen dari matriks 𝑃 haruslah bernilai tidak negatif dan jumlah nilai
peluang pada setiap baris adalah 1.
Contoh 1.
Di akhir hari, nilai saham dicatat; bila naik, maka peluang esok hari nilainya juga
naik = 0,7. Jika nilai saham diakhir hari turun, maka peluang esok hari akan turun
juga = 0,5. Kejadian-kejadian tersebut merupakan rantai Markov dan status 0
menyatakan nilai saham naik dan status 1 menyatakan nilai saham turun, maka
matriks peluang transisinya adalah.
0,7 0,3
𝑃=[ ]
0,5 0,5
Contoh 2.
Model dari kondisi suatu stok barang tertentu. Pada akhir suatu hari tertentu kondisi
sutau stok dicatat. Jika stok meningkat hari ini maka peluang bahwa stok esok hari
meningkat adalah 0,6. Jika stok hari ini menurun maka peluang bahwa stok esok
hari meningkat adalah 0,3.
Model ini merupakan rantai markov dengan keterangan:
Status 0 : stok meningkat
Status 1 : stok menurun
Maka matriks transisinya adalah.
0,6 0,4
𝑃=[ ]
0,3 0,7
Contoh 3
Andaikan contoh saham sebelumnya diubah sebagai berikut: Nilai saham esok hari
tidak hanya tergantung pada nilai saham hari ini, namun juga kemarin.
Jika nilai saham dua hari berturut-turut (hari ini dan kemarin) naik, maka nilainya
besok juga akan naik dengan peluang 0,9.
Jika nilainya hari ini naik, tetapi kemarin turun, maka peluang besok nilainya akan
naik sebesar 0,6.
Jika hari ini nilainya turun, tetapi kemarin naik, maka peluang besok nilai saham
akan naik sebesar 0,5.
Jika nilai saham hari ini dan kemarin turun, peluang besok nilainya akan naik
sebesar 0,3.
Sistem tersebut dapat dipandang sebagai rantai Markov bila definisi statusnya
sebagai berikut.
Status 0 : Nilai saham hari ini naik, kemarin juga naik
Status 1 : Nilai saham hari ini naik, kemarin turun
Status 2 : Nilai saham hari ini turun, kemarin naik
Status 3 : Nilai saham hari ini turun, kemarin juga turun.
𝑚
(𝑛) (𝑚) (𝑛−𝑚)
𝑝𝑖𝑗 = ∑ 𝑝𝑖𝑘 𝑝𝑘𝑗
𝑘=0
Bentuk khusus dari persamaan di atas untuk setiap 𝑖, 𝑗, dan 𝑛 sebagai berikut.
Ketika 𝑚 = 1
𝑚
(𝑛) (𝑛−1)
𝑝𝑖𝑗 = ∑ 𝑝𝑖𝑘 𝑝𝑘𝑗
𝑘=0
Ketika 𝑚 = (𝑛 − 1)
𝑚
(𝑛) (𝑛−1)
𝑝𝑖𝑗 = ∑ 𝑝𝑖𝑘 𝑝𝑘𝑗
𝑘=0
(𝑛)
Dengan demikian 𝑝𝑖𝑗 dapat dihitung dari 𝑝𝑖𝑗 secara berurutan. Untuk setiap 𝑖,
𝑗, dan 𝑛 = 2, maka persamaan Chapman-Kolmogorov menjadi:
𝑚
(2)
𝑝𝑖𝑗 = ∑ 𝑝𝑖𝑘 𝑝𝑘𝑗
𝑘=0
(2)
Perhatikan bahwa 𝑝𝑖𝑗 sama dengan matriks 𝑃2 yang diperoleh dari perkalian
matriks peluang transisi 1-step dengan dirinya sendiri.
𝑃 (2) = 𝑃. 𝑃 = 𝑃2
𝑝00 𝑝01 𝑝02 𝑝03 𝑝00 𝑝01 𝑝02 𝑝03
𝑝 𝑝11 𝑝12 𝑝13 𝑝10 𝑝11 𝑝12 𝑝13
𝑃2 = [𝑝10 𝑝21 𝑝22 𝑝23 ] [𝑝20 𝑝21 𝑝22 𝑝23 ]
20
𝑝30 𝑝31 𝑝32 𝑝33 𝑝30 𝑝31 𝑝32 𝑝33
Jika diinginkan nilai peluang transisi dari status 1 ke status 3 dalam 2-step, maka
Untuk bentuk yang lebih umum, matriks peluang transisi 𝑛-step dapat diperoleh
dari persamaan berikut.
Jadi, matriks peluang transisi 𝑛-step dapat diperoleh dengan mengalikan matriks
peluang transisi 1-step sebanyak 𝑛 kali.
Ilustrasi
1. Diberikan matriks peluang transisi sebagai berikut.
0,8 0,2
𝑃=[ ]
0,6 0,4
Sehingga matriks peluang transisi 2-step dapat dihitung dengan cara seperti
berikut.
Latihan :
1. Jika hari ini hujan maka besok akan hujan dengan peluang 𝛼 = 0,7. Jika hari
ini tidak hujan maka besok akan hujan dengan peluang 𝛽 = 0,4. Matriks
peluang transisi 4 langkah adalah...
2. Keadaan hujan pada suatu hari bergantung pada keadaan hujan dalam dua hari
terakhir. Jika dalam dua hari terakhir hujan maka besok akan hujan dengan
peluang 0,7. Jika hari ini hujan dan kemarin tidak hujan maka besok akan
hujan dengan peluang 0,5. Jika hari ini tidak hujan dan kemarin hujan maka
besok akan hujan dengan peluang 0,4. Jika dalam dua hari terakhir tidak hujan
maka besok hujan dengan peluang 0,2. Matriks peluang transisi 2 langkah
adalah...
3. Model dari kondisi suatu stok barang tertentu. Pada akhir suatu hari tertentu
kondisi sutau stok dicatat. Jika stok meningkat hari ini maka peluang bahwa
stok esok hari meningkat adalah 0,7. Jika stok hari ini menurun maka peluang
bahwa stok esok hari meningkat adalah 0,5. Matriks peluang transisi 3 langkah
adalah...
4. Jika model di atas dikembangkan bahwa kondisi stok esok berubah atau tidak
tergantung pada hari ini dan kemarin maka kemungkinan-kemungkinan yang
ada adalah sebagai berikut: Jika dalam 2 hari terakhir stok meningkat, besok
akan meningkat dengan peluang 0,9. Jika hari ini meningkat, kemarin
menurun, besok akan meningkat dengan peluang 0,6. Jika hari ini menurun,
kemarin meningkat, besok akan meningkat dengan peluang 0,5. Jika dalam 2
hari terakhir stok menurun, besok akan meningkat dengan peluang 0,3.
Matriks peluang transisi 2 langkah adalah...
Pangsa pasar (market share) menurut O'Neal adalah persentase atau proporsi dari
total tersedia pasar atau segmen pasar yang sedang dilayani oleh sebuah perusahaan
yang dapat dinyatakan sebagai pendapatan penjualan perusahaan (dari pasar) dibagi
dengan total pendapatan penjualan yang tersedia di pasar. Hal ini juga dapat
dinyatakan sebagai volume unit penjualan (di pasar) dibagi dengan total volume
unit yang dijual di pasar tersebut. Hal ini umumnya diperlukan untuk riset pasar
komisi untuk memperkirakan ukuran pasar total dan pangsa pasar perusahaan.
Faktor-faktor yang mempengaruhi pangsa pasar adalah inovasi tiada henti,
layanan kepada pelanggan, efektifitas distribusi dan menekan biaya
𝑃 × 𝑄 𝑛 = 𝑄 𝑛+1
Keterangan :
Contoh 1
Pada suatu kota kecil terdapat dua pasar swalayan W dan L. Diasumsikan setiap
pembeli di kota tersebut melakukan kunjungan belanja satu kali per minggu. Dalam
sembarang minggu seorang pembeli hanya berbelanja di W atau L saja, dan tidak
dikeduanya. Kunjungan belanja disebut percobaan dari proses dan toko yang dipilih
disebut keadaan dari proses. Suatu sampel 100 pembeli diambil dalam periode 10
minggu, kemudian data dikompilasikan.
Dalam menganalisis data, terlihat bahwa dari seluruh pembeli yang berbelanja
di W dalam suatu minggu, 90 persen tetap berbelanja di toko W pada minggu
berikutnya, sedangkan sisanya berpindah belanja pada toko L. 80 persen dari yang
berbelanja di toko L dalam suatu minggu tetap berbelanja di toko L, sedangkan 20
persen berpindah belanja pada toko W. Informasi tersebut disusun pada Tabel 1
berikut.
Tentukan:
a. Matriks peluang transisi
b. Prediksi pangsa pasar minggu berikutnya, jika diketahui pangsa pasar minggu
ini adalah
0,7
𝑄1 = [ ]
0,3
Penyelesaian:
a. Karena terdapat 100 sampel pembeli, maka matriks peluang transisinya adalah
90 10
𝑃 = [100 100] = [0,9 0,1]
20 80 0,2 0,8
100 100
Contoh 2
Dua buah produk bersaing seimbang di pasar. Perubahan strategi pemasaran salah
satu produk menghasilkan peluang transisi sebagai berikut.
0,7 0,3
[ ]
0,4 0,6
Prediksi kemungkinan perkembangan pangsa pasar kedua produk tersebut selama
3 periode ke depan.
Penyelesaian:
Karena dua produk tersebut bersaing seimbang, maka pangsa pasarnya saat ini
0,5
adalah 𝑄 = [ ].
0,5
Prediksi pangsa pasar 1 periode adalah
Reachable
Status 𝑗 dikatakan reachable dari status 𝑖 jika terdapat path (jalur) dari 𝑖 menuju 𝑗
Status 5 adalah reachable dari status 3 melaui 3-4-5
Communicate
Status 𝑗 dikatakan communicate dengan status 𝑖 jika status 𝑖 reachable dari 𝑗 dan
𝑗 reachable dari 𝑖.
Closed Set
Himpunan status dikatakan sebagai closed set jika tidak terdapat status diluar
himpunan yang dapat dicapai oleh status anggota himpunan tersebut.
Status 1 dan 2 adalah closed set
Status 3,4 dan 5 adalah closed set
Absorbing State
Status 𝑖 dikatakan sebagai absorbing state jika 𝑝𝑖𝑖 = 1
Transient State
Status 𝑖 dikatakan sebagai transient state jika terdapat status 𝑗 yang dapat dicapai
dari 𝑖 namun 𝑖 tidak dapat dicapai melalui 𝑗.
Terdapat cara untuk meninggalkan status 𝑖 tanpa bisa kembali ke status 𝑖
Recurrent State
Jika bukan transient state maka status tersebut dapat dikatakan sebagai recurrent
state.
Semua status pada contoh pada gambar 1 merupakan recurrent state.
Diberikan matriks peluang transisi sebagai berikut.
Periodic State
Semua path yang berasal dari 𝑖 hanya bisa kembali ke 𝑖 dalam kelipatan 𝑘 > 1.
Jika kita mulai dengan status 1 maka satu-satunya cara untuk kembali ke status 1
adalah minimal setelah 3 periode.
Status 1 memiliki periode 3.
Recurrent state yang bukan periodic state disebut sebagai aperiodic state.
Ergodic (Ireducible)
Jika semua status merupakan recurrent, aperiodic, dan communicate, maka rantai
Markov tersebut dapat dikatakan sebagai Ergodic.
First Passage Time (FPT) adalah waktu yang dibutuhkan oleh suatu proses untuk
menuju status 𝑗 dari status 𝑖 untuk pertama kali. Secara umum FPT merupakan
perubah acak dan memiliki distribusi peluang yang bersesuaian dengan mereka.
Distribusi peluang ini bergantung pada peluang transisi dari proses.
Misalkan: 𝐹𝑖𝑗𝑛 merupakan peluang bahwa FPT dari status 𝑖 ke status 𝑗 sama
dengan 𝑛. Dapat ditunjukkan bahwa peluang memenuhi hubungan rekursif sebagai
berikut:
𝑛−1
𝑓𝑖𝑗𝑛 = 𝑛
𝑝𝑖𝑗 − ∑ 𝑓𝑖𝑗𝑘 ∙ 𝑝𝑗𝑗
𝑛−𝑘
𝑘=1
Jadi peluang dari suatu FPT dari status 𝑖 ke status 𝑗 dalam langkah 𝑛 dapat
dihitung secara rekursif dari peluang transisi satu langkah.
Menghitung 𝑓𝑖𝑗𝑛 untuk seluruh 𝑛 mungkin sulit, relatif lebih sederhana untuk
menghitung FPT harapan dari status 𝑖 ke status 𝑗.
Diberikan nilai harapan 𝜇𝑖𝑗 yang didefinisiakan sebagai berikut:
𝑛
Bila ∑∞
𝑛=1 𝑓𝑖𝑗 = 1, maka 𝜇𝑖𝑗 memenuhi persamaan berikut secara unik.
Contoh
Sebuah toko kamera memiliki stok kamera yang dapat dipesan mingguan.
Asumsikan 𝑋0 = 3. Kasus ini merupakan proses stokastik {𝑋𝑡 } dengan t = 0,1,2,3
mewakili jumlah kamera yang mungkin ada pada akhir minggu.
Dengan matriks peluang transisi sebagai berikut:
Tentukan waktu yang dibutuhkan agar jumlah kamera kembali seperti semula
untuk pertama kalinya (FPT).
Penyelesaian
𝜇30 dapat dicapai karena seluruh status recurrent, maka:
atau
Kesimpulan: Waktu yang dibutuhkan agar jumlah kamera kembali seperti semula
adalah 3,5 minggu.
Suatu proses akan berada pada kondisi steady state manakala proses terebut akan
konvergen ke suatu nilai yang sama untuk 𝑛 → ∞. Untuk rantai Markov yang
ergodik dan tidak dapat direduksi, lim 𝑃𝑖𝑗𝑛 ada dan saling bebas dari 𝑖.
𝑛→∞
Misalkan
𝜋𝑗 = lim 𝑃𝑖𝑗𝑛 , 𝑗 ≥ 0
𝑛→∞
𝜋𝑗 = ∑ 𝜋𝑖 𝑃𝑖𝑗𝑛 , 𝑗 ≥ 0
𝑖=1
dengan ∑∞𝑗=0 𝜋𝑗 = 1.
𝜋𝑗 disebut sebagai peluang pada keadaan stabil dari rantai markov dan memiliki
hubungan resiprokal terhadap waktu recurrent harapan.
1
𝜋𝑗 = 𝜇 , 𝑗 = 1,2, … 𝑀
𝑗𝑗
Contoh
Seperti contoh masalah FPT untuk menentukan stok kamera yang dimiliki oleh toko
kamera, maka untuk jangka waktu panjang lamanya waktu yang dibutuhkan agar
jumlah kamera kembali seperti semula (steady state) adalah...
Penyelesaian
Sehingga diperoleh:
1
𝜋0 = 0,285 → 𝜇00 = 𝜋 = 3,51 minggu
0
1
𝜋1 = 0,285 → 𝜇11 = = 3,51 minggu
𝜋1
1
𝜋2 = 0,264 → 𝜇22 = 𝜋 = 3,79 minggu
2
1
𝜋3 = 0,166 → 𝜇33 = 𝜋 = 6,02 minggu
3
Jadi, agar jumlah kamera kembali seperti semula (steady state) pada jangka
waktu panjang adalah 6,02 minggu.
Referensi
1. Hillier, Frederick and Lieberman, Gerald J. 2001. Introduction to Operations
Research, 7th ed. McGraw-Hill: New York.
2. Taha, Hamdy. 2007. Operation Research : An Introduction, 8th ed. Pearson
Education Inc.: NJ.
3. Winston, Wayne L. 2003. Operations Research: Application & Algorithms, 4th
ed. Thomson Learning: Belmont – CA.
4. Hartanto, D. PPT: Rantai Markov (Markov Chain), KOI. Teknik Industri: ITS.
5. Siswanto. 2007. Operations Research Jilid II. Jakarta: Erlangga.
TEORI PERMAINAN
(Pak Ramli)
Teori Permainan atau Game Theory dikemukakan oleh seorang ahli matematika
Perancis yang bernama Emile Borel pada tahun 1921. Kemudian dikembangkan
lebih lanjut oleh Jhon Von Neumann dan Oskar Morgenstren, yang digunakan
sebagai alat untuk merumuskan prilaku ekonomi yang bersaing. Contoh nyata
penerapan Teori Permainan atau Game Theory adalah aplikasi-aplikasi dalam dunia
militer, pembuatan kontrak, dan penetapan harga-harga. Dalam bab-bab
sebelumnya, kita telah menemui banyak situasi di mana satu pengambil keputusan
memilih keputusan yang optimal tanpa mengacu pada efek keputusan terhadap
pembuat keputusan lain (dan tanpa mengacu pada efek keputusan orang lain
terhadap dirinya) Dalam banyak situasi bisnis, penerapan teori permainan dua atau
lebih pengambilan keputusan secara bersamaan memilih suatu tindakan, dan
tindakan yang dipilih oleh setiap pemain mempengaruhi imbalan yang diterima
oleh pemain lain. Sebagai contoh, setiap perusahaan makanan cepat saji harus
menentukan iklan dan kebijakan harga untuk produknya, dan keputusan masing-
masing perusahaan akan mempengaruhi pendapatan dan laba perusahaan makanan
cepat saji lainnya. Teori permainan berguna untuk membuat keputusan dalam kasus
di mana dua atau lebih pengambil keputusan memiliki kepentingan yang
bertentangan. Sebagian besar studi tentang teori permainan ditawarkan dengan
situasi di mana hanya ada dua pengambil keputusan (atau pemain), dan sebagian
kecil teori permainan n-orang (di mana n > 2)
Pengertian teori permainan atau Game Theory sangatlah beragam, tetapi memiliki
arti yang sama. Berikut ini adalah pengertian dari Teori Permainan atau Game
Theory menurut beberapa ahli.
Berdasarkan dari keempat pengertian para ahli dapat ditarik sebuah kesimpulan
pengertian dari Teori Permainan atau Game Theory. Teori Permainan atau Game
Theory merupakan suatu ilmu pengetahuan berupa teori matematis yang digunakan
untuk menentukan, merumuskan, dan mempelajari situasi konflik atau kompetisi
yang melibatkan dua atau lebih kepentingan guna mendapatkan suatu keputusan
yang terbaik untuk setiap pemain.
Model-model Teori Permainan atau Game Theory dapat diklasifikasikan dalam
beberapa cara, bergantung pada faktor-faktor, yaitu banyaknya pemain, jumlah
keuntungan dan kerugian, dan banyaknya strategi yang dilakukan dalam permainan.
1). Two Person Zero Sum and Constant Sum Games: Saddle Point
Jika banyaknya pemain adalah dua pihak (baik individu maupun kelompok), maka
permainannya disebut sebagai permainan dua orang (two-person game).
Karakteristik Two Zero Sum Game.
a) Ada dua pemain (disebut pemain baris dan pemain kolom)
b) Pemain baris harus memilih 1 dari m strategi .Secara bersamaan, pemain
kolom harus memilih 1 dari n strategi.
c) Jika pemain baris memilih strategi ke-i dan pemain kolom memilih strategi
ke j, maka pemain baris menerima hadiah atau keuntungan sebesar aij dan
pemain kolom menerima kekalahan dengan mendapat kerugian sebesar aij
sejumlah keuntungan yang diperoleh pemain baris. Permainan semacam ini
disebut zero-sum game dua pemain yang diwakili oleh matrix pada Tabel 1
Tabel 1 The Game Reward Matrik
antara Perusahaan A dan Perusahaan B
Strategi B1 B2 …. Bn
A1 a11 a12 …. a1n
A2 a21 a22 …. a2n
.. … .. … ..
Am am1 am2 ..... amn
Contoh tabel 2 matrik pay off (matrik permainan) berikut, dapat dijelaskan
beberapa ketentuan dasar yang terpenting dalam teori permainan.
Nilai-nilai yang ada dalam tabel tersebut (yakni angka 1, 9, 2 ,7 di baris pertama,
8.5.4.3 di baris kedua 6,8,10,5 dibaris ketiga dan 7, 9, 8,6 di baris keempay),
merupakan hasil yang diperoleh dari penggunaan berbagai strategi yang dipilih oleh
kedua perusahaan. Satuan nilai tersebut merupakan efektifitas yang dapat berupa
uang, persentase pangsa pasar, jumlah pelanggan dan sejenisnya. Nilai positif
menunjukkan keuntungan bagi pemain baris dan kerugian bagi pemain kolom,
begitu pula sebaliknya nilai negatif menunjukkan kerugian bagi pemain baris dan
keuntungan bagi pemain kolom. Sebagai contoh nilai 9 pada sel C12 menunjukkan
apabila pemain/perusahaan A menggunakan strategi A1 dan perusahaan B
meresponnya dengan strategi B2, maka perusahaan A akan mendapatkan
keuntungan sebesar 9 yang berarti perusahaan B akan mengalami kerugian sebesar
9 jadi pemaun A dan pemain B berada dalam kondisi bertentangan atau bersaing
dan tidak ada kerjasama antara keduanya.
Asumsi menurut John von Neumann and Oskar Morgenstern untuk teori zero-sum
games menggunakan prinsip minimaks dan maksimin.
Pemain baris A:
Maks Z = v
V ≤ X1+8X2 (Batasan Strategi A1)
V ≤ 9X1+5X2 (Batasan Strategi A2)
X1 + X2 = 1
X1 ≥ 0; X2 ≥ 0 ; V urs
Pemain Kolom B:
Min Z = w
w ≤ Y1+9Y2 (Batasan Strategi B1)
w ≤ 8X1+5X2 (Batasan Strategi B2)
Y1 + Y2 = 1
Y1 ≥ 0; Y2 ≥ 0
Tedapat dua strategi dalam menyelesaikan kasus Teori Permainan atau Game
Theory. yaitu strategi murni dan strategi campuran.
Strategi B1 B2 B3 Minimum
A1 4 4 10 4
A2 2 3 1 1
A3 6 5 7 5 Maksimin
Maksimum 6 5Minimaks 10
Kesimpulan dari kasus diatas adalah peluang perusahaan menang 3/11 dan
peluang perusahaan B kalah adalah 4/11 dengan nilai permaianan (saddle point)
6.09
4). Two-Person Zero Sum-Game:Dominasi
Jika Strategi Murni tidak dapat diterapkan dan permainan belum berakhir karena
belum ditemukan titik pelana. Oleh karena itu kita perlu menerapkan Strategi
Campuran, dengan menerapkan terlebih dulu aturan Dominan (bertujuan untuk
mengurang ukuran Matrik dengan ukuran terkecil yaitu 2x2).
Dari Tabel 6 pada diketahui bahwa Strategi B1 mendominasi B2 dan B3, sehingga
B3 bisa dihilangkan dari Matrik. Diketahui juga bahwa Strategi A2 mendominasi
strategi A1 maupun A3, maka Strategi A1 dapat dihilangkan dari tabel.Matriks 2x2
menjadi (Tabel 7);
Maksimin = Minimaks
Maksimum (minimum semua baris ) = Minimum (maksimum semua kolom)
8≠6
2. N-person Game
To be continued?
Sumber:
Anoname: Teori Permainan.2006
Winstone,Wayne.2006.Operation Research :Game Theory Chapter 14.p 804
TEORI ANTRIAN
(Pak Ikrar)