DYNAMYC PROGRAMING
1. Pendahuluan
Dynamic programing adalah suatu teknik matematik yang baru saja
dikembangkan. Teknik ini sangat berguna dalam banyak hal yang menyangkut
problema pengambilan serangkaian keputusan. Dalam kehidupan sehari-hari , para
perancang sering dihadapkan kepada problema pengambilan serangkaian keputusan
yang berurutan (sequential decision problem) dimana hasil keputusan pada suatu tahap
di pengaruhi oleh keputusan apa yang di ambil pada tahap sebelumnya. Tidak dapat
kiranya disangkal bahwa keputusan apapun yang akan diambil pada setiap tahapan
siperencana menginginkan agar secara overall, keputusan-keputusan tersebut dapat
memberikan hasil yang optimum. Tetapi disini jelas terlihat adanya kaitan yang erat
antara hasil keputusan secara keseluruhan dengan hasil dari tahapan keputusan secara
keseluruhan dengan hasil dari tahapan keputusan secara tesendiri-sendiri. Makin baik
hasil dari dari setiap tahapan keputusan maka makin optimum pula hasil keputusan
secara keseluruhan. Pengertian ‘baik’ dalam hal ini tidak selalu berati berarti
mendapatkan hasil sebesar-besarnya pada tiap keputusan yang tersendiri-sendiri, tetapi
keputusan tersebut dipilih sedemikian rupa sehingga jangan sampai memberikan
pengaruh yang buruk terhadap hasil keputusan pada tahap berikutnya. Sebagai contoh,
dalam bidang pengendalian persediaan, diinginkan agar total biaya persediaan pertahun
adalah sekecil mungkin. Agar tujuan ini dapat dicapai maka biaya persediaan setiap
bulan tidak perlu di tetapkan serendah-rendahnya pada tiap bulan secara tersendiri-
sendiri dapat berakibat meningkatkan biaya persediaan pada bulan berikutnya.
Dynamic programing adalah suatu metode untuk meneliti berbagai-bagai
kemungkinan dalam pengambilan serangkaian keputusan yang berurutan untuk
mendapatkan hasil keputusan yang optimum secara keseluruhan.
Dalam pemecahan problem menurut metode dynamic programing, tidk ada
suatu formulasi penyelesaian yang standard sebagai mana halnya didalam penyelesaian
linear programing adalah merupakan suatu metode pendekatan umum kepada
pemecahan problema dan model matematik tertentu harus di formulasikan untuk setiap
bentuk problema.
2. Prototype problema dynamic programing
Metode dynamic programing didasarkan kepada pengertian matematis yang di sebut
“recursion”. Untuk menjelaskan pengertian ini baiklah diberikan suatu contoh prototype
problema dari dynamic programing yaitu stage coach problem seperti di uraikan berikut
ini.
Seorang salesman ingin mengembara dari kota asalnya ke suatu kota tujuan yang
agak jauh. Untuk mencapai kota tujuan tersebut ada beberapa pilihan route yang dapat
dilaluinya seperti terlihat dalam diagram di bawah ini.
2 5
10
1 3 6
9 Kota
Kota tujuan
Asal
4 7
Dalam diagram ini terlihat bahwa,salesman dapat berangkat dari kota asalnya (blok 1)
melalui kota 2, atau kota 3 ataupun kota 4 yang masing-masing di gambarkan sebagai
blok 2,blok 3,dan blok 4.
Dari masing-masing kota singgahan ini, dia dapat meneruskan kekota 5, atau kota 6
atau kekota 7 dan seterusnya, sehingga dia mencapai tujuan yaitu kota 10. Karena
daerah-daerah yang dapat dilalui cukup membahayakan bagi keselamatan maka
perusahaan asuransi telah menawarkan suatu kebijaksanaan orang yang melintas.
Kepada setiap orang, dibebankan premi yang sebanding dengan besarnya tingkat
bahaya pada route bersangkutan. Adapun besarnya premi tersebut adalah sebagai
berikut:
5 6 7 8 9
10
2 3 4 2 7 4 6 5 1 4
8 3
1 2 4 5 3 2 4 6 6 3
3
9 4
4 1 5 7 3 3
4
Angka-angka dalam kolom adalah besarnya premi yang harus di bayar. Disini terlihat
bahwa dari setiap kota, salesman mempunyai sejumlah pilihan sebagai kota singgahan
dari sebelum melangkah ke kota singgahan tersebut dia harus lebih dahulu mengambil
keputusan ke kota mana sebaiknya dia pergi. Dalam dynamic programming, tahapan
dimana keputusan harus diambil disebut stage dan masing-masing pilihan tersebut
disebut state. Jadi dalam problema diatas, terdapat 10 state yaitu sama dengan
banyaknya kota yang tersedia untuk dipilih dan ada 4 stage pengambilan keputusan
yaitu:
Stage 1: Memilih route dari kota 1 ke kota 2 atau dari kota1 ke kota3 atau dari kota 1
ke kota 4.
Stage 2: Bila pada stage 1, telah di[ilih salah satu dari ketiga kota tersebut, selanjutnya
dari kota pilihan ini dia harus pula memilih kota singgahan berikutnya yaitu
salah satu dari kota 5, kota 6 dan kota 7.
Stage 3: Dari kota singgahan yang terpilih pada stage 2, kota singgahan selanjutnya
adalah salah satu dari kota 8 dan kota 9.
Stage 4: dri kota singgahan yang terpilih pada stage 3, perjalanan dapat diteruskan ke
kota tujuan yaitu kota 10.
2 5
10
1 3 6
4 7
Stage 1
Stage 2 Stage 3 Stage 3
Menurut penyelesaian diatas, salesman berangkat dari kota asalnya melalui route 1 2
6 9 10 dengan total biaya 13. Total biaya ini tidaklah minim karena masih ada
route yang lebih baik yaitu 1 4 6 9 10 dengan total biaya 11. Disini terlihat
dengan mengorbankan sedikit lebih besar biaya pada stage 1 akan diperoleh total biaya
yang lebih kecil.
Problema diatas dapat diselesaikan dengan metode ‘trial and error’. Tetapi
metode ini hanya mungkin digunakan apabila banyaknya stage dan state cukup kecil.
Menurut metode dynamic programming, pertama-tama dicari penyelesaian optimum
dari bagian kecil dari problema tersebut. Kemudian bagian kecil dari problema tersebut
secara sistematika diperbesar dan dicari penyelesaian optimumnya. Demikian
seterusnya sehingga problema secara keseluruhan telah terselesaikan. Penyelesaian
yang demikian disebut “recursion”.
Secara umum ‘dynamic programming system’ dapat digambarkan sebagai
berikut:
x1 xn x n+1 xN
g1 gn g n+1 gN
g1 gn g n+1 gN
1-stage
(N-n)-stage
(N-n+1)-stage
N-stage
: f N 1 ( s N 1 , x N 1 ) x N 1 f N 1 ( s n 1 , x n 1 )
* Opt
Problema 2-stage
x NOpt1 g N 1 ( s N 1 , x N 1 ), f N* ( s N , x N )
: f n 1 ( s n , x n ) x n f n ( s n , x n )
* Opt
Problema n-stage
x nOpt g n ( s n , x n ) f n*1 ( s n 1 , x n 1 )
Problema N-stage : f 1* ( s1 , x1 ) x1Opt f1 ( s1 , x1 )
x1Opt g1 ( s1 , x1 ) f 2* ( s 2 , x 2 )
Untuk lebih jelasnya, maka pertama-tama baiklah problema stage coach tersebut
diatas diselesaikan lebih dahulu dengan menggunakan metode dynamic programming,
yang kemudian diberikan contoh-contoh soal.
Penyelesaian problema stage coach.
x1 x2 x3 x4
s2 s3 s4 s5 =0
stage 1 stage 2 stage 3 stage 4
g1 g2 g3 g4
1-stage
2-stage
3-stage
4-stage
Poblema 1-stage:
Optimasi biaya dimulai dari stage paling akhir yaitu akhir perjalanan salesman.
Stage terakhir yaitu stage 4 adalah state dari kota-kota yang paling dekat ke kota tujuan.
Bila salesman telah sampai dalam stage 4 ini, maka ada 2 kemungkinan di kota (state)
mana dia berada. Jika salesman berada state 8, maka untuk pergi ke state 10, dia harus
mengeluarkan biaya sebesar 3.
Tetapi jika dia berada di state 9, maka biaya tersebut adalah 4. Besarnya biaya-
biaya ini dapat dijelaskan dalam bentuk tabel berikut:
x4 f 4* ( s 4 )
x 4*
s4 10
8 3 10
9 4 10
Problema 2-stage:
Bila salesman berada pada stage 3 maka ada 2 stage lagi baru sampai ke kota
tujuannya.
Misalkan dia sekarang berada di stage 5. Untuk perjalanan selanjutnya dia dapat pergi
ke salah satu dari state 8 atau state 9. Bila dia memiih state 8, maka biaya minimum
yang akan dikeluarkannya adalah biaya dari state 5 ke state 8 ditambah dengan biaya
dari state 8 ke state 10, yaitu sama dengan 1 + 3 = 4. Tetapi apabila dia memilih state 9
maka total biaya minimum tersebut adalah 4 + 4 = 8.
Karena biaya pada alternatif yang kedua ini lebih besar, maka dia akan memilih
state 8. Dengan demikian dapat ditulis pada s 3 = 5, f 3* (s3) = 4 dan x3* = 8. Dengan
cara yang sama dapat ditentukan biaya optimum pada s 3 = 6 dan s3 = 7 seperti terlihat
dibawah ini:
x3 f 3 ( s3 , x3 ) g 3 ( s3 , x3 ) f 4* ( s 4 )
f 3* ( s 3 ) x 3*
s3 8 9
5 4 8 4 8
6 9 7 7 9
7 6 7 6 8
Problema 3-stage:
Dengan cara yang sama, penyelesaian untuk problema 3-stage dapat diperoleh.
Pada problema ini total biaya adalah f 2 (s2 , x2) = g2 (s2 , x2) + f 3* (s3). Sebagai contoh,
apabila salesman berada pada state 2, dan memilih pergi ke state 5, maka total biaya
minimum adalah biaya pada route 2 5 ditambah biaya minimum daristate 5 ke state
10.
Biaya minimum dari state 5 ke state 10 ini dapat diketahui dari tabel pada
problema 2-stage, jadi toal biaya adalah 7 + 4 = 11. Demikian pula halnya apabila
salesman memilih state 6, total biaya minimum adalah biaya pada route 2 6 ditambah
dengan biaya minimum dari state 6 ke state 10 atau sama dengan 4 + 7 = 11. Apabila
dipilih state 7 maka total biaya minimum adalah 6 + 6 = 12. Pada ketiga alternatif ini,
maka total biaya yang terkecil adalah 11 yang mana dihasilkan oleh alternatif pertama
dan kedua. Jadi salesman tersebut boleh memilih state 5 atau state 6 bila dia berangkat
dari state 2 karena route ini akan memerlukan biaya yang sama kecilnya. Selanjutnya
untuk s = 3 dan s = 4, total biaya minimum dapat diperoleh dengan cara yang sama.
x2 f 2 ( s 2 , x 2 ) g 2 ( s 2 , x 2 ) f 3* ( s 3 )
f 2* ( s 2 ) x 2*
s2 5 6 7
2 11 11 12 11 5,6
3 7 9 10 7 5
4 8 8 11 8 5,6
Problema 4-stage:
Problema 4-stage ini telah mencakup seluruh stage karena problema ini hanya
terdiri dari 4-stage. Disini hanya ada satu kemungkinan asal dari salesman yaitu state 1
dengan 3 alternatif tuuan yaitu state 2, state 3 dan state 4. Total biaya minimum dari
ketiga alternatif ini adalah sebagai berikut:
x1 f1 ( s1 , x1 ) g1 ( s1 , x1 ) f 2* ( s 2 )
f 1* ( s1 ) x1*
s1 2 3 4
1 13 11 11 11 3,4
= 8 dan pada problema 1-stage, untuk s4 = 8, diperoleh x 4* = 10. Jadi salah satu dari
3. Contoh-contoh Problema
Contoh 1.
Seorang pedagang memiliki 4 buah store telah membeli 6 keranjang buah
strawberry untuk dijual di masing-masing storenya.
Berdasarkan pengalaman masa lalu, diketahui bahwa distribusi probabilitas dari
potensi pemasaran buah strawberry sebelum menjadi busuk pada masing-masing store
adalah berbeda-beda. Oleh karena itu si pedagang ingin mengetahui bagaimana cara
yang terbaik untuk mengalokasikan ke 6 keranjang buah strawberry yang baru dibelinya
ini kepada ke 4 store yang dimilikinya agar dia memperoleh keuntungan yang sebesar-
besarnya.
Untuk kemudahan pekerjaannya, dia tidak hendak memecah keranjang buah itu
di antara ke empat store tersebut, tetapi dia bersedia untuk tidak mengalokasikan buah
itu kepasa salah satu atau beberapa store apabila dipandang, cara tersebut memang akan
menaikkan keuntungannya. Tabel dibawah ini memperlihatkan total keuntungan yang
diharapkan pada tiap store apabila dialokasikan berbagai-bagai jumlah keranjang dari
buah strawberry tersebut.
x1 x2 x3 x4
s1=6 s2 s3 s4 s5=0
store 1 store 2 store 3 store 4
0 0 0
1 1 1
2 2 2
p1 3 p2 3 p3 3 p4
4 4 4
5 5 5 1-stage
6 6 6
2-stage
3-stage
4-stage
4
Fungsi pembatas : x
i 1
i 6
4
dan x
in
i si xi adalah bilangan bulat yang positip
1 – Stage
f*4 (s4) = Max P4 (x 4
x4=0, 1,…6
Optimasi keuntungan yang dapat diperoleh dari store 4 (stage 4) pada berbagai-bagai
jumlah keranjang yang mungkin ditawarkan. Andai kata jumlah keranjang yang masih
tersisa untuk dialokasikannke store 4 adalah nol (berarti ke enam keranjang buah
tersebut sudah teralokasi kepada store-store lainnya). Maka keuntungan yang diperoleh
dari store 4 ini adalah nol. Tetapi bila masih ada 1 keranjang lagitersisa untuk
dialokasikan amaka keuntungan yang diperoleh adalah 2. dengan cara ynag sama, akan
dapat diketahui besarnya keuntungan dari store 4 apabila banyaknya keranjang yang
masih tersisa untuk dialokasikan kepada store ini adalah 2, 3, 4, 5 dan 6, yaitu seperti
terlihat dalam table berikut ini.
x4
f*4(s4) x*4
s4
0 0 0
1 2 1
2 3 2
3 4 3
4 4 4
5 4 5
6 4 6
2 – Stage
Problema 2 - Stage ini adalah pengalokasian jumlah keranjang kepada store 3 dan store
4. secara matematis sdapat ditulis : pada s 3 = 0. f*3 (s3, x3) = 0. Tetapi apabila masih ada
1 keranjang lagi yang akan dialokasikan untuk store 3 dan store 4 dan kepada store 3
dialokasikan nol keranjang berarti kepada store 4 dialokasikan 1 keranjang. Dengan
cara ini, total keuntungan yang dapat diperoleh dari kedua store ini adalah 0 + 2 = 2.
Alternatif lain ialah dari sisa 1 keranjang tersebut, 1 keranjang dialokasikan kepada
store3, yang berarti kepada store 4 dialokasikan sebanyak nol keranjang. Dengan cara
ini total keuntungan yang diperoleh dari store 3 dan store 4 adalah 6 + 0 = 6. kedua
alternatif ini dapat ditulis :
Pada s3 = 1, maka f*3(s3, x3) = Max (0 2), (6 0)
x3
= 6.
Karena keuntungan maksimum yaitu 6 diperoleh pada alternatif kedua, maka f*3(s3, x3)
= 6 dan x*3 = 1. Dengan cara yang sama, dapat juga diperoleh cara pengalokasian yang
akan memberikan keuntungan maksimum pada kedua store ini apabila s 3 = 2, 3, 4, 5 dan
6 lihat table dibawah ini. Hasil lengkap perhitungan dari problema 2 – stage ini adalah :
3 – Stage
Problema 3 – stage adalah pengalokasian jumlah keranjang kepada store 2, store3 dan
store 4. Andaikan untuk ketiga store ini masih tersisa nol keranjang, atau dengan kata
lain seluruh keranjang dialokasikan kepada store 1, maka besarnya keuntungan yang
dapat diperoleh dari ketiga store ini adalah nol. Jadi pada s2 = 0.
Maka f2 (s2, x2) = P2(x2) + (f*3(s3)
=0 +0
= 0.
Bila ada sisa 1 keranjang (s 2 = 1) maka ada dua cara untuk mengalokasikan keranjang
ini yaitu, kepada store 2 dialokasikan 1 keranjang dan kepada store 3 dan store 4 tidak
ada ataupun kepada store 2 tidak dialokasikan, tetapi kepada store 3 dan store 4
sebanyak 1 keranjang. Menurut alternatif pertama besarnya keuntungan yang dapat
diperoleh dari ke tiga store ini adalah 2 + 0 = 2, dan alternatif kedua memberikan
keuntungan sebesar 0 + 6. karena kmeuntungan terbesar diperoleh pada alternatif kedua
pada s2 = 1 maka f*2(s2, x2) = 6 dan x2 = 0. Selanjutnya, besarnya keuntungan dari ketiga
store ini pada s2 = 2, 3, 4, 5 dan 6 dapat dihitung dengan cara yang sama. Hasil lengkap
dari perhitungan pada problema 2 – stage ini adalah :
4 – Stage
Problema 4 – stage adalah pengalokasian seluruh keranjang kepada store 1, store 2,
store 3, dan store 4. Apabila kepada store 1 tidak ada dialokasikan , maka kepada store
2, store 3 dan store 4, harus dialokasikan keenam keranjang buah tersebut. Cara ini
memberikan total keuntungan sebesar 0 + 16 = 16. Jika hanya 1 keranjang dialokasikan
kepada store 1, maka sisanya sebanyak 5 keranjang harus dialokasikan kepada store 2,
store3 dan store 4. Besarnya keuntungan yang diperoleh dengan cara ini adalah 4 + 14 =
18. dengan cara yang sama, dapat dihitung total keuntungan apabila kepada store 1,
dialokasikan sebanyak2, 3, 4, 5 dan 6 keranjang. Secara lengkap, besarnya keuntungan
pada problema 4 – stage ini adalah :
x1 f1 (s1, x1) = P1(x1) + f*2(s1 – x1)
0 1 2 3 4 5 6 f*1(s1) x*1
s1
6 16 18 18 17 15 13 7 18 1,2
Penyelesaian.
Adalam problema ini, sebagai stage adalah team research dan sebagai state s
adalah banyaknya tenaga ahli yang diperbantukan kepada state tertentu.
Decision variable xn (n=1, 2, 3) adalah banyaknya tenaga ahli yang
diperbantukan kepada stage n (team n)
x1 x2 x3
P1 P2 P3
1 - stage
2 - stage
3 - stage
Misalakn pi (xi) adalah probabilitas kegagalan team I, jika kepada team ini
diperbantukan sebanyak xi tenaga ahli. Tujuan dari proyek adalah memilih x1, x2 dan x3
agar : P1 (x1). P2 (x2). P (x3) sekecil mungkin. Atau,
3
Min Pi (xi) = P1(x1). P2(x2). P3(x3)
i 1
3
Fungsi tujuan : x
i 1
i = 2, i = 1, 2, 3.
3
dan x
in
i =sn, i = n, n + 1, ……………3
Problema 1 – stage :
s3 f*3 (s3) f*3
0 0.80 0
1 0.50 1
2 0.30 2
Problema 2 – stage :
x2 f2 (s2, x2) = P2(x2) + f*3(s2 – x2)
f*2(s2) x2*
s2 0 1 2
0 0.48 0.48 0
1 0.30 0.32 0.30 0
2 0.18 0.20 0.16 0.16 2
Problema 3 – stage :
x1 f1 (s1, x1) = P1(x1) + f*2(s2 – x2)
f*1(s1) x1*
s1 0 1 2
2 0.064 0.060 0.072 0.060 1
Dari penyelesaian diatas diketahui : bahwa pada s 1 = 2, diperoleh x*1= 1. kepada team 1
akan dialokasikan 1 tenaga ahli. Jadi untuk team 2 dan 3 masih tersisa sebanyak : 2 – 1
= 1 tenaga ahli lagi, sehingga s2= 1. pada s2= 1, diperoleh x*2= 0. dengan perkataan lain,
kepada team 2, tidak perlu diperbantukan tenaga ahli. Oleh karena itu s 3 = 1. pada s3= 1,
diperoleh x*3= 1.
Kesimpulan adalah bahwa penyelesaian optimum dari problema ini adalah :
kepada team 1 dan team 3 perlu diperbantukan tenaga ahli masing-masing sebanyak 1
orang sedang kepada team 2 tidak perlu diperbantukan. Probabilitas kegagalan seluruh
team adalah 0.006.
Contoh 3.
Suatu perusahaan dalam waktu yang dekat merencanakan untuk
memperkenalkan suatu produk baru didalam suatu pasar. Oleh karena pasar yang akan
dimasuki oleh produk baru ini pasar yang bersaing, maka perusahaan membuat suatu
rencana tentang strategi pemasaran. Keputusan sudah diambil yaitu produk baru ini
akan diperkenalkan dalam 3 phase.
Phase 1 adalah dengan mengadakan perkenalann khusus yaitu menawarkan produk tadi
pada harga rendah agar pada perkenalan pertama dapat menarik para pembeli. Phase 2
adalah kampanye dengan membuat advertensi secara intensuf untuk “membujuk” para
pembeli tadi agar bersedia membeli produk baru itu secara terus menerus dengan harga
yang biasa. Diketahui, bahwa perusahaan yang lain juga sedang memperkenalkan
produk barunya yang juga sangat bersaing. Oleh karena itu strategi pada phase 3 adalah
melanjutkan kegiatan advertensi yang disertai dengan kampanye promosi untuk
mencegah para langganan beralih ke produk yang lain.
Suatu budget sebesar $5.000.000 telah disediakan untuk kampanye pemasaran
ini. Yang menjadi problema sekarang adalah mendapatkan cara yang terbaik untuk
mengalokasikan uang tersebut kepada ketiga phase tadi. Misalkan M adalah ‘market
share’ pada awal (diterangkan sebagai suatu per centage) yang diperoleh didalam phase
1, F2 adalah fraksi dari market share yang diperoleh dari phase 2 dan F 3 adalah fraksi
dari market share yang diperoleh pada phase 3. data dibawah ini memperlihatkan
hubungan antara besarnya market share yang diperoleh pada tiap phase apabila
sejumlah tertentu uang digunakan untuk kampanye.
Adalah :
M = 10x1 – x12
F2 = 0.40 + 0.10x2
F3 = 0.60 + 0.070x3
Bagaimanakah cara penyelesaian uang tersebut.
Penyelesaian
Didalam problema ini dibutuhkan pengambilan keputusan didalam 3 phase.
Oleh karena itu sebagai stage adalah phase dan state adalah besarnya uang yang dapat
dialokasikan pada tiap phase.
Diagram dari dynamic programming system dari problema ini adalah :
x1 x2 x3
s1=5 juta s2 s3
Phase 1 Phase 1 Phase 1 s4=0
P1 P2 P3
1 - stage
2 - stage
3 - stage
Fungsi tujuan adalah memaksimumkan (M) (F2) (F3).
(a). Bila phase 1 dianggap sebagai stage 1, phase 2 sebagai stage 2 dan phase 3 sebagai
stage 3 dan fn (sn, xn) adalah besarnya fungsi tujuan, maka :
Problema 1 – stage :
Problema 2 – stage :
x2 x3
s2 Phase 2 s3 Phase 3 s4 = 0
p2 p3
Problema 3 – stage
x1 x2 x3
s1 Phase 1 s2 Phase 2 s3 Phase 3 s4 = 0
p1 p2 p3
fn(s1, x1) = M (x1) + f*2(s2)
dan
f*n(s1, x1) = Max [M(x1) + f*2(s2)]
x1
Pada kedua alternatif ini, market share yang dapat diperoleh pada akhir dari phase 3
adalah 7.70 %
(b). Penyelesaian pada bagian (b) pada prinsipnya sama dengan penyelesaian pada
bagian (a). hanya saja perbedaannya adalah besarnya fraksi dari market share yang
dapat diperoleh dinyatakan sebagai fungsi dari decision variable xn.
Penyelesaian selengkapnya adalah :
Problema 1 – stage.
f3 (s3, x3) = 0.60 + 0.07x3
dan
f*3 (s3, x3) = 0.60 + 0.07x*3
s3 f*3(s3, x3) x*3
0<s<5 0.60 + 0.70 s3 s3
Problema 2 – stage
f2(s2, x2) = (0.40 + 0.10x2). f*3(s3, x3)
= (0.40 + 0.10x2).[0.60 + 0.07 s3]
Karena s3 = s2 – x2 maka
f2(s2, x2) = (0.40 + 0.10x2).[0.60 + 0.07 (s2 – x2)]
= 0.24 + 0.028 + 0.032 x2 + 0.007 s2x2 – 0.007 x22
Untuk mendapatkan harga f2 (s2, x2) yang maksimum maka :
f 2
= + 0.032 + 0.007 s2 – 0.014 x2 = 0
x 2
0.007 s 2 0.032
x2 =
0.014
= 0.5 s2 + 2.286
Karena x2 < s2 maka 0.5 s2 + 2.286 < s2 atau s2 > 4.572.
Dengan demikian : x2* = 2.286 + 0.5 s2, untuk 4.572 < s2 < 5
Harga x2* yang memenuhi syarat untuk 0 < s2 < 4.572 dicari sebagai berikut :
Pada 0 < s2 < 4.572 maka akan dipenuhi
2.286 + 0.5 s2 >s2……………………………………………………………(1)
Karena x2<s2 maka juga akan dipenuhi
2.286 + 0.5 s2 >x2……………………………………………………………(2)
dari (1) dan (2), diperoleh x2* = s2 pada 0 < s2 < 4.572
Jadi untuk 4.572 < s2 < 5 :
f2* (s2=, x2) = (0.24) + (0.028)s2 + (0.032) (2.286+0.5 s2) +(0.007)(2.286+0.5 s2)
(s2)-(0.007)(2.286+0.5 s2)2
= 0.277 + 0.044 s2 + 0.00175 s22
Dan untuk 0< s2 < 4.572 :
f*2(s2, x2) = (0.24)s2 + (0.032)s2 +0.007 s22 – 0.007 s22
= 0.24 + 0.06 s2.
Problema 3 – stage
f1(s1, x1) = (10 x1 – x12). f*2(s2, x2)
= (10 x1 – x12). f*2(s1, x1)
karena s2 = s1 – x1 dan s1 = 5 maka bila harga s2 bila disubsitisi dari persamaan diatas,
maka diperoleh :
(10x1 – x12)[0.24 + 0.06(5-x1)], untuk 4.28 < s2 < 5
f1(s1, x1) = (10x1 – x12)[0.277 + 0.044(5-x1)+0.00175 (5-x1)2],
untuk 0 < x1 < 4.28.
Harga x1* yang memberikan harga f1(s1, x1) yang maksimum akan diperoleh dari :
x 1
f1(s1, x1) = 0
Kesimpulan.
Phase Banyaknya uang yang dialokasikan
($ 1000.000)
1 3.15
2 1.85
3 0.00
Contoh 4.
Suatu jumlah positip yang besarnya D, akan dibagi menjadi 3 bagian.
Bagaimanakah caranya pembagian terasebut, agar jumlah kuadrat dari ketiga bagian itu
adalah minimum ?
Penyelesaian :
Karena jumlah positip tersebut harus dibagi menjadi 3 bagian, maka banyaknya
stage dalam problema ini adalah tiga yaitu bagian 1, bagian 2 dan bagian 3. Decision
variable (state) dari problema ada;ah besarnya tiap-tiap bagian.
Misalkan xn (n=1,2,3) adalah decision variable pada stage n. Diagram dari
dynamic programming system dari problema ini dapat digambarkan sebagai berikut :
x1 x2 x3
s1=D s2 s3
stage 1 stage 1 stage 1 s4=0
R1 R2 R3
1 - stage
2 - stage
3 - stage
Formulasi model matematika dari problema ini :
3
x
2
Max : 1
i 1
3
Fungsi pembatas : xi D
i 1
xi > 0 untuk i = 1, 2, 3
Problema 1 – stage :
Pada problema 1 – stage ini, diasumsikan bahwa jumlah positip D dialokasikan
kapada satu stage saja yaitu stage 3 (lihat diagram). Oleh karena itu :
f*3(s3) = x32 …………………………………………………………………(1)
s3 = s2 – x2 …………………………………………………………………..(2)
Karena s4 = 0, maka x3* = s2 – x2 …………………………………………………..(3)
Problema 2 – stage :
0< x2 < s2
x 2
x 22 s 2 x 2 0
2
atau 2 x 2 2 s 2 x 2 0
s2
x2
2
s2
Untuk memeriksa apakah f 2 s 2 akan minimum pada x2 = maka :
2
2 2
x2
2
x2 s2 x2 2 2
2
=4
2 s
Karena 2 0 maka f 2 s 2 akan minimum pada x 2 2
x2 2
s2
Bila x 2 di substitusikan kedalam persamaan (5) maka :
2
s 2 2 s2
2
f s 2 s 2
2
2 2
s 2 2 s 2 2
=
2 2
s2
= ………………………………………………………………………….
2
(6)Karena s1 = x1 + s2 maka s2 = s1 – x1 ……………………………………………….(7)
Dari persamaan (6) dan (7) diperoleh :
f
s2 s1 x1
2
2
2
Problema 3 – stage :
f1 s1 Min x12 f 2 s 2
0 x1 s1
2 s1 x1 2
= Min x1 ……………………………………………(8)
2
Dengan cara yang sama seperti pada problema 2 – stage, harga x 1 yang
2 s1 x1
2
x1 0
x 2 2
s1 x1
atau : 2x1 - 2 0
2
s1
x1
3
s1
Substitusikan harga x1 = kedalam persamaan (8), diperoleh
3
s1
2
s 2 1
s
f 1 s1 1 3
3 2
2
2
s 2 s1 s 2 2
= 91 32 91 9 s1
2
s12
=
3
D2 D
Karena s1 = D maka f1 s1 dan x1
3 3
Menurut persamaan (7) = D2 = s1 – x1
= D – D/3
= 2/3 D
2
D
Maka :
x 2 3
2
D
x 2
3
Dari persamaan (2), x3 s 2 x 2
2 1
= D
3 3
D
x3
3
D
Karena x 3 x 2 x1 , maka dapat disimpulkan bahwa agar jumlah kuadrat
3
dari ketiga bagian itu menjadi minimum maka jumlah D itu harus dibagi sama besar
pada setiap bagian.
Contoh 5
Selesaikan problema linier programming dibawah ini dengan menggunakan
metode dynamic programming.
dan a
j n
ij x j Ri , i 1,2,3
x j 0, j 1,2
2 x2 ≤ R2
2 x2 ≤ R3
x2 ≤ 0
Penyelesaian pada 1 – stage ini adalah :
R1, R2, R3 f 2 ( R1 , R2 , R3 ) x 2
R2 R3 R R3
Ri ≥ 0 5Min , Min 2 ,
2 2 2 2
Problema 2- stage :
f1 R1 , R2 , R3 , x1 3 x1 f 2 R1 x1 , R2 , R3 3x1
dimana harga x1 yang feasible adalah harga-harga yang memenuhi set dari fungsi
pembatas x1 ≤ R1, 3x1 ≤ R3 dan x1≥ 0.
Karena harga R1, R2 dan R3 adalah masing-masing 4, 12 dan 18, maka :
f1 4,12,18, x1 Max 3 x1 f 2 4 x1 ,12,18 3x1
x1 ≤ 4
3x1 ≤ 18
x1 ≥ 0
12 18 3 x1
Max 3 x1 5Min ,
2 2
0 ≤ X1 ≤ 4
Perlu diperhatikan bahwa :
12 18 3 x1 6 , jika 0 x1 2
Min , 18 3 x1
2 2 2 , jika 2 xi 6
90 9 x1
Karena Max [3x1 + 30] dan Max akan mencapai harga maksimum pada
2
0≤ x1 ≤ 2 2 ≤ x1≤ 6
x1= 2, maka x1 2 , seperti yang terlihat dibawah ini :
4, 12, 18 36 2
18 3 2
Dengan demikian : x 2 Min 6, 6
2
Dan Z = 3x1 + 5x2
= 3 (2) + 5 (6)
= 36
BAGIAN III
GAME THEORY
1. Pendahuluan
Kehidupan manusia diwarnai dengan penuh konflik dan persaingan. Banyak
contoh-contoh persaingan yang sering dijumpai di dalam kehidupan sehari-hari yaitu
antara lain peraturan politik, operasi militer, persaingan pasar, perjudian dan lain-lain.
Persoalan persaingan tidaklah terbatas hanya antara dua pihak saja, akan tetapi dapat
meliputi banyak pihak. Keadaan terakhir yang diperoleh dalam persaingan antara pihak
itu sangat ditentukan oleh keputusan yang diambil oleh pihak-pihak yang bersaing
selama proses persaingan berlangsung. Didalam proses persaingan itu, masing-masing
selalu berusaha untuk memperoleh hasil yang optimum bagi dirinya. Oleh karena itu
setiap pihak akan memperhatikan keputusan-keputusan apa yang telah diambil oleh
saingannya, untuk dijadikan bahan pertimbangan baginya didalam melakukan
pembentukan dan pemilihan alternatif-alternatif tindakan yang harus diputuskannya.
Suatu hasil optimum bagi suatu pihak didalam persaingan akan terbentuk dengan
mengingat batas-batas yang ada yang berhubungan dengan kemungkinan-kemungkinan
dari berbagai pihak itu untuk bertindak. Untuk itu tiap pihak haruslah menggunakan
kecerdasan yang ada padanya agar dapat membawanya ke titik optimum yang
diharapkan.
Game theory adalah suatu teori matematik yang membahas secara abstrak
problema persaingan yang bersifat formal. Pembahasan utama dalam teori ini adalah
pada proses pengambilan keputusan oleh pihak-pihak yang bersaing. Didalam game
theory, pihak-pihak yang bersaing ini disebut pemain, dan kumpulan dari tindakan-
tindakan yang dapat diambil oleh setiap pemain selama proses persaingan berlangsung
disebut strategi. Dalam pembahasannya, teori ini membuat suatu asumsi bahwa setiap
pemain selalu memilih strateginya tanpa mengetahui lebih dahulu strategi apa yang
dipilih oleh lawannya atau dengan kata lain pemain memilih strategi masing-masing
dalam waktu yang bersamaan.
Suatu permainan dikatakan telah terjadi apabila seluruh pemain telah melakukan
tindakan masing-masing yang diputuskan secara serentak. Masing-masing pemain
mendapat suatu hasil (pay off), bila suatu permainan telah terjadi. Hasil ini dapat berupa
suatu pendapatan atau suatu kerugian ataupun seri (draw).
Sebagian besar penelitian yang telah dilakukan dalam bidang game theory adalah
tentang persaingan dua orang dengan jumlah nol (two-person zero-sum games). Sesuai
dengan namanya, persaingan ini hanya melibatkan dua pemain yang dapat berupa team,
perusahaan dan lain-lain yang sedang bersaing. Disebut jumlah nol, karena besarnya
hasil yang diperoleh pemain yang menang adalah sama dengan besarnya kerugian dari
pihak yang kalah, sehingga total dari besarnya kemenangan, kedua pemain ini adalah
nol.
2. Model Persaingan
Suatu permainan disebut persaingan apabila keadaan dari permainan tersebut
memiliki cirri-ciri berikut :
(a). Jumlah pemain adalah terbatas, hingga N
(b). Banyaknya macam tindakan yang dimiliki oleh setiap pemain adalah terbatas.
Macam tindakan yang diambil oleh satu pemain tidak perlu sama dengan macam
tindakan yang diambil oleh pemain lainnya.
©. Permainan telah terjadi apabila masing-masing pemain memilih satu tindakan dari
kumpulan tindakan-tindakan yang dapat diambilnya. Saat pengambilan tindakan
oleh setiap pemain adalah bersamaan, sehingga tidak ada pemain yang mengetahui
sebelumnya tindakan apa yang akan diambil oleh pemain lainnya.
(d). Hasil permainan (value of game) ditentukan oleh set dari tindakan-tindakan yang
diambil oleh para pemain. Tiap hasil permainan menyatakan suatu set dari
pembayaran-pembayaran (pay off) yang diterima oleh setiap pemain. Pay off ini
dapat berupa bilangan positif, negatif atau nol.
Pada bagian terdahulu sudah disebutkan bahwa sebagian besar dari penyelidikan
dalam bidang game theory ini adalah tentang permainan antara 2 pemain dengan jumlah
pembayaran sama dengan nol. Pembahasan yang dilakukan pada bagian ini juga
dibatasi pada model persaingan antara dua pemain dengan jumlah nol.
Didalam game theory, dikenal dua macam strategi yaitu strategi murni (pure
strategy) dan strategy campuran (mixed strategy).
(a). Strategi murni adalah suatu aturan keputusan yang telah tersusun sebelum semua
permainan berlangsung dengan selalu memilih satu macam saja tindakan. Dengan
perkataan lain, selama proses persaingan berlangsung setiap pemain hanya
menggunakan satu strategi saja walaupun masing-masing pihak mempunyai
sejumlah strategi.
(b). Strategi campuran adalah suatu aturan keputusan yang telah tersusun sebelum
semua permainan dimulai untuk memilih suatu tindakan untuk tiap kali permainan
terjadi, sesuai dengan distribusi kemungkinan tertentu. Dengan perkataan lain,
penggunaan suatu strategi tergantung dari suatu kemungkinan (probability) yang
dimiliki oleh strategi tersebut.
Suatu strategi murni dapat dinyatakan dengan suatu bilangan yang menunjukkan
tindakan yang dipilih. Suatu strategi camuran untuk seorang pemain yang mempunyai
m strategi dapat dinyatakan dengan set x, yang terdiri dari m buah bilangan yang tak
negatif yaitu x1, x2, x3……xm yang jumlahnya sama dengan satu. Disini xi (i = 1,
2…..m) menyatakan besarnya kemungkinan untuk menggunakan strategi i atau dalam
bentuk lain dapat ditulis :
x = ( x1, x2,………..xm )
dimana
xi ≥ 0, i = 1, 2………….. m
m
dan x
i 1
i 1
Dapat dilihat bahwa perbedaan dari strategi murni dengan strategi campuran
adalah bahwa pada strategi murni, salah satu harga xi besarnya sama dengan satu
(karena hanya satu strategi saja yang digunakan selama persaingan berlangsung) dan
yang lainnya sama dengan nol, sedangkan pada strategi campuran, seluruh strategi
digunakan sesuai dengan besarnya probabilitas penggunaan yang dimiliki oleh setiap
strategi. Jadi strategi murni adalah suatu bentuk khusus dari strategi campuran.
Setiap pemain didalam persaingan dengan strategi murni mempunyai satu strategi
yang mana memberikan hasil optimum kepadanya. Strategi yang demikian disebut
strategi optimum bagi pemain bersangkutan. Berbeda halnya dengan persaingan dengan
strategi murni ini, pada persaingan dengan strategi campuran, setiap pemain tidak
memiliki suatu strategi yang optimal. Oleh karena itu setiap strategi digunakan secara
berulang-ulang. Untuk menyatakan ukuran optimum dari strategi campuran ini
digunakan criteria maximin dan minimax. Arti dari maximin adalah sebagai berikut :
Seorang pemain membuat suatu daftar dari strategi-strategi yang dapat dipilihnya
dan kemudian meneliti hasil-hasil terburuk yang bisa terjadi kepadanya sebagai akibat
dari kombinasi strategi yang dapat diambil oleh lawannya. Dari hasil-hasil terburuk ini
pemain bersangkutan akan memilih strategi yang memberikan hasil yang terbaik
diantara hasil-hasil yang terburuk tadi.
Arti dari minimax adalah kebalikan dari maximin yaitu :
Pemain A dengan m
Strategi ( i = 1, 2
….m)
aij
-amn
Pemain B dengan
n strategi ( j = 1, 2 … n)
1 2 3
1 -a11 -a12 -a13 -a1n
-a21 -a22
2
-a31
3
-aij
-am1 -amn
Pada umumnya didalam setiap permainan hanya satu bentuk matrix saja yang
digunakan yaitu matrix untuk A, dengan pengertian bahwa matrix untuk B selalu akan
mengandung elemen-elemen yang harganya adalah negatif dari matrix A. oleh karena
itu untuk selanjutnya hanya matrix untuk A yang akan dibahas.
Didalam matrix untuk A set cij memperlihatkan besarnya kemungkinan pemain A
ataupun juga merupakan besarnya kekalahan A. jika A memilih strategi ke i dan B
memilih strategi ke j. problema yang selalu timbul adalah tentang cara untuk
mendapatkan :
(a). Strategi yang optimum untuk pemain A
(b). Strategi yang optimum untuk pemain B
©. Harga akhir dari permainan
Berikut ini akan dibahas metode pemecahan dari problema permainan dua orang
jumlah nol, untuk strategi murni dan strategi campuran.
4. Metode Pemecahan
Seperti yang sudah dijelaskan pada bagian 2, semua permainan dua orang jumlah
nol akan dapat diselesaikan apabila permainan tersebut mempunyai strategi optimal
yang stabil. Macam permainan yang paling mudah untuk diselesaikan adalah permainan
yang strategi optimal stabilnya adalah strategi-strategi murni.
Hal ini akan terjadi apabila matrix hasil mengandung titik pelana (saddle point).
Titik pelana adalah suatu elemen dari matrix yang merupakan elemen terkecil) dalam
baris matrix dan sekaligus merupakan elemen terbesar dalam kolomnya.
Dengan kata lain, titik pelana didefinisikan sebagai suatu elemen dari suatu matrix
hasil yang merupakan harga terbesar dari minima baris-baris sekaligus merupakan harga
terkecil dari maxima kolom-kolom.
Penyelesaian untuk permainan yang mempunyai strategi optimum stabil ini ialah
bahwa A harus menggunakan strategi murninya yang ditunjukkan oleh baris yang
memuat titik pelana dan B harus menggunakan strategi murninya yang ditunjukkan oleh
kolom yang memuat titik pelana tadi. Harga dari permainan untuk A adalah sama
dengan harga elemen titik pelana dan untuk B adalah sama dengan harga negatifnya.
B
1 2 3 4
1 2 1 5 2
A 2 2 0 1 2 Strategi 2 didominasi oleh strategi 1 untuk A
3 4 3 6 2 Strategi 1 dan 3 didominasi oleh strategi 2 untuk
B
Dalam matrix hal tersebut terlihat bahwa strategi 1 untuk pemain A dominan
terhadap strategi 2 yang dimilikinya. Artinya, A akan selalu lebih baik menggunakan
strategi 1 dari pada strategi 2, karena strategi 1 ini akan memberikan hasil yang lebih
besar baginya tanpa memperhatikan strategi apa yang digunakan oleh B.
Disamping itu untuk pemain B, strategi 2 yang dimilikinya dominan terhadap
strategi 1 dan strategi 3. oleh karena itu B tidak perlu menggunakan kedua strategi ini.
Dengan demikian matrix hasil akan berubah menjadi :
B
1 2
A 1 1 2
3 3 2
Step 2 : Periksa apakah matrix hasil mempunyai titik pelana. Titik pelana adalah suatu
elemen didalam matrix hasil yang merupakan elemen maksimum diantara m
elemen baris yang minimum dan sekaligus merupakan elemen minimum
diantara n elemen kolom yang maksimum.
B
1 2 3
A 1 -3 -2 6 -3 Elemen baris yang minimum
2 2 1 2 1 Maksimum
3 5 -2 -4 -4
Elemen kolom 5 1 6
Yang maksimum
Minimum
Dalam contoh matrix hasil diatas terlihat bahwa titik pelana adalah 1 yang
merupakan hasil permainan apabila A menggunakan strategi 2 dan B
menggunakan strategi 2. Titik pelana ini diartikan sebagai hasil kemenangan
terkecil yang dapat diperoleh A dan juga merupakan kekalahan yang terkecil yang
dapat diderita oleh B (Principle of pessimism).
Pada umumnya para pemain menganut prinsip pesimistik yaitu :
A. : Memaksimumkan kemenangan minimum yang dapat diperolehnya
(Maximin principle)
B. : Meminimumkan kekalahan maksimum yang dapat dideritanya (minimax
principle).
Idea dibalik principle of pessimism ini adalah : setiap pemain menganggap hasil
yang terburuk akan terjadi kepada dirinya pada setiap kali dia mengambil suatu
tindakan. Usaha terbaik yang dapat dilakukannya adalah memilih strategi yang
akan memberikan hasil yang terbaik dari hasil yang terburuk tersebut.
Contoh 1
Dua orang politikus sedang mengadakan kampanye untuk mendapatkan suara
terbanyak didalam suatu pemilihan. Karena saat pemilihan tinggal 2 hari lagi maka
kedua politikus ini berusaha dengan keras untuk mengadakan kampanye yang effektif.
Sebagai daerah kampanye dipilih 2 buah kota yang diperkirakan kota kunci yang
disebut sebagai kota I dan kota II. Untuk menghindarkan pemborosan waktu perjalanan,
maka para politikus ini merencanakan perjalanan pada malam hari dan menghabiskan
waktu sepanjang hari untuk selama satu atau dua hari di salah satu kota. Karena
persiapan harus sudah dibuat sebelumnya, maka tidak ada seorangpun diantara mereka
mengetahui schedule kampanye lawannya sample waktu kampanye diakhiri.
Penyelesaian
Dengan melihat sesaat, dapat diketahui bahwa A harus menggunakan strategi 1
karena strategi ini mendominasi strategi 2 dan strategi 3 sebab strategi 1 ini akan
memberikan hasil sedikitnya sama dengan hasil yang diberikan oleh kedua strategi yang
lain tanpa memperhatikan strategi apa yang akan diambil oleh B. Demikian juga untuk
B dia tidak akan menggunakan strategi 3, karena dengan strategi ini dia akan menderita
kerugian yang lebih besar dibandingkan dengan kerugian apabila digunakannya kedua
strateginya yang lain.
Karena dua politikus ini dianggap selalu berpikir secara rational, maka B
memperkirakan bahwa A akan menggunakan strategi 1. Dengan demikian agar
kekalahan B minimum, maka dia akan menggunakan strategi 2. Sebagai hasilnya A
akan menerima kemenangan sebanyak 1000 suara dari B. Dengan demikian dikatakan
harga dari persaingan ini adalah 1000.
Note : Disini terlihat bahwa konsep dari dominasi strategi adalah sangat membantu
didalam mempermudah penyelesaian permainan ini.
Contoh 2
Andaikata matrix untuk A dalam contoh 1 adalah seperti yang ditunjukkan dibawah
ini, carilah strategi-strategi optimum untuk kedua politikus tersebut, serta besarnya hasil
dari permainan itu dengan asumsi bahwa keduanya menganut prinsip pesimistik.
1 2 3
-5 -4 6
A 2 0 1
4 -2 -4
Penyelesaian
Problema ini diselesaikan dengan menggunakan prosedur penyelesaian permainan
dua orang jumlah nol sebagai berikut :
Step 1 : Memeriksa strategi yang dominan.
Dalam matrix hasil diatas terlihat bahwa permainan tersebut tidak mempunyai
strategi-strategi yang mendominasi strategi yang lain. Oleh karena itu kedua
pemain secara nyata belum mengetahui strategi mana yang harus digunakan.
Step 2 : Memeriksa titik pelana.
Berdasarkan prinsip pesimistik, titik pelana dicari sebagai berikut :
B
1 2 3 Min
1 -5 -4 6 -5
A 2 2 0 1 0 Maximin
3 4 -2 -4 -4
Max 4 0 6
Minimax
Disini terlihat bahwa matrix hasil tersebut mempunyai titik pelana yang besarnya
nol yang merupakan hasil permainan apa bila A menggunakan strategi 2 dan B
menggunakan strategi 2.
4.2. Permainan dengan strategi campuran
Dalam uraian diatas sudah dijelaskan bahwa bila matrix hasil dari suatu permainan
mempunyai titik pelana, maka permainan tersebut dapat diselesaikan secara
optimum dengan menggunakan strategi murni. Tetapi suatu permainan tidak
selamanya mempunyai titik pelana. Sebagai contoh, perhatikanlah permainan dua
orang jumlah nol berikut :
B
1 2 3 4 Min
1 5 -10 9 8 -10
2 6 7 8 1 1
A 3 8 7 15 2 2 Maximin
4 3 4 -1 4 -1
Max 8 7 15 8
Minimax
Bertitik tolak dari prinsip maximin-minimax, diperoleh bahwa pada permainan
diatas harga dari maximin (=2) tidak sama dengan harga minimax (=7). Oleh karena itu,
diketahui bahwa permainan tersebut tidak mempunyai titik pelana dn strategi maximin-
minimax yang murni tidak akan memberikan penyelesaian yang optimum. Hal ini
adalah nyata karena setiap pemain masih dapat memperbaiki posisinya dengan memilih
strategi yang berbeda. Permaiann yang demikian dinamakan permainan yang tidak
stabil.
Jika suatu permainan tidak mempunyai titik pelana, maka permainan yang
demikian akan dapat diselesaikan secara optimum dengan menggunakan strategi
campuran. Dalam hal ini, setiap pemain menggunakan seluruh strategi yang dimilikinya
menurut distribusi probabilitas tertentu yang telah ditetapkan lebih dahulu.
Secara matematis, penggunaan strategi campuran ini dapat dijelaskan sebagai
berikut :
Misalkan : xi = probabilitas bahwa pemain A akan menggunakan strategi i, (i =
1, 2,….m)
yj = probabilitas bahwa pemain B akan menggunakan strategi j, (j
=1,2…n)
dimana m dan n adalah banyaknya strategi yang dimiliki oleh masing-masing
pemain A dan pemain B. Sebelum permainan dimulai pemain A akan menetapkan lebih
dahulu rencana permainannya dengan menentukan harga x1, x2……xm. Hal yang sama
juga akan dilakukan oleh B yaitu menentukan harga-harga y1, y2,….yn.
Karena harga x1, x2….xm dan y1, y2, ….yn ini adalah probabilitas yang masing-
masing berupa bilangan positif maka
m
0 ≤ x1 ≤ 1 dan x
i 1
i 1
m
0 ≤ y1 ≤ 1 dan y
i 1
i 1
Rencana penggunaan setiap strategi menurut probabilitas (x1, x2, …xm) dan (y1,
y2…yn) ini disebut strategi campuran.
Jika aij adalah merupakan harga set (i, j) dari matrix hasil suatu permainan, maka
xi dan yj akan diperlihatkan dalam matrix sebagai berikut :
B
y1 y2 y3 yn Min
x1 a11 a12 a13 …. ain
a2 a21 a22 a23 …. a2n
A : : : :
xm am1 am2 am3 …. amn
Max
Sama halnya dengan penyelesaian problema pada permainan dengan strategi
murni, pada problema strategi campuran, penyelesaian juga didasarkan kepada criteria
maximin-minimax. Perbedaannya adalah bahwa A memilih xi yang akan
memaksimumkan ekspektasi hasil yang terkecil didalam setiap kolom dan pemain B
memilih yi yang meminimumkan ekspektasi hasil yang terbesar didalam setiap baris
dari matrix hasil.
Secara matematis criteria maximin-minimax ini dapat diformulasikan sebagai
berikut :
m
(1). Pemain A memilih xi (xi ≥ 0, xi 1 ), yang akan menghasilkan :
i 1
m m m
Max Min a ij i i 2 i
x , a x .... ain xi v A
i 1 i 1 i 1
Dimana v A adalah maximin dari ekspektasi hasil.
n
(2). Pemain B memilih Vi (0≤Vi ≤1, Vi 1) yang menghasilkan :
i 1
n n n
Min Max a ij y j , a 2 j y j ,....., a nj y j V B
j 1 j 1 j 1
Dimana VB adalah minimax dari ekspektasi hasil.
(3). Seperti halnya didalam strategi murni, pada strategi campuran ini secara umum,
juga berlaku hubungan berikut :
Maximin dari ekspektasi hasil minimax dari ekspektasi hasil, atau
V A V V B , dimana V adalah hasil dari permainan.
Bila X i dan X j adalah merupakan probabilitas dari penggunaan strategi i dan strategi
j yang menghasilkan penyelesaian optimum, maka hubungan diatas akan berubah
Dengan demikian, ekspektasi hasil yang optimum dari permainan tersebut adalah,
m n
V a ij xi y j
i 1 j 1
Beberapa metoda penyelesaian untuk mencari harga optimum dari X i danY1 untuk
permainan dua orang jumlah nol antara lain adalah metoda penyelesaian secara grafik
metode sub-game dan metoda linear programming.
Metode grafik dan metode sub-game digunakan bilamana salah satu dari pemain
mempunyai hanya 2 strategi.Secara umum permainan yang demikian disebut metode
penyelesaian permainan (2 x n) atau (mx2). Metode linear programming digunakan
bilamana masing-masing pemain mempunyai strategi yang lebih banyak yang disebut
permainan ( m x n ). Khusus untuk hanya 2 strategi, maka penyelesaian dapat dilakukan
secara aljabar.
(5). Produser penyelesaian secara aljabar pada permainan ( 2 x 2 ).
Misalkan suatu matrix hasil bagi A pada permainan ( 2 x 2 ) adalah sebagai
berikut.
Misalkan pula bahwa pada matrix hasil ini tidak terdapat titik pelana.
a11 a12
Probabilitas bahwa A akan menggunakan strategi i adalah xi dan
a21 a22 probabilitas bahwa D akan menggunakan strategi j adalah vj. Problema
adalah mencari harga decision variable xi dan yi, dimana , 0 ≤ xi ≤ 1 dan
x
i 1
i 1 untuk i=1,2 dan 1 dan 0 ≤ yj ≤1, untuk j = 1,2, serta besarnya hasil dari
permainan tersebut. Bila V dinyatakan sebagai ekspektasi hasil dari permainan, menurut
hubungan maximin – minimax seperti yang telah di uraikan dimuka :
a11x1 + a21x2 ≤ v ≤a11y1 + a12y2
dan a12x1 + a22x2 ≤ v ≤ a21y1 + a22y2
x1 + x2 = 1
y1 + y2 = 1.
Pada hasil permainan yang optimum, hubungan berikut akan berlaku :
a). ekspektasi hasil untuk A.
a11x1 + a21x2 = a12x1 + a22x2 ……………………………………………….. (1)
dan x1 + x2 = 1 ……………………………………………….. (2)
Dari (1) dan (2), diperoleh :
x1 a 22 a 21
x2 a11 a12 …………………………………. (3)
=
v1 a 22 a12
……………………………….. (6)
v 2 a11 a 21
Contoh 3:
Tentukanlah strategi optimum dari permainan yang mempunyai matrix hasil di bawah
ini:
V1 V2
X1
1 3
A
2 -1
X2
( 1) 2
=
1 3
x1 3
x2 2
( 1) 3
=
1 2
=4
karena V1 = 1-V2 (persamaan 5), maka diperoleh :
4 1
V1 = dan V2 =
5 5
3 4 2 4
Hasil permainan yang optimum : V* = (1) ( ) ( ) + (2) ( ) ( ) +
5 5 5 5
3 1 2 1
(3) ( ) ( ) + (-1) ( ) ( )
5 5 5 5
34
=
25
penyelesaian secara aljabar ini dapat disederhanakan dengan suatu prosedur yaitu :
Step 1 : Kurangkan harga sel terkecil dalam setiap baris matrix dari harga sel
yang terbesar pada baris yang sama juga, juga hal yang sama dilakukan
pada kolom matrix
Step 2 : Pertukarkanlah tempat dari setiap pasang dari hasil pengurangan
tersebut.
Step 3: Tentukan strategi optimum dengan cara membagi masing-masing hasil
pengurangan dengan total dari setiap pasang hasil pengurangan
Contoh 4 :
Matrix hasil suatu permainan adalah seperti ditunjukkan dibawah ini :
B
V1 V2
X1
5 1 A A
X2
3 4
6. Metode Grafik.
Penyelesaian dengan metode grafik hanya dapat digunakan dalam permainan yang
sedikitnya salah satu dari pemainnya mempunyai dua strategi. Perhatikanlah permainan
matrix hasil seperti dibawah ini :
V1 V2 B Vn
X1
A a11 a12 a1n
Misalkan bahwa dalam permainan ini tidak terdapat titik palang. Karena A hanya
mempunyai 2 strategi yaitu ( X1, X2 ) dimana X2 = 1 – X1 ; X1 ≥ 0 dan X2 ≥ 0, maka dia
hanya perlu untuk mencari harga optimum dari X1. Ekspektasi hasil untuk pemain A
terhadap strategi murni pemain B adalah :
Strategi murni B ( V1,2 …. Vn ) Ekspektasi hasil A
( 1, 0, 0, … 0 ) a11X1 + a21X2 = (a11-a21)X1 + a21 ….
( 0, 1, 0, … 0 ) A12X1 + a22X2 = (a12-a22)X1+a22
. . . . .
. . . . .
. . . . .
. . . . .
n
Ekspektasi -
hasil 1
12
+ V*
V
X1 = 0 X1 = 1
X1* 1
maximin
-
dalam contoh grafik diatas terlihat bahwa setiap garis fungsi diberi nomor sesuai dengan
strategi murni B. Harga V yang diberikan oleh garis fungsi yang bertanda garis tebal
adalah merupakan ekspektasi harga yang minimum untuk A pada setiap harga X1. Harga
maximum (=V*) dari ekspektasi harga minimum ini diperoleh pada titik tertinggi atau
perpotongan kedua garis fungsi ini. Titik ini disebut maksimum point dari ekspektasi
hasil untuk A. Harga X1 pada titik ini adalah optimum (=X1*). Selanjutnya harga V1
untuk B dapat diperoleh setelah V* diketahui. Berdasarkan definisi, ekspektasi dari
permainan ini adalah :
V* = Y1* a11 a 21 x1 * a 21 + Y2* a12 a 22 x1 * a 22
+….. + V n 1 * a1n 1 1 a 2 n 1 x1 * a 2 n 1
Y*n a1n a 2 n x1 a 2 n
Semua garis a1 j a 2 j x1 * a 2 j , untuk j = 1,2 …….. n yang tidak melalui maximin
point harus mempunyai harga Yj* yang bersesuaian sama dengan nol, karena bila Y*>0,
maka setiap ,garis fungsi tersebut, pada X1= X1* akan memberikan ekspektasi hasil
selalu lebih besar dari maksimin ekspektasi hasil. Oleh karena maximin point di peroleh
dari perpotongan dari dua garis fungsi maka kecuali untuk harga Vj yang bersesuaian
dengan kedua garis fungsi ini seluruh Vj yang lainnya harus sama dengan nol. Dengan
demikian problema permainan (2xn) atau (mx2) berobah menjadi permainan (2x2).
Contoh 5:
Perhatikanlah permainan (2x4) berikut ini : B
X1
A V1 v2 v3 v4
X2 2 2 3 -1
4 3 2 6
Permainan ini tidak mempunyai strategi yang dominan dan titik palang. Ekspektasi hasil
untuk pemain A terhadap setiap strategi murni pemain B adalah sebagai berikut :
Strategi murni B ( V1, V2, V3, V4) Ekspektasi hasil A
1. ( 1, 0, 0, 0 ) 2X1 + 4 ( 1-X1 ) = -2X1 + 4
2. ( 0, 1, 0, 0 ) 2X1 + 3 ( 1-X1 ) = -X1 + 3
3. ( 0, 0, 1, 0 ) 3X1 + 2 ( 1-X1 ) = X1 + 2
4. ( 0, 0, 0, 1 ) -X1 + 6 (1-X1 ) = -7X1 + 6
Bila ke empat garis fungsi ini di plot maka diperoleh grafik sebagai berikut :
+6
4
+5 Maximin point
+4
V 1
+3 2
V* =
+2 3
+1
X1 = 0 X1 = 1
-1 X1 = X1
-2
-3
V* = V = Max
0 x1 1
min x1 2 , 7 x1 6
Oleh karena itu harga optimum dari X1 adalah pada titik potong dari kedua garis fungsi
( X1+2 ) dan ( -7X1+6 ). Atau ,
X1+2 = -7X1+6
8X1 = 4
X1 = ½
Maka X1* = ½ dan X2* = ½
Ekspektasi hasil untuk A adalah,
VA = -7 (½ ) + 6
=2½
yang juga merupakan hasil optimum dari permainan ( = V* )
Karena harga V = 2 ½ diperoleh pada X 1= X1* = ½, maka bila harga X1 dari persamaan
diatas disubstitusi dengan X1* = ½ , akan di peroleh :
Mode persamaan ini hanya benar apabila V1* = 0, karena pada V1* > 0, tidak ada harga
Vj* yang akan memenuhi atau dengan kata lai, ekspektasi hasil pada X 1= ½ akan selalu
lebih besar dari maximin point. Dengan demikian pemain B akan menggunakan hanya 3
strateginya sebagai strategi campuran yaitu Y2, Y3, Y4. Setiap dua garis yang mempunyai
tanda slopenya berlawanan adalah juga akan memberikan penyelesaian yang optimum.
Dengan demikian, maka ada tiga kombinasi strategi campuran untuk pemain B yaitu (
Y2, Y3 ), ( Y2, Y4 ), ( Y3, Y4 ). Masing masing kombinasi ini akan memberikan hasil yang
optimum yang sama besarnya.
Bila kombinasi yang pertama dipilih, maka V1* = 0 dan V4* = 0 dan V3* = 1- ½.
Ekspektasi hasil untuk B terhadap tiap strategi murni A adalah :
7. Metode Sub-Game :
Dasar pemilihan dalam penyelesaian permainan (2 x
n) atau (m x 2) menurut -6 -1 -4 metode Sub-game adalah
suatu tanggapan bahwa permainan tersebut terdiri
dari beberapa Sub-game (2 x 7 -2 -5 2). Pandanglah matrix hasil
permainan (2 x 3 ) dibawah ini :
V1 V2 V3
X1
A
X2
a) Sub-game I
B
V1 V2
X1 B hanya menggunakan strategi ( V1 , V2 ), dimana
-6 -1 V3 = 0
7 -2
A A
X2
b) Sub-game II
B
V1 V2
X1 B hanya menggunakan strategi ( V1 , V3 ), dimana
-6 -4 A V2 = 0
A
X2
7 -5
c) Sub-game III
B
V1 V2
X1 B hanya menggunakan strategi ( V2 , V3 ), dimana
-1 4 A V1= 0
A
X2
-2 -5
Pada masing-masing dari ketiga Sub-game tersebut, pemain B mempunyai satu strategi
yang tidak digunakan. Strategi optimum bagi pemain B adalah merupakan strategi yang
terbaik dari ketiga sub-game (2 x 2) tersebut. Sebelum sub-game (2 x 2) ini
diselesaikan, maka perlu di periksa titik pelana lebih dahulu.
Penyelesaian secara aljabar untuk ketiga sub-game ini adalah sebagai berikut :
a) Sub-game I 9 5
X1* = dan X2* =
14 14
B
1 13
V1* = ; V2* = dan V3* = 0.
V1 V2 14 14
X1 9 1 9 13 9
-6 -1 A V = 6 1
14
A 14 14 14
1 5 13 5
7 -2 5 + 7 2
14 14 14 14
15
=-
14
X2
b) Sub-game II. 12 10
X1* = dan X2* =
22 22
B
9 13
V1 V2 V1* = ; V2* = 0 dan V3* =
22 22
X1 12 9 12 13 12
-6 -4 V = 6 4
22 22 22 22
A X2
10 9 10 13 10
7 -5 + 7 5
22 22 22 22
1
=-
11
c) Sub-game III.
B
V1 V2
X1 Titik pelana = -1
4
-
-
Maka : X1* = 1 ; X2* = 0
A X2
1
19
ekspektasi hasil untuk B sebesar - adalah yang terbaik di antara ketiganya. Oleh
14
karena itu B harus menggunakan strategi :
1 13
V1* = ; V2* = ; V3* = 0
14 14
Untuk mengoptimumkan ekspektasi hasil baginya, dan A harus menggunakan strategi
optimumnya yaitu :
9 15
X1* = dan X2* =
14 14
19
Ekspektasi hasil dari permainan tersebut adalah -
14
Pada penyelesaian permainan (2 x n) atau (m x 2) dengan menggunakan model sub-
game, terlihat bahwa pemain yang mempunyai strategi lebih dari dua mempunyai
kesempatan untuk memilih strategi optimum berdasarkan sub-game yang memberikan
hasil yang terbaik baginya. Yang perlu diperhatikan ialah pemain tersebut harus
memilih strategi campuran atas satu sub-game saja dan bukan menggunakan strategi
campuran dari seluruh sub-game yang ada.
Jika pemain B ( pemain yang mempunyai tiga strategi ) dalam contoh diatas
meggunakan strategi campuran dari ketiga sub-game tersebut, maka dia harus
menggunakan satu sub-game untuk satu keputusan. Misalkan proporsi penggunaan
strategi campuran untuk sub-game I, sub-game II dan sub-game III, masing-masing
adalah 1, 2, dan 3, dim ana :
3
i 1
1 1 dan 0 1 1, untuk i =1, 2 dan 3.
Dapat dilihat bahwa VB akan optimum hanya bila 2 0 dan 3 0 dan 1 1 . Ini
berarti bahwa B harus menggunakan strategi campuran menurut sub-game I saja.
m
Dimana x
i 1
1 1
x
i 1
i 1
Xi 0, untuk i = 1, 2, ………………… , m
m
xi 1
v
i 1
vA
A
Bila VA < 0, maka tanda ketidaksamaan dalam fungsi pembatas ini harus dibuktikan.
xi 1
Misalkan X i karena Max VA = Min , maka problema tersebut dapat dirubah
vA vA
m
Min ZA = X i 1
i
m
Fungsi pembatas a
i 1
ij X1 1
linear programming ini adalah formulasi model ekspektasi hasil untuk A. Dengan cara
yang sama, formulasi linear programming dari permainan itu untuk B adalah sebagai
berikut : pemain B menganut system minimax maka ekspektasi hasil untuknya adalah :
n
n
dimana V
i 1
1 1
n
misalkan pula bahwa Max aijY j , j 1,2...n vB
j 1
Y
i 1
j 1
Yj ≥ 0 untuk j = 1, 2, ……… n
Bila seluruh fungsi pembatas dibagi dengan VB ( misalkan bahwa VB > 0 ), maka
diperoleh :
1
Max
VB
n
Yi
Fungsi pembatas a
j 1
ij
VB
1, untuk i = 1, 2, ……… n
n Yj 1
j 1 VB
VB
yj 1
misalkan : = Yj dan = ZB
VB VB
Fungsi pembatas a Y
j 1
ij j 1, untuk i = 1, 2, ……n
Yj ≥ 0, untuk j = 1, 2, …... n
Untuk meyakinkan bahwa VA dan VB adalah positif, maka sebelum problema linear
programing diformulasikan, perlu ditambahkan bilangan positif k kepada setiap elemen
dari matrix hasil sedemikian rupa, sehingga setelah penambahan ini, seluruh elemen
matrix hasil tersebut menjadi positif. Hal ini jelas akan membuat harga V A dan VB lebih
besar dari yang sebenarnya yaitu :
V 'A = VA + k
V 'B = VB + k
Untuk mendapatkan harga VA dan VB sebenarnya, maka YA dan YB yang diperoleh dari
penyelesaian linear programming, dikurangi kembali dengan bilangan positif k
Dari kedua model linear programing diatas terlihat bahwa formulasi linear programing
untuk A dan B masing-masing tidak lain adalah primal dan dual linear programming.
Contoh 6:
Carilah penyelesaian optimum dari oermainan (3x3) dibawah ini :
1 2 3
1 3 -1 -3
2 -3 3 -1
A
-4 -3 3
3
Penyelesaian
1. pemeriksaan terhadap strategi yang dominan. Dengan membandingkan seluruh
kolom dan baris matrix, maka diketahui bahwa dalam permainan itu tidak
terdapat strategi yang dominant. Jadi permainan adalah (3x3)
1 2 3
1 8 4 2
Baris minimum
2
A 2 8 4 -3
3 -
1 2 8 3 Maximin
-4
Kolom 3
maksimum
-4 -3 3
1 2 3
2
A
3
Minimax
3
:
Dari kedua model linear programming ini, maka formulasi untuk B lebih mudah untuk
diselesaikan dibandingkan dengan formulasi untuk A. karena formulasi yang terakhir ini
diselesaikan dengan dual simplexmethod ataupun metode bilangan M besar.
Penyelesaian untuk formulasi B dengan metode simplex adalah sebagai berikut :
ZB – Y1 – Y2 – Y3 –DY4-Dy5-Dy6 = 0
8Y1 + 4Y2 + 2Y3 + Y4 =1
2Y1 + 8Y2 + 4Y3 +Y5 =1
Y1 + 2Y2 + 8Y3 + Y6 = 1
Table pertama:
Basic
ZB Y1 Y2 Y3 Y4 Y5 Y6 RHS
Variable
ZB 1 -1 -1 -1 0 0 0 0
Y3 0 8 4 2 1 0 0 1
Y4 0 2 8 4 0 1 0 1
Y5 0 1 2 8 0 0 1 1
Basic
ZB Y1 Y2 Y3 Y4 Y5 Y6 RHS
Variable
4 6 1 1
ZB 1 0 0 0
8 8 8 8
4 2 1 1
Y3 0 1 0 0
8 8 8 8
Iterasi 1
28 2 6
Y4 0 0 7 1 0
8 8 8
12 62 1 7
Y5 0 0 0 1
8 8 8 8
Basic
ZB Y1 Y2 Y3 Y4 Y5 Y6 RHS
Variable
5 11 1 45
ZB 1 0 0 0
49 196 14 196
1 1 1
Y3 0 1 0 0 - 0
7 14 14
3 31 1 11
Y4 0 0 1 0 -
98 196 14 196
1 3 1 5
Y5 0 0 0 1
98 98 7 49
yj 1
Karena Yj* = VB , (untuk j=1, 2, 3) dan ZB = VB maka
1
y1* = Y1* .
ZB
1 196
=
14 45
14
=
45
1
y2* = Y2* .
ZB
11 196
=
196 45
11
=
45
1
y3* = Y3* .
ZB
5 196
=
49 45
20
=
45
karena formulasi linear programming untuk A dan B mempunyai hubungan prima dan
dual maka dari table diatas dapat dilihat :
5 11 1
X1* = ; X2* = dan X3* =
49 196 14
45
Dan ZA = ZB =
196
1
x1* = X1*.
ZA
5 196
=
49 45
11
=
45
1
x2* = X2* .
ZA
11 196
=
196 45
11
=
45
1
x3* = X3* .
ZA
1 196
=
14 45
14
=
45
ekspektasi hasil optimum dari permainan ( = V*)
1
V* = VA = VB* = 5
ZB
196
= 5
45
29
=-
45