Dynamic Prog - Game Theory

BAGIAN II
DYNAMYC PROGRAMING
1. Pendahuluan
Dynamic programing adalah suatu teknik matematik yang baru saja
dikembangkan. Teknik ini sangat berguna dalam banyak hal yang menyangkut
problema pengambilan serangkaian keputusan. Dalam kehidupan sehari-hari , para
perancang sering dihadapkan kepada problema pengambilan serangkaian keputusan
yang berurutan (sequential decision problem) dimana hasil keputusan pada suatu tahap
di pengaruhi oleh keputusan apa yang di ambil pada tahap sebelumnya. Tidak dapat
kiranya disangkal bahwa keputusan apapun yang akan diambil pada setiap tahapan
siperencana menginginkan agar secara overall, keputusan-keputusan tersebut dapat
memberikan hasil yang optimum. Tetapi disini jelas terlihat adanya kaitan yang erat
antara hasil keputusan secara keseluruhan dengan hasil dari tahapan keputusan secara
keseluruhan dengan hasil dari tahapan keputusan secara tesendiri-sendiri. Makin baik
hasil dari dari setiap tahapan keputusan maka makin optimum pula hasil keputusan
secara keseluruhan. Pengertian ‘baik’ dalam hal ini tidak selalu berati berarti
mendapatkan hasil sebesar-besarnya pada tiap keputusan yang tersendiri-sendiri, tetapi
keputusan tersebut dipilih sedemikian rupa sehingga jangan sampai memberikan
pengaruh yang buruk terhadap hasil keputusan pada tahap berikutnya. Sebagai contoh,
dalam bidang pengendalian persediaan, diinginkan agar total biaya persediaan pertahun
adalah sekecil mungkin. Agar tujuan ini dapat dicapai maka biaya persediaan setiap
bulan tidak perlu di tetapkan serendah-rendahnya pada tiap bulan secara tersendiri-
sendiri dapat berakibat meningkatkan biaya persediaan pada bulan berikutnya.
Dynamic programing adalah suatu metode untuk meneliti berbagai-bagai
kemungkinan dalam pengambilan serangkaian keputusan yang berurutan untuk
mendapatkan hasil keputusan yang optimum secara keseluruhan.
Dalam pemecahan problem menurut metode dynamic programing, tidk ada
suatu formulasi penyelesaian yang standard sebagai mana halnya didalam penyelesaian
linear programing adalah merupakan suatu metode pendekatan umum kepada
pemecahan problema dan model matematik tertentu harus di formulasikan untuk setiap
bentuk problema.
2. Prototype problema dynamic programing
Metode dynamic programing didasarkan kepada pengertian matematis yang di sebut
“recursion”. Untuk menjelaskan pengertian ini baiklah diberikan suatu contoh prototype
problema dari dynamic programing yaitu stage coach problem seperti di uraikan berikut
ini.
Seorang salesman ingin mengembara dari kota asalnya ke suatu kota tujuan yang
agak jauh. Untuk mencapai kota tujuan tersebut ada beberapa pilihan route yang dapat
dilaluinya seperti terlihat dalam diagram di bawah ini.
2 5
10
1 3 6
9 Kota
Kota tujuan
Asal
4 7
Dalam diagram ini terlihat bahwa,salesman dapat berangkat dari kota asalnya (blok 1)
melalui kota 2, atau kota 3 ataupun kota 4 yang masing-masing di gambarkan sebagai
blok 2,blok 3,dan blok 4.
Dari masing-masing kota singgahan ini, dia dapat meneruskan kekota 5, atau kota 6
atau kekota 7 dan seterusnya, sehingga dia mencapai tujuan yaitu kota 10. Karena
daerah-daerah yang dapat dilalui cukup membahayakan bagi keselamatan maka
perusahaan asuransi telah menawarkan suatu kebijaksanaan orang yang melintas.
Kepada setiap orang, dibebankan premi yang sebanding dengan besarnya tingkat
bahaya pada route bersangkutan. Adapun besarnya premi tersebut adalah sebagai
berikut:
5 6 7 8 9
10
2 3 4 2 7 4 6 5 1 4
8 3
1 2 4 5 3 2 4 6 6 3
3
9 4
4 1 5 7 3 3
4
Angka-angka dalam kolom adalah besarnya premi yang harus di bayar. Disini terlihat
bahwa dari setiap kota, salesman mempunyai sejumlah pilihan sebagai kota singgahan
dari sebelum melangkah ke kota singgahan tersebut dia harus lebih dahulu mengambil
keputusan ke kota mana sebaiknya dia pergi. Dalam dynamic programming, tahapan
dimana keputusan harus diambil disebut stage dan masing-masing pilihan tersebut
disebut state. Jadi dalam problema diatas, terdapat 10 state yaitu sama dengan
banyaknya kota yang tersedia untuk dipilih dan ada 4 stage pengambilan keputusan
yaitu:
Stage 1: Memilih route dari kota 1 ke kota 2 atau dari kota1 ke kota3 atau dari kota 1
ke kota 4.
Stage 2: Bila pada stage 1, telah di[ilih salah satu dari ketiga kota tersebut, selanjutnya
dari kota pilihan ini dia harus pula memilih kota singgahan berikutnya yaitu
salah satu dari kota 5, kota 6 dan kota 7.
Stage 3: Dari kota singgahan yang terpilih pada stage 2, kota singgahan selanjutnya
adalah salah satu dari kota 8 dan kota 9.
Stage 4: dri kota singgahan yang terpilih pada stage 3, perjalanan dapat diteruskan ke
kota tujuan yaitu kota 10.
2 5
10
1 3 6
4 7
Stage 1
Stage 2 Stage 3 Stage 3
Sebagai dasar di dalam pengambilan keputusan pada setiap stage adalah

besarnya biaya (premi)yang harus dibayar pada route tersebut. Salesman ingin
mengambil route dimana total premi yang harus dibayar paling rendah.
Seperti sudah diuraikan dimuka, bahwa dengan memilih route pada setiap stage
yang didasarkan pada biaya yang terkecil pada route tersebut, belumlah menjamin total
biaya menjadi minimum. Sebagai bukti, dapat dilihat salah satu alternatif penyelesaian
yang didasarkan kepada biaya minimum pada setiap stage.
Stage Dari Ke Biaya

1 State 1 State 2 2
2 State 2 State 6 4
3 State 6 State 9 3
4 State 9 State 10 4
Total 13
Menurut penyelesaian diatas, salesman berangkat dari kota asalnya melalui route 1  2
 6  9  10 dengan total biaya 13. Total biaya ini tidaklah minim karena masih ada
route yang lebih baik yaitu 1  4  6  9  10 dengan total biaya 11. Disini terlihat
dengan mengorbankan sedikit lebih besar biaya pada stage 1 akan diperoleh total biaya
yang lebih kecil.
Problema diatas dapat diselesaikan dengan metode ‘trial and error’. Tetapi
metode ini hanya mungkin digunakan apabila banyaknya stage dan state cukup kecil.
Menurut metode dynamic programming, pertama-tama dicari penyelesaian optimum
dari bagian kecil dari problema tersebut. Kemudian bagian kecil dari problema tersebut
secara sistematika diperbesar dan dicari penyelesaian optimumnya. Demikian
seterusnya sehingga problema secara keseluruhan telah terselesaikan. Penyelesaian
yang demikian disebut “recursion”.
Secara umum ‘dynamic programming system’ dapat digambarkan sebagai
berikut:
x1 xn x n+1 xN
s1 s2 sn s n+1 s n+1 sN s N+1

stage 1 stage n stage n+1 stage N
g1 gn g n+1 gN
dimana: Xn = decision variabel pada stage n

gn = biaya yang harus ditanggung (return) sebagai akibat dari keputusan
yang diambil pada stage n.
Untuk memudahkan penyelesaian problem, maka dalam dynamic programming
perhitungan dilakukan secara mundur (back ward computation system). Menurut cara
ini, pertama-tama dihitung besarnya biaya minimum yang timbul pada stage terakhir.
Karena hanya ada satu stage dalam perhitungan ini, yaitu stage terakhir maka disebut
sebagai problema 1-stage. Selanjutnya dilakukan perhitungan biaya minimum yang
timbul pada dua stage yang terakhir, yang disebut problema 2-stage. Demikian
seterusnya sehingga terakhir adalah perhitungan biaya minimum yang timbul pada
seluruh stage yang ada, yang disebut sebagai problema N-stage. Perhitungan menurut
“backward system” dapat dijelaskan dengan diagram dibawah ini:
x1 xn x n+1 xN
s1 s2 sn s n+1 s n+1 sN s N+1

stage 1 stage n stage n+1 stage N
g1 gn g n+1 gN
1-stage
(N-n)-stage
(N-n+1)-stage
N-stage
Misalkan decision variabel xn ( n = 1, 2…. N ) adalah state yang terpilih pada

stage n. Misalkan pula bahwa: fn (sn , xn ) adalah total biaya pada stage-stage yang
belum dilalui apabila salesman berada di state s, dimana xn adalah merupakan state
berikutnya.
Bila dimisalkan bahwa x*n adalah harga dari xn yang memberikan fn ( sn , xn )
yang optimum yaitu f*n ( sn , xn ), maka f*n ( sn , xn ) = fn ( sn , x*n ).
Perhitungan biaya optimum pada stage-by-stage dapat diformulasikan sebagai berikut:
Problema 1-stage : f N* ( s N , x N )  g N ( s N , x N )
: f N 1 ( s N 1 , x N 1 )  x N 1  f N 1 ( s n 1 , x n 1 )
* Opt
Problema 2-stage
 x NOpt1 g N 1 ( s N 1 , x N 1 ), f N* ( s N , x N ) 
: f n 1 ( s n , x n )  x n  f n ( s n , x n )
* Opt
Problema n-stage
 x nOpt g n ( s n , x n )  f n*1 ( s n 1 , x n 1 ) 
Problema N-stage : f 1* ( s1 , x1 )  x1Opt  f1 ( s1 , x1 )

 x1Opt g1 ( s1 , x1 )  f 2* ( s 2 , x 2 ) 
Untuk lebih jelasnya, maka pertama-tama baiklah problema stage coach tersebut
diatas diselesaikan lebih dahulu dengan menggunakan metode dynamic programming,
yang kemudian diberikan contoh-contoh soal.
Penyelesaian problema stage coach.
x1 x2 x3 x4
s2 s3 s4 s5 =0
stage 1 stage 2 stage 3 stage 4
g1 g2 g3 g4
1-stage
2-stage
3-stage
4-stage
Poblema 1-stage:
Optimasi biaya dimulai dari stage paling akhir yaitu akhir perjalanan salesman.
Stage terakhir yaitu stage 4 adalah state dari kota-kota yang paling dekat ke kota tujuan.
Bila salesman telah sampai dalam stage 4 ini, maka ada 2 kemungkinan di kota (state)
mana dia berada. Jika salesman berada state 8, maka untuk pergi ke state 10, dia harus
mengeluarkan biaya sebesar 3.
Tetapi jika dia berada di state 9, maka biaya tersebut adalah 4. Besarnya biaya-
biaya ini dapat dijelaskan dalam bentuk tabel berikut:
x4 f 4* ( s 4 )
x 4*
s4 10
8 3 10
9 4 10
Problema 2-stage:
Bila salesman berada pada stage 3 maka ada 2 stage lagi baru sampai ke kota
tujuannya.
Misalkan dia sekarang berada di stage 5. Untuk perjalanan selanjutnya dia dapat pergi
ke salah satu dari state 8 atau state 9. Bila dia memiih state 8, maka biaya minimum
yang akan dikeluarkannya adalah biaya dari state 5 ke state 8 ditambah dengan biaya
dari state 8 ke state 10, yaitu sama dengan 1 + 3 = 4. Tetapi apabila dia memilih state 9
maka total biaya minimum tersebut adalah 4 + 4 = 8.
Karena biaya pada alternatif yang kedua ini lebih besar, maka dia akan memilih
state 8. Dengan demikian dapat ditulis pada s 3 = 5, f 3* (s3) = 4 dan x3* = 8. Dengan
cara yang sama dapat ditentukan biaya optimum pada s 3 = 6 dan s3 = 7 seperti terlihat
dibawah ini:
x3 f 3 ( s3 , x3 )  g 3 ( s3 , x3 )  f 4* ( s 4 )
f 3* ( s 3 ) x 3*
s3 8 9
5 4 8 4 8
6 9 7 7 9
7 6 7 6 8
Problema 3-stage:
Dengan cara yang sama, penyelesaian untuk problema 3-stage dapat diperoleh.
Pada problema ini total biaya adalah f 2 (s2 , x2) = g2 (s2 , x2) + f 3* (s3). Sebagai contoh,
apabila salesman berada pada state 2, dan memilih pergi ke state 5, maka total biaya
minimum adalah biaya pada route 2  5 ditambah biaya minimum daristate 5 ke state
10.
Biaya minimum dari state 5 ke state 10 ini dapat diketahui dari tabel pada
problema 2-stage, jadi toal biaya adalah 7 + 4 = 11. Demikian pula halnya apabila
salesman memilih state 6, total biaya minimum adalah biaya pada route 2  6 ditambah
dengan biaya minimum dari state 6 ke state 10 atau sama dengan 4 + 7 = 11. Apabila
dipilih state 7 maka total biaya minimum adalah 6 + 6 = 12. Pada ketiga alternatif ini,
maka total biaya yang terkecil adalah 11 yang mana dihasilkan oleh alternatif pertama
dan kedua. Jadi salesman tersebut boleh memilih state 5 atau state 6 bila dia berangkat
dari state 2 karena route ini akan memerlukan biaya yang sama kecilnya. Selanjutnya
untuk s = 3 dan s = 4, total biaya minimum dapat diperoleh dengan cara yang sama.
x2 f 2 ( s 2 , x 2 )  g 2 ( s 2 , x 2 )  f 3* ( s 3 )
f 2* ( s 2 ) x 2*
s2 5 6 7
2 11 11 12 11 5,6
3 7 9 10 7 5
4 8 8 11 8 5,6
Problema 4-stage:
Problema 4-stage ini telah mencakup seluruh stage karena problema ini hanya
terdiri dari 4-stage. Disini hanya ada satu kemungkinan asal dari salesman yaitu state 1
dengan 3 alternatif tuuan yaitu state 2, state 3 dan state 4. Total biaya minimum dari
ketiga alternatif ini adalah sebagai berikut:
x1 f1 ( s1 , x1 )  g1 ( s1 , x1 )  f 2* ( s 2 )
f 1* ( s1 ) x1*
s1 2 3 4
1 13 11 11 11 3,4
Hasil dari problema 4-stage memperlihatkan bahwa salesman pertama-tama

harus pergi ke salah satu dari kaota 3 atau kota 4. Pada problema 3-stage, untuk s 2 = 3,
diperoleh x 2* = 5. Dengan demikian pada problema 2-stage, untuk s3 = 5, diperoleh x3*
= 8 dan pada problema 1-stage, untuk s4 = 8, diperoleh x 4* = 10. Jadi salah satu dari
route yang optimum adalah 1  3  5  8  10. Apabila dipilih x1* = 4, akan

memberikan dua route yang optimal lainnya yaitu 1  4  5  8  10 dan 1 4  6
 9  10.
Masing-masing dari ketiga route tersebut akan memberikan total biaya (minimum) yang
sama yaitu 11.
3. Contoh-contoh Problema
Contoh 1.
Seorang pedagang memiliki 4 buah store telah membeli 6 keranjang buah
strawberry untuk dijual di masing-masing storenya.
Berdasarkan pengalaman masa lalu, diketahui bahwa distribusi probabilitas dari
potensi pemasaran buah strawberry sebelum menjadi busuk pada masing-masing store
adalah berbeda-beda. Oleh karena itu si pedagang ingin mengetahui bagaimana cara
yang terbaik untuk mengalokasikan ke 6 keranjang buah strawberry yang baru dibelinya
ini kepada ke 4 store yang dimilikinya agar dia memperoleh keuntungan yang sebesar-
besarnya.
Untuk kemudahan pekerjaannya, dia tidak hendak memecah keranjang buah itu
di antara ke empat store tersebut, tetapi dia bersedia untuk tidak mengalokasikan buah
itu kepasa salah satu atau beberapa store apabila dipandang, cara tersebut memang akan
menaikkan keuntungannya. Tabel dibawah ini memperlihatkan total keuntungan yang
diharapkan pada tiap store apabila dialokasikan berbagai-bagai jumlah keranjang dari
buah strawberry tersebut.
Jumlah Besar keuntungan yang diharapkan pada:

Keranjang Store 1 Store 2 Store 3 Store 4
0 0 0 0 0
1 4 2 6 2
2 6 4 8 3
3 7 6 8 4
4 7 8 8 4
5 7 9 8 4
6 7 10 8 4
Berapa keranjangkah buah strawberry yang harus dialokasikan kepada setiap

store?
Problema diatas dapat dipandang sebagai problema dynamic programming
dengan 4 stage yaitu sesuai dengan banyaknya store pada mana strawberry tersebut
harus dialokasikan. Sebagai state atau decision variabel adalah jumlah keranjang yang
harus dialokasikan di dalam setiap stage.
Secara diagram ‘physical system’ dari ke empat store tersebut adalah sebagai
berikut:
s1=6 s2 s3 s4 s5=0
store 1 store 2 store 3 store 4
Jumlah keranjang strawberry yaitu sebanyak 6 keranjang dinyatakan sebagai s1

= 6. Dari jumlah yang 6 keranjang ini, sebagian dialokasikan ke store 1 dan sisa yang
belum dialokasikan adalah sebanyak s2. Sebagian dari jumlah s2 dialokasikan pula pada
store 2 sehingga sisanya menjadi s3. Kemidian sebagian dari s3 ini dialokasikan pula
kepada store 3 sehingga sisanya tinggal sebesar s 4 keranjang. Sisa sebesar s3 keranjang
ini seluruhnya dialokasikan ke store 4. Oleh karena seluruhnya sudah teralokasi maka s 5
= 0.
Dynamic Programming System dari problema ini digambarkan sebagai berikut.
Disini store 1 adalah stage 1, store 2 sebagai stage 2, store 3 sebagai stage 3 dan store 4
sebagai stage 4.
x1 x2 x3 x4
s1=6 s2 s3 s4 s5=0
store 1 store 2 store 3 store 4
0 0 0
1 1 1
2 2 2
p1 3 p2 3 p3 3 p4
4 4 4
5 5 5 1-stage
6 6 6
2-stage
3-stage
4-stage
xn (n = 1, 2, 3, 4) = decision variable pada stage n

Pn (n = 1, 2, 3, 4) = keuntungan yang diperoleh pada stage n
s1 (n = 1, 2, 3, 4) = banyaknya keranjang yang masih tersisa untuk dialokasikan
kepada stage berikutnya.
Formulasi model matematik dari problema ini adalah sebagai berikut :
Misalkan Pi (xi) adalah besarnya keuntungan yang dapat diperoleh apabila x i keranjang
buah tersebut dialokasikan kepada store i. Maka sebagai tujuan adalah memilih x 1, x2, x3
dan x4 agar total keuntungan sebesarbesarnya secara matematis dapat ditulis :
4
Tujuan : Max :  P  xi 
i 1
i
4
Fungsi pembatas : x
i 1
i 6
Dan xi adalah bilangan bulat yang positip.

Dengan menggunakan notasi yang sama seperti yang telah diuraikan dimuka, f n (sn, xn)
adalah total keuntungan, maka :
4
fn (sn, xn) = pn (xn) + Max x
i  n 1
i  p i ( xi )
4
dan x
in
i  si xi adalah bilangan bulat yang positip
Karena fn*(sn) = Max  f n (s n , x n )

xn = 0, 1, 2, …sn
maka : fn (sn, xn) = Pn(xn) + f*n+1 (sn – xn)
dan f*n(sn) = Max  Pn (x n )  f *n 1 (s n - x n 
xn = 0, 1, …sn
1 – Stage
f*4 (s4) = Max  P4 (x 4 
x4=0, 1,…6
Optimasi keuntungan yang dapat diperoleh dari store 4 (stage 4) pada berbagai-bagai
jumlah keranjang yang mungkin ditawarkan. Andai kata jumlah keranjang yang masih
tersisa untuk dialokasikannke store 4 adalah nol (berarti ke enam keranjang buah
tersebut sudah teralokasi kepada store-store lainnya). Maka keuntungan yang diperoleh
dari store 4 ini adalah nol. Tetapi bila masih ada 1 keranjang lagitersisa untuk
dialokasikan amaka keuntungan yang diperoleh adalah 2. dengan cara ynag sama, akan
dapat diketahui besarnya keuntungan dari store 4 apabila banyaknya keranjang yang
masih tersisa untuk dialokasikan kepada store ini adalah 2, 3, 4, 5 dan 6, yaitu seperti
terlihat dalam table berikut ini.
x4
f*4(s4) x*4
s4
0 0 0
1 2 1
2 3 2
3 4 3
4 4 4
5 4 5
6 4 6
2 – Stage
Problema 2 - Stage ini adalah pengalokasian jumlah keranjang kepada store 3 dan store
4. secara matematis sdapat ditulis : pada s 3 = 0. f*3 (s3, x3) = 0. Tetapi apabila masih ada
1 keranjang lagi yang akan dialokasikan untuk store 3 dan store 4 dan kepada store 3
dialokasikan nol keranjang berarti kepada store 4 dialokasikan 1 keranjang. Dengan
cara ini, total keuntungan yang dapat diperoleh dari kedua store ini adalah 0 + 2 = 2.
Alternatif lain ialah dari sisa 1 keranjang tersebut, 1 keranjang dialokasikan kepada
store3, yang berarti kepada store 4 dialokasikan sebanyak nol keranjang. Dengan cara
ini total keuntungan yang diperoleh dari store 3 dan store 4 adalah 6 + 0 = 6. kedua
alternatif ini dapat ditulis :
Pada s3 = 1, maka f*3(s3, x3) = Max  (0  2), (6  0)
x3
= 6.
Karena keuntungan maksimum yaitu 6 diperoleh pada alternatif kedua, maka f*3(s3, x3)
= 6 dan x*3 = 1. Dengan cara yang sama, dapat juga diperoleh cara pengalokasian yang
akan memberikan keuntungan maksimum pada kedua store ini apabila s 3 = 2, 3, 4, 5 dan
6 lihat table dibawah ini. Hasil lengkap perhitungan dari problema 2 – stage ini adalah :
x3 f3 (s3, x3) = P3(x3) + f*4(s3 – x3)

0 1 2 3 4 5 6 f*3(s3) x3*
s3
0 0 0 0
1 2 6 6 1
2 3 8 8 8 1, 2
3 4 9 10 8 10 2
4 4 10 11 10 8 11 2
5 4 10 12 11 10 8 12 2
6 4 10 12 12 11 10 8 12 2, 3
3 – Stage
Problema 3 – stage adalah pengalokasian jumlah keranjang kepada store 2, store3 dan
store 4. Andaikan untuk ketiga store ini masih tersisa nol keranjang, atau dengan kata
lain seluruh keranjang dialokasikan kepada store 1, maka besarnya keuntungan yang
dapat diperoleh dari ketiga store ini adalah nol. Jadi pada s2 = 0.
Maka f2 (s2, x2) = P2(x2) + (f*3(s3)
=0 +0
= 0.
Bila ada sisa 1 keranjang (s 2 = 1) maka ada dua cara untuk mengalokasikan keranjang
ini yaitu, kepada store 2 dialokasikan 1 keranjang dan kepada store 3 dan store 4 tidak
ada ataupun kepada store 2 tidak dialokasikan, tetapi kepada store 3 dan store 4
sebanyak 1 keranjang. Menurut alternatif pertama besarnya keuntungan yang dapat
diperoleh dari ke tiga store ini adalah 2 + 0 = 2, dan alternatif kedua memberikan
keuntungan sebesar 0 + 6. karena kmeuntungan terbesar diperoleh pada alternatif kedua
pada s2 = 1 maka f*2(s2, x2) = 6 dan x2 = 0. Selanjutnya, besarnya keuntungan dari ketiga
store ini pada s2 = 2, 3, 4, 5 dan 6 dapat dihitung dengan cara yang sama. Hasil lengkap
dari perhitungan pada problema 2 – stage ini adalah :
x2 f2 (s2, x2) = P2(x2) + f*3(s2 – x2)

0 1 2 3 4 5 6 f*2(s2) x2*
s2
0 0 0 0
1 6 2 6 0
2 8 8 4 8 0, 1
3 10 10 10 6 10 0,1,2
4 11 12 12 12 8 12 1,2,3
5 12 13 14 14 14 9 14 2,3,4
6 12 14 15 16 16 15 10 16 3,4
4 – Stage
Problema 4 – stage adalah pengalokasian seluruh keranjang kepada store 1, store 2,
store 3, dan store 4. Apabila kepada store 1 tidak ada dialokasikan , maka kepada store
2, store 3 dan store 4, harus dialokasikan keenam keranjang buah tersebut. Cara ini
memberikan total keuntungan sebesar 0 + 16 = 16. Jika hanya 1 keranjang dialokasikan
kepada store 1, maka sisanya sebanyak 5 keranjang harus dialokasikan kepada store 2,
store3 dan store 4. Besarnya keuntungan yang diperoleh dengan cara ini adalah 4 + 14 =
18. dengan cara yang sama, dapat dihitung total keuntungan apabila kepada store 1,
dialokasikan sebanyak2, 3, 4, 5 dan 6 keranjang. Secara lengkap, besarnya keuntungan
pada problema 4 – stage ini adalah :
x1 f1 (s1, x1) = P1(x1) + f*2(s1 – x1)
0 1 2 3 4 5 6 f*1(s1) x*1
s1
6 16 18 18 17 15 13 7 18 1,2
Hasil perhitungan pada problema 4 – stage memperlihatkan bahwa sipedagang harus

mengalokasikan sebanyak 1 atau 2 keranjang kepada store 1. Misalkan bahwa dia
memilih x*1 = 1. pada problema 3 – stage, untuk s 2 = 5 diperoleh x*2= 2 atau x*2 = 3
atau x*2 = 4. misalkan pula dipilih x*2 = 2. dengan demikin untuk problema 2 – stage,
pada s3 =3 diperoleh x*3 =2. Terakhir pada sub problema 1 – stage, dimana s4=1,
diperoleh x*4 = 1. jadi salah satu dari cara pengalokasianyang optimum adalah 1
keranjang untuk store 1, 2 keranjang utnuk store 2, 2 keranjang untuk store 3 dan 1
keranjang untuk store 4, yang memberikan total keuntungan sebesar 18.
Apabila dipilih x*2 = 3, sedangkan x*1 = 1, maka pada sub problema 2 - stage untuk s 3 =
2, diperoleh x*3 = 1 atau x*3 = 2. misalkan pula dipilih x*3 = 1. pada sub problema 1 –
stage, untuk s4 = 1 diperoleh x4 = 1. Dengan demikian cara pengalokasian optimum
yang lain adalah : 1 keranjang untuk store 1, 3 keranjang untuk store 2, 1 keranjang
untuk store 3 dan 1 keranjang untuk store 4 dengan total keuntungan tetap sebesar 18.
Apabila dipilih x*2 = 3 dan pada sub problema 2 – stage, untuk s 3 = 2 dipilih x*3 = 2,
maka pada problema 1 – stage untuk s4 = 0, diperoleh x*4 = 0.
Apabila dipilih x*2 = 4 maka pada sub problema 2 – stage, pada s3 = 1 diperoleh x*3 = 1,
maka pada problema 1 – stage untuk s4 = 0, diperoleh x*4 = 0.
Dengan cara yang sama, untuk x*1 = 2, dapat dilihat dalam table-tabel diatas besarnya
x*2, x3 dan x*4.
Dalam table dibawah ini dapat dilihat seluruh alternatif dari cara pengalokasian yang
optimum yang memberikan total keuntungan yang sama besarnya yaitu 18.
Jumlah keranjang yang dialokasikan
Total keuntungan
Store1 Store 2 Store 3 Store 4
1 2 2 1 18
1 3 1 1 18
1 3 2 0 18
1 4 1 0 18
2 1 2 1 18
2 2 1 1 18
Contoh 2.
Suatu proyek ruang angkasa sedang melakukan research untuk memecahkan
suatu problema dalam bidang engineering. Untuk tujuan itu, tiga team research sedang
mencoba cara pendekatan yang masing-masing berbeda. Suatu perkiraan sudah dibuat
bahwa, dengan keadaan sekarang probabilitas bahwa masing-masing team yang disebut
team1, team 2 dan tim 3 akan menemui kegagalan adalah sebesar 0.40, 0.60 dan 0.80.
jadi, probabilitas bahwa ketiga team tersebut akan gagal semuanya adalah (0.40)(0.60)
(0.80) = 0.192. Karena tujuan adalah meminimumkan probabilitas kegagalan ini, suatu
keputusan telah dibuat yaitu memperbantukan sebanyak 2 orang top scientist diantara
ketiga team tadi.
Dengan adanya bantuan ketiga ahli ini, diperkirakan probabilitas gagalnya
masing-masing team akan menurun dan besarnya tergantung dari banyaknya tenaga ahli
ayng diperbantukan kepada masing-masing team. Table dibawah ini adalah suatu
perkiraan tentang probabilitas kegagalan team 1, team 2 dan team 3 apabila kepada
masing-masing team ini diperbantukan sebanyak 0,1 atau 2 tenaga ahli. Problema
adalah mendapatkan cara pengalokasian tenaga ahli ini untuk meminimumkan
probabilitas gagalnya ketiga team secara keseluruhan.
Probabilitas Kegagalan
Jumlah Tenaga Ahli
Team 1 Team 2 Team 3
0 0.40 0.60 0.80
1 0.20 0.40 0.50
2 0.15 0.20 0.30
Penyelesaian.
Adalam problema ini, sebagai stage adalah team research dan sebagai state s
adalah banyaknya tenaga ahli yang diperbantukan kepada state tertentu.
Decision variable xn (n=1, 2, 3) adalah banyaknya tenaga ahli yang
diperbantukan kepada stage n (team n)
x1 x2 x3
s1=2 Team 1 s2 Team 2 s3 Team 3

(stage 1) (stage 2) (stage 3) s4=0
P1 P2 P3
1 - stage
2 - stage
3 - stage
Misalakn pi (xi) adalah probabilitas kegagalan team I, jika kepada team ini
diperbantukan sebanyak xi tenaga ahli. Tujuan dari proyek adalah memilih x1, x2 dan x3
agar : P1 (x1). P2 (x2). P (x3) sekecil mungkin. Atau,
3
Min  Pi (xi) = P1(x1). P2(x2). P3(x3)
i 1
3
Fungsi tujuan : x
i 1
i = 2, i = 1, 2, 3.
dan xi adalah bilangan integer yang positip.

Bila fn(s, xn) adalah probabilitas kegagalan team pada : n – stage apabila kepada team-
team tersebut diperbantukan sn tenaga ahli maka :
3
fn (sn, xn) = Pn(xn). Min 
i  n 1
Pi (xi)
3
dan x
in
i =sn, i = n, n + 1, ……………3
xi adalah bilangan integer positip.

Untuk n = 1, 2, 3, maka :
f*n (sn) = Min fn (sn, xn)
xn < s
Jadi : fn (sn, xn) = Pn(xn). f*n+1(sn-xn)
Untuk n = 3, (problema 1 – stage) :

f* 3(s3) = Min P3(x3)
x3 < s
f* 2(s2) = Min [P2(x2).f*3(s3)]
x2 < s2
= Min [P2(x2).f*3(s2 – x2)]
f* 1(s1) = Min [P1(x1).f*2(s1-x1)]
x1 < s1
Dengan menggunakan persamaan matematik tersebut, maka penyelesaian dynamic
programming dari problema tadi adalah sebagai berikut :
Problema 1 – stage :
s3 f*3 (s3) f*3
0 0.80 0
1 0.50 1
2 0.30 2
x2 f2 (s2, x2) = P2(x2) + f*3(s2 – x2)
f*2(s2) x2*
s2 0 1 2
0 0.48 0.48 0
1 0.30 0.32 0.30 0
2 0.18 0.20 0.16 0.16 2
x1 f1 (s1, x1) = P1(x1) + f*2(s2 – x2)
f*1(s1) x1*
s1 0 1 2
2 0.064 0.060 0.072 0.060 1
Dari penyelesaian diatas diketahui : bahwa pada s 1 = 2, diperoleh x*1= 1. kepada team 1
akan dialokasikan 1 tenaga ahli. Jadi untuk team 2 dan 3 masih tersisa sebanyak : 2 – 1
= 1 tenaga ahli lagi, sehingga s2= 1. pada s2= 1, diperoleh x*2= 0. dengan perkataan lain,
kepada team 2, tidak perlu diperbantukan tenaga ahli. Oleh karena itu s 3 = 1. pada s3= 1,
diperoleh x*3= 1.
Kesimpulan adalah bahwa penyelesaian optimum dari problema ini adalah :
kepada team 1 dan team 3 perlu diperbantukan tenaga ahli masing-masing sebanyak 1
orang sedang kepada team 2 tidak perlu diperbantukan. Probabilitas kegagalan seluruh
team adalah 0.006.
Contoh 3.
Suatu perusahaan dalam waktu yang dekat merencanakan untuk
memperkenalkan suatu produk baru didalam suatu pasar. Oleh karena pasar yang akan
dimasuki oleh produk baru ini pasar yang bersaing, maka perusahaan membuat suatu
rencana tentang strategi pemasaran. Keputusan sudah diambil yaitu produk baru ini
akan diperkenalkan dalam 3 phase.
Phase 1 adalah dengan mengadakan perkenalann khusus yaitu menawarkan produk tadi
pada harga rendah agar pada perkenalan pertama dapat menarik para pembeli. Phase 2
adalah kampanye dengan membuat advertensi secara intensuf untuk “membujuk” para
pembeli tadi agar bersedia membeli produk baru itu secara terus menerus dengan harga
yang biasa. Diketahui, bahwa perusahaan yang lain juga sedang memperkenalkan
produk barunya yang juga sangat bersaing. Oleh karena itu strategi pada phase 3 adalah
melanjutkan kegiatan advertensi yang disertai dengan kampanye promosi untuk
mencegah para langganan beralih ke produk yang lain.
Suatu budget sebesar $5.000.000 telah disediakan untuk kampanye pemasaran
ini. Yang menjadi problema sekarang adalah mendapatkan cara yang terbaik untuk
mengalokasikan uang tersebut kepada ketiga phase tadi. Misalkan M adalah ‘market
share’ pada awal (diterangkan sebagai suatu per centage) yang diperoleh didalam phase
1, F2 adalah fraksi dari market share yang diperoleh dari phase 2 dan F 3 adalah fraksi
dari market share yang diperoleh pada phase 3. data dibawah ini memperlihatkan
hubungan antara besarnya market share yang diperoleh pada tiap phase apabila
sejumlah tertentu uang digunakan untuk kampanye.
Adalah :
M = 10x1 – x12
F2 = 0.40 + 0.10x2
F3 = 0.60 + 0.070x3
Bagaimanakah cara penyelesaian uang tersebut.
Penyelesaian
Didalam problema ini dibutuhkan pengambilan keputusan didalam 3 phase.
Oleh karena itu sebagai stage adalah phase dan state adalah besarnya uang yang dapat
dialokasikan pada tiap phase.
Diagram dari dynamic programming system dari problema ini adalah :
x1 x2 x3
s1=5 juta s2 s3
Phase 1 Phase 1 Phase 1 s4=0
P1 P2 P3
1 - stage
2 - stage
3 - stage
Fungsi tujuan adalah memaksimumkan (M) (F2) (F3).
(a). Bila phase 1 dianggap sebagai stage 1, phase 2 sebagai stage 2 dan phase 3 sebagai
stage 3 dan fn (sn, xn) adalah besarnya fungsi tujuan, maka :
f*3 (s3, x3) = F3. dan x*3 = s3 (lihat table)

x3
s3 Phase 3 s4 = 0
P3
s3 f*3(s3, x3) x*3

0 0.50 0
1 0.70 1
2 0.85 2
3 0.90 3
4 0.93 4
5 0.95 5
x2 x3
s2 Phase 2 s3 Phase 3 s4 = 0
p2 p3
f2 (s2, x2) = f2(x2). f*3(s2 – x2)

dan
f*2 (s2, x2) = Max [F2(x2). f*3(s2-x2)]
0< x2< 5
x2 f2(s2, x2) = F2(x2).f*2(s2) f*2(s2) x*2
0 1 2 3 4 5
s2
0 0.15 - - - - - 0.15 0
1 0.21 0.25 - - - - 0.25 1
2 0.25 0.35 0.35 - - - 0.35 1,2
3 0.27 0.425 0.49 0.40 - - 0.49 2
4 0.279 0.45 0.595 0.56 0.425 - 0.595 2
5 0.285 0.465 0.63 0.68 0.595 0.45 0.68 3
Problema 3 – stage
x1 x2 x3
s1 Phase 1 s2 Phase 2 s3 Phase 3 s4 = 0
p1 p2 p3
fn(s1, x1) = M (x1) + f*2(s2)
dan
f*n(s1, x1) = Max [M(x1) + f*2(s2)]
x1
x1 f1(s1, x1) = m(x1). f*2(s1-x1)

f*1 x*1
s1 0 1 2 3 4 5
5 0 5.95 7.35 7.70 6.75 4.50 7.70 3
Jadi penyelesaian optimum adalah :

Banyaknya uang yang dialokasikan
Phase ($ 1000.000)
Alternatif 1 Alternatif 2
1 3 3
2 1 2
3 1 0
Pada kedua alternatif ini, market share yang dapat diperoleh pada akhir dari phase 3
adalah 7.70 %
(b). Penyelesaian pada bagian (b) pada prinsipnya sama dengan penyelesaian pada
bagian (a). hanya saja perbedaannya adalah besarnya fraksi dari market share yang
dapat diperoleh dinyatakan sebagai fungsi dari decision variable xn.
Penyelesaian selengkapnya adalah :
Problema 1 – stage.
f3 (s3, x3) = 0.60 + 0.07x3
dan
f*3 (s3, x3) = 0.60 + 0.07x*3
s3 f*3(s3, x3) x*3
0<s<5 0.60 + 0.70 s3 s3
f2(s2, x2) = (0.40 + 0.10x2). f*3(s3, x3)
= (0.40 + 0.10x2).[0.60 + 0.07 s3]
Karena s3 = s2 – x2 maka
f2(s2, x2) = (0.40 + 0.10x2).[0.60 + 0.07 (s2 – x2)]
= 0.24 + 0.028 + 0.032 x2 + 0.007 s2x2 – 0.007 x22
Untuk mendapatkan harga f2 (s2, x2) yang maksimum maka :
f 2
= + 0.032 + 0.007 s2 – 0.014 x2 = 0
x 2
0.007 s 2  0.032
x2 =
0.014
= 0.5 s2 + 2.286
Karena x2 < s2 maka 0.5 s2 + 2.286 < s2 atau s2 > 4.572.
Dengan demikian : x2* = 2.286 + 0.5 s2, untuk 4.572 < s2 < 5
Harga x2* yang memenuhi syarat untuk 0 < s2 < 4.572 dicari sebagai berikut :
Pada 0 < s2 < 4.572 maka akan dipenuhi
2.286 + 0.5 s2 >s2……………………………………………………………(1)
Karena x2<s2 maka juga akan dipenuhi
2.286 + 0.5 s2 >x2……………………………………………………………(2)
dari (1) dan (2), diperoleh x2* = s2 pada 0 < s2 < 4.572
Jadi untuk 4.572 < s2 < 5 :
f2* (s2=, x2) = (0.24) + (0.028)s2 + (0.032) (2.286+0.5 s2) +(0.007)(2.286+0.5 s2)
(s2)-(0.007)(2.286+0.5 s2)2
= 0.277 + 0.044 s2 + 0.00175 s22
Dan untuk 0< s2 < 4.572 :
f*2(s2, x2) = (0.24)s2 + (0.032)s2 +0.007 s22 – 0.007 s22
= 0.24 + 0.06 s2.
Table dibawah ini adalah summeri dari perhitungan tersebut :

s2 f*2 (s2, x2) x*2
0< s2 < 4.572 0.24 + 0.06 s2 s2
4.572 < s2 < 5 (0.277)+(0.044)s2 + 0.00175 s22 2.286 + 0.5 s2
f1(s1, x1) = (10 x1 – x12). f*2(s2, x2)
= (10 x1 – x12). f*2(s1, x1)
(10x1 – x12)[0.24 + 0.06], untuk 4.572 < s2 < 5

atau f1(s1, x1) =
(10x1 – x12)[0.277 + 0.044 s2+0.00175 s22],
untuk 0 < x1 < 4.572
karena s2 = s1 – x1 dan s1 = 5 maka bila harga s2 bila disubsitisi dari persamaan diatas,
maka diperoleh :
(10x1 – x12)[0.24 + 0.06(5-x1)], untuk 4.28 < s2 < 5
f1(s1, x1) = (10x1 – x12)[0.277 + 0.044(5-x1)+0.00175 (5-x1)2],
untuk 0 < x1 < 4.28.
Harga x1* yang memberikan harga f1(s1, x1) yang maksimum akan diperoleh dari :

x 1
f1(s1, x1) = 0
Bila difrensial diatas diselesaikan maka diperoleh :

x1* = 3,15 dan f1*(s1, x1) = 7,57
Dari hubungan s2 = s1 – x1* diperoleh s2 = 5 – 3,15 = 1,85.
Karena x2* = s2, maka x2* = 1,85
Dengan demikian x1* = s2 – x2*
= 1,85 – 1,85
x1 = 0
Kesimpulan.
Phase Banyaknya uang yang dialokasikan
($ 1000.000)
1 3.15
2 1.85
3 0.00
Contoh 4.
Suatu jumlah positip yang besarnya D, akan dibagi menjadi 3 bagian.
Bagaimanakah caranya pembagian terasebut, agar jumlah kuadrat dari ketiga bagian itu
adalah minimum ?
Penyelesaian :
Karena jumlah positip tersebut harus dibagi menjadi 3 bagian, maka banyaknya
stage dalam problema ini adalah tiga yaitu bagian 1, bagian 2 dan bagian 3. Decision
variable (state) dari problema ada;ah besarnya tiap-tiap bagian.
Misalkan xn (n=1,2,3) adalah decision variable pada stage n. Diagram dari
dynamic programming system dari problema ini dapat digambarkan sebagai berikut :
x1 x2 x3
s1=D s2 s3
stage 1 stage 1 stage 1 s4=0
R1 R2 R3
1 - stage
2 - stage
3 - stage
Formulasi model matematika dari problema ini :
3
x
2
Max : 1
i 1
3
Fungsi pembatas :  xi  D
i 1
xi > 0 untuk i = 1, 2, 3
Penyelesaian dynamic programming adalah sebagai berikut :
Misalkan fn(sn) adalah hasil perkalian maximum yang dapat dicapai.
Pada problema 1 – stage ini, diasumsikan bahwa jumlah positip D dialokasikan
kapada satu stage saja yaitu stage 3 (lihat diagram). Oleh karena itu :
f*3(s3) = x32 …………………………………………………………………(1)
s3 = s2 – x2 …………………………………………………………………..(2)
Karena s4 = 0, maka x3* = s2 – x2 …………………………………………………..(3)
Dari (1) dan (3), diperoleh : f*3(s3) = (s2 – x2)2……………………………………..(4)
f2*(s2) = Min [x22 + f*3(s3)]
0< x2 < s2
Untuk mendapatkan f*2(s2), maka ruas kanan persamaan (5) didifrensialkan

terhadap x2 sebagai berikut :

x 2

x 22   s 2  x 2   0
2

atau 2 x 2  2 s 2  x 2   0
s2
x2 
2
s2
Untuk memeriksa apakah f 2  s 2  akan minimum pada x2 = maka :
2
2 2
 x2
2
 
x2   s2  x2   2  2
2
=4
2 s
Karena 2  0 maka f 2  s 2  akan minimum pada x 2  2
 x2 2
s2
Bila x 2  di substitusikan kedalam persamaan (5) maka :
2
 s 2  2  s2  
2
f  s 2       s 2   
2

 2   2  
 s 2  2  s 2  2 
=      
 2   2  
s2
= ………………………………………………………………………….
2
(6)Karena s1 = x1 + s2 maka s2 = s1 – x1 ……………………………………………….(7)
Dari persamaan (6) dan (7) diperoleh :
f 
 s2    s1  x1 
2
2
2

f1  s1   Min x12  f 2  s 2 
0 x1  s1

 2  s1  x1  2 
= Min  x1     ……………………………………………(8)
  2  
Dengan cara yang sama seperti pada problema 2 – stage, harga x 1 yang
memberikan f 1  s1  yang minimum diperoleh dari :
  2  s1  x1  
2
 x1    0
x 2   2  
 s1  x1 
atau : 2x1 - 2  0
 2 
s1
x1 
3
s1
Substitusikan harga x1 = kedalam persamaan (8), diperoleh
3
  s1  
2
 s 2  1
s   
 
f 1  s1    1    3  
 3   2  
   
   
 2  
2
 s 2  s1   s 2 2
=  91   32    91  9 s1
2
   
   
s12
=
3
D2 D
Karena s1 = D maka f1  s1   dan x1 
3 3
Menurut persamaan (7) = D2 = s1 – x1
= D – D/3
= 2/3 D
2
D
Maka :
x 2  3
2
D
x 2 
3
Dari persamaan (2), x3  s 2  x 2
2 1
=  D
3 3
D
x3 
3
D
Karena x 3  x 2  x1  , maka dapat disimpulkan bahwa agar jumlah kuadrat
3
dari ketiga bagian itu menjadi minimum maka jumlah D itu harus dibagi sama besar
pada setiap bagian.
Contoh 5
Selesaikan problema linier programming dibawah ini dengan menggunakan
metode dynamic programming.
Max : Z = 3x1 + 5x2

Fungsi pembatas : x1 <4
2x2 < 12
3x1 + 2x2 < 18
dan x1, x2 > 0
Disamping metode simplex, problema linier programming tersebut juga dapat

diselesaikan dengan menggunakan metode dynamic programming.
Dalam penyelesaian problema ini, ada dua level keputusan yang berurutan yang
harus dibuat yaitu keputusan pada level 1 dengan decision variable x1 dan keputusan
pada level 2 dengan denision variable x2.
Oleh karena ada 2 level keputusan, maka dalam problema ini level keputusan tersebut
dapat ditafsirkan sebagai stage. Apapula yang merupakan state ? Bila suatu keputusan
telah diambil pada stage 1, informasi apakah yang perlu sebelum keputusan dapat
diambil pada stage 2? Mungkin dapat dikatakan bahwa informasi yang dibutuhkan
adalah banyaknya slack yang terdapat didalam fungsi pembatas (selain dari fungsi
pembatas non negative).
Untuk jelasnya, masing-masing ruas kanan dari fungsi pembatas yaitu 4, 6 dan 18 dapat
diinterpretasikan sebagai banyaknya masing-masing resources 1, 2 dan 3 yang tersedia.
Kemudian state s adalah banyaknya sisa resources (belum digunakan) yang harus
dialokasikan.
Jadi : s = ( R1, R2, R3 )
Dimana Ri (I = 1, 2, 3) adalah banyaknya resources i yang akan dialokasikan. Diagram
dari dynamic programming system dari problema ini adalah :
x1 x2
R1, R2, R3 0
Stage 1 Stage 2
R1-x1
R2
g1 R3-3x1 g2
1- stage
2- stage
Bila Z diinterpretasikan sebagai keuntungan yang harus dimaksimumkan, maka f n (R1,

R2, R3, Xn) adalah total keuntungan maksimum yang diperoleh dari stage n bersama-
sama dengan stage-stage berikutnya pada state (R1, R2, R3) dan decision variable adalah
xn. dengan menggunakan notasi umum dari linier programming :
2
fn (R1, R2, R3, xn) = cn xn + max c

j  n 1
j xj
dan a
j n
ij x j  Ri , i  1,2,3
x j  0, j  1,2
Lebih lanjut, f n  R1 , R2 , R3   Max f n  R1 , R2 , R3 , X n  .............1

*
dimana harga maksimum ini diambil pada harga xn yang fersible.

Jadi :
f n  R1 , R2 , R3 , x n   c n x n  f n1  R1  a1n x n , R2  a 2 n x n , R3  a3n x n .... 2
Persaman ini dapat dijelaskan dengan diagram dibawah ini :

stage n stage n + 1
Cn xn
R1, R2, R3
R1-a1nxn,R2-a2nxn,R3-a3nxn
kontribusi
fn(R1,R2,R3)  f n1  R1  a1n xn , R2  a 2n xn  
Karena persamaan (1) dan persamaan (2) secara bersama-sama saling

berhubungan dan bersifat recursive untuk f 1 dan f 2 maka persiapan untuk
penyelesaian secara dynamic programming sekarang sudah lengkap yaitu :
f2 (R1,R2,R3,x2) = 5 x2
Harga-harga x2 yang feasible adalah harga-harga yang memenuhi fungsi pembatas :
2 x2 ≤ R1
2 x2 ≤ R3
x2 ≥ 0
Oleh karena itu ;
f 2  R1 , R2 , R3 , x 2   Max 5 x 2 
2 x2 ≤ R2
2 x2 ≤ R3
x2 ≤ 0
Penyelesaian pada 1 – stage ini adalah :
R1, R2, R3 f 2 ( R1 , R2 , R3 ) x 2
R2 R3  R R3 
Ri ≥ 0 5Min , Min  2 , 
2 2  2 2 
Problema 2- stage :
f1  R1 , R2 , R3 , x1   3 x1  f 2  R1  x1 , R2 , R3  3x1 
dimana harga x1 yang feasible adalah harga-harga yang memenuhi set dari fungsi
pembatas x1 ≤ R1, 3x1 ≤ R3 dan x1≥ 0.
Karena harga R1, R2 dan R3 adalah masing-masing 4, 12 dan 18, maka :

f1  4,12,18, x1   Max 3 x1  f 2  4  x1 ,12,18  3x1  
x1 ≤ 4
3x1 ≤ 18
x1 ≥ 0
 12 18  3 x1 
 Max 3 x1  5Min , 
 2 2 
0 ≤ X1 ≤ 4
Perlu diperhatikan bahwa :
 12 18  3 x1   6 , jika 0 x1  2
Min  ,    18  3 x1
 2 2   2 , jika 2 xi  6
Berdasarkan ini, maka :

12 18  3 x1   x1  30, jika 0 x1  2
3 x1  5 min  ,    390  9 x1
 2 2   2
, jika 2  x1  6
 90  9 x1
Karena Max [3x1 + 30] dan Max   akan mencapai harga maksimum pada
 2
0≤ x1 ≤ 2 2 ≤ x1≤ 6
x1= 2, maka x1  2 , seperti yang terlihat dibawah ini :
R1, R2, R3 f 1  R1, R2 , R3 , x1  x1
4, 12, 18 36 2
  18  3 2  
Dengan demikian : x 2  Min 6,   6
 2
Dan Z = 3x1 + 5x2
= 3 (2) + 5 (6)
= 36
BAGIAN III
GAME THEORY
1. Pendahuluan
Kehidupan manusia diwarnai dengan penuh konflik dan persaingan. Banyak
contoh-contoh persaingan yang sering dijumpai di dalam kehidupan sehari-hari yaitu
antara lain peraturan politik, operasi militer, persaingan pasar, perjudian dan lain-lain.
Persoalan persaingan tidaklah terbatas hanya antara dua pihak saja, akan tetapi dapat
meliputi banyak pihak. Keadaan terakhir yang diperoleh dalam persaingan antara pihak
itu sangat ditentukan oleh keputusan yang diambil oleh pihak-pihak yang bersaing
selama proses persaingan berlangsung. Didalam proses persaingan itu, masing-masing
selalu berusaha untuk memperoleh hasil yang optimum bagi dirinya. Oleh karena itu
setiap pihak akan memperhatikan keputusan-keputusan apa yang telah diambil oleh
saingannya, untuk dijadikan bahan pertimbangan baginya didalam melakukan
pembentukan dan pemilihan alternatif-alternatif tindakan yang harus diputuskannya.
Suatu hasil optimum bagi suatu pihak didalam persaingan akan terbentuk dengan
mengingat batas-batas yang ada yang berhubungan dengan kemungkinan-kemungkinan
dari berbagai pihak itu untuk bertindak. Untuk itu tiap pihak haruslah menggunakan
kecerdasan yang ada padanya agar dapat membawanya ke titik optimum yang
diharapkan.
Game theory adalah suatu teori matematik yang membahas secara abstrak
problema persaingan yang bersifat formal. Pembahasan utama dalam teori ini adalah
pada proses pengambilan keputusan oleh pihak-pihak yang bersaing. Didalam game
theory, pihak-pihak yang bersaing ini disebut pemain, dan kumpulan dari tindakan-
tindakan yang dapat diambil oleh setiap pemain selama proses persaingan berlangsung
disebut strategi. Dalam pembahasannya, teori ini membuat suatu asumsi bahwa setiap
pemain selalu memilih strateginya tanpa mengetahui lebih dahulu strategi apa yang
dipilih oleh lawannya atau dengan kata lain pemain memilih strategi masing-masing
dalam waktu yang bersamaan.
Suatu permainan dikatakan telah terjadi apabila seluruh pemain telah melakukan
tindakan masing-masing yang diputuskan secara serentak. Masing-masing pemain
mendapat suatu hasil (pay off), bila suatu permainan telah terjadi. Hasil ini dapat berupa
suatu pendapatan atau suatu kerugian ataupun seri (draw).
Sebagian besar penelitian yang telah dilakukan dalam bidang game theory adalah
tentang persaingan dua orang dengan jumlah nol (two-person zero-sum games). Sesuai
dengan namanya, persaingan ini hanya melibatkan dua pemain yang dapat berupa team,
perusahaan dan lain-lain yang sedang bersaing. Disebut jumlah nol, karena besarnya
hasil yang diperoleh pemain yang menang adalah sama dengan besarnya kerugian dari
pihak yang kalah, sehingga total dari besarnya kemenangan, kedua pemain ini adalah
nol.
2. Model Persaingan
Suatu permainan disebut persaingan apabila keadaan dari permainan tersebut
memiliki cirri-ciri berikut :
(a). Jumlah pemain adalah terbatas, hingga N
(b). Banyaknya macam tindakan yang dimiliki oleh setiap pemain adalah terbatas.
Macam tindakan yang diambil oleh satu pemain tidak perlu sama dengan macam
tindakan yang diambil oleh pemain lainnya.
©. Permainan telah terjadi apabila masing-masing pemain memilih satu tindakan dari
kumpulan tindakan-tindakan yang dapat diambilnya. Saat pengambilan tindakan
oleh setiap pemain adalah bersamaan, sehingga tidak ada pemain yang mengetahui
sebelumnya tindakan apa yang akan diambil oleh pemain lainnya.
(d). Hasil permainan (value of game) ditentukan oleh set dari tindakan-tindakan yang
diambil oleh para pemain. Tiap hasil permainan menyatakan suatu set dari
pembayaran-pembayaran (pay off) yang diterima oleh setiap pemain. Pay off ini
dapat berupa bilangan positif, negatif atau nol.
Pada bagian terdahulu sudah disebutkan bahwa sebagian besar dari penyelidikan
dalam bidang game theory ini adalah tentang permainan antara 2 pemain dengan jumlah
pembayaran sama dengan nol. Pembahasan yang dilakukan pada bagian ini juga
dibatasi pada model persaingan antara dua pemain dengan jumlah nol.
Didalam game theory, dikenal dua macam strategi yaitu strategi murni (pure
strategy) dan strategy campuran (mixed strategy).
(a). Strategi murni adalah suatu aturan keputusan yang telah tersusun sebelum semua
permainan berlangsung dengan selalu memilih satu macam saja tindakan. Dengan
perkataan lain, selama proses persaingan berlangsung setiap pemain hanya
menggunakan satu strategi saja walaupun masing-masing pihak mempunyai
sejumlah strategi.
(b). Strategi campuran adalah suatu aturan keputusan yang telah tersusun sebelum
semua permainan dimulai untuk memilih suatu tindakan untuk tiap kali permainan
terjadi, sesuai dengan distribusi kemungkinan tertentu. Dengan perkataan lain,
penggunaan suatu strategi tergantung dari suatu kemungkinan (probability) yang
dimiliki oleh strategi tersebut.
Suatu strategi murni dapat dinyatakan dengan suatu bilangan yang menunjukkan
tindakan yang dipilih. Suatu strategi camuran untuk seorang pemain yang mempunyai
m strategi dapat dinyatakan dengan set x, yang terdiri dari m buah bilangan yang tak
negatif yaitu x1, x2, x3……xm yang jumlahnya sama dengan satu. Disini xi (i = 1,
2…..m) menyatakan besarnya kemungkinan untuk menggunakan strategi i atau dalam
bentuk lain dapat ditulis :
x = ( x1, x2,………..xm )
dimana
xi ≥ 0, i = 1, 2………….. m
m
dan x
i 1
i 1
Dapat dilihat bahwa perbedaan dari strategi murni dengan strategi campuran
adalah bahwa pada strategi murni, salah satu harga xi besarnya sama dengan satu
(karena hanya satu strategi saja yang digunakan selama persaingan berlangsung) dan
yang lainnya sama dengan nol, sedangkan pada strategi campuran, seluruh strategi
digunakan sesuai dengan besarnya probabilitas penggunaan yang dimiliki oleh setiap
strategi. Jadi strategi murni adalah suatu bentuk khusus dari strategi campuran.
Setiap pemain didalam persaingan dengan strategi murni mempunyai satu strategi
yang mana memberikan hasil optimum kepadanya. Strategi yang demikian disebut
strategi optimum bagi pemain bersangkutan. Berbeda halnya dengan persaingan dengan
strategi murni ini, pada persaingan dengan strategi campuran, setiap pemain tidak
memiliki suatu strategi yang optimal. Oleh karena itu setiap strategi digunakan secara
berulang-ulang. Untuk menyatakan ukuran optimum dari strategi campuran ini
digunakan criteria maximin dan minimax. Arti dari maximin adalah sebagai berikut :
Seorang pemain membuat suatu daftar dari strategi-strategi yang dapat dipilihnya
dan kemudian meneliti hasil-hasil terburuk yang bisa terjadi kepadanya sebagai akibat
dari kombinasi strategi yang dapat diambil oleh lawannya. Dari hasil-hasil terburuk ini
pemain bersangkutan akan memilih strategi yang memberikan hasil yang terbaik
diantara hasil-hasil yang terburuk tadi.
Arti dari minimax adalah kebalikan dari maximin yaitu :
Pemain A dengan m
Strategi ( i = 1, 2
….m)
Seorang pemain meneliti kerugian-kerugian terburuk yang mungkin dideritanya.

Dari kerugian-kerugian terburuk ini dia memilih strategi yang memberikan kerugian
yang terkecil diantara kerugian-kerugian yang terburuk ini.
Suatu permainan dikatakan mempunyai memakai penyelesaian apabila set dari
strategi-strategi optimal untuk para pemain itu mempunyai sifat-sifat berikut :
- Bila para pemain pada mulanya memakai seluruh strateginya dan setelah beberapa kali
permainan terjadi dapat mengetahui strategi yang dipilih oleh lawannya, masing-masing
pemain merasa bahwa lebih baik untuk tetap bertahan pada strategi tertentu yang
memberikan keuntungan maksimum kepada pemain bersangkutan. Pada permainan
yang dapat diselesaikan ini, harga permainan bagi seorang pemain adalah sama
besarnya dengan keuntungan yang diharapkannya dari satu kali permainan apabila para
pemain tersebut menggunakan strategi optimumnya yang stabil.
3. Persaingan dua orang jumlah-nol

Suatu permainan dengan hanya dua pemain, dapat digambarkan dalam 2 bentuk
matrix. Baris-baris matrix menyatakan set dari tindakan-tindakan yang dapat diambil
oleh pemain A dan kolom-kolom matrix menyatakan set dari tindakan-tindakan yang
dapat diambil B.
Matrix bentuk pertama disebut matrix pembayaran untuk pemain A (A’s pay off
matrix). Dalam matrix ini harga dalam tiap set matrix menyatakan besarnya hasil yang
bisa diperoleh A atau merupakan pembayaran B kepada A pada setiap kali permainan
terjadi. Matrix bentuk kedua disebut matrix pembayaran untuk pemain B (B’s pay off
matrix). Harga dalam tiap set menyatakan pembayaran A kepada B pada setiap kali
permainan terjadi.
Dalam permainan ‘dua orang jumlah-nol’, harga-harga dalam set-set matrix
untuk B adalah negatif dari harga-harga dalam set-set matrix untuk A, dan kedua matrix
ini akan digambarkan sebagai berikut :
Pemain B dengan
n strategi (j = 1,2……n)
1 2 3 ……………. n
-a11 -a12 -a13 -a1n
-a21 -a22
-a31
Pemain A dengan
m Strategi ( i = 1,
2….m)
aij
-amn
(a). Matrix untuk A
Pemain B dengan
n strategi ( j = 1, 2 … n)
1 2 3
1 -a11 -a12 -a13 -a1n
-a21 -a22
2
-a31
3
-aij
-am1 -amn
(b). Matrix untuk B
Pada umumnya didalam setiap permainan hanya satu bentuk matrix saja yang
digunakan yaitu matrix untuk A, dengan pengertian bahwa matrix untuk B selalu akan
mengandung elemen-elemen yang harganya adalah negatif dari matrix A. oleh karena
itu untuk selanjutnya hanya matrix untuk A yang akan dibahas.
Didalam matrix untuk A set cij memperlihatkan besarnya kemungkinan pemain A
ataupun juga merupakan besarnya kekalahan A. jika A memilih strategi ke i dan B
memilih strategi ke j. problema yang selalu timbul adalah tentang cara untuk
mendapatkan :
(a). Strategi yang optimum untuk pemain A
(b). Strategi yang optimum untuk pemain B
©. Harga akhir dari permainan
Berikut ini akan dibahas metode pemecahan dari problema permainan dua orang
jumlah nol, untuk strategi murni dan strategi campuran.
4. Metode Pemecahan
Seperti yang sudah dijelaskan pada bagian 2, semua permainan dua orang jumlah
nol akan dapat diselesaikan apabila permainan tersebut mempunyai strategi optimal
yang stabil. Macam permainan yang paling mudah untuk diselesaikan adalah permainan
yang strategi optimal stabilnya adalah strategi-strategi murni.
Hal ini akan terjadi apabila matrix hasil mengandung titik pelana (saddle point).
Titik pelana adalah suatu elemen dari matrix yang merupakan elemen terkecil) dalam
baris matrix dan sekaligus merupakan elemen terbesar dalam kolomnya.
Dengan kata lain, titik pelana didefinisikan sebagai suatu elemen dari suatu matrix
hasil yang merupakan harga terbesar dari minima baris-baris sekaligus merupakan harga
terkecil dari maxima kolom-kolom.
Penyelesaian untuk permainan yang mempunyai strategi optimum stabil ini ialah
bahwa A harus menggunakan strategi murninya yang ditunjukkan oleh baris yang
memuat titik pelana dan B harus menggunakan strategi murninya yang ditunjukkan oleh
kolom yang memuat titik pelana tadi. Harga dari permainan untuk A adalah sama
dengan harga elemen titik pelana dan untuk B adalah sama dengan harga negatifnya.
4.1. Permainan dengan menggunakan strategi murni

Prosedur penyelesaian permainan dua orang jumlah-nol dengan menggunakan
strategi murni adalah :
Step 1 : Periksa, apakah ada strategi yang dominan terhadap strategi yang lain. Jika
dalam set strategi terdapat satu atau beberapa strategi yang didominasi
oleh strategi yang lain maka strategi yang didominasi tersebut diabaikan.
B
1 2 3 4
1 2 1 5 2
A 2 2 0 1 2 Strategi 2 didominasi oleh strategi 1 untuk A
3 4 3 6 2 Strategi 1 dan 3 didominasi oleh strategi 2 untuk
B
Dalam matrix hal tersebut terlihat bahwa strategi 1 untuk pemain A dominan
terhadap strategi 2 yang dimilikinya. Artinya, A akan selalu lebih baik menggunakan
strategi 1 dari pada strategi 2, karena strategi 1 ini akan memberikan hasil yang lebih
besar baginya tanpa memperhatikan strategi apa yang digunakan oleh B.
Disamping itu untuk pemain B, strategi 2 yang dimilikinya dominan terhadap
strategi 1 dan strategi 3. oleh karena itu B tidak perlu menggunakan kedua strategi ini.
Dengan demikian matrix hasil akan berubah menjadi :
B
1 2
A 1 1 2
3 3 2
Prinsip untuk mengeliminasi strategi yang didominasi :

(1). Baris : Eliminasi baris matrix jika setiap elemen dalam baris itu <= elemen-
elemen yang bersesuaian dalam baris yang lain.
(2). Kolom : Eliminasi kolom matrix jika setiap elemen dalam kolom itu >= elemen-
elemen yang bersesuaian dalam kolom yang lain.
Step 2 : Periksa apakah matrix hasil mempunyai titik pelana. Titik pelana adalah suatu
elemen didalam matrix hasil yang merupakan elemen maksimum diantara m
elemen baris yang minimum dan sekaligus merupakan elemen minimum
diantara n elemen kolom yang maksimum.
B
1 2 3
A 1 -3 -2 6 -3 Elemen baris yang minimum
2 2 1 2 1 Maksimum
3 5 -2 -4 -4
Elemen kolom 5 1 6
Yang maksimum
Minimum
Dalam contoh matrix hasil diatas terlihat bahwa titik pelana adalah 1 yang
merupakan hasil permainan apabila A menggunakan strategi 2 dan B
menggunakan strategi 2. Titik pelana ini diartikan sebagai hasil kemenangan
terkecil yang dapat diperoleh A dan juga merupakan kekalahan yang terkecil yang
dapat diderita oleh B (Principle of pessimism).
Pada umumnya para pemain menganut prinsip pesimistik yaitu :
A. : Memaksimumkan kemenangan minimum yang dapat diperolehnya
(Maximin principle)
B. : Meminimumkan kekalahan maksimum yang dapat dideritanya (minimax
principle).
Idea dibalik principle of pessimism ini adalah : setiap pemain menganggap hasil
yang terburuk akan terjadi kepada dirinya pada setiap kali dia mengambil suatu
tindakan. Usaha terbaik yang dapat dilakukannya adalah memilih strategi yang
akan memberikan hasil yang terbaik dari hasil yang terburuk tersebut.
Contoh 1
Dua orang politikus sedang mengadakan kampanye untuk mendapatkan suara
terbanyak didalam suatu pemilihan. Karena saat pemilihan tinggal 2 hari lagi maka
kedua politikus ini berusaha dengan keras untuk mengadakan kampanye yang effektif.
Sebagai daerah kampanye dipilih 2 buah kota yang diperkirakan kota kunci yang
disebut sebagai kota I dan kota II. Untuk menghindarkan pemborosan waktu perjalanan,
maka para politikus ini merencanakan perjalanan pada malam hari dan menghabiskan
waktu sepanjang hari untuk selama satu atau dua hari di salah satu kota. Karena
persiapan harus sudah dibuat sebelumnya, maka tidak ada seorangpun diantara mereka
mengetahui schedule kampanye lawannya sample waktu kampanye diakhiri.
Oleh karena itu setiap politikus memanyakan manager kampanye maisng-masing

dikota-kota tersebut tentang pengaruh terhadap banyaknya suara yang akan didapat
ataupun yang hilang apabila lawannya mengadakan kampanye selama 1 atau 2 hari
ditiap kota. Matrix hasil bagi A (harga-harga dalam set dinyatakan dalam ribuan),
diperlihatkan dibawah ini.
B
1 2 3
1 2 1 4
A 2 -2 0 1
3 -1 -2 0
Strategi 1 = Kampanye selama 1 hari ditiap kota

Strategi 2 = Kampanye selama 2 hari di kota I
Strategi 3 = Kampanye selama 2 hari di kota II
Para politikus ini ingin menggunakan informasi tersebut untuk memilih strategi
optimumnya didalam menggunakan waktu kampanye yang 2 hari itu.
Penyelesaian
Dengan melihat sesaat, dapat diketahui bahwa A harus menggunakan strategi 1
karena strategi ini mendominasi strategi 2 dan strategi 3 sebab strategi 1 ini akan
memberikan hasil sedikitnya sama dengan hasil yang diberikan oleh kedua strategi yang
lain tanpa memperhatikan strategi apa yang akan diambil oleh B. Demikian juga untuk
B dia tidak akan menggunakan strategi 3, karena dengan strategi ini dia akan menderita
kerugian yang lebih besar dibandingkan dengan kerugian apabila digunakannya kedua
strateginya yang lain.
Karena dua politikus ini dianggap selalu berpikir secara rational, maka B
memperkirakan bahwa A akan menggunakan strategi 1. Dengan demikian agar
kekalahan B minimum, maka dia akan menggunakan strategi 2. Sebagai hasilnya A
akan menerima kemenangan sebanyak 1000 suara dari B. Dengan demikian dikatakan
harga dari persaingan ini adalah 1000.
Note : Disini terlihat bahwa konsep dari dominasi strategi adalah sangat membantu
didalam mempermudah penyelesaian permainan ini.
Contoh 2
Andaikata matrix untuk A dalam contoh 1 adalah seperti yang ditunjukkan dibawah
ini, carilah strategi-strategi optimum untuk kedua politikus tersebut, serta besarnya hasil
dari permainan itu dengan asumsi bahwa keduanya menganut prinsip pesimistik.
1 2 3
-5 -4 6
A 2 0 1
4 -2 -4
Penyelesaian
Problema ini diselesaikan dengan menggunakan prosedur penyelesaian permainan
dua orang jumlah nol sebagai berikut :
Step 1 : Memeriksa strategi yang dominan.
Dalam matrix hasil diatas terlihat bahwa permainan tersebut tidak mempunyai
strategi-strategi yang mendominasi strategi yang lain. Oleh karena itu kedua
pemain secara nyata belum mengetahui strategi mana yang harus digunakan.
Step 2 : Memeriksa titik pelana.
Berdasarkan prinsip pesimistik, titik pelana dicari sebagai berikut :
B
1 2 3 Min
1 -5 -4 6 -5
A 2 2 0 1 0 Maximin
3 4 -2 -4 -4
Max 4 0 6
Minimax
Disini terlihat bahwa matrix hasil tersebut mempunyai titik pelana yang besarnya
nol yang merupakan hasil permainan apa bila A menggunakan strategi 2 dan B
menggunakan strategi 2.
4.2. Permainan dengan strategi campuran
Dalam uraian diatas sudah dijelaskan bahwa bila matrix hasil dari suatu permainan
mempunyai titik pelana, maka permainan tersebut dapat diselesaikan secara
optimum dengan menggunakan strategi murni. Tetapi suatu permainan tidak
selamanya mempunyai titik pelana. Sebagai contoh, perhatikanlah permainan dua
orang jumlah nol berikut :
B
1 2 3 4 Min
1 5 -10 9 8 -10
2 6 7 8 1 1
A 3 8 7 15 2 2 Maximin
4 3 4 -1 4 -1
Max 8 7 15 8
Minimax
Bertitik tolak dari prinsip maximin-minimax, diperoleh bahwa pada permainan
diatas harga dari maximin (=2) tidak sama dengan harga minimax (=7). Oleh karena itu,
diketahui bahwa permainan tersebut tidak mempunyai titik pelana dn strategi maximin-
minimax yang murni tidak akan memberikan penyelesaian yang optimum. Hal ini
adalah nyata karena setiap pemain masih dapat memperbaiki posisinya dengan memilih
strategi yang berbeda. Permaiann yang demikian dinamakan permainan yang tidak
stabil.
Jika suatu permainan tidak mempunyai titik pelana, maka permainan yang
demikian akan dapat diselesaikan secara optimum dengan menggunakan strategi
campuran. Dalam hal ini, setiap pemain menggunakan seluruh strategi yang dimilikinya
menurut distribusi probabilitas tertentu yang telah ditetapkan lebih dahulu.
Secara matematis, penggunaan strategi campuran ini dapat dijelaskan sebagai
berikut :
Misalkan : xi = probabilitas bahwa pemain A akan menggunakan strategi i, (i =
1, 2,….m)
yj = probabilitas bahwa pemain B akan menggunakan strategi j, (j
=1,2…n)
dimana m dan n adalah banyaknya strategi yang dimiliki oleh masing-masing
pemain A dan pemain B. Sebelum permainan dimulai pemain A akan menetapkan lebih
dahulu rencana permainannya dengan menentukan harga x1, x2……xm. Hal yang sama
juga akan dilakukan oleh B yaitu menentukan harga-harga y1, y2,….yn.
Karena harga x1, x2….xm dan y1, y2, ….yn ini adalah probabilitas yang masing-
masing berupa bilangan positif maka
m
0 ≤ x1 ≤ 1 dan x
i 1
i 1
m
0 ≤ y1 ≤ 1 dan y
i 1
i 1
Rencana penggunaan setiap strategi menurut probabilitas (x1, x2, …xm) dan (y1,
y2…yn) ini disebut strategi campuran.
Jika aij adalah merupakan harga set (i, j) dari matrix hasil suatu permainan, maka
xi dan yj akan diperlihatkan dalam matrix sebagai berikut :
B
y1 y2 y3 yn Min
x1 a11 a12 a13 …. ain
a2 a21 a22 a23 …. a2n
A : : : :
xm am1 am2 am3 …. amn
Max
Sama halnya dengan penyelesaian problema pada permainan dengan strategi
murni, pada problema strategi campuran, penyelesaian juga didasarkan kepada criteria
maximin-minimax. Perbedaannya adalah bahwa A memilih xi yang akan
memaksimumkan ekspektasi hasil yang terkecil didalam setiap kolom dan pemain B
memilih yi yang meminimumkan ekspektasi hasil yang terbesar didalam setiap baris
dari matrix hasil.
Secara matematis criteria maximin-minimax ini dapat diformulasikan sebagai
berikut :
m
(1). Pemain A memilih xi (xi ≥ 0,  xi  1 ), yang akan menghasilkan :
i 1
 m m m

Max Min   a ij i  i 2 i
x , a x .... ain xi   v A
 i 1 i 1 i 1 
Dimana v A adalah maximin dari ekspektasi hasil.
n
(2). Pemain B memilih Vi (0≤Vi ≤1,  Vi  1) yang menghasilkan :
i 1
 n n n 
Min Max  a ij y j ,  a 2 j y j ,.....,  a nj y j   V B
 j 1 j 1 j 1 
Dimana VB adalah minimax dari ekspektasi hasil.
(3). Seperti halnya didalam strategi murni, pada strategi campuran ini secara umum,
juga berlaku hubungan berikut :
Maximin dari ekspektasi hasil  minimax dari ekspektasi hasil, atau
V A  V  V B , dimana V adalah hasil dari permainan.
Bila X i dan X j adalah merupakan probabilitas dari penggunaan strategi i dan strategi
j yang menghasilkan penyelesaian optimum, maka hubungan diatas akan berubah
menjadi suatu kesamaan yaitu :

V A  V  VB
Dengan demikian, ekspektasi hasil yang optimum dari permainan tersebut adalah,
m n
V  a ij xi y j
i 1 j 1
Beberapa metoda penyelesaian untuk mencari harga optimum dari X i danY1 untuk
permainan dua orang jumlah nol antara lain adalah metoda penyelesaian secara grafik
metode sub-game dan metoda linear programming.
Metode grafik dan metode sub-game digunakan bilamana salah satu dari pemain
mempunyai hanya 2 strategi.Secara umum permainan yang demikian disebut metode
penyelesaian permainan (2 x n) atau (mx2). Metode linear programming digunakan
bilamana masing-masing pemain mempunyai strategi yang lebih banyak yang disebut
permainan ( m x n ). Khusus untuk hanya 2 strategi, maka penyelesaian dapat dilakukan
secara aljabar.
(5). Produser penyelesaian secara aljabar pada permainan ( 2 x 2 ).
Misalkan suatu matrix hasil bagi A pada permainan ( 2 x 2 ) adalah sebagai
berikut.
Misalkan pula bahwa pada matrix hasil ini tidak terdapat titik pelana.
a11 a12
Probabilitas bahwa A akan menggunakan strategi i adalah xi dan
a21 a22 probabilitas bahwa D akan menggunakan strategi j adalah vj. Problema
adalah mencari harga decision variable xi dan yi, dimana , 0 ≤ xi ≤ 1 dan
x
i 1
i  1 untuk i=1,2 dan  1 dan 0 ≤ yj ≤1, untuk j = 1,2, serta besarnya hasil dari
permainan tersebut. Bila V dinyatakan sebagai ekspektasi hasil dari permainan, menurut
hubungan maximin – minimax seperti yang telah di uraikan dimuka :
a11x1 + a21x2 ≤ v ≤a11y1 + a12y2
dan a12x1 + a22x2 ≤ v ≤ a21y1 + a22y2
x1 + x2 = 1
y1 + y2 = 1.
Pada hasil permainan yang optimum, hubungan berikut akan berlaku :
a). ekspektasi hasil untuk A.
a11x1 + a21x2 = a12x1 + a22x2 ……………………………………………….. (1)
dan x1 + x2 = 1 ……………………………………………….. (2)
Dari (1) dan (2), diperoleh :
x1 a 22  a 21
x2 a11  a12 …………………………………. (3)
=
(b) ekspektasi hasil untuk B.

a11v1 + a12v2 = a21v1 + a22v2 ……………………………………………….. (4)
v1 + v2 = 1 …………………………………………………………… (5)
dari (3) dan (4), diperoleh :
v1 a 22  a12
 ……………………………….. (6)
v 2 a11  a 21
Contoh 3:
Tentukanlah strategi optimum dari permainan yang mempunyai matrix hasil di bawah
ini:
V1 V2
X1
1 3
A
2 -1
X2
X1,X2 = probabilitas bahwa A akan menggunakan masing-masing strategi 1 dan

strategi 2
V1,V2 = probabilitas bahwa B akan menggunakan masing- masing startegi 1 dan
strategi 2
Penyelesaian :
Dengan melalui suatu pemeriksaan, dapat diketahui bahwa permainan tersebut tidak
mempunyai suatu strategi yang dominan dan juga dalam matrix hasil tidak terdapat titik
pelana. Oleh karena itu titik tersebut diselesaikan dengan metode strategi campuran.
Penyelesaian secara aljabar adalah sebagai berikut :
Dari persamaan (3) :
x1 a 22  a 21

x 2 a11  a12
( 1)  2
=
1 3
x1 3

x2 2
karena X1 = 1-X2 ( persamaan 2 ), maka diperoleh :

3 2
X1* = dan X2* =
5 5
dari persamaan (6)
v1 a 22  a12

v 2 a11  a 21
( 1)  3
=
1 2
=4
karena V1 = 1-V2 (persamaan 5), maka diperoleh :
4 1
V1 = dan V2 =
5 5
3 4 2 4
Hasil permainan yang optimum : V* = (1) ( ) ( ) + (2) ( ) ( ) +
5 5 5 5
3 1 2 1
(3) ( ) ( ) + (-1) ( ) ( )
5 5 5 5
34
=
25
penyelesaian secara aljabar ini dapat disederhanakan dengan suatu prosedur yaitu :
Step 1 : Kurangkan harga sel terkecil dalam setiap baris matrix dari harga sel
yang terbesar pada baris yang sama juga, juga hal yang sama dilakukan
pada kolom matrix
Step 2 : Pertukarkanlah tempat dari setiap pasang dari hasil pengurangan
tersebut.
Step 3: Tentukan strategi optimum dengan cara membagi masing-masing hasil
pengurangan dengan total dari setiap pasang hasil pengurangan
Contoh 4 :
Matrix hasil suatu permainan adalah seperti ditunjukkan dibawah ini :
B
V1 V2
X1
5 1 A A
X2
3 4
Carilah penyelesaian optimum dari permainan tersebut.

Penyelesaian :
Menurut prosedur penyelesaian diatas :
Step 1 : mengurangkan elemen baris/kolom terbesar dengan elemen baris/kolom yang

terkecil.
B
V1 V2
X1
5 1 A A
X2
3 4
5–3=2 4–1=3
Step 2 : mempertukarkan tempat hasil pengurangan.
B
V1 V2
X1
5 1 A A
X2
3 4
3 2
Step 3 : Strategi optimum

1 3
X1* = V1* =
5 5
dan
4 2
X2* = V2* =
5 5
6. Metode Grafik.
Penyelesaian dengan metode grafik hanya dapat digunakan dalam permainan yang
sedikitnya salah satu dari pemainnya mempunyai dua strategi. Perhatikanlah permainan
matrix hasil seperti dibawah ini :
V1 V2 B Vn
X1
A a11 a12 a1n
a21 a22 a2n

X2
Misalkan bahwa dalam permainan ini tidak terdapat titik palang. Karena A hanya
mempunyai 2 strategi yaitu ( X1, X2 ) dimana X2 = 1 – X1 ; X1 ≥ 0 dan X2 ≥ 0, maka dia
hanya perlu untuk mencari harga optimum dari X1. Ekspektasi hasil untuk pemain A
terhadap strategi murni pemain B adalah :
Strategi murni B ( V1,2 …. Vn ) Ekspektasi hasil A
( 1, 0, 0, … 0 ) a11X1 + a21X2 = (a11-a21)X1 + a21 ….
( 0, 1, 0, … 0 ) A12X1 + a22X2 = (a12-a22)X1+a22
. . . . .
. . . . .
. . . . .
. . . . .
( 0, 0, ….. , 1 ) a1nX1 + a2nX2 = (a1n- a2n) X1 + a2n
Terlihat bahwa masing-masing ekspektasi hasil A terhadap strategi murni B adalah

mempunyai hubungan yang linear dengan X1. menurut kriteria maximin minimax untuk
permainan dengan strategi campuran, pemain A harus memilih harga X1 yang akan
memaksimumkan ekspektasi hasil minimum untuknya. Untuk mendapatkan harga X 1
yang demikian, fungsi X1 tersebut dapat diplot pada suatu grafik yang sumbu tegaknya
dinyatakan sebagai ekspektasi hasil dan sumbu datarnya adalah X1. Karena 0 ≤ X1 ≤ 1,
maka dalam grafik, harga X1 dibatasi hanya sampai 1.
n
Ekspektasi -
hasil 1
12
+ V*
V
X1 = 0 X1 = 1
X1* 1
maximin
-
dalam contoh grafik diatas terlihat bahwa setiap garis fungsi diberi nomor sesuai dengan
strategi murni B. Harga V yang diberikan oleh garis fungsi yang bertanda garis tebal
adalah merupakan ekspektasi harga yang minimum untuk A pada setiap harga X1. Harga
maximum (=V*) dari ekspektasi harga minimum ini diperoleh pada titik tertinggi atau
perpotongan kedua garis fungsi ini. Titik ini disebut maksimum point dari ekspektasi
hasil untuk A. Harga X1 pada titik ini adalah optimum (=X1*). Selanjutnya harga V1
untuk B dapat diperoleh setelah V* diketahui. Berdasarkan definisi, ekspektasi dari
permainan ini adalah :
V* = Y1*   a11  a 21  x1 *  a 21  + Y2*   a12  a 22  x1 *  a 22 
+….. + V n 1 *   a1n 1   1  a 2 n 1  x1 *  a 2 n 1 
Y*n   a1n  a 2 n  x1  a 2 n 
Semua garis   a1 j  a 2 j  x1 *  a 2 j  , untuk j = 1,2 …….. n yang tidak melalui maximin
point harus mempunyai harga Yj* yang bersesuaian sama dengan nol, karena bila Y*>0,
maka setiap ,garis fungsi tersebut, pada X1= X1* akan memberikan ekspektasi hasil
selalu lebih besar dari maksimin ekspektasi hasil. Oleh karena maximin point di peroleh
dari perpotongan dari dua garis fungsi maka kecuali untuk harga Vj yang bersesuaian
dengan kedua garis fungsi ini seluruh Vj yang lainnya harus sama dengan nol. Dengan
demikian problema permainan (2xn) atau (mx2) berobah menjadi permainan (2x2).
Contoh 5:
Perhatikanlah permainan (2x4) berikut ini : B
X1
A V1 v2 v3 v4
X2 2 2 3 -1
4 3 2 6
Permainan ini tidak mempunyai strategi yang dominan dan titik palang. Ekspektasi hasil
untuk pemain A terhadap setiap strategi murni pemain B adalah sebagai berikut :
Strategi murni B ( V1, V2, V3, V4) Ekspektasi hasil A
1. ( 1, 0, 0, 0 ) 2X1 + 4 ( 1-X1 ) = -2X1 + 4
2. ( 0, 1, 0, 0 ) 2X1 + 3 ( 1-X1 ) = -X1 + 3
3. ( 0, 0, 1, 0 ) 3X1 + 2 ( 1-X1 ) = X1 + 2
4. ( 0, 0, 0, 1 ) -X1 + 6 (1-X1 ) = -7X1 + 6
Bila ke empat garis fungsi ini di plot maka diperoleh grafik sebagai berikut :
+6
4
+5 Maximin point
+4
V 1
+3 2
V* =
+2 3
+1
X1 = 0 X1 = 1
-1 X1 = X1
-2
-3
ekspektasi hasil dari permainan ini adalah :

V = V1 ( -2X1 + 4 ) + V2 (-X1 +3) + V3 (X1+2)+V4 (-7X1+6)
Ekspektasi hasil yang minimum diperoleh pada setiap titik pada garis fungsi yang
paling bawah ( diberi garis tebal ). Menurut kriteria maximin-minimax, pemain A harus
memberi harga X1 yang dapat memberikan harga terbesar dari ekspektasi hasil
minimum ini, jadi ,
V* = V = Max
0 x1 1
 min x1  2  ,   7 x1  6 
Oleh karena itu harga optimum dari X1 adalah pada titik potong dari kedua garis fungsi
( X1+2 ) dan ( -7X1+6 ). Atau ,
X1+2 = -7X1+6
8X1 = 4
X1 = ½
Maka X1* = ½ dan X2* = ½
Ekspektasi hasil untuk A adalah,
VA = -7 (½ ) + 6
=2½
yang juga merupakan hasil optimum dari permainan ( = V* )
Strategi yang optimum untuk pemain B dicari dengan cara berikut :

Pada penyelesaian yang optimum, ekspektasi hasil permainan adalah :
V* = 2 ½ = V1*( -2X1 + 4 ) + V2* (-X1 +3) + V3* (X1+2)+V4* (-7X1+6)
Karena harga V = 2 ½ diperoleh pada X 1= X1* = ½, maka bila harga X1 dari persamaan
diatas disubstitusi dengan X1* = ½ , akan di peroleh :
2 ½ = V1*( -1+4 ) + V2* (-½+3) + V3* (½+2)+V4* (-7/2+6)

2 ½ = 3V1* + 2 ½ V2* + 2½ V* + 2 ½ V4*
lebih lanjut, karena ( V1, V2, V3, dan V4 ) adalah distribusi probabilitas maka diketahui
bahwa,
V1* + V2* + V3* + V4* = 1.
Mode persamaan ini hanya benar apabila V1* = 0, karena pada V1* > 0, tidak ada harga
Vj* yang akan memenuhi atau dengan kata lai, ekspektasi hasil pada X 1= ½ akan selalu
lebih besar dari maximin point. Dengan demikian pemain B akan menggunakan hanya 3
strateginya sebagai strategi campuran yaitu Y2, Y3, Y4. Setiap dua garis yang mempunyai
tanda slopenya berlawanan adalah juga akan memberikan penyelesaian yang optimum.
Dengan demikian, maka ada tiga kombinasi strategi campuran untuk pemain B yaitu (
Y2, Y3 ), ( Y2, Y4 ), ( Y3, Y4 ). Masing masing kombinasi ini akan memberikan hasil yang
optimum yang sama besarnya.
Bila kombinasi yang pertama dipilih, maka V1* = 0 dan V4* = 0 dan V3* = 1- ½.
Ekspektasi hasil untuk B terhadap tiap strategi murni A adalah :
Strategi murni A ( X1, X2 ) Ekspektasi hasil B

( 1, 0 ) 2V2 + 3 (1 – V2 ) = -V2 + 3
( 0, 1 ) 3V2 + 2 (1 – V2 ) = V2 + 2
Mimimax point akan diperoleh pada V2 yang memenuhi persamaan :

-V2 + 3 = V2 + 2
V2 = ½
Dan V3 = 1 - ½
=½
Ekspektasi hasil dari permainan B adalah :
VB = -( ½ ) + 3
=2½
Karena VB = VA = V* maka jelas terbukti bahwa V1 * = 0; V2 * = ½, V3 * = ½, V4 * = 0
Adalah merupakan strategi yang optimum untuk B. Alternatif lain dari strategi
campuran untuk B akan diperoleh dengan cara yang sama terhadap kombinasi ( V 2, V4 )
atau ( V3, V4 ).
7. Metode Sub-Game :
Dasar pemilihan dalam penyelesaian permainan (2 x
n) atau (m x 2) menurut -6 -1 -4 metode Sub-game adalah
suatu tanggapan bahwa permainan tersebut terdiri
dari beberapa Sub-game (2 x 7 -2 -5 2). Pandanglah matrix hasil
permainan (2 x 3 ) dibawah ini :
V1 V2 V3
X1
A
X2
Permainan ini dapat dianggap terdiri dari 3 Sub-game (2 x 2) yaitu :
a) Sub-game I
B
V1 V2
X1 B hanya menggunakan strategi ( V1 , V2 ), dimana
-6 -1 V3 = 0
7 -2
A A
X2
b) Sub-game II
B
V1 V2
-6 -4 A V2 = 0
A
X2
7 -5
c) Sub-game III
B
V1 V2
-1 4 A V1= 0
A
X2
-2 -5
Pada masing-masing dari ketiga Sub-game tersebut, pemain B mempunyai satu strategi
yang tidak digunakan. Strategi optimum bagi pemain B adalah merupakan strategi yang
terbaik dari ketiga sub-game (2 x 2) tersebut. Sebelum sub-game (2 x 2) ini
diselesaikan, maka perlu di periksa titik pelana lebih dahulu.
Penyelesaian secara aljabar untuk ketiga sub-game ini adalah sebagai berikut :
a) Sub-game I 9 5
X1* = dan X2* =
14 14
B
1 13
V1* = ; V2* = dan V3* = 0.
V1 V2 14 14
X1 9  1   9   13   9 
-6 -1 A V =    6        1  
14 
A  14   14   14 
 1   5   13   5
7 -2 5 +   7        2   
 14   14   14   14 
15
=-
14
X2
b) Sub-game II. 12 10
X1* = dan X2* =
22 22
B
9 13
V1 V2 V1* = ; V2* = 0 dan V3* =
22 22
X1 12  9   12   13   12 
-6 -4 V =    6       4   
 22   22   22   22 
A X2
10  9   10   13   10 
7 -5 +   7        5   
 22   22   22   22 
1
=-
11
c) Sub-game III.
B
V1 V2
X1 Titik pelana = -1
4
-
-
Maka : X1* = 1 ; X2* = 0
A X2
1
-2 -5 V1* = 0 ; V2* = 1 dan V3* = 0
Dari ketiga penyelesaian sub-game (2 x 2) tersebut, terlihat bahwa sub-game I dengan
19
ekspektasi hasil untuk B sebesar - adalah yang terbaik di antara ketiganya. Oleh
14
karena itu B harus menggunakan strategi :
1 13
V1* = ; V2* = ; V3* = 0
14 14
Untuk mengoptimumkan ekspektasi hasil baginya, dan A harus menggunakan strategi
optimumnya yaitu :
9 15
X1* = dan X2* =
14 14
19
Ekspektasi hasil dari permainan tersebut adalah -
14
Pada penyelesaian permainan (2 x n) atau (m x 2) dengan menggunakan model sub-
game, terlihat bahwa pemain yang mempunyai strategi lebih dari dua mempunyai
kesempatan untuk memilih strategi optimum berdasarkan sub-game yang memberikan
hasil yang terbaik baginya. Yang perlu diperhatikan ialah pemain tersebut harus
memilih strategi campuran atas satu sub-game saja dan bukan menggunakan strategi
campuran dari seluruh sub-game yang ada.
Jika pemain B ( pemain yang mempunyai tiga strategi ) dalam contoh diatas
meggunakan strategi campuran dari ketiga sub-game tersebut, maka dia harus
menggunakan satu sub-game untuk satu keputusan. Misalkan proporsi penggunaan
strategi campuran untuk sub-game I, sub-game II dan sub-game III, masing-masing
adalah  1, 2, dan 3, dim ana :
3

i 1
1  1 dan 0   1  1, untuk i =1, 2 dan 3.
Ekspektasi hasil dari permainan untuk B akan menjadi :

 19   1
VB =  1      2      3   1
 14   11 
Dapat dilihat bahwa VB akan optimum hanya bila  2  0 dan  3  0 dan  1  1 . Ini
berarti bahwa B harus menggunakan strategi campuran menurut sub-game I saja.
8. Metode Linear Programming :

Metode linear programming digunakan untuk penyelesaian permainan ( mxn ).
Suatu problema permainan mudah diselasaikan apabila problema tersebut diubah
kedalam bentuk problema linear programming. Metode ini akan sangat berguna bila m
dan n berupa bilangan besar.
Menurut criteria maximin minimax, pemain A harus memilih strategi campuran yang
optimim sedemikian rupa, untuk memaximumkan ekspektasi hasil untuk nya yaitu :
 m
Max  Min  a ij x1 , untuk j = 1, 2 ………… a  

 i 1
m
Dimana x
i 1
1 1
dan X1  0, untuk I = 1, 2, …………. m

m
Misalkan bahwa: Min  a i 1
ij x1 untuk j = 1, 2, … n ) = VA
Sekarang, yang menjadi problema adalah :

Max ( VA )
m
Fungsi pembatas : a
i 1
ij x1  v A, untuk j = 1, 2 …….. , n
x
i 1
i 1
Xi  0, untuk i = 1, 2, ………………… , m
Problema tersebut adalah berupa problema linear programming. Formulasi dari

problema ini akan dapat di sederhanakan dengan cara membagi seluruh fungsi pembatas
yang banyaknya a + 1 dengan VA. Bila VA > 0 maka fungsi pembatas diatas akan
berubah menjadi :
m
xi
a
i 1
ij
vA
 1, untuk j = 1, 2, ………………… n
m
xi 1
v
i 1

vA
A
Bila VA < 0, maka tanda ketidaksamaan dalam fungsi pembatas ini harus dibuktikan.
xi 1
Misalkan  X i karena Max VA = Min , maka problema tersebut dapat dirubah
vA vA
menjadi minimasi yaitu :

1
Bila V  z A , maka problema linear programming untuk pemain A :
A
m
Min ZA = X i 1
i
m
Fungsi pembatas a
i 1
ij X1  1
dan Xi ≥ 0, untuk i = 1, 2, ………. n
linear programming ini adalah formulasi model ekspektasi hasil untuk A. Dengan cara
yang sama, formulasi linear programming dari permainan itu untuk B adalah sebagai
berikut : pemain B menganut system minimax maka ekspektasi hasil untuknya adalah :
 n
Min  Max  aijV j , untuk j = 1, 2 ………… n   = VB

 j 1
n
dimana V
i 1
1 1
dan Vj ≥ 0, untuk j = 1, 2, …………………. n
 n
misalkan pula bahwa Max   aijY j , j  1,2...n   vB
 j 1
maka problema adalah : Min ( VB )

m
fungsi pembatas a Y
i 1
ij j  VB , untuk i = 1, 2, …. m
Y
i 1
j 1
Yj ≥ 0 untuk j = 1, 2, ……… n
Bila seluruh fungsi pembatas dibagi dengan VB ( misalkan bahwa VB > 0 ), maka
diperoleh :
 1 
Max  
 VB 
n
Yi
Fungsi pembatas a
j 1
ij
VB
 1, untuk i = 1, 2, ……… n
n Yj 1
 j 1 VB

VB
yj 1
misalkan : = Yj dan = ZB
VB VB
maka problema linear programing untuk pemain B :

n
Max ZB = Y
i 1
j
Fungsi pembatas a Y
j 1
ij j  1, untuk i = 1, 2, ……n
Yj ≥ 0, untuk j = 1, 2, …... n
Untuk meyakinkan bahwa VA dan VB adalah positif, maka sebelum problema linear
programing diformulasikan, perlu ditambahkan bilangan positif k kepada setiap elemen
dari matrix hasil sedemikian rupa, sehingga setelah penambahan ini, seluruh elemen
matrix hasil tersebut menjadi positif. Hal ini jelas akan membuat harga V A dan VB lebih
besar dari yang sebenarnya yaitu :
V 'A = VA + k
V 'B = VB + k
Untuk mendapatkan harga VA dan VB sebenarnya, maka YA dan YB yang diperoleh dari
penyelesaian linear programming, dikurangi kembali dengan bilangan positif k
Dari kedua model linear programing diatas terlihat bahwa formulasi linear programing
untuk A dan B masing-masing tidak lain adalah primal dan dual linear programming.
Contoh 6:
Carilah penyelesaian optimum dari oermainan (3x3) dibawah ini :
1 2 3
1 3 -1 -3
2 -3 3 -1
A
-4 -3 3
3
Penyelesaian
1. pemeriksaan terhadap strategi yang dominan. Dengan membandingkan seluruh
kolom dan baris matrix, maka diketahui bahwa dalam permainan itu tidak
terdapat strategi yang dominant. Jadi permainan adalah (3x3)
2. pemeriksaan titik pelana
1 2 3
1 8 4 2
Baris minimum
2
A 2 8 4 -3
3 -
1 2 8 3 Maximin
-4
Kolom 3
maksimum
Karena 3 -1 -3 Maximin ≠ Minimax, maka permainan tidak

mempunyai titik pelana.
-3 3 -1
-4 -3 3
3. Formulasi linear programming

Untuk menyatukan bahwa VA dan VB ≥ 0, maka kepada setiap elemen matrix
hasil ditambahkan bilangan positif k = 5. matrix hasil yang baru akan menjadi
1 2 3
2
A
3
Minimax
3
:
Formulasi problema linear programming untuk B

Max : ZB = Y1 + Y2 + Y3
Fungsi pembatas : 8 Y1 + 4 Y2 + 2 Y3 ≤ 1
2 Y1 + 2 Y2 + 4 Y3 ≤ 1
1 Y1 + 2 Y2 + 8 Y3 ≤ 1
Y1, Y2, Y3 ≥ 0.
Dari kedua model linear programming ini, maka formulasi untuk B lebih mudah untuk
diselesaikan dibandingkan dengan formulasi untuk A. karena formulasi yang terakhir ini
diselesaikan dengan dual simplexmethod ataupun metode bilangan M besar.
Penyelesaian untuk formulasi B dengan metode simplex adalah sebagai berikut :
ZB – Y1 – Y2 – Y3 –DY4-Dy5-Dy6 = 0
8Y1 + 4Y2 + 2Y3 + Y4 =1
2Y1 + 8Y2 + 4Y3 +Y5 =1
Y1 + 2Y2 + 8Y3 + Y6 = 1
Table pertama:
Basic
ZB Y1 Y2 Y3 Y4 Y5 Y6 RHS
Variable
ZB 1 -1 -1 -1 0 0 0 0
Y3 0 8 4 2 1 0 0 1
Y4 0 2 8 4 0 1 0 1
Y5 0 1 2 8 0 0 1 1
Basic
Variable
4 6 1 1
ZB 1 0 0 0
8 8 8 8
4 2 1 1
Y3 0 1 0 0
8 8 8 8
Iterasi 1
28 2 6
Y4 0 0 7 1 0
8 8 8
12 62 1 7
Y5 0 0 0 1
8 8 8 8
Basic
Variable
5 11 1 45
ZB 1 0 0 0
49 196 14 196
1 1 1
Y3 0 1 0 0 - 0
7 14 14
3 31 1 11
Y4 0 0 1 0 -
98 196 14 196
1 3 1 5
Y5 0 0 0 1
98 98 7 49
Dari table terakhir ini dapat dilihat bahwa:

1 11 5
Y1* = ; Y2* = dan Y3* =
14 196 49
45
Dan ZB =
196
yj 1
Karena Yj* = VB , (untuk j=1, 2, 3) dan ZB = VB maka
1
y1* = Y1* .
ZB
 1  196 
=  
 14  45 
14
=
45
1
y2* = Y2* .
ZB
 11  196 
=  
 196  45 
11
=
45
1
y3* = Y3* .
ZB
 5  196 
=  
 49  45 
20
=
45
karena formulasi linear programming untuk A dan B mempunyai hubungan prima dan
dual maka dari table diatas dapat dilihat :
5 11 1
X1* = ; X2* = dan X3* =
49 196 14
45
Dan ZA = ZB =
196
1
x1* = X1*.
ZA
 5  196 
=  
 49  45 
11
=
45
1
x2* = X2* .
ZA
 11  196 
=  
 196  45 
11
=
45
1
x3* = X3* .
ZA
 1  196 
=  
 14  45 
14
=
45
ekspektasi hasil optimum dari permainan ( = V*)
 1 
V* = VA = VB* =   5
 ZB 
196
= 5
45
29
=-
45

Dynamic Prog - Game Theory

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Dynamic Prog - Game Theory

Diunggah oleh

Hak Cipta:

Format Tersedia

BAGIAN II

Sebagai dasar di dalam pengambilan keputusan pada setiap stage adalah

Stage Dari Ke Biaya

s1 s2 sn s n+1 s n+1 sN s N+1

dimana: Xn = decision variabel pada stage n

s1 s2 sn s n+1 s n+1 sN s N+1

Misalkan decision variabel xn ( n = 1, 2…. N ) adalah state yang terpilih pada

Hasil dari problema 4-stage memperlihatkan bahwa salesman pertama-tama

route yang optimum adalah 1  3  5  8  10. Apabila dipilih x1* = 4, akan

Jumlah Besar keuntungan yang diharapkan pada:

Berapa keranjangkah buah strawberry yang harus dialokasikan kepada setiap

Jumlah keranjang strawberry yaitu sebanyak 6 keranjang dinyatakan sebagai s1

xn (n = 1, 2, 3, 4) = decision variable pada stage n

Dan xi adalah bilangan bulat yang positip.

Karena fn*(sn) = Max  f n (s n , x n )

x3 f3 (s3, x3) = P3(x3) + f*4(s3 – x3)

x2 f2 (s2, x2) = P2(x2) + f*3(s2 – x2)

Hasil perhitungan pada problema 4 – stage memperlihatkan bahwa sipedagang harus

s1=2 Team 1 s2 Team 2 s3 Team 3

dan xi adalah bilangan integer yang positip.

xi adalah bilangan integer positip.

Untuk n = 3, (problema 1 – stage) :

f*3 (s3, x3) = F3. dan x*3 = s3 (lihat table)

s3 f*3(s3, x3) x*3

f2 (s2, x2) = f2(x2). f*3(s2 – x2)

x1 f1(s1, x1) = m(x1). f*2(s1-x1)

Jadi penyelesaian optimum adalah :

Table dibawah ini adalah summeri dari perhitungan tersebut :

(10x1 – x12)[0.24 + 0.06], untuk 4.572 < s2 < 5

untuk 0 < x1 < 4.572

Bila difrensial diatas diselesaikan maka diperoleh :

Penyelesaian dynamic programming adalah sebagai berikut :

Misalkan fn(sn) adalah hasil perkalian maximum yang dapat dicapai.

Dari (1) dan (3), diperoleh : f*3(s3) = (s2 – x2)2……………………………………..(4)

f2*(s2) = Min [x22 + f*3(s3)]

Untuk mendapatkan f*2(s2), maka ruas kanan persamaan (5) didifrensialkan

memberikan f 1  s1  yang minimum diperoleh dari :

Max : Z = 3x1 + 5x2

Disamping metode simplex, problema linier programming tersebut juga dapat

Bila Z diinterpretasikan sebagai keuntungan yang harus dimaksimumkan, maka f n (R1,

fn (R1, R2, R3, xn) = cn xn + max c

Lebih lanjut, f n  R1 , R2 , R3   Max f n  R1 , R2 , R3 , X n  .............1

dimana harga maksimum ini diambil pada harga xn yang fersible.

Persaman ini dapat dijelaskan dengan diagram dibawah ini :

Karena persamaan (1) dan persamaan (2) secara bersama-sama saling

Berdasarkan ini, maka :

R1, R2, R3 f 1  R1, R2 , R3 , x1  x1

Seorang pemain meneliti kerugian-kerugian terburuk yang mungkin dideritanya.

3. Persaingan dua orang jumlah-nol

(a). Matrix untuk A

(b). Matrix untuk B

4.1. Permainan dengan menggunakan strategi murni

Prinsip untuk mengeliminasi strategi yang didominasi :

Oleh karena itu setiap politikus memanyakan manager kampanye maisng-masing

Strategi 1 = Kampanye selama 1 hari ditiap kota

menjadi suatu kesamaan yaitu :

(b) ekspektasi hasil untuk B.

dari (3) dan (4), diperoleh :

X1,X2 = probabilitas bahwa A akan menggunakan masing-masing strategi 1 dan

karena X1 = 1-X2 ( persamaan 2 ), maka diperoleh :

Carilah penyelesaian optimum dari permainan tersebut.

Step 1 : mengurangkan elemen baris/kolom terbesar dengan elemen baris/kolom yang

Step 3 : Strategi optimum

f3 (s3, x3) = F3. dan x3 = s3 (lihat table)

s3 f3(s3, x3) x3

f2(s2) = Min [x22 + f3(s3)]

2 ½ = V1( -1+4 ) + V2 (-½+3) + V3* (½+2)+V4* (-7/2+6)