Anda di halaman 1dari 13

BAB 5

TEORI PERMAINAN

1. Perumusan permainan dua-orang jumlah-nol


Untuk memberikan gambaran tentang karakteristik dasar permainan dua-orang
jumlah-nol, permainan yang diberi nama “ganjil dan genap”. Dalam permaianan ini kedua
pemain diharuskan menunjukkan satu atau dua jari secara bersamaan. Jika jumlah jari yang
ditunjukkan kedua pemain sama, maka jumlah jari keua pemain genap. Dalam hal ini pemain
I dianggap memenangkan taruhan.
Misalkan pemain II harus membayar 1 juta kepada pemain I. jika jumlah jari yang
ditunjukkan kedua pemain tidak sama, dalam hal ini jumlahnya ganjil, maka pemain kedua
mendapat keuntungan 1 juta dari pemain I. Jadi setiap pemain mempunyai 2 strategi yaitu
menunjukkan 1 jari atau dua jari. Hasil penjumlahan ditunjukkan pada Tabel 1-1.

Tabel 1-1 Tabel Payoff untuk permainan ganjil genap


II
1 2
1 1 -1
I
2 -1 1

Dari tabel, pemain I di katakan menang jika jumlah jari sama yang berarti jumlahnya genap,
jika berbeda maka kalah.
Secara umum permainan yang dilakukan kedua orang ditentukan oleh;
1. Strategi pemain I
2. Strategi pemain II
3. Tabel hasil
Sebelum permainan dimulai, setiap pemain harus mengetahui strategi yang berlaku
dan tabel ‘payoff’. Dalam permainan yang sesungguhnya pemain secara bersamaan memilih
strategi tanpa mengetahui strategi yang dipilih lawan mainnya.
Strategi mungkin hanya melibatkan tindakan yang sederhana seperti menunjukkan
jari pada pemain ganjil dan genap. Tetapi permainan yang lebih rumit, yang melibatkan
sejumlah tindakan, strategi merupakan aturan yang telah ditetapkan sebelumnya yang
memberikan ciri secara lengkap tentang respons yang mungkin dari setiap tahap permainan.
Sebagai contoh, strategi untuk pemain catur menunjukkan bagaimana melakukan langkah
selanjutnya unuk setiap posisi yang mungkin sangat besar. Penerapan teori permainan
biasanya melibatkan situai kompetisi yang lebih ringan jika dibandingkan dengan permainan
catur, tetapi stategi yang terlibat bias lebih kompleks.
Tabel payoff menunjukkan keuntungan (positif) bagi pemain I yang merupakan hasil
dari setiap kombinasi stategi kedua pemain. Tabel ini hanya untuk pemain I, sedang tabel
hasil untuk pemain II adalah negatif dari tabel pemain I sesuai dengan sifat jumlah-nol dari
pemain ini.
Nilai pada tabel ‘payoff’ dapat berupa satuan sesuai yang diinginkan, misalnya
dalam jutaan rupiah, asalkan mewakili secara akurat utilitas bagi pemain I sesuai dengan hasil
permainan. Tetapi utilitas tidak perlu sebanding dengan jumlah uang atau komoditi lainnya
dalam jumlah besar. Sebagai contoh, 2 juta rupiah mungkin berniali lebih sedikit bagi si kaya
jika dibanding dengan 1 juta rupiah bagi si miskin. Dengan kata lain, jika diberikan pilihan
antara (1) 50% peluang untuk menerima 2 juta rupiah atau tidak menerima apa-apa dan (2)
100% pasti mendapat 1 juta rupiah, maka orang mungkin lebih memilih (2). Sebaliknya, hasil
yang diperoleh dari 2 dalam Tabel 1-1, haruslah bernilai 2 kali lebih banyak bagi pemain I

61
Dwijanto, Riset Operasi halaman 62

jika dibandingkan dengan hasil yang diperoleh dari 1. Jadi jika diberikan pilihan maka
haruslah tidak dapat dibedakan antara peluang 50% menerima hasil yang pertama dan pasti
menerima hasil yang terakhir.
Tujuan utama dari teori permainan adalah membangun kriteria yang rasional untuk memilih
strategi. Ada 2 asumsi yang digunakan, yaitu:
1. Kedua pemain rasional.
2. Kedua pemain memilih strategi hanya untuk kepentingannya.

2. Menyelesaikan permainan sederhana


Dua politisi bersaing untuk memperebutkan kursi Bupati untuk kota X. Rencana
kampanye harus disusun untuk dua hari terakhir yang diperkirakan akan berat karena
persaingan begitu ketat. Oleh sebab itu kedua politisi ingin melakukan kampanye pada dua
hari terakhir ini pada 2 tempat utama yaitu T1 dan T2. Untuk menghindari kampanye yang
sia-sia, mereka merencanakan melakukan perjalanan pada malam hari dan menghabiskan
sehari penuh di setiap tempat atau dua hari penuh di salah satu kota. Tetapi rencana ini harus
mempertimbangkan dampaknya (menang atau kalah suara) dari semua kemungkinan
kombinasi yang mungkin dalam melakukan kampanye di tempat tersebut. Politisi itu
berharap dapat menggunakan informasi ini untuk memilih strategi terbaik untuk kedua hari
terakhir tersebut.
Untuk merumuskan masalah ini menjadi permainan dua-orang jumlah-nol, kita harus
mengidentifikasikan kedua pemain (yaitu kedua politisi), strategi untuk setiap pemain dan
tabel payoff.
Setiap pemain mempunyai 3 strategi, yaitu:
Strategi 1= melakukan kampanye 1 hari di setiap tempat.
Strategi 2= melakukan kampanye 2 hari di T1.
Strategi 3= melakukan kampanye 2 hari di T2.
Strategi akan lebih rumit jika setiap politisi akan mengetahui tempat lawan
politiknya akan melakukan kampanye pada hari pertama, sebelum ia membuat rencana untuk
hari kedua. Dalam hal ini strateginya adalah: hari pertama kampanye di T1; jika lawan di hari
pertama di T2, maka hari kedua di T2. Jadi akan terdapat 8 strategi, 1 untuk setiap kombinasi
dari; 2 pilihan hari pertama; 2 pilihan lawan untuk hari pertama; dan 2 pilihan hari kedua.
Setiap nilai pada tabel ‘payoff’ untuk pemain I mewakili utilitas. Untuk pemain I
(atau negatif utilitas untuk pemain II) sesuai dengan hasil diperoleh dari strategi yang
digunakan kedua pemain. Dari sudut politisi tujuannya adalh memenangkan suara dan untuk
setiap tambahan suara (sebelum mengetahui hasil pemilihan) bernilai sama. Karenanya, nilai
yang sesuai tabel ‘payoff’ adalah total suara yang diperoleh dari lawan (yaitu jumlah
perubahan suara bersih di dua tempat) dalam 2 hari terakhir kampanye. Perumusan ini
disimpulkan dalam Tabel 2-1.
Tabel 2-1 perumusan tabel payoff untuk masalah kampanye politik
Jumlah pemilih yang
Strategi dimenangkan oleh politisi I
(dalam 1000 pemilih)
Strategi Politisi II
1 2 3
1
Politisi I 2
3
Dwijanto, Riset Operasi halaman 63

Meskipun demikian, tabel ini tidak akan sesuai , jika informasi tambahan tersedia
bagi politisi tersebut. Misalkan jika ia mengetahui secara pasti rencana pemilih. Dalam hal ini
tabel 2-1 akan menunjukkan politisi mana yang akan memenangkan pemilihan dengan setiap
kombinasi strategi. Karena tujuan utama adalah memenangkan pemilihan, maka nila pada
tabel adalah suatu bilangan positif bila politisi I menang dan negative jika kalah. Jika peluang
untuk menang pada setiap kombinasi strategi diketahui, maka nilai yang sesuai adalah
peluang untuk menang dikurangi peluang kalah, karena biasanya data yang diperlukan untuk
mengetahui peluang tersebut tiddak tersedia.
Dengan menggunakan format tabel 2-1 diberikan 3 alternatif gugus data untuk
memberikan gambaran bagaimana menyelesaikan 3 jenis permainan.
Variasi 1: Tabel nilai untuk kedua politisi ditunjukan oleh Tabel 2-2. Strategi mana yang
harus dipilih oleh mereka?
Tabel 2-2
II
1 2 3
1 1 2 4
I 2 1 0 5
3 0 1 -1

Jika situasinya seperti tabel di atas maka ini disebut situasi khusus, dimana
penyelesaian diperoleh dengan hanya menerapkan konsep strategi domain untuk
mengesampingkan strategi yang lemah sehingga tinggal 1 pilihan yang tersisa. Suatu strategi
dieliminasi jika didominasi strategi yang lain, misalkan jika terdapat strategi lain yang selalu
paling sedikit sebaik strategi lawan.
Untuk pemain I, strategi 3 didominasi oleh strategi 1 karena strategi 1 mempunyai
nilai yang lebih besar untuk (1 ≥ 0, 2 ≥ 1, 4 ≥ -1) setiap strategi yang di pilih pemain II.
Hilangkan srategi 3 dai pertimbangan selanjutnya, sehingga diperoleh tabel nilai yang telah
disederhanakan.
1 2 3
1 1 2 4
2 1 0 5

Karena kedua pemain diasumsikan rasional maka pemain II juga dapat mengambil
kesimpulan bahwa hanya strategi 1 dan 2 yang masih dipertimbangkan pemain I. Sekarang
pemain II memiliki 3 strategi yang didominasi strategi 1 dan 2 (strategi I: 1≤ 4, 1≤ 5,;
strategi II: 2 ≤ 4, 0 ≤ 5), eliminasi strategi 3 diperoleh:
1 2
1 1 2
2 1 0

Pada tahap ini, strategi 2 untuk pemain I didominasi oleh strategi (karena 1≤1, 0 ≤ 2).
Hilangkan strategi 2, didapat:
1 2
1 1 2

Strategi 2 untuk pemain II didominasi oleh strategi (1≤ 2). Akibatnya, kedua pemain
harus memilih strategi 1. Pemain I akan menerima ‘payoff’ 1 dari pemain II (politisi I akan
mendapat keuntungan 1000 suara dari politisi II).
Dwijanto, Riset Operasi halaman 64

Secara umum, nilai yang diperoleh pemain I bila kedua pemain bermain secara
optimal, disebut nilai dari permainan. Permainan yang mempunyai nilai ‘payoff’ nol disebut
permainan seimbang (fair games). Karena permainan khusus ini mempunyai nilai 1, maka
permainan ini bukan permainan seimbang.
Konsep strategi dominan sangat berguna untuk mereduksi ukuran tabel ‘payoff’
yang harus dipertimbangkan dan pada kasus kasus khusus seperti ini dapat mengidentifikasi
penyelesaian optimal dari permainan. Meskipun demikian sebagian besar permainan
membutuhkan pendekatan yang lain untuk mencari penyelesainnya seperti contoh 2.
Variasi 2: Misalkan dari data tabel ‘payoff’ 2-3 diperoleh tabel ‘payoff’ 2-4. Permaianan ini
tidak memiliki strategi dominan, jadi belum jelas apa yang harus dilakukan pemain. Apa
alasannya sehingga teori permainan harus diterapkan?

Tabel 2-3 payoff variasi 2 dari masalah kampanye politik


II
1 2 3
1 -3 -2 6
I 2 2 0 2
3 5 -2 -4

Pertimbangan pemian I. Dengan memilih strategi 1, ia dapat memenangkan 6 atau


paling banyak kehilangan 3. Tetapi, karena pemain II rasional, maka ia akan melindungi
dirinya dari membayar ‘payoff’ yang cukup besar. Jadi terlihat bahwa memilih strategi 1
dapat mengakibatkan kerugian bagi pemain 1. Sama halnya bila memilih strategi 3, pemain I
dapat memenangkan 5, tapi lebih mungkin kehilangan paling banyak 4. Jika pemain I
memilih strategi 2, ia dijamin tidak akan kehilangan apapun, bahkan mungkin memenagkan
sesuatu. Oleh karena itu memilih strategi 2 adlah tindakan paling rasional dari pemain I
dalam menghadapi pemain II.
Pertimbanagan pemain II. Ia dapat kehilangan 5 atau 6 jika menggunakan strategi 1
atau 3, tetapi ia dijamin tidak akan kehilangan apapun jika menggunakan strategi 2.
Karenanya dengan menggunakan penalaran yang sama, pilihan yang paling tepat bagi
pemain II adalah strategi 2
Tabel 2-4 ‘payoff variasi 2 dari masalah kampanye politik.

II
1 2 3 minimum
1 -3 -2 6 -3
I 2 2 0 2 0 ← nilai maksimin
3 5 -2 -4 -4
maksimum 5 0 6

nilai minimaks

Jika kedua pemain memilih strategi 2, maka hasil keduanya adalah impas. Dari
kasus ini diperoleh suatu kriteria pemilihan strategi yaitu setiap pemain harus bermain
sedemikian rupa sehingga meminimumkan kehilangan maksimum. Ini disebut kriteria
minimaks yang merupakan kriteria standart di dalam teori permainan. Jika dilihat dari tabel
‘payoff’ ,kriteria ini mengakibatkan pemain I harus memilih strategi sehingga harus minimum
‘payoff’nya terbesar, sedangkan pemain II harus memilih strategi sehingga maksimum
Dwijanto, Riset Operasi halaman 65

‘payoff’nya terhadap pemain I terkecil. Kriteria ini digambarkan pada tabel 2-4, dimana
strategi 2 ditulis sebagai maksimin strategi untuk pemain I dan strategi 2 ditulis sebagai
“minimaks” satrategi untuk pemain II. Hasil permainan adalah 0, jadi ini adalah permainan
seimbang. Posisi dari nilai itu disebut titik sadel.
Kenyataan bahwa permaian ini mempunyai titik sadel mengakibatkan kesulitan
dalam menentukan bagaimana permaian ini harus dimainkan. Karena titik sadel ini kedua
pemain tidak dapat menarik keuntungan dari pihak lawan untuk meningkatkan posisinya.
Contohnya bila pemain II memperkirakan pemain I akan menggunakan strategi 2, maka
pemain II hanya akan menambah kerugiannya jika ia menggunakan strategi 2. Sama halnya
dengan pemain , mengganti strategi hanya akan memperburuk posisinya. Jadi kedua pemain
tidak mempunyai motif untuk mengubah strategi, mengambil keuntungan dari lawan ataupun
mencegah lawan untuk mengambil keuntungan darinya. Dengan demikian, karena ini
merupakan penyelesaian yang stabil, pemain I dan II harus menggunakan strategi maksimin
dan minimaks secara terpisah.
Variasi berikutnya memberikan gambaran jenis permainan yang tidak mempunyai
titik sadel. Pada kasus ini diperlukan analisa yang lebih rumit.
Variasi 3: Perkembangan hasil kampanye untuk kedua politisi diberikan oleh tabel ‘payoff’ 2-
5. Bagaimana permainan ini harus dimainkan?
Tabel 2-5
II
1 2 3
1 0 -2 2
I 2 5 4 -3
3 2 3 -4

Andaikan kedua pemain akan menerapkan kriteia minimaks seperti variasi 2. Pemain
I dapatmenjamin bahwa ia tidak akan kehilangan lebih dari 2 bila memilih strategi 1. Pemain
II juga menjamin bahwa ia tidak akan rugi lebih dari 2 jika memakai strategi 3. Maksimin
dan minimaks tidak berhimpit. Jadi tidak ada titik sadel.
Perhatikan bahwa tidak ada titik sadel. Apa akibatnya jika kedua pemain memilih
strategi di atas. Dapat dilihat bahwa pemain I akan menang 2 dari pemain II. Karena pemain
II rasional, maka ia akan memilih strategi yang memberikan kemenangan 2, dibandingkan
kehilangan 2 jika memilih strategi 3. Karena pemain I juga rasional maka ia sudah
mengantisipasi perubahan ini dengan mengubah strategi menjadi strategi 2 (-2 ke 4).
Menyadari hal ini pemain II akan mengubah strategi kembali ke strategi 3 untuk menghindari
kerugian 4 dan memenangkan 3. Perubahan ini akan menyebabkan pemain I untuk kembali
mempertimbangkan memilih strategi 1, sehingga siklus yang sama akan berulang kembali.
Singkatnya, penyelesaian awal (pemain I memilih strategi 1 dan pemain II memilih
strategi 3) adalah penyelesaian tidak stabil, sehingga perlu dikembangkan penyelesaian
yang memuaskan.
Kuncinya adalah bila strategi seorang pemain dapat diperkirakan, maka lawan dapat
menarik keuntungan yang cukup besar untuk meningkatkan posisinya. Karena hal hal yang
paling mendasar dari rencana rasional untuk memainkan sebuah permainan seperti ini adalah
kedua pemain tidak dapat mengetahui strategi mana yang akan digunakan pihak lawan.
Daripada menggunakan criteria yang telah diketahui untuk memilih satu strategi yang
dapatditerima berasarkan pertimbangan tertentu. Dengan melakuakan hal ini, kedua pemain
tidak tahu strategi yang digunakan. Sampai lawan memilih strategi.
Dwijanto, Riset Operasi halaman 66

Tabel 2-6 ‘payoff’ variasi 3 dari masalah kampanye politik


II
1 2 3 minimum
1 0 -2 2 -2 ←nilai maksimin
I 2 5 4 -3 -3
3 2 3 -4 -4
maksimum 5 4 2

nilai minimaks

3. Permainan dengan Strategi Campuran


Bila suatu permainan tidak mempunyai titik sadel, maka teori permainan
menyarankan setiap pemain untuk menetapkan distribusi peluang dari strategi yang akan
diterapkannya. Untuk menyatakan secara matematis, misalkan:
Xi = peluang pemain I menggunakan strategi i (i = 1, 2, ... m),
Yj = peluang pemain II menggunakan strategi j (j = 1, 2, . . . n),
m dan n berturut-turut adalah banyaknya strategi yang mungkin.

Pemain I dapat menyebutkan rencananya untuk memainkan permainan dengan


memberikan nilai X1, X2, … Xm. Karena nilai-nilai ini adalah peluang, maka nilainya tak
negatif dan jumlahnya 1. Dengan cara yang sama, rencana pemain II dapat digambarkan oleh
nilai-nilai y1, y2, … , yn. Rencana (X1, X2, …, Xm) dan (Y1, Y2, … Yn) biasa disebut strategi
campuran (mixed strategies) dan strategi awal disebut strategi murni (pure strategies).
Untuk memberikan gambaran yang lebih jelas, perhatikan contoh berikut. Misalkan
pemain I dan pemain II pada variasi 3, masalah kampanye politik (lihat Tabel 2-5) memilih
strategi campuran (X1, X2, X3) = ( 12 , 12 , 0) dan (Y , Y2, Y3) = (0, 12 , 12 ). Dari pemilihan ini,
pemain I mempunyai peluang yang sama (peluang 12 ) untuk memilih strategi (murni) 1 atau
2, tetapi ia mengesampingkan strategi 3. Pemain II secara acak memilih strategi 2 dan 3.
Untuk memainkan permainan ini, setiap pemain dapat melemparkan mata uang untuk
menentukan strategi mana yang akan digunakan.
Walaupun tidak ada alat yang memuaskan sepenuhnya untuk menghitung strategi
campuran, tetapi harapan payoff merupakan salah satu cara yang sangat berguna. Dengan
menerapkan definisi teori peluang untuk nilai harapan diperoleh:
m n
Harapan payoff = Σ Σ pij xi y j ,
i =1 j =1

di mana Pij adalah ‘payoff’ jika pemain I menggunakan strategi z dan pemain II
menggunakan strategi j.
Dalam contoh terdapat 14 'payoff’ yang mungkin yaitu (-2, + 2 + 4, -3) semuanya terjadi
dengan peluang 14 jadi expected ‘payoff’ (-2 + 2 + 4 -3) = 14 . Ukuran keragaan ini tidak
menunjukkan resiko yang terlibat dalam melakukan permainan, tetapi memberikan indikasi
rata-rata ‘payoff’ bila permainan dimainkan berulang kali.
Menggunakan ukuran ini, teori permainan memperluas konsep kriteria minimaks
bagi permainan yang tidak mempunyai titik sadel. Dalam konteks ini, kriteria minimaks
mengharuskan pemain memilih strategi campuran yang meminimumkan harapan kerugian
maksimum. Bila kita memfokuskan pada ‘payoff’ (pemain I) daripada kekalahan (pemain II),
maka kriteria ini setara dengan kriteria maksimin yang memaksimumkan harapan ‘payoff’
minimum. Yang dimaksud dengan harapan ‘payoff’ minimum adalah harapan ‘payoff’ yang
Dwijanto, Riset Operasi halaman 67

terkecil yang dapat dihasilkan oleh sembarang strategi campuran yang dapat ditangkis oleh
lawan. Jadi strategi campuran untuk pemain I yang optimal menurut kriteria ini adalah
strategi yang menghasilkan jaminan (minimum harapan ‘payoff’) paling baik. (Nilai dari
jaminan terbaik, nilai maksimin, dinyatakan sebagai v ). Dengan cara yang serupa, strategi
optimal untuk pemain II adalah strategi yang memberikan jaminan terbaik, di mana yang
terbaik adalah minimum dan jaminan adalah harapan kerugian maksimum. (garansi terbaik
adalah nilai minimaks dinyatakan oleh v ).
Ingat kembali, bila hanya strategi murni yang digunakan dan permainan tidak
mempunyai titik sadel, maka tak ada penyelesaian stabil. Alasan yang mendasar adalah v < v
, sehingga pemain selalu ingin mengubah strateginya untuk memperbaiki posisi. Hal yang
sama untuk permainan dengan strategi campuran, adalah perlu v = v untuk penyelesaian
optimal agar menjadi stabil. Berdasarkan teorema minimaks dari teori permainan, kondisi ini
selalu dipenuhi oleh permainan tertentu.
Walaupun konsep strategi campuran ini sangat intuitif jika permainan dilakukan
berulang-ulang, tetapi konsep ini membutuhkan suatu interpretasi jika permainan dilakukan
hanya sekali. Dalam hal ini, penggunaan strategi campuran tetap melibatkan pemilihan dan
pemakaian strategi murni (yang dipilih secara acak dari distribusi peluangnya), jadi cukup
dapat diterima jika kita mengabaikan proses acak dan hanya memilih satu strategi murni
terbaik yang akan digunakan. Kita telah memberi contoh Variasi 3 pada subbab sebelumnya
di mana pemain berusaha agar lawan tidak dapat mengetahui strateginya. Bahkan jika lawan
menggunakan kecenderungan pemain I (memilih strategi murni) untuk menurunkan peluang
yang berbeda dari peluang untuk strategi campuran yang optimal, maka ia masih dapat
mengambil keuntungan dari informasi ini untuk mengurangi harapan ‘payoff’ pada pemain I.
Karenanya, satu-satunya cara untuk menjamin memperoleh harapan ‘payoff’ optimal v
adalah memilih secara acak strategi murni yang akan digunakan dari distribusi peluang untuk
strategi campuran optimal.

4. Prosedur Penyelesaian Grafik


Pandang permainan dengan suatu strategi campuran, setelah strategi yang
didominasi strategi lain dihilangkan, maka pemain tinggal memiliki 2 strategi murni.
Misalkan pemain tersebut adalah pemain I. Karena strategi campurannya adalah (x1, x2) dan
x2 = 1 – x1, maka perlu dicari penyelesaian optimal untuk x1, Membuat plot harapan 'payoff'
sebagai fungsi dari x1 untuk setiap strategi murni lawan sangat mudah. Grafik ini dapat
digunakan untuk mengidentifikasi titik yang memaksimumkan harapan 'payoff’ minimum.
Strategi campuran minimaks lawan juga dapat ditunjukkan oleh grafik tersebut.
Untuk menggambarkan prosedur ini, perhatikan Variasi 3, masalah kampanye
politik (lihat label 4-1). Ingat kembali strategi murni ke 2; sehingga tabel ‘payoff’ dapat
disederhanakan menjadi Tabel 4-2. Oleh sebab itu untuk setiap strategi murni yang berlaku
untuk pemain II, harapan ‘payoff’ untuk pemain I menjadi:
(y1, y2, y3) Harapan ‘payoff’
(1, 0, 0) 0x1 + 5 (1 – x1) = 5 – 5x1
(0, 1, 0) -2x1 + 4 (1 – x1) = 4 – 6x1)
(0, 0, 1) 2x1 – 3 (1 – x1) = -3 + 5x1

Sekarang, gambar garis harapan ‘payoff’ ditunjukan oleh Gambar 4-1. Untuk setiap nilai x1
diberikan dan (y1, y2, y3) harapan ‘payoff’ akan sesuai dengan:
Harapan ‘payoff’ = y1 (5 - 5x1 + y2 (4 – 6x1) + y3 (-3 + x1)
Minimum harapan ‘payoff’ ditunjukkan oleh titik pada garis terbawah. Berdasarkan
kriteria minimaks (atau maksimin), pemain I harus memilih nilai x1 yang memberikan
harapan payoff minimum yang terbesar sehingga
Dwijanto, Riset Operasi halaman 68

v = v = maks {min (-3 + 5x1, 4 - 6x1)}


0 ≤x1 ≤1

Jadi nilai optimal untuk xl adalah titik potong kedua garis (-3 + 5x1) dan (4 – 6x1). Selesaikan
persamaan
-3 + 5x1 = 4 - 6x1
diperoleh x1 = 117 dan (x1, x2) = ( 117 , 114 ) adalah strategi campuran optimal unttik pemain I,
serta nilai dari permainan:
v = -3 + 5 ( 117 ) = 112
Tabel 4-2 Tabel ‘Payoff’ dipersingkat untuk Variasi 3 dari masalah Kampanye Politik
II
Probabilitas
y1 y2 y3
Probabilitas Strategi Murni 1 2 3
X1 1 0 -2 2
I
1 – x1 2 5 4 -3

Gambar 4-1 Prosedur grafik untuk menyelesaikan permainan


Untuk mencari strategi campuran optimal yang sesuai bagi pemain II, perhatikan
cara berikut ini. Menurut definisi nilai minimaks v dan teorima minimaks, harapan ‘payoff’
yang dihasilkan dari strategi optimal (y1, y2, y3) = (y1*, y2*, y3*) akan memenuhi kondisi
y1*(5 - 5*,) + y2*(4 – 6x1) + y3*(-3 + 5x1) < v = v = 112
untuk setiap nilai x1 (0 ≤ x1 ≤ 1). Bila pemain I bermain optimal (yaitu xl = 117 ),
pertaksamaan ini menjadi persamaan, sehingga
20 2 2 2
11 y1* + 11 y2*+ 11 y3* = v = 11
Karena (yl, y2, y3) adalah distribusi peluang, maka
y1* + y2*+ y3* = 1
Akibatnya, diperoleh y1* = 0, karena jika y1* > 0 akan bertentangan dengan 2 persamaan
terakhir yaitu harapan 'payoff' pada grafik di x1 = 117 ada di atas titik maksimin. (Secara
umum, sembarang garis yang tidak melalui titik maksimin harus diberikan bobot 0, untuk
menghindari harapan 'payoff' naik di atas titik tersebut). Jadi
Dwijanto, Riset Operasi halaman 69

≤ 112 untuk 0 ≤ x1 ≤ 1
y2*(4 – (6x1) + y3*(-3 + 5x1)  2 7
= 11 untuk x1 = 11
Tetapi y2* dan y3* adalah bilangan, sehingga bagian kiri adalah persamaan garis lurus yang
merupakan rata-rata tertimbang dengan bobot 2 garis terbawah dari grafik. Karena ordinat
garis ini harus sama dengan 112 di x1 = 117 dan karena ordinat tidak boleh lebih dari 112 maka
garis tersebut harus horisontal. (Kesimpulan ini selalu benar, kecuali nilai optimal untuk x1
adalah 0 atau 1, dalam hal ini pemain II juga harus menggunakan satu strategi murni).
Sehingga didapat
y2*(4 – (6x1) + y3*(-3 + 5x1) = 112 untuk 0 < x1 < 1.
Untuk memyelesaikan y2* dan y3*, pilih dua nilai x1 (misalkan 0 dan 1) dan selesaikan
persamaan yang diperoleh
4y2* + 3y3* = 112 ,
2
-2y2* + 2y3* = 11 ,
6 5
Penyelesaiannya y3* = 11
dan y2* = 11
Jadi strategi campuran optimal untuk pemain II
5 6
adalah (yl, y2, y3) = (0, , ). 11 11
Jika pada masalah lain terdapat lebih dari 2 garis melalni titik maksimin, maka
terdapat lebih dari dua y1* yang lebih besar dari 0. Kondisi ini akan mengakibatkan terdapat
banyak nilai yang sama untuk strategi campuran optimal bagi pemain II. Salah satu strategi
seperti itu dapat diidentifikasi dengan membuat semua nilai 0 kecuali untuk kedua y1* ini,
kemudian selesaikan persamaan yang diperoleh. Untuk kedua persamaan tersebut, garis yang
bersesuaian harus mempunyai gradien positif dan garis lainnya bergradien negatif.
Meskipun prosedur grafik hanya dijelaskan untuk kasus khusus, pada dasarnya
penalaran yang sama dapat digunakan untuk menyelesaikan sembarang permainan dengan
strategi campuran di mana hanya terdapat 2 strategi murni yang tidak didominasi strategi lain
untuk salah satu pemain.

5. Penyelesaian dengan Pemrograman Linear


Setiap permainan dengan strategi campuran dapat diselesaikan dengan mengubah
masalah menjadi masalah pemrograman linear. Seperti yang akan kita lihat, transformasi ini
membutuhkan sedikit lebih banyak jika dibandingkan dengan menerapkan teorema minimaks
dan menggunakan definisi nilai maksimin v dan nilai minimaks v .
Pertama, perhatikan bagaimana mencari strategi optimal untuk pemain I. Seperti telah
ditunjukkan pada Subbab 3,
m n
Harapan 'payoff' = ∑∑ p
i =1 j =1
x yj
ij 1

dan strategi (x1, x2, . . ., xm) optimal jika


m n

∑∑ p
i =1 j =1
x yj ≥ v = v
ij 1

untuk setiap strategi lawan (yl, y2, ..., yn). Jadi pertaksamaan ini harus dipenuhi, sebagai
contoh, untuk setiap strategi murni pemain II, yaitu untuk setiap strategi (yl, y2, ..., yn) di
mana satu yj = 1 dan sisanya 0. Substitusi nilai ini ke pertaksamaan, diperoleh
m

∑p
i =1
ij xi ≥ v, untuk j = 1, 2, …, , n,

Jadi dari satu pertaksamaan diperoleh n pertaksamaan. Selanjutnya, n pertaksamaan ini


mengakibatkan:
Dwijanto, Riset Operasi halaman 70

n
 m
 n
∑ y  ∑ p
j =1
i
i =1
ij i  ≥ ∑ y j v = v,
x
 j =i
n
Karena ∑y
j =1
j =1

Karena implikasi ini berlaku dua arah, maka menyelesaikan n pertaksamaan di atas ekivalen
dengan menyelesaikan pertaksamaan baru yang berlaku untuk setiap strategi (y1, y2, ..., yn).
Tetapi n pertaksamaan ini merupakan kendala pemrograman linear seperti kendala tambahan
xl + x2 + … + xm = 1
xl > 0, untuk i = 1, 2, • • • , m
yang dibutuhkan untuk menjamin bahwa xi adalah peluang. Jadi setiap penyelesaian (x1, x2 . .
. , xm) yang memenuhi kendala pemrograman linear adalah strategi optimal yang diinginkan.
Konsekuensinya, masalah mencari strategi campuran optimal telah diubah menjadi
mencari penyelesaian layak untuk masalah pemrograman linear. Tetapi masih ada 2 hal,
yaitu (1) v tidak diketahui dan (2) masalah pemrograman linear belum mempunyai fungsi
hijuan. Dua hal ini dapat diselesaikan dengan menggantikan konstanta v yang tidak diketahui
dengan peubah xm+1, kemudian maksimumkan xm+1, sehingga xm+1 otomatis akan sama dengan
v (menurut definisi) pada penyelesaian optimal untuk masalah pemrograman linear.
Dapat disimpulkan bahwa, pemain I harus mencari strategi campuran optimal
dengan menggunakan metode simpleks untuk menyelesaikan masalah pemrograman linear
berikut :
Meminimumkan (–xm + 1),
dengan kendala : p11x1 + p21x2 + • • • + pm1xn – xm+1 ≥ 0
p12x1 + p22x2 + • • • + pm2xn – xm+1 ≥ 0
.
.
.
p1nx1 + p2nx2 + • • • + pmnxm – xm+1 ≥ 0
-(x1 + x2 + … + xm) = -1
dan x1 ≥ 0, untuk i = 1, 2, • • • , m.
(Fungsi tujuan dan kendala persamaan ditulis dalam bentuk yang setara). Perhatikan bahwa
xm+1 tidak dibatasi harus tak negatif padahal metode simpleks hanya dapat digunakan setelah
semua peubah memiliki kendala tak negatif. Tetapi hal ini dapat dengan niudah diatasi seperti
berikut.
Perhatikan pemain II. Ia dapat memperoleh strategi campuran optimal dengan
menuliskan kembali tabel 'payoff' sebagai 'payoff' untuk dirinya, kemudian memprosesnya
seperti yang sudah dijelaskan. Dengan menggunakan prosedur yang sama, diperoleh
kesimpulan, strategi campuran yang optimal untuk pemain II adalah penyelesaian optimal
dari masalah pemrograman linear:
Memaksimumkan (-yn+1)
dengan kendala p11x1 + p21x2 + • • • + p1nyn – yn+1 ≥ 0
p21y1 + p22y2 + • • • + p2nyn – yn+1 ≥ 0
.
.
.
pm1y1 + pm2y2 + • • • + pmnyn – yn+1 ≥ 0
-(y1 + y2 + … + yn) = -1

Perhatikan bahwa masalah pemrograman linear di atas adalah dual dengan


pemrograman linear untuk pemain I. Kenyataan ini mengakibatkan beberapa hal yang
Dwijanto, Riset Operasi halaman 71

penting. Salah satu implikasinya adalah strategi campuran optimal untuk kedua pemain dapat
diperoleh dengan menyelesaikan salah satu masalah pemrograman linear karena optimal
penyelesaian dual otomatis diperoleh dari perhitungan metode simpleks untuk mencari
penyelesaian utama yang optimal. Implikasi kedua adalah untuk menginterpretasi dan
menganalisa permainan diperlukan teori dual.
Fungsi tujuan dari kedua masalah pemrograman linear dituliskan dalam bentuk
meminimumkan (-xm+1) dan memaksimumkan (-yn+1) untuk menunjukkan bahwa kedua
masalah dual satu sama lain. Mulai saat ini, fungsi tujuan akan dituliskan dalam bentuk yang
ekivalen yaitu memaksimumkan xm+1 dan meminimumkan yn+l. Dengan alasan yang sama,
tanda negatif sekarang dihilangkan dari kedua bagian setiap pertaksamaan.
Satu hal yang masih belum jelas, apa yang harus dilakukan untuk mengatasi xm+1 dan
yn+l yang tandanya masih bebas. Jika v > 0, maka nilai optimal untuk xm+1 dan yn+1 tak negatif,
Jadi tidak ada masalah menggunakan metode simpleks, karena kendala untuk peubah-peubah
ini tak negatif. Tetapi, jika v < 0, maka perlu dilakukan pendekatan lain. Salah satu alternatif
adalah mengganti peubah yang tidak mempunyai kendala tak negatif dengan selisih 2 peubah
tak negatif. Alternatif lain adalah menukar pemain I dan II, sehingga tabel 'payoff' ditulis
sebagai 'payoff’ terhadap pemain II asal, yang akan membuat nilai v yang sesuai positif.
Alternatif ketiga dan paling umum dilakukan adalah menambah setiap entry dengan suatu
konstanta yang cukup besar, sehingga semua ini yang baru dari permainan positif. (Sebagai
contoh, pilih konstanta ini sama dengan nilai inutiak terbesar dari entry negatif). Karena
konstanta negatif yang sama ditambahkan pada setiap entry, maka penyesuaian ini tidak akan
mempengaruhi strategi campuran optimal, scliingga strategi ini dapat diperoleh dengan cara
yang biasa. Nilai permainan akan bertambah disebabkan oleh penambahan konstanta, tetapi
nilai ini dapat disesuaikan kembali setelah penyelesaian diperoleh.
Untuk menuliskan model pemrograman linear bagi pemain I, perhatikan bahwa pij
pada model umum adalah nilai pada bans ke-i dan kolom ke-j Tabel 4-2, untuk i = 1, 2, dan j
= 1, 2, 3. Dengan menggunakan fungsi yang memaksimumkan xm+1 sebagai pengganti fungsi
yang meminimumkan (-xm+1), dengan m = 2 dan n = 3, diperoleh model
Memaksimumkan x3
dengan kendala 5x2 – x3 ≥ 0
-2x1 + 4x2 – x3 ≥ 0
2x1 – 3x2 – x3 ≥ 0
x1 + x2 =1
dan x1 ≥ 0, + x2 ≥ 0, x3 ≥ 0

Dengan menggunakan metode simpleks diperoleh x1*= 117 , x2*= 114 , x3*= 112 , sebagai
penyelesaian optimal. Akibatnya, strategi campuran untuk pemain I berdasarkan kriteria
minimaks adalah (x1, x2) = ( 117 , 114 ), dan nilai permainan adalah v = x3* = 112 Metode simpleks
5 6 2
juga menghasilkan penyelesaian optimal bagi dualnya, y1* = 0, y2* = 11 , y3* = 11 , y4* = 11 .
5 6
Jadi strategi campuran optimal untuk pemain II adalah (y1, y2, y3) = (0, , ).
11 11
Masalah dual di atas adalah model pemrograman linear untuk pemain II (dengan
peubah y1, y2 • • • yn, yn+1) seperti ditunjukkan belakangan. Dengan melihat nilai p,y dari label
12-6, diperoleh model:
Meminimumkan y4,
dengan kendala -2y2 = 2y3 – y4 ≤ 0
5y1 + 4y2 – 3y3 – y4 ≤ 0
y1 + y2 y3 =1
dan y1 ≥ 0, y2 ≥ 0, y3 ≥ 0, y4 ≥ 0.
Dwijanto, Riset Operasi halaman 72

Dengan menggunakan metode simpleks untuk menyelesaikan model ini secara


langsung diperoleh penyelesaian optimal y1* = 0, y2* = 115 , y3* = 116 , y4* = 112 (sesuai dengan
penyelesaian dual optimal, x1* = 117 , x2* = 4
11 , x3* = 2
11 ). Strategi campuran optimal untuk
5 6 2
pemain II adalah (y1, y2, y3) = (0, , ), dan nilai permainan adalah v = y4* =
11 11 11 .
Jika menggunakan program Lindo maka dapat di tulis sebagai berikut:
max x3
subject to
5x2-x3>=0
-2x1+4x2-x3>=0
2x1-3x2-x3>=0
x1+x2=1
end
dan diperoleh output sebagai berikut.

LP OPTIMUM FOUND AT STEP 2


OBJECTIVE FUNCTION VALUE
1) 0.1818182
VARIABLE VALUE REDUCED COST
X3 0.181818 0.000000
X2 0.363636 0.000000
X1 0.636364 0.000000
ROW SLACK OR SURPLUS DUAL PRICES
2) 1.636364 0.000000
3) 0.000000 -0.454545
4) 0.000000 -0.545455
5) 0.000000 0.181818

Yang berarti nilai X1=0.636364, X2=0.363636 dan X3= 0.181818


Masalah di atas jika menggunakan program Lingo maka dapat di tulis sebagai berikut:
max=x3;
5*x2-x3>=0;
-2*x1+4*x2-x3>=0;
2*x1-3*x2-x3>=0;
x1+x2=1;
dan outputnya adalah

Rows= 5 Vars= 3 No. integer vars= 0 ( all are linear)


Nonzeros= 12 Constraint nonz= 10( 5 are +- 1) Density=0.600
Smallest and largest elements in absolute value= 1.00000 5.00000
No. < : 0 No. =: 1 No. > : 3, Obj=MAX, GUBs <= 1
Single cols= 0
Optimal solution found at step: 0
Objective value: 0.1818182
Variable Value Reduced Cost
X3 0.1818182 0.0000000E+00
X2 0.3636364 0.0000000E+00
X1 0.6363636 0.0000000E+00
Row Slack or Surplus Dual Price
1 0.1818182 1.000000
2 1.636364 0.0000000E+00
3 0.0000000E+00 -0.4545455
4 0.0000000E+00 -0.5454546
5 0.0000000E+00 0.1818182
Yang berarti nilai X1=0.636364, X2=0.363636 dan X3= 0.181818
Dwijanto, Riset Operasi halaman 73

6. Perluasan
Perluasan berikutnya adalah permainan tak hingga (infinite games), di mana pemain
mempunyai tak hingga banyaknya strategi murni. Permainan ini dirancang untuk situasi di
mana strategi yang dipilih dapat dinyatakan oleh peubah keputusan yang kontinu. Contohnya,
peubah keputusan mungkin berupa waktu untuk melakukan aksi-aksi tertentu, atau proporsi
sumberdaya yang dialokasikan untuk kegiatan tertentu dalam situasi kompetitif. Banyak
penelitian sedang dilakukan akhir-akhir ini membahas jenis permainan tersebut.
Untuk jenis permainan ini diperlukan analisa yang lebih rumit dari pada permainan
dua-orang jumlah-nol yang berhingga, sehingga tidak akan kita bicarakan lebih jauh di sini.

7. Kesimpulan
Masalah pengambilan keputusan dalam lingkungan kompetitif sangat umum dan
penting. Sumbangan yang paling mendasar dari teori permainan adalah menghasilkan konsep
dasar untuk merumuskan dan menganalisa masalah-masalah seperti di atas dalam siruasi
sederhana. Tetapi, terdapat pemisah yang cukup besar antara apa yang dapat ditangani oleh
teori dan kekomplekan dari sebagian besar siruasi kompetisi yang muncul dalam prakteknya.
Oleh sebab itu, alat konseptual dari teori permainan biasanya hanya merupakan tambahan
dalam mengatasi situasi ini.
Karena masalah generalisasi sangat penting, maka penelitian masih terus dilakukan
untuk mengembangkan teori ini bagi situasi yang lebih kompleks.

Anda mungkin juga menyukai