Game Theory
Game Theory
Asumsi dasar:
1. Rasionalitas:
Preference: Von Neumann-Morgenstern Expected Utility Function (EU)
Implikasi EU: pemain punya state preference.
Konsep sederahanya yaitu bahwa diasumsikan pemain lain sepandai kita.
2. Common Knowledge:
X tahu bahwa Y tahu, X tahu kalau Y tahu kalau X tahu, dan seterusnya.
Konsep sederhananya yaitu tahu sama tahu.
Di bagian kiri merupakan Normal Form Games, sebelah kanan merupakan Extensive Form
Games. Yang membedakan antara keduanya yaitu Extensive Form Games memberikan
informasi yang lebih kaya.
Contoh:
Game dengan Payoffs Kualitatif
Mbak Y
Film Horor (q) Film Laga (1-q)
Film Horor (p) (Males tapi (Jomblo,
Senang, Jomblo)
Mas X
Senang Sekali)
Film Laga (1-q) (Jomblo, (Senang Sekali,
Jomblo) Males tapi
Senang)
Prisoners’ Dilemma
Pemain 2
A B
Pemain 1
A (-1,-1) (-9,0)
B (0,-9) (-3,-3)
Pemain 1 tidak akan memilih strategi A, karena strategi A terdominasi dengan strategi B.
Pemain 2 juga tidak akan memilih strategi A. Maka strategi yang diambil yaitu strategi B,
hal ini disebut dengan Nash Equilibrium.
Pemain 2
A(q) B (1-q)
Pemain 1
X (p) (a1,a2) (b1,b2)
Y(1-p) (c1,c2) (d1,d2)
Pemain 2
A B
Pemain 1
A (a1,a2) (0,0)
B (0,0) (b1,b2)
Dimana: a1 > b1, dan i = {1,2}
Pemain 2
A B
Pemain 1
A (a1,b2) (0,0)
B (0,0) (b1,a2)
Dimana: a1 > b1, dan i = {1,2}
Non-Cooperative Game
Pemain 2
A B
Pemain 1
A (a1,a2) (b1,c2)
B (c1,b2) (d1,d2)
Dimana: c1 > a1 > d1 > b1 dan i = {1,2}
Pemain 2
A B
Pemain 1
A (a1,a2) (b1,b2)
B (c1,c2) (d1,d2)
Dimana: b1 > d1 > c1 > a1 dan
Pemain 2
A B
Pemain 1
A (-a1,a2) (a1,-a2)
B (a1,-a2) (-a1,a2)
The Inspection Game
Pemain 2
A B
Pemain 1
A (-2,7) (7,-3)
B (3,4) (5,6)
Pemain 2
A B
Pemain 1
A (a1,a2) (b1,b2)
B (c1,c2) (d1,d2)
Dimana: c1 > a1, b1 > d1 & a2 > b2, d2 > c2
Solusi:
a). PSNE: (A,A) dan (B,B)
b). MSNE:
- ({b2/(a1+b2), a2/(a2+b2)}
-({a1/(a1+b1), b1/(a1+b1)}
c). Terdapat the first mover advantage
d). Esensi: koordinasi dengan fungsi tujuan yang berkebalikan
Prisoners’ Dilemma
Pemain 2
A B
Pemain 1
A (a1,a2) (b1,c2)
B (c1,b2) (d1,d2)
Dimana: c1 > a1 > d1 > b1 dan i = {1,2}
Solusi:
a). The dominant strategy: B
b). PSNE: (B,B)
c). Pareto Optimum: (A,A)
d). Perpindahan dari outcomes lain menuju ke (A,A) adalah win-win solutuion
Hawk and Dove Game
Pemain 2
A B
Pemain 1
A (a1,a2) (b1,b2)
B (c1,c2) (d1,d2)
Dimana: b1 > d1 > c1 > a1 dan
Solusi:
a). PSNE: (A,B) & (B,A)
b). Implementasi game ini banyak diterapkan selama perang dingin dan
bahkan dalam kehidupan rumah tangga
Solusi:
a). MSNE: (50%, 50%)
b). Tidak ada PSNE
c). Tidak mungkin ada win-win solution
d). Terdapat the last mover advantage
e). The winner takes all
Solusi:
a). Mixed Strategy Nash Equilibrium
-p* = (a2 – b2) / (a2 – b2 – c2 + d2)
-q* = (a1 – c1) / (a1 – b1 – c1 + d1)
b). Implikasi: tidak optimal bagi setiap pemain untuk memilih strategi dengan
probabilitas 1.
1. Strategi Dominan
Orang yang rasional pasti akan:
a. Memilih strategi yang dominan (the dominant strategy), atau
b. Mengeliminasi strategi yang terdominasi (the dominated strategy)
a. Pengambilan keputusan di Game Theory harus mempertimbangkan
kemungkinan pilihan strategi oleh lawan main.
b. Pemain i best response atau best reply terhadap strategi s-i yang dipilih
pemain lain adalah strategi s*i yang menghasilkan payoffs terbesar bagi
pemain tersebut
c. Strategi s*i adalah strategi dominan jika pemain i memilih the best
response strategy , apapun strategi yang dipilih oleh lawan.
d. Strategi sdi adalah strategi terdominasi jika strategi tersebut inferior
terhadap strategi lain, apapun strategi yang dipilih oleh lawan.
Apabila pemain 2 memilih strategi setia, maka the best response pemain 1 adalah
mengambil strategi Khianat (9>1), begitu juga sebaliknya. Apabila pemain 2 memilih
strategi Khianat, maka the best response pemain 1 adalah Khianat (3>-2).
Strategi “Khianat” merupakan the dominant trategy bagi setiap pemain di game prisoners’
dilemma.
2. Weakly Dominated Strategies
Strategi s’i adalah strategi yang weakly dominated jika terdapat strategi lain s”i
dari pemain i yang mungkin lebih baik dan tidak pernah lebih tinggi di sebagian
strategi profile dan tidak pernah menghasilkan payoffs lebih rendah.
Contoh:
Iterated Elimination of Strictly Dominated Strategies
L M R
U 1,0 1,2 0,1
D 0,3 0,1 2,0
Pemain 1 akan memilih U dan mengeliminasi D, sehingga game yang tersisa menjadi
1x2
L M
U 1,0 1,2
Contoh:
Iterated Elimination of Weakly Dominated Strategies
L M R
U 1,0 -2,1 0,1
D 1,2 -5,-1 0,0
Cara 1:
Dimulai dari pemain 2, yaitu antara L,M,dan R. Terlihat bahwa strategi M dapat
dieliminasi karena R>M. Lalu strategi U dieliminasi, kemudian R dieliminasi. Lalu
didapatkan NE = (D,L) = (1,2)
Cara 2:
Dimulai dari pemain 1, D dieliminasi. Pemain 2 lalu akan mengeliminasi L,
berikutnya R dieliminasi. Maka didapatkan NE = (U,M) = (-2,1)
Cara 3:
Dimulai dari pemain 1, lalu M dieliminasi, selanjutnya pemain 1 mengeliminasi D,
dan terakhir L dieliminasi. Maka didapatkan NE = (U,R) = (0,1)
Nash Equilibrium
1. Pure Strategy Nesh Equilibrium (PSNE), dapat diperoleh melalui
-Elimination odf strictly dominated strategies selalu menghasilkan a unique pure
strategy Nash Equilibrium
-Elimination of weakly dominated strategies belum tentu menghasilkan a unique
pure strategy Nash Equilibrium
3. Nash (1951): setiap game memiliki MSNE, meski belum tentu memiliki PSNE
Cara menghitung Mixed Strategy
Metode Minmax
Jika p* dan q* adalah minmax (NE) dari game di atas, maka akan diperoleh:
p* = (d2 – c2)/(a2-b2-c2+d2) ; (1-p*) = (a2-b2)/(a2-b2-c2+d2) (7)
q* = (d1 – b1)/(a1-b1-c1+d1) ; (1-q*) = (a1-c1)/(a1-b1-c1+d1) (8)
Substitusi p* dan q* ke persamaan (5) dan (6) diperoleh optimal expected utilitas:
U*1 = U1(p,q*)=q*c1+(1-q*)d1 = (a1d1-b1c1)/(a1-b1-c1+d1) (9)
U*2 = U2(p,q*)=p*b2+(1-p*)d2 = (a2d2-b2c2)/(a2-b2-c2+d2) (10)
Jika U1 dan U2 adalah expected utility pemain 1 dan 2 dalam memainkan game:
U1(p;q) = pqa1 + p(1-q)b1 + (1-p)qc1 + (1-p)(1-q)d1 (1)
U2(p;q) = pqa2 + p(1-q)b2 + (1-p)qc2 + (1-p)(1-q)d2 (2)
Derivasi expected utility terhadap p dan q:
dU1/dq = pa1-pb1 + (1-p)c1-(1-p)d1 = 0 (13)
dU2/dp = qa2 + (1-q)b2-qc2-(1-q)d2 = 0 (14)
Substitusi p+ dan q+ ke persamaan (15) dan (16) diperoleh optimal expected utility:
U+1= U1(p+,q)=p+c1+(1-p+)d1 = (a1d1-b1c1)/(a1-b1-c1+d1) = U1(p,q+) (19)
+ + + +
U 2= U2(p,q )=q+b2+(1-q )d2 = (a2d2-b2c2)/(a2-b2-c2+d2) = U2(p ,q) (20)
1. Kejahatan Serius
Kejahatan Serius tidak pernah lepas dari aspek kelembagaan, di Indonesia terdapat tiga
masalah pembangunan:
1. Kita tidak cukup mengetahui siapa “diri” dan “lawan kita”
2. Transformasi sektor informal ke formal
3. Aspek kelembagaan yang lemah, sehingga korupsi dan ekonomi biaya tinggi marak
Multiplier ekonomi terjadi sebagai hasil dari aktivitass ekonomi. Dengan asumsi: tidak ada
kebocoran akibat korupsi dari sistem ini dan semua aktivitas ekonomi tercatat.
Namun pada kenyataannya banyak terjadi inefisiensi yang terjadi, yaitu salah satunya
korupsi. Korupsi yang terjadi di Indonesia merupakan korupsi struktural, yaitu korupsi yang
telah didesain dari sejak perencanaan dan penyusunan peraturan. Selain itu banyak jenis
korupsi yang belum diatur di Indonesia, yaitu: Korupsi swasta, Korupsi staff asing, Illicit
Enrichment, dan Trading of Influence.
2. Grand Corruption
Menurut Transparansi Nasional, Grand corruption is abuse of high-level power that
benefits the few at the expense of the many, and causes serious and widespread harm
to individuals and society. It often goes unpunished.
Solusi Optimal
a. Setiap upaya meningkatkan kemampuan penegak hukum dalam menjatuhkan
pidana di pengadilan meningkatkan biaya
b. Setiap upaya meningkatkan intensitas hukuman kepada pelaku kejahatan akan
meningkatkan biaya
c. Solusi optimal:
-Conviction (detection) rate ditentukan tinggi namun intensitas hukuman
rendah, atau
- Conviction (detection) rate ditentukan rendah namun intensitas hukuman
tinggi
5. Pemodelan The Inspection Game
a. The Deterrence Theory
Terdapat perbedaan mendasar antara teori Becker (1968) vs teori Tsebelis (1989)
Becker (1968) berpendapat bahwa keinginan individu untuk melakukan kejahatan
dipengaruhi oleh probabilitas ditangkap dan beratnya sanksi hukum. Analisis yang
digunakan yaitu Decision Theory.
Sedangkan Tsebelis (1989) berpendapat bahwa peningkatan sanksi hukum tidak
mempengaruhi prilaku individu, tapi menurunkan probabilitas aparat untuk
menegakkan hukum. Analisis yang digunakan yaitu Game Theory.
Kritik Tsebelis terhadap Becker
1. Probabilitas apakah offender akan tertangkap atau tidak
dipengaruhi oleh perilaku rational agent (polisi, masyarakat) dan
bukan oleh kejadian yang sifatnya random (hujan, bencana alam,
dll)
2. Idealnya alat analisis yang digunakan adalah game theory dan
bukan decision theory
3. Game theory adalah alat analisis yang mempelajari hubungan
interaktif antara dua atau lebih rational agents
Solusi:
Mixed Strategi Nash Equilibrium:
-p* = (a2 – b2)/(a2-b2-c2-d2)
-q* = (a1 – b1)/(a1-b1-c1-d1)
Implikasi: Enforcement tidak dapat diterapkan dengan probabilitas = 1,
mengingat marginal benefits enforcement akan lebih rendah daripada marginal
costnya.
Proposisi 1
1. Offending terjadi jika kepuasan offending (UO) melebihi expected cost
sanksi langsung maupun tidak langsung
2. Hukum akan ditegakkan jika ekspektasi manfaat penegakan hukum
melebihi ekspektasi biaya penegakan hukum
3. Probabilitas offending berbanding lurus dengan biaya penegakan hukum
namun berbanding terbalik dengan benefit cost ratio biaya penegakan
hukum dan biaya pelaksanaan hukuman
4. Di equilibrium: probabilitas penegakan hukum berkorelasi positif dengan
offending dan berbanding terbalik dengan kesengsaraan hukuman
Peningkatan Hukuman
1. Peningkatan hukuman langsung UD misal dipenjara lebih lama, denda lebih
tinggi
2. Peningkatan hukuman tidak langsung UR misal bukti bersih diri untuk
melamar pekerjaan
3. Penggabungan kedua metode di atas (UD dan UR)
Proposisi 2:
Peningkatan sanksi hukum akan menurunkan probabilitas penegakan hukum
dan offending sejauh manfaat bersih dari kebijakan yang baru lebih tinggi
daripada manfaat bersih dari kebijakan sebelumnya.
Alternatif pendekatan:
Program Pencegahan Kejahatan
Enforcer
Enforce Not Enforce
Offend UO-UD, UO + TR +
Public
BE-CE-CS U’R’ – CP
Not Offend TR + UR,
TR, CE-CP
BR – CP
Dimana: TR : Transfer Payment dan CP : biaya program
Proposisi:
Implementasi program pencegahan kejahatan menurunkan probabilitas
kejahatan dan penegakkan hukum.
Kesimpulan:
a. Jika game dikonstruksi secara tepat, tidak ada kontradiksi antara
pendekatan decision theory dan game theorytentang deterrence dan crime
prevention
b. Dampak peningkatan hukuman bagi napi bersifat ambigu
c. Dampak crime prevention terhadap penurunan kemungkinan tindak
kejahatan lebih pasti dibandingkan peningkatan hukuman
Jika incumbent selalu collude, maka jika di bulan 1 incumbent collude, payoffs:
-Incument: (11x150)+40= 1690
-Entrant: (1x50)=50
Jika di bulan 2 incumbent collude, payoffs:
-Incumbent: (10x150) + (2x40)= 1630
-Entrant: (2x50)= 100, dst
Jika Incumbent selalu fight, maka di setiap game hanya ada satu pasar yang akan
menjadi tempat pertarungan, sedangkan sebelas pasar lainnya masih dimiliki oleh
Incumbent. Maka perhitungannya akan menjadi:
Jika di bulan 1 incumbent fight, payoffs:
-Incument: (11x150)+0= 1650
-Entrant: (1x(-10))= -10
Pembelajaran:
a. Strategi yang optimal untuk one-shot game, belum tentu strategi yang optimal
untuk finetely repeated game.
b. Chain Store Paradox menunjukkan pada kita bahwa untuk one-shot game, the
best response dari dari Incumbent adalah collude
c. Namun untuk finitely repeated game, the best response dari Incumbent adalah
selalu fight di setiap round.
Pertempuran vs Perang
a. Pertempuran (battle) = one-shot game
b. Perang (war) = repeated game
c. Memenangkan pertempuran, belum tentu memenangkan perang