Anda di halaman 1dari 86

BAB 7

TEORI PERMAINAN

Ketika seorang konsumen pergi belanja untuk mobil baru, bagaimana ia akan
tawar-menawar dengan penjual? Jika dua negara menegosiasikan
kesepakatan perdagangan, apa yang akan menjadi hasilnya? Apa strategi
yang akan diikuti oleh sejumlah perusahaan minyak setiap penawaran pada
saluran minyak lepas pantai dalam lelang penawaran tertutup?

Dalam situasi seperti ini, tindakan agen yang dapat mengambil akan
memiliki konsekuensi bagi orang lain. Karena itu, agen memiliki alasan untuk
bertindak secara strategis. Teori permainan adalah studi sistematis tentang
bagaimana agen rasional berperilaku dalam situasi strategis, atau dalam
permainan, di mana setiap agen harus terlebih dahulu mengetahui
keputusan agen lain sebelum mengetahui mana keputusan yang terbaik
untuk dirinya. Bundar ini adalah ciri dari teori permainan, dan memutuskan
bagaimana agen rasional berperilaku dalam pengaturan tersebut akan
menjadi fokus dari bab ini.

Bab ini dimulai dengan melihat dari dekat bentuk permainan strategis
dan hasil untuk con sider permainan bentuk luas dalam beberapa detail.
Yang pertama adalah permainan di mana agen membuat pilihan, tunggal
simultan, sedangkan yang kedua adalah permainan di mana pemain dapat
membuat pilihan secara berurutan.

Sepanjang jalan, kita akan menemukan berbagai metode untuk


menentukan keluar datang dari permainan. Anda akan melihat bahwa
setiap metode kita hadapi menimbulkan konsep solusi tertentu. Konsep
solusi akan kita pelajari termasuk yang didasarkan pada argumen dominasi,
Nash equilibrium, Bayesian-Nash equilibrium, induksi mundur,
kesempurnaan permainan sub, dan keseimbangan sekuensial. Masing-
masing konsep solusi yang lebih sophisti kasikan dari pendahulunya, dan

34
tahu kapan harus menerapkan satu solusi ketimbang yang lain adalah
bagian penting dari menjadi seorang ekonom diterapkan baik.

7.1 Strategi Pengambilan Keputusan

Perbedaan penting antara keputusan strategis dan non-strategis


adalah bahwa yang terakhir dapat dibuat dalam isolasi tanpa
memperhitungkan keputusan yang orang lain bisa membuat. Misalnya, teori
konsumen dikembangkan di Bab 1 adalah model non-strategis perilaku.
Mengingat harga dan pendapatan, setiap konsumen bertindak sepenuhnya
sendiri, tanpa memperhatikan perilaku orang lain. Di sisi lain, model Cournot
dan Bertrand dari duopoli diperkenalkan dalam Bab 4 menangkap
pengambilan keputusan strategis pada bagian dari dua perusahaan. Setiap
perusahaan memahami dengan baik bahwa tindakan yang optimal
tergantung pada tindakan yang diambil oleh perusahaan lain.

Untuk lebih menggambarkan pentingnya pembuatan keputusan


strategis mempertimbangkan duel klasik antara adonan dan pitcher dalam
bisbol. Untuk menjaga hal-hal sederhana, mari kita asumsikan bahwa pitcher
hanya memiliki dua pitches mungkin - fastball dan kurva. Juga, rasa itu
diketahui bahwa pitcher ini memiliki fastball terbaik di liga, tapi kurva nya
hanya rata-rata.Berdasarkan hal ini, mungkin tampak terbaik bagi pitcher
untuk selalu membuang fastball nya.Namun, seperti keputusan non-strategis
pada bagian pitcher gagal memperhitungkan keputusan adonan. Karena jika
adonan mengharapkan pitcher melempar bola cepat, maka, sedang
dipersiapkan untuk itu, dia akan memukulnya. Akibatnya, akan lebih
bijaksana untuk teko untuk mempertimbangkan keputusan adonan
mengenai lapangan pitcher sebelum memutuskan mana lapangan untuk
melempar.

35
Untuk mendorong analisis sedikit lebih jauh, mari kita menetapkan
beberapa nomor utilitas untuk berbagai hasil. Untuk mempermudah, kita
menganggap bahwa situasi adalah salah satu semua atau tidak untuk kedua
pemain. Anggap saja sebagai bagian bawah inning kesembilan, dengan
jumlah penuh, basis dimuat, dua angka out, dan tim pitcher depan dengan
satu run. Asumsikan juga bahwa adonan baik hits home run (dan
memenangkan permainan) atau pemogokan keluar (dan kehilangan
permainan). Akibatnya, ada tepat satu lapangan yang tersisa dalam
permainan.Akhirnya, kira setiap pemain berasal dari utilitas 1 kemenangan
dan 1 utilitas dari kerugian. Kami kemudian dapat mewakili situasi ini dengan
diagram matriks pada Gambar. 7.1.

Pada diagram ini, pitcher (P) memilih baris, F (fastball) atau C (kurva),
dan adonan (B) memilih kolom. Adonan hits home run ketika ia
mempersiapkan untuk lapangan yang pitcher telah memilih, dan pemogokan
keluar sebaliknya. Entri dalam matriks menunjukkan hadiah para pemain
'sebagai hasil dari keputusan mereka, dengan imbalannya pitcher
menjadi nomor pertama setiap entri dan adonan yang kedua. Dengan
demikian, entri (1, - 1) pada baris pertama dan kolom kedua menunjukkan
bahwa jika pitcher melempar bola cepat dan adonan mempersiapkan untuk
kurva, imbalannya pitcher adalah 1 dan adonan adalah -1. Entri lain dibaca
dengan cara yang sama.

Meskipun kami telah sejauh ini berkonsentrasi pada keputusan pitcher,


adonan obvi-menerus dalam posisi benar-benar simetris.Sama seperti
pitcher harus memutuskan di mana lapangan untuk melempar, adonan
harus memutuskan di mana lapangan untuk mempersiapkan.Apa yang dapat
dikatakan tentang perilaku mereka dalam pengaturan tersebut? Meskipun
Anda mungkin dapat memberikan jawaban untuk diri sendiri sudah, kita
tidak akan menganalisis pertandingan ini sepenuhnya dulu.

36
Namun, kita bisa langsung menarik kesimpulan agak penting hanya
didasarkan pada gagasan bahwa setiap pemain berusaha untuk
memaksimalkan hasil, dan bahwa setiap alasan strategis.

Lebih baik

F C

-1 1,-1
1,-1 -1,1
Gambar 7.1

Di sini, setiap pemain harus berperilaku dengan cara yang tak terduga.
Kenapa? Karena jika perilaku pitcher ditebak dalam, katakanlah, ia selalu
melempar fastball nya, maka adonan, dengan memilih F. akan dijamin untuk
memukul home run dan memenangkan permainan. Tapi ini akan berarti
bahwa perilaku batter diprediksi juga, dia selalu mempersiapkan untuk
sebuah bola cepat. Akibatnya, karena pitcher berperilaku strategis, ia secara
optimal akan memilih untuk membuang kurva nya, sehingga memukul
adonan keluar dan memenangkan permainan. Tapi ini con tradicts
anggapan asli kita bahwa pitcher selalu melemparkan fastball nya! Kami
menyimpulkan bahwa pitcher tidak dapat benar memprediksi untuk selalu
membuang bola cepat.Demikian pula, itu harus benar untuk memprediksi
bahwa pitcher selalu melempar kurva. Dengan demikian, apa pun perilaku
tidak akhirnya muncul dari skenario ini, harus melibatkan kurangnya
prediktabilitas tertentu mengenai lapangan untuk dilempar. Dan justru
karena alasan yang sama, ia juga harus melibatkan kurangnya prediktabilitas
mengenai pilihan batter yang lapangan untuk mempersiapkan.

Dengan demikian, ketika individu rasional membuat keputusan strategis,


masing-masing dengan mempertimbangkan keputusan yang merek lain,
mereka kadang-kadang berperilaku pria 'tak terduga. Setiap pemain

37
poker yang baik memahami hal ini dengan baik - itu merupakan aspek
penting dari sukses menggertak. Catatan, bagaimanapun, bahwa tidak ada
keuntungan seperti di non-strategis pengaturan - ketika Anda sendirian,
tidak ada satu untuk menipu;.Ini hanyalah salah satu contoh bagaimana
hasil di antara para pembuat keputusan strategis mungkin berbeda cukup
signifikan dari orang-orang di kalangan non-strategis pengambil
keputusan.Sekarang bahwa kita memiliki rasa untuk pengambilan keputusan
strategis, kami siap untuk mengembangkan teori sedikit.

7.2 Permainan Formulir Strategis

Duel adonan-pitcher, serta Cournot dan Bertrand duopoli, hanyalah tiga


contoh dari jenis ekonom situasi strategis ingin menganalisis. Contoh lain
termasuk tawar-menawar antara serikat pekerja dan perusahaan,
perdagangan perang antara dua negara, penelitian dan pengembangan ras
antara perusahaan, dan sebagainya. Kami mencari kerangka tunggal mampu
menangkap fitur penting dari masing-masing pengaturan dan banyak
lagi.Jadi, kita harus mencari unsur-unsur yang umum di antara mereka. Fitur
apa melakukan ini berbagi contoh? Nah, masing-masing melibatkan sejumlah
peserta - kita akan menyebut mereka pemain - yang masing-masing
memiliki berbagai tindakan yang mungkin yang dapat diambil - kita sebut
strategi tindakan - dan masing-masing dari mereka berasal satu hasil atau
lain tergantung pada strat sendiri egy pilihan serta strategi yang dipilih
oleh masing-masing pemain lainnya. Seperti telah menjadi tradisi, kita akan
mengacu pada situasi seperti sebagai permainan, meskipun taruhannya
mungkin cukup serius. Dengan pikiran dalam, menganggap definisi berikut.

Definisi 7.1 Permainan Formulir Strategis

Sebuah permainan bentuk strategis adalah sebuah tupelG=


(Si,ui)i=1,dimana untuk setiap pemain i=1,,N,Si adalah serangkaian
strategi yang tersedia bagi pemain, dan ui: xN j=1 Sj - Rmenggambarkan
pemain itu hasil sebagai fungsi dari strategi yang dipilih oleh semua pemain.

38
Sebuah permainan Bentuk strategis terbatas jika diatur strategi setiap
pemain s mengandung unsur finitely banyak.

Perhatikan bahwa definisi ini cukup umum untuk menutupi adonan-pitcher


duel kami.The 1 bentuk permainan strategis menggambarkan situasi itu,
ketika pitcher tersebut ditetapkan pemain 1, diberikan olehnya.

S1 = S2= (F,C)

u1(F,F) =u1(C, C) = -1

u1(F, C) = u1(C, F) = 1, dan

u2(s1, s2) = -u1( s1, s2) untuk semua (s1, s2) S1 x S2.

Perhatikan bahwa dua pemain game bentuk strategis dengan set strategi
terbatas selalu dapat direpresentasikan dalam bentuk matriks, dengan baris
mengindeks strategi pemain 1, kolom mengindeks strategi pemain 2, dan
entri yang menunjukkan hadiah mereka.

7.2.1 Strategi dominan

Setiap kali kita mencoba untuk memprediksi hasil dari permainan, adalah
lebih baik untuk melakukannya tanpa memerlukan bahwa pemain tahu
banyak tentang bagaimana lawan mereka akan berperilaku. Hal ini tidak
selalu mungkin, tapi ketika itu, solusi tiba di sangat meyakinkan. Pada bagian
ini, kita mempertimbangkan berbagai bentuk dominasi strategis, dan kami
melihat cara kita kadang-kadang dapat menggunakan ide-ide untuk
memecahkan, atau mempersempit, solusi untuk permainan.

Mari kita mulai dengan permainan bentuk dua pemain strategis dalam
Gambar. 7.2. Di sana, hasil-pilihan strategi memaksimalkan pemain 2
tergantung pada pilihan yang dibuat oleh pemain 1. Jika memilih 1 U (atas),
maka yang terbaik adalah untuk 2 untuk memilih L (kiri), dan jika memilih 1
D (turun), maka yang terbaik adalah untuk 2 untuk memilih R (kanan).

39
Akibatnya, pemain harus membuat 2 keputusan strategis, dan ia harus
mempertimbangkan dengan hati-hati keputusan pemain 1 sebelum
memutuskan apa yang harus dilakukan sendiri.

Apa yang akan pemain 1 lakukan? Perhatikan dengan seksama pada


hadiah dan Anda akan melihat bahwa pilihan pemain l'terbaik
sebenarnya tergantung pada pilihan yang dibuat oleh pemain 2. Terlepas
dari pilihan pemain 2, U yang terbaik untuk pemain 1. Akibatnya, pemain 1
pasti akan memilih U. Setelah menyimpulkan ini, pemain 2 kemudian akan
memilih L. Dengan demikian, satu-satunya hasil yang masuk akal dari
permainan ini adalah pasangan strategi (U, L), dengan vektor hasil terkait (3,
0).

Fitur khusus dari game ini yang memungkinkan kita untuk


memecahkan itu - untuk menyimpulkan hasil bila dimainkan oleh pemain
rasional - adalah bahwa pemain memiliki 1 strategi yang terbaik baginya
terlepas dari strategi yang dipilih oleh pemain 2. Setelah pemain 1
keputusan jelas, maka pemain 2 menjadi jelas juga.Dengan demikian, dalam
dua-pemain game, ketika seorang pemain memiliki semacam dominan
strategi, hasilnya agak mudah untuk menentukan.

L R

U 3,0 0,-4
2,4 -1,8
D

Gambar 7.2 Strategi Sticly Dominan

Untuk membuat ini sedikit lebih formal, kami memperkenalkan beberapa


notasi. Biarkan S = S1 X XSNmenunjukkan set strategi murni sendi. Simbol,
-i menunjukkan semua pemain kecuali pemain i. Jadi, misalnya, Si-

40
1menunjukkan unsur Si-1 yang dengan sendirinya menunjukkan setSi-1 XSi +1
x . x SN. Kemudian kita memiliki definisi berikut.

Definisi 7.2 Strategi Strictly Dominan

Strategi A, untuk pemain saya adalah benar-benar dominan apabila u (S1, S-


i)> ui(Si, S-i) untuk semua (S1, S-i) S dengan si si.

Kehadiran strategi ketat dominan, salah satu yang benar-benar unggul


semua strategi lain, agak jarang.Namun, bahkan ketika tidak ada strategi
yang ketat dominan tersedia, masih dimungkinkan untuk menyederhanakan
analisis permainan dengan mengesampingkan strategi yang jelas menarik
bagi pemain memiliki mereka.Perhatikan contoh digambarkan dalam
Gambar. 7.3. Pemain tidak memiliki strategi yang ketat dominan di sana.
Untuk melihat ini, perhatikan bahwa unik pilihan pemain l's terbaik
adalah U ketika 2 memainkan L, namun Dwhen 2 memainkan M, dan unik
pilihan 2 terbaik adalah L ketika 1 memainkan U, namun R ketika 1
memainkan D. Namun, setiap pemain memiliki strategi yang sangat menarik.
Cis strategi pemain l'selalu mengungguli oleh D, dalam arti bahwa hasil
yang ketat lebih tinggi bila D dipilih dibandingkan dengan ketika C dipilih
regardlessox strategi yang dipilih oleh pemain 2. Dengan demikian, kita
dapat menghapus C dari pertimbangan. Pemain 1 tidak akan memilihnya.
Demikian pula, strategi pemain 2 A / R yang mengungguli oleh (check this)
dan dapat dihapus dari pertimbangan juga. Sekarang C dan M telah dihapus,
Anda akan melihat bahwa permainan telah dikurangi dengan yang Gambar.
7.2. Dengan demikian, seperti sebelumnya, satu-satunya hasil yang masuk
akal adalah (3, 0). Sekali lagi, kami telah menggunakan ide dominasi untuk
membantu kami memecahkan permainan. Tapi kali ini kami terfokus pada
dominasi salah satu strategi di atas yang lain, daripada atas semua orang
lain.

41
Definisi 7.3 Strictly Didominasi Strategi

Pemain adalah strategi, ketat mendominasi yang lain dari strategi nyasi,
apabila ui( si, s-i) > ui ( si, s-i)untuk semuas- i S-i.Dalam kasus ini, kita juga
mengatakan bahwa Si, secara ketat mendominasi di S.

Seperti yang telah kita perhatikan, kehadiran strategi ketat dominan


atau ketat didominasi dapat menyederhanakan analisis permainan cukup
untuk membuat itu benar-benar dipecahkan.Ini adalah pelajaran untuk
meninjau teknik solusi kami untuk permainan Figs. 7.2 dan 7.3.

L M R

3,0 0,-5 0,-4 U

1,-1 3,3 -2,4


C
2,4 4,1 -1,8
D

Gambar 7.3

Dalam permainan Gambar.7.2, kami mencatat bahwa U adalah benar-


benar dominan untuk pemain 1.Kami, oleh karena itu mampu menghilangkan
D dari pertimbangan. Setelah selesai, kami kemudian dapat menyimpulkan
bahwa pemain akan memilih 2 L, atau berapa jumlahnya untuk hal yang
sama, kami mampu menghilangkan Perhatikan bahwa meskipun R. R tidak
ketat mendominasi dalam permainan asli, itu didominasi ketat (by L) pada
game berkurang di mana D strategi dihilangkan. Ini meninggalkan: solusi
yang unik (U, L). Dalam permainan Gambar.7.3, pertama-tama kita
dihilangkan C untuk 1 dan Mfor2 (masing-masing yang ketat mendominasi),
kemudian (. Mengikuti Ara 7,2 analisis) dihilangkan D untuk 1, kemudian
dihilangkan R untuk 2. Ini lagi meninggalkan pasangan strategi yang unik (U,

42
L).Sekali lagi, perhatikan bahwa tidak ketat mendominasi dalam permainan
asli, namun itu benar-benar mendominasi dalam permainan berkurang di
mana Chas dieliminasi.Demikian pula, 7?menjadi ketat didominasi hanya
setelah kedua C dan Dhave dieliminasi. Kita sekarang meresmikan ini
prosedur iteratif menghilangkan strategi ketat mendominasi.

BiarkanS1 = S1 untuk setiap pemain i, dan untuk n 1. mari kita


menunjukkan strategi-strategi pemain bertahan setelah putaran n eliminasi.
Artinya, si Si n apabila si Si n-1 tidak ketat didominasi masuk S n-1

Definisi 7,4 iteratif Strictly Undominated Strategi

Sebuah strategi si, untuk pemain i iteratif ketat undominated di S (atau


bertahan iteratif penghapusan strategi ketat didominasi) jika si Si n untuk
semua n 1.

Sejauh ini, kita telah membahas gagasan hanya dominasi yang


ketat.Terkait gagasan dominasi lemah juga tersedia.Secara khusus,
mempertimbangkan analog berikut Definisi 7.3 dan 7.4.

Definisi 7,5 Strategi Lemah Didominasi

Pemain i itu, lemah mendominasi yang lain dari strategi itu, si, apabila ui (si,
s-i) ui (si, s-i) untuk semua s-I S-i,dengan setidaknya satu ketimpangan
yang ketat. Dalam kasus ini, kita juga mengatakan bahwa lemah
mendominasi di S.

Perbedaan antara dominasi lemah dan ketat dapat dilihat dalam


contoh Gambar. 7.4. Dalam game ini, pemain tidak memiliki strategi ketat
mendominasi. Namun, baik D dan Langka lemah didominasi oleh U dan L,
masing-masing.Dengan demikian, menghilangkan strategi ketat didominasi
tidak berpengaruh di sini, sementara menghilangkan strategi lemah
mendominasi isolat pasangan strategi yang unik (U, L).Seperti dalam kasus

43
dominasi yang ketat, kita juga mungkin ingin iteratif menghilangkan strategi
lemah.

L R

1,1 0,0 U
0,0 0,0
D
Gambar 7.4 Strategi Lemah Didominasi

Dengan pikiran dalam, biarkan W1 = S1 untuk setiap pemain i, dan untuk n


1. biarkan Wi menunjukkan strategi-strategi pemain saya bertahan setelah
putaran n eliminasi strategi lemah mendominasi. Artinya, si Wi n apabila si
Wi n-1 tidak lemah didominasi masuk Wn-1 = W1 n-1 x x WN n-1.

Definisi 7,6 iteratif Lemah Undominated Strategi

Sebuah strategi s, untuk pemain i iteratif lemah undominated di S (atau


bertahan iteratif penghapusan strategi lemah didominasi) jika untuk semua.
Harus jelas bahwa serangkaian strategi yang tersisa setelah menerapkan
berulang dominasi lemah terkandung dalam set yang tersisa setelah
menerapkan berulang dominasi yang ketat. Anda akan diminta untuk
menunjukkan ini dalam salah satu latihan.

Untuk mendapatkan merasakan kekuatan kadang-kadang mengejutkan


iteratif argumen dominasi, menganggap pertandingan berikut yang disebut
'Tebak Rata-rata' di mana N> 2 pemain mencoba untuk
outguess satu sama lain. Setiap pemain secara bersamaan harus memilih
integer antara 1 dan 100. Orang yang paling dekat dengan sepertiga rata-
rata menebak menang $ 100, sedangkan yang lain mendapatkan apa-apa.
Hadiah $ 100 dibagi secara merata jika ada hubungan. Sebelum membaca,
berpikir sejenak tentang bagaimana Anda akan memainkan permainan ini
ketika ada, katakanlah, 20 pemain.

44
Mari kita lanjutkan dengan menghilangkan strategi lemah
mendominasi.Perhatikan bahwa memilih nomor 33 lemah mendominasi
semua nomor yang lebih tinggi. Hal ini karena sepertiga rata-rata dari angka-
angka harus kurang dari atau sama dengan 33. Akibatnya, terlepas dari
nomor yang lain 'diumumkan, 33 tidak lebih buruk pilihan daripada
jumlah yang lebih tinggi, dan jika semua pemain lain terjadi untuk memilih
nomor 34, maka pilihan 33 secara ketat baik dari semua nomor yang lebih
tinggi. Dengan demikian, kita dapat menghilangkan semua nomor di atas 33
dari pertimbangan untuk semua pemain. Oleh karena itu, Tapi argumen yang
sama menetapkan bahwa semua angka di atas 11 yang lemah mendominasi
di W1. Dengan demikian, Melanjutkan dengan cara ini menetapkan bahwa
untuk setiap pemain, satu-satunya strategi hidup berulang dominasi lemah
adalah memilih nomor 1.

Jika Anda telah menjaga duel adonan-pitcher di belakang pikiran Anda,


Anda mungkin telah memperhatikan bahwa dalam permainan itu, ada
strategi untuk pemain baik adalah sangat lemah atau mendominasi. Oleh
karena itu, tidak ada prosedur penghapusan kami telah menjelaskan akan
mengurangi strategi dipertimbangkan ada sama sekali. Meskipun prosedur
eliminasi adalah jelas sangat membantu dalam beberapa keadaan, kita tidak
lebih dekat untuk memecahkan duel adonan-pitcher daripada kami ketika
kita menyisihkannya.Sekarang saatnya untuk mengubah itu.

7.2.2 EKUILIBRIUM NASH

Menurut teori permintaan dan penawaran, gagasan keseimbangan


pasar di mana permintaan sama dengan pasokan pusat. Daya tarik teoritis
dari konsep ini muncul karena dalam situasi seperti ini, tidak ada
kecenderungan atau kebutuhan untuk perilaku seseorang untuk berubah.Ini
keteraturan dalam perilaku membentuk dasar untuk membuat prediksi.

Dengan pandangan menuju membuat prediksi, kami ingin


menggambarkan keteraturan potensial dalam perilaku yang mungkin timbul

45
dalam pengaturan strategis. Pada saat yang sama, kita ingin
menggabungkan gagasan bahwa pemain baik dalam arti bahwa mereka
bertindak sendiri dan mementingkan kepentingan mereka dan bahwa
mereka sepenuhnya menyadari keteraturan dalam perilaku orang lain.
Dalam pengaturan strategis, seperti dalam pengaturan permintaan-
penawaran, keteraturan dalam perilaku yang dapat berkelanjutan akan
disebut kesetimbangan. Dalam Bab 4, kita sudah menemukan gagasan
keseimbangan Nash dalam konteks strategis Cournot duopoli. Konsep ini
generalises untuk sewenang-wenang permainan bentuk strategis. Memang,
kesetimbangan Nash, diperkenalkan di Nash (1951), adalah yang paling
penting keseimbangan konsep dalam semua teori permainan.

Secara informal, suatu strategi bersama 'se S merupakan


ekuilibrium Nash asalkan masing-masing individu, sementara sepenuhnya
menyadari orang lain' perilaku, tidak memiliki insentif untuk mengubah
sendiri. Dengan demikian, keseimbangan Nash menggambarkan perilaku
yang dapat dipertahankan secara rasional.Secara formal, konsep
didefinisikan sebagai berikut.

Definisi 7.7 Strategi Nash Equilibrium

Murni Mengingat permainan bentuk strategis, strategi bersama merupakan


strategi kesetimbangan Nash murni G jika untuk setiap pemain untuk semua.

Perhatikan bahwa dalam setiap permainan Figs. 7,2-7,4, pasangan


strategi (U. L) merupakan strategi kesetimbangan Nash murni. Untuk melihat
ini dalam permainan Gambar.7.2, pertimbangkan dulu apakah pemain 1
dapat meningkatkan hasil nya dengan mengubah pilihannya strategi dengan
strategi pemain 2 yang tetap. Dengan beralih ke D, pemain 1 hasil jatuh 3-2.
Akibatnya, pemain 1 tidak dapat meningkatkan hasil nya. Demikian juga,
pemain 2 tidak dapat meningkatkan hasil nya dengan mengubah strateginya
ketika strategi pemain tetap pada U. Oleh karena itu (U, L) memang

46
ekuilibrium Nash dari permainan pada Gambar. 7.2. Yang lain bisa (dan
harus) sama diperiksa.

Sebuah permainan mungkin memiliki lebih dari satu ekuilibrium


Nash.Misalnya, dalam permainan Gambar. 7,4, (D. R) juga merupakan
strategi kesetimbangan Nash murni karena pemain tidak ketat dapat
meningkatkan hasil nya dengan beralih strategi ketika pilihan strategi
pemain lain adalah tetap. Beberapa game tidak memiliki apapun strategi
murni Nash kesetimbangan. Seperti yang bisa Anda tebak, ini adalah kasus
untuk adonan-pitcher permainan duel kami di Gambar.7.1, direproduksi
sebagai Gambar. 7,5.

Mari kita periksa bahwa tidak ada strategi kesetimbangan Nash murni
di sini. Ada tapi empat kemungkinan: (F, F), (F. C). (C. F), dan (C, Q. Kami
akan memeriksa satu, dan menyerahkan kepada Anda untuk memeriksa
yang lain. Bisa (F, F) menjadi strategi kesetimbangan Nash murni? Hanya jika
pemain tidak dapat meningkatkan hasil nya dengan secara sepihak
menyimpang dari bagian nya (F, F) Mari kita mulai dengan

F C

-1,1 1,-1 F
1,-1 -1,1
C
Gambar 7.5

adonan Ketika (F. F) dimainkan, adonan menerima hasil dari 1.. Dengan
beralih ke C,.strategi bersama menjadi (F. C) ( ingat, kita harus memegang
strategi pitcher tetap pada F), dan adonan menerima -1 Akibatnya, adonan
tidak dapat meningkatkan hasil nya dengan beralih ing.. Bagaimana
pitcher? Pada (F. F), pitcher menerima hasil dari -.. 1 Dengan beralih ke C,
strategi bersama menjadi (C. F) dan pitcher menerima 1, perbaikan
demikian, kendi dapat meningkatkan hasil nya dengan secara sepihak

47
beralih strategi, dan sebagainya (F. F) tidak strategi kesetimbangan Nash
murni. Argumen yang sama berlaku untuk tiga kemungkinan lain.

Tentu saja, ini adalah yang diharapkan dalam terang analisis heuristik
kita duel adonan-pitcher di awal bab ini..sana kita menyimpulkan bahwa baik
adonan dan pitcher harus berperilaku dalam cara yang tak terduga. Tapi
diwujudkan dalam definisi keseimbangan strategi Nash murni adalah bahwa
setiap pemain tahu persis mana strategi masing-masing pemain lain akan
memilih. Artinya, dalam ekuilibrium strategi Nash murni, pilihan semua
orang secara sempurna diprediksi Duel adonan-pitcher terus keluar
analisis..Tapi kita cepat mendekati itu.

Strategi campuran dan Nash Equilibrium

Sebuah cara ampuh untuk membuat pilihan dengan cara yang orang lain
tidak bisa memprediksi adalah untuk membuatnya dengan cara yang Anda
sendiri catmol memprediksi. Dan cara paling sederhana untuk melakukannya
adalah untuk randomise di antara pilihan Anda. Misalnya, dalam duel
adonan-pitcher, baik adonan dan pitcher dapat menghindari pilihan mereka
diprediksi oleh lain hanya dengan melempar koin untuk menentukan pilihan
untuk membuat.

Mari kita luangkan waktu untuk melihat bagaimana ini memberikan


solusi untuk duel adonan-pitcher.Misalkan kedua adonan dan teko memiliki
dengan mereka sebuah koin.Tepat sebelum masing-masing untuk melakukan
tugasnya, mereka masing-masing (secara terpisah) melemparkan koin
mereka.Jika koin muncul kepala, pemiliknya memilih F, jika ekor, C.
Selanjutnya, anggaplah bahwa masing-masing dari mereka adalah sangat
menyadari bahwa hal itu.Mengingat metode yang membuat setiap pemain
pilihannya, tidak dapat meningkatkan hasil dengan membuat pilihannya pun
berbeda.Mari kita melihat mengapa.

48
Pertimbangkan pelempar. Dia tahu bahwa adonan melempar koin
untuk memutuskan apakah akan bersiap-siap untuk fastball (F) atau kurva
(Q. Jadi, ia tahu bahwa adonan akan memilih F dan C masing-masing dengan
probabilitas satu-setengah. Akibatnya, masing-masing pilihan sendiri pitcher
akan menginduksi lotre atas hasil yang mungkin dalam permainan Karena itu
marilah kita berasumsi bahwa hadiah para pemain sebenarnya von
Neumann-Morgenstern utilitas,.dan bahwa mereka akan berperilaku untuk
memaksimalkan utilitas yang diharapkan mereka.

Apa kemudian adalah utilitas yang diharapkan yang pitcher berasal


dari pilihan yang tersedia baginya? Jika dia hanya untuk memilih F
(mengabaikan koin nya), utilitas yang diharapkan itu akan, sedangkan jika ia
memilih C, akan. Dengan demikian, mengingat fakta bahwa adonan memilih
F dan C dengan probabilitas satu-tiap babak, pitcher acuh tak acuh antara F
dan C nya. Jadi, saat memilih baik untuk C akan memberikan pitcher hasil
tertinggi nya nol, demikian juga akan randomisasi antara mereka dengan
probabilitas satu-setengah pada masing-masing. Demikian pula, mengingat
bahwa pitcher adalah randomisasi antara F dan C dengan probabilitas satu-
setengah pada masing-masing, adonan juga dapat memaksimalkan utilitas
yang diharapkan nya dengan randomisasi antara Fand C dengan probabilitas
yang sama. Singkatnya, pilihan acak para pemain 'membentuk
kesetimbangan: masing-masing sadar manusia (acak) ner di mana yang
lain membuat pilihannya, dan tidak dapat meningkatkan hasil yang
diharapkan nya dengan secara sepihak mengubah cara di mana pilihannya
dibuat.

Untuk menerapkan ide-ide untuk umum permainan bentuk strategis,


pertama-tama kita secara resmi memperkenalkan gagasan strategi
campuran.

Definisi 7.8 Strategi Campuran

49
Perbaiki permainan bentuk terbatas strategis Sebuah strategi campuran,
m,.untuk pemain saya adalah distribusi probabilitas atas Yaitu, memberikan
kepada masing-masing, proba jawab mil (Si), yang Sj akan dimainkan.
Kami akan menunjukkan set strategi campuran untuk pemain i oleh M.
Akibatnya, esi m '(5 /) akan memanggil pemain Sj i diatur strategi
murni.

Dengan demikian, strategi campuran adalah sarana yang pemain


randomise pilihan mereka. Salah satu cara untuk memikirkan strategi
campuran hanya sebagai roda rolet dengan nama strategi murni berbagai
dicetak pada bagian roda. Roda rolet yang berbeda mungkin memiliki bagian
yang lebih besar ditugaskan untuk salah satu strategi murni atau yang lain,
menghasilkan probabilitas yang berbeda bahwa strategi-strategi yang akan
dipilih. Himpunan strategi campuran ini kemudian himpunan semua roda
roulette tersebut.

Setiap pemain 7 sekarang diizinkan untuk memilih dari himpunan M


strategi campuran, bukan Sj. Catatan bahwa ini memberikan setiap pemain /
pilihan ketat lebih dari sebelumnya, karena setiap strategi murni 5, e 5,
diwakili di M, dengan distribusi probabilitas (degenerate) menetapkan
probabilitas satu ke s,. menunjukkan set strategi campuran bersama. Mulai
sekarang, kita akan membuang kata campuran dan hanya menelepon saya
m strategi bersama dan /;, e A /, - strategi untuk pemain /?. Jika Uj adalah
von Neumann-Morgenstern fungsi utilitas pada 5, dan strategi saya Mis
dimainkan, maka pemain utilitas yang diharapkan adalah

ui (m) = .

Formula ini mengikuti dari kenyataan bahwa para pemain memilih strategi
mereka secara mandiri.Akibatnya, probabilitas bahwa S strategi murni s
yang dipilih adalah produk dari probabilitas bahwa setiap komponen terpisah

50
yang dipilih, yaitu m \ (s \).Kita sekarang memberikan konsep keseimbangan
pusat untuk permainan bentuk strategis.

Definisi 7,9 Nash Equilibrium

Mengingat permainan bentuk terbatas strategis strategi bersama saya M


adalah ekuilibrium Nash dari G jika untuk setiap pemain saya, (saya, m_y)
untuk semua m, e M, -. Dengan demikian, dalam ekuilibrium Nash, setiap
pemain dapat randomisasi pilihan, dan tidak ada pemain dapat
meningkatkan hasil yang diharapkan nya dengan secara sepihak randomisasi
pun berbeda.

Ini mungkin tampak bahwa memeriksa keseimbangan Nash


memerlukan pemeriksaan, untuk setiap pemain / ', setiap strategi di
set terbatas A /, - melawan fn,. Hasil berikut menyederhanakan tugas ini
dengan mengambil keuntungan dari linearitas

Teorema 7.1 Sederhana Nash Equilibrium

Tes Pernyataan berikut adalah ekuivalen: fn e M adalah ekuilibrium Nash.


Untuk setiap pemain i, Uj (fn) untuk setiap Sj e S, diberi bobot positif Menurut
teorema.

Pernyataan (b) dan (c) menawarkan metode alternatif untuk check-ing


untuk keseimbangan Nash.Pernyataan (b) yang paling berguna untuk
komputasi Nash kesetimbangan.Ia mengatakan bahwa seorang pemain
harus bersikap acuh tak acuh antara semua strategi murni diberi bobot
positif dengan strategi campuran dan bahwa masing-masing harus tidak
lebih buruk daripada strategi murni nya diberikan nol berat badan.
Pernyataan (c) mengatakan bahwa itu sudah cukup untuk memeriksa setiap
pemain bahwa tidak ada strategi yang murni menghasilkan hasil yang lebih
tinggi diharapkan dari strategi campuran nya agar vektor strategi campuran
membentuk keseimbangan Nash. Bukti: Kita mulai dengan menunjukkan
pernyataan bahwa (a) menyiratkan (b). Misalkan pertama yang fn adalah

51
keseimbangan Nash. Akibatnya, </,(m) > uy (/ ny, M_ /) untuk semua /;,, e
A / /. Secara khusus, untuk setiap e Sj Sj. kita dapat memilih / /;,.menjadi
strategi memberikan probabilitas satu ke s,, sehingga ; U / (S /, M_ /) berlaku
pada kenyataannya untuk setiap s, e Sj. Masih menunjukkan bahwa / /, (/ , ;)
- TIJ (Sj. fh-f) untuk setiap s, e 5y diberi bobot positif m, - Sekarang jika salah
satu nomor berbeda dari (/, (/ ) maka setidaknya satu akan ketat... besar
karena (/, (/?)? adalah kombinasi cembung yang ketat dari mereka. Tapi ini
akan bertentangan dengan ketidaksetaraan saja didirikan.

Karena itu jelas bahwa pernyataan (b) menyiratkan (c), tetap hanya
untuk menetapkan bahwa (c) menyiratkan (a). Jadi, misalkan Uj {m)&gt; t / /
(s,, M_ /) untuk setiap 5, 5 e / dan setiap pemain /. Memperbaiki / pemutar
dan m, e A / /. Karena jumlah, (/ /),, M_ /) adalah kombinasi cembung nomor
{u / (S /, / h-/)} s, eS,. kita memiliki u; (m)&gt; Ui (m &quot;Karena kedua
pemain dan strategi yang dipilih adalah sewenang-wenang, fn adalah
ekuilibrium Nash

Contoh I G. 7.1

Mari kita perhatikan contoh untuk melihat ide-ide di tempat kerja Anda dan
kolega. diminta untuk mengumpulkan laporan yang harus siap dalam satu
jam. Anda setuju untuk membagi pekerjaan menjadi dua bagian. Untuk
cemas bersama Anda, Anda masing-masing menemukan bahwa pengolah
kata yang Anda gunakan tidak kompatibel dengan satu kegunaan lain. Untuk
menempatkan laporan bersama dalam kekuatiran layak ion, salah satu
dari Anda harus beralih ke pengolah kata yang lain Tentu saja,.karena mahal
untuk menjadi akrab dengan pengolah kata baru, masing-masing dari Anda
lebih suka bahwa switched lainnya. Di lain tangan, masing-masing dari Anda
lebih memilih untuk beralih ke pengolah kata yang lain daripada gagal untuk
mengkoordinasikan sama sekali.

WP MW

52
2,1 0,0 WP
0,0 1,2
MW
Gambar 7.6

Akhirnya, misalkan tidak ada waktu untuk Anda berdua ke Limbah


membahas masalah koordinasi.Masing-masing harus memutuskan pengolah
kata untuk digunakan dalam privasi kantornya sendiri.

Situasi ini diwakili oleh permainan Gambar. 7.6. Pengolah kata pemain
l&#39;s \ WP, dan pemain 2 adalah MW. Mereka masing-masing memperoleh
suatu hasil dari nol karena gagal untuk mengkoordinasikan, sebuah hasil dari
2 dengan koordinasi pada pengolah kata mereka sendiri, dan hasil dari 1
dengan koordinasi pada prosesor kata lain. Permainan ini memiliki dua
strategi murni ekuilibria Nash, yaitu, (WP, WP) dan (MW, MW).

Apakah ada kesetimbangan Nash dalam strategi campuran?Jika


demikian, maka mudah untuk melihat dari Gambar. 7,6 bahwa kedua pemain
harus memilih masing-masing strategi murni mereka dengan probabilitas
ketat positif. Mari kemudian p&gt; 0 menunjukkan kemungkinan bahwa
pemain memilih 1 pengolah kata rekannya, MW, dan biarkan q&gt; 0
menunjukkan kemungkinan bahwa pemain memilih 2 col nya kata liga WP
prosesor. Dengan bagian (b) dari Teorema 7.1, setiap pemain harus bersikap
acuh tak acuh antara masing-masing strategi murni nya. Untuk pemain 1, ini
berarti bahwa untuk pemain dan 2, ini berarti

(1 - p) (l) + P (0) = (1 - p) (0) + p (2).

Pemecahan ini menghasilkan p-q = 1/3. Dengan demikian, strategi


(campuran) di mana setiap pemain memilih pengolah kata rekannya dengan
probabilitas 1/3 dan sendiri dengan probabilitas 2/3 adalah keseimbangan
Nash ketiga game ini. Tidak ada orang lain.

53
Permainan Contoh 7.1 menarik dalam sejumlah hal. Pertama, ia
memiliki beberapa kesetimbangan Nash, sebagian, murni lain tidak. Kedua,
salah satu dari kesetimbangan ini adalah ketidak sien. Perhatikan bahwa
dalam kesetimbangan campuran-strategi, hasil masing-masing pemain yang
diharapkan adalah 2/3, sehingga masing-masing akan ketat lebih baik adalah
salah satu strategi kesetimbangan murni dimainkan.

Ketiga, keseimbangan campuran-strategi hadir meskipun ini bukan


permainan di mana pemain baik ingin berperilaku dalam cara yang tak
terduga. Haruskah kita kemudian mengabaikan keseimbangan campuran-
strategi kita temukan di sini, karena di dalamnya, strategi campuran tidak
melayani tujuan mereka diperkenalkan untuk melayani? No Meskipun kita
pertama kali diperkenalkan strategi campuran untuk memberikan pemain
kesempatan untuk berperilaku tak terduga jika mereka diinginkan, ada cara
lain untuk menafsirkan makna dari strategi campuran. Daripada memikirkan
strategi campuran untuk pemain 1, mengatakan, sebagai randomisasi
disengaja di pihaknya, menganggapnya sebagai sebuah ekspresi dari
keyakinan para pemain lain mengenai strategi murni bahwa pemain akan
memilih 1. Jadi, misalnya, dalam permainan kami Gambar. 7,6,
keseimbangan strategi pemain l&#39;s menempatkan probabilitas 1/3 on
MW dan 2/3 pada WP dapat ditafsirkan untuk mencerminkan ketidakpastian
pemain 2 mengenai strategi murni bahwa pemain akan memilih 1. Pemain 2
percaya bahwa pemain akan memilih 1 MW dengan probabilitas 1/3 dan WP
dengan probabilitas 2/3. Demikian pula, keseimbangan strategi campuran
pemain 2 s di sini tidak perlu mencerminkan gagasan bahwa pemain 2
sengaja mengacak antara WP dan MW, melainkan dapat diartikan sebagai
keyakinan pemain 1 &#39;s tentang probabilitas bahwa pemain 2 akan
memilih salah satu strategi murni atau yang lain.

Jadi, sekarang kita memiliki dua interpretasi yang mungkin strategi


campuran kita miliki. Di satu sisi, mereka mungkin merupakan perangkat
fisik yang sebenarnya (roda roulette) bahwa pemain digunakan untuk

54
sengaja randomise pilihan murni strategi mereka. Di sisi lain, strategi
campuran pemain hanya dapat mewakili keyakinan bahwa orang lain terus
tentang strat murni egy bahwa ia mungkin memilih. Dalam penafsiran ini
yang terakhir, tidak ada pemain yang secara eksplisit randomisasi pilihannya
strategi murni. Apakah kita memilih untuk mempekerjakan satu interpretasi
atau yang lain tergantung pada konteksnya. Biasanya, interpretasi roda rolet
masuk akal dalam permainan seperti duel adonan-kendi di mana
kepentingan para pemain lawan, sedangkan interpretasi keyakinan berbasis
lebih cocok untuk permainan seperti yang pada Gambar. 7,6, di mana
kepentingan para pemain sampai batas tertentu, bertepatan.

Apakah setiap pertandingan memiliki setidaknya satu ekuilibrium


Nash?Ingatlah bahwa dalam kasus keseimbangan strategi murni Nash,
jawabannya tidak (duel adonan-pitcher).Namun, setelah strategi campuran
diperkenalkan, jawabannya adalah ya cukup umum.

Teorema 7.2 (Nash) Keberadaan Nash Equilibrium

Setiap permainan bentuk terbatas strategis memiliki setidaknya satu


kesetimbangan Nash. Bukti:... Misalkan G = (S, U / Oylj menjadi permainan
bentuk terbatas strategis Untuk menjaga sederhana notasi, mari kita
asumsikan bahwa setiap pemain memiliki jumlah yang sama dari strategi
murni, n Dengan demikian, untuk setiap pemain / &#39;, kita mungkin
indeks masing-masing strategi murni nya dengan salah satu nomor 1 sampai
dengan nand sehingga kita dapat menulis 5 / = {1,2 n). Akibatnya, Uj (j \, ji
menunjukkan imbalannya untuk pemain ketika pemain memilih 1 murni
strategy71 pemain memilih strategi 2 ji murni dan pemain N (booses murni
Pemain strategi,.&quot;S set strategi campuran adalah M, = {(menjalankan
min) e ik &quot;2 ~ 2 / l = mii = H. mana saya menunjukkan kemungkinan
ditugaskan untuk strategi isyth pemain murni. Perhatikan bahwa AT, tidak
kosong, kompak, dan cembung.

55
Kita akan menunjukkan bahwa keseimbangan Nash dari G ada dengan
menunjukkan adanya titik tetap dari fungsi yang tetap poin tentu
kesetimbangan dari G. Dengan demikian, sisa bukti terdiri dari tiga langkah:
(1) membangun fungsi, (2) membuktikan bahwa ia memiliki titik tetap, dan
(3) menunjukkan bahwa titik tetap adalah ekuilibrium Nash dari G.

Langkah 1: Tentukan f: M -&gt; A / sebagai berikut. Untuk setiap M saya,


setiap pemain / &#39;, dan masing-masing j strategi murni nya, biarkan

Langkah 2: Karena pembilang mendefinisikan fn adalah kontinu dalam m,


dan penyebutnya adalah baik terus menerus di dalam dan melompat jauh
dari nol (memang, itu adalah tidak pernah kurang dari satu), /. adalah fungsi
kontinu dari dalam untuk setiap / dan j. Akibatnya, f adalah fungsi kontinu
pemetaan M set tidak kosong, kompak, dan cembung ke dalam dirinya
sendiri. Oleh karena itu kita mungkin berlaku fixed-point teorema Brouwer
(ALU Teorema) menyimpulkan bahwa / &quot;memiliki

Langkah titik tetap 3:. Karena f {fn) = fn kita memiliki MFH) = ntn untuk
semua pemain / dan strategi murni gies j. Akibatnya, dengan definisi mana
kesetaraan pertama berikut karena jumlahnya nrtg untuk salah satu dari j
Akibatnya,. (Pl) dapat ditulis ulang Tetapi jumlah di sisi kanan dapat menjadi
nol hanya jika </,(/, /??_,) Uj(fn) < 0 for every j. (If (//(/, fh-i) u,(m) > 0
untuk j tertentu, maka istilah YTH dalam jumlah yang ketat positif. Karena
tidak ada istilah dalam jumlah yang negatif, ini akan membuat jumlah
seluruh ketat positif) Oleh karena itu., Dengan bagian (c) Teorema 7.1. fn
adalah ekuilibrium Nash. Saya

Teorema 7.2 sangat luar biasa.Ia mengatakan bahwa tidak peduli


berapa banyak pemain yang terlibat, asalkan masing-masing memiliki

56
strategi murni finitely banyak akan ada setidaknya satu Nash equilibrium.
Dari sudut pandang praktis, ini berarti bahwa pencarian keseimbangan Nash
tidak akan sia-sia. Lebih penting lagi, Namun, teorema menetapkan bahwa
gagasan keseimbangan Nash adalah koheren dengan cara yang mendalam.
Jika kesetimbangan Nash jarang ada, ini akan menunjukkan inkonsistensi
mendasar dalam definisi. Bahwa Nash kesetimbangan selalu ada dalam
permainan terbatas merupakan salah satu ukuran kesehatan dari ide.

7.2.3 INFORMASI LENGKAP

Meskipun berbagai macam situasi dapat dimodelkan sebagai bentuk


permainan strategis, analisis kami dari permainan ini sejauh ini tampaknya
dikenakan pembatasan agak penting. Sampai saat ini, ketika kita telah
mempertimbangkan berulang dominasi yang ketat atau lemah, atau
keseimbangan Nash sebagai metode kami memecahkan permainan, kami
selalu menganggap bahwa setiap pemain yang sempurna diberitahu tentang
hadiah dari semua pemain lain. Jika tidak, para pemain tidak bisa melakukan
perhitungan yang diperlukan untuk menurunkan strategi optimal.

Tapi banyak situasi kehidupan nyata melibatkan dosis besar informasi


lengkap tentang hadiah lawan &#39;. Perhatikan, misalnya, dua perusahaan
bersaing untuk keuntungan di pasar yang sama. Hal ini sangat mungkin
bahwa salah satu atau keduanya secara tidak sempurna informasi tentang
biaya yang lain produksi. Bagaimana kita menganalisis situasi semacam itu?
Idenya adalah untuk menambahkan untuk itu salah satu bahan lebih
sehingga menjadi bentuk permainan strategis. Kami kemudian akan mampu
menerapkan salah satu metode solusi berbagai yang kami kembangkan
sejauh ini. Ide-ide yang dipelopori di Harsanyi (1967-1968).

Bahan tambahan adalah spesifikasi dari keyakinan masing-masing


perusahaan tentang biaya perusahaan lain. Sebagai contoh, kita mungkin
menetapkan bahwa perusahaan 1 percaya bahwa kemungkinan yang sama
bahwa perusahaan 2 adalah perusahaan tinggi atau rendah biaya. Selain itu,

57
kita mungkin ingin menangkap gagasan bahwa biaya dari dua perusahaan
tersebut berkorelasi. Misalnya, ketika biaya perusahaan l&#39;s rendah
mungkin lebih mungkin bahwa biaya perusahaan 2 adalah juga rendah. Oleh
karena itu, kita mungkin menetapkan bahwa saat biaya l&#39;perusahaan s
rendah ia percaya bahwa biaya 2 adalah dua kali lebih mungkin untuk
menjadi rendah setinggi dan bahwa ketika perusahaan 1 &#39;s biaya tinggi
ia percaya bahwa biaya 2 adalah dua kali lebih cenderung tinggi serendah .
Sebelum terlalu jauh ke depan, adalah berguna untuk meresmikan beberapa
pikiran kita sampai sekarang.

Pertimbangkan kelas berikut situasi strategis di mana informasi incom-


plete. Seperti biasa, ada pemain finitely banyak / N = 1, dan satu set strategi
murni, 5,.untuk masing-masing. Selain itu, bagaimanapun, mungkin ada
ketidakpastian mengenai hadiah dari beberapa dari mereka. Untuk
menangkap ini, kami memperkenalkan untuk setiap pemain / himpunan yang
terbatas, 7}, jenis yang mungkin &#39;bahwa pemain mungkin. Kami
mengizinkan hadiah pemain bergantung seperti biasa pada strategi yang
dipilih murni bersama, tetapi juga pada jenis sendiri serta pada jenis yang
lain. Artinya, pemain / s fungsi hasil (peta 5 x T ke R, di mana T = x_j 7), dan
5 adalah himpunan strategi murni sendi. Oleh karena itu, i /, (s, t) adalah
pemain adalah von Neumann-Morgenstern utilitas ketika strategi murni
bersama adalah 5 dan jenis vektor-bersama adalah t. Memungkinkan pemain
hasil fs bergantung pada jenis pemain lain memungkinkan kita untuk
menganalisis situasi di mana informasi yang dimiliki oleh satu pemain
mempengaruhi hasil dari yang lain. Misalnya, dalam pelelangan saluran
minyak lepas pantai! bidder dalam hasil serta upaya optimal nya akan
tergantung pada kemungkinan bahwa saluran tersebut mengandung minyak,
sesuatu yang penawar lain mungkin memiliki informasi.

Akhirnya, kami memperkenalkan bahan tambahan yang


memungkinkan kita untuk menggunakan solusi kami telah mengembangkan
di bagian sebelumnya. Bahan tambahan spesifikasi, untuk setiap / pemain

58
dan masing-masing jenis nya t &quot;dari keyakinan ia memegang tentang
jenis yang lain mungkin. Secara formal, untuk setiap pemain / f dan setiap
jenis, e 7), mari / j, (r_ / | ry) menunjukkan pemain prob kemampuan /
&#39;memberikan ke acara yang lain adalah jenis F_, - e 71 / ketika tipenya
adalah fy. Menjadi probabilitas, kami mengharuskan setiap / j / (F_ / | r,)
berada di [0, 1], dan kami juga memerlukan Hal ini sering berguna untuk
menentukan keyakinan para pemain &#39;sehingga mereka dalam arti
konsisten tenda dengan satu sama lain. Sebagai contoh, seseorang mungkin
ingin menegaskan bahwa dua pemain akan setuju tentang apa yang jenis
pemain ketiga memiliki probabilitas yang positif. Sebuah cara standar untuk
mencapai semacam ini konsistensi dan lebih adalah untuk menganggap
bahwa keyakinan para pemain &#39;dihasilkan dari distribusi probabilitas
tunggal / Jover jenis ruang sendi T. Secara khusus, misalkan untuk setiap (e
T. p (t)&gt; 0 dan p (t) = 1 - Jika kita berpikir tentang pemain &#39;.
gabungan tipe T-vektor kembali sebagai yang dipilih oleh Nature menurut p
maka menurut Bayes&#39; rule (lihat juga bagian 7.3.7.) pemain fs
keyakinan tentang. jenis yang lain &#39;ketika tipenya adalah tj dapat
dihitung dari p sebagai berikut: Jika semua pj semua dapat dihitung dari p
menurut rumus ini, kita mengatakan bahwa p adalah umum sebelumnya.

Asumsi bahwa ada sebelum umum dapat dipahami dalam setidaknya


dua cara. Yang pertama adalah bahwa p hanyalah distribusi empiris obyektif
atas jenis pemain &#39;, salah satu yang telah ditanggung melalui
pengamatan masa lalu banyak. Yang kedua adalah bahwa asumsi
sebelumnya yang umum mencerminkan gagasan bahwa perbedaan
keyakinan hanya berasal dari perbedaan informasi. Akibatnya, sebelum
pemain menyadari jenis mereka sendiri - dan karena itu dalam posisi
informationally simetris - keyakinan masing-masing pemain tentang vektor
jenis pemain harus identik, dan sama dengan p. Kemampuan kita untuk
menganalisis situasi dengan informasi yang tidak lengkap tidak akan
memerlukan asumsi sebelumnya yang umum. Oleh karena itu kami tidak

59
akan bersikeras bahwa keyakinan para pemain &#39;, pi, dihasilkan dari
sebelumnya yang umum. Dengan demikian, kami mengizinkan situasi di
mana, misalnya, beberapa jenis pemain 1 memberikan probabilitas nol untuk
jenis pemain 3 yang selalu ditugaskan probabilitas positif oleh pemain 2
terlepas dari jenis nya. (Latihan 7.20 meminta Anda untuk menunjukkan
bahwa situasi ini tidak mungkin dengan umum sebelumnya.)Sebelum kami
menjelaskan bagaimana menganalisis situasi dengan informasi yang tidak
lengkap, kami menempatkan semua elemen bersama-sama.

DEFINITIN 7.10 Permainan Informasi lengkap (permainan Bayesian)

Sebuah permainan dari informasi yang tidak lengkap adalah tupel G = (/,..,
7} 5 &quot;Uj)?., Di mana untuk setiap pemain i = 1 N. set 7) terbatas , up. S
x TR, dan untuk setiap f, e 7.adalah distribusi proba-bility on 7_,. Jika di
samping itu, untuk setiap pemain i, strategi set 5, terbatas, maka G disebut
permainan terbatas informasi yang tidak lengkap.Sebuah permainan
informasi yang tidak lengkap juga disebut permainan Bayesian.

Pertanyaannya tetap: bagaimana kita dapat menerapkan solusi kami


sebelumnya dikembangkan untuk game informasi yang tidak lengkap?
Jawabannya adalah untuk mengasosiasikan dengan tion lengkap
pertandingan informasi Ga bentuk permainan * strategis G di mana setiap
jenis setiap pemain dalam permainan informasi yang tidak lengkap
diperlakukan sebagai pemain yang terpisah.Kita kemudian dapat
menerapkan semua hasil kami untuk permainan bentuk strategis untuk * G.
Tentu saja, kita harus meyakinkan Anda bahwa * G menangkap semua aspek
yang relevan dari situasi informasi yang tidak lengkap kami mulai dengan.
Kami akan melakukan semua ini satu langkah pada satu waktu. Untuk saat
ini, mari kita mulai dengan sebuah contoh. CONTOH 7.2 Dua perusahaan
terlibat dalam persaingan harga Bertrand seperti di Bab 4, kecuali bahwa
salah satu dari mereka tidak pasti tentang biaya konstan marjinal lain. Biaya
marjinal Firm 1 s produksi diketahui, dan perusahaan 2 adalah baik tinggi

60
atau rendah, dengan masing-masing pos jawab yang memiliki
kemungkinan yang sama. Tidak ada biaya tetap.Dengan demikian,
perusahaan 1 memiliki satu jenis, dan perusahaan 2 memiliki dua jenis -
biaya tinggi dan biaya rendah. Kedua perusahaan masing-masing memiliki
set strategi yang sama, yaitu set non-negatif harga. Hasil Firm 2 tergantung
pada tipenya, tapi tegas 1 &#39;s hasil ini tergantung dari tipe perusahaan 2
ini, itu tergantung hanya pada harga yang dipilih.

Untuk berasal dari permainan ini informasi tidak lengkap permainan bentuk
strategis, bayangkan bahwa sebenarnya ada r / iree perusahaan ketimbang
dua, yaitu, perusahaan 1, 2 perusahaan dengan biaya tinggi, dan
perusahaan 2 dengan biaya rendah. Bayangkan juga bahwa masing-masing
dari tiga perusahaan sekaligus harus memilih harga dan bahwa perusahaan
percaya bahwa setiap 1 dari 2 perusahaan yang memiliki kemungkinan yang
sama untuk menjadi pesaing satu-satunya. Beberapa pemikiran akan
meyakinkan Anda bahwa ini cara untuk melihat hal-hal indah menangkap
semua fitur strategis yang relevan dari situasi aslinya. Secara khusus,
perusahaan harus memilih 1 harga tanpa mengetahui apakah pesaing
memiliki biaya tinggi atau rendah.Selain itu, perusahaan 1 memahami
bahwa harga pesaing mungkin berbeda sesuai dengan biayanya. Secara
umum itu, kita ingin mengasosiasikan dengan setiap permainan informasi
lengkap G = (ph Tj, Sj. Uj) v_, permainan bentuk strategis G * di mana setiap
jenis masing-masing pemain itu sendiri merupakan pemain yang
terpisah..Hal ini dilakukan sebagai berikut. Untuk setiap yaitu (1 N) dan
masing-masing r, 6 7, biarkan tj menjadi pemain dalam G yang terbatas set
strategi murni adalah S, z demikian, 7jv adalah himpunan terbatas pemain di
G., Dan S = 5 x SFL adalah himpunan strategi murni sendi. Masih hanya
untuk menentukan hadiah para pemain &#39;.

Kami mengasumsikan di sini jenis PTAI thai set T \ T &quot;yang saling


beririsan. Ini adalah tanpa kehilangan keumumannya sejak set tipe, menjadi
terbatas, selalu dapat didefinisikan sebagai subset dari bilangan bulat dan

61
kita selalu dapat memilih ini bilangan bulat sehingga Oleh karena itu, tidak
ada ambiguitas dalam mengidentifikasi pemain di C menurut jenis nya saja.
Setelah mendefinisikan set terbatas pemain, set terbatas strategi mereka
murni, dan hadiah mereka untuk setiap strategi murni bersama, ini
melengkapi definisi

DEFINISI permainan bentuk strategis 7.11 The Strategis Bentuk


permainan Associated

Misalkan G = (Pj, Tj, Sj, u, ) *, menjadi permainan informasi yang tidak


lengkap. Permainan G * didefinisikan di atas adalah bentuk permainan
strategis terkait dengan informasi yang tidak lengkap permainan G. Mari kita
luangkan waktu untuk memahami mengapa * G menangkap esensi dari
situasi informasi yang tidak lengkap kami mulai dengan.Cara paling
sederhana untuk melihat ini adalah untuk memahami rumus pemain hasil fs.
Bila strategi murni dipilih dalam G * dan jenis pemain saya adalah tj, pemain
fs rumus hasil, yaitu, Menangkap gagasan bahwa pemain / &#39;tidak pasti
dari pemain lain&#39; jenis - yaitu, ia menggunakan /, (F_; |? R , j untuk
menilai probabilitas mereka - dan juga menangkap gagasan bahwa perilaku
pemain lain mungkin tergantung pada jenis mereka - yaitu, untuk setiap j,
pilihan Sj (tj) e 5, tergantung pada

Dengan bergaul dengan setiap permainan G informasi yang tidak lengkap


dengan strategi yang dipilih gic permainan bentuk, G *.kami telah
mengurangi studi permainan informasi lengkap untuk mempelajari
permainan dengan informasi yang lengkap, yaitu, untuk mempelajari
permainan bentuk strategis. Akibatnya, kita dapat menerapkan salah satu
solusi yang kami telah dikembangkan untuk * G. Ini adalah par-ticularly
berguna untuk mempertimbangkan set ekuilibria Nash dari * G dan jadi kami
memberikan ini definisi yang terpisah.

DEFINISI 7.12 Bayesian Nash Equilibrium-

62
Sebuah ekuilibrium Bayesian-Nash dari permainan informasi yang tidak
lengkap adalah ekuilibrium Nash dari permainan bentuk terkait
strategis.Dengan alat kami telah dikembangkan sampai sekarang, maka
sangat mudah untuk berurusan dengan pertanyaan tentang keberadaan
Bayesian-Nash equilibrium. Jika tipe set 7) tidak menguraikan subset dari
bilangan bulat positif, maka ini adalah &#39;teknis&#39; bukan permainan
bentuk strategis dalam arti Definisi 7.1, di mana pemain makan diindeks
oleh bilangan bulat positif. RUU ini kesalahan teknis kecil dapat dengan
mudah diperbaiki sepanjang garis catatan kaki sebelumnya.

TEOREMA 7.3 Keberadaan Bayesian Nash Equilibrium-

Setiap permainan terbatas informasi yang lengkap memiliki setidaknya satu


Bayesian-Nash equilibrium. Bukti: Bv Definisi 7,12, itu sudah cukup untuk
menunjukkan bahwa permainan bentuk terkait strategis pos-sesses
keseimbangan Nash. Karena permainan bentuk strategis terkait dengan
permainan terbatas informasi yang tidak lengkap itu sendiri terbatas, kita
dapat menerapkan Teorema 7.2 untuk menyimpulkan bahwa permainan
bentuk terkait strategis memiliki keseimbangan Nash. Saya Contoh 7.3 Untuk
melihat ide-ide di tempat kerja, mari kita perhatikan secara lebih rinci dua
perusahaan dibahas dalam Contoh 7.2. Misalkan biaya marjinal perusahaan
yang l&#39;s produksi adalah nol. Juga, anggaplah perusahaan 1 percaya
bahwa biaya marjinal 2 perusahaan yang baik 1 atau 4, dan bahwa masing-
masing &#39;jenis&#39; perusahaan 2 terjadi dengan probabilitas 1/2. Jika
harga terendah yang dibebankan adalah p, maka permintaan pasar adalah 8
- p. Untuk menjaga hal-hal sederhana, anggaplah bahwa setiap perusahaan
dapat memilih hanya salah satu dari tiga harga, 1, 4, atau 6. Para hadiah
kepada perusahaan-perusahaan yang dijelaskan pada Gambar. 7.7. Hasil
perusahaan l&#39;s selalu angka pertama dalam setiap pasangan, dan hasil
perusahaan 2 ketika biaya nya rendah (tinggi) yang diberikan dengan jumlah
kedua dalam entri dari matriks di sebelah kiri (kanan).

63
Sesuai dengan sifat-Bertrand kompetisi masalah, kami telah menerapkan
konvensi berikut dalam menentukan hadiah ketika perusahaan memilih
harga yang sama. Jika biaya kedua perusahaan &#39;secara ketat kurang
dari harga umum, maka pasar dibagi secara merata di antara mereka. Jika
tidak, perusahaan 1 menangkap seluruh pasar dengan harga umum.
Perpecahan merata kedua mencerminkan gagasan bahwa jika harga umum
adalah di atas hanya perusahaan biaya l&#39;s, perusahaan 1 bisa
menangkap seluruh pasar dengan menurunkan harganya sedikit (yang, jika
kita membiarkannya, ia bisa lakukan dan masih lebih dari menutupi biaya
nya) , sedangkan perusahaan 2 tidak akan menurunkan harganya (bahkan
jika kita membiarkan dia) karena ini akan mengakibatkan kerugian. Kami
sekarang telah menggambarkan permainan informasi yang tidak lengkap.
Permainan strategis-bentuk yang terkait adalah satu di mana ada tiga
pemain: 1 perusahaan, perusahaan 21 (biaya rendah), dan 2h perusahaan
(biaya tinggi). Masing-masing memiliki seperangkat strategi yang sama
murni. yaitu, himpunan harga {1,4, 6). Biarkan p \, pi. pi, menunjukkan harga
yang dipilih oleh perusahaan 1,2 /, dan 2/7, masing-masing. Gambar. 7,8
menggambarkan permainan ini bentuk strategis. Karena ada tiga pemain,
perusahaan 1 &#39;s pilihan harga menentukan matriks, dan perusahaan 21
dan 2/Ys harga menentukan baris dan col UMN, masing-masing, dari
matriks yang dipilih. Sebagai contoh, menurut Gambar. 7,8, jika perusahaan
1memilih p - 4, 21 perusahaan p \ = 4, dan perusahaan 2h pi, = 4, hadiah
mereka akan menjadi 12, 6, dan 0, masing-masing. Menurut Definisi 7.11,
para imbalan dalam bentuk permainan strategis Gambar. 7,8 untuk
perusahaan dan 21 2h dapat diperoleh hanya dengan membaca mereka dari
matriks dari Gambar. 7.7. Hal ini karena hanya ada satu jenis
&#39;perusahaan 1. Sebagai contoh, menurut Gambar. 7,7, jika perusahaan
murah 2 memilih pi = 6, maka menerima hasil dari 5 1 jika perusahaan
memilih p \ = 6. Perhatikan bahwa hal ini tercermin dalam permainan yang
terkait Gambar. 7,8, di mana hasil perusahaan 27 adalah 5 ketika dan
perusahaan 1 memilih harga 6 terlepas dari harga yang dipilih oleh

64
perusahaan 2h. Para hadiah untuk mengencangkan 1 di game bentuk terkait
strategis Gambar. 7,8 diperoleh dengan mempertimbangkan keyakinan
perusahaan l&#39;s tentang biaya perusahaan 2 ini. Sebagai contoh,
mempertimbangkan strategi di mana perusahaan memilih 21 p / = 1.
perusahaan 2h memilih pi, = 6, dan perusahaan memilih 1 p \ = 4. Sekarang,
biaya jika perusahaan 2 ini rendah (yaitu, jika perusahaan 1 bersaing
terhadap perusahaan 21), maka menurut Gambar. 7,7, perusahaan 1 &#39;s
hasil adalah nol. Jika biaya perusahaan 2 yang tinggi, maka hasil 1 s
perusahaan adalah 16. Karena perusahaan 1 percaya bahwa biaya 2
perusahaan sama-sama cenderung tinggi atau rendah.hasil perusahaan 1 s
diharapkan adalah 8. Inilah perusahaan hasil 1 &#39;s sesuai dengan p \ =
4, p \ = 1, dan pi, = 6 pada Gambar. 7.8. Satu sama dapat menghitung
bentuk terkait perusahaan l&#39;s permainan strategis (diharapkan) hasil
yang diberikan pada Gambar. 7,8 untuk semua kombinasi strategi lainnya
bersama. Untuk menemukan keseimbangan Bayesian-Nash dari permainan
informasi Bertrand-persaingan tidak lengkap, kita harus mencari
keseimbangan Nash dari permainan bentuk terkait strategis Gambar. 7.8.

p1= 6 pi = 4 p1= 1 ph = 6 ph = 4
ph =1

P1 = 6 6,5 0,12 0,0 P1 = 6,2 0,0 0,-21


P1 = 4 16,0 8,6 0,0 6 16,0 16,0 0,-21
P1 = 1 7,0 7,0 7,0 7,0 7,0 7,0
P1 =
4

P1 =
1
Gambar 7.7

Pilihan p1 = 6 Pilihan p1 = 4

65
ph= 6 ph = 4 ph = 1 ph = 6 ph =
4 ph =1

P1 = 6 6,5,2 3,5,0 3,5,-21 P1 = 16,0,0 16,0,0 8,0,-21


P1 = 4 3,12,2 0,12,0 0,12,- 6 12,6,0 12,6,0 4,6,-21
21
P1 = 1 3,0,2 0,0,0 0,0,-21 8,0,0 8,0,0 0,0,-21
P1 =
4

P1 =
1

Pilihan p1 = 1

ph= 6 ph = 4 ph= 1

P1 = 6 7,0,0 7,0,0 7,0,0


P1 = 4 7,0,0 7,0,0 7,0,0
P1 = 1 7,0,0 7,0,0 7,0,0

Menemukan satu ekuilibrium Nash sangat mudah di sini. Perhatikan bahwa


perusahaan 21 dan 2h masing-masing memiliki strategi lemah dominan:
memilih harga 4 adalah lemah dominan bagi perusahaan 21 dan memilih
harga 6 yang lemah dominan untuk 2h perusahaan. Tapi begitu kita
menghilangkan strategi lain untuk mereka, perusahaan 1 kemudian memiliki
strategi ketat dominan, yaitu, untuk memilih harga 4. Untuk melihat ini,
misalkan p / = 4 dan pi, = 6. Kemudian sesuai dengan Gambar. 7,8,
perusahaan 1 &#39;s hasil adalah 3 jika ia memilih p \ = 6, 12 jika dia
memilih p \ = 4, dan 7 jika ia memilih p = 1. Akibatnya, ada strategi
ekuilibrium Bayesian-Nash murni di mana dua dari tiga perusahaan memilih
harga 4 sementara yang ketiga memilih harga 6.Anda diundang untuk
mengeksplorasi keberadaan lainnya Bayesian-ekuilibria Nash dari permainan

66
ini dalam latihan.Perhatikan bahwa berbeda dengan kasus persaingan
Bertrand dengan informasi lengkap, keuntungan tidak didorong ke nol di
sini.Memang, hanya perusahaan biaya tinggi 2 menghasilkan nol keuntungan
dalam keseimbangan dijelaskan di sini.

7.3 Permainan Formulir Luas Sejauh inisial, kitd hanya mempertimbangkan


pengaturan Strategis di mana para pemain harus memilih Pengembangan
strategi mereka secara bersamaan.Kami sekarang membawa Dinamika
eksplisit Ke Dalam, GAMBAR, Dan mempertimbangkan situasi di mana
pemain Strategis dapat membuat pilihan secara berurutan. Illustrasi
permainan &#39;dibawa Pulang&#39;, terdapat 21 sen di Atas MEJA. Andari
Dan Oposisi- nent bergantian menghapus tagihan dan bahasa Dari
ITU.Ketentuan-satunya adalah bahwa PADA gilirannya masing-masing,
Satu.doa, atau Tiga sen harus dihilangkan. Hal inisial tidak mungkin untuk
Lulus.Orang Yang menghilangkan pennv Lalu Kehilangan.Apa Cara optimal
untuk bermain dibawa Pulang, Dan Acute kedua pemain bermain secara
optimal, siapa Yang Menang?Kami akhirnya menemukan jawaban untuk Akan
kedua pertanyaan.Perhatikan bahwa Illustrasi dibawa Pulang, pemain
membuat pilihan mereka secara berurutan, Artikel Baru Penuh pengetahuan
bahasa Dari pilihan Yang dibuat di Masa Lalu. Akibatnya, Strategis Formulir
Kami permainan Model - di mana pemain membuat pilihan mereka secara
bersamaan, Dalam, ketidaktahuan pilihan Yang &#39;Lain KONSOLIDASIAN -
Muncul untuk menyediakan kerangka Koperasi Karyawan Bhakti Samudera
Yang memadai untuk menganalisis permainan inisial. Dalam, permainan
salon banyak seperti inisial, pemain bergiliran secara berurutan Dan
Sempurna mengenai * Semua pilihan sebelumnya ketika giliran mereka
untuk Bergerak. TAPI Dalam, permainan Before - salon permainan Dan
permainan Ekonomi - pemain mungkin tidak memiliki pengetahuan Yang
Sempurna bahasa Dari setiap langkah Masa Lalu. Perhatikan, misalnya,
situasi di mana pembeli Ingin membeli mobil bekas.Penjual memiliki pilihan
memperbaiki atau tidak.Penghasilan kena pajak memutuskan apakah Akan

67
melakukan perbaikan, Penjual memilih daftar harga mobil.Penghasilan kena
pajak kedua keputusan, besarbesaran memberitahu pembeli Bahasa Dari
daftar harga. Namun, pembeli tidak memiliki Cara untuk mengetahui apakah
perbaikan Yang undertaken.4

Ada kerangka standar dalam mana kedua macam situasi yang dinamis - dan
banyak lagi - dapat dianalisis.Hal ini disebut permainan bentuk yang luas.
Secara informal, unsur-unsur permainan bentuk yang luas adalah (i) para
pemain, (ii) Nature (atau kesempatan); (iii) aturan &#39;dari permainan,
termasuk urutan bermain dan informasi setiap pemain telah mengenai
DEFINISI 7.13 Permainan Formulir Ekstensif Sebuah game bentuk yang luas,
dilambangkan dengan V, terdiri dari unsur-unsur berikut: 1. Satu set terbatas
pemain, N. 2. Satu set tindakan, A, yang mencakup semua tindakan yang
mungkin yang berpotensi dapat diambil di beberapa titik dalam permainan.
A tidak perlu terbatas. 3. Satu set node, atau sejarah. X, di mana i. X berisi
elemen dibedakan, xq, disebut node awal, atau sejarah kosong, ii. setiap xe
X \ {xrj) mengambil bentuk x = (a1, a2 ..... a) untuk beberapa tindakan
finitely banyak, e A, dan iii. jika (a \, 32 ...., pada) e ^ {.} vo untuk beberapa
k,&gt; 1 maka (a \ ai a.) g simpul A, atau sejarah, kemudian hanya deskripsi
lengkap tentang tindakan yang telah diambil sejauh ini dalam permainan.
Kita akan menggunakan istilah sejarah dan simpul bergantian. Untuk
referensi di masa mendatang, biarkan menandakan serangkaian tindakan
yang tersedia bagi pemain yang mendapat giliran untuk bergerak setelah
sejarah xe 4. Satu set tindakan, A (xq) c A. distribusi probabilitas ANDA, n,
pada A (xq) untuk menjelaskan peran dari kesempatan dalam permainan.
Kesempatan selalu bergerak pertama, dan hanya sekali, dengan secara acak
memilih tindakan dari A (xq) menggunakan n distribusi probabilitas. Dengan
demikian, menyiratkan bahwa, fori = 1 dan hanya i = Lg

5. Satu set node akhir. Setiap node akhir menggambarkan satu bermain
lengkap tertentu dari permainan dari awal sampai akhir. 6. Sebuah fungsi,
yang menunjukkan yang mendapat giliran pada setiap simpul keputusan di

68
X. Untuk referensi di masa mendatang. Biarkan 7.Sebuah partisi. 1, dari
himpunan node keputusan, X \ (EU [xq]), sehingga jika x dan xf berada
dalam elemen yang sama dari partisi, kemudian (i) i (x) = t (Y), dan (ii ) A (x)
= Aix1). 1 partisi himpunan node keputusan dalam set informasi. Informasi
yang diatur mengandung x dinotasikan byX (x).Ketika x simpul keputusan
dicapai dalam permainan, pemain i (x) harus mengambil tindakan setelah
mendapat informasi bahwa sejarah bermain adalah salah satu elemen of
(x).Dengan demikian, J (x) menjelaskan informasi yang tersedia untuk
pemain i (x) ketika setelah x sejarah, itu adalah gilirannya untuk bergerak.
Kondisi (i) dan (ii) memastikan bahwa playeri (x) tidak dapat membedakan
antara sejarah ml (x) berdasarkan pada apakah atau tidak itu adalah
gilirannya untuk memindahkan atau didasarkan pada set tindakan yang
tersedia, masing-masing. Untuk referensi di masa mendatang, mari kita
menunjukkan set informasi set milik pemain i. 8. Untuk setiap i N. von
Neumann-Morgenstern fungsi hasil yang domain adalah himpunan node
akhir, u,: E -&gt; M. ini menjelaskan hasil untuk setiap pemain untuk setiap
permainan lengkap kemungkinan permainan.

Kami menulis r = &lt;NAXEt. T. J, ((/,) / / v&gt; Jika set tindakan, A, dan node
X,.Yang terbatas, maka V disebut permainan bentuk terbatas yang luas.
Memang, definisi ini tampak cukup kompleks, namun membacanya .dua atau
tiga kali Anda akan segera mulai menghargai betapa sangat kompak itu,
terutama ketika Anda menyadari bahwa hampir setiap permainan salon
pernah bermain - belum lagi sejumlah besar aplikasi dalam ilmu-ilmu sosial -
ditutupi olehnya Namun demikian, beberapa! contoh akan membantu untuk
mengkristal ide-ide CONTOH 7,4 Mari kita mulai dengan permainan dibawa
pulang dijelaskan sebelumnya.. Ada dua pemain, sehingga / V = {1. 2).
Seorang pemain dapat menghapus hingga tiga koin di giliran, jadi mari r \, ri.
dan menunjukkan penghapusan satu, dua. atau tiga koin, masing-masing.
Untuk secara resmi model fakta bahwa kesempatan memainkan peran dalam
game ini, biarkan A (x $) = [a] (yaitu, kesempatan memiliki satu bergerak).

69
Dengan demikian, himpunan tindakan adalah A = {a, r \, ri. rj} - Sebuah
elemen khas dari A \ {} ao kemudian terlihat seperti ~ x-(a. r \, ri, r \ n, nf.).
Ini akan menunjukkan bahwa hingga saat ini dalam permainan, jumlah koin
dihapus secara bergantian oleh para pemain adalah 1,2, 1,3, dan 3, masing-
masing. Akibatnya, ada 11 koin yang tersisa dan itu adalah giliran pemain 2
untuk bergerak (karena pemain

1 menghilangkan koin pertama).Jadi.t (x) = 2. Selain itu, karena setiap


pemain sepenuhnya informasi, dari semua bergerak masa lalu, l (x) = [x]
untuk setiap xe X. Dua contoh dari node akhir dalam mengambil adalah <?i
= (a, r\. i^. r\. r(. /-j. r;. /'3,12), and ei = (a, rt. /-.j. rj, rj, rj. 15, r|y because
each indicates that all 21 coins have been removed. The first indicates a win
fQr player 2 (because player 1 removed the last two coins), and the second
indicates a winfol player 1. Thus, if a payoff of 1 is assigned, to the winner,
and -1 to the loser, we havl u\(e\) = U2(e2) = -1. and i/itez) - ii2(e]) = 1. q

EXAMPLE 7.5 To take a second example, consider the buyer and seller of
the used car To keep things simple, assume that the seller, when choosing a
price, has only two choices-high and low. Again there are two players, so N =
{5, B], where 5denotes seller, and B j buyer. The set of actions that might
arise is A = {repair, don't repair, price high, price \ovi,\ accept, reject}.
Because chance plays no role here, rather than give it a single action, we'
simply eliminate chance from the analysis. A node in this game is, for
example, x = (repair, price high). At this node x, it is the buyer's turn to
move, so that i(x) B. Because at this node, the buyer is informed of the
price chosen by the seller, but not of the seller's repair decision, T{x) =
{(repair, price high), (don't repair, price high)}. That is, when node *is
reached, the buyer is informed only that one of the two histories in l(x) has
occurred; he is not informed of which one, however.

1 menghilangkan koin pertama).Jadi.t (x) = 2. Selain itu, karena setiap


pemain sepenuhnya informasi, dari semua bergerak masa lalu, l (x) = [x]

70
untuk setiap xe X. Dua contoh dari node akhir dalam mengambil adalah <?i
= (a, r\. i^. r\. r(. /-j. r;. /'3,12), and ei = (a, rt. /-.j. rj, rj, rj. 15, r | y karena
masing-masing menunjukkan bahwa semua 21 koin telah dihapus. Yang
pertama menunjukkan kemenangan fQr pemain 2 (karena pemain 1 dihapus
dua koin terakhir), dan yang kedua menunjukkan pemain winfol 1. Dengan
demikian, jika hasil dari 1 diberikan, kepada pemenang, dan -1 untuk kalah,
kami havl u \ (e \) = U2 (e2) = -1. dan i / itez) - ii2 (e]) = 1. Q

CONTOH 7.5 Untuk mengambil contoh kedua, mempertimbangkan pembeli


dan penjual mobil bekas Untuk menjaga hal-hal sederhana, menganggap
bahwa penjual, ketika memilih harga, hanya memiliki dua pilihan-tinggi dan
rendah. Sekali lagi ada dua pemain, sehingga N = {5, B], di mana 5denotes
penjual, pembeli dan B j. Himpunan tindakan yang mungkin timbul adalah A
= {perbaikan, tidak memperbaiki, harga tinggi, harga \ ovi, \ menerima,
menolak}. Karena kebetulan tidak memainkan peranan di sini, daripada
memberikan satu tindakan, kita hanya &#39;menghilangkan kesempatan
dari analisis. Sebuah node dalam game ini, misalnya, x = (perbaikan, harga
tinggi). Pada x simpul, giliran pembeli untuk bergerak, sehingga saya (x) - B.
Karena pada node ini, pembeli diberitahu dari harga yang dipilih oleh
penjual, tapi bukan dari keputusan perbaikan penjual, T {x ) = {(perbaikan,
harga tinggi), (tidak memperbaiki, harga tinggi)}. Artinya, ketika * simpul
tercapai, pembeli diberitahu bahwa hanya salah satu dari dua sejarah di l (x)
telah terjadi; ia tidak diberitahu dari mana, namun.

7.3. PERTANDINGAN POHON: Sebuah representasi diagram

Hal ini juga memungkinkan untuk mewakili permainan bentuk grafis yang
luas dengan cara diagram &#39;permainan pohon&#39;. Untuk menjaga
diagram dari keluar dari tangan, mempertimbangkan versi empat-koin
dibawa pulang. Gambar. 7,9 menggambarkan game ini disederhanakan.
Lingkaran gelap kecil mewakili node dan garis bergabung dengan mereka
mewakili mengirim tindakan yang diambil. Sebagai contoh, simpul berlabel

71
a-mengambil bentuk x = (a. r \ /?.) Dan menunjukkan sejarah bermain di
mana pemain 1 pertama dihapus satu koin dan kemudian pemain 2 dihapus
dua. Akibatnya, di x simpul, ada satu koin yang tersisa dan giliran pemain
l&#39;s untuk bergerak. Setiap simpul keputusan diberi label pemain untuk
menandakan giliran untuk memindahkan setelah node yang tercapai. Simpul
awal diberi label dengan huruf C, menunjukkan bahwa permainan dimulai
dengan langkah kesempatan. Karena kebetulan sebenarnya tidak
memainkan peran dalam game ini (yang secara resmi ditunjukkan oleh fakta
bahwa kesempatan dapat mengambil tindakan tapi satu), kita bisa
disederhanakan diagram dengan menghilangkan kesempatan sama sekali.
Selanjutnya kita akan mengikuti konvensi ini setiap kali kesempatan
memainkan peran apapun.

Setiap node akhir diikuti oleh vektor hadiah. Dengan konvensi, masuknya Ah
cor-pemain merespon hasil / &#39;s. Jadi, misalnya, u \ (e) = -.. 1 dan (/ 2 (e)
= 1, di mana e adalah simpul akhir digambarkan dalam Gambar 7.9 Pohon
permainan yang sesuai untuk permainan pembeli-penjual ditunjukkan pada
Gambar. 7.10, tetapi hadiah telah dibiarkan tidak ditentukan Fitur baru
adalah kehadiran elips terdiri dari garis putus-putus yang menyertakan
berbagai node Masing-masing elips merupakan set informasi.. Dalam
gambar, ada dua set informasi tersebut.. Dengan konvensi , set informasi
tunggal - yang mengandung tepat satu simpul - tidak digambarkan dengan
melampirkan node tunggal dalam lingkaran putus-putus Sebaliknya, node
yang merupakan anggota dari tunggal.

7.32. Analisa Informasi Permainan Ambil-Pergi (take-away)


Kami hendak mengembangkan secara informal du aide pokok dalam
menganalisa permainan ambil-pergi yang pertama adalah gagasan untuk
menciptakan strategi bentuk permainan yang luas. Yang kedua gagasa untuk
menciptakan jenis induksi tarik-ulur. Dalam hal ini pemahaman yang jelas
dari setiap ide yang dibuat akan berlangsung lama untuk memastikan makna

72
yang jelas dari ide-ide yang lebih rumit yang terdapat dalam bagian-bagian
yang mengikutinya.
Tujuan kami dalam menganalisa secara sistematis dalam permainan ambil-
pergi adalah untuk mamahami bagaimana dua orang yang mahir akan
memainkan permainan ini. Istimewanya, kita diminta untuk menunjukkan
aksi yang terbaik untuk setiap kesempatan yang mungkin muncul. Dalam
bahasa yang luas kita hendaknya memutuskan untuk melakukan suatu aksi
yang optimal untuk setiap pemain yang menjadi pemenang. Syarat suatu
aksi penetapan pemenang adalah pemain khusus yang merupakan suatu
strategi dasar untuk setiap pemain. Gagasan ini secara formal diperkenalkan
dalam strategi-strategi yang mengikutinya. Untuk sementara ini, cukup
mencatat bahwa strategi untuk pemain 1 dalam permainan ambil-pergi
adalah harus mengikuti langkah awal; langkah awal pemain 1 dan sebaliknya
dengan pemain 2 dan seterusnya. Oleh karenanya, dengan menggunakan
suatu strategi seorang pemain bisa merundingkannya pada saat gilirannya.
Bermain dan permainan ini menyediakan langkah-langkah pendukung, yaitu
penjelasan tentang sejarah permainan ini menyediakan langkah-langkah
pendukung, yaitu penjelasan tentang sejarah permainan sampai poin yang
didapat dalam permainan ini. Khususnya , strategi pemain tetap
membereikan peringatan jika ia dengan sengaja menyimpang dari strategi
sebelumnya. Ebagai contoh, pertimbangkan strategi sederhana berikut bagi
pemain 1 : geser 1 koin jika jumlah yang tinggal adalah genap : walaupun
pemain 1 menyimpang dari strategi ini dengan menggeser 2 koin sekaligus
pada awal permainan yang tersisa. Strategi ini akan terus memberikan
peringatan untuk waktu permainan yang tersisa. Sekarang yang menjadi
pertanyaan adalah strategi manakah yang pantas digunakan oleh kedua
pemain..?kamu boleh jadi telah beberapa kali mempertimbangkan bagaiman
bermain dengan baik dalam permainan ambil-pergi ini. Namun, sepintas
hanya dengan 21 koin di atas meja. Sama sekali tidak terlihat jelas beberapa
banyak koin pemain pertama yang akan bergeser tentu ia harus menggeser
satu, dua, atau tiga koin. Apakah salah pilihan pilihan ini lebih baik dari yang

73
lainnya ? sulit untuk memberikan jawaban yang tepat dari pertanyaan ini
karena ada banyak langkah yang tersedia dalam permainan ini. Dengan
demikian, kita tidak dapat menyalahkan keberhasilan langkah awal tanpa
mengenal bagaimana permainan ini akan berlanjut sesudahnya.
Untuk memperkecil kerumitan permainan ini, cobalah mulai dengan
sejumlah koin yang lebih sedikit. Tentu saja ada kemungkinansatu koin yang
tertingggal di meja. Pemain yang mendapat giliran tersebut akan mengalami
kekalahan karena ia terpaksa akan menggeser koin terakhir. Dengan
demikian, jika hanya satu koin yang tersisa? Ini adalah posisi pemenang,
karena pemain yang mendapat giliran ini dapat menggeser satu koin dengan
cara ini ia meninggalkan satu koin tersisa seperti yang telah kita ketahui
berarti pemain yang lain berada dalam posisi yang kalah. Sama halnya
dengan menggunakan 3 dan 4 koin adalah dalam posisi kalah dengan 1 koin.
Bagaimana dengan 5 koin? Ini sudah pasti kita berada dalam posisi kalah
karena menggeser 1,2,atau 3 koin yang menempati posisi koin secara
berturut-turut. Teruskan dengan cara ini yaitu dari posisi yang terdekat
diakhir permainan sampai posisi terdekat diawali permainan, menunjukkan
bahwa posisi 1,5,9,13,17,21 adalah posisi yang kalah dan yang selain dari
angka itu adalah posisi yang menang.
Oleh karena itu, bila dua orang ahli memainkan permainan ambil-pergi
dngan 21 koin, pemain kedua selalu mejadi pemenang tanpa menghiraukan
bagaimana cara pemain 1 bermain. Untuk mengenali hal ini, pertimbangkan
strategi yang berikut ini untuk pemain 2 yang diberikan lewat analisa posisi
pemenang dan posisi kalah: bilamana mungkin selalu geser hanya koin yang
mencukupi sehingga hasilnya adalah salah satu posisi yang kalah yaitu 1,5,
9, 13, 17,21; sebaliknya gesr satu koin kami serahkan kepada anda untuk
membuktikan bahwasanya jika pemain-pemain sudah melakukannya
sehingga dalam setiap giliran yang sebelumnya. Ia akan selalu menyediakan
tempat satu posisi yang kalah bagi lawannya, karena lawannya memulai
permaiana pada posisi yang kalah. Ini menyempurnakan argument tersebut.
7.35 permainan informasi sempurna dan setrategi induksi tarik ukur

74
Sebuah sub class penting dari bentuk permainan yang luas terdiri dari
banyak permainan dimana pemain-pemain dengan sempurna mengetahui
segala tindakan yang diambil sebelumnya setiap giliran mereka berpindah
( bergerak ) . yaitu (contohnya) dimana pemain J (x) = (x) untuk semua
keputusan yang diputuskan x . permainan permainan ini disebut permainan
informasi sempurna .

Ambil-pergi ( take- away ) adalah sebuah permainan informasi


sempurna seperti catur , dam , nought dan silang (zig-zag) dan banyak
permainanlainnya , seperti contoh sebuah permainan informasi sempurna
yang sederhana dari ekonomi , dengan mempertimbangkan situasi
berikutnya . ada 2 perusahaan yang bersaing dalam sebuah industri
tunggal ,yang satu memproduksi (disebut incumbent) dan yanglainnya
peserta (disebut entrant) . entrant harus memutuskan apakah dia harus/akan
memasuki industri atau tetap berada diluar . jika peserta tetap berada diluar,
akan berlaku status guo . dan permainan berakhir . jika entrant masuk,
incumbeut harus memutuskan apakah dia akan melawan/bertarung dengan
membanjiri pasar dan menurunkanharga atau menyetujuinya dengan tidak
melakukannya . dalam status guo hasil (print)masuk dari setiap perusahaan
mendapat 1 . jika incumbent menyetjuinya, pohon permainan ini masuk
digambarkan pada p.g. 7.12

Jelasnya, incumbent akan menjaga entrant keluar untuk menikmati


keuntungan monopolinya yang ke-2 . pada kenyataannya apakah entrant
tetap berada diluar ? jelas ini tergantung bagaimana incumbent memberi
reaksi untuk masuk, jika incumbent bereaksi untuk melawan/bertarung
kemudian entrat masuk akan mendapat satu poin (hasil) untuk entrant dan
entrant sebaiknya tetap berada diluar , sebaiknya jika incumbentmenyetujui
masuk dan keudian entrant masuk , dengan demikian ini tergantung
bagaimana incumbert akan bereaksi masuk .

75
Jadi mari kita asumsikan dengan sederhana, jika entrant sudah masuk ,
apa yang terbaik buat/bagi incumbent dalam permainan saat ini? Jelas yang
terbaik baginya adalah menyetujuinya karena dengan demikia dia menerima
poin/hasil 1 bukan -1 . akibatnya dari sudut pandang entrant ,permainan ini
mengalami penurunan yang disaikan dalam pig 7.13 . yang mana kita telah
menggantikan keputusan incumbent dan seterusnya dengan hasil vektor
(garis vektor) yang akan menghasilkan pencapaian keputusannya sekali lagi.

Jelas entrant akan memilih n\masuk karena hasil yang diproleh 1 bukan
0 . dengan demikian sekali lagi kita sudah tiba/berada pad seasang srategi
bagi peain-pemaidengan meeahkan perainan tarik ulur . strateginya adalah
entrat masuk dan incumben menyetujuinya .

Mari kita coba teknik tarik ulur untuk memecahkan permainan yang
sedikit lebih kompleks dari permainan informasi sempurna yang
digambarkan dalam p.p 7.14 . kita mulai denan menganalisis keputusan
sebelumnya . pada akhir keputusan ada 2 keputusan sebelumnya dan
mereka diberi label X dan Y . keduanya bagian dari pemain 1, pada x .
pemain 1 sebaiknya memilih R dan pada Y dia sebaiknya memilih L .
akibatnya (akhirnya) permainan yang disajikan pada p.g 7.14 bisa
menurunkan permainan yang disajikan pada p.g 7.15 . sebagaimana
keputusan X dan Y dan seterusnya , telah digantikan dengan memberikan
poin/hasil yang dianggap tidak terhndarkan oleh Xdan Y . sekarang kita
mengulangi proses ini pada permainan penurunan disini ada 2 , W dan Z
adalah keputusan sebelumnya (ini bagian dari pemain 2) jika ini sudah
terapai pemain 2 sebaiknya memilih R dan jika Z sudah erpakaipemain 2
sebaiknya menulis I dan dan menggunaan hasil penurunanpermainan ini
akan menghasilkan pemin baru yait pada p.g .16 dimana jesnya peain 1
memilih R yang kita sipulkan dari analisis ini , pemain 1 akan memilih
strategi (R,R,L) dan pemain 2 memilih strategi (r,1). Hsil dari pengguaan
kedua stategi ini adala setiap pemain aan menerima 0poin (0) .

76
Mungkin solusi pemain ini tampak sedikit aneh , setiap pemain
mendapat nilai 0 dan mungkin setiap pemain memperoleh hasil 3 jika
bermain dengan benar sebagaimana mestinya . namun akan terjadi
kesalahan bagi pemain 2 untuk memainkan r jika keputusan z sudah tercapai
sebab pemain 1 secara rasio akan memilih L pada Y bukan R. Karena
pemain sebelumnya memberikan hasil yang lebih tinggi dari 1 . dengan
demikian , pemain-pemain benar-benar mengantisipasi hal itu dengan
melakukan yang terbaikuntuk memilih 1 , bagi pmain 2 akan memproleh
hasil 0 yang sudah melampaui alternatif -1 .

Prosedur sebelumnya bisa digunakan untuk memproleh strategi dalam


setiap permainan informasi sempurna . strategi itu disebut strategi induksi
tarik-ulur . untuk mempersiap definisi tersebut , nyatanya Y dekat mengikuti
X jika Y ( x,a1.....ak0 untuk a1...2k E A dan y segera mengikuti X jika k=1 , X
kita sebut bahwa Y adalah pengikut lemah X jika Y=X atau Y dekat mengikuti
X.

7.15 strategi tarik-ulur

Penggabungan strategi (murni)5 adalah sebuah strategi induksi tarik


ulur untuk bentuk perkainan luas yang terbatas . r dari informasi sempurna
jika memperoleh pengikut . sebut saja sebuah keputusan x akhir dari r jika
semua keputusan segera mengikuti keputusan akhir . untuk setiap
keputusan akhir x lihat s1(x0 (x) menjadi tindakan yang mengarah pada
sebuah keputusan akhir yang memaksimalkan hasil pemain L9x)S diantara
tindakan yang terdapat pada X lihat Ux menunjukan hasil vektor ,
menghapus keputusandan tindakan dibawah ini secara ketat bagi setiap
keoutusan akhir di r dan menetapkan Ux ke X . yang kemudian menjadi
sebuah keputusan akhir di r . proses ini berkelanjutan sampai sebuah
tindakan sudah ditetapkan untuk setiap keputusan yang dputuskan .
kemudian hasil ini akan menghasilkan (strategi tarik ulur) sendi murni S .

77
Metode untuk membangun sebuah strategi induksi tarik ulur yang
diberikan dalam definisi 7.15 yang diseut alojarima induksi mundur , yang
tercermin dalam strategi induksi tarik ulur adalah gagasan bahwa keputusa
yang dibuat di awal permainan harus memperhitungkan pemain yang
bermain secara optimal . untuk pemain selanjutnya , kita harus
mengantisipasi ide ini di seleksi selanjutnya . diskusi kita pada induksitarik
lur membawa pendebatan 71 berkaitan dengan strategi induksi tarik ulur
dari gagasan keseimbangan equilibrium Nash .

7.3. (KUHN) INDUKSI TARIK ULUR DAN EQUILIBRIUM NASH


Jika S adalah sebuah startegi induksi tarik ulur untuk bentuk permainan
informasi sederhana yang lebih luas terbatas r kemudian s adalah sebuah
Equilibrium Nash r.
Bukti : karena Equilibrium Nash r adalah hanya sebuah bentuk strategi
Equilibrium Nash (Si, Ui) iEN sudah cukup menunjukkan bahwa Ui (S) > (SI,
S-i) > Ui (S) untuk setaip pemain I dan setiap Si E Si . bahkan ini bukanlah
masalah yan terjadi , kemudian Ui (Si, S-i) > Ui (S) untuk setiap I dan SI E
Si. Selanjutnya harus ada tindakan , ai , secara alamiah , sehingga akhir e
dan e menyebabkan Respek oleh S dan S = (Si, S-i) yang memberikan
tindakan , yang memenuhi persamaan Ui (e) > Ui (e).
Oleh karena itu gabungan keputusan yang di putuskan x di mana pemain
itu memulainya , pemain I bisa melakukan yang lebih baik dengan
mengunakan strategi yang berbeda dan Si , bukan vakum (0) karena X= a,
adalah sebuah anggota dari kumpulan ini. Lihat X menjadi seorang anggota
dari kumpulan ini yang memiliki pengikut tidak ketat pada kumpulan ini.
Dengan demikian , saat pertandingan dimulai pada x dan selanjutnya
pemain lain memperkerjakan Si, hasil pemain I akan lebih tinggi jika dai
melakukan beberapa strategi Si dari pada Si. Selanjutnya , karena x tidak
memiliki pengikut ketat diantara kumpulan (set) yang sudah dipilih .(1) x
bagian dari pemain I dan (2) semua tindakan ditentukan oleh si pada

78
keputusan yang menjadi bagian I mengikuti x yang tidak dapat diperbaiki
lagi.
Oleh karena itu , kita bisa simpulkan saat permainan dimulia x dan
setelah itu yang lainnya bekerja sebagai s-i , hasil 1 jika mengambil tindakan
x yan ditemukan oleh si , dan selanjutnya memperkerjakan si. Yang lebih
ketua I bekerja sebagai si dimulai dari x sebaik-baiknya. Tetapi I menhasilkan
industry tarik ulur ketua alogaritma industri tarik ulur mencapai keputusan x
dan selanjutnya harus ada hasil yang lebih besar yan I bisa peroleh dari
tindakan yan mungkin dari x diberika kepada s ( strategi industry tarik ulur )
yang akan dipekerjakan seterusnya kontradiksa ini menghadapi buktinya.
Sehingga setiap sendi industri tarik ulur merupakan strategi equilibrium
nash. Karena alogaritma indutri tarik ulur selalu mengakhri permainan yang
tak terbatas dengan informasi yang sempurna, kami telah benar-benar
mendirikan selanjunya.

7.1. adanya strategi murni equilibrium


Setiap bentuk permainan luas yan terbatas dari informasi yang sempurna
memiliki strategi murni equilibrium nash.
Walaupun setiap strategi industry tarik ulur adalah sebuah equilibrium
nash, tidak semua equilibrium nas adalah strategi industri tarik ulur , melihat
hal ini, perhatikan walaupun strategi industri tarik ulur unik dalam permainan
entraat-incumbent pada pig 7.12 melambatkan entraat masuk dan
incumbent masuk. Strategi berikut juga merupakan permainan equilibrium
nash : entraat tetap berada di luar dan incumbent melawan jika entraat
masuk, catatan yan diberikan mengingat strategi dari pemain lain, bahkan
pemain bisa menambah/meningkatkan hasilnya dengan
mengubah/menukar strateginya. Dengan demikian strategi sudah benar
benar membentuk equilibrium nash.
Namun, equilibrium nash akhir tidak masuk akal karena melibatkan
ancaman untuk melawan pada bagian incumbent yang kredibel.
Berkurangya ancaman kredibilitas karena tidak adanya kepentingan

79
incumbent untuk benar-benar melaksanaka kesempatan yang diberikan.
Entraat harus memperhatikan ini dan masuk, justru ini semacam
kemampuan entraat melihat kedepan secara otomatis yang diwujudkan
dalam strategi industri tarik ulur yang kita lihat, ketika ada beberapa
equilibrium nash , kita sering menghilangkan satu atau lebih dasar yang
melibatkan ancaman yang diluar mereka seperti ini.
7.36. permainan informasi sempurna dan subgame equilibrium yang
sempurna
Teknik industri tarik ulur adalah penyelesaian baik yang diterapkan pada
permainan informasi bagiamanapun tidak bisa kepermainan lainnya secara
luas, menurut contoh permainan pada pig 7.17 dimana pemain 1 telah
memiliki pilihan untuk mengkoordinasi permainan dengan pemain 2. Marilah
kita coba menerangkan teknik industri tarik ulur ini.
Seperti sebelumnya, langkah awal adalah menemukan semua kumpulan
informasi yang sedemikian rupa sehingga tindakan apapun yang dipilih
sebagai kumpulan informasi, permainan ini kemudian berakhir dalam
permainan di pig 7.17. penisolasian kumpulan informasi yang dimiliki pemain
ke 2, yaitu titik pencapaian permainan itu setelah pemain 1 memilih masuk
dan kemudian L atau R.
Perhatikan ketua giliran pemain 2 bermain , tindakan L atau r berbicara baik
akan menakibatkan permainan berakhir, sekaran menurut alogaritma
industri tarik ulur , langkah berikutnya adalah memilih tindakan yang optimal
untuk pemain 2. Tapi sekarang kita berada dalam kesulitan karena sama
sekali tidak jelas tindakan yang diambil pemain 1. Jika pemain 1 memilih L
maka tindakan terbaik pemain 2 adalah memilih L yang mana jika pemain 1
memilih R, kemudian pemain 2 tidak harus memilih r, tidak ada cara keluar
langsung dari kesulitan ini karena menurut dari definisi dari
himpunan/kumpulan informasi , pemain 2 tidak mengetahui tindakan yang
diambil pemain 1.
Sebaliknya ada 2 cara yang mingkin bisa mengacak perilaku seseorang
dalam bentuk permainan yang luas. Yang pertama adalah analog

80
(pengamatan) langsung yang digunakan dalam bentuk permainan yang
strategis. Tujuan setiap strategi dasar yang memungkinkan dan sebelum
permainan dimulai, gunakan perangkat pengacakan yang tepat untuk
memilih salah satu strategi dasar anda. Dengan metode ini, anda sekali
mengacak dan untuk semua diawal permainan.
Setelah strategi dasar (murni) dipilih, perilaku anda akan menentukan
strategi dasar untuk keseluruhan pemain, tidak ada melakukan pengacakan
selanjutnya.
Metode kedua adalah dengan menggunakan perangkat pengacakan ketika
giliran anda dihapus. Dari pada sekali mengacak dan untuk semua awal
permainan mengumpulkan strategi dasar (murni), anda mengacak pada
gilirannya masing-masing selama kumpulan tindakan anda saat tidak
tersedia dengan demikian jika selama bermain, itu merupakan giliran anda
untuk berpindah lebih dari sekali, maka anda akan menggunakan perangkat
pengacakan lebih dari sekali selama permainan. Karena bisa memiliki
perangkat pengacakan yang dibedakan pada setiap giliran.
Jenis pengacakan pertama disebut strategi campuran yang sesuai dengan
terminology yang ditetapkan untuk bentuk permainan strategis, yang kedua
disebut strategi perilaku.
Secara formal, sebuah strategi campuran M 1 untuk pemain I ; seperti
sebelumnya kemungkinan didistribusikan lewat pemain IS himpunan dari
strategi dasar Si. Yaitu untuk setiap strategi dasar Si Si, Mi (Si)
menunjukkan kemungkinan bahwa Simerupakan strategi dasar yang dipilih.
Akibatnya kita harus memiliki (memilih) Mi (Si) (0,1) dan Si Si Mi (Si) = 1
Disisi lain, strategi perilaku bi, disediakan untuk sebuah pemain iS yang
menetapkan distribusi yang mungkin atas tindakan yang tersedia artinya, bi
(a,I) (0,1) dan a A (i) bi (a,I)=1, untuk setiap himpunan informasi I bagian
dari pemain I, dimana A (A) menunjukkan kumpulan tindakan yang ada pada
himpunan informasi yang ditetapkan I.
Dalam sebuah diagram silsilah permainan ini kami menunjukkan strategi
tingkah laku dengan menentukan tindakan yang mungkin dipilh dalam

81
pasangan misalnya fig 7.14 (d) menggambarkan strategi perilaku untuk
pemain 1 dimana ia memilih L dan K dengan kemungkinan setiap
kumpulan informasi pertamanya dan dia memilih L dan R dengan
kemungkinan 2/3 dan 1/3, pada himpunan informasi keduanya.
Walaupun kami tridak memberikan bukti ini, ternyata semua permainan yang
menjadi perhatian kami dalam hal ini,tidak ada bedanya sama sekali. Apakah
pemain menggunakan strategi campuran atau perilaku dari sudut pandang
strategi kedua-duanya seimbang. Untuk setriap strategi campuran ini
menjadi bagian pemain I, ada persis hasilnya yang diharapkan pemain I
sama persis hasilnya yang diharapkan Mi, tanpa memperhatikan strategi-
strategi (campuran atau perilaku).
Karna permainan yang ahli memiliki daya ingat sempurna, subjek permainan
bekerja yang baik dan begitu juga dengan setrategi campuran (dalam subjek
permainan) memiliki rekaan strategi tingkah laku yang sempurna. Tentu saja
sama,strategi tingkah laku ini juga merupakan keseimbangan bagi subjek
permainan.

Sekarang ganti subjek permainan dengan garis vector keuntungan yang


ditetapkan dengan setrategi keseimbangan didalamnya. Dengan demikian
kita telah mengurangi ukuran permainan yang telah ditetapkan bagian dari
strategi tingkah laku secara keseluruhan berada dalam subjek permainan
kita boleh mengulang pengurangan permainan dan seterusnya hingga kita
telahm menetapkan dengan sempurna gabungan setrategi tingkah laku
untuk permainan yang ahli. Mengamati bahwa algoritma ini harus berakhir
karna keterbatasan permainan.

Dijelaskan bahwa setrategi yang sangat ditentukan merupakan


equilibrium subgawe sempurna yang mengikutinya secara sejajar, bukti
separuh pertama dari teori 7.5 anda diminta mengisi sebuah latihan secara
detail.

82
Penting untuk dicatat pendapat tentang daya yang semopurna tidak
dapat dibuang dalam suatu permainan tanpa daya ingat yang sempurna,
keseimbangan subjek permainan tidak mungkin terus ada. Hal ini
dipertimbangkan dalam salah satu latihan.

Peruses ini menjelaskan bukti yang dilustrasikan pada gambar 7.26 (a)
sampai gambar 7.26 (c). perlu dicatat bagaimana kesempurnaan subjek
permainan mengemakan nama induksi kuno, yaitu awal permainan yang
optimal ditentukan oleh permainan sesudahnya. Dalam bagian berikutnya
kita mengembangkan lebih jauh suatu kemurnian dari keseimbangan agar
mengunakan ide-ide central ini lebih berhasil lagi.

7.3.7.equilibrium sequential

Permainan pada gambar 727 memiliki sejumlah equilibrium nash. Karna


permainan ini hanya memiliki permainannya sendiri sebagai subgame, setiap
subgame ini merupakan subgame sempurna. Namun apakah subgame-
subgame sempurna ini pemikiran equilibrium?

Pertimbangan strategi dasar subgame equilibrium sempurna yang mana


pemain 1 memiliki l dan pemain 2 memiliki m. jelas merupakan equilibrium
nash (dan subgame sempurna ) karna tidak ada pemain yang dapat
menunjukan hasil mereka dengan mengubah strategi mereka secara tidak
harfiah. Istimewanya pemain 1 tidak memainkan M atau R karna
berdasarkan equilibrium ini, pemain 2 akan merespon dengan memainkan M
dan ini akan memberikan pemain satu hasil-1 bukan O apabila ia memainkan
L. demikianlah ancaman pemain 2 akan memainkan M jika diberi
kesempatan yang cukup untuk menyakinkan pemain 1 memainkan L .
namun apabila ancaman pemain 2 sesuatu yang dapat dipercaya? Apakanh
ini membuat pemain 1 percaya bahwa pemain 2 akan memilih M jika
tercapai? Untuk menjawab pertanyaan ini kita harus mempertimbangkan
keputusan dari masalah yang dihadapi oleh pemain 2 jika pemain 1 tidak
memiliki L .

83
Jadi pemainan pemain 2 yang mencapai bagaimana dia bias
memutuskan aksi mana yang akan diambil? Setelah itu, aksi terbaiknya
tergantung pada aksi yang dipilih pemain 1. Jika pemain1 memiliki M,
kemudian aksi terbaik pemain 2 adalah R. jika pemain 1 memiliki R, aksi
terbaiknya adalah L.

Saat ini karna pemain 2 tidak diberitahukan aksi pemain 1, diluar


sepengetahuan pemain 2 pemain 1 memilih M atau R. pemain 2 harus yakin
aksi yang mana yang akan dipilih pemain 1. Biarkan p (x) dan p (y)
menunjukan kemungkinan-kemungkinan pemain 2 menepatkan keputusan x
dan y yang telah diperoleh yang diberikan pada saat gilirannya melangkah
{dari rumus,p (x)+p(y)=1}.untuk member kepercayaan pemain 2 kita bias
menaksir praduga yang berguna bagaimana untuk memilih l.m dan r.
praduga berguna ini adalah, secara masing-masing dibuat dalam rumus 4
p(y),1,praduga berguna memilikinya.

Karna pada tahapan ini kita tidak mengetahui kepercayaan pemain 2


(dalam contoh rumus p(x)dan p(y), kita tidak bias menentukan pilihan yang
dibuatnay. Oleh karna itu, daapt dikatakan bahwa ia tidak akan pernah
memilik m. bagaimana pun juga m adalah nilai dari p(x) dan p(y),tapi m
tidak memperbesar praduga berguna pemain 2. Untuk mengetahui hal ini,
perhatikan secara sederhana pilihan strategi campuran l dan r dengan
kemungkinan yang sedikit lebih besar dari pada praduga berguna yang
pemain 1 dapatkan dengan memikih m. dengan demikian,seperti apapun
kepercayaan yang mungkin dipegang pemain 2 pada akhirnya salah satu
dari l atau r yang akan menghasilkan praduga berguna untuk pemain 2
sedikit lebih tinggi nilainya dari pada memainkan m.

Akibatnya, bertentangan dengan subgame aquilibrium sempurna


pemain 12 tidak akan memainkan m bila tercapai. Sebab itu subgame
equilibrium sempuna ini bukan merupakan pemikiran yang sehat.

84
Alasan subgame equilibrium sempurna gagal menjadi suatu pemikiran
yang sehat adalah karna kesempurnaan subgame tidak menerapkan tingkah
laku pemain 2 pada informasi yang tidak diperolehnya bukan tunggal oleh
karna itu tidak didefinisikan sebagai subgame.

Bagaimana juga, seperti yang telah kita ketahui, dengan


memperkenalkan kepercayaan kepada pemain 2 melalui keputusan dalam
informasi yang telah diperoleh. Kita bias menerapkan secara sehat tingkah
lakunya. Tingkah laku ini bias mempengaruh kuat terhadap hasil equilibrium
kamu diajak untuk menunjukan tingkah laku ini dalam suatu latihannya
dalam subgame equilibrium yang sempurna yang mana m kemungkinan
diberikan nilai o oleh pemain 2 (seperti yang telah kita bantah sebagaimana
seharusnya) yang meminta pemain 1 untuk memilih l dengan kemungkinan
nilai o.

Saat ini kami memperkenalkan secara formal kepercayaan untuk para


pemain melalui keputusan dalam informasi mereka menghilangkan subgame
equilibrium sempuna dalam tubuh induksi terukir-ulur.

Kepercayaan dan kaitannya terhadap strategi

seperti yag di peragakan pada contoh gambar 7.27. Menjadi berarti sekali
untuk mempertimbangkan kepercayaan terhadap informasi yang pemain 2
peroleh yaitu sejarah permainan hingga nilai dalam permainan ini.

Pemberian bentuk permainin yang luas dengan rumus n dan keputusan


dengan x, misalkan p (x) menunjukan kemungkinan pemain L (x),
menetapkan sejarah dengan pengadaian x pada informasi yang diperoleh
dengan rumus I (x).Dengan demikian, kita harus menggunakan
xI(y)p(x)=1 untuk setiap keputusan y. fungsi p (.) disebut system
kepercayaan karena p mewujudkan kepercayaan para pemain pada informasi
tentang sejarah dan nilai yang diperoleh dalam permainan.

85
Dalam permainan pohon diagram, system kepercayaan dilambangkan
dengan p, dengan menempatkan kemungkinan yan ditujukan pada setiap
keputusan dalam setiap informasi disebelah keputusan masing-masing dan
didalam tanda kurung besar.

Karena kepercayaan pemain mengenai sejarah permainan secara


khusus akan memiliki pengaruh yang penting terhadap tingkah laku terkini
pemain. Amat diperlukan karena kepercayaan-kepercayaan ini dibentuk dari
cara berfikir yang sehat.

Yang menarik bagi kita untuk dipertanyakan adalah : untuk pemberian


strategi perilaku dengan b, yang manakah system kepercayaan, apakah p
hasilpemikiran yang sehat? Perlu diberi sebutan penilaian untuk
pasangan system kepercayaan / strategi perilaku (p,b). Cenderung seperti
suatu pasangan berurutan (p,b), kepercayaan p dimaknai sebagai system-
sistem yang diikuti oleh para pemain, sementara itu strategi perilaku b
adalah system yang sedang dimainkan, kemudian ungkapan kembali
pertanyaan kita, penilaian manakah yang pantas?

Contohnya, pertimbangan permainan pada ganbar 7.28. Dalam


permainan ini digambarkan strategi perilaku sama seperti
strategikepercayaan pemain 2 (sebelah kiri tak ditentukan seperti x,,dan y).
Sekarang dengan diberikan strategi pemain 1 pemain 2 bisa menghitung
kemungkinan akan setiap keputusan yang telah diperoleh. Salah satu dari
mereka cenderung secara sederhana menggunakan hukum bayes.Dengan
demikian, kepercayaan yang pantas untuk pemain 2 yang diberikan strategi
pemain 1, adalah sebagai berikut x=,=1/9dan y=5/9.

Dengan demikian, untuk penilaian (p,b) menjadi layak.Sistem


kepercayaan p harus diambil dari penempatan gabungan strategi perilaku b
dengan menggunakan hukum baye jika, memungkinkan. Begitu, misalkan p
(x) menunjukan kemungkinan keputusan x diperoleh dari penempatan

86
strategi perilaku b. Hukum bayes bahwa untuk setiap informasi
dilambangkan I, dan setiap x I.

P (x)=Bila penyebutnya positif dengan begitu, bila informasi diperoleh


dengan kemungkinan positif berdasarkan b. Kita nyatakan sebagai prinsip
utama.

Kepercayaan harus berasal dari strategi yang menggunakan hukum bayes


bila memungkinkan.

Kata bila memungkinkan barmakan semua informasi yang diperoleh


dengan kemungkinan yang positif berdasarkan pada penempatan strategi
gabungan.Akibatnya, tidak selalu memungkinkan untuk menggunakan
hukum bayes.Contohnya dalam permainan pada ganbar 7.29. Pemberian
strategi-strategi perilaku pemain 1 dan 2. Informasi pemain 3 tidak diperoleh
(Diperoleh dengan kemungkinan nol) Dengan demikian, kita tidak bias
memakai secara formal hukum bayes dalam keadaan ini untuk mendapatkan
kepercayaan pemain 3. Meskipun demikian, pemberian strategi pemain 2
disana benar-benar kelihatan menjadi suatu kepercayaan bijaksana yang
unik untuk pemain 3,yaitu a=1/3

Alasan bahwa ini hanya merupakan kepercayaan yang pantas/


bijaksana adalah strategi perilaku pemain 2 sedikit bermakna, artinya ia
akan memainkan bagian kiri dengan kemungkinan 1/3 jika pemain 1 bermain
baik, sekalipun pemain 1 lebih baik memainkan bagin kiri dengan
kemungkinan 1. Dengan demikian, aksi campuran pemain 2 sudah dihitung,
maka pemaian 1 harus menyimpang dari strateginya, untuk strategi pemain
2 masuk dalam permainan. Akibatnya, ketika pemain 3 yang diperoleh,
kepercayaan yang bijaknya adalah menempati kemungkinan 1/3 pada
pemain 2 yang telah bermain di bagian kiri.

Apakah masih ada pembatasan yang lebih jaih yang mungkin kita
pertimbangkan untuk menyingkirkan kepercayaan yang menyertai

87
penempatan strategi perilaku? Baik, katakanlah ada. Pertimbangkan gambar
7.30 dan 7.31, keduanya menunjukan strategi perilaku untuk pemain 1 dan
2. Dalam setiap permainan pilihan x dan antara 0 (nol) dan 1 (satu) akan
memberikan hasil penilaian yang cocok dengan hukum bayes. Selain itu,
jenis argument yang digunakan dalam contoh gambar 7.29 secara
sederhana tidak tersedia.

Namun, ada alasan yang baik untuk bertahan dalam setiap kasus /
kesempatan x=p, dalam persamaan ini terdiri dari 2 prinsip tambahan yang
dengan sengaja dijelaskan hanya secara formal. Persamaan tersebut adalah
sebagai berikut :

Kepercayaan harus mencerminkan pemain memilih strategi mereka dengan


bebas pemain dengan informasi serupa memiliki kepercayaan serupa.

Bagian 3 (tiga) Mengetik 10 jari

Karna permainan yang ahli memiliki daya ingat sempurna, subjek permainan
bekerja yang baik dan begitu juga dengan setrategi campuran (dalam subjek
permainan) memiliki rekaan strategi tingkah laku yang sempurna. Tentu saja
sama,strategi tingkah laku ini juga merupakan keseimbangan bagi subjek
permainan.

Sekarang ganti subjek permainan dengan garis vector keuntungan yang


ditetapkan dengan setrategi keseimbangan didalamnya. Dengan demikian
kita telah mengurangi ukuran permainan yang telah ditetapkan bagian dari
strategi tingkah laku secara keseluruhan berada dalam subjek permainan
kita boleh mengulang pengurangan permainan dan seterusnya hingga kita
telahm menetapkan dengan sempurna gabungan setrategi tingkah laku
untuk permainan yang ahli. Mengamati bahwa algoritma ini harus berakhir
karna keterbatasan permainan.

Dijelaskan bahwa setrategi yang sangat ditentukan merupakan


equilibrium subgawe sempurna yang mengikutinya secara sejajar, bukti

88
separuh pertama dari teori 7.5 anda diminta mengisi sebuah latihan secara
detail.

Penting untuk dicatat pendapat tentang daya yang semopurna tidak


dapat dibuang dalam suatu permainan tanpa daya ingat yang sempurna,
keseimbangan subjek permainan tidak mungkin terus ada. Hal ini
dipertimbangkan dalam salah satu latihan.

Peruses ini menjelaskan bukti yang dilustrasikan pada gambar 7.26 (a)
sampai gambar 7.26 (c). perlu dicatat bagaimana kesempurnaan subjek
permainan mengemakan nama induksi kuno, yaitu awal permainan yang
optimal ditentukan oleh permainan sesudahnya. Dalam bagian berikutnya
kita mengembangkan lebih jauh suatu kemurnian dari keseimbangan agar
mengunakan ide-ide central ini lebih berhasil lagi.

7.3.7.equilibrium sequential

Permainan pada gambar 727 memiliki sejumlah equilibrium nash. Karna


permainan ini hanya memiliki permainannya sendiri sebagai subgame, setiap
subgame ini merupakan subgame sempurna. Namun apakah subgame-
subgame sempurna ini pemikiran equilibrium?

Pertimbangan strategi dasar subgame equilibrium sempurna yang mana


pemain 1 memiliki l dan pemain 2 memiliki m. jelas merupakan equilibrium
nash (dan subgame sempurna ) karna tidak ada pemain yang dapat
menunjukan hasil mereka dengan mengubah strategi mereka secara tidak
harfiah. Istimewanya pemain 1 tidak memainkan M atau R karna
berdasarkan equilibrium ini, pemain 2 akan merespon dengan memainkan M
dan ini akan memberikan pemain satu hasil-1 bukan O apabila ia memainkan
L. demikianlah ancaman pemain 2 akan memainkan M jika diberi
kesempatan yang cukup untuk menyakinkan pemain 1 memainkan L .
namun apabila ancaman pemain 2 sesuatu yang dapat dipercaya? Apakanh
ini membuat pemain 1 percaya bahwa pemain 2 akan memilih M jika

89
tercapai? Untuk menjawab pertanyaan ini kita harus mempertimbangkan
keputusan dari masalah yang dihadapi oleh pemain 2 jika pemain 1 tidak
memiliki L .

Jadi pemainan pemain 2 yang mencapai bagaimana dia bias


memutuskan aksi mana yang akan diambil? Setelah itu, aksi terbaiknya
tergantung pada aksi yang dipilih pemain 1. Jika pemain1 memiliki M,
kemudian aksi terbaik pemain 2 adalah R. jika pemain 1 memiliki R, aksi
terbaiknya adalah L.

Saat ini karna pemain 2 tidak diberitahukan aksi pemain 1, diluar


sepengetahuan pemain 2 pemain 1 memilih M atau R. pemain 2 harus yakin
aksi yang mana yang akan dipilih pemain 1. Biarkan p (x) dan p (y)
menunjukan kemungkinan-kemungkinan pemain 2 menepatkan keputusan x
dan y yang telah diperoleh yang diberikan pada saat gilirannya melangkah
{dari rumus,p (x)+p(y)=1}.untuk member kepercayaan pemain 2 kita bias
menaksir praduga yang berguna bagaimana untuk memilih l.m dan r.
praduga berguna ini adalah, secara masing-masing dibuat dalam rumus 4
p(y),1,praduga berguna memilikinya.

Karna pada tahapan ini kita tidak mengetahui kepercayaan pemain 2


(dalam contoh rumus p(x)dan p(y), kita tidak bias menentukan pilihan yang
dibuatnay. Oleh karna itu, daapt dikatakan bahwa ia tidak akan pernah
memilik m. bagaimana pun juga m adalah nilai dari p(x) dan p(y),tapi m
tidak memperbesar praduga berguna pemain 2. Untuk mengetahui hal ini,
perhatikan secara sederhana pilihan strategi campuran l dan r dengan
kemungkinan yang sedikit lebih besar dari pada praduga berguna yang
pemain 1 dapatkan dengan memikih m. dengan demikian,seperti apapun
kepercayaan yang mungkin dipegang pemain 2 pada akhirnya salah satu
dari l atau r yang akan menghasilkan praduga berguna untuk pemain 2
sedikit lebih tinggi nilainya dari pada memainkan m.

90
Akibatnya, bertentangan dengan subgame aquilibrium sempurna
pemain 12 tidak akan memainkan m bila tercapai. Sebab itu subgame
equilibrium sempuna ini bukan merupakan pemikiran yang sehat.

Alasan subgame equilibrium sempurna gagal menjadi suatu pemikiran


yang sehat adalah karna kesempurnaan subgame tidak menerapkan tingkah
laku pemain 2 pada informasi yang tidak diperolehnya bukan tunggal oleh
karna itu tidak didefinisikan sebagai subgame.

Bagaimana juga, seperti yang telah kita ketahui, dengan


memperkenalkan kepercayaan kepada pemain 2 melalui keputusan dalam
informasi yang telah diperoleh. Kita bias menerapkan secara sehat tingkah
lakunya. Tingkah laku ini bias mempengaruh kuat terhadap hasil equilibrium
kamu diajak untuk menunjukan tingkah laku ini dalam suatu latihannya
dalam subgame equilibrium yang sempurna yang mana m kemungkinan
diberikan nilai o oleh pemain 2 (seperti yang telah kita bantah sebagaimana
seharusnya) yang meminta pemain 1 untuk memilih l dengan kemungkinan
nilai o.

Saat ini kami memperkenalkan secara formal kepercayaan untuk para


pemain melalui keputusan dalam informasi mereka menghilangkan subgame
equilibrium sempuna dalam tubuh induksi terukir-ulur.

Untuk mengetahui dua prisip ini berperan yaitu dengan = ,


pertimbangkan gambar 7.30. ketika informasi pemain 2 diperoleh, adalah
kemungkinan penempatan pemain 2 pada pemain 1 yang telah memilih L,
sekarang, meskipun tidak ditunjukkan dalam diagram, prinsip kepercayaan
umum menunjukkan bahwa pemain3 juga menempati kemungkinan ini
(ketika kesamaan informasi secara tepat ditempatkan sebagai pemain 2).
Namun dengan kebebasan strategi-strategi pemain, mencari tahu pilihan
strategi pemain 2, yang disediakan pemain 3 bukan dengan informasi apa
saja yang berkenaan dengan strategi yang dipilih oleh pemain.

91
Akibatnya, keyakinan pemain 3 mengenai pemain 1 harus tetap tidak
berubah (yaitu, sama dengan cv on L oleh pemain 1) bahkan setelah
mengetahui bahwa pemain telah memilih 2 L. Tapi ini berarti bahwa f = a.
Alasan yang sama dapat diterapkan pada Gambar. 7.31. Mencari tahu
apakah atau tidak pemain 1 dimainkan Kiri atau Kanan seharusnya tidak
(oleh kemerdekaan) mempengaruhi keyakinan 3 mengenai kemungkinan
bahwa pemain memilih 2 Kiri versus Tengah, yaitu, fi =. Perhatikan bahwa
kepercayaan umum prinsip ciple tidak diperlukan dalam kasus ini karena
set informasi dua pertanyaan yang dimiliki oleh pemain yang sama. Secara
keseluruhan, tiga prinsip - aturan Bayes &#39;, kemandirian, dan umum
keyakinan-cukup untuk menghasilkan semua pembatasan pada keyakinan
kita telah mempertimbangkan sejauh ini dalam semua contoh sebelumnya.
(Anda akan diminta dalam latihan untuk menunjukkan bahwa kemerdekaan
menghasilkan pembatasan a = 1/3 dalam permainan Gambar. 7.29.) Tentu
saja, pernyataan ini hanya merupakan salah satu informal karena
kemandirian dan kepercayaan umum prinsip dinyatakan hanya informal. Apa
yang kita perlukan adalah definisi formal dari apa artinya bagi penilaian
untuk menjadi &#39;masuk akal&#39;, dan ini adalah apa yang sekarang
kita berikan. Setelah menyatakan definisi, kita akan berbicara tentang
bagaimana berhubungan dengan tiga prinsip: aturan Bayes &#39;,
kemandirian, dan kepercayaan umum.

Untuk mempersiapkan definisi memerlukan terminologi sedikit. Sebuah


strategi perilaku dalam permainan bentuk terbatas yang luas disebut benar-
benar dicampur jika memberikan prob ketat positif kemampuan untuk
setiap tindakan di setiap set informasi. Anda akan diminta untuk
menunjukkan sebagai latihan bahwa di bawah strategi tercampur sempurna
setiap set informasi tercapai dengan probabilitas ketat positif. Akibatnya,
untuk strategi tersebut, Bayes &#39;aturan sendiri unik menentukan
pemain&#39; keyakinan. DEFINISI 7.20 Penilaian Konsisten Sebuah penilaian
(p, b) untuk bentuk permainan V terbatas yang luas konsisten jika ada urutan

92
strategi perilaku tercampur sempurna, bn. konvergen ke b, sehingga urutan
terkait sistem pemerintahan diinduksi Bayes &#39;keyakinan, pn, konvergen
terhadap p. Bagaimana definisi penilaian yang konsisten berhubungan
dengan prinsip-prinsip, kemandirian naik Bayes &#39;dan keyakinan umum?
Seperti yang Anda akan diminta untuk menunjukkan di Latihan 7,43, con
konsistensi menyiratkan aturan Bayes &#39;. Memang, konsistensi adalah
ketat lebih ketat daripada Bayes &#39;naik, dan bahkan lebih ketat daripada
Bayes&#39; aturan di setiap subgame. Karena tidak prinsip kemandirian
atau prinsip kepercayaan umum secara resmi ditetapkan, kita tidak bisa
secara resmi menghubungkannya dengan konsistensi. Namun, kami ingin
menunjukkan bahwa konsistensi meresmikan baik prinsip-prinsip dengan
cara yang wajar. Konsistensi meresmikan prinsip kemandirian dengan
menegaskan bahwa keyakinan yang berasal dari batas strategi tercampur
sempurna,

Menurut definisi, menggabungkan kemerdekaan. Untuk melihat


konsistensi yang meresmikan prinsip kepercayaan umum, perhatikan
kembali urutan sepenuhnya strategi campuran menentukan keyakinan para
pemain &#39;. Setiap strategi campuran bersama di urutan dapat dianggap
sebagai kepercayaan umum bahwa - sebelum bermain permainan ketika
semua pemain memiliki informasi yang sama - semua berbagi pemain
tentang bagaimana strategi murni sendi yang dipilih. The penetapan limit,
demikian juga kepercayaan umum.Mari kita sekarang menerapkan definisi
konsistensi untuk contoh yang telah kita dianggap sejauh ini. Ini akan
memberi kita merasakan bagaimana kerjanya. Pada contoh Gambar. 7.28,
biarkan b menunjukkan strategi perilaku digambarkan ada (strategi perilaku
2 adalah tidak relevan) dan membiarkan p = (a, / 3, y) menunjukkan sistem
kepercayaan. Untuk penilaian (p, b) harus konsisten, harus ada urutan
penilaian dengan b &quot;benar-benar dicampur untuk setiap n, dan p&quot;
berasal dari b &quot;menggunakan aturan Bayes &#39;Tapi lb adalah
berarti. Bahwa sepanjang urutan perilaku strategi, probabilitas ditempatkan

93
pada tiga pilihan paling kanan dari pemain 1 konvergen ke 3/15, 1/15, dan
15/5, masing-masing Oleh karena itu,. karena urutan keyakinan diperoleh
dengan aturan Bayes &#39;, karena itu, konsistensi penilaian mensyaratkan
bahwa justru karena kita bersikeras pada sebelumnya.

Dalam Gambar. 7.29, mengingat strategi perilaku yang digambarkan di sana,


membutuhkan konsistensi = 1/3. Hal ini karena di sepanjang setiap urutan
sepenuhnya strategi campuran konvergen ke satu dalam gambar,
kemungkinan bahwa pemain memilih 1 kanan dan 2 memilih benar adalah,
dalam batas, dua kali lebih mungkin seperti yang di mana 1 memilih kanan
dan 2 memilih meninggalkan. Kesimpulan ini mengikuti dari persyaratan
bahwa keyakinan berasal dari batas yang berasal sepanjang urutan
menggunakan aturan Bayes &#39;.Kami meninggalkan sebagai latihan
memverifikasi konsistensi yang menghasilkan pembatasan dibahas
sebelumnya untuk contoh Gambar.7.30 dan 7.31 juga. Seperti disebutkan,
dapat dibuktikan bahwa penilaian yang konsisten memenuhi prinsip pertama
kami ciple, aturan Bayes &#39;, dan kami telah menyarankan bahwa
prinsip-prinsip meresmikan resmi kami kemerdekaan dan kepercayaan
umum. Tapi satu mungkin khawatir bahwa def matematis inition
konsistensi melampaui prinsip-prinsip ini dengan cara yang mungkin tidak
diinginkan. Namun, ternyata bahwa konsistensi dapat ditampilkan untuk
menjadi setara dengan principles.21 Pemain berikut dapat menetapkan
probabilitas relatif, kemungkinan tak terbatas, untuk setiap pasang strategi
murni sendi. Para pemain &#39;probabilitas relatif memuaskan hukum
probabilitas standar (misalnya, Bayes&#39; rule). Probabilitas relatif Para
pemain &#39;bertepatan dengan probabilitas relatif pengamat luar
(kepercayaan umum).

Probabilitas relatif pengamat luar untuk pertama insitu strategis hadir asi
tidak akan berubah setelah mengamati hasil dari setiap jumlah terbatas
situasi strategis yang identik (suatu bentuk kemandirian yang berhubungan
dengan &#39;pengalaman yang tak terbatas&#39;). Menurut pendapat

94
kami, kesetaraan konsistensi dengan keempat prinsip menunjukkan bahwa
konsistensi adalah pembatasan ideal pada keyakinan. Tentu saja, tidak
semua pengaturan praktis akan sesuai dengan cita-cita dan satu karena itu
harus berhati-hati untuk tidak menerapkan konsistensi inap propriately.
Namun, jika tujuan seseorang adalah untuk memahami perilaku strategis
antara pemain rasional ideal &#39;, maka dalam terang konsistensi, atas
kesetaraan sepenuhnya wajar. Rasionalitas Sequential Sekarang kita telah
mengeksplorasi hubungan antara keyakinan dan strategi, kita dapat kembali
ke tugas mengembangkan gagasan yang masuk akal induksi mundur untuk
umum permainan bentuk yang luas.Untuk permainan dengan informasi yang
sempurna, solusi induksi mundur berjumlah bersikeras bahwa semua pemain
membuat pilihan yang memaksimalkan hasil-kapan giliran mereka untuk
bergerak. Kesempurnaan subgame mencoba untuk memperluas ide ini
melampaui permainan informasi yang sempurna. Namun, sebagai contoh
Gambar. 7.27 menggambarkan, kesempurnaan subgame tidak cukup cukup
kuat untuk menyingkirkan perilaku yang suboptimal pada setiap set
informasi.

Sekarang kita telah dikaruniai setiap pemain dengan keyakinan


tentang sejarah bermain ketika pernah giliran bahwa pemain untuk
bergerak, maka sangat mudah untuk meminta bahwa pilihan yang dibuat
pada setiap informasi set pemain yang pernah optimal sana. Setelah ini
dilakukan, kita akan tepat diperpanjang ide induksi mundur untuk umum
permainan bentuk yang luas. Kami sekarang secara resmi mengejar alur
pemikiran ini.Perbaiki permainan bentuk terbatas yang luas. Pertimbangkan
penilaian, (hal. b), dan set informasi, I, milik pemain. Untuk memeriksa
pemain yang, strategi perilaku &#39;s, 6,, optimal untuk i sekali informasi
set-nya 7 tercapai, kita harus dapat menghitung hasil untuk i dari setiap
strategi lain yang mungkin mempekerjakan sekali lis tercapai. Mari kita
menghitung, &quot;s hasil menurut penilaian (p, b) mengingat bahwa nya
informasi-mation ditetapkan I telah tercapai Untuk setiap x node dalam saya,

95
kita dapat menggunakan b untuk menghitung pemain awal hasil fs dari x
Untuk.. melakukan hal ini, hanya memperlakukannya x seolah-olah itu
didefinisikan suatu subgame Untuk setiap seperti, mari Uj (b \ x)
menunjukkan nomor hasil demikian, u /.. (b | x) adalah imbalannya untuk
saya jika node x dalam I memiliki telah dicapai Tentu saja, pemain / tidak
tahu mana node dalam I telah tercapai Tapi sistem kepercayaan, p,
menggambarkan probabilitas bahwa / yang ditunjuk untuk setiap node di I.
Akibatnya, pemain,.. &quot;s hasil sesuai dengan (p , b), mengingat bahwa /
telah tercapai, hanya nilai yang diharapkan dari u angka, (b | a &#39;)
sesuai dengan sistem kepercayaan p, yaitu,

Kami menunjukkan hasil ini dengan See Gambar. 7.32 dan 7.33 untuk contoh
di mana Vj {p, b | I) dihitung.

Sekarang kita tahu bagaimana menghitung hasil fs dari penilaian


sewenang-wenang kondisi nasional pada salah satu informasinya set yang
telah dicapai, maka sangat mudah untuk membandingkan hasil ini dengan
apa yang ia dapat memperoleh dengan mengubah strateginya pada titik
dalam permainan, dan ini adalah dasar untuk definisi pusat bagian ini.

5 6 3 06

96
1 4 4
12

8 12

DEFINISI 7.21 Rasionalitas Sequential

Sebuah penilaian (p, b) untuk permainan bentuk terbatas ekstensif


berurutan rasional jika untuk setiap pemain saya, informasi setiap set I milik
pemain i, dan setiap strategi perilaku, pemain i, Kami juga memanggil
perilaku bersama strategi, b, berurutan rasional jika untuk beberapa sistem
kepercayaan, p. penilaian {p. b) adalah berurutan rasional seperti di atas.
Dengan demikian, penilaian yang berurutan rasional jika tidak ada pemain,
pada setiap titik dalam permainan.pernah memiliki insentif untuk mengubah
strateginya. Perhatikan juga bahwa frase italicised &#39;pada setiap titik
dalam permainan&#39; merujuk bukan hanya untuk informasi set dicapai
dengan probabilitas positif oleh b strategi perilaku, tetapi untuk semua set
informasi.

Arti penting dari perbedaan terlihat dari permainan Gambar. 7.27.


Seperti yang Anda mungkin ingat, keseimbangan yang sempurna subgame
di mana pemain memainkan L 1 dan 2 memainkan m adalah tidak masuk
akal justru karena pemain 2 akan ingin beralih dari m jika memang set
informasinya yang dicapai. Ini tidak masuk akal keseimbangan tidak akan
dihilangkan jika kita tidak bersikeras memeriksa perilaku yang optimal di
semua set informasi dan bukan hanya memeriksa orang-orang yang dicapai
dengan probabilitas positif sesuai dengan strategi yang diberikan. Namun,
ketika kita melakukan bersikeras perilaku yang optimal pada semua set
informasi, ini keseimbangan yang sempurna subgame dihilangkan. Lebih
formal, jika b menunjukkan strategi perilaku yang digambarkan dalam

97
Gambar.7.27, maka tidak ada sistem kepercayaan, p, sehingga penilaian (p,
b) adalah berurutan rasional.(Lihat latihan.)Dengan demikian, tidak semua
kesetimbangan sempurna subgame (dan, karenanya, tidak semua ekuilibria
Nash) yang berurutan rasional. Apakah ada permainan memiliki strategi
perilaku berurutan rasional gies yang tidak subgame kesetimbangan yang
sempurna? Jawabannya adalah ya, dan contoh berikut adalah pengingat
lebih lanjut dari pentingnya membangun koneksi yang tepat antara
keyakinan dan strategi.Permainan digambarkan dalam Gambar. 7.34 disebut
&#39;uang cocok&#39;. Setiap pemain memiliki sepeser pun dan dapat
memilih untuk menempatkannya Kepala up atau ekor di telapak tangannya.
Pemain 1 menang sen 2 kalau pertandingan uang, dan pemain
memenangkan 2 sen l&#39;s jika mereka gagal untuk mencocokkan. Pemain
1 memilih pertama, tapi terus telapak tangannya ditutup sampai 2 pemain
telah membuat pilihannya.Dengan demikian, pemain harus memilih 2 Saya
memimpin atau ekor tanpa mengetahui pilihan yang dibuat oleh l pemain.

Ekuilibrium Nash unik dari game ini, dan karenanya keseimbangan


yang sempurna yang unik subgame, adalah untuk kedua pemain untuk
randomise dengan memilih Kepala dan ekor dengan probabilitas 1/2 masing-
masing. Namun, mempertimbangkan penilaian digambarkan pada gambar di
mana kedua pemain memilih Kepala dengan probabilitas 1, dan keyakinan
tempat pemain 2 yang probabilitas 1 pada pemutar 1 ekor telah dipilih.
Penilaian ini, meskipun tidak keseimbangan Nash, yang berurutan rasional
karena pemain 1 adalah mendapatkan hasil yang tertinggi mungkin, dan
menurut kepercayaan 2, ketika set informasinya tercapai, ia juga
memperoleh Th hasil setinggi mungkin nya adalah karena menurut 2
keyakinan ini, pemain telah memilih 1 ekor dengan probabilitas satu,
Akibatnya, oleh Kepala memilih, hasil 2 pemain ini dimaksimalkan - lagi,
menurut keyakinannya. Dengan demikian, penilaian berurutan rasional
bahkan tidak perlu menjadi Nash kesetimbangan. Jelas kesulitan dengan
contoh ini adalah bahwa keyakinan pemain 2 yang tidak berasal dari strategi

98
melalui aturan Bayes &#39;. Menempatkan gagasan rasionalitas berurutan
bersama-sama dengan tiga prinsip menghubungkan keyakinan dengan
strategi yang dibahas dalam subseksi sebelumnya - aturan Bayes &#39;,
ketergantungan HDI, dan keyakinan umum - mengarah ke konsep
keseimbangan penting berikut diperkenalkan di Kreps dan Wilson (1982).

DEFINISI 7.22 Equilibrium Sequential

Sebuah penilaian untuk permainan bentuk terbatas yang luas adalah


keseimbangan berurutan jika konsisten dan berurutan rasional. Karena
(seperti yang Anda akan diminta untuk menunjukkan dalam latihan)
penilaian yang konsisten memang memenuhi aturan Bayes &#39;,
keseimbangan sekuensial yang unik dari permainan uang pencocokan
Gambar. 7.34 memiliki setiap pemain memilih Kepala dengan probabilitas
1/2.Ini adalah pelajaran untuk menerapkan konsep kesetimbangan berurutan
ke contoh yang kurang transparan. CONTOH 7.7 Pertimbangkan varian dari
uang yang cocok, yang akan kita sebut &#39;uang pencocokan
canggih&#39;. Ada tiga pemain, masing-masing dalam kepemilikan sepeser
pun. Tujuan dari para pemain adalah sebagai berikut: pemain 3 permintaan
untuk mencocokkan pilihan pemain 1, dan 1 pemain keinginan untuk justru
sebaliknya. Peran Player 2 adalah untuk &#39;membantu&#39; pemain 3
mencoba untuk mencocokkan pilihan pemain l&#39;s. Dengan demikian,
Anda bisa memikirkan pemain 2 dan 3 sebagai anggota tim yang (meskipun
membuat pilihan independen) bermain melawan pemain 1. Ada empat dolar
dipertaruhkan.

Bagaimana tepatnya adalah pemain 2 diizinkan untuk membantu


pemain 3 menebak pilihan player 1 &#39;s Kepala atau Ekor? Jawabannya
adalah tentu saja diwujudkan dalam aturan yang tepat dari permainan, yang
kita belum terbilang. Mereka adalah sebagai berikut: 1 pemain dimulai
dengan diam-diam menempatkan koin nya baik Kepala atas atau ekor di
telapak tangannya. Player 2 kemudian melakukan hal yang sama. Pemain 1

99
dan 2 kemudian mengungkapkan koin mereka ke wasit (berhati-hati untuk
tidak mengungkapkan koin baik untuk pemain 3).Wasit kemudian
menginformasikan 3 pemain apakah atau tidak koin pemain 1 dan 2
pertandingan.Pemain 3 kemudian harus memutuskan apakah memilih Kepala
atau Ekor. Jika pilihan ini cocok 3 1 &#39;s, maka pemain 1 membayar
pemain 2 dan 3 masing-masing dua dolar. Jika tidak, pemain 2 dan 3 masing-
masing pemain membayar 1 dua dolar. Untuk membuat permainan sedikit
lebih menarik, kami juga akan memberikan pemain 1 dan 2 pilihan untuk
berhenti pada giliran. Berhenti biaya dua dolar. Jadi jika pemain 1 berhenti, ia
harus membayar pemain 2 dan 3 masing-masing satu dolar, dan jika pemain
2 berhenti, pemain 2 dan 3 masing-masing pemain membayar 1 satu dolar.
Seluruh permainan yang digambarkan dalam Gambar. 7.35. Anda harus
memeriksa bahwa angka tersebut kompatibel dengan deskripsi hanya
diberikan.

Permainan ini memiliki beberapa kesetimbangan berurutan.Ini adalah


pelajaran untuk menunjukkan bagaimana salah satu dihitung. Anda akan
diminta untuk menemukan orang lain dalam latihan. Dalam gambar, kami
telah menunjukkan kepercayaan pemain 2 oleh atau, -, dan pemutar 3 ini
oleh / 3y dan y,. Untuk memudahkan eksposisi, kita akan merujuk pada
informasi pemain 3 set dengan keyakinan yang ditunjukkan oleh fii sebagai
beta 3 ini &#39;set informasi, dan lain sebagai 3 s&#39; set informasi
gamma &#39;.

Misalkan x dan y probabilitas bahwa pemain 1 dan 2, masing-masing, tempat


di Kepala, dan membiarkan x dan y menunjukkan probabilitas mereka
tempat di ekor. Biarkan zp dan zy menunjukkan probabilitas bahwa pemain 3
tempat pada Kepala di informasinya set beta dan gamma, masing-masing.
Dengan demikian, vektor (oq, ji \, y \,. X x, y, y, zp, zY) adalah penilaian
untuk permainan. Sekarang kita akan mencari keseimbangan berurutan di
mana setiap x, x, y, y, zp, zy secara ketat antara nol dan satu dan di mana
pemain 1 dan 2 tidak pernah berhenti. Tentu saja, tidak ada jaminan bahwa

100
seperti keseimbangan berurutan ada. Tapi jika ada satu, pencarian kami akan
menemukannya. Mari kita kemudian berasumsi bahwa setiap x, x, y, y, zp, zY
secara ketat antara nol dan satu dan bahwa x + x = y + y = 1. Akibatnya,
setiap rangkaian informasi yang tercapai dengan probabilitas positif,
sehingga untuk penilaian untuk konsisten, itu sudah cukup bahwa keyakinan
akan derivi menggunakan aturan Bayes &#39;(lihat latihan). Dengan
demikian, untuk konsistensi, kita harus memiliki Masih menggunakan kondisi
untuk rasionalitas berurutan.

Rasionalitas Sequential membutuhkan strategi masing-masing pemain


untuk menjadi hasil-memaksimalkan pada setiap set informasi itu,
mengingat keyakinannya dan strategi yang lain. Tapi mengingat fakta
penting bahwa jika seorang pemain pencampuran antara sejumlah pilihan
dan pemain yang memaksimalkan hasil, maka ia harus peduli antara pilihan.
Kita akan menggunakan fakta ini untuk menentukan strategi para pemain
&#39;. Dengan menggunakan (El), perhitungan langsung mengarah ke hal-
hal berikut: di mana, misalnya, (E.2) memberikan hasil pemain l&#39;s
bermain di Kepala informasinya mengatur dilambangkan I \, dan (E.3)
memberikan hasil 3 pemain yang bermain ekor pada informasi beta nya
diatur hp dilambangkan. Sekarang dengan komentar di atas, x. x, y, y, zp,
dan zy harus menghasilkan indiffer berikut ences: Karena kita
mengasumsikan bahwa pemain tidak berhenti dalam kesetimbangan, x = 1 -
a-dan y = 1-y. Dengan pemikiran ini, kita dapat menggunakan dua
indifferences terakhir di atas untuk memecahkan x dan y, memperoleh x-x =
y = y = 1/2. Mengingat hal ini, dua yang pertama indifferences menyiratkan
bahwa zp, = 1/2 juga. Karena pemain 3 memiliki tepat dua pilihan pada
setiap set informasi dan dia indiffer ent antara mereka, perilakunya adalah
hasil memaksimalkan setiap informasi nya set. Masih hanya untuk
memeriksa bahwa pemain 1 dan 2 memaksimalkan hadiah mereka.Dengan
demikian, kita harus memeriksa bahwa tidak tidak lebih baik dengan
berhenti. Bahwa ini sebenarnya kasus berikut karena dengan berhenti,

101
pemain 1 dan 2 mendapatkan hasil negatif, sedangkan memilih Kepala atau
Ekor menghasilkan hasil dari 0.

Dengan demikian, penilaian di mana setiap entri adalah 1/2 adalah


keseimbangan berurutan. Perhatikan bahwa dalam keseimbangan sekuensial
dihitung di sini, setiap pemain menerima hasil dari nol. Dengan demikian,
pemain 3 sebenarnya tidak mendapatkan bantuan yang signifikan dari
pemain 2, karena tanpa pemain 2, permainan akan menjadi pencocokan
permainan uang standar antara pemain 1 dan 3. Dalam latihan, Anda
diminta untuk menemukan semua kesetimbangan sekuensial lainnya. Anda
akan menemukan bahwa pemain 2 dan 3 tarif yang lebih baik dalam
kesetimbangan lainnya. Ada lagi yang bisa kita pelajari dari contoh ini.
Memang, itu adalah pelajaran untuk mempertimbangkan penilaian (a \ fi \
y \, x x, y, y, zp, zy...) - (1 0 0;...... 1 0 0 0, 0 0 ), di mana pemain memilih
Kepala 1 dengan probabilitas 1. 2 pemain berhenti dengan probabilitas 1, 3
dan pemain memilih ekor dengan probabilitas 1. Penilaian ini tampaknya
agak konyol karena meskipun pemain 1 adalah pastikan untuk memilih
Kepala, dan pemutar 3 ingin mencocokkan, pemain memilih 3 ekor, terlepas
dari pilihan pemain 2. Meskipun demikian, penilaian yang berurutan rasional,
dan memenuhi aturan Bayes &#39;! Untuk melihat rasionalitas berurutan,
perhatikan bahwa pemain 1 pasti memaksimalkan di set informasi sejak 2
pemain berhenti. Juga pemain 2 adalah memaksimalkan di set informasi,
karena diberi kepercayaan nya (yang menempatkan probabilitas 1 pada
pemutar 1 Heads telah dipilih) dan strategi pemain 3 (untuk memilih ekor
tidak peduli apa), pemutar 3 yang pasti tidak untuk mencocokkan pemain 1 .
Jadi, yang terbaik adalah untuk 2 untuk berhenti. Akhirnya, mengingat
bahwa pemain 3 percaya pada setiap set informasi bahwa (jika mencapai)
telah memilih pemain 1 ekor, itu memang yang terbaik untuk pemain 3 juga
memilih ekor. Untuk memverifikasi Bayes &#39;rule, cukup perhatikan
bahwa informasi non-tunggal hanya mengatur dicapai dengan strategi

102
perilaku bersama adalah pemain 2, dan keyakinannya memang yang
diinduksi oleh Bayes&#39; rule dari strategi.

Meskipun penilaian ini memenuhi aturan Bayes &#39;dan berurutan


rasional, bukan keseimbangan berurutan. Memang, hal ini tidak konsisten.
Secara intuitif, salah satu indra bahwa ada sesuatu yang salah dengan
keyakinan pemain 3 ini. Sebelum menunjukkan bagaimana penilaian untuk
mally melanggar kondisi konsistensi diwujudkan dalam Definisi 7.20, akan
sangat membantu untuk pertama berpikir tentang hal ini secara intuitif.
Untuk melakukannya, ingat bahwa konsistensi mewujudkan tiga prinsip
prinsip keuangan: Aturan Bayes &#39;, kemandirian, dan kepercayaan
umum. Meskipun penilaian yang diberikan tidak memenuhi aturan Bayes
&#39;, itu tidak memuaskan kemerdekaan. Memang, kita akan menyatakan
bahwa kemerdekaan dence menyiratkan bahwa salah satu dari p2 atau y2
harus nol. (Namun keduanya sama dengan 1 dalam penilaian yang
diberikan.) Biarkan b (b2) menunjukkan node (kanan) kiri di set informasi
beta pemain 3, dan biarkan g \ (gz) menunjukkan node (kanan) kiri dalam
informasi gamma 3 s ditetapkan. Mengingat strategi, tapi sebelum mereka
dilakukan, pertimbangkan pertanyaan berikut merenungkan oleh pemain
3.&quot;Apa kemungkinan simpul g \ bp relatif terhadap simpul.&quot; Kami
ingin menyatakan bahwa jawaban pemain 3 adalah: &#39;Nodegi adalah
jauh lebih mungkin dibandingkan bp simpul.

Alasannya adalah sebagai berikut. Dari Gambar. 7.35, diketahui bahwa


pertanyaan dapat diulang sebagai-&quot;Mengingat bahwa pemain memilih
2 Kepala, apa kemungkinan bahwa pemain memilih 1 Kepala relatif terhadap
ekor?&quot; Tapi dengan kemandirian, 3 keuntungan pemain tidak ada
informasi tentang pilihan strategi l&#39;s dengan mencari tahu pilihan
strategi pemain 2. Akibatnya, pertanyaan di atas harus memiliki jawaban
yang sama seperti pertanyaan: Mengingat bahwa pemain memilih 2 Quit,
apa kemungkinan bahwa pemain memilih 1 Kepala relatif terhadap ekor
&#39;? Tapi jawaban atas ques kedua tion harus bahwa Kepala oleh 1

103
adalah jauh lebih mungkin dibandingkan ekor diberi pilihan 2 untuk Berhenti
karena ini adalah tepat apa strategi yang diusulkan menunjukkan. Oleh
karena itu, dengan kemandirian, jawaban atas pertanyaan awal harus sama -
bahwa g \ adalah jauh lebih mungkin dibandingkan i&gt; 2 - Sebuah
argumentasi yang serupa menunjukkan bahwa jawaban atas pertanyaan
&#39;Apa kemungkinan simpul b \ relatif terhadap simpul &#39;gp harus
bahwa mantan jauh lebih mungkin daripada yang terakhir. (. Memberikan
argumen) Akhirnya, pertimbangkan pertanyaan ini pemain 3: &quot;Apa
kemungkinan simpul g \ relatif terhadap simpul b \ T Meskipun kita tidak bisa
memastikan jawaban 3 ini, hanya ada dua kemungkinan. Entah g \ lebih
mungkin (tidak selalu jauh lebih) dari &gt; i atau tidak.Jika ya, maka karena
b \ ini jauh lebih mungkin dibandingkan g2, harus menjadi kasus yang g \
adalah jauh lebih mungkin dibandingkan g&gt; _. Tapi ini setara dengan
tabungan yang y \ = 1 dan y2 - 0. Dengan demikian, dalam kasus ini, n = o.

Di sisi lain, jika b \ setidaknya sama asg kemungkinan \, kemudian karena g \


adalah jauh lebih mungkin dibandingkan bz, itu harus menjadi kasus yang b \
adalah jauh lebih mungkin dibandingkan b2. Tapi ini setara dengan
mengatakan bahwa / 3 \ = 1 dan fi2 = 0. Akibatnya, kemandirian berarti
bahwa baik y2 = 0, atau FL2 - 0. Kami menyimpulkan bahwa penilaian yang
diberikan tidak memuaskan kemerdekaan.Akun intuitif bukan merupakan
demonstrasi formal yang penilaian gagal untuk konsisten.Hal ini
dimaksudkan hanya untuk menyediakan Anda dengan wawasan sedikit lebih
ke sifat kesulitan dengan itu. Kami sekarang akan secara resmi menunjukkan
bahwa penilaian gagal untuk konsisten - dan oleh karena itu bukan
merupakan ekuilibrium berurutan - dengan membuktikan hasil berikut. Jika
KLAIM (oq, P \, y \, x x,. Y, y, zp, zy) adalah penilaian yang konsisten untuk
sen pencocokan canggih, maka keyakinan harus memenuhi persamaan
berikut (ai) z/32y2 = (2 ) 2/3iyi.

Sebelum kita memberikan bukti klaim, diketahui bahwa ketika \ = 1


(seperti dalam penilaian kita menganalisis), persamaan mengatakan bahwa

104
salah satu fi2 atau y2 harus nol, tepat seperti yang kami berpendapat 23To
mengatakan bahwa satu peristiwa yang tak terhingga lebih mungkin
daripada yang lain hanya berarti bahwa tergantung pada salah satu dari dua
telah terjadi, satu diberikan probabilitas satu, dan yang lainnya diberikan
probabilitas nol. Jadi. Misalnya, mengingat strategi para pemain &#39;, dan
sebelum pertandingan dimulai, kita akan mengatakan bahwa pilihan Kepala
oleh pemain 1 adalah jauh lebih mungkin dibandingkan pilihan ekor karena
mantan memiliki probabilitas satu dan nol probabilitas kedua. di atas
menggunakan kemerdekaan. Akibatnya, membuktikan klaim memang
menunjukkan bahwa penilaian berurutan rasional mengingat tidak konsisten
dan karenanya tidak keseimbangan berurutan. Bukti Klaim: Jika penilaian (. A
\ fi \, y \, x, x, y, y, zp, zY) konsisten, maka menurut Definisi 7,20, ada urutan
tercampur sempurna dari strategi perilaku gies x &quot;, x&quot;, y
&quot;, yn, z&#39;Lz&#39;Y &#39;konvergen ke x, x, y, y, zp, zY, masing-
masing, yang terkait urutan Bayes&#39; keyakinan aturan diinduksi
atau&quot;, / 3j &#39;, y &quot;konvergen ke \ a, fi \, y \, masing-masing.
Sekarang, karena semua kemungkinan strategi perilaku positif secara ketat
di sepanjang urutan, kita memiliki identitas Hasil yang diinginkan sekarang
mengikuti dengan mengambil batas dari kedua belah pihak sebagai n
cenderung tak terhingga. Kami mengakhiri bagian ini dengan teorema
berikut, yang, di satu sisi, menunjukkan koherensi keseluruhan gagasan
keseimbangan sekuensial, dan pada acara lain yang keseimbangan
sekuensial memang perpanjangan induksi mundur untuk umum permainan
bentuk yang luas.

TEOREMA 7.7 (Kreps dan Wilson) Keberadaan Equilibrium Sequential

Setiap terbatas bentuk permainan yang luas dengan recall yang sempurna
memiliki setidaknya satu berurutan equi Librium . Apalagi jika penilaian (p,
b) adalah keseimbangan berurutan, maka b strategi perilaku adalah
keseimbangan sempurna subgame. Kami telah menjelajahi banyak ide dalam
bab ini, dari dominasi, untuk keseimbangan Nash, semua jalan melalui ke

105
ekuilibrium berurutan. Sepanjang jalan, kami berharap dapat memberikan
pembaca rasa kekayaan teori permainan serta kekuatan yang luar biasa
untuk shedding cahaya pada hasil dari situasi strategis yang melibatkan
pemain rasional. Dalam bab berikutnya, kita akan membuat baik
penggunaan ide-ide permainan teori kami telah mengembangkan sini untuk
memahami konsekuensi ekonomi penting dari asimetri informasi. 7,4

Latihan 7.4

Merumuskan permainan bentuk strategis terkait dengan kedua Cournot dan


Bcrtrand duopoli. 7.2 Untuk iteratif penghapusan strategi ketat
mendominasi, menunjukkan bahwa set yang bersarang dan bahwa prosedur
berakhir di putaran finitely banyak jika permainan terbatas. Dapatkah Anda
memberikan upper ketat terikat pada jumlah iterasi yang mungkin
diperlukan?

7.3 prosedur kami untuk menghilangkan iteratif (lemah atau ketat)


mendominasi strategi menghilangkan semua kemungkinan strategi setiap
putaran.Satu mungkin mempertimbangkan menghilangkan hanya beberapa
dari strategi-strategi yang mendominasi di setiap putaran.Dalam pengertian
ini, seseorang dapat mengubah urutan strategi yang didominasi dieliminasi.
(A) Gunakan permainan berikut untuk menunjukkan bahwa urutan strategi
lemah didominasi dieliminasi dapat mempengaruhi hasil yang tetap. (B)
Buktikan bahwa dalam permainan terbatas, urutan eliminasi tidak masalah
ketika seseorang menghilangkan strategi ketat mendominasi. 7,4 Kita telah
melihat bahwa salah satu strategi murni ketat dapat mendominasi strategi
lain murni. Strategi campuran juga dapat ketat mendominasi strategi murni,
dan mereka benar-benar dapat mendominasi strategi campuran lainnya,
juga.Untuk mengilustrasikan, pertimbangkan permainan dua pemain berikut.
a. Yakinkan diri Anda bahwa tak satu pun dari pemain murni 2 ini strategi L
atau R ketat mendominasi strategi murni nya M. b. Tunjukkan bahwa M
strategi murni ketat didominasi oleh strategi campuran di mana pemain

106
memilih 2 Tanah / masing-masing dengan probabilitas 1/2?. 7,5
Pertimbangkan &#39;menebak-the-averagc&#39; permainan dibahas pada
akhir bagian 7.2.1. Tunjukkan bahwa ada strategi murni ketat mendominasi
yang lain. Cari strategi campuran yang ketat mendominasi 100. a. Tunjukkan
bahwa 99 tidak ketat didominasi. b. Tunjukkan bahwa iteratif penghapusan
strategi ketat didominasi menghasilkan pilihan yang unik dari 1 untuk
masing-masing pemain N, dan bahwa ini memerlukan 99 putaran eliminasi.
c. Tunjukkan bahwa ketika ada N = 3 pemain, dan satu menerapkan prosedur
iteratif dominasi lemah, maka W) = (1,2, 14), Wf = (1 2), dan Wf = jl) untuk
setiap pemain;. &#39; . d. Tunjukkan bahwa setiap strategi hidup berulang
dominasi lemah juga bertahan iteratif dominasi yang ketat.

7,7 Sebuah permainan dua orang yang disebut zero-sum jika hadiah para
pemain &#39;selalu jumlah ke nol. Misalkan u (x, y) menunjukkan hasil
player 1 s dalam permainan dua orang, zero-sum ketika pemain memilih 1 x
X, dan pemutar 2 memilih ye Y, akibatnya, hasil 2 pemain adalah-u (xy).
Kedua terbatas Fare x dan menetapkan strategi murni.Pertanyaan-
pertanyaan berikut ini semua mengacu pada permainan dua orang, zero-
sum. a. Buktikan teorema minimax. Artinya, buktikan bahwa ada sepasang
strategi campuran mj, m \ sehingga max min iK.m \, ntz) = u (ni \, nA) = min
max u (m \ di&gt;.). Interpretasikan hasil ini. b. Tunjukkan bahwa Nash
kesetimbangan yang dipertukarkan dalam bahwa jika (mf, dan (m \, mz)
adalah dua ekuilibria Nash, maka (mj. / / /;&gt;) dan (mj.mp juga ekuilibria
Nash Simpulkan, oleh karena itu, bahwa dalam. dua orang, zero-sum game,
jika ada beberapa ekuilibria Nash, pemain tidak perlu tahu mana strategi
ekuilibrium yang lain menggunakan. c. Tunjukkan bahwa hasil pemain
l&#39;s (dan karena itu pemain 2 yang juga) adalah sama di setiap
ekuilibrium Nash Jumlah ini. disebut nilai permainan. 7,8 Sebuah permainan
simetris jika setiap pemain memiliki set yang sama strategi murni dan untuk
setiap pemain / setiap kali / V-vektor adalah permutasi dari (1 TV). Buktikan
bahwa terbatas permainan simetris memiliki sebuah Nash equilibrium

107
kesetimbangan Nash simetris di mana setiap pemain memilih strategi yang
sama.

7,9 Buktikan (topi nilai dari, simetris dua orang permainan, zero-sum adalah
nol. 7,10 Hitung set Nash kesetimbangan dalam permainan berikut. Juga
menunjukkan. Bahwa ada dua busur Nash kesetimbangan, tetapi hanya satu
yang tidak pemain memainkan strategi yang lemah didominasi b..Juga
menunjukkan bahwa ada jauh lebih banyak ekuilibria Nash, hanya satu yang
memiliki kedua pemain memainkan strategi yang lemah mendominasi. c.
Juga menunjukkan bahwa ada strategi yang unik ditentukan oleh iteratif
menghilangkan strategi lemah mendominasi. 7.11 Dua pemburu berada
pada berburu rusa Mereka berpisah di hutan dan masing-masing memiliki
dua strategi:.. berburu rusa (S), atau menyerah berburu rusa dan bukannya
berburu kelinci (R) Jika mereka berdua berburu rusa, mereka akan berhasil
dan masing-masing mendapatkan hasil dari 9 Jika salah satu perburuan
untuk rusa dan lainnya menyerah dan berburu untuk kelinci, pemburu rusa
dan kelinci menerima 0 pemburu 8.. Jika kedua berburu kelinci maka masing-
masing menerima 7. Hitung semua Kesetimbangan Nash untuk permainan
ini, yang disebut &#39;Stag The Hunt&#39;, digambarkan di bawah ini.
Manakah dari kesetimbangan ini yang menurut Anda paling mungkin untuk
dimainkan?Kenapa? 7.12 Hubungi dua pertandingan dengan set strategi
yang sama tetapi hadiah yang berbeda strategis setara jika untuk setiap
pemain; &#39;dan setiap strategi campuran dari yang lain, pemain
peringkat fs strategi murni dalam satu pertandingan bertepatan dengan
peringkat di tangan yang lain Pertimbangkan lagi permainan berburu rusa,
tapi rasa bahwa pemain 1.&#39; s hasil ketika pemain lain berburu rusa
dikurangi dengan a&gt; 0, sehingga permainan menjadi,

a) Tunjukkan bahwa game ini strategis setara dengan permainan berburu


rusa. b) Menggunakan hanya operasi mengurangkan sebuah konstanta
dari hasil pemain sambil tetap strategi pemain lain, menunjukkan
bahwa permainan berburu rusa yang strategis dan setara dengan

108
koordinasi permainan murni, mana keseimbangan menurut Anda
paling mungkin untuk dimainkan dalam murni koordinasi permainan?
Kenapa? Bandingkan jawaban Anda dengan yang Anda berikan dalam
Latihan 7.11. (Jika jawaban Anda berbeda bertanya pada diri sendiri
mengapa, dalam terang kesetaraan strategis dua pertandingan.) 7.13
Pertimbangkan tendangan penalti dalam sepak bola. Ada dua pemain,
kiper dan striker. Striker ini memiliki dua strategi: tendangan ke kanan
kiper (R) atau ke kiri kiper (L). Kiper memiliki dua strategi: bergerak ke
kiri (L) atau memindahkan hak (R). Membiarkan adalah probabilitas
bahwa tendangan dihentikan ketika kedua memilih L dan membiarkan
p adalah probabilitas bahwa tendangan dihentikan saat berdua
memilih R. Asumsikan bahwa 0 &lt;a&lt;P &lt;1. Akibatnya, striker yang
lebih terampil menendang ke kiri kiper. Matriks hasil adalah sebagai
berikut.
b) a. Sebelum menganalisis pertandingan ini, secara informal menjawab
pertanyaan-pertanyaan berikut. (I) Apakah Anda mengharapkan striker
yang lebih terampil menendang ke kiper yang tersisa daripada
kanannya, untuk mencetak lebih sering ketika dia menendang ke kiper
yang tersisa? (Ii) Jika kemampuan striker untuk mencetak gol saat
sepakan terhadap kenaikan kiri kiper (yaitu penurunan) bagaimana ini
akan mempengaruhi persentase kali skor striker ketika dia memilih
untuk menendang ke kiper yang tersisa? Akan mempengaruhi
persentase mencetak gol ketika dia menendang tepat? b. Temukan
keseimbangan Nash yang unik. c. Jawab lagi pertanyaan-pertanyaan
dalam bagian (a). Berdasarkan hal ini, tidaklah bijaksana untuk menilai
skor relatif striker kemampuan menendang kiri kanan dibandingkan
dengan membandingkan fraksi kali dia mencetak ketika dia
menendang benar versus fraksi kali dia mencetak ketika ia
meninggalkan tendangan? d. Tunjukkan bahwa mengetahui fraksi kali
gol itu mencetak gol ketika kedua pemain memilih L dan fraksi kali gol
itu mencetak gol ketika kedua pemain memilih R akan memungkinkan

109
Anda untuk benar menyimpulkan kemampuan skor pemain saat
menendang kiri dan kanan. e. Bisakah Anda benar menyimpulkan
kemampuan skor pemain saat menendang kiri dan kanan jika Anda
hanya memiliki akses ke pilihan striker? Jika tidak, apa yang bisa
disimpulkan? f. Bisakah Anda benar menyimpulkan kemampuan skor
pemain saat menendang kiri vs kanan jika Anda onl memiliki akses ke
pilihan kiper? Jika tidak, apa yang bisa disimpulkan?
c) 7.14 Tiga perusahaan menggunakan air dari danau untuk keperluan
produksi, perusahaan bach memiliki dua strategi murni: limbah
memurnikan (P), atau membuang limbah mentah (D). Jika nol atau satu
perusahaan memilih D, air tetap murni, tetapi jika dua atau tiga
perusahaan memilih D, air menjadi tercemar dan setiap perusahaan
menderita kerugian dari 3. Biaya pemurnian, P, adalah 1. Menghitung
semua Kesetimbangan Nash dari game ini. 7.15 Tunjukkan bahwa
setiap pertandingan hingga memiliki keseimbangan Nash di mana
tidak ada pemain yang menempatkan probabilitas positif pada strategi
murni lemah mendominasi. a) Meningkatkan hasil ini dengan
menunjukkan bahwa setiap pertandingan hingga memiliki sebuah
nisuch Nash equilibrium bahwa untuk setiap pemain tidak lemah
didominasi. b) Tunjukkan bahwa hasil dari bagian (a) membutuhkan
finiteness dengan mempertimbangkan permainan Bcrtrand duopoli
diperkenalkan dalam Bab 4. 7.16 Tunjukkan bahwa dalam permainan
bentuk terbatas strategis, himpunan strategi hidup berulang dominasi
lemah tidak kosong. 7.17 Pertimbangkan permainan bentuk strategis
digambarkan di bawah ini. Masing-masing dari dua negara secara
bersamaan harus memutuskan suatu tindakan. Negara 1 harus
memutuskan apakah akan mempertahankan atau senjata untuk
menghancurkan mereka. Negara 2 harus memutuskan apakah untuk
memata-matai negara 1 atau tidak. Ini akan menjadi skandal
internasional bagi negara jika negara 1 2 bisa membuktikan bahwa

110
negara 1 adalah menjaga senjatanya. Matriks hasil adalah sebagai
berikut.
d) a) Apakah pemain baik memiliki strategi ketat dominan? b) Apakah
pemain cither memiliki strategi lemah dominan? c) Cari keseimbangan
Nash di mana pemain tidak mempekerjakan strategi lemah dominan.
e) 7.18 Mempertimbangkan kedua negara dari latihan sebelumnya, tapi
sekarang anggaplah bahwa negara 1 dapat menjadi salah satu dari
dua jenis, &#39;agresif&#39; atau &#39;non-agresif&#39;. Negara 1
tahu jenis sendiri. Negara 2 tidak tahu jenis negara l&#39;s, namun
percaya bahwa negara 1 agresif dengan probabilitas e&gt; 0. Jenis
agresif tempat-tempat penting pada menjaga senjatanya. Jika ia
melakukannya dan negara 2 mata-mata pada jenis agresif ini
mengarah pada perang, yang tipe agresif menang dan membenarkan
karena mata-mata, tetapi yang sangat mahal bagi negara 2. Ketika
negara 1 adalah non-agresif, hadiah yang seperti sebelumnya
(misalnya, seperti dalam latihan sebelumnya). Matriks hasil terkait
dengan masing-masing dua kemungkinan jenis negara 1 diberikan di
bawah ini. a) Tindakan apa yang harus jenis agresif negara mengambil
1 dalam ekuilibrium Bayesian-Nash? b) Dengan asumsi bahwa e
&lt;1/5. menemukan keseimbangan Bayes-Nash yang unik. (Dapatkah
Anda membuktikan bahwa itu adalah unik?) 719 Sebuah komunitas
terdiri dari dua jenis individu, jenis yang baik dan jenis yang buruk.
Fraksi A &gt; 0 buruk, sedangkan sebagian kecil sisanya, 1 - e&gt; 0
busur yang baik. Jenis buruk dicari polisi, sementara jenis yang baik
tidak. Individu dapat memutuskan apa warna mobil untuk mengemudi,
merah atau biru. Mobil merah makan lebih cepat daripada mobil biru.
Semua orang lebih suka mobil cepat untuk memperlambat mobil.
Setiap hari polisi memutuskan apakah akan berhenti hanya mobil
merah atau berhenti hanya mobil biru, atau untuk menghentikan ada
mobil sama sekali. Mereka tidak bisa menghentikan semua mobil.
Individu harus memutuskan apa warna mobil untuk mengemudi.

111
Individu tidak suka berhenti, dan polisi tidak suka menghentikan
individu yang baik. Seorang individu yang buruk selalu mencoba untuk
pergi jika dihentikan oleh polisi dan lebih mungkin untuk pergi jika
mengendarai mobil merah. Matriks hasil terkait dengan situasi sehari-
hari adalah sebagai berikut.
f) Pikirkan ini sebagai permainan Bayesian dan menjawab berikut. a)
Misalkan f itu. &lt;1/21. Temukan dua strategi murni Bayes-ekuilibria
Nash dari game ini. b) Misalkan e&gt; 1/16. Tunjukkan bahwa
&#39;Jangan Berhenti&#39; adalah sangat didominasi polisi dengan
strategi campuran. c) Misalkan s = 1/6. Temukan keseimbangan Bayes-
Nash yang unik. (Dapatkah Anda membuktikan bahwa itu adalah
unik?) 7.20 a) Misalkan p adalah umum sebelumnya dalam permainan
informasi lengkap menugaskan probabilitas positif untuk setiap vektor
jenis sendi. Tunjukkan bahwa jika beberapa jenis beberapa pemain
memberikan probabilitas positif untuk beberapa jenis, t,, dari pemain
lain /, maka semua pemain, terlepas dari jenis mereka, juga
menetapkan probabilitas positif untuk mengetik f, - pemain; &#39;. b)
Menyediakan permainan tiga pemain dari informasi yang tidak lengkap
di mana keyakinan para pemain &#39;tidak dapat dihasilkan oleh
perusahaan sebelum umum yang memberikan probabilitas positif
untuk setiap vektor bersama jenis. c) Menyediakan permainan dua
pemain dari informasi yang tidak lengkap di mana keyakinan para
pemain &#39;tidak dapat dihasilkan oleh perusahaan sebelum umum
yang memberikan probabilitas positif untuk setiap vektor bersama
jenis dan di mana setiap pemain, terlepas dari jenis nya, memberikan
probabilitas positif kepada setiap jenis pemain lainnya. 7.21 permainan
lengkap kami informasi memungkinkan para pemain untuk memiliki
ketidakpastian tentang gaji pemain lain &#39; off. Tapi bagaimana
dengan ketidakpastian tentang set murni pemain lain &#39;strategi?
Tunjukkan bahwa ketidakpastian tentang strategi set murni pemain
dapat ditangkap oleh ketidakpastian tentang hadiah itu sendiri.

112
g) 7.22 Tunjukkan bahwa ada busur lainnya Bayesian-ekuilibria Nash dari
permainan Bertrand dua perusahaan dalam Contoh 7.3. 7.23 Dalam
VVC latihan memungkinkan setiap pemain dalam permainan Bayesian
untuk memiliki jenis tak terhingga banyaknya dan kami keyakinan allrJj
pemain ini tentang jenis pemain lain &#39;yang akan diberikan oleh
fungsi kepadatan probabilitas. Payoff] formula dan definisi
keseimbangan Bayes-Nash adalah justru analog dengan kasus
&quot;tipe terbatas dengan penjumlahan atas jenis digantikan oleh
integral. Pertimbangkan pertama-harga, tertutup-tawaran lelang di
mana penawar mengajukan tawaran secara bersamaan dengan objek
akan kepada penawar tertinggi dengan harga yang setara dengan
penawaran mereka. Misalkan ada busur dua penawar dan bahwa nilai-
nilai mereka untuk objek yang dipilih secara independen dari distribusi
seragam atas [0, f] Pikirkan tipe pemain sebagai nilai yang pemain
tempat pada objek hasil Seorang pemain adalah. v-/&gt; ketika ia
menang objek dengan penawaran b dan nilai nya adalah v, hasil nya
adalah 0 jika dia tidak menang objek
h) a) Merumuskan ini sebagai permainan Bayesian dan menemukan
permainan bentuk terkait strategis. Perhatikan bahwa permainan
bentuk terkait strategis memiliki pemain tak terhingga banyaknya. b)
Biarkan bj (v) menunjukkan tawaran yang dibuat oleh pemain /
&#39;tipe v Tampilkan bahwa ada keseimbangan Bayesian-Nash di
mana (ij = a + fi i-untuk semua /&#39; dan v Tentukan nilai-nilai dari
dan p 7.24 Memodifikasi pertama-harga, tertutup-tawaran lelang
dalam latihan sebelumnya sehingga pecundang juga membayar nya
hid (tapi tidak menang objek). ini lelang dimodifikasi disebut lelang
semua-bayar.. a) Tunjukkan bahwa ada keseimbangan Bayesian-Nash
di mana b, - (v) = y + 8v + <p\r for all and v.
b) Bagaimana tawaran para pemain &#39;dibandingkan dengan
mereka yang berada di auction7 pertama-harga Apa intuisi balik
perbedaan dalam tawaran? c) Tunjukkan bahwa, ex ante, lelang

113
pertama-harga dan lelang semua-bayar menghasilkan pendapatan
yang diharapkan sama untuk penjual. 7,25 Sepenuhnya menjelaskan
dua strategi murni yang berbeda untuk setiap pemain di kedua
pertandingan pembeli-penjual dan permainan disederhanakan dibawa
pulang. Hitung hadiah terkait dengan keempat pasang strategi. 7.26
Daftar semua strategi murni untuk kedua pemain dalam permainan
bentuk luas Figs. 7.12 dan 7.14. Selain itu, menggambarkan bentuk
terkait strategis dalam diagram matriks. 7.27 Dalam Gambar. 7.36,
sebuah perusahaan asuransi (C), harus mempertimbangkan apakah
akan menawarkan kebijakan asuransi mobil murah atau mahal untuk
driver (D). Perusahaan tidak dapat mengamati apakah pengemudi
drive aman atau ceroboh, tetapi dapat mengamati apakah pengemudi
telah mengalami kecelakaan atau tidak. Kemungkinan kecelakaan
tergantung pada apakah pengemudi drive aman atau sembarangan.
Jika pengemudi drive dengan aman ia memiliki kecelakaan dengan
probabilitas 1/5. Jika dia drive sembarangan ia memiliki kecelakaan
dengan probabilitas 4/5. Jika pengemudi drive aman dia tidak akan
membeli kebijakan mahal. Situasi ini dimodelkan sebagai permainan
bentuk yang luas pada gambar di bawah.Probabilitas kecelakaan
dimodelkan sebagai pengacakan oleh Alam dan diberikan dalam tanda
kurung siku pada gambar.Imbalannya pengemudi adalah nomor
teratas dalam setiap vektor hasil.Misalnya, dalam vektor hasil (2, -1)
imbalannya pengemudi adalah 2.
a) Apakah ada keseimbangan Nash di mana pengemudi drive aman
dengan probabilitas satu? b) Cari keseimbangan Nash yang
memaksimalkan kemungkinan bahwa pengemudi drive aman. 7.28
Turunkan mundur strategi induksi untuk permainan yang ditunjukkan
pada Gambar. 7.37 (hal. 372). a) Yang game mengakui strategi mundur
beberapa induksi? b) Buktikan bahwa jika permainan informasi
terbatas yang sempurna memiliki properti bahwa tidak ada pemain
yang acuh tak acuh antara setiap pasang node akhir, maka strategi

114
induksi mundur yang unik. c) Berikan contoh permainan terbatas
informasi yang sempurna di mana strategi induksi mundur tidak unik,
tetapi vektor hasil ini. 7.29 Berikut permainan, diambil dari Reny
(1992), disebut &#39;Take-it-or-leave-it&#39;. Wasit Sebuah
dilengkapi dengan dolar N. Dia menempatkan satu dolar di atas
meja.Pemain juga dapat mengambil 1 dolar atau meninggalkannya.
Jika iamengambilnya. permainan berakhir. Jika ia meninggalkan itu,
wasit menempatkan dolar kedua di atas meja. Dua pemain kini diberi
pilihan untuk mengambil dua dolar atau meninggalkan mereka. Jika ia
membawa mereka, permainan berakhir. Jika wasit menempatkan dolar
ketiga di atas meja dan itu lagi giliran pemain 1 s untuk mengambil
atau meninggalkan tiga dolar. Permainan berlanjut dengan cara ini
dengan pemain bergantian diberi pilihan untuk mengambil semua
uang wasit sejauh ini ditempatkan di atas meja dan di mana wasit
menambah dollar untuk total setiap kali seorang pemain meninggalkan
uang. Jika pemain terakhir untuk bergerak memilih untuk
meninggalkan dolar N permainan berakhir dengan kedua pemain
menerima uang.Asumsikan bahwa adalah informasi publik.
a) Tanpa berpikir terlalu keras, bagaimana Anda memainkan
permainan ini jika Anda berada di posisi pemain 1? Apakah ada
bedanya jika / Vwere sangat besar (seperti satu juta) atau cukup kecil
(seperti 5) 7 b) Hitung strategi induksi mundur.Apakah ini masuk akal
bagi Anda? c) Buktikan bahwa strategi induksi mundur membentuk
ekuilibrium Nash. d) Buktikan bahwa hasilnya bahwa hasil dari strategi
induksi mundur adalah hasil yang unik dalam kesetimbangan Nash.
Apakah ada ekuilibrium Nash yang unik? 7.30 Pertimbangkan bentuk
yang luas tanpa hadiah dalam Gambar. 7.38. Misalkan permainan baik
berakhir dalam kemenangan untuk satu pemain dan kerugian bagi
yang lain, atau dasi. Artinya, hanya ada tiga vektor hasil yang
mungkin: (0, 0), (1 -1.). dan (-1. 1). Membangun empat pertandingan
yang berbeda dengan menetapkan hadiah tersebut dalam beberapa

115
fashion sampai titik akhir. a) Tunjukkan bahwa dalam setiap kasus,
salah satu pemain dapat memastikan menang, atau keduanya dapat
memastikan hasil imbang. b) Dapatkah Anda generalisasi temuan ini
ke beberapa terkenal permainan salon (noughts dan salib, draft,
catur)?
7.31 Biarkan menunjukkan subset terbatas node dari beberapa
permainan bentuk yang luas. Buktikan bahwa Y mengandung simpul
tidak memiliki pengikut yang ketat di Y. 7.32 Memberikan contoh
permainan terbatas informasi yang tidak sempurna dan daya ingat
yang sempurna di mana tidak ada &#39;terakhir&#39; set informasi.
Artinya, untuk setiap set informasi, ada node, x, di dalamnya sehingga
(x, a) e X adalah bukan merupakan simpul akhir untuk beberapa
tindakan a. 7.33 Temukan semua kesetimbangan sempurna subgame
dalam permainan Gambar. 7.17. 7.34 Buktikan bahwa untuk setiap
permainan bentuk yang luas, permainan itu sendiri adalah sebuah
subgame. 7.35 Tunjukkan bahwa jika s adalah strategi kesetimbangan
Nash murni dari permainan bentuk yang luas, maka s menginduksi
keseimbangan Nash dalam setiap subgame yang dicapai oleh s. 7.36
Berdebat bahwa dalam setiap permainan informasi yang sempurna,
setiap node mendefinisikan subgame a. 7.37 Jawablah pertanyaan-
pertanyaan berikut. a) Buktikan bahwa setiap pertandingan bentuk
terbatas yang luas dengan informasi yang sempurna memiliki
setidaknya satu strategi keseimbangan subgame murni sempurna. b)
Memberikan contoh permainan bentuk terbatas yang luas tidak
memiliki subgame keseimbangan strategi murni sempurna. 7.38
Melengkapi bukti Teorema 7.6 pada keberadaan keseimbangan yang
sempurna subgame.
7.39 Temukan semua kesetimbangan sempurna subgame dari
permainan pada Gambar. 7.26 (a). 7.40 Jawablah pertanyaan-
pertanyaan berikut untuk permainan yang ditunjukkan pada Gambar.
7.39. a) Hitung keseimbangan Nash untuk permainan. b) Tunjukkan

116
bahwa game ini tidak memiliki ekuilibrium Nash dalam strategi
perilaku. a) Simpulkan bahwa game ini tidak memiliki keseimbangan
yang sempurna subgame. b) Apa sumber dari kegagalan eksistensi?
7.41 Berdebat bahwa untuk terbatas permainan bentuk yang luas, jika
strategi perilaku, b, benar-benar dicampur, maka a) setiap set
informasi tercapai dengan probabilitas positif. b) penilaian (p, b) adalah
konsisten jika dan hanya jika p berasal dari b dengan menggunakan
aturan Bayes &#39;7.42 Jawablah pertanyaan-pertanyaan berikut. a)
Berdebat bahwa prinsip kemandirian menyiratkan bahwa mengingat
strategi perilaku yang digambarkan dalam permainan Gambar. 7.29.
nilai harus menjadi 1/3. b) Pastikan mengingat strategi perilaku
digambarkan dalam Gambar. 7,30 dan 7,31, konsistensi menyiratkan
bahwa dalam kedua kasus keyakinan harus memenuhi ft = 7.43
Buktikan bahwa jika penilaian konsisten, maka memenuhi Bayes
&#39;aturan, dan bahkan Bayes&#39; aturan di setiap subgame. (The
penilaian awal menginduksi sebuah penilaian subgame setiap Ketika
subgame masing-masing diperlakukan sebagai permainan dalam
dirinya sendiri,. Dan penilaian diinduksi pada subgame yang
memenuhi Bayes &#39;aturan, penilaian awal dikatakan untuk
memenuhi Bayes&#39; aturan di setiap subgame. ) 7.44
Pertimbangkan permainan Gambar. 7.27. Biarkan b menunjukkan
strategi perilaku di mana pemain memainkan L 1 dan pemain 2
memainkan m. Buktikan bahwa untuk setiap sistem kepercayaan, p,
penilaian (p, b) tidak berurutan rasional. Temukan semua penilaian
berurutan rasional.
7.45 Cari semua kesetimbangan berurutan untuk permainan Gambar.
7.35. 7.46 (a) Berdebat bahwa kelas game Bayesian dengan sebelum
umum adalah subset dari kelas permainan bentuk yang luas dengan
menunjukkan bahwa setiap permainan Bayesian dengan umum
sebelum memiliki set strategi dan fungsi hasil yang setara dengan
mereka dalam bentuk yang luas permainan di mana Nature pertama

117
memilih tipe pemain &#39;sesuai dengan sebelumnya, setelah itu
setiap pemain secara simultan informasi hanya dari jenis sendiri,
setelah itu setiap pemain secara bersamaan mengambil tindakan. (B)
Pertimbangkan permainan dua pemain Bayesian dengan dua jenis
untuk setiap pemain dan di mana keempat vec-tor jenis sama-sama
mungkin. Menggambar bentuk permainan yang luas (tanpa
menentukan hadiah) seperti yang dijelaskan dalam bagian (a). (C)
Buktikan bahwa Bayes-Nash keseimbangan permainan Bayesian
menginduksi keseimbangan berurutan dari permainan bentuk yang
luas dijelaskan dalam bagian (a) dan sebaliknya. 7.47 Pertimbangkan
permainan bentuk yang luas pada Gambar. 7.40. Seorang peserta
harus memutuskan apakah akan masuk pasar di masing-masing dari
dua periode. Pasar sudah ditempati oleh seorang penguasa, yang
dapat berupa &#39;lemah&#39; atau kuat &#39;. Sebuah kewajiban
yang lemah tidak dapat memotong harga yang cukup rendah untuk
mendorong peserta keluar jika mencoba untuk masuk.Sebuah
kewajiban yang kuat dapat melakukannya namun.Probabilitas bahwa
Alam memilih incumbent kuat adalah 1/4.Imbalannya incumbent
adalah nomor teratas dalam setiap vektor hasil Sebagai contoh, dalam
vektor hasil (8, 0), incumbent menerima hadiah dan 8 peserta
menerima hasil 0.
7.45 Cari semua kesetimbangan berurutan untuk permainan Gambar.
7.35. 7.46 (a) Berdebat bahwa kelas game Bayesian dengan sebelum
umum adalah subset dari kelas permainan bentuk yang luas dengan
menunjukkan bahwa setiap permainan Bayesian dengan umum
sebelum memiliki set strategi dan fungsi hasil yang setara dengan
mereka dalam bentuk yang luas permainan di mana Nature pertama
memilih tipe pemain &#39;sesuai dengan sebelumnya, setelah itu
setiap pemain secara simultan informasi hanya dari jenis sendiri,
setelah itu setiap pemain secara bersamaan mengambil tindakan. (B)
Pertimbangkan permainan dua pemain Bayesian dengan dua jenis

118
untuk setiap pemain dan di mana keempat vec-tor jenis sama-sama
mungkin. Menggambar bentuk permainan yang luas (tanpa
menentukan hadiah) seperti yang dijelaskan dalam bagian (a). (C)
Buktikan bahwa Bayes-Nash keseimbangan permainan Bayesian
menginduksi keseimbangan berurutan dari permainan bentuk yang
luas dijelaskan dalam bagian (a) dan sebaliknya. 7.47 Pertimbangkan
permainan bentuk yang luas pada Gambar. 7.40. Seorang peserta
harus memutuskan apakah akan masuk pasar di masing-masing dari
dua periode. Pasar sudah ditempati oleh seorang penguasa, yang
dapat berupa &#39;lemah&#39; atau kuat &#39;. Sebuah kewajiban
yang lemah tidak dapat memotong harga yang cukup rendah untuk
mendorong peserta keluar jika mencoba untuk masuk.Sebuah
kewajiban yang kuat dapat melakukannya namun.Probabilitas bahwa
Alam memilih incumbent kuat adalah 1/4.Imbalannya incumbent
adalah nomor teratas dalam setiap vektor hasil Sebagai contoh, dalam
vektor hasil (8, 0), incumbent menerima hadiah dan 8 peserta
menerima hasil 0.

119

Anda mungkin juga menyukai