UAS Bab5 Yang Gisella
UAS Bab5 Yang Gisella
LEARNING
Dipresentasikan oleh:
YANG GISELLA YULIALISTIKA E.
Varian model BL muncul tergantung pada bobot yang melekat pada tindakan
masa lalu. Brown (1951) mengembangkan model permainan fiktif (fictitious
play model) yang menggabungkan permainan yang lebih "menarik" asumsi
bahwa pemain menanggapi rata-rata sejarah yang diamati dengan pengamatan
sebelumnya dihitung dan diberi bobot yang sama. Dalam model Cournot,
mengikuti Cournot (1838) pemain memilih respons terbaik untuk tindakan
lawan yang paling baru diamati; hanya tindakan terakhir lawan dihitung.
A belief Learning Model
Dengan asumsi bahwa kepercayaan tidak dapat diamati secara langsung, Cheung dan Friedman
membangunnya aturan pembelajaran empiris berdasarkan skema di mana pemain dan
lembaga/mekanisme menghasilkan interaksi dan umpan balik antara tindakan, hasil dan keyakinan.
Aturan BL memberikan aturan keputusan berdasarkan probabilitas bahwa seorang pemain akan
memilih diberikan tindakan; ini akan ditentukan oleh tiga elemen.
Fokus ini diamati perilaku sangat cocok dengan tema teori eksperimen dan permainan (the
experimental and game theory) yang terlihat dalam ekonomi perilaku modern yaitu tentang
menganalisis pilihan. Psikologi perilaku dikembangkan dari ahli fisiologi pemenang hadiah Nobel -
Ivan Pavlov (1849–1946).
EWA adalah model pembelajaran adaptif yang melihat ke belakang berdasarkan pengalaman masa lalu
baik dalam bentuk penguatan langsung atau sebagai bukti tentang sejarah orang lain.
Beauty contests
Beauty Contest dikembangkan oleh ekonomi perilaku modern, Keynes
menggunakan metafora “beauty contest” surat kabar. Pesaing tidak
diminta untuk memilih “wajah tercantik” tetapi “yang menurutnya paling
mungkin untuk ditangkap keunggulan dari pesaingnya.”. Dalam Beauty
Contest, spekulan di pasar keuangan mencapai "derajat ketiga" penalaran.
Mereka tidak membentuk keyakinan tentang fundamental, kebenaran
nilai-nilai atau hasil tetapi malah mencoba menebak apa yang dipikirkan
orang lain.
Herding and Social Learning
Ekonomi perilaku (Behavioural economics) juga mengeksplorasi jenis pembelajaran tertentu/spesifik
dalam bentuk sosial belajar,
Herding adalah kategori umum dari perilaku di mana orang mengikuti kelompok orang lain dan
mungkin melakukannya karena berbagai alasan. Ini adalah fenomena bukan individu memutuskan
untuk mengikuti orang lain dan meniru perilaku kelompok daripada memutuskan secara independen
dan atomistik berdasarkan informasi pribadi mereka sendiri.
Salah satu studi perintis/pelopor tentang herding and social learning adalah
model kaskade informasi yang dikembangkan oleh Bikhchandani, Hirshleifer
dan Welch (BHW; 1992, 1998). Mereka fokus pada pembelajaran sosial
dalam konteks perilaku sosial yang seragam. Mereka mengidentifikasi empat
mekanisme penggembalaan utama / four primary herding mechanisms
encouraging people mendorong orang untuk melakukan apa yang orang lain
lakukan: sanksi atas menyimpang, eksternalitas hasil/payoff positif, preferensi
konformitas dan komunikasi.
Herding and Social Learning
Jadi BHW mengusulkan bahwa pembelajaran sosial dalam bentuk “kaskade informasi” juga menghasilkan perilaku
sosial yang seragam. Kaskade informasi terjadi “ketika optimal untuk sebuah individu, setelah mengamati tindakan
orang-orang di depannya, untuk mengikuti perilaku individu sebelumnya tanpa memperhatikan informasinya
sendiri” (BHW 1992, hal. 994).
Bikhanchandi, Hirshleifer dan Welch (1992) mengembangkan model serupa kaskade informasi sebagai penjelasan
untuk konformitas lokal yang munculketika optimal bagi seorang individu untuk mengikuti tindakan pendahulunya
dan mengabaikan informasi pribadinya.
Menurut teori Bayesian, herding dan kaskade informasi muncul karena anggota
kawanan mengabaikan sinyal pribadi mereka sendiri untuk mendukung informasi
kawanan tentang tindakan pendahulu mereka. Ini berarti bahwa mereka berpotensi
mengabaikan sejumlah besar informasi pribadi yang penting.
Secara keseluruhan, model herding dan sosial learning didasarkan pada model
Bayesian berasumsi bahwa agen menggunakan metode logis yang canggih tetapi
hasilnya bisa bagus atau buruk tergantung pada apakah pembuat keputusan yang
diturunkan benar atau salah melacak oleh tindakan pendahulu mereka.
Experimental tests of Bayesian herding
Sebuah aritmatika analisis aturan Bayes dirangkum dalam Mathematical Appendix A5.3. Tabel 5.1 merangkum probabilitas bahwa bola
berasal dari Guci A, dihitung dengan menggunakan Bayes's aturan.
Contoh: jika A mengumumkan bahwa menurutnya bola berasal dari Guci A, maka yang lain akan berasumsi bahwa dia mengambil
bola merah. Kemudian B memilih. Mungkin dia memilih bola hitam tetapi dia menyimpulkan bahwa A telah menarik bola merah
dan dari sini menyimpulkan bahwa peluang terambilnya bola dari Guci A adalah 50%. Dia bisa memilih secara rasional baik guci
tapi bayangkan dia menebak guci A.
Kemudian C memilih dan mungkin dia juga memilih bola hitam tetapi dia berasumsi bahwa A dan B telah memilih bola merah dan
sebagainya, jika dia menggunakan aturan Bayes, maka dia menyimpulkan bahwa Guci A dipilih karena bola merah telah dipilih dua
kali, melawan satu undian bola hitamnya. Secara keseluruhan, dia menilai itu kemungkinan Guci A adalah 67% jadi dia juga akan
memilih Guci A meskipun dia memilih sebuah bola hitam..
Experimental tests of Bayesian herding
Anderson dan Holt (1996, 1997) membangun sebuah ilustrasi tentang bagaimana proses penalaran ini
bekerja dan menguji hipotesis secara eksperimental menggunakan percobaan guci.
Eksperimen ada dua guci: Guci A dan Guci B; Guci A berisi dua merah bola dan satu bola hitam; dan Guci
B berisi satu bola merah dan dua bola hitam, seperti yang ditunjukkan pada Gambar 5.1
Model pembelajaran penguatan (Reinforcement learning models) memanfaatkan wawasan dari psikologi perilaku
eksperimen – termasuk eksperimen klasik dari Skinner dan Thorndike – yang menunjukkan bagaimana proses belajar
hewan didorong oleh respons mereka terhadap imbalan (reward)
Model pembelajaran kepercayaan (Belief learning models) mengacu pada wawasan dari teori permainan (game
theory) untuk menangkap pembelajaran sebagai proses strategis mengantisipasi tindakan orang lain, konsekuensi dari
tindakan tersebut dan strategi terbaik yang diberikan informasi ini.
TERIMAKASIH