Translate Ekonometrik, Measurment, Dan Experiments

8 Pengukuran

t Ikhtisar
t Pengamatan
t Inflasi Harga Konsumen
t Pengangguran dan PDB
t Kesimpulan
t Pertanyaan Studi
t Bacaan yang disarankan

Ikhtisar

Bagian I buku ini membahas teori ekonomi . Para ekonom berteori untuk berbagai tujuan, yang menonjol adalah penjelasan
ilmiah dari fenomena ekonomi. Tetapi tidak peduli apa tujuan yang dikejar, teori sangat tidak mungkin untuk memenuhi
tujuannya dengan baik kecuali didukung oleh bukti. Bagian II karena itu melihat pada topik bukti, generasi dukungan empiris
atau metode-ology. Ada dua jenis metode utama untuk menghasilkan dukungan empiris dalam ekonomi: metode
observasional dan eksperimental. Metode observasi, seperti yang ditunjukkan oleh istilah, bertujuan untuk menarik
kesimpulan tentang teori ekonomi tanpa manfaat intervensi yang dirancang oleh ekonom. Dalam prakteknya, ahli ekologi
bergantung pada pekerjaan kantor statistik dan badan penyedia data lainnya, dan menganalisis data yang diberikan kepada
mereka dengan menggunakan model statistik dan ekonometrik. Ekonometrika adalah topik Bab 9. Metode eksperimental
membutuhkan peran yang lebih aktif dalam proses penghasil data di pihak ekonom. Ekonom mendesain dan mengeksekusi
intervensi, mengamati dan mencatat hasilnya dan hanya kemudian menganalisis data, sering juga menggunakan teknik
statistik yang rumit seperti yang dari metode observasi. Eksperimen ekonomi akan dipertimbangkan dalam Bab 10 dan 11.

Bab ini melihat kerja keras yang dilakukan oleh kantor-kantor statistik seperti Biro Statistik Tenaga Kerja di
Amerika Serikat, Kantor Nasional Inggris
146 Metodologi

Statistik, Statistische Bundesamt di Jerman, Centraal Bureau voor de Statistiek di Belanda, Organisasi Kesehatan
Dunia dan Perserikatan Bangsa-Bangsa, dan banyak penyedia data non-pemerintah seperti Transparency
International (sebuah LSM yang menerbitkan Indeks Persepsi Korupsi, CPI) atau Biro Riset Ekonomi Nasional
(NBER) swasta AS untuk memberi tahu pembuat kebijakan, peneliti ilmiah, dan penduduk pada umumnya tentang
keadaan ekonomi dengan membangun indikator ekonomi. Indikator ekonomi adalah angka indeks seperti Indeks
Harga Konsumen (juga disingkat CPI) dan produksi industri yang bertujuan untuk mewakili beberapa fakta tentang
ekonomi — dalam kasus ini tingkat inflasi saat ini dan perubahan output untuk sektor industri ekonomi.

Sebagian besar ekonom menyadari fakta bahwa masalah pengukuran yang besar mengintai di balik pernyataan yang
tidak berbahaya seperti “Inflasi harga konsumen di Belanda telah +2,6 persen pada tahun ini hingga April 2011” atau “45
persen orang Spanyol di bawah 35 saat ini menganggur. "Tetapi mereka jarang terlibat aktif dalam proses merancang
prosedur pengukuran, meninggalkan tugas itu kepada" profesional "- petugas statistik. Nantinya saya akan memberikan
beberapa alasan untuk menganggap ini sebagai keadaan yang disesalkan. Penting untuk memahami masalah pengukuran
yang terkait dengan masing-masing indikator ekonomi. T babnya melihat pada satu indikator, inflasi harga konsumen,
pada beberapa panjang, dan pada produk domestik bruto dan pengangguran lebih singkat. Ketiganya memiliki
kepentingan teoritis dan praktis yang sangat besar. Ketiganya sangat bermasalah. Namun, pertama-tama, saya akan
membuat sejumlah pernyataan umum tentang "pengamatan."

Pengamatan

Mengapa observasi memainkan peran penting dalam sains? Apa itu pengamatan, data, bukti, dan
bagaimana mereka berhubungan? Kita bisa sekali lagi melihat ke David Hume untuk sebuah jawaban.
Seperti yang kita lihat di Bab 1, Hume mengira bahwa pengetahuan sejati ada dua macam: itu adalah
kebenaran logika dan matematika, dan oleh karena itu benar menurut definisinya (atau terbukti sendiri
benar), atau itu adalah kebenaran faktual, dan sebagai benar demikian dengan observasi. Apa yang tidak
termasuk dalam salah satu kategori ini sama sekali bukan pengetahuan, itu adalah pendapat terbaik.
Pembelahan ini dari semua pengetahuan asli ke dalam logika dan matematika di satu sisi dan masalah
fakta yang dapat diamati di sisi lain disebut "garpu Hume" (lihat Hume 1999 [1748]).

Kemajuan sains membuat keyakinan bahwa semua pengetahuan asli adalah salah satu dari dua jenis ini
yang tidak dapat dipertahankan. Penemuan instrumen ilmiah seperti teleskop, mikroskop, dan termometer
membuat seluruh dunia yang tidak dapat diamati oleh indra manusia yang tidak dapat dijangkau oleh
penyelidikan ilmiah. Menuntut bahwa sains hanya menangani apa yang dapat diamati akan melumpuhkan
sains.
Pengukuran 147

Namun, sulit untuk mengatasi intuisi bahwa pengetahuan ilmiah berbeda dari jenis pengetahuan lain -
artistik, sastra, agama - bahwa perbedaan ini ada hubungannya dengan klaimnya yang didukung lebih
baik oleh bukti dan didukung oleh bukti memiliki sesuatu untuk dilakukan. dengan observasi. Salah satu
cara untuk mendamaikan dua gagasan yang saling bertentangan — pengetahuan yang didasarkan pada
observasi lebih dapat diandalkan daripada jenis pengetahuan lain dan oleh karena itu memainkan peran
yang agak istimewa di satu sisi, dan bahwa sebagian besar hal yang berkaitan dengan ilmu pengetahuan
tingkat lanjut tidak dapat diamati di pihak lain. —Adalah untuk menunjukkan bahwa konsep observasi
atau observabilitas itu sendiri telah berubah dengan kemajuan teknis. Dan memang inilah yang
tampaknya menjadi kasus, baik dalam ilmu alam maupun sosial.

Para ilmuwan sering menerapkan istilah seperti mengamati, mengamati, dan mengamati fenomena
yang jelas tidak dapat diakses oleh sensasi manusia. Di sini adalah bagaimana astrofisikawan
menggambarkan pengamatan mereka tentang bagian dalam Matahari (dikutip dari Shapere 1982: 486):

[N] eutrino berasal dari inti bintang yang sangat panas, dalam volume kurang dari satu juta volume
matahari total. Wilayah inti ini begitu terlindung dengan baik oleh lapisan di sekitarnya sehingga
neutrino menyajikan satu-satunya cara untuk langsung mengamatinya.

(Minggu 1969: 161; dikutip dari Shapere 1982: 486)

Tidak ada cara yang diketahui selain oleh neutrino untuk melihat ke interior bintang.
(Clayton 1968: 388; dikutip dari Shapere 1982: 486)

Neutrino adalah partikel kecil, hampir tak bermassa dan tidak bermuatan yang karena ukurannya, massa dan
muatan netral memiliki kemungkinan interaksi yang sangat rendah dengan materi lain. Untuk "mengamati"
mereka, detektor yang sangat canggih (tangki ukuran kolam renang Olimpiade diisi dengan klorin) harus
digunakan, dan bahkan perangkat ini menangkap mereka sangat jarang. Sensasi manusia bahkan tidak
mendekati peka terhadap mereka.

Tentu saja, banyak informasi latar belakang diperlukan untuk mengamati bagian dalam Matahari
menggunakan foto-foto gelembung-ruang, yang menunjukkan adanya argon, yang pada gilirannya
menunjukkan interaksi klorin dengan neutrino, yang sangat tidak mungkin berasal dari tempat lain. daripada di
bagian dalam Matahari. Dudley Shapere membedakan teori sumber, teori transmisi dan teori reseptor di antara
hal-hal yang diperlukan untuk membuat kesimpulan dari tanda pada foto-foto ruang gelembung untuk fakta
tentang bagian dalam Matahari (Shapere 1982). Apa yang penting bagi Shapere adalah (a) bahwa
astrofisikawan memiliki teori yang sesuai yang mereka miliki; dan (b) bahwa mereka tidak memiliki alasan
untuk meragukan keabsahan teori-teori ini dalam konteks aplikasi ini. Karena alasan inilah interior Matahari
dianggap "dapat diamati", bahkan secara langsung, meskipun fakta bahwa ia tidak terlihat oleh manusia tanpa
bantuan alat-alat canggih.
148 Metodologi

Ekonom memiliki konsep observabilitas yang serupa. Pertimbangkan yang berikut ini:

Diewert ... menunjukkan bahwa Pollak-Konüs yang benar (tidak dapat diobservasi), indeks biaya
hidup yang sebenarnya adalah antara indeks harga Paasche dan Laspeyres yang dapat diamati.
(Diewert 1998: 48)

Sangat mudah untuk berteori tentang hubungan antara variabel yang didefinisikan secara tepat; itu
cukup lain untuk mendapatkan ukuran yang akurat dari variabel-variabel ini. Sebagai contoh,
kesulitan mendapatkan langkah-langkah yang wajar tentang laba, suku bunga, persediaan modal,
atau, yang lebih buruk lagi, arus layanan dari persediaan modal adalah tema yang berulang dalam
literatur empiris. Pada ekstrem, mungkin tidak ada rekan yang dapat diamati untuk variabel teoritis.
Literatur tentang model konsumsi pendapatan tetap… memberikan contoh yang menarik.
(Greene 2000: 211)

Dalam A Theory of the Consumption Function , Friedman (1957) mengembangkan konsep
pendapatan permanen, Y ( P ), sebagai variabel penjelas untuk konsumsi. Sebagai perkiraan Y ( P )
yang tidak dapat diamati , ia mengusulkan hal-hal berikut:

E [Y (P)] = e ( (1)

di mana E menunjukkan "perkiraan," Y ( t ) pendapatan yang dapat diamati pada periode t , koefisien
penyesuaian dalam model harapan adaptif dari mana

(1) berasal, dan variabel tren yang digunakan dalam proses penimbangan. (Wright 1969: 845)

Teknik filter Kalman (pemodelan ruang-negara) menawarkan pendekatan yang bermanfaat untuk
memperkirakan Nairu karena dirancang untuk mengidentifikasi variabel yang tidak dapat diamati —
seperti Nairu — atas dasar asumsi yang dibuat tentang sifat ekonometrik variabel dan keterkaitan
ekonomi antara variabel ini dan variabel teramati lainnya [seperti pengangguran].

(Logeay dan Tober 2004: 2–3)

Dalam masing-masing ekstrak ini, variabel yang "dapat diamati" - indeks harga Paasche dan Laspeyres, pendapatan,
pengangguran - dikontraskan dengan yang lain yang dianggap "tidak dapat diamati" - indeks biaya hidup "yang
sebenarnya", pendapatan tetap , NAIRU ( tingkat pengangguran yang tidak mempercepat inflasi). Perbedaan
penting antara yang dapat diamati dan tidak teramati dalam kasus-kasus ini harus dilakukan, seperti yang ada dalam
fisika, dengan keandalan pengetahuan latar belakang
Pengukuran 149

diperlukan untuk belajar tentang fenomena yang dimaksud. Seperti yang akan kita lihat secara rinci di bawah ini,
banyak, sering diperdebatkan, asumsi harus dibuat untuk menyimpulkan nilai suatu variabel dari data, bahkan untuk
variabel yang dihitung sebagai dapat diamati. Tetapi asumsi-asumsi ini tidak termasuk teori ekonomi tertentu . Ini
berbeda dalam kasus variabel yang tidak dapat diamati. Indeks biaya hidup yang sebenarnya berasal dari teori
pilihan rasional, pendapatan permanen dari teori konsumsi Friedman, dan NAIRU dari “asumsi yang dibuat tentang
keterkaitan ekonomi antara variabel ini dan variabel teramati lainnya.” Para ekonom, tampaknya demikian , percaya
kantor statistik tetapi bukan teori mereka sendiri. Bagaimanapun, mereka berbagi dengan astrofisikawan Shapere
sebuah konsep observability yang sangat berbeda dari konsep rakyat biasa dan filosof. Para filsuf dan rakyat biasa
dianggap sebagai sesuatu yang dapat diamati yang dapat dideteksi dengan indra-indra yang tidak terdeteksi. Para
ilmuwan, sebaliknya, menganggap sebagai pengamatan yang dapat diukur secara andal (atau, alternatifnya, yang
dapat dideteksi oleh peralatan yang tepat dan dihasilkan oleh suatu proses yang dipahami dengan baik — bnd.
Shapere 1982). Perubahan tingkat harga (atau pendapatan nasional atau tingkat pengangguran) paling baik dilihat
dalam pengertian ekonom tetapi tidak dalam arti kata biasa. Menggunakan apa pun kecuali mata Anda, Anda dapat
melihat label harga individu tetapi tidak tingkat rata-rata perubahan harga di seluruh ekonomi.

Beberapa pernyataan terminologis diperlukan. Data adalah hasil pengukuran yang tak terpisahkan.
Pembacaan barometer, foto bubble-chamber, catatan harga atau hasil kuesioner adalah semua data. Mereka
bisa diamati dalam arti kata biasa. Dan mereka berfungsi sebagai bukti (fakta tentang) fenomena . Fenomena
telah didefinisikan dalam Bab 2 sebagai kejadian (biasanya berulang) atau proses kepentingan ilmiah.
Sebagaimana James Bogen dan James Woodward telah amati, teori memprediksi dan menjelaskan (fakta
tentang) fenomena, bukan data (Bogen dan Woodward 1988). Data dihasilkan oleh faktor-faktor yang terlalu
idiosynkratik untuk menjadi obyek penganiayaan ilmiah. Ambil catatan bahwa seorang individu, John Doe,
menjadi pengangguran pekan lalu sebagai contoh. Teori pengangguran menggambarkan kekakuan upah,
penurunan permintaan agregat, guncangan eksternal negatif, tunjangan pengangguran yang berlebihan dan
gesekan sebagai penyebab pengangguran. Mungkin beberapa faktor ini telah menyebabkan pengangguran John
Doe. Tapi kemungkinan besar itu adalah hasil dari banyak sekali keadaan yang terlalu spesifik, terlalu aneh
bagi kasus individualnya untuk menjadi objek teori ekonomi: mungkin dia mencuri perlengkapan kantor;
mungkin majikannya ditangkap karena penipuan keuangan; mungkin dia menggunakan opsi luar sebagai alat
tawar-menawar dalam negosiasi upah, majikannya mengatakan "Ambillah, kemudian !," tetapi pilihan itu
gagal. Dengan demikian, catatan pengangguran John Doe digunakan sebagai titik data semata untuk
menyimpulkan fakta tentang sebuah fenomena — katakanlah, tingkat perubahan saat ini dalam tingkat
pengangguran di suatu negara — yang dengan sendirinya menjadi objek teori ilmiah.

Dalam hal berikut, saya akan menggambarkan proses menggunakan data ini untuk menyimpulkan
fakta-fakta tentang suatu fenomena ekonomi - khususnya, nilai ekonomi
150 Metodologi

variabel — untuk tiga contoh yang saya sebutkan di atas: inflasi harga konsumen, produk domestik bruto
(PDB, ukuran pendapatan nasional) dan pengangguran. Inflasi harga konsumen akan menjadi kasus
utama saya, tetapi saya akan secara singkat membahas PDB dan pengangguran sebagai perbandingan.
Ketiga variabel tersebut dianggap dapat diobservasi oleh para ekonom. Namun, seperti yang akan kita
lihat, mengukurnya membutuhkan pembuatan sejumlah besar asumsi substansial, dan sering
diperdebatkan. Membuat asumsi ini memerlukan komitmen nyata dari pihak penyidik terkait fakta -
fakta tertentu yang relevan dengan prosedur pengukuran, tujuan pengukuran, serta penilaian evaluatif .
Konsekuensi alami dari poin-poin ini adalah bahwa para ekonom, yang paling tahu tentang aspek-aspek
prosedur pengukuran yang relevan bagi mereka, harus lebih terlibat daripada saat ini dalam desain
prosedur pengukuran.

Variabel yang akan saya lihat pada bagian ini adalah Indeks Harga Konsumen AS (IHK), yang mengukur
inflasi harga konsumen . Mengukur inflasi sangat penting bagi masyarakat luas, baik yang sekarang maupun
yang akan datang. Karena tanda kurung pajak dan program pembelanjaan publik serta banyak kontrak swasta
diindeks inflasi, tingkat inflasi yang terukur mempengaruhi pendapatan sekali pakai bagi sebagian besar
karyawan dan penerima manfaat dan pensiun pemerintah, penerimaan pemerintah, pengeluaran, dan utang
nasional. Mengukur inflasi juga merupakan kepentingan yang tak tertandingi untuk analisis ekonomi .
Banyak, jika tidak sebagian besar, analisis empiris dari fenomena ekonomi berkaitan dengan apa yang disebut
oleh ekonom sebagai variabel riil , yang artinya variabel-variabel yang dikosongkan oleh indeks inflasi.
Menemukan bahwa indeks kami secara serius salah mengartikan aspek dari fenomena yang kami minati
berpotensi menginvasi banyak dari apa yang kami ketahui tentang ekonomi, tidak hanya dalam hal
menggambarkan ekonomi yang berbeda dan membandingkannya tetapi juga dalam hal memahami hubungan
kausal bertanggung jawab atas fenomena yang menarik. Jika kita menemukan bias yang signifikan dalam laju
inflasi yang terukur, banyak gagasan dan hasil kita mengenai kuantitas ekonomi seperti pendapatan,
pertumbuhan, produktivitas, uang, dan hubungan timbal baliknya mungkin harus dipertimbangkan kembali
(tentu saja hanya sejauh mana CPI memang digunakan) sebagai deflator).

Mengukur CPI: Dasar-dasar

Seperti namanya, CPI adalah indeks harga . Indeks harga melacak biaya pembelian keranjang barang
tetap sepanjang waktu. Jika q i0 menunjukkan kuantitas baik i dalam keranjang periode dasar pada waktu
0 dan p i0 , p i1 menunjukkan harga basis dan periode saat ini pada waktu 0 dan 1, berturut-turut,
kemudian L 01 = ∑ q i0 p i1 / ∑ q i0 p i0 adalah indeks harga untuk periode saat ini relatif terhadap periode
dasar atau Laspeyres indeks harga .
Pengukuran 151

Di Amerika Serikat, CPI diukur oleh Biro Statistik Tenaga Kerja (BLS), yang mengumpulkan kuotasi harga
bulanan atas 71.000 barang dan jasa individu di sekitar 22.000 unit ritel di 88 daerah di seluruh negara yang dikenal
sebagai unit sampling primer. Selain itu, BLS mengumpulkan informasi dari sekitar 40.000 penyewa atau tuan tanah
dan 20.000 pemilik rumah untuk komponen perumahan CPI. Barang-barang dan layanan individu ini dikumpulkan
dalam dua langkah. Pada langkah pertama, harga individu dikumpulkan menjadi 9.108 strata, satu untuk setiap 207
item dalam 44 area . Stratum item adalah indeks tingkat rendah untuk kelompok dan layanan seperti “Jas pria,
mantel olahraga dan pakaian luar” dan “Layanan berkebun dan perawatan kebun.” Di dalam setiap item, item level
entri stratum (ELIs) ditetapkan. Beberapa strata mungkin hanya memiliki satu ELI (misalnya, "Apel") sementara
yang lain dapat memiliki sejumlah ELI yang lebih heterogen atau kurang (misalnya, "Layanan dokter"). Suatu
wilayah merupakan wilayah geografis nyata (32 wilayah sesuai dengan lokasi di 29 kota) atau sebuah konstruksi
yang mewakili kota-kota berukuran lebih kecil dan menengah di beberapa wilayah di Amerika Serikat (yaitu, 12
kawasan tersisa dibangun dari 56 lokasi utama unit sampling).

Karena indeks harga mengukur biaya pembelian sekeranjang barang , keputusan harus dibuat bagaimana
memperlakukan kasus-kasus di mana karakteristik barang berubah dalam satu atau lain cara. Berikut beberapa
contoh perubahan yang relevan: beberapa barang tumbuh dalam kepentingan relatifnya bagi konsumen
sedangkan yang lainnya menurun; produksi beberapa barang dihentikan dan barang baru diluncurkan; kualitas
barang membaik atau memburuk; perubahan saluran distribusi dan saluran baru muncul; faktor lingkungan
yang relevan untuk perubahan konsumen.

BLS menggunakan berbagai metode untuk menghadapi dunia yang terus berubah. Meskipun CPI secara
nominal merupakan indeks keranjang tetap, ini adalah praktik BLS untuk memperbarui bobotnya setiap
beberapa tahun. Bobot itu sendiri diperoleh dari apa yang disebut Survei Pengeluaran Konsumen (CES), yang
mengumpulkan informasi rinci tentang semua pengeluaran di luar kantong dari sampel rumah tangga nasional.
Dengan demikian orang bisa secara bersamaan menangani substitusi serta masalah barang baru, meskipun
agak kasar.

Bobot yang diperoleh dari CES digunakan untuk mengumpulkan indeks harga tingkat yang lebih tinggi dari
indeks untuk strata item. Di bawah level strata, bobot yang digunakan dalam agregasi harga individual berasal
dari dua sumber. Pertama, Biro Sensus melakukan apa yang disebut Point-of-Purchase Survey (POPS) yang
mencoba mengukur distribusi pengeluaran di berbagai gerai ritel. Berdasarkan hasil POPS, BLS memilih
sampel outlet di area tertentu. Probabilitas untuk dijadikan sampel adalah proporsional dengan pangsa outlet
tersebut dalam total pengeluaran di daerah untuk item yang dipilih. Kedua, para ekonom BLS mengunjungi
toko-toko ini dan memilih satu atau lebih barang spesifik dari mana kategori barang yang lebih luas akan diberi
harga. Probabilitas untuk dipilih untuk setiap item yang diberikan sebanding dengan estimasi pangsa dalam
pendapatan outlet.

Dalam proses ini, sekitar 20 persen dari semua item mengalami rotasi sampel setiap tahun, yaitu, mereka
digantikan oleh yang lain, bukan barang yang dapat dibandingkan secara langsung.
152 Metodologi

Ini berarti bahwa rotasi penuh terjadi setiap lima tahun. Untuk barang-barang yang dirotasi ke dalam
sampel, BLS melakukan berbagai prosedur penyesuaian kualitas.

Rotasi sampel bukan satu-satunya sumber substitusi barang. BLS mencoba untuk memastikan bahwa setiap
bulan, jenis barang yang persis sama direplikasi. Ini, bagaimanapun, tidak selalu mungkin karena item dapat
sementara atau secara permanen tidak tersedia. Dalam hal ini, perwakilan BLS dapat menilai item baru agar
sebanding dengan yang lama, mengikuti panduan standar tertentu. Jika item tersebut dinilai tidak dapat
diperbandingkan, salah satu dari sejumlah prosedur penyesuaian akan diterapkan. Berikut ini ikhtisar:

1 Metode tumpang tindih . Jika dalam periode tertentu (katakanlah, t ) baik yang baru maupun yang item
lama tersedia, perubahan indeks dihitung dengan menggunakan perubahan harga barang lama antara t - 1
dan t , dan harga dari item baru antara t dan t + 1. Ini secara implisit memperlakukan perbedaan harga
antara barang lama dan barang baru yang mencerminkan
perbedaan kualitas mereka dan tidak ada yang lain. Karena barang-barang lama dan baru hampir
tidak pernah tersedia dalam periode yang sama, metode ini jarang digunakan kecuali dalam rotasi
sampel.

2 Metode mark-up . Dalam beberapa kategori, produsen diminta untuk memperkirakan biaya peningkatan
kualitas yang diberikan. Biaya ini (ditandai hingga

perkiraan nilai ritel) kemudian dikurangi dari perubahan harga untuk mencerminkan peningkatan
kualitas. Aplikasi terluas dari metode ini adalah di bidang kendaraan bermotor.

3 Metode hedonis . BLS menggunakan teknologi estimasi hedonis secara terbatas, terutama di bidang
perumahan dan pakaian jadi. Dalam estimasi hedonis, nilai barang dibagi menjadi berbagai karakteristik seperti
kaki persegi, jumlah kamar mandi dan usia apartemen. Dengan mempertimbangkan karakteristik individu dan
pengamatan karakteristik ini dalam suatu barang atau jasa, perubahan harga dapat dianalisis
berubah karena perubahan kualitas dan itu karena faktor lain.
4 Metode tautan . Metode t he link mengeksploitasi informasi terkait erat item. Jika item lama terakhir diamati
pada t - 1, dan yang baru pertama kali diamati dalam t , maka perubahan harga antara t - 1 dan t dihitung
menggunakan perubahan harga dari item yang terkait erat antara t −1 dan t , dan setelahnya, perubahan harga
barang baru. Ini adalah metode yang paling umum digunakan di luar rotasi sampel. Ini juga menyiratkan
penyesuaian kualitas: dalam hal ini perbedaan harga antara barang yang terkait erat dan barang baru dianggap
tidak mencerminkan apa pun kecuali perubahan kualitas.

Masalah Nomor Indeks

Indeks harga mengukur perubahan tingkat harga dengan benar hanya dalam kasus di mana tidak ada
perubahan kecuali harga. Jika harga dan jumlah berubah (misalnya, ketika orang memutuskan untuk
mengkonsumsi lebih banyak barang dan lebih sedikit
Pengukuran 153

orang lain), ambiguitas muncul: akankah kita menggunakan (kuantitas) bobot dari periode dasar atau periode
saat ini? Melakukan yang terdahulu menghasilkan indeks Laspeyres yang kita temui di atas, melakukan yang
terakhir indeks Paasche. Keduanya memiliki kelebihan dan kekurangan. Indeks Laspeyres menjawab
pertanyaan yang tepat: apa yang harus saya bayar hari ini jika saya membeli keranjang barang yang sama yang
saya beli periode lalu lagi? Tapi indeks Laspeyres sudah ketinggalan jaman sangat cepat. Misalkan hukum
Engel (yang mengatakan bahwa orang cenderung membeli makanan secara proporsional kurang karena
mereka menjadi lebih kaya) adalah benar dan pendapatan masyarakat meningkat dengan cepat. Pada periode
dasar, karena masih relatif miskin, konsumen akan menghabiskan sebagian besar anggaran mereka untuk
makanan. Tetapi bagian dari pendapatan mereka yang dihabiskan untuk makanan akan berkurang dengan
meningkatnya pendapatan. Indeks Laspeyres membekukan selera orang pada periode dasar, yang akan menjadi
semakin tidak representatif. Indeks Paasche, sebaliknya, dalam arti selalu up-to-date, menggunakan bobot
periode saat ini. Hal ini dapat ditafsirkan secara analog ke indeks Laspeyres: apa yang harus saya bayar
periode terakhir jika saya membeli keranjang barang yang sama yang saya beli periode ini? Salah satu
kelemahannya adalah sulit untuk diukur. Untuk mengukur indeks Laspeyres, setelah keranjang awal barang
telah ditetapkan, satu hanya membutuhkan pengamatan harga. Indeks Paasche membutuhkan observasi quan-
tity sebagai tambahan karena menggunakan bobot periode saat ini. Kedua indeks juga memiliki kekurangan
teoretis. Misalnya, nomor indeks harus memiliki properti berikut: diberikan tiga periode yang dipesan t 1 , t 2 ,
t 3 , indeks harga untuk periode t 1 dan t 2 kali indeks harga untuk periode t 2 dan

t 3 harus setara dengan indeks harga untuk periode t 1 dan t 3 . Baik Laspeyres maupun indeks Paasche
tidak memenuhi properti ini.
Ketidakjelasan dalam memilih indeks yang tepat kadang-kadang disebut sebagai "Masalah Nomor Indeks"
(misalnya, Samuelson dan Nordhaus 1992: 590). Kadang-kadang disarankan bahwa indeks Laspeyres melebih-
lebihkan inflasi sedangkan indeks Paasche mengecilkannya. Klaim ini didasarkan pada gagasan bahwa
konsumen, dalam rangka mempertahankan tingkat kesejahteraan yang konstan, menggantikan barang yang
lebih murah bagi yang telah menjadi lebih mahal. Oleh karena itu, indeks Laspeyres melebih-lebihkan barang-
barang mahal (karena konsumen telah menggantinya dari mereka) dan indeks Paasche mewakili mereka (pada
periode dasar orang-orang telah membeli barang-barang ini!).

Apa yang disebut "indeks biaya hidup" (COLI) memperkirakan jumlah uang yang diperlukan untuk tidak
membeli keranjang barang tetap tetapi tingkat utilitas tetap . Konsep ini telah dikembangkan oleh para pendukung
“pendekatan ekonomi” untuk mengindeks angka, yang mengasumsikan bahwa konsumen adalah agen ekonomi yang
sepenuhnya rasional. Satu dapat menunjukkan bahwa di bawah asumsi tertentu indeks Laspeyres memang melebih-
lebihkan COLI sedangkan indeks Paasche mengecilkannya, tetapi indeks yang dibangun dengan mengambil mean
geometrik antara indeks Laspeyres dan Paasche mendekati dengan baik. Indeks baru ini disebut "indeks Fisher"
(setelah ekonom Irving Fisher, salah satu pendiri dari teori angka indeks, di antara banyak hal lainnya) dan disebut
sebagai "indeks superlatif" karena mendekati COLI yang sebenarnya. .
154 Metodologi

Ada dua masalah yang berkaitan dengan pertanyaan apakah COLI adalah konsep yang tepat di balik IHK,
yang berkaitan dengan fakta, yang lain ke pertanyaan evakuasi. Pertanyaan faktual adalah sejauh mana
substitusi barang benar-benar dapat dijelaskan oleh model pilihan rasional yang mengasumsikan preferensi
konstan pada periode yang berbeda. Bisa dibayangkan bahwa orang membeli keranjang barang yang baru
(bukan berbobot) bukan karena mereka memaksimalkan kepuasan preferensi konstan pada perubahan harga,
melainkan karena selera mereka berubah. Bahwa barang-barang yang sekarang memiliki berat lebih tinggi
dalam keranjang juga lebih murah akan datang sebagai anugerah tambahan. Dengan mengubah preferensi,
kerangka kerja COLI sulit dipahami (meskipun lihat Heien dan Dunn 1985).

Pertanyaan evaluatif adalah sejauh mana perilaku substitusi yang disebabkan oleh kenaikan harga harus
memandu kebijakan ekonomi. Orang-orang yang substansial menjauh dari barang-barang yang menjadi
relatif lebih mahal (ingat bahwa sangat mungkin bahwa harga semua barang meningkat; orang akan, jika
model pilihan rasional benar, masih mengganti barang yang sekarang relatif lebih murah untuk mereka
yang relatif lebih mahal), sampai taraf tertentu, dipaksa untuk mengubah komposisi keranjang konsumsi
mereka. Bahkan jika perubahan itu bersifat sukarela dalam arti (karena tidak ada yang menggunakan
kekuatan fisik untuk membuat orang memilih apa yang mereka lakukan), patut dipertanyakan apakah
mereka adil. Mungkin orang ingin terus melakukan pembelian yang sama dengan yang mereka lakukan
pada periode dasar tetapi mereka tidak lagi mampu. Jika ya, bukankah lebih tepat menggunakan indeks
berbasis-berat daripada yang berpura-pura orang mengganti beberapa barang untuk orang lain karena
mereka mau?

Substitusi hanyalah salah satu dari beberapa sumber bias potensial dalam CPI. Saya akan membahas
dua sumber lebih lanjut: perubahan kualitas dan agregasi.

“Perhitungan Harga Rumah-ke-Rumah”:

Perubahan Kualitas

Masalah perubahan kualitas telah disebut sebagai “pertempuran jarak rumah-ke-rumah” (Shapiro and Wilcox
1996) karena sifatnya yang sangat diperebutkan. Sejauh ini kita telah mempertimbangkan dunia yang cukup
statis kecuali bahwa harga barang berubah dan orang bereaksi terhadap perubahan ini dengan menyesuaikan
bundel konsumsi mereka. Bahkan, banyak hal yang berubah: lini produk lama dihentikan dan jalur baru
diluncurkan; kualitas barang yang ada berubah; barang diperdagangkan di saluran baru seperti di diskon dan
melalui internet; berbagai barang yang tersedia berubah seperti varietas sereal sarapan; fitur lingkungan
berubah — misalnya jumlah lalu lintas dalam perjalanan ke supermarket atau kualitas udara di mana barang-
barang yang diperdagangkan dikonsumsi.

Indeks harga tradisional tidak memiliki jawaban terhadap masalah perubahan kualitas. Karena melacak
biaya untuk membeli keranjang barang tertentu dari waktu ke waktu tidak ada ruang untuk barang baru,
barang yang diubah atau distribusi yang berbeda
Pengukuran 155

saluran. Sekali lagi, seseorang bisa membekukan keranjang di periode dasar tetapi keranjang seperti itu
akan segera menjadi tidak representatif. Selain itu, indeks tidak teridentifikasi ketika tidak ada harga
untuk beberapa barang - misalnya karena produksi mereka dihentikan.

Seperti halnya perubahan kuantitas, dalam prakteknya keranjang diperbarui secara berkala. Tetapi
bagaimana seharusnya seseorang menghadapi kenyataan bahwa suatu barang baru berbeda dalam kualitas dari
barang lama? Jika barang baru tersebut merupakan perbaikan dari yang lama dan diperlakukan sebagai
substitusi yang sepadan, inflasi akan terlalu berlebihan karena konsumen mendapat keuntungan dari barang
yang lebih baik dan harga yang lebih tinggi dibenarkan karena perusahaan berinvestasi dalam
pengembangannya. Di sisi lain, jika perubahan harga ditafsirkan sebagai mencerminkan apa-apa selain
perubahan kualitas (dengan demikian, jika model baru dari mobil biaya € 25.000 versus € 20.000 untuk model
lama, inflasi akan diperkirakan sebagai 0 persen karena kenaikan harga 25 persen mencerminkan peningkatan
kualitas yang identik), inflasi akan diremehkan karena perubahan harga sering diperkenalkan pada saat yang
bersamaan dengan perubahan kualitas untuk menyembunyikannya.

Pada prinsipnya "pendekatan ekonomi" untuk mengindeks angka memiliki jawaban untuk masalah ini.
Pendekatan itu menganggap barang bukan sebagai tujuan dalam hak mereka sendiri melainkan sebagai kendaraan
untuk menyediakan "utilitas" bagi konsumen. Dengan demikian, model lama memberikan konsumen dengan tingkat
utilitas U lama dan model baru dengan level U baru . Perubahan kualitas dapat diperkirakan sebagai (dalam persentase)
U baru / U lama –1. Perubahan harga kemudian dapat didiskon dengan perubahan kualitas: Inflasi Bersih

= P baru / P lama - U baru / U lama . Misalkan misalnya model mobil baru kita menghasilkan utilitas 10 persen lebih
tinggi. Inflasi neto kemudian akan diperkirakan sebagai
25% - 10% = 15%.

Ada berbagai masalah dengan prosedur ini. Pertama, utilitas tidak dapat diukur pada skala rasio seperti
yang diperlukan. Seperti yang dilihat pada Bab 3, utilitas tidak mengungkapkan apa pun kecuali
pemesanan preferensi, dan rasio antara dua utilitas adalah angka yang tidak berarti. Jika konsumen
memilih barang baru di atas yang lama, semua yang dapat kita simpulkan adalah bahwa mereka lebih
menyukainya, bukan karena seberapa besar mereka menyukainya. Tingkat perubahan kualitas harus
diperkirakan (atau "diperhitungkan" seperti yang disebut) oleh ekonom atau ahli statistik bahkan jika
model pilihan rasional itu benar.

Kedua, setidaknya ada beberapa alasan untuk meragukan bahwa model pilihan rasional dapat atau
harus digunakan di sini. Seringkali ketika barang baru masuk pasar barang lama menghilang. Konsumen
harus membeli barang baru apakah mereka suka atau tidak. Dalam konteks seperti itu, pilihan tidak dapat
digunakan sebagai indikator preferensi.

Ketiga, para ekonom cenderung sangat digerakkan oleh teori ketika mereka memperkirakan dampak
perubahan kualitas pada kesejahteraan manusia. Untuk memberikan satu contoh saja, peningkatan variasi
produk selalu diartikan sebagai hal yang baik karena konsumen dapat memenuhi preferensi mereka
dengan lebih tepat. Tetapi variasi yang lebih besar tidak selalu merupakan hal yang baik karena
meningkatkan biaya pengambilan keputusan, di antara hal-hal lainnya. Apa nilai sebenarnya dari
memiliki variasi Cheerios yang lain?
156 Metodologi

Apapun cara terbaik untuk menjawab pertanyaan-pertanyaan ini, penting untuk memperhatikan bahwa
mereka tidak dapat dijawab tanpa mengambil sikap substantif mengenai masalah faktual dan evaluatif
tertentu. Jika pilihan konsumen adalah antar-bagian sebagai menunjukkan kepuasan preferensi di sana
lebih baik menjadi bukti bahwa konsumen dapat memilih sebaliknya dan bahwa preferensi mereka
memenuhi aksioma teori pilihan rasional. Setiap perkiraan tingkat perubahan kualitas (yaitu, apakah
MacBook Pro baru 10 persen atau 15 persen lebih baik dari yang lama atau bahkan 5 persen lebih kurang
baik) harus mencerminkan penilaian nilai tentang seberapa jauh konsumen benar-benar mendapat
manfaat dari barang baru. Tidak ada cara untuk melakukannya tanpa konsep konsumeritas yang
substantif (lihat Bab 13).

Pengumpulan

Sejauh ini saya telah mengatakan sedikit tentang perkiraan kuantitas dengan harga yang tertimbang
dalam indeks. Seperti yang disebutkan di atas (lihat "Mengukur CPI: Dasar-dasar"), di Amerika Serikat,
mereka diperkirakan dalam survei titik pembelian, yang mencoba mengukur distribusi pengeluaran di
berbagai gerai ritel. Yang penting di sini adalah bahwa setiap barang berbobot sebanding dengan bagian
pembelanjaannya dalam total pengeluaran. Jika 10 persen dari pengeluaran nasional masuk ke layanan
internet, maka layanan internet akan memiliki bobot 10 persen di CPI.

Ini berarti bahwa rumah tangga yang lebih kaya - rumah tangga yang membelanjakan lebih banyak
untuk konsumsi - berlebihan atau, bagaimanapun juga, bahwa pengeluaran mereka dibebani oleh bagian
pengeluaran mereka dan bukan oleh jumlah orang yang tinggal di rumah tangga atau oleh rumah tangga.
Indeks adalah "plutokrat": diatur oleh kekayaan (Schultze dan Mackie 2002).

Alternatif yang telah diusulkan adalah indeks “demokratis” di mana setiap pengeluaran rumah tangga
menerima bobot yang sama. Karena pola konsumsi berubah secara signifikan dengan pendapatan (ingat
hukum Engel), pindah dari indeks saat ini ke indeks demokratis akan memiliki dampak yang signifikan
terhadap perkiraan inflasi.

Pola konsumsi rumah tangga berbeda di seluruh dimensi daripada hanya pendapatan. Orang yang lebih
tua, misalnya, mungkin kurang dapat memperoleh manfaat dari saluran distribusi baru seperti diskon dan
toko online — jika, katakanlah, mereka tidak mengemudi dan tidak paham teknologi. Rumah tangga
tunggal dapat mengurangi penggunaan diskon kuantitas daripada keluarga besar dan seterusnya.

Kecukupan skema ini atau itu tergantung pada tujuan yang dikejar dengan mengukur CPI. Sekarang,
penggunaan menonjol untuk CPI adalah sebagai berikut (Schultze dan Mackie 2002: 192):

t sebagai langkah kompensasi untuk menghitung berapa banyak yang dibutuhkan untuk memungut
kembali penerima jaminan sosial dan pembayaran transfer publik lainnya terhadap perubahan dalam
biaya hidup dan untuk penggunaan formal atau informal dalam pengaturan upah;
Pengukuran 157

t untuk indeksasi inflasi dalam kontrak pribadi;
t sebagai ukuran inflasi untuk obligasi Treasury yang diindeks inflasi;

t sebagai ukuran yang dapat digunakan untuk mengindeks sistem pajak pendapatan agar tetap netral;

t sebagai output deflator untuk memisahkan perubahan dalam produk domestik bruto (PDB) dan
komponennya ke dalam perubahan harga dan perubahan output nyata; dan

t sebagai tolok ukur inflasi untuk Federal Reserve dan pembuat kebijakan makroekonomi lainnya.

Tujuan yang berbeda membutuhkan bobot yang berbeda. Jika penerima jaminan sosial akan dikompensasikan
untuk perubahan dalam biaya hidup, tampaknya anggaran mereka adalah yang relevan, bukan anggaran rumah
tangga kaya atau penduduk pada umumnya. Sebaliknya, jika indeks digunakan untuk tujuan ekonomi makro
seperti menguji teori kuantitas uang, tampaknya masuk akal untuk membebani rumah tangga berdasarkan
pengeluaran mereka — karena ini adalah tempat di mana uang mengalir. Jika indeks digunakan untuk menjaga
agar sistem pajak pendapatan tetap netral, maka pengeluaran rele-vant seharusnya adalah pajak pembayar
pajak, dan seterusnya.

Sekarang, mungkin tidak masuk akal untuk menghitung indeks yang berbeda untuk semua kelompok ini. Bahkan,
karena menghitung indeks mahal, mungkin lebih baik untuk menghitung indeks lebih sedikit (atau bahkan hanya
satu), bahkan jika itu berarti bahwa indeks ini (atau indeks ini) kurang akurat. Tapi ini tidak membatalkan poin saya
yang lebih umum, yaitu bahwa (a) kecukupan nomor indeks harus dinilai berdasarkan tujuan yang digunakan indeks
(“tujuan pengukuran”) dan (b) normatif atau penilaian evaluatif memainkan peran penting dalam pembangunan
prosedur pengukuran.

Pengangguran dan PDB

Pengukuran CPI bukan pengecualian. Mengukur indikator ekonomi apa pun adalah bisnis yang rumit dan
menimbulkan isu-isu konseptual, faktual dan normatif / evaluatif. Ambil pengangguran sebagai contoh lebih lanjut.
Organisasi Perburuhan Internasional (ILO) mendefinisikan seseorang sebagai pengangguran ketika mereka tidak
bekerja, saat ini mencari pekerjaan dan tersedia untuk bekerja. Definisi ini digunakan di seluruh dunia tetapi cukup
samar dan karena itu tunduk pada interpretasi yang berbeda. Menggunakan standar AS, misalnya, pengangguran
Kanada sekitar 1 persen lebih rendah dari tarif resmi Kanada mengatakan itu (Flaherty 2012: 35). Definisi ini
mengatakan " seseorang yang mencari pekerjaan." Ini tidak berlaku untuk remaja di bawah 16, kepada orang-orang
yang terbatas pada lembaga seperti rumah jompo dan penjara atau orang-orang yang aktif bertugas di angkatan
bersenjata. Juga tidak berlaku untuk orang-orang yang bersedia bekerja tetapi tidak sedang mencari karena mereka
telah berkecil hati. Haruskah para pekerja yang putus asa dihitung sebagai pengangguran atau meninggalkan tenaga
kerja? Haruskah personel militer dihitung sebagai pekerja (saat ini mereka bukan bagian dari angkatan kerja)?
Seberapa aktif seseorang harus dihitung sebagai “mencari
158 Metodologi

kerja"? Selain itu, di AS, perkiraan tersebut berasal dari apa yang disebut Survei Penduduk Terkini, yang
mewawancarai sampel dari 60.000 rumah tangga. Sampel ini mungkin tidak representatif dan orang-orang mungkin
tidak menjawab semua pertanyaan dengan jujur (misalnya tentang seberapa aktif mereka mencari pekerjaan). Di
negara lain, seseorang harus terdaftar di lembaga pemerintah (seperti UK Jobcentre) untuk dihitung sebagai
pengangguran.
Produk domestik bruto (PDB) didefinisikan sebagai nilai pasar barang dan jasa akhir yang diproduksi
dalam suatu perekonomian dalam jangka waktu tertentu. Ada tiga pendekatan dasar untuk mengukur
kuantitas: metode pendapatan, metode pengeluaran dan metode produk atau output. Untuk memberikan
contoh, metode pendapatan menambahkan pendapatan dari semua sektor ekonomi. Akun Pendapatan dan
Belanja Nasional AS membagi pendapatan menjadi lima kategori:

t upah, gaji dan penghasilan tenaga kerja tambahan; t laba perusahaan;

t bunga dan pendapatan investasi lain-lain; t pendapatan petani;
t penghasilan dari usaha non-pertanian yang tidak terkait.

Kelima komponen pendapatan ini berjumlah pendapatan domestik bersih dengan biaya faktor. Untuk mencapai
PDB, dua penyesuaian harus dilakukan: pajak tidak langsung dikurangi subsidi harus ditambahkan untuk
mendapatkan dari biaya faktor ke harga pasar, dan depresiasi harus ditambahkan untuk mendapatkan dari produk
domestik netto ke produk domestik bruto.

GDP digunakan untuk banyak tujuan, yang menonjol sebagai indikator nilai konsumen. Tetapi apakah harga
pasar merupakan ukuran nilai yang baik? Sekali lagi orang harus berasumsi bahwa konsumen rasional (yang
sudah dipertanyakan) tetapi juga bahwa semua pasar kompetitif (yang pasti salah). Produksi banyak barang
memiliki eksternalitas, yang menurut sifatnya tidak tercermin dalam harga pasar. Banyak barang tidak
memiliki harga pasar, misalnya layanan yang disediakan untuk publik seperti barang dan jasa militer serta
non-dipasarkan seperti pekerjaan rumah tangga dan perawatan anak. Haruskah ekonomi dianggap lebih miskin
hanya karena lebih banyak barang dan jasa disediakan oleh pemerintah dan rumah tangga swasta?

Kesimpulan

Indikator ekonomi membutuhkan asumsi latar belakang yang kuat tentang fakta (misalnya, apakah konsumen
membuat keputusan mereka sesuai dengan model pilihan rasional yang diberikan oleh teori ekonomi), nilai
(misalnya, apakah perubahan kualitas yang diberikan merupakan manfaat konsumen) dan tujuan pengukuran (
misalnya, apakah indikator inflasi digunakan untuk keperluan pengindeksan atau untuk analisis ekonomi
makro). Karena itu, ekonom akademis harus mengambil sikap yang lebih aktif dalam merancang prosedur
pengukuran daripada yang mereka lakukan saat ini. Sebagian besar pekerjaan dilakukan oleh kantor statistik,
dan akademik
Pengukuran 159

ekonom cenderung menjadi konsumen belaka daripada produsen dan konsumen data. Tetapi sebagai pengguna data
ekonom harus tahu yang terbaik apa prosedur akan memadai untuk tujuan mereka karena mereka tahu tujuan mereka
terbaik dan, setidaknya pada prinsipnya, apa latar belakang asumsi untuk membuat.

Ambil pengangguran sebagai contoh. Untuk alasan-alasan teoritis, yang penting adalah orang-orang bersedia
bekerja dengan tingkat upah yang berlaku . Survei Penduduk Terkini AS tidak menanyakan tentang tingkat
pembayaran. Definisinya tentang pengangguran tidak sesuai dengan definisi para ekonom. Bahwa ini tidak baik
untuk diterapkan pekerjaan ekonometrik seperti pengujian teori terhadap data adalah nyata. Selain itu, masalah
pengukuran menunjukkan bahwa dikotomi yang rapi antara "fakta" di satu sisi dan "nilai" di sisi lain tidak dapat
ditegakkan. Untuk menggambarkan fakta-fakta tentang ekonomi, misalnya fakta tentang tingkat inflasi,
pengangguran dan pertumbuhan, berarti membuat komitmen normatif yang substansial. Fakta dan nilai terjerat.

Pertanyaan Studi

1 Analisis indikator ekonomi selain CPI, GDP dan tidak bekerja. Apakah itu membuat asumsi latar

belakang tentang fakta,
penilaian nilai dan tujuan pengukuran?
2 Salah satu klaim penting yang dibuat dalam bab ini menyangkut fakta dan belitan nilai.
Apakah fakta-fakta dan nilai-nilai selalu terbentang dalam pengukuran ekonomi?

3 Jika Anda mendesain prosedur pengukuran untuk CPI, bagaimana Anda akan memecahkan
masalah perubahan kualitas?
4 Kami telah melihat bahwa CPI yang sedikit berbeda harus diukur
segmen populasi yang berbeda. Berapa banyak indeks yang harus kita hitung secara ideal untuk
negara maju?

5 Seberapa banyak usaha yang harus dilakukan seseorang untuk mencari pekerjaan agar dapat

mendaftar sebagai penganggur dalam pandangan Anda? Jelaskan jawaban Anda. Atas dasar apa
Anda membenarkan jawaban Anda?

Bacaan yang disarankan

Bagian pada “Harga Konsumen Inflasi” pada dasarnya adalah ringkasan dari chap- ters 2-4 dari Reiss
2008a. Untuk pembahasan yang lebih rinci tentang masalah pengukuran dalam konteks indeks harga dan
referensi, lihat bab-bab ini. Reiss 2001 menyajikan laporan sebelumnya tentang apa yang membuat
prosedur pengukuran memadai.

Positivis logis mewarisi dikotomi yang dapat diamati / tidak dapat diamati dari Hume, dan memainkan peran yang
sangat penting dalam filsafat sains mereka pada awalnya. Di paruh kedua abad kedua puluh, serangan itu diserang
oleh
160 Metodologi

filsuf seperti Russell Hanson, Thomas Kuhn, Paul Feyerabend dan lain-lain. Referensi utama termasuk Hanson
1958, Kuhn 1996 [1962], Feyerabend 1975, Maxwell 1962, Shapere 1982 dan Hacking 1983: chs 10-11.

Diskusi yang benar-benar baik dan komprehensif tentang masalah pengukuran dan normatif dalam pembangunan
PDB adalah Stiglitz dkk . 2010. Para pembaca yang cenderung historis akan menghargai sejarah Tom Stapleford
tentang pengukuran CPI di Amerika Serikat (Stapleford 2007). Koleksi makalah tentang pengukuran ekonomi juga
dengan fokus historis adalah Morgan dan Klein 2001.

9 Ekonometrika

t Ikhtisar

t Induksi, Pengurangan dan All That t Sebagian besar tidak berbahaya
Ekonometrika? t Kesimpulan
t Pertanyaan Studi

Ikhtisar

Ekonometrika adalah studi tentang ekonomi menggunakan metode statistik. Tujuannya adalah untuk memperkirakan
hubungan ekonomi, untuk menguji teori dan untuk mengevaluasi kebijakan. Dengan kata lain, ini memberikan teori
ekonomi dengan konten empiris. Ragnar Frisch (1895–1973), seorang ekonom Norwegia dan penerima bersama
dengan Jan Tinbergen dari Hadiah Nobel pertama dalam bidang ekonomi pada tahun 1969, kadang-kadang dikreditkan
dengan istilah coining. Dalam catatan editornya untuk edisi pertama jurnal Econometric Society, Econometrica , ia
menjelaskan:

[T] di sini adalah beberapa aspek dari pendekatan kuantitatif untuk ekonomi, dan tidak ada satu pun dari aspek-
aspek ini, yang diambil dengan sendirinya, harus dibingungkan dengan ekonometri. Jadi, ekonometri sama sekali
tidak sama dengan statistik ekonomi. Juga tidak identik dengan apa yang kita sebut teori ekonomi umum, meskipun
sebagian besar teori ini memiliki karakter kuantitatif yang pasti. Ekonometrika juga tidak boleh dianggap identik
dengan aplikasi matematika untuk ekonomi. Pengalaman telah menunjukkan bahwa masing-masing dari tiga
pandangan-poin ini, yaitu statistik, teori ekonomi, dan matematika, adalah hal yang diperlukan, tetapi tidak dengan
sendirinya merupakan kondisi yang mencukupi untuk memahami hubungan kuantitatif dalam kehidupan ekonomi
modern. Ini adalah penyatuan ketiga yang kuat. Dan unifikasi inilah yang membentuk ekonometri.

(Frisch 1933: 2)
162 Metodologi

Ekonometrika tidak hanya menerapkan metode statistik ke teori ekonomi yang sudah ada sebelumnya.
Sebaliknya, itu mengubah klaim teoritis menjadi proposisi empiris yang dapat diuji yang dapat dinyatakan
dalam bentuk matematika yang tepat dan secara statistik memperkirakan parameter mereka.

Dari sudut pandang filsuf, ada dua isu mendasar terkait yang membuat ekonometri penting dan menarik. Yang
pertama adalah pengujian atau konfirmasi teori-teori ilmiah. Dalam banyak hal ini telah dengan masalah di filsafat
ilmu pada abad kedua puluh dan seterusnya. Itu tentu masalah yang paling penting untuk positivis logis, dan
masalah pemisah antara mereka dan Karl Popper dan para pengikutnya. Yang kedua adalah masalah
mengidentifikasi hubungan kausal dari data: inferensi kausal . Dalam hal berikut, saya akan memperkenalkan topik
pengujian teori atau konfirmasi dalam istilah filosofis murni. Saya kemudian akan beralih ke ekonometrik,
menunjukkan bahwa pendekatan utama untuk pengujian teori memiliki mitra ekonometrik dan mendiskusikan
pendekatan ekonometrik ini. Masalah mengidentifikasi hubungan kausal akan dirawat di sepanjang jalan

Induksi, Pengurangan, dan Semua Itu

Pengujian atau konfirmasi teori-teori ilmiah dengan pengamatan adalah kasus khusus dari mode penalaran
yang disebut inferensi induktif atau hanya induksi . Dalam istilah yang paling umum, induksi mengacu pada
kesimpulan dari serangkaian pernyataan mengenai hal-hal yang diamati ("Swan 1 berwarna putih," "Swan 2
berwarna putih," "Swan 3 adalah putih ...") pada pernyataan mengenai hal-hal yang tidak teramati. Sangat
sering ini akan menjadi pernyataan umum ("Semua angsa berwarna putih"; dalam hal ini ada beberapa hal
yang tidak teramati karena tidak semua angsa, lahir dan belum lahir, dapat diamati pada titik ini). Kesimpulan
induktif adalah ampliative : mereka melampaui apa yang sudah diketahui, memperbesar pengetahuan kita
mendasarkan. David Hume, sekali lagi (anti-) pahlawan dalam cerita, berpendapat dengan tegas bahwa tidak
ada jaminan bahwa penalaran ampliatif dapat diandalkan: bahkan ketika semua premis dalam argumen
induktif adalah benar, kesimpulannya mungkin masih salah - karena kasus yang sampai saat ini belum diamati
dapat berubah menjadi berbeda dari semua kasus yang telah diamati. Masa depan mungkin tidak menyerupai
masa lalu, dan karena itu semua kesimpulan induktif kami mungkin salah (lihat Hume 1999 [1748]: bagian 7).

Untuk menjelaskan alasan Hume secara singkat, ingat dari Bab 1 bahwa Hume berpikir bahwa semua
alasan mengenai hal-hal fakta harus didasarkan pada pengamatan. Generalisasi seperti “Semua angsa
berwarna putih” menyangkut masalah fakta — ini bukan kebenaran logis . Kita tidak bertentangan
dengan diri kita sendiri ketika kita mengatakan "Tidak semua angsa berwarna putih" atau "Beberapa
angsa berwarna hitam" ketika menerima premis kita ("Angsa 1 berwarna putih," "Angsa 2 berwarna
putih," "Swan 3 putih ..."). Kami mungkin keliru untuk membuat pernyataan ini tetapi kami tidak
melakukan kesalahan logis .
Ekonometrika 163

Sekarang, basis bukti untuk generalisasi hanya dapat berisi sejumlah pengamatan terbatas yang dibuat di
masa lalu. Karena generalisasi menyangkut semua kasus, termasuk kasus-kasus masa depan dan sampai saat
ini tidak teramati, selalu mungkin bahwa observasi baru memalsukan generalisasi. Meskipun semua angsa
yang telah diamati hingga sekarang mungkin berwarna putih, mungkin angsa berikutnya yang diamati ternyata
berwarna hitam. Ini pada dasarnya adalah posisi orang Eropa sebelum 1697 ketika Willem de Vlamingh,
seorang kapten laut Belanda yang menjelajahi pantai Australia pada akhir abad ketujuh belas, menemukan
angsa hitam di Sungai Swan di Australia Barat. Pra-1697 generalisasi "Semua angsa berwarna putih"
didasarkan pada bukti terbaik yang tersedia di Eropa. Namun demikian itu ternyata salah, dan seperti semua
generalisasi dapat berbagi nasib yang sama.

Mungkin, kami mungkin berpendapat, sebelum 1697 generalisasi didasarkan pada bukti terbaik yang
tersedia untuk orang Eropa tetapi tidak pada semua bukti yang relevan atau cukup. Teori evolusi
mengajarkan kita bahwa populasi dapat berevolusi dengan sangat berbeda ketika mereka menjadi terpisah
secara spasial, jadi kita harus mengharapkan seekor angsa Australia terlihat berbeda dari angsa Eropa.
Tentu saja, ini adalah penalaran anakronistik, karena Darwin tidak menerbitkan bukunya On the Origin
of Species hingga 1859. Tetapi yang lebih penting, itu tidak meruntuhkan argumen Hume.

Bahkan jika, bertentangan dengan fakta, setiap angsa yang pernah hidup telah diamati dan ditemukan
berkulit putih, masih mungkin bahwa angsa yang belum dilahirkan akan berubah menjadi hitam. Masa
depan mungkin tidak seperti masa lalu. Jadi, bahkan jika untuk semua sejarah manusia, hari telah diikuti
malam tidak ada jaminan bahwa itu akan terus melakukannya. Alasan apa pun untuk meyakini suatu
generalisasi hanya dapat terletak di masa lalu, dan masa depan mungkin berbeda dari masa lalu. Prinsip-
prinsip tingkat tinggi seperti “Alam itu seragam” sendiri harus didukung oleh bukti, dan bukti ini akan
kembali menyangkut fakta-fakta tentang masa lalu. Ini masalah induksi Hume .

Tidak semua orang dalam sejarah filsafat pasca-Hume sama-sama terkesan oleh skeptisisme induktif
Hume. Khususnya, John Stuart Mill, salah satu pahlawan filosof-ekonom kami, setuju dengan Hume
bahwa inferensi induktif tidak pernah dapat mencapai kepastian. Namun, baginya ini tidak berarti bahwa
penilaian mengenai hal-hal fakta yang melampaui pengalaman masa lalu tidak masuk akal. Itu hanya
berarti bahwa sebagai manusia kita harus menghadapi pengetahuan yang tidak sempurna dan tidak pasti.

Bahkan jika semua pengetahuan manusia bisa salah, ada kesimpulan induktif yang lebih baik dan kurang baik.
Apa yang disebut "induksi sederhana," kesimpulan dari (biasanya, sejumlah kecil) contoh untuk generalisasi adalah,
pada umumnya, modus penalaran yang sangat tidak bertanggung jawab. Kisah angsa adalah salah satu contoh dari
inferensi yang buruk. Cerita semacam itu dapat dikalikan sesuka hati. Dari “Universitas Erasmus memiliki lebih dari
15.000 siswa,” “Universitas Leiden memiliki lebih dari 15.000 siswa” dan “Universitas Delft memiliki lebih dari
15.000 siswa” kita tidak dapat menyimpulkan “Semua universitas memiliki lebih dari 15.000 siswa.” Dari “Sampel-
sampel lilin ini mencair pada 93 ° C ”kita tidak dapat menyimpulkan“ Semua sampel lilin meleleh pada 93 ° C, ”dan
seterusnya.
164 Metodologi

Ada bentuk-bentuk kesimpulan induktif yang lebih andal. Salah satu kontribusi terbesar Mill terhadap
logika dan filsafat sains adalah memformalkan sebagian dari ini ke dalam apa yang ia sebut "Kanon
Metode Induktif," semacam logika induktif. Ini terdiri dari empat metode:

t Metode Perjanjian
t Metode Perbedaan
t Metode Residu
t Metode Variasi Sejalan.

Untuk tujuan kita, Metode Perbedaan adalah yang paling penting. Mill menggambarkannya sebagai
berikut:

Jika suatu kejadian di mana fenomena yang sedang diselidiki terjadi, dan contoh di mana fenomena itu
tidak terjadi, memiliki setiap keadaan yang sama, kecuali satu, yang hanya terjadi di yang pertama;
Keadaan di mana saja dua contoh itu berbeda, adalah efek, atau penyebabnya, atau bagian yang tak
tergantikan dari penyebab, dari fenomena tersebut.
(Mill 1874 [1843]: 280)

Inferensi kausal , dengan kata lain, dapat dilanjutkan dengan membandingkan dua situasi yang persis sama
kecuali bahwa dalam satu fenomena hadir dan yang lain itu tidak ada. Jika kedua situasi berbeda sehubungan
dengan beberapa faktor, maka faktor tersebut dinilai sebagai efek atau penyebab atau bagian yang sangat
diperlukan dari penyebab fenomena tersebut. Klaim kausal menyamaratakan semua situasi yang identik dalam
semua faktor penyebab ("Penyebab yang sama - efek yang sama").

Mill menganggap Metode Perbedaan sebagai prinsip induktif yang secara umum dapat diandalkan tetapi
tidak berpikir itu bekerja di bidang ekonomi. Alasannya untuk menolaknya adalah bahwa fenomena ekonomi
terlalu rumit untuk terjadi secara alami dalam bentuk yang memungkinkan penerapan Metode Perbedaan, dan
eksperimentasi — penciptaan buatan dari keadaan yang tepat — biasanya bukan merupakan pilihan. Seperti
yang akan kita lihat di bawah ini, ada ekonom terkemuka yang tidak menerima alasan Mill untuk menolak
inferensi kausal induktif. Pada bagian berikutnya saya akan membahas suatu gerakan dalam ekonometri
kontemporer yang bertujuan untuk mengeksploitasi eksperimen alami , yang pada dasarnya adalah situasi dari
jenis Mill yang dibayangkan. Dan di Bab 10 saya akan membahas eksperimen laboratorium , yang telah
mendapatkan popularitas di bidang ekonomi sejak 1950-an.

Namun, pertama-tama, marilah kita mempertimbangkan alternatif Mill untuk induksi kausal induktif.
Di antara para ilmuwan Mill membedakan dua jenis alasan: pria dan teoritikus praktis, dan menjelaskan:

Namun, meskipun kedua kelas peneliti tidak melakukan apa pun kecuali berteori, dan keduanya tidak
berkonsultasi dengan panduan lain selain pengalaman, ada perbedaan di antara mereka, dan perbedaan
yang paling penting adalah: bahwa mereka yang disebut pria praktis memerlukan pengalaman khusus , dan
memperdebatkan
Ekonometrika 165

sepenuhnya ke atas dari fakta-fakta tertentu ke kesimpulan umum; sementara mereka yang disebut
ahli teori bertujuan untuk merangkul bidang pengalaman yang lebih luas, dan, setelah berpendapat ke
atas dari fakta-fakta tertentu ke prinsip umum termasuk rentang yang jauh lebih luas daripada
pertanyaan di bawah diskusi, kemudian berdebat ke bawah dari prinsip umum itu ke berbagai
kesimpulan spesifik.

(Mill 1844: 142; penekanan awal)

Manusia praktis Mill menggunakan metode induktif seperti yang telah saya jelaskan di atas. Para
teoretikus, sebaliknya, pertama — secara induktif — menetapkan prinsip-prinsip yang sangat umum
tentang perilaku manusia, dan kemudian, untuk mencapai prediksi tentang suatu fenomena khusus,
menerapkan prinsip-prinsip umum dengan mengkonsekretasikannya (mengatakan apa yang mereka
maksudkan dalam spesifik keadaan) dan menambahkan faktor relevan lainnya.

Contoh Mill secara singkat membahas kekhawatiran pertanyaan apakah raja mutlak cenderung
menggunakan kekuasaan pemerintah untuk kesejahteraan atau lebih tepatnya untuk penindasan rakyatnya.
Orang-orang praktis akan mengumpulkan kasus monarki absolut, mengamati apa yang dilakukan dan
dilakukan oleh para raja dari pengamatan mereka. Ahli teori, sebaliknya, menganggap raja absolut hanya
sebagai contoh dari jenis manusia yang lebih umum, yang kecenderungan perilaku utamanya sudah mereka
ketahui. Jadi, dari pengalaman kita dengan manusia dalam situasi lain, kita dapat memperkirakan bahwa
seorang manusia dalam situasi raja yang lalim akan membuat penggunaan kekuasaan yang buruk (Mill 1844:
143).

Prinsip-prinsip umum adalah hukum kecenderungan (untuk diskusi tentang istilah ini, lihat Bab 5)
perilaku manusia seperti hukum Engel atau hukum penawaran dan permintaan. Bagaimana, akhirnya,
apakah kita menggunakan ide ini untuk menguji atau mengkonfirmasikan teori ekonomi? Daniel
Hausman dengan baik merangkum akun Mill tentang pengujian teori sebagai berikut:

1 Meminjam terbukti [kecenderungan] hukum tentang operasi yang relevan

faktor penyebab [seperti keinginan orang untuk memiliki lebih banyak kekayaan, untuk menghindari
tenaga kerja dan sebagainya].
2 Disimpulkan dari hukum dan pernyataan kondisi awal ini, sederhana-
tions, dll, prediksi mengenai fenomena yang relevan.
3 Uji prediksi.
4 Jika prediksi benar, maka anggaplah keseluruhan amalgam seperti yang dikonfirmasi. Jika prediksi
tidak benar, maka putuskan (a) apakah ada kesalahan dalam deduksi, (b) apa jenis gangguan [yaitu,
faktor yang mengganggu] terjadi, (c) seberapa sentral hukum yang dipinjam (seberapa besar
penyebabnya) faktor yang mereka identifikasi, dan apakah himpunan hukum yang dipinjam harus
diperluas atau dikontrakkan).

(Hausman 1992a: 147–8)

Alasan untuk membahas posisi Mill di sini cukup panjang adalah bahwa dalam pandangan saya (seperti dalam
Dan Hausman) pengujian teori dalam ekonomi kontemporer
166 Metodologi

pada dasarnya mengikuti skema Mill dengan sedikit modifikasi. Para ekonom dewasa ini jarang menggunakan
gagasan hukum, tetapi prinsip mereka bahwa orang memiliki preferensi yang stabil yang memenuhi aksioma
tertentu, bahwa orang pada umumnya lebih menyukai yang lebih sedikit dan seterusnya adalah setara
kontemporer hukum Mill.

Maka ada dua cara untuk melengkapi hipotesis ekonomi dengan konten empiris. The metode induktif hasil
bottom-up dengan mengumpulkan contoh-contoh spesifik dari hipotesis dan generalisasi dari contoh-contoh.
The metode deduktif hasil top-down dengan menggunakan prinsip-prinsip umum yang didirikan di tempat lain,
menyimpulkan prediksi konkret dari prinsip-prinsip ini bersama-sama dengan kondisi awal dan kemudian
menguji prediksi terhadap data.

Sebagaimana disebutkan di atas, Mill berpikir bahwa metode induktif tidak dapat diterapkan untuk
ekonomi. Banyak ekonom masih berbagi pandangannya tentang masalah ini. Namun dalam beberapa
tahun terakhir telah terjadi perdebatan sengit dalam ekonometrik tentang metode, dengan dua kubu yang
menyerupai “pria praktis” Mill dan “ahli teori” Mill. Jadi dalam hal berikut saya memperkenalkan
perdebatan kontemporer dalam ekonometri dan menunjukkan bagaimana hal itu dapat dianggap sebagai
perdebatan antara "pria prac-tical" dan "teoretisi."

Ekonometrik Paling Tidak Berbahaya?

Analisis regresi

Alat utama ekonometri adalah analisis regresi. Dalam analisis regresi, variabel dependen y dinyatakan sebagai
fungsi variabel independen X

= { x 1 , x 2 , ..., x n } dan istilah kesalahan: y = f ( X ) +. "Ketergantungan" untuk saat ini hanya berarti
ketergantungan fungsional, bukan sebab-akibat. Variabel dependen juga kadang-kadang disebut output
atau variabel atau regresi yang dijelaskan, dan variabel variabel input atau variabel penjelas atau
regressor yang independen. Regressand dan regressor sebenarnya adalah istilah yang paling sedikit
menyesatkan tetapi mereka jelek dan mudah membingungkan, jadi saya akan tetap dengan bahasa biasa
variabel dependen dan independen di sini.

Untuk melakukan analisis regresi, bentuk fungsional untuk f harus ditentukan. Spesifikasi f paling sederhana dan
paling umum adalah fungsi aditif linier:

y = 0 + 1 x 1 + ... + n x n +,

dimana s adalah parameter yang tidak diketahui. Di bawah sejumlah asumsi, yang dapat diperkirakan dari
pengamatan pada y dan X menggunakan berbagai metode estimasi. Salah satu metode tersebut, kuadrat
terkecil biasa, membuat asumsi berikut:

t Exogeneity : kesalahan berarti nol: E [] = 0, dan variabel independen

tidak berkorelasi dengan kesalahan: E [ X ] = 0.
t Kemandirian linear : variabel independen bebas linier.
Artinya, tidak ada variabel adalah fungsi linear dari variabel lain.
Ekonometrika 167

t Homoscedasticity : E [ 2
| X ] = 2 , yang berarti bahwa istilah kesalahan memiliki varian 2 yang
sama
dalam setiap pengamatan.

t Nonautocorrelation : kesalahan tidak berkorelasi antar observasi:
E [ ij | X ] = 0 untuk i ≠ j .

Misalkan sekarang kita tertarik pada pertanyaan apakah anak-anak sekolah lebih baik di kelas yang lebih
kecil. Sebuah prasyarat untuk menggunakan analisis regresi untuk membantu menjawab pertanyaan ini adalah
untuk mengukur variabel-variabel yang menarik, dalam hal ini “melakukan dengan baik di sekolah” dan
“ukuran kelas.” Yang terakhir ini dapat diukur secara langsung dengan menghitung jumlah siswa di kelas.
Variabel "berhasil baik di sekolah" biasanya disebut prestasi pendidikan atau akademik, dan ada tes standar
untuk itu. Untuk mempermudah, mari kita anggap bahwa kedua variabel telah diukur secara memuaskan.
Kami mungkin sekarang tergoda untuk menjalankan regresi sederhana seperti:

pencapaian pendidikan = 0 + 1 ukuran kelas +,

dan menilai bahwa ukuran kelas berkontribusi positif terhadap pencapaian pendidikan setiap kali 1 secara
signifikan lebih besar daripada nol. Masalah dengan prosedur ini adalah bahwa kondisi eksogenitas
kemungkinan besar tidak terpenuhi. Mungkin ada banyak alasan untuk ini, salah satu yang lebih penting adalah
bahwa faktor-faktor yang tidak dapat dikendalikan seperti latar belakang pendidikan orang tua mempengaruhi
kedua variabel independen dan dependen. Dengan demikian, orang tua yang berpendidikan lebih baik mungkin
akan mengirim anak-anak mereka ke sekolah-sekolah yang memiliki kelas kecil, dan memberi mereka lebih
banyak kesempatan belajar di luar sekolah, mempengaruhi prestasi pendidikan mereka. Dalam hal ini
kesalahan akan berkorelasi dengan variabel independen yang melanggar kondisi eksogenitas.

Variabel Instrumental

Dalam kontribusi yang sangat asli, ahli ekonometrik Joshua Angrist dan Victor Lavy telah mengeksploitasi fitur
tentang penentuan alokasi siswa untuk kelas di Israel untuk memecahkan masalah ini: aturan Maimonides (Angrist
dan Lavy 1999). Banyak negara menetapkan ukuran kelas mereka untuk menyesuaikan dengan beberapa versi
aturan Maimonides, yang menetapkan ukuran kelas maksimum, di luar itu guru tambahan harus ditemukan. Di
Israel, ukuran kelas maksimum ditetapkan pada 40. (Ini adalah "aturan Maimonides" asli. "Maimonides adalah
seorang rabi pada abad kedua belas yang menafsirkan apa yang dikatakan Talmud tentang ukuran kelas sebagai
berikut:" Dua puluh lima anak mungkin bertanggung jawab atas satu guru. Jika jumlah di kelas melebihi dua puluh
lima tetapi tidak lebih dari empat puluh, dia harus memiliki asisten untuk membantu dengan instruksi. Jika ada lebih
dari empat puluh, dua guru harus ditunjuk ”(Hyamson 1937: 58b; dikutip dalam Angrist dan Lavy 1999: 534.) Jika
ada kurang dari 40 anak yang terdaftar, mereka semua akan berada di kelas yang sama. Jika ada 41, akan ada dua
kelas, satu dari 20, dan satu dari 21. Jika ada 81 anak atau lebih, dua kelas pertama akan
168 Metodologi

penuh, dan banyak lagi harus diatur, dan seterusnya untuk angka yang lebih tinggi. Angrist dan Lavy's
Figure 1a, yang menunjukkan keampuhan aturan di Israel, muncul di sini sebagai Gambar 9.1.

Grafik mulai berjalan di sepanjang garis 45 derajat, dan kemudian turun terus sampai 20 ketika
pendaftaran adalah 40, meningkat dengan kemiringan 0,5 hingga 80, jatuh ke 27,7 (80 dibagi dengan 3)
pada 80, naik lagi dengan kemiringan 0,25 , dan seterusnya. Mereka menunjukkan bahwa ukuran kelas
sebenarnya, meskipun tidak sesuai dengan aturan, sangat dipengaruhi olehnya, dan menunjukkan pola
gergaji gigi yang sama.

Aturan Maimonides menciptakan eksperimen alami . Hal ini disebabkan oleh fakta bahwa tidak ada alasan
untuk mencurigai adanya perbedaan sistematis antara siswa yang relevan dengan pencapaian pendidikan di
sekitar titik-titik diskontinuitas. Siswa dan orang tua mereka tidak memiliki cara untuk mengetahui
sebelumnya apakah mereka akan menjadi anggota kelompok, katakanlah, 80 siswa, dalam hal mana akan ada
dua kelas 40, atau 81 siswa, dalam hal mana akan ada tiga kelas dari 27. Setiap variasi yang disebabkan oleh
aturan karena itu akan bergantung pada faktor perancu seperti latar belakang pendidikan orang tua: "Karena
tampaknya tidak mungkin bahwa efek pendaftaran selain mereka yang bekerja melalui ukuran kelas akan
menghasilkan pola seperti itu, aturan Maimonides memberikan sumber variasi eksogen yang luar biasa untuk
penelitian kelas ”(Angrist and Lavy 1999: 536).

Angrist dan Lavy menganalisa eksperimen alami yang dibuat oleh aturan Maimonides yang dibentuk
dengan menafsirkannya sebagai variabel instrumental yang valid . Satu (agak tidak standar) cara untuk
mendefinisikan variabel instrumental Z adalah sebagai berikut (lih. Reiss 2008a: ch. 7):

Ukuran
kelas

40

35

30

25

20

15

10

0

Maimonides berkuasa

Ukuran kelas sebenarnya

0 20 40 60 80 100 120 140 160
180 200 220

Jumlah pendaftaran

Gambar 9.1 Aturan Maimonides dalam Aksi

Sumber: Angrist dan Lavy 1999: 541.
Ekonometrika 169

Sebuah Z menyebabkan variabel independen (dalam hal ini, ukuran kelas);

b Z mempengaruhi variabel dependen, jika sama sekali, hanya melalui independen variabel;

c Z itu sendiri tidak disebabkan oleh variabel dependen atau oleh faktor yang juga mempengaruhi
variabel dependen.

Bahwa Z efektif dalam menentukan ukuran kelas ditunjukkan pada Gambar 9.1. Sangat tidak mungkin
bahwa aturan mempengaruhi prestasi pendidikan dengan cara lain selain ukuran kelas. Dan aturan itu
sendiri tidak disebabkan oleh faktor latar belakang seperti prestasi pendidikan orang tua.

Studi seperti Angrist dan Lavy telah menjadi semakin populer di ekonometrik baru-baru ini. Sebuah boneka
negara untuk Mesir telah digunakan sebagai instrumen untuk menentukan kemanjuran bantuan asing, karena
Mesir mendapat banyak bantuan Amerika sebagai bagian dari perjanjian Camp David (lihat Deaton 2010a).
"Nomor urut acak" (yang digunakan untuk menentukan status draf untuk melayani dalam perang Vietnam)
telah digunakan sebagai instrumen untuk menunjukkan bahwa melayani di tentara secara negatif
mempengaruhi pendapatan sipil di kemudian hari (Angrist 1990). Curah hujan telah digunakan sebagai
instrumen untuk pertumbuhan ekonomi dalam menjelaskan perang saudara (Miguel et al . 2004).

Praktis Men versus Theorists

Para pendukung penelitian semacam ini mirip dengan “pria praktis” Mill: mereka bertujuan untuk
menetapkan generalisasi ("Ukuran kelas menyebabkan pencapaian pendidikan"; "Bantuan asing
mempromosikan pertumbuhan ekonomi"; "Menjadi seorang veteran Vietnam mengurangi pendapatan
sipil" dan sebagainya pada) atas dasar pengalaman spesifik. Mereka sangat sadar akan masalah
metodologis yang ditunjukkan Mill. Mill berpikir bahwa metode pengalaman khusus - metode induktif -
tidak dapat berhasil diterapkan dalam ekonomi karena kompleksitas fenomena ekonomi (yang dalam
konteks ini berarti bahwa regresi cenderung menjadi bingung) dan karena ketidakmungkinan
eksperimentasi.

Seperti disebutkan di atas, kita akan melihat eksperimen laboratorium ekonomi di Bab 10. Jika manipulasi
terkontrol tidak tersedia, masalah pembaur masih dapat diatasi: dengan mengeksploitasi eksperimen alami
menggunakan variabel instrumental. Mill berpikir bahwa eksperimen alami sangat tidak mungkin karena
kompleksitas fenomena ekonomi. Tetapi Mill terutama berkepentingan dengan fenomena makro-sosial. Dan
memang tampaknya tidak mungkin berhasil menguji teori tentang efek perdagangan bebas dengan memeriksa
dua negara yang identik dalam semua hal kecuali untuk kebijakan perdagangan mereka. Ahli ekonometri
kontemporer “praktis-men” setuju dengan sentimen umum Mill tetapi berpikir bahwa ada situasi — biasanya
situasi mikro — di mana kita cukup beruntung untuk menemukan seperangkat eksperimen semu — seperti
penentuan ukuran kelas oleh Maimonides ' aturan — yang berhasil dieksploitasi secara ekonometrik.
170 Metodologi

Tapi bisakah itu? "Theorists" Mill juga memiliki rekan-rekan kontemporer mereka. Mereka berpendapat,
pada dasarnya, bahwa kecuali didukung oleh model teoritis, instrumen apa pun cenderung tidak valid. Klaim
eksplisit sepanjang garis-garis ini telah dibuat oleh Angus Deaton, yang membedakan antara variabel
"eksternal" dan "eksogen" (2010a). Variabel eksternal adalah salah satu yang disebabkan secara independen
dari fenomena yang menarik. Variabel eksogen adalah variabel yang memenuhi kondisi eksogenitas yang
dijelaskan di atas. Agar suatu instrumen menjadi valid, ia harus benar-benar eksogen (tiga kondisi [a] - [c]
mendefinisikan instrumen berarti eksogenitas!). Bukti (induktivist) econometri-cians memberikan instrumen
untuk menjadi valid sering hanya menunjukkan bahwa itu adalah eksternal. Para teoritikus mengklaim bahwa
dalam banyak kasus ada alasan untuk meragukan bahwa itu eksogen.

Dengan demikian, telah diperdebatkan bahwa aturan Maimonides (meskipun "eksternal") adalah
instrumen yang tidak valid karena orang tua dapat dan akan mengantisipasi operasinya. Orang tua yang
lebih peduli tentang pendidikan (katakan, karena mereka memiliki prestasi pendidikan yang lebih tinggi)
akan memastikan bahwa anak-anak mereka berakhir di kelas yang lebih kecil (Urquiola dan Verhoogen
2009). Demikian pula, James Heckman berpendapat bahwa nomor urut acak adalah instrumen yang tidak
valid karena pemberi kerja akan mencatat nomor dan membuat keputusan mereka mengenai investasi
pelatihan tergantung pada jumlah (yaitu, jika jumlah karyawan tinggi dan karena itu memiliki probabilitas
rendah sedang disusun, mereka akan berinvestasi lebih banyak dalam pelatihannya daripada ke pelatihan
karyawan yang identik dengan angka rendah). Pada gilirannya, karyawan dengan lebih banyak pelatihan
memiliki upah yang lebih tinggi (Heckman 1996a: 461). Terakhir, negara yang menjadi Mesir pasti
mempengaruhi pertumbuhan ekonominya dengan lebih banyak rute daripada hanya melalui bantuan
asing. Yang terakhir ini memang pilihan instrumen yang sangat bodoh.

Tak satu pun dari ini menunjukkan, bagaimanapun, bahwa variabel teknologi instrumental umumnya salah. Itu
hanya menunjukkan bahwa pilihan instrumen harus didukung dengan cara yang lebih berprinsip dan lebih
sistematis. Salah satu cara untuk mendukung pilihan instrumen dengan cara yang lebih berprinsip adalah dengan
mengambilnya dari teori. Ini adalah apa yang diminta oleh sejawat kontemporer dari “teoretikus” Mill: dapatkan
instrumen Anda dari model teoretis. Lebih khusus, mereka merekomendasikan bahwa spesifikasi ekonometrik
disimpulkan dari prinsip-prinsip ekonomi umum dan asumsi tentang kondisi awal, penyederhanaan dan sebagainya.
Saya akan menggunakan contoh karena Angus Deaton karena menunjukkan apa ide itu dalam model yang sangat
sederhana (Deaton 2010a).

Modelnya adalah model makroekonomi Keynesian dari penentuan pendapatan nasional yang diambil
dari buku teks ekonometrik standar sekali. Ada dua persamaan yang bersama-sama terdiri dari sistem
makroekonomi lengkap. Persamaan pertama adalah fungsi konsumsi, di mana konsumsi agregat adalah
fungsi linear dari pendapatan nasional agregat, sedangkan yang kedua adalah identitas akuntansi
pendapatan nasional yang mengatakan bahwa pendapatan adalah jumlah konsumsi dan investasi. Sistem
dapat ditulis dalam nota-tion standar sebagai:
Ekonometri 171
C=+Y+u (1)
YC + I (2)

Menurut (1), konsumen memilih tingkat konsumsi agregat dengan mengacu pada pendapatan mereka,
sementara di (2), investasi diatur oleh "roh-roh hewan" pengusaha dengan cara yang berada di luar model.

Dalam model ini, konsumsi dan pendapatan secara bersamaan ditentukan sehingga, khususnya, realisasi
stochastic dari u — konsumen yang menampilkan roh-roh hewan mereka sendiri — akan mempengaruhi
tidak hanya C , tetapi juga Y melalui persamaan (2), sehingga ada korelasi positif antara C dan Y . Sebagai
hasilnya, estimasi kuadrat terkecil dari (1) akan menyebabkan perkiraan parameter yang bias ke atas dan
tidak konsisten.

Namun, pengetahuan kita tentang persamaan (2) memberi tahu kita bahwa investasi adalah variabel
instrumental untuk pendapatan: ia mempengaruhi pendapatan, itu mempengaruhi konsumsi jika hanya melalui
pendapatan, dan tidak memiliki kesamaan dengan konsumsi sebagaimana ditentukan di luar model oleh "roh-
roh binatang" pengusaha. Dalam regresi variabel instrumental, ada regresi tahap pertama di mana pendapatan
diregresikan pada investasi. Pada tahap kedua, konsumsi diregresikan pada nilai pendapatan yang diprediksi.

Ini adalah bentuk mentah yang diakui dari derivasi teoritis dari persamaan regresi karena prinsip-prinsip
teoritis sudah hampir terlihat seperti persamaan regresi. Tetapi model yang lebih realistis pada dasarnya sama.
Dalam kritik mereka terhadap aturan Maimonides sebagai variabel instrumental, misalnya, Miguel Urquiola
dan Eric Verhoogen membangun model mikroekonomi yang sangat kompleks di mana rumah tangga membuat
keputusan optimal mengenai pilihan sekolah tergantung pada kesediaan mereka untuk membayar kualitas dan
pada kualitas dan biaya kuliah dari sekolah, sekolah menghasilkan "kualitas" (pendidikan) sebagai satu-
satunya yang baik dan memaksimalkan keuntungan atas pilihan biaya kuliah, pendaftaran dan jumlah ruang
kelas (Urquiola dan Verhoogen 2009). Mereka mendapatkan dua “implikasi yang dapat diuji” berikut dari
model ini:

Implikasi yang Dapat Diuji 1: Dalam ekuilibrium, ada hubungan invert-ed-U antara ukuran kelas dan
pendapatan rumah tangga rata-rata.

Implikasi yang Dapat Diuji 2: Dalam ekuilibrium, sekolah dapat menumpuk pada pendaftaran yang
kelipatan 45 [versi Chili aturan Maimonides 'memiliki batas atas 45], menyiratkan perubahan terputus-
putus dalam pendapatan rumah tangga rata-rata sehubungan dengan pendaftaran di titik-titik.

(Urquiola dan Verhoogen 2009: 192–3)

Kedua implikasi tersebut kemudian diuji terhadap data Chili dan ditemukan konsisten dengan itu.

Ekonometrik “praktis-manusia” membantah bahwa asumsi yang masuk akal dari teori ekonomi, yang masuk
ke dalam model seperti Urquiola dan Verhoogen, yang membuat banyak ekonometri ini luar biasa.
172 Metodologi

Memang, tampaknya sulit untuk berpikir bahwa orang tua diberitahu sepenuhnya dan rasional dan sekolah
menjadi entitas yang memaksimalkan laba sesuai dengan cara yang digambarkan oleh penulis. Terhadap para
teoritikus mereka berpendapat bahwa eksploitasi mereka terhadap pengalaman alami merupakan
“econometrics yang paling tidak berbahaya” (Angrist dan Pischke 2008), yang telah mendorong “revolusi
kredibilitas” dalam ekonomi empiris (Angrist dan Pischke 2010), yang pada gilirannya telah “memiliki sangat
meningkatkan standar kerja empiris ”(Imbens 2009). Perdebatan antara pria praktis dan ahli teori masih hidup
dan baik.

Kesimpulan

Ekonometrika terlalu luas dan rumit untuk memberikan tinjauan komprehensif dari semua masalah
metodologis dalam teks pengantar singkat, jadi dalam bab ini saya telah fokus pada satu masalah yang penting
dan hidup tetapi pada saat yang sama beberapa silsilah filosofis: Harus belajar tentang fenomena ekonomi
berlangsung pada dasarnya secara induktif atau deduktif? John Stuart Mill adalah, terlepas dari semua
pekerjaan yang dia lakukan dalam memformalkan kesimpulan induktif, seorang pendukung awal pendekatan
deduktif karena dia berpikir bahwa dunia ekonomi terlalu rumit dan tidak dapat dikontrol secara
eksperimental. Mill tidak juga berpikir bahwa pembelajaran induktif diperlukan, karena prinsip-prinsip
ekonomi yang paling funda-mental sudah dipahami dengan baik dalam pandangannya. Pandangan "teori-
pertama" Mill telah mendominasi ekonomi sejak itu. Tetapi dari waktu ke waktu, inductivist telah
menawarkan alternatif dan melibatkan ahli teori dalam perdebatan metodologis.

Contoh awal perdebatan semacam itu adalah apa yang disebut Methodenstreit antara Sekolah Sejarah
Jerman dan ekonom Austria Carl Menger pada awal abad ke-20 (lihat Caldwell 2004: bagian 1). Gustav
Schmoller dan sejarawan ekonom historisnya mencoba mempertahankan visi mereka tentang model
pembelajaran ekonomi induktif berbasis bukti melawan arus deduktif yang dicontohkan oleh Menger. Tapi
mereka kalah. Pemikiran Schmoller memengaruhi ekonomi Amerika melalui muridnya, Thorstein Veblen, dan
melalui yang belakangan apa yang kemudian dikenal sebagai institusionalisme Amerika. Pada titik tertentu
dalam sejarahnya, Biro Riset Ekonomi Nasional (NBER) di Boston adalah benteng institusionalisme. Arthur
Burns dan Wesley Clair Mitchell, dua institusional NBER, membela pendekatan induktivistik, relatif bebas
teori untuk pengukuran siklus bisnis hampir 50 tahun kemudian. Tjalling Koopmans mengkritik mereka
dengan argumen yang mencerminkan Methodenstreit pertama , dan kontroversi "Pengukuran tanpa Teori"
terjadi (lihat Koopmans 1947). Burns dan Mitchell kehilangan itu. Faktanya, seluruh sekolah institusionalis
mereka praktis menghilang dari planet ini. Hari ini, gerakan "Ekonometrika Paling Tidak Berbahaya"
mewakili pendekatan induktivistik dan kritik mereka seperti James Heckman dan Angus Deaton pendekatan
deduktivistik. Biarkan saya memprediksi bahwa yang terakhir akan sekali lagi menang dan bahwa sekolah
baru ekonometri induktivist akan muncul dalam sekitar 50 tahun.
Ekonometrika 173

Pertanyaan Studi

1 Apakah Hume benar untuk menjadi skeptis tentang generalisasi induktif?

2 Mill berpikir bahwa inferensi kausal induktif tidak mungkin di bidang ekonomi. Apakah Anda setuju?

3 Karakterisasi variabel instrumental yang diberikan dalam bab ini berbeda dari presentasi buku teks
ekonometri standar. Apa perbedaan utamanya? Apakah itu penting?

4 Apakah Anda berpihak pada versi kontemporer dari orang-orang praktis Mill atau para teoretisi?
Pertahankan jawaban Anda.

5 Peran apa, menurut Anda, yang dapat dan seharusnya teori mainkan dalam penyelidikan ekono-
metrik?


Sejarah ekonometrik yang luar biasa dan filosofis adalah Morgan 1990. Banyak makalah klasik dapat
ditemukan di Hendry dan Morgan 1995. Tinjauan umum masalah metodologis Hoover pada tahun 2006 dalam
metrik ekonomi jauh lebih komprehensif daripada yang saya dapat di sini. Saya mempertahankan pembacaan
kausal saya atas variabel instrumental dalam Reiss 2005 dan Reiss 2008a: ch. 7. Diskusi kausalitas yang sangat
canggih dalam ekonometrik dapat ditemukan di Hoover 2001. Dalam buku itu Hoover mengembangkan
beberapa gagasan Herbert Simon (Simon 1953). Akun alternatif dari gagasan Simon dapat ditemukan di N.
Cartwright 2007b: ch. 14. Pertukaran terbaru antara "pria praktis" dan "ahli teori" ada dalam Journal of
Economic Perspectives 24: 2 (2010) dan Journal of Economic Literature 48: 2 (2010).

10 Eksperimen

t Ikhtisar
t Berbicara kepada para ahli teori
t Mencari Fakta

t Berbisik ke dalam Telinga Para Pangeran t Masalah-masalah
Metodologis t Kesimpulan
t Pertanyaan Studi

Ikhtisar

Sederhanakan, kita dapat mengatakan bahwa ada empat jenis eksperimen dalam ilmu ekonomi. Ada, pertama, eksperimen
pemikiran dalam kedua makroekonomi (lihat Bab 6 tentang eksperimen pemikiran moneter Hume) dan mikroekonomi (lihat
Bab 7 tentang eksperimen dan model pemikiran Galilea). Menganggap para pelaku adalah abstrak suatu situasi dari dunia
nyata, menyederhanakannya ke tingkat yang lebih besar atau lebih kecil, memanipulasi suatu variabel dan merenungkan apa
yang akan terjadi dalam situasi yang diidealkan. Ada, kedua, eksperimen alami . Dalam eksperimen alami tidak ada
manipulasi oleh eksperimen. Sebaliknya, eksperimen menemukan situasi alami yang menyerupai eksperimen dan
menggunakan metode statistik untuk menganalisisnya. Dalam bab sebelumnya kita telah melihat bahwa teknik variabel
instrumental-ekono-metrik sering digunakan untuk efek itu. Ada, ketiga, evaluasi lapangan acak yang telah menjadi populer
dalam ekonomi pembangunan dalam beberapa tahun terakhir. Dalam evaluasi lapangan secara acak, subyek eksperimental
dibagi menjadi dua kelompok, perlakuan eksperimental diterapkan pada satu dan perawatan kontrol yang lain. Perawatan
dinilai efektif jika ada perbedaan hasil antara kedua kelompok. Percobaan-percobaan ini akan kita periksa dalam bab berikut.

Kategori terakhir adalah eksperimen laboratorium. Ketika ada pembicaraan tentang eksperimen di bidang
ekonomi atau ekonomi eksperimental, itu biasanya
Eksperimen 175

percobaan laboratorium yang disebut. Ini dimulai sekitar tahun 1950-an, dan dengan demikian merupakan
fenomena yang relatif baru. Hanya evaluasi lapangan secara acak yang lebih muda. Bahwa buku ini
memperlakukan berbagai jenis eksperimen dalam susunan sejarah kemunculannya adalah kesempatan murni.

Percobaan laboratorium dalam ekonomi menguji hipotesis yang ditarik dari teori ekonomi di “lab,” yang biasanya
berarti ruang kelas yang disiapkan khusus atau lingkungan universitas lainnya. Artinya, orang yang nyata (tidak seperti
agen ideal model ekonomi dan eksperimen pikiran) dibawa ke lingkungan buatan (tidak seperti dalam evaluasi lapangan
secara acak, di mana agen diamati di habitat alami mereka) dan mengalami intervensi yang dikendalikan oleh pengalam-
menter (tidak seperti dalam eksperimen alami, di mana variasi tidak berada di bawah kendali pengalaman). Ketika saya
mengatakan "percobaan" atau "eksperimen ekonomi" dalam bab ini, maksud saya eksperimen semacam ini: eksperimen
laboratorium terkontrol.

Saya mengatakan bahwa eksperimen menguji hipotesis dari teori ekonomi. Ini terlalu sempit fokus.
Menurut seorang praktisi, ekonom mengejar setidaknya tiga tujuan dengan eksperimen, yang ia gambarkan
secara metaforis sebagai berikut (Roth 1986):

t berbicara kepada ahli teori ("menguji dan memodifikasi teori ekonomi formal"); t mencari fakta-fakta
( “mengumpulkan data tentang fenomena menarik dan penting
institusi ”); dan

t berbisik ke telinga para pangeran ("memberikan masukan ke dalam proses pembuatan kebijakan").

Dalam hal berikut, saya akan memberikan satu atau beberapa contoh dari setiap kategori dan menjelaskan
beberapa hal yang telah dipelajari para ekonom dari melakukan jenis percobaan ini. Saya kemudian akan
mengambil langkah mundur dan memeriksa beberapa masalah metodologis yang terlibat dalam eksperimen
ekonomi secara umum.

Berbicara kepada para ahli teori

Para ekonom eksperimental memeriksa dua teori ekonomi utama: teori pilihan rasional individu dan teori
permainan. Beberapa hasil yang telah kita temui dalam Bab 3 dan 4. Para ekonom dan ahli metodologi
ekonomi biasanya mengutip Lichtenstein dan Slovic 1971 sebagai makalah seminal tentang “pembalikan
preferensi,” yang memicu seluruh industri kontribusi terhadap topik tersebut (misalnya, Hausman 1992a ;
Cox 2008), tetapi dalam psikologi phenom-enon preferensi intransitif sudah dikenal pada saat itu. Berikut
ini adalah deskripsi eksperimen yang dilakukan sebagai reaksi terhadap serangkaian temuan pada awal
1950-an:

Kami mempresentasikan jadwal perbandingan pasangan dari sembilan rangsangan kepada 47 mahasiswa laki-
laki yang belum tamat dalam mata kuliah psikologi dasar. Rangsangan kami
176 Metodologi

adalah deskripsi verbal anak perempuan. Deskripsi verbal ini diketik pada slide lentera dan ditunjukkan
kepada para siswa dengan proyektor slide. Setiap gadis digambarkan oleh tiga kata sifat. Deskripsi para
gadis adalah sebagai berikut: (1) polos, sangat menawan, kaya; (2) cantik, pesona rata-rata, kaya; (3)
pendapatan yang cukup, sangat menarik, rata-rata; (4) cantik, mempesona, baik dilakukan; (5) rata-rata
"penampilan", menawan, kaya; (6) rata-rata “penampilan”, sangat menarik, baik dilakukan; (7) cantik,
sangat menawan, miskin;

(8) indah, pesona rata-rata, baik-to-do; (9) pendapatan yang indah, menawan, dan rata-rata. Setiap
stimulus dibandingkan dengan setiap stimulus lainnya. Jadi ada total 36 perbandingan. Para siswa diminta
untuk menunjukkan mana dari dua gadis di setiap perbandingan mereka lebih suka menikah. Studi ini
diulang dengan siswa yang sama menggunakan rangsangan yang sama enam minggu setelah presentasi
asli.

Para siswa mengambil banyak waktu membuat pilihan mereka dan tampaknya membuat pilihan
mereka dengan hati-hati dan jujur.

(Davis 1958: 29)

Triad adalah serangkaian peringkat preferensi seperti [(9)> (8); (8)> (7); (9)

> (7)], yang transitif, atau [(9)> (8); (8)> (7); (7)> (9)], yang intransitif atau "melingkar." Hasilnya
adalah bahwa dari 3.948 kemungkinan triad pada dua presentasi, 487, sedikit di atas 12 persen, adalah
intransi-tive; 22,8 persen preferensi berubah dari presentasi pertama hingga kedua; dan 28 melingkar di
kedua presentasi. Tampaknya kami jauh lebih baik membangun “daftar cinta” kami di sekolah (lihat Bab
4), tetapi mungkin itu karena fakta bahwa kami memberi peringkat pada gadis-gadis yang nyata daripada
deskripsi.

Temuan Davis boleh dibilang tidak perlu terlalu mengkhawatirkan para ekonom mengingat bahwa mereka
tidak tertarik untuk berpacaran. Lichtenstein dan Slovic 1971 dibawa ke perhatian para ekonom sebagai bukti
untuk pembalikan preferensi sistematis dan ekonomi signifikan (Grether dan Plott 1979). Seperti yang kita
lihat di Bab 3, eksperimen preferensi-pembalikan tunduk pada lebih dari satu interpretasi karena, mengingat
set-up, pembalikan dapat dipahami sebagai bukti untuk preferensi intransitif tetapi juga, antara lain, sebagai
hasil dari individu yang merespon secara berbeda. masalah pilihan di satu sisi dan masalah penilaian di sisi
lain. Graham Loomes, Chris Starmer dan Robert Sugden telah mengusulkan pengaturan eksperimental yang
dimaksudkan untuk mengendalikan penjelasan alternatif yang dikenal (Loomes et al . 1991). Lebih khusus
lagi, mereka menjalankan eksperimen yang dirancang untuk (a) menunjukkan bahwa preferensi intransitif
adalah fenomena asli (bukan artefak dari prosedur eksperimental yang dipilih); dan (b) menunjukkan bahwa
jenis intran-sitivity yang ditemukan dapat dijelaskan lebih baik dengan "teori penyesalan" (sebuah alternatif
untuk teori yang diharapkan-utilitas karena Loomes dan Sugden 1982) daripada dengan penjelasan alternatif
yang mungkin.

Inilah, singkatnya, pengaturan eksperimental mereka. Loomes et al . membangun 20 masalah pilihan
berpasangan seperti yang ditunjukkan pada Gambar 10.1.
Percobaan 177

1 ...

... 30 31 ...

… 60
61 ...

… 100

SEBUAH £ 8.00

£ 8.00

£0

B
£ 18,00

$0
$0

%
30

30

40

Gambar 10.1 Contoh Soal Pilihan

Sumber: Loomes et al . 1991: 434.

Subyek diminta untuk mengambil amplop tertutup dari kotak berisi 100 amplop semacam itu, dan untuk
menjaga amplop tetap tertutup sampai akhir percobaan. Amplop berisi nomor 1–100, dengan setiap amplop
yang hanya berisi satu nomor; subjek tahu tentang set-up tetapi tidak nomor apa yang ada di dalam amplop.
Subyek juga tahu bahwa pada akhir percobaan, mereka akan diminta untuk melempar dadu bermata 20 untuk
menentukan pertanyaan mana yang akan dimainkan secara nyata. Jika, katakanlah, pertanyaan dari Gambar
10.1 dipilih, eksperimen kemudian akan memeriksa opsi mana yang dipilih subjek. Jika dia memilih "A," dia
akan menerima £ 8 jika jumlahnya antara 1 dan 30, jumlah yang sama jika itu antara 31 dan 60, dan tidak ada
apa-apa jika itu adalah antara 61 dan 100. Jika dia memilih "B," dia akan menerima £ 18 jika jumlahnya antara
1 dan 30 dan tidak ada yang sebaliknya. Dua ratus subjek mengambil bagian dalam percobaan dan diacak
menjadi dua subkelompok dari 100 subjek masing-masing. Kedua subkelompok menerima masalah pilihan
yang sedikit berbeda (perbedaan utama adalah nilai lotere yang diharapkan). Pada awal percobaan, subjek
menerima buku yang berisi semua 20 masalah pilihan dan catatan penjelasan. Dengan demikian mereka bisa
melihat semua masalah sebelum menjawab salah satu dari mereka.

Tidak terlalu mengherankan, Loomes dkk . menemukan pelanggaran sistematis dari aksioma tran-sitivity.
Tanggapan siklik (non-transitif) menyumbang 14 hingga 29 persen pengamatan. Yang lebih menarik bagi
mereka adalah fakta bahwa secara substansial lebih "diprediksi" daripada pelanggaran "tidak terduga" dari tran
sitivitas, sejalan dengan teori penyesalan tetapi tidak konsisten dengan gagasan bahwa orang harus sering
melakukan kesalahan karena alasan apa pun (jika pelanggaran disebabkan oleh kesalahan, semua jenis
pelanggaran harus kira-kira sama besar kemungkinannya).

Seperti yang kita lihat di Bab 3, bukti pelanggaran sistematis aksioma transi-tivity (dan aksioma lain)
sangat penting jika teori pilihan rasional digunakan sebagai teori prediktif atau eksplanatif. Oleh karena
itu, temuan eksperimental memiliki signifikansi teoretis yang sangat besar.

Mencari Fakta

Teori permainan juga tentu saja telah diuji "di laboratorium." Salah satu hasil yang lebih mencolok berasal dari
aplikasi eksperimental Ultimatum
178 Metodologi

Game (lihat Bab 4, Gambar 4.4). Ingat bahwa dalam Game Ultimatum, pengusul memiliki dana awal $
x yang mungkin ia dapat atau tidak dapat dibagi dengan responden. Responden memiliki pilihan untuk
menerima, dalam hal mana para pihak menerima jumlah yang ditawarkan oleh pengaju, atau menolak,
dalam hal mana keduanya tidak menerima apa pun. Teori permainan diambil untuk memprediksi bahwa
pengusul menawarkan jumlah minimum yang mungkin (misalnya, $ 1 atau $ 0,01), dan bahwa
responden menerima tawaran positif.

Sayangnya, ini bukan apa yang diamati dalam eksperimen. Alih-alih menyimpan jumlah maksimum untuk
diri mereka sendiri, pengusul menawarkan responden bagian substansial dari sumbangan, di negara-negara
maju biasanya sekitar 30-40 persen rata-rata, dengan 50:50 perpecahan yang cukup umum. Penting juga
bahwa tawaran rendah sering ditolak. Artinya, responden tampaknya menghukum pengusul untuk penawaran
yang mereka anggap tidak memadai dengan biaya untuk diri mereka sendiri.

Maka, inilah contoh-contoh "fakta" eksperimental: para pendukung di Game Ultimatum menawarkan sekitar
30–40 persen dari total taruhan rata-rata; responden sering menolak penawaran rendah. Gagasan tentang
"fakta" tidak standar dalam ekonomi eksperimental atau filsafat ekonomi. Saya menganggap bahwa dalam
ekonomi eksperimental sebuah "fakta" adalah sejenis fenomena dalam filosofi rasa sains (lihat Bab 2 dan 8):
pola perilaku yang dapat diulangi dan patut dicatat. Fakta-fakta yang dilaporkan di sini dapat diulang karena
mereka telah direproduksi dalam eksperimen yang tak terhitung jumlahnya, dan ada sedikit keraguan bahwa
mereka akan direproduksi jika percobaan baru dilakukan dalam kondisi yang sama. Mereka patut diperhatikan
karena mereka dianggap melanggar prediksi permainan-teori. Oleh karena itu, dalam hal ini saya akan
menggunakan filsafat teknis dari istilah sains "fenomena," meskipun para ahli ekologi mungkin lebih akrab
dengan gagasan "fakta."

Sebagai tambahan, izinkan saya mencatat bahwa ekonomi eksperimental cukup digerakkan oleh teori
bahkan dalam pencariannya untuk fenomena (Reiss 2008a: ch. 5). Di luar teori, tidak banyak yang luar biasa
dalam kenyataan bahwa banyak orang membagi endowmen yang diberikan oleh seorang eksperimen dengan
orang lain setengah-setengah. Hanya dengan latar belakang prediksi yang berasal dari teori permainan dan
asumsi lain, perilaku seperti itu tampaknya patut diperhatikan. Ini merupakan pelanggaran dari prediksi
teoritis dan karena itu signifikan dari sudut pandang seorang ekonom.

Fenomena eksperimental baru sering muncul di depan dalam mencari penjelasan untuk fenomena yang
sudah ada. Penawaran di luar ekuilibrium dalam Ultimatum Games dapat, misalnya, dijelaskan dengan
menarik perhatian para pengusul bahwa takut tawaran yang rendah mungkin ditolak (yang bukan ketakutan
tak berdasar, seperti yang telah kita lihat). Untuk menguji hipotesis ini, game terkait dapat dimainkan: Game
Dictator. Game Dictator pada dasarnya sama dengan Game Ultimatum kecuali bahwa responden tidak punya
pilihan. Dia tidak bisa menolak penawaran rendah — yang mengubah pengusul menjadi "diktator", karena
dia akan memutuskan tentang jumlah yang dibawa kedua belah pihak. Namun, dalam Dictator Games,
pengusul terus menawarkan jumlah positif (dalam uji eksperimental di negara-negara maju). Dengan sekitar
20 persen dari sumbangan, penawaran adalah
Eksperimen 179

lebih rendah untuk memastikan, tetapi mereka jauh lebih tinggi dari apa yang diprediksi teori permainan.
Lima puluh lima puluh perpecahan juga terus menjadi signifikan. Ini, kemudian, adalah beberapa
fenomena baru.

Kumpulan fenomena lain berasal dari uji eksperimental permainan barang publik (PG). Game PG adalah
Dilema n -person Prisoner. Masing-masing dari n pemain dapat memberikan kontribusi jumlah c i wakaf
mereka yang sama untuk setiap pemain. Jumlah total kontribusi kemudian dikalikan dengan beberapa faktor m
dan dibagi secara merata di antara semua pemain terlepas dari kontribusinya. Imbal hasil moneter setiap
pemain diberikan oleh m ∑ c i - c i . Jika pemain hanya peduli dengan pembayaran uang, strategi maksimalnya
adalah tidak berkontribusi; yaitu, untuk mengendarai gratis kontribusi orang lain. Karena pemain benar-benar
simetris, alasan yang sama berlaku untuk setiap pemain, sehingga dalam kesetimbangan tidak ada yang
memberikan kontribusi.

Sekali lagi, ini bukan apa yang sedang diamati dalam implementasi eksperimental. Dalam subjek game
PG satu-shot berkontribusi sekitar setengah dari pemberkahan mereka. Dalam permainan yang berulang,
subjek pada awalnya berkontribusi dalam jumlah yang besar, yang menurun karena lebih banyak putaran
dimainkan. Fakta ini kemudian dikenal sebagai "overcontribution and decay." Hasil dari dua game PG
diilustrasikan pada Gambar 10.2.

Kontribusi

Sesi PG 1 sesi PG 2

20

18

16

14

12

10

8

6

4

2

0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Bulat

Gambar 10.2 “Overcontribution and Decay” dalam Permainan Barang Publik

Sumber: Guala dan Burlando 2002.
180 Metodologi

Fakta luar biasa tentang fenomena ekonomi eksperimental adalah bahwa mereka cenderung sangat sensitif
terhadap pengaturan yang tepat di mana eksperimen dilakukan. Hampir semua variasi dalam pengaturan dapat
menyebabkan variasi dalam hasil. Faktor-faktor penting yang sering mempengaruhi hasil adalah misalnya
ukuran "pasak"; pengalaman subyek; para pemain informasi dan bagaimana didistribusikan di antara pemain;
budaya dan lingkungan (untuk perinciannya, lihat Reiss 2008a: ch. 5). Tentang insentif moneter, saya akan
mengatakan lebih banyak di bawah ini. Di sini izinkan saya secara singkat melaporkan beberapa hasil yang
mengasyikkan dari pengujian pengalaman mengalamai Ultimatum Game di negara-negara berkembang.

Saya menyarankan di atas bahwa menawarkan di Ultimatum Games cukup kuat di negara-negara maju,
tetapi ini sebenarnya agak menyesatkan karena ada perbedaan sistematis di sana. Misalnya, di Amerika Serikat
menawarkan lebih tinggi daripada di Jepang, dan lebih tinggi di Jepang daripada di Israel (Roth et al . 1991).
Di Amerika Serikat, siswa tampak lebih dermawan daripada pekerja (Carpenter et al . 2005). Variasi
meningkat ketika seseorang meninggalkan dunia maju. SEBUAH studi yang luar biasa yang dilakukan oleh
kelompok peneliti interdisipliner telah menyelidiki sejauh mana perilaku bentuk lingkungan ekonomi dan
sosial di 15 masyarakat skala kecil di 12 negara di 5 benua (Henrich et al . 2001). Ada variasi budaya yang
besar di antara masyarakat yang diteliti. Sebagai contoh, sampel terdiri dari tiga masyarakat pencari makan,
enam praktik pertanian tebang-dan-bakar, empat kelompok penggembala nomaden, dan tiga komunitas petani
skala kecil yang menetap. Perilaku dalam permainan seperti Game Ultimatum ditemukan untuk saling
bervariasi secara sistematis dan cukup dramatis dengan perbedaan budaya. Dengan demikian, ada variasi luas
dalam penawaran rata-rata di Game Ultimatum, mulai dari sekitar seperempat (misalnya, 27 persen di antara
Hadza di Tanzania, dengan tingkat penolakan sangat tinggi) hingga lebih dari setengah (misalnya, 58 persen di
kalangan Lamalara di Indonesia, dengan tingkat penolakan mendekati nol). Yang penting, perbedaan ini dapat
jauh lebih baik dijelaskan oleh perbedaan tingkat kelompok dalam organisasi ekonomi dan tingkat integrasi
pasar daripada oleh perbedaan individu (Henrich et al . 2001). Tabel 10.1 mereproduksi tabel Henrich et al . 1,
yang merangkum hasil paling penting mereka.

Berbisik ke Telinga Para Pangeran

Meskipun saya belum menyelidiki masalah ini secara sistematis, saya pikir aman untuk mengatakan bahwa
eksperimen ekonomi yang dilakukan dalam persiapan lelang spektrum US Federal Communications
Commission (FCC) pada awal 1990-an adalah eksperimen yang telah menerima perhatian terbesar dalam
literatur metodologis. Salah satu alasan mengapa eksperimen ini mendapat begitu banyak perhatian adalah
karena mereka memiliki sasaran kebijakan yang jelas dan segera. Lelang hanyalah salah satu dari beberapa
mekanisme alokasi untuk lisensi untuk menggunakan spektrum elektromagnetik. Alternatif seperti proses
administratif atau lotere digunakan pada tahun 1970-an dan 1980-an tetapi mereka penuh dengan kesulitan dan
jatuh tidak disukai. Lelang, bagaimanapun, datang
Eksperimen 181

Tabel 10.1 Permainan Ultimatum di 15 Skala Kecil Masyarakat

Penawara
Kelompok Negara Berarti Mode b Penolakan n rendah
menawarka
n sebuah tingkat c penolakan

tingkat d
Machiguenga Peru 0,26 0,15 / 0,25 (72) 0,048 (1/21) 0,10 (1/10)
Hadza (kamp besar) Tanzania 0,40 0,50 (28) 0,19 (5/26) 0,80 (4/5)
Hadza (kamp kecil) Tanzania 0,27 (38) 0,20 (8/29) 0,28 (5/16) 0,31
0,5 / 0,3 / 0,25
Tsimané Bolivia 0,37 (65) 0,00 (0/70) 0,00 (0/5)
Quichua Ekuador 0,27 0,25 (47) 0,15 (2/13) 0,50 (1/2)
Torguud Mongolia 0,35 0,25 (30) 0,05 (1/20) 0,00 (0/1)
Khazax Mongolia 0,36 0,25
Mapuche Chili 0,34 0,50 / 0,33 (46) 0,067 (2/30) 0,2 (2/10)
Au PNG 0,43 0,3 (33) 0,27 (8/30) 1.00 (1/1)
Gnau PNG 0,38 0,4 (32) 0.4 (25/10) 0,50 (3/6)
Petani Sangu Tanzania 0,41 0,50 (35) 0,25 (5/20) 1.00 (1/1)
Sangu penggembala Tanzania 0,42 0,50 (40) 0,05 (1/20) 1.00 (1/1)
Penduduk desa yang
belum menetap Zimbabwe 0,41 0,50 (56) 0,1 (3/31) 0,33 (2/5)
Penduduk desa yang
dimukimkan
kembali Zimbabwe 0,45 0,50 (70) 0,07 (12/86) 0,57 (4/7)
Achuar Ekuador 0,42 0,50 (36) 0,00 (0/16) 0,00 (0/1)
Orma Kenya 0,44 0,50 (54) 0,04 (2/56) 0,00 (0/0)
Sakit Paraguay 0,51 0,50 / 0,40 (75) 0,00 (0/51) 0,00 (0/8)
Lameiara e Indonesia 0,58 0,50 (63) 0,00 (3/8) 0,00 (4/20)

Catatan: PNG = Papua Nugini.

a Kolom ini menunjukkan penawaran rata-rata (sebagai proporsi) dalam permainan ultimatum untuk setiap masyarakat.
b Kolom ini menunjukkan tawaran modal (s), dengan persentase subyek yang membuat penawaran modal (dalam kurung).

c Tingkat penolakan (sebagai suatu proporsi), dengan jumlah aktual yang diberikan dalam kurung.
d Tingkat penolakan untuk penawaran 20 persen atau kurang, dengan angka aktual yang diberikan dalam kurung. e Termasuk penawaran
rendah yang dihasilkan dari proses-proses.

Sumber: Henrich dkk . 2001: 74.

dengan masalah mereka sendiri. Salah satu contoh yang terkenal adalah kemungkinan “kutukan
pemenang.” Kutukan seorang pemenang dapat muncul dalam lelang nilai bersama dengan informasi yang
tidak lengkap. Anggaplah para penawar yang berbeda rata-rata benar dalam perkiraan mereka tentang
nilai barang yang dilelang. Tapi karena itu adalah penawar tertinggi yang memenangkan lelang, dia
cenderung melebih-lebihkan nilai item. Jadi pemenangnya adalah "terkutuk" karena dia menerima barang
dengan harga terlalu tinggi.

Mengubah aturan lelang dapat membantu memperbaiki masalah seperti kutukan pemenang. Misalnya, jika
penawar tertinggi menang, tetapi hanya membayar minimum yang diperlukan untuk menang (yaitu, tawaran
tertinggi kedua ditambah satu sen), kemungkinan bahwa kutukan pemenang diperoleh lebih kecil. Tugas untuk FCC
kemudian adalah untuk menemukan desain lelang yang akan mengalokasikan lisensi secara efisien, tanpa
182 Metodologi

menciptakan fenomena yang tidak diinginkan seperti kutukan pemenang, dan sesuai dengan tujuan yang
ditetapkan oleh Kongres.

Ekonom segera memasuki tahap (sering sebagai konsultan untuk perusahaan telekomunikasi) - "teori lelang"
adalah salah satu cabang yang lebih penting dari ekonomi terapan, setelah semua. Awalnya, para ahli teori
yang mencoba memodelkan lelang dengan maksud untuk memaksimalkan pendapatan pemerintah (di
antaranya, Paul Milgrom, Robert Wilson dan Preston McAfee). Tapi ternyata lelang tingkat kompleksitas yang
diperlukan untuk FCC menolak pemodelan matematika. Mekanisme individu bisa dimodelkan, tetapi tidak
pelelangan secara keseluruhan (Guala 2001). Untuk menguji bagaimana mekanisme yang berbeda berinteraksi,
sekelompok ekonom dari Caltech, yang dipimpin oleh Charles Plott, melakukan serangkaian percobaan. Pada
bulan Maret 1994, FCC mengumumkan struktur lelang yang dipilih, yang pada dasarnya merupakan
penawaran multi-putaran simultan (untuk lisensi bernilai tinggi), di mana penawar dapat menarik penawaran
mereka, meskipun dengan penalti. Keputusan itu dibuat setidaknya sebagian berdasarkan hasil eksperimen.

Tidak selalu ada pangeran yang terlibat dalam kasus-kasus seperti pelelangan FCC tetapi makna analogi
Roth jelas: satu tujuan dari eksperimen ekonomi adalah persiapan dan bantuan dalam pengambilan keputusan
kebijakan. Tujuan ini jelas berbeda dari dua lainnya. Di satu sisi, jika mekanisme lelang jenis-jenis tertentu
tidak dapat dimodelkan secara teoritis, maka mengamati bagaimana mekanisme-mekanisme ini dalam suatu
eksperimen tidak dapat bertujuan menguji prediksi-prediksi retrospektif. Di sisi lain, "testbeds untuk
kebijakan" ini (Plott 1997) tidak bertujuan untuk menetapkan fakta-fakta yang kuat seperti itu. Eksperimen
yang dijalankan dalam persiapan lelang FCC sangat spesifik sehingga hasil mereka dari awal tidak akan
melakukan perjalanan jauh di luar pengaturan yang relevan dengan pelelangan ini. Saya akan kembali ke titik
ini nanti.

Masalah Metodologis

Seberapa baik percobaan dalam masing-masing dari tiga peran ini? Mari kita perhatikan dulu bahwa ada
perasaan di mana peran kedua (“membangun fenomena”) adalah sebelum yang pertama (“teori pengujian”).
Pembedaan Bogen-Woodward antara data dan fenomena telah diperkenalkan di Bab 8. Data adalah hasil yang
dapat diamati tetapi idiosynkratik dari prosedur percobaan individual. Fenomena tidak dapat diamati tetapi
efek sistematis dari kepentingan teoritis (atau ilmiah). Dalam contoh pertama, eksperimen menghasilkan data.
Seringkali data dapat digunakan untuk dapat dipercaya menyimpulkan fenomena, tetapi fenomena tidak secara
otomatis jatuh dari percobaan. Hal ini membutuhkan desain pengalaman-mental yang baik, biasanya analisis
statistik, dan selalu banyak inter-pretasi dan idealisasi untuk mengekstrak fenomena dari data eksperimen.
Tetapi itu adalah fenomena yang melawan teori yang diuji, bukan data. Dengan demikian, pertama-tama kita
harus menetapkan bahwa hasil eksperimen adalah fenomena asli daripada artefak percobaan. Kami kemudian
dapat memutuskan apakah kami menggunakan fenomena eksperimental untuk menguji teori atau sebaliknya
Eksperimen 183

memeriksa kekuatannya, mencari penjelasan, dll. Dalam apa yang berikut, saya akan, akibatnya, pertama
memeriksa beberapa masalah metodologis umum mengenai pembentukan fenomena eksperimental, kemudian
berbicara tentang isu-isu seputar teori-pengujian dan akhirnya bertanya bagaimana seseorang dapat
mengekstrapolasi pengetahuan yang diperoleh dalam eksperimen untuk pengaturan yang relevan untuk
kebijakan.

Menetapkan Fenomena Eksperimental

Kami sudah mencatat bahwa fenomena kepentingan teoretis atau kepentingan ilmiah yang potensial bagi para
ekonom tidak duduk-duduk seperti bunga di padang rumput, hanya menunggu untuk dipetik oleh ekonom yang
menginginkannya dan kebetulan lewat. Ini tetap benar untuk situasi laboratorium. Karena berbagai alasan,
sebagian besar eksperimen ekonomi melibatkan mahasiswa di terminal komputer, dan “manipulasi”
eksperimental dilaksanakan melalui instruksi di layar. Hasil yang dapat diamati dari eksperimen ini adalah,
biasanya, string angka seperti pada Gambar 10.3.

0: 1: 1 0: 1 0: 3 4::: 1: 2: 2 0: 0: 3 8::: 2: 3: 2 0: 0: 4 0::: 3: 4: 3:

1 7: 4 1::: 4: 1: 2 0: 0: 2 4::: 5: 2: 2 0: 0: 3 8::: 6: 3: 2 0:

0: 4 0::: 7: 4: 3: 1 7: 4 1:: 8: 1: 2 0: 0: 2 4:: 9: 2: 1 5: 5: 4 3:::

1 0: 3: 2 0: 0: 4 0:: 1 1: 4: 2 0: 0: 2 4::: 1 2: 1: 0: 2 0: 4 4:: 1 3 3: 2:

2 0: 0: 3 8::: 1 4: 3: 2 0: 0: 4 0:: 1 5: 4: 2 0: 0: 2 4:::

Gambar 10.3 Hasil yang Dapat Diamati dari Eksperimen Ekonomi

Sumber: Guala 2005: 41.

Apakah output eksperimental seperti yang dari Gambar 10.3 dapat saling preted sebagai fenomena
kepentingan ilmiah tergantung pada (pre-eksperimental) desain percobaan serta pada (post-percobaan)
Data analisis .

Pra-eksperimen, eksperimen harus dirancang untuk meminimalkan kemungkinan bahwa data diproduksi
oleh apa pun kecuali fenomena yang menarik. Ini adalah fakta sederhana kehidupan eksperimental bahwa
banyak hal bisa salah, sering kali dalam cara yang tak terduga. Untuk memulainya, kami lebih memilih data
sebagai hasil dari input subyek, dan bukan dari kode perangkat lunak yang tidak berfungsi atau terminal yang
sudah gila. Oleh karena itu adalah ide yang baik untuk menyelidiki peralatan untuk berfungsi dengan baik
sebelumnya. Kami juga lebih memilih data yang dihasilkan dari refleksi subjek eksperimental sendiri tentang
tugas, dan bukan dari satu orang yang menyalin jawaban orang lain, jadi kami menyaring subjek dari satu sama
lain. Lebih lanjut, keputusan subjek harus dihasilkan dari refleksinya pada tugas dan bukan dari kesalahan dan
peluang, jadi kami memberikan instruksi yang sangat jelas sebelum eksperimen dimulai, memungkinkan
waktu untuk berpikir
184 Metodologi

selama percobaan dan buat petunjuk di layar sebagai tidak ambigu mungkin. Dan seterusnya.

Bogen dan Woodward menyebut upaya ini sebagai "investigasi empiris peralatan" (misalnya, verifikasi
kode perangkat lunak, pengujian terminal) dan "kontrol pembaur yang mungkin" (misalnya, menekan
komunikasi antara subjek, memberikan instruksi yang jelas), masing-masing (Bogen dan Woodward
1988: bagian VI). Tujuannya sama: untuk memisahkan sinyal dari kebisingan, atau fenomena dari
artefak.

Bahkan eksperimen yang dirancang dengan sempurna tidak akan segera mengungkapkan fenomena minat ilmiah.
Seperti yang telah kita lihat, sebuah eksperimen, apakah dirancang dengan baik atau buruk, menghasilkan data,
bukan fenomena. Jadi, setelah percobaan, data yang dihasilkan harus dikumpulkan dan (secara statistik) dianalisis
untuk memungkinkan penarikan kesimpulan tentang fenomena yang menarik. Sebagai contoh, keputusan dari
subjek eksperimental individu biasanya bukan kepentingan ilmiah melainkan perilaku populasi subyek. Seringkali,
oleh karena itu, rata-rata atas populasi uji dihitung dan dilaporkan, daripada keputusan masing-masing subyek.
Selain itu, seringkali efek dari beberapa manipulasi adalah subjek dari penyelidikan, dan oleh karena itu perbedaan
antara hasil dalam satu set-up dan hasil di set-up lainnya adalah bunga. Tetapi karena adanya variasi kesempatan di
antara subjek, perbedaan antara hasil rata-rata dari dua populasi uji mungkin sistematis atau karena kebetulan, dan
uji statistik dapat digunakan untuk membedakan mana yang benar. Perbedaan "signifikan secara statistik" antara dua
perawatan biasanya diinterpretasikan sebagai sistematis, dan yang tidak signifikan adalah karena kebetulan.
Misalnya, perbedaan antara dua jadwal pada Gambar 10.2 adalah bahwa dalam PG Sesi 1 (jadwal bawah)
permainan dimainkan dengan pemain heteroge-neous (yaitu, kelompok terdiri dari beberapa subjek yang selalu
bebas naik dari kontribusi orang lain , beberapa yang selalu berkontribusi, beberapa yang berkontribusi ketika yang
lain lakukan dan sebagainya), sedangkan di PG Sesi 2 (jadwal atas) hanya jenis yang sama diizinkan untuk bermain
satu sama lain. Para penulis mengamati bahwa “dalam game PG kedua, tingkat kontribusi rata-rata jauh lebih tinggi
daripada yang pertama” (Guala dan Burlando 2002: 44; penekanan ditambahkan), dan berlanjut untuk
menyimpulkan bahwa model perwakilan-agen memiliki kegunaan terbatas dalam konteks ini karena mereka
"mungkin kurang memiliki kedalaman yang jelas dan akan gagal menangkap mekanisme penting yang menopang
kerjasama" (Guala dan Burlando 2005: 49). Heterogenitas agen sangat penting. Ada cerita yang menarik untuk
diceritakan tentang kecukupan menyimpulkan realitas efek dari signifikansi statistiknya tetapi sayangnya cerita ini
berada di luar lingkup buku ini.

Dalam literatur terbaru tentang percobaan ilmiah, terutama dalam ilmu sosial dan biomedis, para ahli metodologi
sering berbicara tentang validitas "internal" dan "eksternal" dari hasil eksperimen (misalnya, Guala 2005). Yang
pertama sangat terkait erat dengan gagasan fenomena tetapi terutama digunakan ketika fenomena bunga adalah
beberapa efek kausal. Misalkan kita tertarik, seperti Burlando dan Guala, apakah heterogenitas agen memiliki efek
sistematis pada tingkat kontribusi dalam permainan barang publik. Eksperimen
Eksperimen 185

hasil — katakanlah, perbedaan yang terukur (ukuran d , katakanlah) dalam kontribusi rata-rata antara
kelompok pemain heterogen dan homogen — kemudian dapat dikatakan "sah secara internal" jika (dan hanya
jika) dengan benar menunjukkan bahwa efek kausal (dari ukuran d ) heterogenitas agen pada tingkat kontribusi
ada dalam populasi eksperimental . (Validitas internal dari hasil eksperimen menyiratkan demikian adanya
fenomena.) Hasilnya dikatakan "eksternal berlaku" jika benar menunjukkan bahwa efek kausal ada di populasi
lain . Saya akan mengatakan lebih banyak tentang validitas eksternal di bagian tentang topik itu nanti di bab ini
dan di Bab 11 di bawah ini.

Pengujian Hipotesis Ekonomi

Fisikawan Prancis abad kesembilan belas Pierre Duhem berpendapat bahwa hipotesis teoritis tidak pernah diuji
secara individual tetapi hanya dengan latar belakang asumsi tambahan tentang rincian prosedur eksperimental
(Duhem 1991 [1914]). Ini tentu saja kasus dalam eksperimen ekonomi. Jika, misalnya, kami ingin menguji apakah
preferensi orang memang transitif (seperti teori pilihan rasional akan memilikinya), dan orang membalik pilihan
mereka antara dua tugas yang tampaknya setara dalam sebuah eksperimen, hasil eksperimen tidak secara otomatis
menyangkal teori hipotesa. Mungkin saja eksperimen itu cacat dalam berbagai cara, seperti yang baru saja kita lihat.
Tetapi bahkan jika kita dapat yakin bahwa beberapa hasil eksperimen adalah fenomena asli dan bukan artifak dari
prosedur pengalaman-mental tertentu, hasilnya biasanya tidak memerlukan kebenaran atau kepalsuan hipotesis
teoritis di tangan. Sebaliknya, pada umumnya, sebuah fenomena eksperimental memungkinkan lebih dari satu
interpretasi teoritis.

Kami sudah menemukan satu contoh di atas. Misalkan dalam beberapa jenis eksperimen, subjek sering
menilai salah satu dari sepasang opsi lebih tinggi tetapi kemudian memilih opsi lain. Hasil eksperimen
seperti itu tidak selalu mengindikasikan preferensi intransitif, dan bahkan lebih sedikit penjelasan spesifik
mengapa preferensi mungkin bersifat intransitif. Untuk mulai dengan, harus diasumsikan bahwa
preferensi stabil dari waktu ke waktu. Ini adalah asumsi yang sering dibuat tetapi ini bukan bagian dari
teori ekonomi seperti itu (lihat Bab 3). Ini adalah asumsi auxil-iary. Lebih lanjut harus diasumsikan
bahwa tidak ada perbedaan yang relevan antara penilaian dan pilihan tugas, asumsi yang terjadi menjadi
kontroversial.

Apakah perbedaan antara dua tugas keputusan relevan atau tidak adalah sulit untuk menentukan di luar
kerangka teoritis. Teori yang diharapkan-utilitas konvensional (EUT) biasanya dianggap menyiratkan bahwa
menyajikan masalah keputusan sebagai pilihan- atau sebagai penilaian-tugas seharusnya tidak membuat
perbedaan untuk pembuat keputusan rasional, dan sehingga pembalikan preferensi yang terungkap dalam
rangkaian tugas ini melanggar EUT. Slovic dan Lichtenstein 1983 menunjukkan bahwa pembalikan pref-
erence adalah hasil dari efek pemrosesan informasi, dan terjadi karena proses mental yang dibawa untuk
menanggung tugas penilaian berbeda dari yang dibawa untuk menanggung tugas-tugas pilihan.
186 Metodologi

Dengan demikian, satu penjelasan tentang fenomena pembalikan menyatakan bahwa orang memiliki (setidaknya)
dua set preferensi yang berbeda yang diaktifkan dalam situasi keputusan yang berbeda. Penjelasan lain menyatakan
bahwa ada yang salah dengan prosedur eksperimental. Banyak eksperimen preferensi-pembalikan menggunakan apa
yang disebut prosedur elicita-Becker-DeGroot – Marschak (BDM) di mana subjek diberi lotere yang dapat dijual
kembali ke eksperimen. Dapat ditunjukkan bahwa jika preferensi subyek memenuhi aksioma EUT mereka akan
menggunakan kepastian mereka setara sebagai harga jual minimum. Jika, sebaliknya, aksioma kemerdekaan tidak
berlaku, prosedur BDM tidak dapat dijamin untuk memperoleh kesetiaan yang benar (Karni dan Safra 1987). Di
bawah interpretasi ini, fenomena pembalikan konflik dengan EUT, tetapi dengan aksioma kemerdekaan dan tidak
dengan transitivitas.

Namun penjelasan lain ditawarkan oleh teori penyesalan. Penyesatan teori adalah teori pilihan di bawah ketidakpastian,
dikembangkan oleh Graham Loomes dan Robert Sugden, yang model pilihan sebagai meminimalkan fungsi vektor
penyesalan, didefinisikan sebagai perbedaan antara hasil yang dihasilkan oleh pilihan yang diberikan dan hasil terbaik
yang bisa telah dicapai dalam keadaan alamiah itu. Siklus preferensi adalah implikasi dari teori penyesalan (Loomes et al.
1991: 429-30).

Fenomena pembalikan preferensi karenanya konsisten dengan setidaknya tiga interpretasi teoritis. Ini
adalah fakta umum tentang pengujian hipotesis: karena hipotesis teoritis tidak pernah diuji secara
terpisah, dan selalu ada ketidakpastian tentang asumsi tambahan, konflik yang jelas antara fenomena
yang dibentuk secara eksperimental dan hipotesis teoritis dapat selalu ditafsirkan lebih dari satu cara -
sebagai sanggahan dari hipotesis yang dipertaruhkan, sebagai sanggahan dari klaim teoritis lain yang
dibuat dalam derivasi prediksi atau sebagai pelanggaran asumsi tentang pengaturan eksperimental.

Saya sebutkan di atas bahwa Loomes et al . 1991 mendesain eksperimen mereka dengan maksud untuk
mengesampingkan semua penjelasan alternatif. Dengan demikian, mereka percaya bahwa eksperimen
mereka tidak hanya menunjukkan bahwa pembalikan preferensi adalah fenomena asli, mereka juga
percaya bahwa hasil spesifik mereka tidak dapat dijelaskan oleh masalah dengan prosedur elisitasi atau
perpindahan subyek antara "preferensi penilaian" dan "preferensi pilihan." tidak bisa mendiskusikan di
sini apakah mereka benar. Tetapi yang jelas adalah bahwa hanya penjelasan alternatif yang diketahui
dapat dikesampingkan (bnd. Guala 2005). Kemungkinan bahwa ada alternatif, bahkan alternatif yang
lebih sukses secara empiris, selalu tetap ada.

Seseorang sering mendengar bahwa eksperimen (baik) membuktikan hasil mereka. Ada rasa di mana
pengetahuan populer ini benar. Bersyarat pada latar belakang yang diasumsikan dari alternatif teoritis, kadang-
kadang mungkin untuk merancang eksperimen yang mampu mengesampingkan semua kecuali satu kandidat.
Bentuk induksi ini disebut induksi demonstratif atau deduksi dari fenomena (Worrall 2000). Seberapa kuat metode
ini tergantung pada seberapa yakin kita dapat bahwa alternatif yang diketahui menguras ruang kemungkinan
alternatif. Dalam ilmu ekonomi, mungkin bijaksana untuk tidak terlalu optimis.
Eksperimen 187

Validitas Eksternal

Ketika tujuannya adalah untuk “berbisik ke telinga para pangeran,” apakah suatu fenomena yang didirikan
secara eksperimental dapat dijelaskan secara teoritis adalah kepentingan sekunder. Yang paling penting adalah
apakah pengetahuan pengalaman-pengalaman adalah jenis yang tepat untuk menanggung intervensi kebijakan.
Jika, seperti yang sering terjadi, fenomena yang dibentuk secara eksperimental adalah beberapa hubungan
kausal antara variabel X dan Y , dan pembuat kebijakan ingin mempengaruhi Y , pertanyaannya adalah apakah
apa yang dapat dipelajari dalam percobaan tentang hubungan antara X dan Y adalah panduan yang dapat
diandalkan untuk apa yang akan terjadi pada Y ketika X diintervensi. X mungkin merupakan variabel yang
nilainya adalah desain lelang yang berbeda dan pendapatan pemerintah Y. Ekonom eksperimental dapat
menguji desain lelang mana yang memaksimalkan pendapatan dalam kondisi laboratorium. Tetapi apakah
pengetahuan itu akan membawa ke lelang yang sebenarnya dilakukan oleh pemerintah?

Ada beberapa alasan untuk skeptisisme. Kami melihat di atas bahwa eksperimen harus dikontrol secara ketat agar
dapat menghasilkan hasil yang valid. Tetapi semakin banyak peneliti yang mengendalikan lingkungan, semakin
tidak alami dan semakin artifisial. Apakah orang cenderung berperilaku sama dalam kondisi laboratorium buatan
seperti yang akan terjadi jika kebijakan itu diterapkan — dalam kondisi apa pun yang berlaku saat itu? W. Allen
Wallis dan Milton Friedman berpendapat tidak. Mereka menulis, meskipun pada saat ketika ekonomi eksperimental
tidak dianggap ekonomi yang tepat (Wallis dan Friedman 1942: 179–80): “Sangat dipertanyakan apakah subjek
dalam situasi eksperimental yang begitu artifisial bisa tahu pilihan apa yang akan dia membuat dalam situasi
ekonomi; tidak tahu, hampir tidak dapat dihindari bahwa dia, dengan seluruh itikad baik, akan menyesuaikan
jawaban-jawabannya sedemikian rupa sehingga menghasilkan hasil yang masuk akal tetapi palsu. ”

Masalah menilai apakah suatu kesimpulan dari situasi eksperimental ke situasi lain (yang mungkin tetapi
tidak harus menjadi situasi kebijakan) yang telah terbentuk dengan baik telah dikenal sebagai "masalah
validitas eksternal" (Shadish et al . 2002; Guala 2005: ch. 7; Reiss 2008a: ch. 5; Steel 2008). Masalahnya
adalah, pada dasarnya, untuk memutuskan dalam kondisi apa hasil eksperimen dapat diproyeksikan ke dalam
situasi yang sejauh ini tidak teramati. Ini adalah masalah asli, karena situasi eksperimental berbeda dengan
sifatnya secara lebih kurang dramatis dari situasi-situasi yang pada akhirnya ingin kita pelajari. Salah satu
alasan untuk ini kami telah temui: kontrol eksperimental membuat situasi eksperimental buatan sampai batas
tertentu, dan perilaku orang mungkin berbeda antara laboratorium buatan ini dan lebih "alami" situasi
kebijakan. Ada alasan lain. Pada umumnya, percobaan dilakukan pada "model," yaitu, pada sistem substitusi
yang bertindak sebagai stand-in untuk sistem kepentingan akhir. Seperti disebutkan di atas, sebagian besar
eksperimen ekonomi menggunakan mahasiswa sebagai subjek. Tetapi beberapa ekonom tertarik khususnya
pada perilaku mahasiswa. Mahasiswa universitas murah, tersedia dan relatif dapat diandalkan. Mereka
digunakan dalam eksperimen ekonomi karena lebih mudah
188 Metodologi

melakukannya, bukan untuk alasan epistemik yang baik. Dan ada peluang baik bahwa perilaku mereka
berbeda dari perilaku orang lain, baik itu populasi pada populasi target besar atau spesifik seperti "manajer
perusahaan yang tertarik membeli lisensi untuk penggunaan spektrum elektromagnetik."

Situasi eksperimental dan target berbeda, kemudian. Tetapi apakah mereka berbeda dalam hal yang
relevan ? Apakah mereka berbeda dalam cara yang berpotensi membatalkan kesimpulan dari percobaan
ke target? Masalahnya adalah bahwa sebagian besar kita tidak dapat menjawab pertanyaan ini untuk
kasus-kasus tertentu di tangan. Yang kita ketahui adalah bahwa semua manusia sama dalam beberapa hal
tetapi berbeda dalam yang lain. Kita tidak harus melakukan eksperimen lebih lanjut untuk mencari tahu
apakah hubungan sebab-akibat "memegang kepala seseorang di bawah air selama lima menit
menyebabkan kematian mereka" terus berlanjut pada populasi manusia yang baru, hingga saat itu belum
teramati. Sebaliknya, perilaku orang-orang dalam eksperimen ekonomi tampaknya bervariasi dengan
faktor-faktor seperti tingkat insentif moneter, budaya dan norma sosial, pengalaman, distribusi informasi,
status sosial dan apa yang Anda miliki. Oleh karena itu sulit untuk memprediksi apakah hasil eksperimen
akan tetap berlaku ketika beberapa faktor ini berbeda antara eksperimen dan situasi target — seperti
halnya kasusnya.

Masalah validitas eksternal telah mendapat perhatian yang cukup besar dalam filsafat sains baru-baru ini,
sebagian karena ia ada di mana-mana dalam ilmu-ilmu khusus. Terutama dalam peneliti ilmu biologi dan biomedis
sering menghadapi masalah karena dalam ilmu-ilmu itu, juga, eksperimen biasanya dilakukan pada model. Fakta
bahwa beberapa zat telah terbukti beracun (aman) di beberapa spesies hewan, katakanlah, tidak ada alasan kuat
untuk percaya bahwa itu juga akan beracun (aman) bagi manusia. Salah satu masalah bagi peneliti yang mencoba
untuk menarik kesimpulan tentang manusia adalah bahwa toksisitas zat sering bervariasi antara spesies hewan yang
berbeda, dan tidak jelas spesies mana yang merupakan model terbaik untuk manusia (Shanks dan Yunani 2009).
Sejauh yang saya bisa lihat, upaya-upaya pada solusi yang dikembangkan oleh para filsuf ilmu pengetahuan dapat
diorganisasikan ke dalam empat kelompok: solusi berdasarkan mekanisme sebab-akibat, pada tendensi kausal, pada
teknik dan pada percobaan lapangan.

Validitas eksternal dengan mekanisme kausal . Seperti yang kita lihat di Bab 6, penyebab biasanya tidak
mempengaruhi efeknya di celah spatio-temporal. Sebaliknya, ketika beberapa C menyebabkan beberapa E ,
ada biasanya akan mekanisme yang memediasi pengaruh kausal dari C pada E . Teori mekanistik validitas
eksternal membuat asumsi yang masuk akal bahwa jika C menyebabkan E di eksperimental populasi P e
melalui seperangkat mekanisme M, dan M diketahui beroperasi juga di populasi target P t , maka salah satu
dapat menyimpulkan bahwa C menyebabkan E di P t . Masalah langsung dengan mode ini penalaran adalah
bahwa hal itu sepenuhnya tidak informatif, seperti yang kita ingin menyimpulkan-hubungan kausal antara C
dan E -follows segera dari apa yang kita harus mengasumsikan pada awal-mekanisme antara C dan E . Yaitu,
jika kita tahu mekanisme apa yang M beroperasi dalam populasi target, tidak perlu menjalankan eksperimen
pada populasi lain, karena hubungan sebab akibat sudah diketahui. Untuk mengubah penalaran mekanistik ini
menjadi lebih banyak
Eksperimen 189

strategi inferensial yang bermanfaat Daniel Steel membuat asumsi tambahan (Steel 2008). Asumsi
tambahan adalah bahwa hanya perbedaan hilir pada tahapan yang relevan dari mekanisme yang penting.
Anggaplah (ini adalah contoh Steel, lihat Steel 2008: 90) bahwa penyebab C menyebabkan efek E melalui
mekanisme CXYAZBE . X , Y dan Z menandakan poin di mana mekanisme cenderung berbeda sedangkan
A dan B cenderung serupa dalam model dan target. Kemudian, jika perbedaan hulu harus menghasilkan
perbedaan hilir, perlu untuk membandingkan hanya mekanisme di Z . Ini mengurangi jumlah informasi
tentang mekanisme dalam target yang diperlukan untuk penyimpulan. Jadi, bahkan jika mekanisme dalam
target tidak dipahami dengan baik, kesimpulan sukses dari eksperimental ke populasi target terkadang
dapat dibuat.

Ini bentuk penalaran mekanistik (disebut "proses komparatif pelacakan" oleh Steel) hanya bekerja ketika tiga
kondisi terpenuhi. Pertama, mekanisme yang bertanggung jawab untuk fenomena eksperimental harus dipahami
dengan baik. Bahwa kadang-kadang mungkin untuk menetapkan penjelasan untuk fenomena eksperimental telah
ditunjukkan di atas. Tetapi, boleh dibilang, untuk melakukannya dengan sukses sangat sulit, dan akibatnya ini
jarang terjadi. Indikasi kesulitan ini adalah kurangnya konsensus di antara para ekonom mengenai penjelasan
fenomena eksperimental. Pembalikan preferensi adalah contoh kasusnya. Sementara sebagian besar ekonom
tampaknya menerima fenomena tersebut, ada berbagai macam pendapat mengenai interpretasi yang benar (lihat
misalnya Cox 2008). Tentunya, jika mekanisme yang bertanggung jawab untuk fenomena bunga tidak dipahami
dengan baik, pengetahuan tentang mekanisme hampir tidak dapat digunakan untuk menilai validitas eksternal.
Kedua, sejauh "berbisik ke telinga para pangeran" adalah tujuan eksperimen, ekstrapolasi yang sukses dari
eksperimen ke situasi kebijakan mensyaratkan bahwa kebijakan tersebut tidak mempengaruhi mekanisme yang
berlaku dalam populasi di mana kebijakan tersebut diterapkan. Kebijakan itu kadang-kadang, atau mungkin sebagai
aturan, mengubah mekanisme yang bertanggung jawab untuk fenomena kepentingan telah dipahami dalam ekonomi
setidaknya karena kritik Lucas (Lucas 1976; Steel 2008: 154–60 membahas relevansi kritik Lucas untuk pelacakan
proses komparatif ). Ini adalah komplikasi untuk akun mekanistik validitas eksternal, tetapi tidak ada alasan untuk
percaya bahwa mereka setidaknya tidak dapat diatasi.

Validitas eksternal dengan kecenderungan kausal . Dalam Bab 5 kita melihat bahwa beberapa ekonom dan filsuf
menafsirkan klaim kausal seperti “ C menyebabkan E ” sebagai menyiratkan bahwa C cenderung membawa E ,
bahkan di hadapan faktor yang mengganggu pengoperasian C . Laporan Nancy Cartwright tentang validitas
eksternal dibangun di atas pemahaman sebab-akibat ini (misalnya, N. Cartwright 2009a, b). Ide dasarnya sederhana.
Untuk menegaskan bahwa faktor C memiliki kecenderungan untuk menghasilkan E adalah untuk menegaskan
bahwa hubungan kausal sampai batas tertentu tidak bergantung pada latar belakang kausal. Jadi jika kita belajar
bahwa C menyebabkan E dalam situasi X (pengalaman, katakanlah), dan kita memiliki alasan untuk percaya bahwa
C memiliki kecenderungan stabil untuk menghasilkan E , maka kita dapat menyimpulkan bahwa C juga akan
menyebabkan E dalam situasi Y ( situasi kebijakan, katakanlah). Untuk mengilustrasikan, jika beberapa desain
lelang tertentu menyebabkan pendapatan menjadi
190 Metodologi

menjadi maksimal dalam situasi eksperimental, maka ia akan tetap berusaha memaksimalkan pendapatan
dalam situasi kebijakan, yang dalam hal ini berarti akan mempengaruhi pendapatan secara positif.

Kecenderungan akun membantu dengan penilaian validitas eksternal hanya sejauh bahwa faktor memiliki
kecenderungan stabil untuk mempengaruhi hasil dan bahwa kita dapat belajar tentang kecenderungan ini. Saat
ini, keseimbangan bukti tampaknya menunjukkan bahwa sebagian besar faktor eksperimental ekonom
mempertimbangkan tidak memiliki kecenderungan stabil. Sebaliknya, faktor-faktor ini bertindak "holistik";
yaitu, apa faktor-faktor ini tergantung pada susunan yang rumit dari faktor-faktor lain di mana mereka
beroperasi. Contoh ketergantungan konteks seperti itu diberikan di atas. Tapi mungkin alasan kurangnya bukti
untuk faktor-faktor dengan kecenderungan yang stabil adalah bahwa para ekonom belum tampak cukup keras
(saya sarankan ini expla-nation di Reiss 2008b). Sayangnya, tidak ada metode off-the-shelf untuk menetapkan
tendensi (untuk diskusi, lihat Reiss 2008b; N. Cartwright 2009a). Sebagian besar metode inferensi kausal
menetapkan bahwa satu faktor menyebabkan yang lain dalam percobaan tetapi diam tentang sejauh mana
hasilnya tergantung pada spesifikasi percobaan. N. Cartwright 2009b menunjukkan bahwa kesimpulan dari "
C menyebabkan E " menjadi " C memiliki kecenderungan stabil untuk mempengaruhi E " kadang-kadang
dapat dilakukan atas dasar teori . Daftar John, seorang ekonom eksperimental yang tidak ada bandingannya,
membuat poin yang sama (Daftar 2007: 2): “Memang, teori adalah alat yang memungkinkan kita untuk
mengambil hasil dari satu lingkungan untuk memprediksi di lingkungan lain, dan generalisasi laboratorium
seharusnya tidak terkecuali. “Seperti yang telah kita lihat, bagaimanapun, teori adalah alat ekonomi
eksperimental hanya bergantung pada bahaya mereka sendiri.

Validitas eksternal dengan teknik . Proposal ini berusaha untuk menetapkan validitas eksternal bukan
dengan memodifikasi eksperimen atau kesimpulan dari hasil eksperimen tetapi dengan memodifikasi sistem
target tentang inferensi yang dibuat. Teori dapat diuji hanya di bawah kondisi yang dikontrol ketat, seperti
yang telah kita lihat, dan untuk kondisi kontrol yang ketat berarti membuat eksperimen kurang seperti situasi
kebijakan di mana hasil eksperimen seharusnya diterapkan. Tetapi jika eksperimen tidak bisa seperti situasi
kebijakan, mengapa tidak membuat situasi kebijakan seperti eksperimen? Jika gunung tidak akan datang ke
Muhammad, Muhamad harus pergi ke gunung, seperti yang mereka katakan. Francesco Guala berpendapat
bahwa strategi ini digunakan dalam lelang FCC, sebagian menjelaskan keberhasilan mereka (Guala 2005: ch.
8).

Masalah ilmiah utama dalam kasus lelang FCC adalah masalah desain mekanisme . Dalam Bab 6 kita
membahas pengertian mekanisme dalam beberapa detail, tetapi mekanisme desain literatur memiliki
pemahaman yang sama sekali berbeda dari istilah tersebut. Dalam desain mekanisme, cabang teori permainan
(kadang-kadang disebut "teori permainan terbalik"), "mekanisme" mengacu pada sistem aturan yang mengatur
perilaku agen dengan tujuan mencapai tujuan atau hasil tertentu. Oleh karena itu, tujuan perancangan
mekanisme tidak untuk menganalisis dan menjelaskan fenomena yang ada (seperti lembaga), melainkan untuk
menciptakan cetak biru bagi lembaga-lembaga baru dengan fitur-fitur tertentu yang diinginkan. Charles Plott
menjelaskannya sebagai berikut:
Eksperimen 191

Desain dimotivasi oleh mekanisme (model matematika, badan teori) yang mungkin benar-benar tidak
memiliki detail operasional. Tugasnya adalah menemukan sistem lembaga — aturan untuk ekspresi
individual, pengiriman informasi, dan pilihan sosial — sebuah “proses” yang mencerminkan fitur perilaku
mekanisme tersebut. Teori ini mengemukakan keberadaan proses-proses yang melakukan dengan cara-
cara tertentu (yang diinginkan), dan tugasnya adalah menemukannya. Ini adalah bentuk rekayasa
institusional yang murni.
(Plott 1981: 134)

Lelang FCC adalah institusi yang direkayasa. Kongres AS menugaskan FCC untuk merancang dan menguji bentuk
alternatif penawaran kompetitif, dan FCC meminta ahli teori ekonomi dan peneliti untuk membantu. Teori dapat
memberikan beberapa wawasan tentang desain lelang calon apa yang harus terlihat. Fenomena "pemenang
kutukan", misalnya, secara teoritis dipahami dengan cukup baik dan, yang penting, teori menawarkan strategi untuk
menghindarinya. Tapi pelelangan FCC yang diperlukan terlalu rumit untuk dimodelkan secara keseluruhan dengan
cara permainan-teoritis. Pada titik inilah para ekonom eksperimental datang, karena perilaku desain alternatif dapat
diuji dengan cara eksperimental. Yang penting, eksperimen dapat membantu tidak hanya untuk memahami
perbedaan antara desain dasar yang berbeda tetapi juga rincian implementasi mereka.

Berbekal pemahaman teoretis dan eksperimental tentang desain lelang ini, FCC tahu persis bagaimana mengatur
pelelangan lisensi spektrum yang sebenarnya sehingga hasil yang efisien akan dihasilkan. Lelang kemudian dipuji sebagai
sukses besar (Cramton 1997). Memang, lelang menghasilkan beberapa $ 23 miliar pendapatan pemerintah antara 1994
dan 1997.

Oleh karena itu, strategi rekayasa: bangun institusi Anda sedemikian rupa untuk meniru kondisi
eksperimental semaksimal mungkin. Jelas, desain mekanisme adalah kasus yang sangat khusus — seperti
yang ditunjukkan oleh nama alternatif " teori permainan terbalik ." Bukanlah kasus bahwa fenomena yang
ada dianalisis dan dijelaskan tetapi fenomena baru (atau lembaga) dibuat, mengikuti rekomendasi yang
diturunkan. dari teori dan eksperimen. Pendekatan ini bekerja, paling baik, hanya ketika yang terakhir dan
bukan yang pertama adalah tujuannya. Dan ada masalah lain. Dipandu oleh teori ekonomi, para ekonom
menginterpretasi ulang tujuan pelelangan sebagaimana ditetapkan oleh Kongres (lihat Reiss 2008a: ch. 5;
Nik-Khah 2005: bab 5). Teori ekonomi sering berguna ketika tujuannya adalah untuk meningkatkan
efisiensi atau untuk memaksimalkan keuntungan tetapi biasanya tidak ketika tujuannya berbeda.
Akhirnya, pendekatan itu hanya berfungsi sejauh sebuah lembaga yang secara dekat mencerminkan
eksperimen dapat dibuat. Ini tampaknya telah terjadi dalam lelang FCC, tetapi ini mungkin tidak dijamin.

Validitas eksternal dengan percobaan lapangan . Daftar John dan rekan penulisnya berpendapat bahwa
percobaan lapangan dapat membantu memastikan validitas eksternal hasil laboratorium (Harrison dan Daftar
2004; Levitt dan Daftar 2007; Daftar 2007). Buat daftar percobaan laboratorium dan lapangan yang berbeda
sebagai berikut:
192 Metodologi

Mirip dengan percobaan laboratorium, percobaan lapangan menggunakan randomisasi untuk mencapai
identifikasinya. Berbeda dari eksperimen laboratorium, bagaimanapun, percobaan lapangan terjadi di
lingkungan alam agen yang diamati dan tidak dapat dibedakan secara wajar dari tugas-tugas agen telah
memasuki pasar untuk menyelesaikan.
(Daftar 2007: 7; penekanan awal)

Harrison dan Daftar 2004 menawarkan klasifikasi berbagai jenis pengalaman lapangan. Untuk itu mereka
mengusulkan enam karakteristik yang ditujukan untuk mendeskripsikan semua jenis eksperimen: sifat dari
kumpulan subjek, sifat informasi yang subjek bawa ke tugas, sifat komoditi, sifat dari tugas atau perdagangan.
aturan diterapkan, sifat taruhannya dan lingkungan di mana subyek beroperasi. Sebuah "percobaan lapangan
artifactual" (AFE), kemudian, adalah salah satu yang sama seperti eksperimen laboratorium, kecuali bahwa
kelompok subjek lebih mewakili populasi sasaran yang diinginkan. Sebagaimana dibahas di atas, sebagian besar
eksperimen laboratorium menggunakan mahasiswa sebagai subjek. Namun perilaku mahasiswa mungkin bukan
indikator kuat dari apa yang dilakukan pelaku pasar. AFE menggunakan kumpulan subjek yang lebih "realistis,"
seperti pebisnis atau nelayan atau pembuat kebijakan. “Percobaan lapangan berbingkai” (FFE) juga dikontrol ketat
tetapi menggunakan konteks lapangan dalam komoditas, tugas, pasak atau kumpulan informasi dari subjek. Alih-
alih perdagangan "token" (unit mata uang yang mungkin atau mungkin tidak dikonversi menjadi uang nyata pada
kurs yang ditentukan sebelumnya setelah percobaan), katakanlah, barang nyata diperdagangkan dengan uang
sungguhan, taruhannya lebih tinggi, distribusi informasi lebih realistis. Sebuah "percobaan lapangan alami" (NFE),
akhirnya, menggerakkan lingkungan dari laboratorium ke lapangan. Artinya, subjek diamati di habitat alami mereka
daripada di laboratorium universitas. Satu-satunya perbedaan antara NFE dan situasi yang terjadi secara alami
adalah bahwa subjek diacak ke dalam kelompok perlakuan dan kelompok kontrol (biasanya tanpa disadari).

Daftar percaya bahwa eksperimen lapangan sehingga membangun "jembatan antara lab dan data yang terjadi
secara alami" (ini adalah judul Daftar 2007). Memang, ahli ekologi telah membuat pengamatan yang menarik
menggunakan percobaan lapangan. Inilah beberapa contoh. Yang disebut "efek endowmen," perbedaan (positif)
antara kesediaan seseorang untuk menerima (WTA) dan kesediaan mereka untuk membayar (WTP) untuk itu
setelah hak milik mereka untuk itu telah ditetapkan, (Kahneman et al . 1990) , adalah fenomena eksperimental yang
melanggar teori ekonomi neoklasik yang melintasi berbagai pengaturan laboratorium. Dalam serangkaian
percobaan lapangan, Daftar (2003, 2004) menunjukkan, sebaliknya, bahwa perilaku individu menyatu dengan
prediksi neoklasik sebagai pengalaman pasar meningkat. Contoh lain menyangkut apa yang disebut "preferensi
sosial," yaitu preferensi yang mengungkapkan altruisme, keadilan, timbal balik, ketidakadilan ketidaksetaraan, dan
semacamnya. Preferensi sosial, juga, telah diamati dalam konteks laboratorium yang tak terhitung jumlahnya
(meskipun hasilnya tidak selalu konsisten; lihat Woodward 2009). Daftar 2006 melakukan berbagai jenis percobaan
lapangan di mana pembeli memberikan penawaran harga kepada penjual, dan penjual kembali memilih tingkat
kualitas
Eksperimen 193

barang yang diberikan kepada pembeli. Barang-barang berkualitas tinggi lebih mahal untuk diproduksi tetapi
lebih berharga bagi pembeli. Sekarang, hasil eksperimen lapangan artefak dan dibingkai meniru percobaan
laboratorium: bukti untuk preferensi sosial dalam bentuk harga dan kualitas yang berkorelasi positif. Namun,
dalam eksperimen lapangan alam di mana subjek diamati di pasar tetapi tidak menyadari pengamatan, tidak
ada hubungan statistik yang kuat antara harga dan kualitas yang dapat ditemukan. Akhirnya, studi lain
(Carpenter dan Seki 2006) mencoba mereplikasi perilaku dalam eksperimen barang publik (lihat di atas)
dengan berbagai jenis anggota industri perikanan di satu komunitas Jepang tertentu. Apa yang telah ditemukan
adalah bahwa individu yang melihat lebih banyak persaingan di tempat kerja berkontribusi jauh lebih sedikit
terhadap barang publik, tergantung pada jenis pekerjaan mereka. Hasil seperti itu hampir tidak mungkin
muncul dari percobaan lapangan lab atau artifactual.

Metafora jembatan adalah metafora yang kuat, tetapi eksperimen lapangan adalah alat yang dapat diandalkan
untuk menilai validitas eksternal hanya sejauh bahwa pengaruh faktor yang bervariasi antara berbagai jenis
eksperimen pada hasil minat berperilaku secara teratur dan dapat diukur secara andal dalam eksperimen. , dan
bahwa hasil eksperimen bebas dari artefak untuk memulai. Mungkin ada, katakanlah, hubungan kuasi-linear dan
stabil antara pengalaman pasar dan kesenjangan WTA-WTP, atau antara daya saing dan kontribusi yang dirasakan
dengan barang publik, yang dapat digunakan untuk memprediksi kombinasi faktor-hasil yang sejauh ini tidak
teramati. Tetapi ini hanya akan berhasil jika hubungan ini memang stabil dan tidak bergantung pada latar belakang
yang tepat dari faktor-faktor lain. Faktor ekonomi yang khas itu tidak berperilaku baik tetapi agak berbeda dengan
latar belakang telah diperdebatkan di atas dalam konteks akun kecenderungan kausal. Selain itu, semakin dekat satu
ke pengaturan lapangan yang sebenarnya, semakin besar kemungkinan bahwa hasil eksperimen tidak valid oleh
pembaur yang mempengaruhi perlakuan dan kelompok kontrol secara berbeda, hanya karena pembaur tidak dapat
dikontrol pada tingkat yang sama seperti dalam eksperimen laboratorium.

Kesimpulan

Bab ini telah melihat eksperimen peran dapat bermain dalam membangun fenomena, menguji teori ekonomi
dan memberikan saran kebijakan. Eksperimen adalah alat investigasi ilmiah yang kuat karena memungkinkan
kontrol faktor latar belakang dengan cara yang membuat kesimpulan kausal sangat andal. Tapi keandalannya
datang dengan biaya peningkatan ketidakjelasan sehubungan dengan situasi para ekonom pada akhirnya
tertarik pada: pasar "alami" atau situasi kebijakan. Masalah menarik kesimpulan dari laboratorium ke situasi
kepentingan akhir sekarang diakui oleh para ekonom dan filsuf sains, yang telah mengembangkan sejumlah
solusi sebagai jawaban. Masing-masing solusi ini "berfungsi," tetapi hanya di bawah kondisi yang cenderung
membatasi. Percobaan dengan demikian merupakan tambahan yang berharga untuk toolbox meth-odological
ekonom, tetapi tentu saja bukan obat mujarab untuk semua masalah seputar inferensi kausal yang dapat
diandalkan.
194 Metodologi

Pertanyaan Studi

1 Bab ini membahas tiga eksperimen peran dalam ekonomi.

2 Kadang-kadang disarankan bahwa ada trade-off antara validitas internal dan eksternal dari

suatu eksperimen. Apa yang ada di balik klaim ini? Apa kamu setuju?

3 Apakah selalu ada penjelasan alternatif tentang fenomena, seperti yang dikemukakan oleh
masalah Duhem?

4 Bab ini membahas empat cara untuk menangani masalah validitas eksternal. Pendekatan mana
yang menurut Anda paling menjanjikan? Pertahankan jawaban Anda.

5 Apakah eksistensi ekonomi eksperimental mengubah ekonomi menjadi "ilmu eksperimental"?


Guala 2005 adalah sumber kanonik untuk karya filosofis pada ekonomi eksperimental. Lihatlah Santos 2010
untuk perspektif epistemologi sosial. Reiss 2008a: ch. 5 mengambil pandangan kritis pada kasus lelang FCC
dan eksperimen ekonomi secara umum. Bibliografi yang sangat lengkap tentang "filsafat ekonomi
eksperimental" dapat ditemukan di situs web Francesco Guala:
http://users.unimi.it/guala/MEE_Bibliography.htm.

Semua diskusi tentang ekonomi eksperimental ini mengikuti satu atau lain apa yang disebut filsafat eksperimental
ilmu pengetahuan, sebuah gerakan di dalam filsafat ilmu yang jauh dari fokus eksklusif pada teori yang mengagung-
agungkan filsafat sains sebelumnya dan menuju penekanan yang lebih besar pada sains. praktek. "Klasik" dalam
filsafat eksperimentalis sains adalah Peretasan 1983, Franklin 1986, Galison 1987, dan esai dalam Gooding et al .
1989.

Untuk survei rinci kerja dalam ekonomi eksperimental, lihat Kagel dan Roth 1997. Sebuah buku yang
lebih baru tentang metodologi eksperimental, yang ditulis oleh ekonom, adalah Bardsley et al . 2010.
Lelang FCC juga telah dibahas oleh Alexandrova 2006, Alexandrova dan Northcott 2009, Callon dan
Muniesa 2007, Guala 2001, Nik-Khah 2005, 2006 dan Mirowski dan Nik-Khah 2007.

Untuk pengenalan dasar untuk tes signifikansi dari perspektif filsuf, lihat Hacking 1999: ch. 18. Untuk
pembahasan kritis tentang sekolah statistik di mana tes signifikansi dibangun, lihat Royall 1997: bab 2–3.

Translate Ekonometrik, Measurment, Dan Experiments

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Translate Ekonometrik, Measurment, Dan Experiments

Diunggah oleh

Hak Cipta:

Format Tersedia

Anda mungkin juga menyukai