Anda di halaman 1dari 56

Machine Translated by Google

Bagian VII

Berorientasi Kuantitatif
Metode Kebijakan
Machine Translated by Google
Machine Translated by Google

23 Metode Kuantitatif
Analisis Kebijakan
Kaifeng Yang

PERKENALAN

Analisis kebijakan melibatkan penggunaan teknik kuantitatif dan/atau kualitatif untuk mendefinisikan masalah
kebijakan, menunjukkan dampaknya, dan menyajikan solusi potensial. Seringkali diperlukan metode yang canggih
untuk menilai bagaimana permasalahan kebijakan yang teridentifikasi dipengaruhi oleh berbagai variabel, termasuk
intervensi kebijakan dan faktor kontekstual. Metode kuantitatif membantu menunjukkan apakah ada hubungan antara
rancangan kebijakan dan hasil kebijakan, menguji apakah hubungan tersebut dapat digeneralisasikan ke situasi
serupa, mengevaluasi besaran dampak kebijakan terhadap faktor sosial, ekonomi, dan politik, dan menemukan
alternatif kebijakan yang lebih baik. Penggunaan metode-metode tersebut merupakan bagian dari keahlian ilmiah
yang dianggap relevan oleh para analis kebijakan. Teknik seperti pemodelan, kuantifikasi input dan output, statistik
deskriptif, inferensi statistik, riset operasi, analisis biaya-manfaat, dan analisis risiko-manfaat sering digunakan dalam
studi kebijakan.
Bab ini membahas penggunaan metode kuantitatif dalam analisis kebijakan. Hal ini bertujuan untuk memberikan
pemahaman umum tentang penggunaan metode kuantitatif dalam analisis kebijakan, dengan menggunakan contoh-
contoh dari literatur analisis kebijakan dan menghubungkan metode kuantitatif dengan perkembangan analisis
kebijakan sebagai sebuah profesi dan disiplin terapan. Bab ini memiliki dua bagian besar. Bagian pertama mengulas
secara singkat kemunculan dan evolusi metode kuantitatif dalam analisis kebijakan, membahas asal usul, perubahan,
penggunaan, dan pendidikannya. Bagian kedua memperkenalkan beberapa metode kuantitatif yang banyak
digunakan dalam analisis kebijakan.
Karena keterbatasan halaman, bab ini tidak membahas topik-topik dasar seperti pengambilan sampel, tingkat
pengukuran, reliabilitas, validitas, dan pengujian hipotesis, juga tidak membahas rincian prosedur statistik. Pembaca
yang tertarik dapat menemukan rinciannya di banyak buku teks metode penelitian. Bab ini juga tidak membahas
beberapa metode analisis kuantitatif yang penting, seperti analisis biaya-manfaat, penelitian survei, penelitian
evaluasi, metodologi Q, dan penilaian dampak lingkungan, karena hal-hal tersebut dibahas dalam bab-bab lain dalam
buku panduan ini. Untuk alasan yang sama, perdebatan antara perspektif positivis dan post-positivis tidak diuraikan
di sini.

SEJARAH METODE KUANTITATIF DALAM ANALISIS KEBIJAKAN

Kebutuhan akan analisis kebijakan kuantitatif mencerminkan keinginan pejabat terpilih untuk merancang kebijakan
yang lebih baik, memahami kinerja kebijakan, dan menilai dampak yang ditimbulkan oleh kebijakan. Penggunaan
metode kuantitatif dalam analisis kebijakan berakar pada Harold Lasswell (1951, 1970, 1971), yang membayangkan
disiplin ilmu kebijakan menyeluruh berdasarkan pengetahuan ilmu sosial dan metode untuk menganalisis pilihan
kebijakan dan pengambilan keputusan untuk demokratisasi masyarakat. .
Ilmu kebijakan, sebagai bidang yang bersifat multimetode, multidisiplin, dan berorientasi pada masalah, berkaitan
dengan pemetaan proses kebijakan, alternatif kebijakan, dan hasil kebijakan. Seperti disiplin ilmu sosial lainnya, ilmu
ini harus menggunakan metode analitik untuk memodelkan dinamika kebijakan dan memecahkan masalah kebijakan.

349
Machine Translated by Google

350 Buku Panduan Analisis Kebijakan Publik

ANALISIS KUANTITATIF SEBAGAI ANALISIS KEBIJAKAN : 1950-an–1960-an

Metode kuantitatif telah lama digunakan dalam pengambilan keputusan publik. Biro Penelitian Kota New York
pada tahun 1910-an mulai menggunakan metode ilmu sosial untuk mempelajari permasalahan perkotaan secara
sistematis. Pada tahun 1922, Biro Ekonomi Pertanian dibentuk di Departemen Pertanian AS untuk mengkaji
hubungan antara pertanian dan perekonomian dan untuk mengembangkan kebijakan ekonomi yang lebih baik.
Namun, penggunaan metode kuantitatif yang lebih canggih baru muncul pada Perang Dunia II. Kantor Penelitian
dan Pengembangan Ilmiah didirikan pada tahun 1941 untuk mengkoordinasikan kegiatan ilmiah selama Perang
Dunia II. Undang-Undang Ketenagakerjaan tahun 1946 membentuk Dewan Penasihat Ekonomi, yang merupakan
langkah pertama Kongres secara resmi mengakui bahwa lembaga eksekutif harus memanfaatkan pengetahuan
para ahli.
Mengenai metode kuantitatif yang digunakan, Perang Dunia II adalah titik balik yang merangsang teknik
analitik baru seperti analisis sistem dan riset operasi. Ilmuwan sosial mulai memainkan peran yang lebih penting
dalam pengambilan keputusan pemerintah dengan mengadopsi positivisme dan penalaran ekonomi normatif.
Model ekonomi mendominasi bidang ini. Misalnya, para ilmuwan dan insinyur di Inggris menciptakan riset
operasi pada Perang Dunia II untuk membantu mengalokasikan dan mengelola sumber daya militer secara
efektif. Teknik ini mulai digunakan secara luas di Amerika Serikat pada awal tahun 1950an. Hal ini juga disebut
sebagai ilmu manajemen, rekayasa sistem, dan analisis efektivitas biaya. Rand Corporation, yang didirikan
pada tahun 1948 untuk melakukan pekerjaan analisis kebijakan bagi pemerintah khususnya Departemen
Pertahanan, akhirnya mengembangkan teknik tersebut menjadi analisis sistem, sebuah alat yang digunakan di
militer sepanjang tahun 1950-an. Ini cukup berhasil dalam memecahkan masalah sederhana dan kompleks
seperti manajemen inventaris, penjadwalan produksi, penilaian keandalan peralatan, dan minimalisasi risiko
investasi (Brewer dan deLeon 1983).
Tahun 1960an menjadi “Zaman Keemasan” untuk analisis sistem dan analisis kebijakan. Pada masa ini,
analisis kebijakan pada dasarnya adalah analisis kuantitatif dan penekanan penelitiannya adalah pada
metodologi, bukan pada pokok bahasannya. Keahlian atau spesialisasi analisis kebijakan berada pada metode
dan teknik kuantitatif, bukan pada penerapannya pada bidang kebijakan tertentu. Seperti yang diamati oleh
Radin (2000), makalah dan konferensi profesional pada tahun 1960an terutama membahas prosedur analitik
kuantitatif seperti pemrograman linier, analisis Markov, pemrograman dinamis, teori permainan, pemodelan
stokastik, analisis Bayesian, kuasi-linearisasi, penyematan invarian, dan sistem umum. teori. Salah satu alasan
orientasi kuantitatif adalah karena sebagian besar analis kebijakan pada masa ini adalah pakar di bidang
ekonomi. Radin (2000) mengamati bahwa sebagian besar analis kebijakan pada saat itu, yang dilatih sebagai
ekonom atau peneliti operasi, memiliki gelar Ph.D. di bidang tersebut. Sebagian besar posisi analisis kebijakan
berada pada analisis ekonomi. Misalnya, Biro Ekonomi Pertanian merupakan pusat penelitian kebijakan
ekonomi. Dewan Penasihat Ekonomi adalah badan analisis kebijakan terkemuka lainnya. Selama ini, analisis
kebijakan dipengaruhi oleh perkembangan metodologi disiplin ilmu lain, seperti positivisme dalam ilmu sosial
secara umum, ekonometrika dalam ilmu ekonomi, dan revolusi perilaku dalam ilmu politik.

Dominasi metode kuantitatif dalam analisis kebijakan pada periode ini juga terlihat dalam praktiknya.
Secara garis besar, penggunaan Sistem Perencanaan, Pemrograman, dan Penganggaran (PPBS) merupakan
ciri analisis kebijakan pada tahap ini. Dipromosikan secara aktif oleh Menteri Pertahanan Presiden John
Kennedy, Robert McNamara, PPBS memiliki pendahulu dalam pekerjaan Rand Corporation.
McNamara mengundang Charles Hitch dari Rand untuk membentuk Unit Analisis Sistem yang bertanggung
jawab atas proses PPBS yang menghubungkan perencanaan dengan penganggaran. Unit penelitian juga
memperkenalkan beberapa metode kuantitatif lainnya kepada pemerintah federal seperti analisis biaya-manfaat,
penelitian operasi dan sistem, dan pemrograman linier. Presiden Johnson, pada tahun 1965, mewajibkan
semua lembaga federal untuk menyiapkan dokumen perencanaan dan makalah analisis masalah untuk
mendukung rekomendasi mereka kepada Biro Anggaran. PPBS terdiri dari tiga jenis laporan utama: (1)
memorandum program, membandingkan biaya dan efektivitas program-program alternatif utama dan menjelaskan tujuan lembaga
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 351

strategi; (2) kajian analitik khusus terhadap isu-isu terkini dan jangka panjang; (3) rencana program dan keuangan, yang
merangkum keluaran lembaga, biaya, dan kebutuhan pendanaan selama periode lima tahun. Pada tahun 1965, Biro
Anggaran mengeluarkan arahan kepada semua departemen dan lembaga federal, yang mengharuskan mereka
mendirikan kantor analitik pusat yang akan menerapkan PPBS. Pada tahun 1969, Undang-Undang Kebijakan Lingkungan
Hidup Nasional mengamanatkan analisis dampak dalam pembuatan kebijakan lingkungan.
Sejak awal, statistik telah menjadi persyaratan kurikuler. Program analisis kebijakan dianggap membantu siswa
membangun kesadaran kritis terhadap kegunaan umum informasi kuantitatif (Leinhardt 1981). Literatur kebijakan awal
memperkenalkan analisis sistem dan metode penelitian operasi, khususnya yang diterapkan di bidang pertahanan
(Hitch 1965; Quade 1966; Quade dan Boucher 1968). Materi seperti bagaimana menerapkan metode penelitian
operasional, ekonomi kesejahteraan, dan analisis biaya-manfaat merupakan topik umum dalam buku teks populer
mengenai metode kebijakan pada masa itu.

Dalam program urusan publik atau kebijakan, yang pertama kali ditetapkan pada akhir tahun 1960an, ekonomi
merupakan teori utama, ditambah dengan sejumlah teknik kuantitatif. Misalnya, di Fakultas Urusan Masyarakat
Universitas Minnesota, ilmu ekonomi merupakan inti dari kurikulum yang diwajibkan. Urutan inti analisis kebijakannya
meliputi analisis efektivitas biaya dan PPBS. Ia juga memiliki rangkaian metode kuantitatif yang mengajarkan logika
inferensi dan analisis regresi (Brandl 1976). Pada tahun 1968, Universitas Michigan mereorganisasi Institut Administrasi
Publik menjadi Institut Studi Kebijakan Publik. Program ini memiliki delapan mata kuliah inti untuk siswa tahun pertama.

Diantaranya, empat mata kuliah tersebut merupakan alat analisis seperti statistika, ekonomi mikro dan makro, analisis
manfaat biaya, dan analisis sistem. Kursus lainnya mencakup dua teori organisasi dan dua teori politik dan institusi.
Tujuannya adalah untuk membantu siswa menggabungkan alat-alat terbaru dalam pemecahan masalah dan analisis
kuantitatif dengan pemahaman mendalam tentang konteks sosial, politik, dan ekonomi (Walker 1976).

PENGGUNAAN METODE ANALISIS KEBIJAKAN KUANTITATIF : 1970-an – 1980-an

Penggunaan teknik kuantitatif seperti PPBS mendapat kritik sejak kemunculannya. Wildavsky (1969) menyerukan untuk
menyelamatkan analisis kebijakan dari PPBS, dengan alasan bahwa prasyarat keberhasilan penerapan PPBS biasanya
tidak ada di pemerintahan. Faktanya, tiga tahun setelah Presiden Johnson mengumumkan sistem PPB berskala
pemerintah, Presiden Nixon mengeluarkan sebuah memorandum yang menghapuskannya. Pada tahun 1970an,
banyak keterbatasan dari pendekatan positivis telah diakui. Secara umum, teknik-teknik kuantitatif tersebut gagal untuk
secara efektif menangani banyak masalah sosial yang kompleks karena masalah-masalah tersebut tidak dapat
direpresentasikan dengan model ilmiah yang rasional dan tidak memiliki satu tujuan tunggal. Riset operasi memberikan
beban berat pada ahli matematika dan analis kuantitatif untuk menghasilkan representasi matematis, sementara
mengabaikan data, konsep, dan metode kualitatif dan lunak (Brewer dan deLeon 1983). Analisis sistem, yang sangat
bergantung pada ilmu ekonomi dan pengukuran objektif serta proksi, tidak akan berfungsi dengan baik jika seluruh nilai,
kepentingan, dan perspektif kemanusiaan dipertimbangkan. Alat-alat lain seperti diagram alir dan pohon keputusan
ditemukan berguna ketika ada tujuan dan nilai yang disepakati. Namun pada kenyataannya, kebijakan cenderung
memiliki tujuan yang beragam dan saling bertentangan.

Namun demikian, pada tahun 1970an dan 1980an, metode kuantitatif yang berasal dari kerangka analisis sistem
masih banyak digunakan dan model ekonomi tetap dominan meskipun teknik lain juga diambil dari ilmu sosial positivis.
Radin (2000) menyimpulkan bahwa “meskipun terdapat perbedaan dalam praktiknya, kerangka ekonom, yang diambil
dari model pasar, terus mendominasi” (hal. 113). Analisis biaya-manfaat banyak digunakan untuk mengukur biaya dan
manfaat dari solusi kebijakan dan dengan demikian mengidentifikasi solusi yang memberikan manfaat bersih terbesar.
Misalnya, Kantor Analis Legislatif California melakukan studi biaya-manfaat untuk semua undang-undang sebelum
Machine Translated by Google

352 Buku Panduan Analisis Kebijakan Publik

legislatif pada tahun 1970an dan 1980an. Analisis biaya-manfaat diperlukan oleh pemerintah federal pada tahun
1970an dan 1980an agar semua usulan peraturan dikeluarkan oleh lembaga-lembaga, meskipun manfaat dari program
kesehatan, pendidikan, dan kesejahteraan beragam dan seringkali tidak berwujud. Perintah Eksekutif 12291 yang
ditandatangani oleh Presiden Reagan, memerlukan analisis biaya-manfaat yang terperinci untuk semua peraturan
federal yang baru untuk memastikan bahwa badan pengatur federal secara menyeluruh mempelajari dampak
peraturan yang diusulkan terhadap semua pihak terkait sebelum diundangkan. Perintah tersebut menetapkan bahwa
keputusan administratif harus didasarkan pada informasi yang memadai mengenai perlunya dan konsekuensi dari
tindakan pemerintah yang diusulkan, dan tujuan peraturan harus dipilih untuk memaksimalkan manfaat bersih bagi masyarakat.
Perkembangan metode kuantitatif dalam analisis kebijakan dipengaruhi oleh beberapa peristiwa sosial
bersejarah. Misalnya, Krisis Energi mendorong akademisi untuk menyusun model pasokan dan permintaan energi
berdasarkan matematika. Perang Melawan Kemiskinan menghasilkan serangkaian program kesejahteraan sosial
baru yang menghasilkan peluang besar untuk analisis kebijakan. Hasilnya, banyak jurnal profesional dan lembaga
penelitian kebijakan publik bermunculan. Sumber daya yang signifikan tersedia untuk studi evaluasi yang disponsori
oleh pemerintah federal. Pada tahun 1950-an dan 1960-an, analisis kebijakan pada dasarnya bersifat prospektif
karena berupaya menilai alternatif-alternatif kebijakan sebelum suatu program benar-benar dilaksanakan. Analisis
kebijakan retrospektif, yang mengevaluasi dampak program yang telah ditetapkan, digunakan pada tahun 1960an
namun baru menjadi praktik umum pada tahun 1970an.
Pada saat yang sama, kegagalan program dari beberapa inisiatif Great Society mendorong para analis kebijakan
untuk mengatasi permasalahan implementasi selama tahap perancangan kebijakan (Nakamura dan Smallwood 1980).
Analisis terhadap implementasi dan dampak program memerlukan penggunaan metode yang lebih canggih untuk
memasukkan variabel yang lebih kontekstual. Sementara pengukuran efisiensi dan studi lapangan ditekankan pada
tahun 1960an, studi eksperimental menjadi penting pada tahun 1970an, ketika eksperimen sosial seperti program
Pajak Penghasilan Negatif dan Head Start tersebar luas (Daniels dan Wirth 1983).

Secara umum, selama dua dekade, kapasitas analitik meningkat secara signifikan karena tuntutan yang lebih
besar terhadap analisis kebijakan, kemampuan komputasi yang lebih kuat, dan kemajuan dalam pemodelan ekonomi
seperti model simulasi mikro-analitik. Namun, meskipun analisis kebijakan menjadi lebih canggih, keterbatasannya
juga terungkap (Mei 1998). Perdebatan antara metode kualitatif dan kuantitatif, pendekatan positivis dan postpositivis
juga mengambil momentum. Teknik kuantitatif tidak lagi menjadi satu-satunya keterampilan yang dimiliki para analis
kebijakan, dan banyak orang menyadari bahwa keterampilan politik sama pentingnya dengan keterampilan teknis
(yaitu, Meltsner 1976).
Dengan dukungan dari yayasan swasta, pada akhir tahun 1970an, program pascasarjana kebijakan publik
didirikan di Harvard, Universitas California di Berkeley, Carnegie-Mellon, Rand Graduate Institute, Universitas
Michigan, Universitas Pennsylvania, Universitas Minnesota, dan Universitas Texas di Austin. Di Universitas Michigan,
program kebijakan memperkenalkan beberapa mata kuliah baru mengenai teknik analisis tingkat lanjut seperti
pemodelan dan peramalan, evaluasi kebijakan, dan riset operasi dengan penekanan pada teori keputusan statistik.
Kursus penyegaran matematika ditambahkan untuk mempersiapkan siswa menghadapi statistik tingkat lanjut (Walker
1976). Asosiasi Nasional Sekolah Urusan Publik dan Administrasi menetapkan analisis kebijakan sebagai salah satu
dari lima mata pelajaran dasar yang menyenangkan. Wildavsky (1976) menjelaskan prinsip-prinsip pendidikan
pascasarjana kebijakan publik berdasarkan pengalaman Berkeley pada tahun 1970an. Dia menekankan pentingnya
berbagai perspektif dan teknik analitik, dengan alasan bahwa tidak ada satu set operasi pun yang dapat diajarkan
sebagai inti dari analisis. Ia memandang analisis sebagai keterampilan perjalanan dalam menerapkan alat analitik
secara kreatif untuk memecahkan berbagai masalah kebijakan dalam jangka waktu singkat.

Engelbert (1977) meninjau pengalaman program pascasarjana kebijakan pada awal dan pertengahan tahun
1970an dan menunjukkan bahwa terdapat pokok bahasan inti yang dibangun di sekitar: (1) metodologi kuantitatif
termasuk pemrograman dan pemodelan matematika serta statistik deskriptif dan inferensial; (2) lingkungan politik dan
kelembagaan dalam perumusan dan implementasi kebijakan; (3) teori dan analisis ekonomi dengan penekanan pada
hubungan sektor publik-swasta dalam alokasi sumber daya; (4) strategi pengambilan keputusan dan implementasi
perilaku dan nonperilaku dan
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 353

proses; dan (5) pengelolaan, pengendalian, dan evaluasi program. Ada ketergantungan yang besar pada alat evaluasi
kuantitatif: “Pelatihan dalam metodologi kuantitatif tidak hanya ditekankan pada materi pelajaran teknik kuantitatif hingga
latihan pemecahan . . . namun siswa diharapkan menunjukkan kemahiran dalam penerapannya

masalah” (Engelbert 1977, 231). Pengajaran intensif diberikan pada teknik-teknik seperti riset operasi, pembuatan model,
analisis biaya-manfaat, dan pemrograman linier.

DEMOKRATISASI UNTUK ANALISIS KEBIJAKAN : 1990-an~

Pada tahun 1990an, analisis kuantitatif menjadi lebih umum dan lebih informatif, terutama karena perangkat lunak statistik,
seperti SPSS, SAS, dan STATA, memfasilitasi penggunaan metode kuantitatif untuk menangani model yang kompleks dan
kumpulan data yang sangat besar. Paket statistik tersebut dapat menghitung banyak statistik dan memungkinkan penggunanya
memanipulasi kumpulan data dan mengubah variabel. Saat ini, analisis kebijakan mempunyai jejak warisan positivis, yang
terlihat jelas dalam kurikulum sekolah kebijakan yang mewajibkan berbagai statistik sebagai mata kuliah inti. Kekuatan
warisan juga terlihat dalam jurnal-jurnal seperti Journal of Policy Analysis and Management (JPAM), Policy Studies Review
(PSR), Review of Policy Research (RPR), dan lain-lain. Jurnal-jurnal ini berisi kajian kebijakan dengan menggunakan berbagai
analisis statistik terhadap kebijakan tertentu. Hal ini juga terlihat dalam konferensi tahunan yang disponsori oleh Asosiasi
Kebijakan dan Manajemen Publik, yang dalam beberapa tahun terakhir didominasi oleh makalah yang menggunakan model
penelitian ekonomi positivis dan model penelitian lainnya (Durning 1999).

Sementara itu, terdapat perang metode antara penelitian kuantitatif dan kualitatif; menjadi antara validitas internal dan
eksternal; dan antara kontrol eksperimental dan statistik (Brewer 1983; Krane 2001). Perdebatan kuantitatif versus kualitatif
mencerminkan pertarungan yang lebih besar antara “positivis” dan “post-positivis.” Sejak tahun 1980an, pendekatan positivis
rasional terhadap analisis kebijakan telah dikritik karena berbagai alasan. Dasar metodologi kuantitatif adalah pemalsuan
empiris melalui pengujian hipotesis obyektif terhadap model yang dirumuskan secara ketat. Prinsip fundamental positivis
dalam analisis kebijakan adalah memisahkan fakta dan nilai, yang dengannya persoalan normatif diterjemahkan ke dalam
pertimbangan teknis. Dalam upaya mencapai hubungan yang dapat ditiru, kaum positivis menekankan desain penelitian
empiris, pemodelan kausal, pengambilan sampel ilmiah, dan kuantifikasi hasil. Namun, ketika mempelajari fenomena sosial,
kita tidak bisa mengisolasi diri dari objek penelitiannya, dan kita juga tidak bisa memisahkan fakta dari nilai-nilai.

Dalam kurikulum metodologi, positivisme membekali siswa dengan desain penelitian empiris dan metode statistik.
Banyak penulis yang mengkritik bahwa siswa yang dilatih dalam tradisi ini seringkali hanya mempunyai sedikit pelatihan
dalam memahami landasan normatif dan interpretatif dari alat yang telah mereka pelajari, serta lingkungan sosial di mana
teknik ini diterapkan (Fischer 1998). Oleh karena itu, post-positivisme diajukan sebagai alternatif, yang diperlakukan sebagai
perkawinan antara pengetahuan ilmiah dengan pengetahuan interpretatif dan filosofis tentang norma dan nilai. Dari segi
epistemologi, post-positivisme menggabungkan teori deliberatif dan partisipasi demokratis.

Ketegangan antara positivisme dan post-positivisme belum memudar. Di satu sisi, seseorang dapat berargumentasi
bahwa positivisme lemah dalam menghadapi permasalahan yang sulit diselesaikan atau jahat (Fischer 1995). Di sisi lain,
masih belum jelas apakah post-positivisme dapat menentukan tujuan bersama dan menawarkan serangkaian solusinya
sendiri, khususnya dalam aspek operasional penelitian kebijakan (deLeon 1998). Namun demikian, sejak tahun 1990an, lebih
banyak upaya telah dilakukan untuk mendemokratisasi desain dan proses analisis kebijakan. Desain partisipatif, keterlibatan
pemangku kepentingan, masukan warga, metode kualitatif, dan metodologi campuran, antara lain, telah berkontribusi pada
bidang yang memiliki basis teori dan metodologi multidisiplin (Krane 2001).

Saat ini, positivisme masih merupakan infrastruktur intelektual disiplin ilmu dan didukung oleh pelatihan, praktik, dan
spesialisasi para akademisi yang mengajarkan metode analisis kebijakan (Durning 1999). Morçöl (2001) menemukan bahwa
terdapat banyak dukungan terhadap positivisme
Machine Translated by Google

354 Buku Panduan Analisis Kebijakan Publik

di kalangan profesional kebijakan, terutama di kalangan praktisi dan profesional dengan latar belakang pendidikan
di bidang ekonomi, matematika, dan sains. Keterampilan analisis kebijakan pada tahun 1990an meliputi: metode
studi kasus, analisis biaya-manfaat, analisis etika, evaluasi, analisis masa depan, analisis sejarah, analisis
implementasi, wawancara, analisis hukum, ekonomi mikro, negosiasi dan mediasi, riset operasi, analisis
organisasi, politik analisis kelayakan, berbicara di depan umum, fasilitasi kelompok kecil, pengetahuan spesifik
program, statistik, metode penelitian survei, dan analisis sistem (Radin 2000).

Vijverberg (1997) merekomendasikan bahwa kurikulum metode kuantitatif harus mencakup: (1)
Mata kuliah 1: pengenalan teori probabilitas, uji hipotesis, distribusi statistik, uji selisih rata-rata, ANOVA, dan uji
rangking; (2) Mata kuliah 2: desain penelitian dan metode survei; (3) Mata kuliah 3: pengenalan analisis regresi;
(4) Kursus 4: kelanjutan analisis regresi termasuk estimasi kemungkinan maksimum, logit/probit, tobit, persamaan
simultan, analisis faktor, dan model LISREL; (5) Kursus 5: topik lanjutan dalam metode penelitian, termasuk Box-
Jenkins (ARIMA), akar unit dan kointgrasi, pengenalan statistik nonparametrik, dan model selektivitas sampel.

Selain itu, analisis ekonomi dan riset operasional secara tradisional penting untuk analisis kebijakan kuantitatif,
jadi kami menambahkannya sebagai kategori kursus lainnya. Hal ini dapat digambarkan sebagai topik lanjutan
dalam analisis ekonomi dan riset operasional, yang mencakup makroekonomi, mikroekonomi, analisis biaya-
manfaat, ekonometrik, riset operasi, dan ekonomi terapan.
Ambil contoh program Magister Kebijakan Publik di Harris School of Public Policy, University of Chicago,
siswa harus menyelesaikan mata kuliah wajib dan pilihan termasuk Pendahuluan Matematika, Metode Statistik
untuk Penelitian Kebijakan I, Metodologi Penelitian Survei, Desain Kuesioner Survei, Statistik Metode Penelitian
Kebijakan II, Analisis Regresi Terapan dan beberapa mata kuliah analisis ekonomi. Siswa menggunakan program
komputer untuk menerapkan teknik ini pada situasi nyata (misalnya, pengaruh pajak penjualan, diskriminasi pasar
tenaga kerja, dan program redistributif).
Kurikulum dan silabus juga menunjukkan bahwa analisis ekonomi mendominasi pengajaran analisis kebijakan.

METODE STATISTIK KUANTITATIF


Statistika adalah teori dan prosedur analisis data kuantitatif yang diperoleh dari sampel observasi untuk
mempelajari dan membandingkan sumber varians fenomena, untuk membantu mengambil keputusan untuk
menerima atau menolak hubungan yang dihipotesiskan. Statistik deskriptif memungkinkan analis kebijakan
merangkum data maritim secara efektif dan bermakna. Statistik inferensial adalah penggunaan teknik kuantitatif
untuk menggeneralisasi dari sampel ke populasi. Untuk memilih teknik yang tepat, analis kebijakan harus
mempertimbangkan tujuan penelitian, ukuran sampel, sebaran data, jumlah variabel terikat dan bebas, dan jenis
skala pengukuran yang digunakan oleh variabel tersebut.
Seseorang dapat merujuk ke buku statistik lain untuk informasi lebih rinci (misalnya Hair et al. 1998).

ANALISIS UNIVARIAT DAN BIVARIAT

Statistik univaraite atau deskriptif merangkum suatu kumpulan data mentah sehingga data tersebut dapat lebih
mudah dipahami. Sebelum statistik deskriptif dihitung, analis kebijakan terkadang menggunakan grafik dan tabel
untuk memetakan data dan mendapatkan gambaran umum tentang data tersebut. Misalnya, poligon frekuensi
menampilkan tren, Ogive (poligon frekuensi kumulatif) menunjukkan persentase kasus yang mengikuti di bawah
atau di atas standar, dan keduanya dapat digunakan untuk membandingkan sampel yang berbeda. Histogram
dan diagram batang membantu menunjukkan perbedaan antar subkelompok. Persentase dapat dihitung untuk
menunjukkan proporsi, seperti persentase penerima kesejahteraan yang puas terhadap layanan tersebut. Proporsi
tersebut terkadang sulit untuk ditafsirkan—misalnya terlalu tinggi atau terlalu rendah—dalam kebijakan
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 355

analis tidak akrab dengan konteksnya. Tingkat ketidakpuasan sebesar 5 persen dapat diartikan sebagai tanda
yang mengkhawatirkan atau sebagai bukti kualitas.
Ukuran tendensi sentral menunjukkan nilai khas dari data. Mean adalah rata-rata aritmatika dan dipengaruhi
oleh nilai ekstrim. Jadi tidak berguna untuk distribusi yang tidak seimbang seperti pendapatan. Median adalah
observasi tengah dalam kumpulan data yang diurutkan berdasarkan peringkat dan tidak sensitif terhadap nilai
observasi, namun sensitif terhadap ukuran sampel. Modusnya adalah nilai yang paling sering muncul, tidak
sensitif terhadap nilai dan ukuran sampel. Peneliti harus mencari tahu apakah munculnya dua atau lebih mode
disebabkan oleh percampuran subkelompok yang berbeda (misalnya bobot siswa kelas tiga dan orang tuanya)
dalam satu kumpulan data. Nilai relatif dari mean, median dan mode memberikan informasi kepada analis
kebijakan tentang bentuk distribusi. Pilihan ukuran yang tepat tidak hanya bergantung pada distribusinya, namun
juga tingkat pengukuran dan tujuan analis. Yang juga penting adalah ukuran penyebaran, yang terkadang
menunjukkan keandalan, konsistensi, dan keamanan. Misalnya, pengambil keputusan mungkin tertarik pada
departemen kepolisian mana yang memiliki rata-rata waktu tanggap darurat yang lebih pendek, namun mereka
juga harus tertarik pada seberapa konsisten departemen tersebut. Analis harus menggunakan beberapa statistik
deskriptif untuk merangkum berbagai aspek data mereka untuk menghasilkan gambaran yang lebih jelas. Deviasi
standar adalah ukuran yang paling umum digunakan, meskipun tidak berguna untuk distribusi yang miring. Ukuran
lainnya, rentang antar-kuartil (jarak antara kuartil atas dan bawah), sulit dihitung secara matematis namun
berguna untuk distribusi yang miring.
Analisis bivariat menguji apakah dan bagaimana suatu variabel berhubungan secara statistik dengan
variabel lain. Hal ini membantu menunjukkan keberadaan, signifikansi statistik, arah, dan kekuatan hubungan.
Prosedurnya tergantung pada tingkat pengukuran variabel independen dan dependen. Jika variabel independen
dan dependen bersifat kategoris (nominal atau ordinal), analisis tabel kontingensi (tabulasi silang) umumnya
digunakan. Jika variabel bebasnya bersifat kategoris dan variabel terikatnya adalah interval atau rasio, maka uji
beda rata-rata (uji t) atau analisis varians (ANOVA) lebih disukai. Apabila kedua variabel tersebut interval atau
rasio maka dilakukan korelasi atau regresi.

Dalam analisis tabel kontingensi, pertama-tama analis memisahkan observasi ke dalam kelompok-kelompok
berdasarkan nilai variabel independennya, kemudian menghitung persentase dalam kategori independen, dan
terakhir membandingkan persentase di salah satu kategori dependen. Perbedaan persentase memberitahu analis
apakah variabel independen membuat perbedaan (Meier dan Brudney 2002). Uji chi-square (ÿ2 ) kemudian
digunakan untuk menilai signifikansi statistik dari hubungan tersebut—apakah kita dapat menolak hipotesis nol
yang mengasumsikan tidak ada hubungan antara dua variabel dalam populasi berdasarkan observasi sampel
kita. Uji chi-square menunjukkan kemungkinan hasilnya dapat digeneralisasikan ke populasi. Namun, chi-kuadrat
bukanlah ukuran kepentingan atau kekuatan substantif karena hasil chi-kuadrat dipengaruhi oleh ukuran sampel:
jika ukuran sampel N besar (katakanlah, lebih besar dari 1.500), ÿ2 biasanya akan besar meskipun asosiasinya
lemah. Pentingnya atau kekuatan hubungan lebih baik diukur, terutama ketika berhadapan dengan sampel besar,
dengan ukuran hubungan yang berkisar antara +1,0 (hubungan positif sempurna) dan –1,0 (hubungan negatif
sempurna). Jika kedua variabel bersifat ordinal, ukuran asosiasi yang paling sering digunakan adalah tau-b
Kendall (untuk tabel persegi), tau-c Kendall (untuk tabel non-persegi), d Somer, dan gamma Goodman dan
Kruskal. Secara umum, pengukuran tau lebih umum digunakan dibandingkan pengukuran Somer's d. Banyak
analis sering menggunakan gamma dan tau-b atau tau-c. Jika salah satu atau kedua variabel adalah nominal,
lambda Goodman dan Kruskal harus digunakan.

Uji selisih rata-rata dan analisis varians memiliki logika yang serupa. Analis pertama-tama membagi
observasi ke dalam kategori berdasarkan nilai variabel independen. Suatu hubungan terjalin jika nilai-nilai variabel
terikat sangat berbeda antar kelompok dan memiliki varian dalam kelompok yang lebih kecil dibandingkan
sebelumnya (Johnson dan Reynolds 2005). Untuk menentukan signifikansi statistik, uji selisih rata-rata
menggunakan uji t dan membandingkan hasilnya dengan kriteria yang sesuai (nilai t yang besar menyebabkan
penolakan hipotesis nol). Analisis varians menggunakan statistik F untuk mengukur signifikansi statistik. F adalah
rasio mean square antar kelompok
Machine Translated by Google

356 Buku Panduan Analisis Kebijakan Publik

kuadrat rata-rata dalam kelompok. Rasio F dibandingkan dengan tabel rasio F untuk memutuskan apakah hipotesis nol
ditolak.
Regresi linier, atau regresi kuadrat terkecil biasa, bertujuan untuk menemukan fungsi garis terbaik untuk
menggambarkan hubungan yang dapat meminimalkan kesalahan kuadrat. Bentuk umumnya adalah Y = a + bX + e, dengan
a adalah titik potong, b adalah kemiringan, dan e adalah suku kesalahan. Rumus b, koefisien regresinya adalah

ÿ(Xi – Xÿ) (Yi – Yÿ)


2
ÿ (xi – x¯) .
Koefisien menunjukkan seberapa besar perkiraan perubahan nilai rata-rata Y jika X diubah satu satuan. Goodness of fit
dapat diukur dengan kesalahan standar estimasi, yang menunjukkan jumlah kesalahan yang dibuat ketika memprediksi nilai
Y untuk nilai X. Kebaikan umum lainnya dari ukuran kesesuaian adalah koefisien determinasi (r2 ) yang berkisar dari nol
(kekurangan sama sekali) hingga satu (kesesuaian sempurna). Koefisien determinasi adalah rasio variasi yang dijelaskan
terhadap total variasi Y, atau rasio pengurangan error dengan menggunakan garis regresi terhadap total error dengan
menebak mean.

ANALISIS VARIAN (ANOVA)

ANOVA adalah teknik ketergantungan yang menjelaskan variasi suatu variabel terikat metrik berdasarkan sekumpulan
variabel bebas nonmetrik (kategoris). Bentuk umumnya adalah:
Y1 = X1 + X2 + X3 + (metrik) . . . + Xn
(nonmetrik)
ANOVA membantu menentukan apakah sampel dari dua kelompok atau lebih berasal dari populasi dengan rata-rata
yang sama. Ini adalah alat utama untuk menganalisis data eksperimen. ANOVA menguji varians dalam kelompok (MSW)
dan varians antar kelompok (MSB). Rasio MSB terhadap MSW, yang merupakan statistik F , mengukur seberapa besar
varians yang disebabkan oleh perlakuan yang berbeda versus kesalahan pengambilan sampel acak. Nilai statistik F yang
besar menyebabkan penolakan hipotesis nol karena tidak ada efek pengobatan. Pertimbangkan studi tentang pelatihan
kerja dan penempatan kerja. Analis kebijakan ingin membandingkan pengaruh dua program, Pelatihan Sekolah dan
Pelatihan Kerja (OJT), terhadap penempatan kerja dalam kaitannya dengan gaji. Peserta secara acak ditugaskan ke salah
satu dari dua program.
ANOVA digunakan untuk menguji perbedaan antara kedua kelompok. Variabel bebas disini adalah jenis program pelatihan
kerja dan variabel terikatnya adalah penghasilan bulanan peserta. ANOVA banyak digunakan dalam studi kebijakan.
Misalnya, Wells, Layne, dan Allen (1991) menggunakan ANOVA untuk menilai apakah gaya belajar berbeda untuk manajer
pengawas, menengah, menengah atas, atas, dan eksekutif di Departemen Pemasyarakatan Georgia.

Untuk menggunakan ANOVA, data harus memenuhi asumsi linearitas, normalitas (variabel terikat terdistribusi normal),
dan equal variance (varians sama untuk semua kelompok perlakuan).
Namun, uji F di ANOVA kuat dalam asumsi ini kecuali dalam kasus ekstrim. Asumsi equal variance seringkali diabaikan jika
jumlah kasus pada masing-masing kelompok sama. Analis didorong untuk memeriksa data terlebih dahulu untuk menilai
keberadaan hubungan nonlinier dan outlier.

ANALISIS REGRESI GANDA

Analisis regresi berganda menguji hubungan antara satu variabel dependen metrik (kriteria) dan sekumpulan variabel
independen metrik (prediktor). Bentuk umumnya adalah:
Y ... + ÿn Xn + ÿ
= ÿ + ÿ1 X1 + ÿ2 X2 + ÿ3 X3 +
(metrik) (metrik)
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 357

ÿ adalah konstanta regresi yang mewakili nilai Y ketika semua variabel independen bernilai nol. ÿ merupakan koefisien
regresi yang menunjukkan hubungan antara X dan Y terkontrol untuk seluruh variabel independen lainnya. ÿ adalah istilah
kesalahan yang menggabungkan efek kumulatif pada Y dari faktor-faktor yang tidak termasuk dalam model. Regresi dapat
digunakan untuk menghitung nilai prediksi Y untuk setiap nilai X tertentu. Dan residu atau jarak antara nilai prediksi dan nilai
Y yang diamati akan menghasilkan ukuran (R2 ) mengenai seberapa cocok persamaan tersebut dengan data.

Analisis regresi adalah teknik ketergantungan yang paling banyak digunakan dan serbaguna dalam analisis kebijakan
untuk tujuan prediksi atau penjelasan. Misalnya, analisis regresi adalah landasan model peramalan yang memprediksi
perekonomian nasional atau kinerja lainnya berdasarkan masukan tertentu.
Hal ini digunakan untuk memeriksa bagaimana keputusan dibuat dan bagaimana sikap dibentuk. Hal ini juga digunakan
untuk mengidentifikasi faktor-faktor penentu kualitas implementasi kebijakan dan desain program. Hunter (2001)
menggunakan regresi berganda untuk menjelaskan perbedaan pertumbuhan ekonomi negara bagian dengan melobi upaya
dalam kategori tertentu dan sampel kebijakan ekonomi sisi permintaan, mengendalikan pertumbuhan bisnis bersih,
pengeluaran, dan kendali republik terhadap pemerintah dan badan legislatif. Pertumbuhan ekonomi diukur dengan perubahan
produk negara bruto (GSP) per kapita suatu negara antara tahun 1986 dan 1991.
Hasil regresi menunjukkan bahwa dua kategori upaya lobi menjelaskan lebih banyak perbedaan dalam GSP dibandingkan
kebijakan sisi permintaan dan variabel lainnya. Dengan regresi berganda, penulis mampu menunjukkan bahwa variabel
kontrol memberikan kontribusi terhadap 9 persen variasi perubahan GSP sedangkan variabel dependen memberikan
kontribusi tambahan variasi sebesar 34 persen.
Langkah yang sangat penting namun sering diabaikan adalah menilai apakah model memenuhi asumsi analisis
regresi, seperti keberadaan, linearitas, homoskedastisitas (varians residu yang sama), independensi residu, dan normalitas.
Metode diagnostik utama adalah dengan menguji residu—perbedaan antara nilai variabel terikat sebenarnya dan nilai
prediksinya—melalui plot regresi parsial dan uji statistik (yaitu, uji Kolmogorov-Smirnov dan uji normalitas Shapiro-Wilks; uji
Durbin- Tes Watson untuk independensi). Dalam analisis grafis, pola berbentuk segitiga atau berlian menunjukkan adanya
heteroskedastisitas, yang juga dapat dinilai dengan uji Levene di SPSS. Yang juga penting adalah menghindari
multikolinearitas, yang secara substansial dapat mempengaruhi penjelasan dan estimasi koefisien regresi dan uji
signifikansinya. Analis dapat menggunakan matriks korelasi untuk variabel independen guna mengamati apakah terdapat
korelasi yang tinggi (0,90 ke atas). Ukuran yang lebih umum adalah nilai toleransi dan faktor inflasi varians (VIF, nilai
pemotongan aturan praktis pada 10,0), yang mengukur sejauh mana setiap variabel independen dijelaskan oleh variabel
independen lainnya. Analis dapat menggunakan beberapa strategi perbaikan untuk memecahkan masalah di atas, dan
transformasi data (yaitu, dari Y ke log Y atau Y2 ) adalah salah satu opsinya. Pada langkah terakhir, analis juga perlu
mengidentifikasi outlier dan menentukan apakah outlier tersebut harus dikeluarkan dari analisis. Indikator umum untuk tujuan
ini adalah leverage h dan jarak Cook, yang mengukur sejauh mana koefisien regresi berubah ketika observasi tertentu
dihapus.

ANALISIS SERI WAKTU

Analisis deret waktu mengidentifikasi pola perubahan sepanjang waktu untuk menjelaskan fenomena dan memprediksi masa
depan berdasarkan pola historis dan pola yang ada. Hal ini memungkinkan analis kebijakan untuk memeriksa suatu
variabel, seperti tingkat pengangguran dan pertumbuhan ekonomi, dalam interval waktu yang sama seperti bulan dan tahun.
Bentuk umumnya adalah
Xt = a1 Xt-1 + a2 Xt-2 . . . + sebuah Xt-n
+ Analisis deret waktu penting dalam analisis kebijakan karena perubahan kebijakan merupakan pertanyaan krusial
dan analisis deret waktu memungkinkan peramalan berbasis data. Banyak studi kebijakan bersifat cross-sectional, dan
hasilnya dapat diperkuat dengan mereplikasi studi tersebut pada waktu yang berbeda. Selain itu, analisis rangkaian
waktu dapat menjawab pertanyaan sebab-akibat yang tidak mungkin ditangani dengan pendekatan cross-sectional
Machine Translated by Google

358 Buku Panduan Analisis Kebijakan Publik

analisis, mengingat bahwa urutan perubahan sementara dapat ditetapkan dengan rangkaian waktu. Misalnya, untuk
menjawab pertanyaan apakah kejadian kejahatan di suatu wilayah berubah setelah ditetapkannya program
pemberantasan kejahatan yang baru, eksperimen rangkaian waktu yang terputus adalah strategi yang tepat. Untuk
memprediksi pola dari waktu ke waktu berdasarkan jajak pendapat Gallup mengenai popularitas presiden, regresi time-
series adalah strategi yang tepat.
Secara umum, analisis deret waktu dapat memiliki tiga tujuan: analisis tren dan perkiraan; analisis sebab akibat;
dan analisis program dan kebijakan (Burbridge 1999). Khususnya, rangkaian waktu terputus berguna karena penerapan
suatu program atau kebijakan akan menghasilkan jeda dalam tren rangkaian waktu untuk variabel-variabel tertentu
yang dipengaruhi oleh program atau kebijakan tersebut. Analis perlu memiliki data pra-program yang cukup untuk
menentukan tren pra-program, mengetahui waktu yang tepat untuk penerapan program, dan asumsi yang masuk akal
tentang berapa lama waktu yang dibutuhkan program untuk mempengaruhi tren jangka panjang (Burbridge 1999) .

Ada enam langkah dasar dalam analisis deret waktu. Pertama, plot datanya. Kedua, periksa plotnya dan tentukan
apakah ada fluktuasi jangka pendek. Ketiga, jika data menunjukkan tren siklis, tentukan panjang tren jangka pendek dan
saring tren tersebut. Keempat, tentukan apakah suatu hubungan ada. Kelima, gunakan regresi linier untuk
memperkirakan hubungan antara waktu dan variabel yang dianalisis. Keenam, membuat ramalan dengan menggunakan
persamaan regresi (Meier dan Brudney 2002).
Misalnya, dalam penelitian mengenai desain kebijakan, insentif birokrasi, dan penegakan kebijakan, Keizer dan
Meier (1996) berhipotesis bahwa lingkungan implementasi di tingkat lokal dan sumber daya yang berkomitmen untuk
implementasi mempengaruhi tingkat penegakan kebijakan yang sebenarnya. Dengan menggunakan kumpulan data
runtun waktu dari undang-undang federal tentang penegakan tunjangan anak dari tahun 1983 hingga 1991, mereka
dapat mengkonfirmasi hipotesis tersebut. Albritton (1979) mengukur dampak amandemen Judul XX terhadap Undang-
Undang Jaminan Sosial dengan analisis rangkaian waktu yang terputus. Model Auto-Regressive Integrated Moving
Averages (ARIMA) diadopsi dan hasilnya menunjukkan bahwa inovasi kebijakan menghasilkan perubahan yang dramatis
dan tidak bertahap. Morgan dan Pelissero (1980) menggunakan eksperimen semu rangkaian waktu yang terputus untuk
menguji hipotesis bahwa kota-kota yang direformasi mengenakan pajak dan belanja lebih sedikit dibandingkan kota-kota
yang tidak direformasi. Sebelas kota, dengan jumlah penduduk 25.000 atau lebih, yang melakukan reformasi struktur
politik antara tahun 1948 dan 1973, dibandingkan dengan sebelas kota serupa yang tidak melakukan reformasi. Hasil
penelitian menunjukkan bahwa struktur pemerintahan tidak mempengaruhi perilaku fiskal kota.

ANALISIS SEJARAH PERISTIWA (EHA)

Analisis riwayat peristiwa digunakan untuk menjelaskan mengapa unit analisis tertentu (individu, organisasi, atau negara
bagian, dll.) lebih mungkin mengalami peristiwa yang menarik dibandingkan unit analisis lainnya. Ini adalah subbidang
khusus analisis deret waktu yang menganalisis peristiwa langka (deret waktu di mana sebagian besar datanya bukan
peristiwa). Data di EHA mengukur jumlah, waktu, dan urutan perubahan dalam variabel yang diteliti. EHA dapat menjadi
suatu bentuk studi panel yang periode observasinya tidak diberi jarak sembarangan, melainkan dilakukan pengukuran
pada setiap tahap rangkaian peristiwa. Variabel terikatnya bersifat kualitatif dan bernilai antara nol dan satu, tetapi
variabel bebasnya dapat bernilai bilangan real apa pun.

Konsep utama EHA mencakup kumpulan risiko (seperangkat unit analisis yang belum mengalami peristiwa
tertentu), fungsi penyintas (penurunan ukuran risiko dari waktu ke waktu), dan tingkat bahaya (tingkat di mana peristiwa
tertentu yang terjadi pada waktu tertentu). EHA berasumsi bahwa variabel dependen (misalnya pernikahan, perubahan
pekerjaan, pendidikan tinggi, dan kematian) dapat diprediksi dalam jangka waktu tertentu. Dasar pemikirannya berasal
dari analisis tabel kehidupan yang digunakan oleh para ahli demografi untuk menghitung tingkat kelangsungan hidup
dan kematian suatu populasi dari waktu ke waktu. Misalnya, jika jumlah penduduk yang masih hidup berjumlah x pada
waktu t, tingkat kelangsungan hidup penduduk tersebut dapat diprediksi pada waktu t + 1. Tingkat bahaya dalam EHA
adalah sisi lain dari tingkat kelangsungan hidup dan mengacu pada probabilitas dari variabel terikat yang terjadi pada
seorang individu dalam jangka waktu tertentu, mengingat individu tersebut berada pada
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 359

risiko (Cohen, Manion, dan Morrison 2000). Masalahnya diselesaikan dengan melakukan transformasi logit
dari variabel dependen dan kemudian memperkirakan dengan teknik kemungkinan maksimum (Allison 1984).
EHA mulai digunakan dalam ilmu sosial pada tahun 1970an. Analisis ini menonjol dalam bidang
hubungan internasional, karena digunakan untuk menganalisis rangkaian waktu konflik internasional dan
peristiwa diplomatik. Analis kebijakan kemudian menerapkan EHA di bidang lain. Plotnick (1983) menggunakan
EHA untuk mempelajari masuk dan keluar dari program Aid to Families with Dependent Children (AFDC).
Perkiraan tersebut diterapkan pada proyeksi perubahan jangka waktu yang dihabiskan di dalam dan di luar
AFDC dan beban kasus AFDC karena perubahan dalam variabel terikat. Hasilnya menunjukkan bahwa usia
dan upah mempunyai pengaruh negatif yang signifikan terhadap tingkat masuk AFDC, dan pengaruh positif
yang signifikan terhadap tingkat keluar.
Berry dan Berry (1990), yang meneliti adopsi lotere negara bagian, menggunakan EHA untuk
menjelaskan bagaimana karakteristik internal negara bagian (politik dan ekonomi) dan difusi regional
mempengaruhi kemungkinan negara mengadopsi lotere. Model EHA dikembangkan sebagai:

b1 FISCALi,t–1 + b2 PARTYi,t + b3 ELECT1i,t + b4 ELECT2i,t + b5 PENDAPATANi,t–1


)
ADOPTi, t = ( + b6 AGAMAi,t–1 + b7 TETANGGASi,t

ADOPTi,t = peluang negara bagian i akan mengadakan lotere pada tahun t


FISCALi,t–1 = kesehatan fiskal pemerintah suatu negara bagian pada tahun sebelumnya
PESTASaya,t = sejauh mana suatu partai politik mengendalikan pemerintah
SELECT1i,t = dummy, 1 untuk tahun pemilu gubernur =
SELECT2i,t dummy, 1 bukan untuk tahun pemilu maupun tahun setelahnya
PENGHASILAN i,t–1 = pendapatan pribadi
RELIGIONi,t–1 = proporsi penduduk yang menganut agama fundamentalisme
TETANGGASi,t = jumlah negara tetangga yang sebelumnya mengadopsi

Hasilnya menunjukkan bahwa adopsi sebelumnya oleh negara-negara tetangga dan menurunnya
kesehatan fiskal mempengaruhi kemungkinan adopsi lotere. Para penulis mencatat bahwa adopsi lotere
kemungkinan besar terjadi pada tahun-tahun setelah pemilu. Selain itu, negara-negara dengan pendapatan per
kapita lebih rendah dan negara-negara dengan persentase fundamentalis agama yang lebih tinggi memiliki
kemungkinan paling kecil untuk mengadopsi lotere. Dengan EHA, Berry dan Berry (1990) menyimpulkan bahwa
difusi regional dan determinan internal merupakan penjelasan yang valid mengenai adopsi lotere negara.
Mereka mengusulkan bahwa EHA harus digunakan dalam subbidang ilmu politik lainnya karena ia
memanfaatkan variasi perilaku politik baik secara temporal maupun cross-sectional, dan tetap berlaku untuk
peristiwa yang jarang terjadi seperti perang dan pergantian identifikasi partai politik. Box-Steffensmeier dan
Jones (1997) mengilustrasikan metode EHA dengan tiga isu: intervensi militer yang terbuka, pencegahan
terhadap penantang, dan jalur karier kongres. Mereka juga menyerukan penggunaan model EHA yang lebih besar.

ANALISIS FAKTOR

Analisis faktor adalah teknik saling ketergantungan di mana semua variabel dipertimbangkan secara
bersamaan dan faktor-faktor diciptakan untuk menjelaskan kumpulan variabel. Analisis faktor mempunyai
tiga tujuan dasar: untuk mengidentifikasi struktur faktor yang mendasari variabel, untuk mencapai reduksi
data, dan untuk menguji hubungan antar variabel. Analisis faktor didasarkan pada asumsi mendasar
bahwa beberapa faktor mendasar, yang jumlahnya lebih kecil daripada jumlah variabel yang diamati,
bertanggung jawab atas kovariasi antar variabel yang diamati. Penekanan pada struktur faktor yang
mendasari mencerminkan keyakinan bahwa ada kualitas nyata di dunia, seperti kepercayaan, motivasi dan kepuasan, ya
Machine Translated by Google

360 Buku Panduan Analisis Kebijakan Publik

tidak dapat diukur secara langsung tetapi dapat diungkapkan melalui kovariasi variabel-variabel terkait. Bentuk umumnya
adalah:
X1 = b1 (F1 ) + b2 (F2 ) + . . . + bn (Fn ) + d1 (U1 )
Di mana

X1
= skor subjek pada variabel observasi 1
miliar
= bobot faktor persekutuan yang mendasari n, yang digunakan dalam menentukan skor
subjek pada X1 skor subjek
Fn = pada faktor yang mendasari n
d1 =
bobot regresi untuk faktor unik yang terkait dengan X1
U1 =
faktor unik yang terkait dengan X1

Analisis faktor memiliki dua jenis: eksplorasi dan konfirmasi. Analisis faktor konfirmatori digunakan dengan analisis
jalur untuk pemodelan persamaan struktural. Untuk analisis faktor eksploratif, jika kasus dikelompokkan maka menjadi
metode Q atau analisis klaster; jika variabel dikelompokkan maka itu adalah analisis faktor tipe R. Analisis faktor berbeda
dengan analisis komponen utama karena komponen analisis komponen utama memperhitungkan varians total dalam data
sedangkan analisis faktor faktor memperhitungkan varians umum dalam kumpulan data. Analisis faktor mengasumsikan
bahwa variabel yang diamati merupakan kombinasi linier dari faktor-faktor yang mendasarinya. Sebaliknya, analisis
komponen utama mengasumsikan bahwa komponen merupakan kombinasi linier dari variabel yang diamati. Oleh karena
itu, analisis faktor dapat digunakan untuk mengidentifikasi jumlah dan sifat faktor yang bertanggung jawab atas kovariasi
dalam kumpulan data, namun analisis komponen utama tidak bisa. Meski demikian, banyak penulis yang tidak melakukan
pembedaan tersebut terutama jika tujuannya adalah untuk mereduksi item atau variabel.

Misalnya, Winter dan May (2001) mengukur motivasi sosial petani Denmark untuk mematuhi peraturan melalui enam
item survei tentang persepsi petani terhadap gaya penegakan hukum yang dilakukan oleh pengawas kota. Mereka
kemudian menggunakan analisis komponen utama, yang diperlakukan sebagai analisis faktor, dan mengidentifikasi dua
dimensi yang mendasari gaya penegakan hukum: formalisme dan pemaksaan. Warner dan Hebdon (2001) mempelajari
faktor-faktor yang mempengaruhi pilihan restrukturisasi pemerintah daerah di antara privatisasi dan alternatif-alternatifnya.
Selain tekanan fiskal dan variabel kontrol seperti pendapatan per kapita, tipe kota, ukuran pemerintahan dan masa jabatan,
penulis mengembangkan empat belas item untuk mengukur kondisi ekonomi dan politik pemerintah daerah. Mereka
melakukan analisis komponen utama dan mengurangi empat belas item menjadi tiga komponen berbeda: kualitas informasi
dan layanan; efisiensi; dan serikat pekerja dan faktor politik. Pada Tabel 23.1, tujuh item pertama memiliki muatan faktor
lebih tinggi dari 0,5 pada Kualitas Informasi dan Layanan, dengan muatan lebih rendah untuk dua komponen lainnya. Oleh
karena itu, ketujuh item tersebut dapat digunakan bersama-sama dalam analisis selanjutnya.

Item kedelapan, dampak lapangan kerja lokal, mempunyai beban yang sama pada komponen pertama (0,476) dan komponen
ketiga (0,452). Oleh karena itu, item ini seharusnya dihapus dari analisis selanjutnya.

ANALISIS JALUR

Analisis jalur digunakan untuk menguji hubungan tidak langsung dan kasual antar variabel yang ditentukan dalam model.
Analis kebijakan pertama-tama menggambar diagram jalur berdasarkan teori atau serangkaian hipotesis, kemudian
memperkirakan koefisien jalur menggunakan teknik regresi, dan akhirnya menentukan dampak tidak langsung (Nachmias
dan Nachmias 1996). Hal ini sangat berguna ketika berhadapan dengan efek mediasi, dimana variabel independen
berdampak pada variabel intervening yang selanjutnya berdampak pada variabel dependen. Analisis jalur mengasumsikan
reliabilitas sempurna dari instrumen yang digunakan untuk mengoperasikan variabel. Oleh karena itu, seluruh variabel
dalam model jalur dianggap sebagai variabel yang diamati, bukan faktor laten atau faktor yang mendasarinya. Jika digunakan
secara matematis dengan analisis faktor konfirmatori (CFA), maka menjadi model persamaan struktural (SEM) dan dapat
menangani variabel laten. SEM memungkinkan
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 361

TABEL 23.1
Hasil Analisis Komponen Utama dari Warner dan Hebdon (2001)

Informasi &

Kualitas Pelayanan Efisiensi Persatuan

Informasi (1) 0,792 0,17 0,038


Hukum 0,643 –0,048 0,407
Nilai-Nilai Komunitas (2) 0,614 0,2 0,27
Pemantauan (3) 0,613 0,189 0,301
Kualitas Pelayanan (4) 0,604 0,481 –0,003
Kepemimpinan 0,563 0,434 –0,009
Pengalaman 0,529 0,125 0,132
Dampak Ketenagakerjaan Lokal 0,476 0,196 0,452

Efisiensi ekonomi 0,147 0,832 0,092


Dampak Anggaran 0,07 0,793 0,339
Pengelolaan 0,321 0,693 0,112
Tenaga kerja 0,457 0,471 0,419

Persatuan 0,076 0,075 0,799


Politik (5) 0,216 0,243 0,573

Catatan: N = 201; Berdasarkan survei tahun 1997 di kota dan kabupaten di Negara Bagian New York.

penilaian reliabilitas variabel laten, estimasi pengaruh tidak langsung variabel eksogen yang lebih tepat, dan variabel
dependen ganda.
Analisis jalur digunakan untuk menyederhanakan dan menggambarkan hubungan teoretis yang kompleks.
LISREL (Hubungan Struktural Linear) telah menjadi program populer sejak tahun 1981, dan paket statistik seperti
SAS dan Stata juga dapat melakukan analisis. Ellickson (1992) menggunakan analisis jalur untuk menjelaskan
dampak faktor pribadi, lingkungan, dan kelembagaan terhadap keberhasilan legislatif dengan data yang diambil dari
Dewan Perwakilan Rakyat Missouri tahun 1987–88. Hasil penelitian menunjukkan bahwa variabel kelembagaan,
senioritas dan partai politik, mempunyai pengaruh yang paling kuat. Analisis jalur mampu menunjukkan bahwa jabatan
formal merupakan variabel intervening antara keberhasilan legislatif dengan variabel independen lainnya seperti usia,
urbanisme, senioritas, dan partai politik.
Cohen dan Vigoda (1998) menggunakan analisis jalur untuk membandingkan dua model berbeda yang
menjelaskan hubungan antara perilaku kewarganegaraan dan hasil kerja. Gambar 23.1, model langsung, tidak
memiliki variabel mediasi. Hasilnya menunjukkan bahwa partisipasi politik, keterlibatan masyarakat, dan altruisme
secara umum mempunyai dampak langsung yang signifikan secara statistik terhadap kinerja yang dirasakan,
sementara kekecewaan terhadap pemerintah mempunyai dampak langsung yang signifikan terhadap niat berpindah.
Gambar 23.2, model tidak langsung, memiliki empat variabel independen (partisipasi politik, keterlibatan masyarakat,
altruisme umum, dan kekecewaan terhadap pemerintah), satu variabel mediasi (partisipasi dalam pengambilan
keputusan), dan dua variabel dependen (niat berpindah dan persepsi kinerja).
Di antara variabel-variabel independen, hanya keterlibatan masyarakat yang memiliki jalur partisipasi dalam pengambilan
keputusan yang signifikan secara statistik. Sebagai perbandingan, indeks kecocokan model menunjukkan bahwa model
langsung lebih baik dibandingkan model tidak langsung.

TEORI PERMAINAN

Teori permainan adalah pendekatan matematis terhadap pengambilan keputusan individu yang menggunakan
permainan sebagai paradigma interaksi pengambil keputusan yang rasional. Permainan adalah setiap interaksi antar
agen yang diatur oleh seperangkat aturan yang menentukan kemungkinan gerakan untuk setiap peserta dan
serangkaian hasil untuk setiap kemungkinan kombinasi gerakan. Sebuah permainan “strategi murni” terdiri dari
komponen-komponen yang saling terkait berikut ini: Para pemain, yang mungkin berupa orang atau organisasi, memilih dari daftar pilih
Machine Translated by Google

362 Buku Panduan Analisis Kebijakan Publik

Partisipasi -0,04
politik
0,31*
Niat
pergantian
0,00
Keterlibatan
komunitas -0,22*

Partisipasi dalam
-0,23*
-0,01 pengambilan keputusan

Altruisme
umum
0,34*
Kinerja yang
0,19* dirasakan

Kekecewaan
-0,05
terhadap pemerintah

*p < 0,05

GAMBAR 23.1 Model Jalur Tidak Langsung dari Cohen dan Vigoda (1998).

atau strategi yang tersedia bagi mereka. Pada setiap tahap permainan, para pemain memilih tindakan mereka dari
serangkaian kemungkinan keputusan, yang biasanya tidak sama untuk setiap pemain. Tindakan tersebut mengarah
pada hasil atau konsekuensi. Hal ini mengasumsikan para pemain mempunyai preferensi yang tetap terhadap
hasil: mereka lebih menyukai beberapa hasil daripada yang lain. Setelah keputusan dibuat, setiap pemain menerima
imbalan tertentu yang diukur dalam satuan umum untuk semua pemain (Morrow 1994).

Partisipasi -0,06
politik

Niat
-0,05
pergantian
0,22*
Keterlibatan
komunitas

Partisipasi dalam
-0,26*
pengambilan keputusan

Altruisme
umum
-0,05
Kinerja yang
-0,11 dirasakan

Kekecewaan
0,02
terhadap pemerintah

*p < 0,05

GAMBAR 23.2 Model Jalur Langsung dari Cohen dan Vigoda (1998).
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 363

Asumsi teori permainan adalah: (1) tindakan individu bersifat rasional secara instrumental, (2) pengetahuan
umum tentang rasionalitas dimiliki oleh semua pemain, (3) para pemain akan menarik kesimpulan yang sama
tentang bagaimana permainan dimainkan, (4 ) pemain mengetahui aturan permainan dan motif mereka tidak
bergantung pada aturan, (5) preferensi tetap, (6) transitivitas (jika A>B dan B>C maka A>C) (Heap dan Varoufakis
2004; Gates dan Humes 2000). Rupanya asumsi-asumsi tersebut terlalu sederhana dan banyak dikritik.
Misalnya, identitas dan preferensi individu mungkin tidak ditentukan sebelumnya; sebaliknya, mereka tertanam dan
terbentuk secara sosial. Mereka sering kali muncul selama interaksi sosial tertentu.
Dalam situasi kebijakan, kita mungkin menghadapi berbagai peristiwa yang terjadi sebagai akibat dari keputusan yang
dibuat oleh pihak lain. Ketika para aktor berusaha untuk memaksimalkan kepentingan mereka sendiri namun tindakan mereka
mempengaruhi satu sama lain, maka terdapat kondisi permainan yang melibatkan konflik dan kerja sama. Model teori
permainan membantu aktor mengambil keputusan ketika dihadapkan pada persaingan alternatif kebijakan atau konsekuensi keputusan.
Baik politik maupun permainan melibatkan gerakan dan interaksi para pemain yang berupaya memaksimalkan
kepentingan mereka; pemilihan strategi dengan konsekuensi tertentu; dan terkadang pembentukan koalisi (Kelly
2003).
Ada beberapa bentuk permainan. Yang paling sederhana adalah permainan dua orang, zero-sum yang
melibatkan dua pemain dan keuntungan satu pemain adalah kerugian pemain lain, dan sebaliknya. Perhatikan
Dilema Tahanan, salah satu permainan klasik, sebagai contoh. Kedua pemain tersebut merupakan rekan kejahatan
yang telah ditangkap polisi. Setiap tersangka ditempatkan di sel terpisah dan diberi kesempatan untuk mengaku.
Setiap narapidana mempunyai dua pilihan: strategi A (mengaku) atau strategi B (tidak mengaku). Imbalan bagi
seorang narapidana di babak tertentu bergantung pada pilihan kedua narapidana di babak tersebut. Seperti yang
ditunjukkan dalam tabel tradeoff (Tabel 23.2), ada empat kemungkinan skenario: (1) keduanya memilih untuk
mengaku (strategi A), dan masing-masing dari mereka memperoleh imbalan yang sama sebesar 3; (2) keduanya
memilih untuk tidak mengaku (strategi B), dan masing-masing mendapat imbalan yang sama sebesar 2; (3)
Narapidana 1 memilih untuk mengaku (strategi A) sedangkan Tahanan 2 memilih untuk tidak mengaku (strategi B).
Hasilnya, Tahanan 1 mendapat imbalan sebesar 5 sedangkan Tahanan 2 mendapat imbalan sebesar 1; (4) Tahanan
1 memilih untuk tidak mengaku (strategi B) sedangkan Tahanan 2 memilih untuk mengaku. Hasilnya, Tahanan 1
mendapat imbalan 1 sedangkan Tahanan 2 mendapat imbalan 5.
Dilema Tahanan berkaitan dengan masalah kepercayaan, masalah free rider, barang publik, negosiasi,
regulasi, korupsi, dan resolusi konflik. Axelrod (1984) menunjukkan bahwa Tit for-Tat, sebuah program yang dimulai
dengan gerakan kooperatif dan kemudian mengikuti apa pun yang dilakukan lawan pada gerakan sebelumnya,
adalah strategi terbaik dalam permainan Dilema Tahanan yang berulang. Hal ini menunjukkan bahwa meskipun
kerja sama bukanlah keseimbangan Nash dalam permainan satu kali, namun kerja sama ini merupakan permainan
yang berulang tanpa batas waktu. Analisis Axelrod (1984) dan analisis Smith (1982) telah membawa banyak
penerapan lain dalam bidang ilmu politik (lihat Axelrod dan Dion 1988). Teori permainan telah digunakan dalam ilmu
politik sejak tahun 1950an, khususnya di bidang-bidang seperti pemungutan suara, preferensi kelompok,
pembentukan koalisi, tawar-menawar, diplomasi, dan negosiasi (Shubik 1982). Setelah Harsanyi (1967)
memperkenalkan konsep informasi tidak lengkap ke teori permainan pada akhir tahun 1960an, model informasi tidak
lengkap telah diterapkan pada pemungutan suara, aktivisme politik, kontrol birokrasi, tawar-menawar krisis, perjanjian
pengendalian senjata, dan pembentukan aliansi (Gates dan Humes 2000) .

TABEL 23.2
Dilema Tahanan

Tahanan 1

Strategi A Strategi B

Strategi A (3,3) (1,5)


Tahanan 2
Strategi B (5,1) (2,2)
Machine Translated by Google

364 Buku Panduan Analisis Kebijakan Publik

SIMULASI

Simulasi adalah prosedur kuantitatif di mana analis membangun model matematis dari proses kebijakan yang sulit
dipecahkan secara analitis dan kemudian menjalankan model tersebut melalui serangkaian percobaan coba-coba
yang terorganisir untuk mensimulasikan perilaku sistem dari waktu ke waktu. Ini membantu analis memahami sistem
dengan mensimulasikannya di lingkungan dan menentukan kemungkinan terjadinya peristiwa dan perubahan
kondisional dalam kebijakan publik. Hal ini membantu menjawab pertanyaan-pertanyaan seperti: “Apa yang akan
terjadi pada kebijakan pembangunan ekonomi daerah kita jika tingkat inflasi sebesar 4 persen dan bukannya 3
persen pada tahun mendatang?” Atau, “Bagaimana strategi manajemen pertumbuhan ini akan mempengaruhi lalu
lintas di wilayah ini dalam dua puluh tahun?” Terkadang simulasi merupakan satu-satunya metode yang tersedia jika
lingkungan atau sistem sebenarnya sulit untuk diamati atau dimodelkan, atau jika model terlalu rumit untuk diselesaikan secara analitis
Di saat lain, tidak mungkin (misalnya, terlalu mahal atau mengganggu) untuk benar-benar mengoperasikan dan
mengamati suatu sistem. Misalnya, jika analis membandingkan dua cara memberikan manfaat kepada veteran,
menjalankan dua sistem yang berbeda dapat menyebabkan kebingungan besar dan masalah hukum.
Simulasi yang baik harus memenuhi ketentuan berikut: (1) Terkalibrasi. Data yang akurat disertakan dalam
konstruksi simulasi, dan nilai parameternya sedekat mungkin dengan observasi empiris; (2) Diperiksa. Fungsi model
sebanding dengan fungsi sebenarnya di dunia nyata; (3) Fleksibel. Model ini cukup fleksibel untuk menjawab
berbagai pertanyaan (Kane 1999). Langkah-langkah umumnya adalah: (1) mendefinisikan sistem yang ingin
disimulasikan, (2) merumuskan model yang ingin digunakan, (3) mengidentifikasi dan mengumpulkan data yang
diperlukan untuk menguji model, (4) menguji model dan membandingkannya. perilaku dengan lingkungan
sebenarnya, (5) menjalankan simulasi, (6) menganalisis hasil dan merevisi solusi jika diinginkan, (7) menjalankan
kembali simulasi untuk menguji solusi baru, (8) memvalidasi simulasi (Levin et al. 1989 ).

Meskipun ada kritik karena kurangnya keanggunan dan presisi matematis, simulasi adalah salah satu teknik
riset operasi yang paling banyak digunakan. Pada tahun 1960-an, istilah ini digunakan dalam isu-isu hubungan
internasional dan urusan perkotaan seperti penganggaran kota, pemilu, dan rekrutmen politik (lihat Coplin 1968).
Penggunaannya telah berkembang pesat seiring dengan berkembangnya pemodelan matematika dan teknologi
informasi. Hal ini sangat berguna dalam menjawab “bagaimana jika . . .” pertanyaan (Zagonel dkk. 2004). Di
Universitas Rhode Island, Departemen Ekonomi Lingkungan dan Sumber Daya Alam menciptakan Laboratorium
Simulasi Kebijakan (SimLab) untuk menerapkan alat interaktif berdasarkan teknologi komputer modern guna
membantu memahami konsekuensi dari tindakan kebijakan.
Misalnya, dewan kota di salah satu Ruang Keputusan Grup di SimLab mungkin merancang rencana untuk mengelola
pertumbuhan di kota tersebut. Sistem komputer kemudian mensimulasikan lingkungan dan memprediksi konsekuensi
ekonomi dan sosial dari rencana tersebut. Sistem Informasi Geografis digunakan untuk menyajikan konsekuensi
bagi kota dengan peta elektronik.
Simulasi digunakan dalam berbagai setting kebijakan seperti pembangunan daerah pemilihan (Gelman dan
King 1994), pembuatan kebijakan luar negeri (Taber 1992), dampak pengendalian emisi terhadap iklim bumi (Bankes
dan Lempert 1996), sosial. reformasi keamanan (Weller 2000), dan pendekatan alternatif terhadap perluasan
asuransi kesehatan (Remler, Zivin, dan Glied 2004). Tengs dkk. (2004) menciptakan Model Kebijakan Tembakau
untuk mengkaji potensi konsekuensi dari mewajibkan perusahaan tembakau untuk meningkatkan keamanan rokok.
Melalui simulasi terhadap populasi Amerika selama rentang waktu lima puluh tahun, hasilnya menunjukkan bahwa
meskipun mandat keselamatan menjadikan merokok lebih menarik dan meningkatkan penggunaan tembakau, masih
ada kemungkinan untuk memperoleh manfaat bersih dalam kesehatan penduduk. Robins, Michalopoulos, dan Pan
(2001) menggunakan model simulasi untuk menguji apakah penerima kesejahteraan akan bekerja penuh waktu jika
ditawari tambahan pendapatan yang dikondisikan pada pekerjaan penuh waktu. Model simulasi ini memperluas
model mikroekonomi tradisional mengenai pilihan pendapatan atau waktu luang dengan memasukkan pilihan
menerima kesejahteraan, dengan asumsi bahwa keputusan penerima kesejahteraan mengenai pekerjaan dan
kesejahteraan didasarkan pada niat untuk memaksimalkan kesejahteraan ekonomi mereka. Hasil disimulasikan
dengan tiga insentif keuangan yang berbeda: AFDC (lingkungan pra-TANF), TANF (saat ini digunakan di negara-
negara sampel sebagaimana disyaratkan oleh Undang-Undang Bantuan Sementara untuk Keluarga yang Membutuhkan), dan SSP (Pr
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 365

Hasilnya menunjukkan bahwa suplemen penghasilan akan meningkatkan lapangan kerja penuh waktu,
sedangkan insentif TANF terutama akan mendorong lapangan kerja paruh waktu.

KESIMPULAN

Metode kuantitatif membantu menilai pengaruh relatif dan gabungan dari berbagai variabel independen
terhadap beberapa variabel dependen. Mereka memberikan informasi kepada masyarakat dan klien tentang
pilihan kebijakan melalui angka, grafik, dan hubungan yang teruji. Hal ini memungkinkan warga negara dan
klien untuk melihat manfaat dan risiko alternatif kebijakan dengan pandangan matematis. Pengembangan
teknik kuantitatif yang lebih canggih merupakan tugas penting bagi banyak analis kebijakan saat ini (Wagle
2000). Ketika permasalahan kebijakan menjadi lebih kompleks, lingkungan menjadi lebih bergejolak, dan waktu
serta anggaran menjadi lebih terbatas, analis kebijakan harus mampu memilih strategi yang paling tepat (valid,
masuk akal, dan realistis) dan melaksanakan studinya dalam waktu singkat.

REFERENSI

Albritton, RB (1979). Mengukur kebijakan publik: Dampak program pendapatan keamanan tambahan.
Jurnal Ilmu Politik Amerika, 23(3), 559–578.
Allison, PD (1984). Analisis sejarah peristiwa. Taman Newbury: Bijak.
Axelrod, R. (1984). Evolusi kerjasama. New York: Buku Dasar.
Axelrod, R., dan Dion, D. (1988). Evolusi kerjasama lebih lanjut. Sains 242. 1385–1390.
Bankes, S., dan Lempert, RJ (1996). Strategi adaptif untuk meredakan perubahan iklim. Dalam Fogel, LJ, Angeline, PJ, &
Back, T. (eds.), Prosiding konferensi tahunan kelima tentang pemrograman evolusioner, hal.
17–25. Cambridge, MA: MIT Pers.
Berry, FS, dan Berry, WD (1990). Adopsi lotere negara sebagai inovasi kebijakan: Analisis sejarah peristiwa.
Tinjauan Ilmu Politik Amerika, 84(2), 395–415.
Box-Steffensmeier, JM, dan Jones, BS (1997). Waktu sangat penting: Model sejarah peristiwa dalam politik
sains. Jurnal Ilmu Politik Amerika, 41(4), 1414–1461.
Brandl, JE (1976). Pendidikan pelayanan publik pada tahun 1970an. Analisis Perkotaan, 3, 105–114.
Brewer, GD, dan deLeon, P. (1983). Dasar-dasar analisis kebijakan. Homewood, IL: Dorsey
Tekan.
Pembuat Bir, MB (1983). Evaluasi: Dulu dan sekarang. Dalam EL Struening dan MB Brewer (eds.), Buku Pegangan penelitian
evaluasi, Beverly Hills, CA: Sage.
Burbridge, L. (1999). Data cross-sectional, longitudinal, dan time-series: Kegunaan dan keterbatasan. Dalam GJ Miller dan ML
Whicker (eds.), Buku Pegangan metode penelitian dalam administrasi publik, hal.283–300. New York: Marcel Dekker.

Cohen, A., dan Vigoda, E. (1998). Penilaian empiris tentang hubungan antara kewarganegaraan umum dan hasil kerja.
Triwulanan Administrasi Publik, 21(4), 401–431.
Cohen, L., Manion, L., dan Morrison, K. (2000). Metode penelitian dalam pendidikan, edisi ke-5, New York: Routledge.
Coplin, WD (1968). Simulasi dalam studi politik. Chicago: Penerbitan Markham.
Daniels, MS, dan Wirth, CJ (1983). Paradigma evaluasi penelitian: Perkembangan yang penting
komponen pengambilan kebijakan. Tinjauan Amerika tentang Administrasi Publik, 17(1), 33–45.
deLeon, P. (1998). Pendahuluan: Dasar pembuktian analisis kebijakan: Empiris versus postpositivis
posisi. Jurnal Studi Kebijakan, 26(1), 109–113.
Durning, D. (1999). Transisi dari analisis kebijakan tradisional ke postpositivis: Peran metodologi Q.
Jurnal Analisis dan Manajemen Kebijakan, 18(3), 389–410.
Ellickson, MC (1992). Jalur menuju keberhasilan legislatif: Sebuah studi analitik jalur terhadap dewan perwakilan Missouri.
Studi Legislatif Triwulanan, 17(2), 285–302.
Engelbert, EA (1977). Pendidikan universitas analisis kebijakan publik. Tinjauan Administrasi Publik, 37(3),
228–236.
Fischer, F. (1995). Mengevaluasi kebijakan publik. Chicago: Nelson-Hall.
Machine Translated by Google

366 Buku Panduan Analisis Kebijakan Publik

Fischer, F. (1998). Melampaui empirisme: Penyelidikan kebijakan dalam perspektif postpositivis. Jurnal Studi Kebijakan,
26(1), 129–146.
Gates, S., dan Humes, BD (2000). Permainan, informasi, dan politik. Ann Arbor: Universitas Michigan
Tekan.
Gelman, A., dan King, G. (1994). Meningkatkan demokrasi melalui redistricting legislatif. Politik Amerika
Tinjauan Sains, 88(3), 541–559.
Gottman, JM (1988). Analisis deret waktu. New York: Pers Universitas Cambridge.
Rambut, JF, Tatham, RL, Anderson, RE, dan Black, W. (1998). Analisis data multivariat (edisi ke-5). Atas
Saddle River, NJ: Prentice Hall.
Harsanyi, J. (1967). Permainan informasi yang tidak lengkap dimainkan oleh pemain Bayesian. Ilmu Manajemen, 14,
159–182, 320–334, 486–502.
Tumpukan, SPH, dan Varoufakis, Y. (2004). Teori permainan. New York: Routledge.
Halangan, CJ (1965). Pengambilan keputusan untuk pertahanan. Berkeley, CA: Pers Universitas California.
Pemburu, KG. (2001). Analisis pengaruh upaya lobi dan kebijakan pembangunan ekonomi sisi permintaan terhadap kesehatan
perekonomian negara. Triwulanan Administrasi Publik, 25(1), 49–78.
Johnson, JB, dan Reynolds, HT (2005). Metode Penelitian Ilmu Politik (edisi ke-5). Washington DC:
CQ Tekan.
Kane, D. (1999). Simulasi komputer. Dalam GJ Miller dan ML Whicker (eds.), Buku Pegangan metode penelitian
dalam administrasi publik, hal. 511–533. New York: Marcel Dekker.
Keiser, LR, dan Meier, KJ (1996). Desain kebijakan, insentif birokrasi, dan manajemen publik: Kasus penegakan tunjangan
anak. Jurnal Penelitian dan Teori Administrasi Publik, 6(3), 337–364.
Kelly, MA (2003). Teori permainan. Dalam J. Rabin (ed.), Ensiklopedia administrasi publik dan kebijakan publik, hlm.533–536.
New York: Marcel Dekker.
Krane, D. (2001). Kemajuan yang tidak menentu di garis depan evaluasi kebijakan. Jurnal Internasional Publik
Administrasi, 24(1), 95–123.
Laswell, HD (1951). Orientasi kebijakan. Dalam D. Lerner dan HD Lasswell (eds.), Ilmu kebijakan, hal.3–15. Stanford: Pers
Universitas Stanford.
Laswell, HD (1970). Munculnya konsepsi ilmu kebijakan. Ilmu Kebijakan, 1, 3–14.
Lasswell, HD (1971). Pratinjauan ilmu kebijakan. New York: Elsevier.
Leinhardt, S. (1981). Analisis data dan pendidikan statistik dalam program kebijakan publik. Dalam JP Crecine (ed.), Penelitian
dalam analisis dan manajemen kebijakan publik, hal. 53–61. Greenwich, CT: JAI Pers.
Levin, RI, Rubin, DS, Stinson, JP, dan Gardner, ES (1989). Pendekatan kuantitatif terhadap manajemen.
New York: McGraw-Hill.
Mei, PJ (1998). Analisis kebijakan: Masa lalu, sekarang, dan masa depan. Jurnal Internasional Administrasi Publik, 21(6-8),
1089–1114.
Meier, KJ, dan Brudney, JL (2002). Statistik terapan untuk administrasi publik (edisi ke-5). Belmont, California:
Wadsworth.
Meltsner, AJ (1976). Analisis kebijakan dalam birokrasi. Berkeley: Pers Universitas California.
Morçöl, G. (2001). Keyakinan positivis di kalangan profesional kebijakan: Investigasi empiris. Ilmu Kebijakan,
34, 381–401.
Morgan, DR, dan Pelissero, JP (1980). Kebijakan perkotaan: Apakah struktur politik penting? Politik Amerika
Tinjauan Sains, 74(4), 999–1006.
Besok, JD (1994). Teori permainan untuk ilmuwan politik. Princeton, NJ: Pers Universitas Princeton.
Nachmias, CF, dan Nachmias, D. (1996). Metode Penelitian dalam Ilmu Sosial (Edisi ke-5). New York: St.
Pers Martin.
Nakamura, RT, dan Smallwood, F. (1980). Politik implementasi kebijakan. New York: St
Tekan.
Segi empat, ES (Ed.). (1966). Analisis keputusan militer. Chicago: Rand McNally.
Quade, ES, dan Boucher, WI (Eds.). (1968). Analisis sistem dan perencanaan kebijakan: Aplikasi untuk pertahanan.
New York: Elsevier Amerika.
Plotnick, R. (1983). Pergantian populasi AFDC: Analisis sejarah peristiwa. Jurnal Sumber Daya Manusia, 18(1), 65–81.

Radin, Beryl A. (2000). Melampaui Machiavelli: Analisis kebijakan sudah matang. Washington DC: Georgetown
Pers Universitas.
Machine Translated by Google

Metode Kuantitatif untuk Analisis Kebijakan 367

Remler, DK, Zivin, JG, dan Glied, SA (2004). Pemodelan perluasan asuransi kesehatan: Pengaruh pendekatan alternatif.
Jurnal Analisis dan Manajemen Kebijakan, 23(2), 291–313.
Robins, PK, Michalopoulos, C., dan Pan, E. (2001). Insentif keuangan dan reformasi kesejahteraan di Amerika
Amerika. Jurnal Analisis dan Manajemen Kebijakan, 20(1), 129–150.
Shubik, M. (1982). Teori permainan dalam ilmu sosial. Cambridge: Pers MIT.
Smith, M. (1982). Evolusi dan teori permainan. Cambridge: Pers Universitas Cambridge.
Taber, CS (1992). POLI: Model sistem pakar dari sistem kepercayaan kebijakan luar negeri AS. Politik Amerika
Tinjauan Sains, 86(4), 888–904.
Puluhan, T., Ahmad, S., Moore, R., dan Gage, E. (2004). Kebijakan federal yang mewajibkan rokok lebih aman: Sebuah
simulasi hipotetis mengenai perkiraan keuntungan atau kerugian kesehatan masyarakat. Jurnal Analisis dan
Manajemen Kebijakan, 23(4), 857–872.
Vijverberg, WP (1997). Komponen metode kuantitatif dalam kurikulum ilmu sosial dilihat dari isi jurnal. Jurnal Analisis dan
Manajemen Kebijakan. 16(4), 621–629.
Wagle, U. (2000). Ilmu kebijakan demokrasi: Masalah metodologi dan partisipasi warga negara.
Ilmu Kebijakan, 33, 207–223.
Pejalan, JL (1976). Kurikulum dalam studi kebijakan publik di University of Michigan. Analisis Perkotaan,
3, 89–103.
Warner, M. dan Hebdon, R. (2001). Restrukturisasi pemerintah daerah: Privatisasi dan alternatifnya. Jurnal
Analisis dan Manajemen Kebijakan, 20(2), 315–336.
Weller, CE (2000). Bisnis berisiko? Mengevaluasi risiko pasar dari proposal investasi ekuitas untuk mereformasi jaminan
sosial. Jurnal Analisis dan Manajemen Kebijakan, 19(2), 263–273.
Wells, JB, Layne, BH, dan Allen, D. (1991). Pelatihan pengembangan manajemen dan gaya belajar. Publik
Tinjauan Produktivitas & Manajemen, 14(4), 415–428.
Wildavsky, AB (1969). Menyelamatkan analisis kebijakan dari PPBS. Tinjauan Administrasi Publik, 29, 189–202.
Wildavsky, AB (1976). Prinsip untuk sekolah pascasarjana kebijakan publik. Jurnal Analisis Perkotaan, 4,
3–28.
Musim Dingin, SC, dan Mei, PJ (2001). Motivasi untuk mematuhi peraturan lingkungan. Jurnal dari
Analisis dan Manajemen Kebijakan, 20(4), 675–698.
Zagonel, AA, Rohrbaugh, J., Richardson, GP, dan Anderson, DF (2004). Menggunakan model simulasi untuk menjawab
pertanyaan “bagaimana jika” mengenai reformasi kesejahteraan. Jurnal Analisis dan Manajemen Kebijakan,
23(4), 890–901.
Machine Translated by Google
Machine Translated by Google

24 Penggunaan (dan Penyalahgunaan) dari


Survei dalam Analisis Kebijakan

Jerry Mitchell

Dahulu kala, Neanderthal tidak diragukan lagi bersembunyi di sebuah gua di suatu tempat di Eropa saat ini sambil bertanya-
tanya apakah mereka harus pindah karena populasi beruang yang menyusut. Jika Neanderthal Leviathan cenderung pada
cara berpikir kontrak sosial, manusia purba mungkin akan disurvei mengenai dukungan dan penolakan mereka terhadap
perpindahan ke tempat lain. Hasil-hasil tersebut dapat digunakan sebagai alasan bagi keputusan yang penuh risiko untuk
mengalah atau tetap bertahan. Alasan kepunahan Neanderthal mungkin karena masyarakat memandang arah kebijakan
yang benar, namun pemerintah salah menafsirkan datanya.

Tentu saja tidak ada spekulasi jika kita mengetahui bahwa masyarakat telah disurvei secara formal dan informal
mengenai berbagai tindakan di banyak tempat dan karena berbagai alasan sepanjang sejarah manusia. Pontius Pilatus
memutuskan untuk membunuh Yesus setelah melakukan survei yang tidak sistematis terhadap masyarakat setempat,
Presiden Bill Clinton memutuskan untuk berbohong tentang perselingkuhannya dengan Monica Lewinsky setelah lembaga
jajak pendapatnya mengatakan kepadanya bahwa masyarakat akan sangat tidak menyetujui tindakan bodoh seperti itu, dan
Parlemen Hongaria memutuskan untuk menarik pasukannya dari Irak setelah jajak pendapat menunjukkan 55 persen
masyarakat mendukung penarikan tersebut.
Sudah menjadi sifat manusia jika para pemimpin dan pengikut saling bertanya tentang apa yang mereka yakini atau
apa yang harus mereka lakukan. Mungkin ada tekanan evolusioner bagi manusia untuk bertanya satu sama lain seberapa
baik mereka beradaptasi atau gagal beradaptasi terhadap keadaan lingkungan. Lagipula, kecenderungan bergosip yang
meluas tidak lebih dari sebuah survei berskala kecil dan tidak ilmiah yang menggambarkan apa yang dikatakan dan dilakukan
orang lain. Pada tingkat kelembagaan, dewan penasihat kerajaan dan dewan penasihat perusahaan saat ini merupakan
mekanisme yang sama untuk memperoleh pendapat mengenai tindakan tertentu. Pemungutan suara sebenarnya tidak lebih
dari sebuah survei yang disponsori dan dipilih sendiri oleh negara, yang memberikan mandat hukum bagi pejabat yang
memegang jabatan dan membuat undang-undang. Faktanya adalah bahwa masyarakat disurvei mengenai pilihan mereka
sebelum mereka pergi ke tempat pemungutan suara dan kemudian disurvei lagi setelah mereka datang ke tempat
pemungutan suara untuk menjelaskan mengapa mereka menandai surat suara mereka dengan satu atau lain cara.
Ketertarikan terhadap survei telah mencapai proporsi epidemi. Praktis setiap negara di dunia melakukan pemungutan
suara sebelum dan sesudah pemilihan pemimpin mereka. Pada bulan-bulan menjelang pemilihan presiden AS tahun 2004,
survei pemilih dilakukan setiap hari, atau bahkan setiap jam, oleh organisasi berita, kelompok advokasi, dan partai politik.
Meskipun para politisi mengecam survei dan berpendapat bahwa mereka tidak terikat pada pemilu, mudah untuk melihat
dampak survei pada pemilu 2004 karena kedua calon presiden tersebut berkampanye hampir secara eksklusif di negara-
negara bagian yang surveinya menunjukkan persaingan yang ketat. Dalam sistem pemilihan pemenang yang eksentrik di
lembaga pemilihan Amerika, tidak ada gunanya menjalankan iklan atau tampil secara pribadi di negara bagian di mana salah
satu kandidat memiliki keunggulan dominan menurut penelitian survei.

Namun penelitian survei menjadi populer bukan hanya dalam kampanye politik. Survei pemirsa menentukan acara
televisi mana yang bertahan dan berkembang setiap musimnya, selebriti mana yang disukai dan tidak disukai, dan iklan
mana yang berhasil dan gagal. Ini adalah produk konsumen langka yang tidak pernah menjadi sasaran survei pemasaran
pada satu waktu atau lainnya. Jajak pendapat pelanggan mempengaruhi di mana

369
Machine Translated by Google

370 Buku Panduan Analisis Kebijakan Publik

produk ditempatkan di rak-rak toko dan berupa iklan yang muncul di etalase toko. Faktanya, survei sentimen konsumen
Universitas Michigan telah menjadi indikator utama kesehatan perekonomian AS. Bahkan penentuan makanan yang
baik dan buruk sampai taraf tertentu didasarkan pada tanggapan longitudinal terhadap kuesioner tentang kebiasaan
makan beberapa populasi yang dipilih secara khusus. Kehormatan yang luar biasa terhadap survei dan kemudahan
administrasinya telah menjadikannya bagian dari setiap aliran pemikiran, sehingga hasil survei menjadi hal yang lumrah
untuk dilaporkan dalam jurnal profesional antropologi, psikologi, sosiologi, pendidikan, ilmu politik. , dan administrasi
publik.

Penggunaan penelitian survei juga merupakan bagian dari analisis kebijakan. Survei dilakukan untuk
mengidentifikasi kebutuhan masyarakat, untuk mengetahui dukungan dan penolakan terhadap kebijakan, serta untuk
mengevaluasi kepuasan dan ketidakpuasan terhadap program. Survei dapat digunakan oleh para pembuat kebijakan
sebagai dasar untuk mengambil keputusan mengenai apakah akan membuat kebijakan baru atau menghentikan
kebijakan lama, untuk mendapatkan pemahaman yang lebih baik mengenai isu-isu, dan untuk mengadvokasi perubahan
kebijakan, program, dan layanan. Survei dapat diterapkan pada setiap tahapan proses kebijakan: untuk mengidentifikasi
permasalahan, mempertimbangkan manfaat solusi, menentukan dukungan legislatif terhadap undang-undang, menilai
kesulitan implementasi, dan mengukur hasil. Survei relevan dengan banyak bidang kebijakan: lingkungan hidup,
kesejahteraan sosial, pembangunan ekonomi, pendidikan, layanan kesehatan, hak-hak sipil, peradilan pidana, dan
urusan luar negeri (Christenson dan Taylor 1983; Glaser dan Bardo 1994; Swindell dan Kelly 2000; Thompson 1997).
Untuk mempengaruhi kebijakan publik, survei dilakukan oleh setiap sektor—publik, swasta, dan organisasi nirlaba—
mulai dari Kebun Binatang San Francisco, Chicago Tribune , hingga Dewan Kota New York. Mereka dapat digunakan
di setiap tingkat pemerintahan: federal, negara bagian, dan lokal. Kapan pun dan di mana pun survei dilakukan, ada
uang yang bisa dihasilkan dengan mengumpulkan survei dan menganalisis hasilnya. Pada tahun 2001, pemerintahan
George W. Bush menghabiskan hampir satu juta dolar saja untuk operasi mengukur reaksi masyarakat terhadap
proposal Jaminan Sosial alternatif dan kebijakan energi (Green 2002).
Tidak perlu banyak perhatian untuk menyadari bahwa survei merupakan bagian penting dari proses kebijakan,
namun yang mengejutkan, buku teks analisis kebijakan sering kali mengabaikan metode survei dari perangkat
metodologis para analis. Misalnya, dalam Policy Analysis: Concepts and Practices (2005) karya David L. Weimer dan
Aidan R. Vining (2005) setebal 499 halaman, hanya terdapat satu setengah halaman pembahasan wawancara, bahkan
tidak dicantumkan kata survei atau survei. jajak pendapat dalam indeks. Siapa yang mengetahui alasan dari pengabaian
ini, namun tentunya ini bukan saatnya untuk menjadi seorang Neanderthal ketika memahami bagaimana mempelajari
kebijakan yang mempengaruhi kehidupan banyak orang. Oleh karena itu, tujuan bab ini adalah untuk mengkaji
penggunaan survei dalam analisis kebijakan. Bagian pertama mengidentifikasi unsur-unsur penelitian survei, bagian
kedua memberikan contoh bagaimana survei menjawab berbagai pertanyaan kebijakan, dan bagian terakhir mengkaji
permasalahan dalam usaha penelitian survei.

UNSUR PENELITIAN SURVEI

Ada empat hal yang perlu dipertimbangkan ketika melakukan survei: (1) memilih jenis survei terbaik yang akan
digunakan, (2) mengembangkan pertanyaan yang baik, (3) menentukan siapa yang harus disurvei, dan (4) menganalisis
hasilnya.

JENIS SURVEI

Ada tiga jenis survei: melalui telepon, tatap muka, dan yang dilakukan sendiri. Survei melalui telepon adalah cara yang
paling mudah untuk dilakukan karena yang diperlukan hanyalah telepon, nomor telepon, dan penelepon (walaupun
survei telepon skala besar memerlukan sistem yang rumit, seperti komputer yang dibantu telepon dan staf yang banyak
dan terlatih). Mewawancarai orang-orang melalui telepon sejauh ini merupakan cara yang paling umum untuk
melakukan survei terhadap sejumlah besar orang—sebuah negara, negara bagian, atau wilayah metropolitan yang besar. Telepon
Machine Translated by Google

Penggunaan (dan Penyalahgunaan) Survei dalam Analisis Kebijakan 371

Survei ini menguntungkan karena kedekatannya, formatnya yang terstandarisasi, dan potensi pemirsa untuk
menjelaskan pertanyaan kepada responden. Namun, tidak mungkin untuk menjangkau orang-orang yang tidak memiliki
telepon (tunawisma, pasien rumah sakit, narapidana, dll.) dan seringkali sulit untuk menghubungi populasi tertentu
(hakim, dokter, pejabat terpilih, dll.) dengan penjaga gerbang (misalnya, sekretaris, asisten, dll).
Masalah lainnya adalah mendapatkan tanggapan dari orang-orang yang menggunakan mesin penjawab dan sistem ID
penelepon sebagai alat penyaringan. Lembaga survei juga dilarang secara hukum menggunakan peralatan panggilan
otomatis untuk menghubungi nomor nirkabel.
Survei tatap muka melibatkan kontak tatap muka antara pewawancara dan responden. Ini mungkin melibatkan
kuesioner yang diformat dengan sejumlah tanggapan yang datang satu demi satu atau bisa juga tidak terstruktur
dengan pertanyaan yang berkembang seperti percakapan antara dua orang teman. Survei tatap muka tidak sesuai
untuk populasi besar, namun sangat berguna ketika ingin menghubungi sekelompok orang tertentu di lingkungan yang
alami—di jalanan, di mal, atau di dalam ruang tunggu. Keuntungan utama adalah mengizinkan pewawancara
menjelaskan pertanyaan kepada responden. Agar dapat melakukannya dengan baik, pewawancara yang terlatih
sangat penting karena perubahan suara, bahasa tubuh, dan isyarat fisik lainnya dapat membentuk respons. Wawancara
langsung mahal dan memakan waktu.
Survei yang dikelola sendiri didistribusikan kepada responden untuk diselesaikan. Survei dapat didistribusikan
dalam empat cara: (1) dikirim melalui pos dan dikembalikan melalui pos, (2) dikirim melalui email atau diposting di situs
Web dan dikembalikan melalui email atau dengan memasukkan informasi di situs Web , (3) ditinggalkan di tempat
tertentu (di atas meja atau konter) dan dikembalikan melalui pos atau ke tempat tersebut (kotak drop, dll.), dan (4)
dibagikan kepada orang-orang saat mereka memasuki atau meninggalkan gedung, jalan, ruangan , atau tempat
lainnya. Keuntungan dari survei yang dilakukan sendiri mencakup anonimitas responden, kemampuan untuk
mengajukan pertanyaan sensitif, potensi untuk mendapatkan akses ke populasi yang sulit dijangkau, dan tidak adanya
bias pewawancara. Sisi negatifnya, sulit untuk mendapatkan tanggapan—kuesioner dapat dengan mudah dibuang ke
tempat sampah, email dapat dihapus, dan survei yang ditinggalkan mungkin tidak diambil. Penting untuk memastikan
bahwa satu orang tidak menyelesaikan lebih dari satu survei, jika tidak, sampel akan menjadi bias. Mengajukan
pertanyaan yang baik sangatlah penting karena penafsiran pertanyaan diserahkan kepada responden.

KUESIONER
Survei adalah tentang pertanyaan. Teka-tekinya adalah pembuatan kuesioner lebih merupakan suatu seni daripada
sains. Tidak ada aturan pasti tentang bagaimana pertanyaan harus diajukan dalam survei, meskipun ada buku yang
memberikan beberapa pedoman untuk mengajukan pertanyaan, seperti Doing Survey Research (2003) karya Peter M.
Nardi dan Mail and Internet Surveys: The Tailored karya Don Dillman. Metode Desain (2000). Kadang-kadang
pertanyaan-pertanyaan dari survei-survei sebelumnya diulangi, namun dalam sebagian besar kasus, pertanyaan-
pertanyaan dibuat secara ad hoc dari satu survei ke survei berikutnya. Ada dua jenis pertanyaan umum yang dapat
diajukan: (1) pertanyaan tertutup yang menyediakan serangkaian kategori jawaban yang harus diisi oleh responden,
dan (2) pertanyaan terbuka yang memungkinkan responden menuliskan jawaban mereka.
tanggapan.
Pertanyaan survei mengoperasionalkan variabel. Variabel independen adalah variabel yang menjelaskan
perilaku, sikap, atau kebutuhan. Misalnya, afiliasi partisan dapat digunakan sebagai variabel independen untuk
menjelaskan dukungan atau penolakan terhadap suatu kebijakan. Variabel terikat adalah apa yang dijelaskan atau
dipertanggungjawabkan. Beberapa variabel dependen yang umum mencakup kepuasan kebijakan, penggunaan
layanan, dan dukungan program publik.
Baik variabel independen maupun dependen mempunyai nilai atau sifat yang berbeda dengannya. Misalnya,
usia dapat mempunyai nilai yang berbeda bagi orang yang berbeda atau bagi orang yang sama pada waktu yang berbeda.
Demikian pula, negara asal merupakan variabel karena negara seseorang dapat diberi nilai. Ada dua sifat variabel
yang harus selalu dicapai. Setiap variabel harus lengkap, harus mencakup semua kemungkinan tanggapan yang dapat
dijawab. Misalnya, jika variabelnya adalah “agama” dan
Machine Translated by Google

372 Buku Panduan Analisis Kebijakan Publik

pilihannya hanya “Protestan”, “Yahudi”, dan “Muslim”, ada beberapa agama yang belum dimasukkan. Daftar ini
tidak mencakup semua kemungkinan. Karena tidak mungkin untuk membuat daftar semua kemungkinan dengan
beberapa variabel, biasanya secara eksplisit mencantumkan properti yang paling umum dan kemudian
menggunakan kategori umum seperti “Lainnya” untuk memperhitungkan semua properti yang tersisa. Selain
bersifat menyeluruh, sifat-sifat suatu variabel juga harus saling eksklusif, tidak boleh ada responden yang
mempunyai dua atribut secara bersamaan. Meskipun hal ini mungkin tampak jelas, namun seringkali agak rumit dalam praktiknya.
Misalnya, tidak tepat untuk merepresentasikan variabel “status pekerjaan” dengan dua properti “bekerja” dan
“menganggur”. Masalahnya adalah atribut-atribut ini tidak selalu eksklusif—seseorang yang sedang mencari
pekerjaan sampingan sambil bekerja akan dapat memeriksa kedua atribut tersebut. Solusinya mungkin dengan
membuat kategori lain “bekerja tetapi sedang mencari pekerjaan” atau meminta responden mencentang semua
yang sesuai.
Pertanyaan survei dapat berupa ukuran tingkat nominal, ordinal, atau interval. Ukuran tingkat nominal adalah
ukuran yang berisi kategori jauh tanpa urutan apa pun. Misalnya, jika survei menanyakan apakah seseorang
berhutang atau menyewa rumahnya. Ukuran ordinal adalah ukuran yang memiliki sekumpulan kategori terurut.
Usia dapat diukur dengan serangkaian rentang yang terurut, misalnya dari delapan belas hingga tiga puluh, tiga
puluh satu hingga empat puluh, dan seterusnya. Pengukuran tingkat interval adalah pengukuran yang setiap nilai
mempunyai kategorinya sendiri. Contohnya adalah mengajukan pertanyaan terbuka yang mengharuskan responden
menuliskan berapa tahun mereka bekerja. Setiap tanggapan akan mempunyai nilai tersendiri. Tingkat pengukuran
pertanyaan penting karena menentukan jenis analisis statistik yang dapat dilakukan.
Ada banyak hal tambahan yang perlu dipertimbangkan ketika menyusun instrumen survei (Miller dan Miller-
Kobayahsi 2000). Responden harus diberitahu bagaimana menjawab pertanyaan dan harus ada pernyataan
apakah survei itu rahasia atau tidak. Kebanyakan survei dimulai dengan pertanyaan-pertanyaan yang relatif mudah
dijawab, diikuti dengan pertanyaan-pertanyaan yang lebih sulit. Pertanyaan demografis (pendapatan, usia, tempat
tinggal, dll.) biasanya diajukan di akhir survei. Biasanya, peneliti survei ingin memperoleh intensitas perasaan
dalam pertanyaannya, sehingga mereka tidak menanyakan apakah seseorang puas atau tidak puas, namun
mereka akan menanyakan apakah seseorang sangat puas, agak puas, agak tidak puas. , atau sangat tidak puas.
Pertanyaan tidak boleh bias atau mengarah.
Pertanyaan-pertanyaan tersebut harus mudah dipahami oleh responden, sehingga analis harus berhati-hati dalam
mencocokkan pertanyaan dengan unit analisis. Inilah salah satu alasan mengapa survei harus diuji terlebih dahulu
sebelum benar-benar dilaksanakan.

RESPONDEN

Ada dua pendekatan untuk memutuskan siapa yang akan disurvei: (1) seluruh populasi yang diteliti, atau (2)
sampel dari populasi. Jika populasinya kecil, semua orang biasanya disurvei. Misalnya, jika seseorang mensurvei
dua puluh lima remaja pelaku kejahatan mengenai pendapat mereka tentang kamp pelatihan alternatif menuju
inkarnasi yang baru saja mereka selesaikan, maka kedua puluh lima peserta tersebut akan disurvei. Tidak perlu
mengambil sampelnya. Apabila terdapat lebih banyak populasi yang terlibat, maka ada baiknya dilakukan
pengambilan sampel, yaitu mengambil sebagian dari populasi. Ada dua jenis sampel: probabilitas dan non-
probabilitas.
Sampel probabilitas adalah sampel yang nama-namanya diambil dari suatu populasi yang ukuran dan
karakteristiknya (seperti jenis kelamin, usia, tempat tinggal, dll.) diketahui. Dengan kata lain, ada cara untuk
mengetahui secara statistik apakah sampel tersebut mewakili populasi. Dalam sampel probabilitas, dimungkinkan
untuk menghitung kesalahan pengambilan sampel—perbedaan antara statistik sampel dan parameter populasi
yang sebenarnya. Kesalahan pengambilan sampel merupakan fungsi dari jumlah responden—semakin besar
jumlah orang yang datanya dikumpulkan, semakin kecil kesalahan pengambilan sampel (dan, tentu saja, semakin
tinggi biaya survei). Suatu survei terhadap seribu responden akan mempunyai kesalahan pengambilan sampel
sebesar ± 3,1 persen, sedangkan pada survei yang melibatkan dua ratus responden, kesalahan pengambilan sampelnya
Machine Translated by Google

Penggunaan (dan Penyalahgunaan) Survei dalam Analisis Kebijakan 373

akan menjadi ±6,9 persen. Penugasan acak adalah bentuk pengambilan sampel probabilitas yang paling umum,
yang melibatkan pemberian kesempatan yang sama kepada setiap subjek dalam suatu populasi untuk dipilih.
Jenis sampel probabilitas lainnya adalah sampel sistematis, yang melibatkan pemilihan nama atau item dari
daftar populasi pada interval tertentu (misalnya, setiap orang kesepuluh).
Sampel non-probabilitas adalah sampel yang nama-namanya dipilih dari suatu populasi yang ukuran dan
karakteristiknya tidak diketahui. Misalnya, jika Chicago Transit Authority ingin mensurvei penumpangnya, mereka
akan mengetahui bahwa terdapat populasi penumpang, namun tidak memiliki daftar induk untuk menentukan
nama. Dalam pengambilan sampel non-probabilitas, upayanya adalah memperkirakan apakah sampel tersebut
mewakili suatu populasi yang diketahui keberadaannya, tetapi parameter pastinya tidak diketahui. Untuk
membangun distribusi responden yang representatif, mungkin diperlukan upaya yang bertujuan untuk memperoleh
tanggapan berdasarkan kategori tertentu, seperti gender, etnis, atau pekerjaan.
Baik itu sampel probabilitas atau non-probabilitas, peneliti survei berupaya untuk memiliki ukuran sampel
yang cukup besar untuk memperkirakan populasi, memiliki tingkat respons di atas 50 persen, dan untuk
memastikan bahwa semua pertanyaan dalam instrumen survei relevan. menjawab. Kualitas sampel bergantung
pada sampel dan cara penggunaannya. Jika suatu negara sedang mempertimbangkan manfaat dari pembuatan
program zona perusahaan baru dan ingin mengetahui seberapa baik program tersebut berhasil diterapkan di
tempat lain, maka ada baiknya jika kita mengambil contoh pengalaman negara bagian terdekat dalam
menggunakan zona perusahaan. Seseorang dari lembaga think tank yang mengkaji persepsi zona perusahaan
di negara tersebut mungkin menginginkan sampel negara bagian Amerika dari setiap wilayah di negara tersebut.

ANALISIS DATA

Survei menghasilkan angka. Ironisnya, pertanyaan subjektif menghasilkan statistik objektif. Setiap pertanyaan
dalam survei merupakan analisis univariat yang dapat disajikan, bergantung pada format pertanyaan, sebagai
distribusi frekuensi atau ukuran tendensi sentral. Statistik bivariat menggambarkan hubungan antara dua
pertanyaan. Statistik multivariat adalah tentang hubungan antara dua pertanyaan atau lebih, yang sering kali
melibatkan penggunaan analisis regresi. Dengan kata lain, survei yang menilai dukungan terhadap voucher
sekolah dapat menunjukkan berapa banyak responden yang mendukung atau menentang voucher (analisis
univariat). Analisis ini juga dapat menunjukkan apakah Partai Republik atau Demokrat cenderung mendukung
voucher sekolah (analisis bivariat). Dan hal ini dapat menunjukkan apakah dukungan atau penolakan terhadap
voucher lebih dipengaruhi oleh satu variabel dibandingkan variabel lainnya, seperti afiliasi partisan, gender,
tempat tinggal, atau pendapatan (analisis multivariat).
Ada banyak teknik untuk menentukan keakuratan hasil survei, yang dapat dihitung menggunakan paket
perangkat lunak statistik. Misalnya, statistik Chi Square mengukur signifikansi hubungan bivariat antara variabel
tingkat nominal, sedangkan koefisien korelasi mengukur kekuatan hubungan antara beberapa variabel tingkat
interval. Statistik lainnya adalah r Pearson, yang merupakan ukuran kekuatan hubungan antara dua variabel
tingkat interval.
Jenis statistik yang digunakan untuk menilai nilai hubungan bergantung pada bagaimana pertanyaan diukur,
ukuran sampel, dan audiens yang menganalisis. Diskusi statistik yang rumit mungkin lebih cocok bagi pembaca
ilmiah dibandingkan bagi pembuat kebijakan atau masyarakat.
Data survei dapat disajikan dalam bentuk narasi atau grafik dan tabel. Jika tabel digunakan, penting untuk
menyajikan informasi yang cukup agar mudah diinterpretasikan, namun tidak terlalu banyak informasi yang
menyulitkan pemahaman. Tabel harus mempunyai judul deskriptif, semua variabel dan kategori yang terkait harus
diberi label dengan jelas, variabel bebas harus dicantumkan dalam kolom dan variabel terikat harus dicantumkan
di sepanjang baris, ukuran statistik harus dicantumkan di bagian bawah tabel, dan jumlah kasus yang digunakan
dalam analisis harus disebutkan.
Setelah bagian kesimpulan atau rekomendasi, biasanya laporan kebijakan memuat lampiran yang mencakup
instrumen survei beserta jawaban terhadap setiap pertanyaan.
Machine Translated by Google

374 Buku Panduan Analisis Kebijakan Publik

PENGGUNAAN SURVEI

Ada beberapa cara survei digunakan untuk memeriksa kebijakan publik. Ada tiga kegunaan yang dapat memberikan
gambaran: (1) menilai kebutuhan akan kebijakan, (2) memahami dukungan dan penolakan terhadap solusi, dan (3)
mengevaluasi daya tanggap kebijakan terhadap individu dan kelompok.

PERLU PENILAIAN

Analis kebijakan umumnya menilai perlunya kebijakan di antara berbagai lapisan masyarakat. Bagaimana pembuat
kebijakan bisa mengetahui bahwa kebijakan harus diambil jika mereka tidak tahu apa yang dibutuhkan? Meskipun
kebutuhan merupakan sebuah konsep yang ambigu dan dapat bervariasi dari satu orang atau kelompok ke kelompok
lainnya, cara sederhana untuk memahami kebutuhan adalah dengan bertanya kepada orang-orang apa yang mereka
butuhkan, dan membiarkan mereka mendefinisikan sendiri konsep tersebut. Setelah tingkat kebutuhan untuk populasi
tertentu telah dinilai, maka diskusi yang lebih cerdas mengenai perencanaan program dapat dimulai. Idealnya, pembuat
kebijakan dan pendukung kebijakan berupaya mengembangkan layanan atau intervensi untuk membantu masyarakat
mencapai atau mendekati keadaan yang memuaskan (Posavac dan Carey 2003).
Contoh penilaian kebutuhan adalah survei yang dilakukan oleh Departemen Layanan Bisnis Kecil Kota New York
untuk menentukan kebutuhan distrik peningkatan bisnis (BID) di lingkungan lokal. BID adalah perusahaan yang dikelola
secara profesional yang bertujuan untuk memperbaiki suatu wilayah dengan menggunakan dana dari pajak atau biaya
khusus wajib yang dibayarkan oleh properti dan/atau pemilik bisnis di wilayah yang ditetapkan secara hukum. Masalahnya
adalah perlu atau tidaknya BID. Untuk menentukan kebutuhan, sebuah survei didistribusikan ke semua pelaku bisnis dan
pemilik properti yang meminta mereka untuk menunjukkan apakah mereka setuju atau tidak setuju tentang beberapa
kondisi lingkungan, seperti jalanan yang kotor, kantong-kantong, fasad yang rusak, dan kekosongan ritel. Ketika hasil
survei menunjukkan banyak persetujuan mengenai tingkat keparahan permasalahan di suatu wilayah, dewan kota
mempunyai alasan yang lebih besar untuk menyetujui pembentukan BID. Faktanya, hampir seluruh dari empat puluh
tujuh BID di Kota New York telah ditetapkan setelah survei menemukan bahwa dunia usaha yakin bahwa hal tersebut
diperlukan.

POLLING PENDAPAT

Penilaian terhadap tingkat dukungan dan penolakan terhadap solusi alternatif dalam proses kebijakan merupakan hal
yang lazim. Siapa pun dapat terlibat dalam penilaian solusi, termasuk pejabat terpilih, administrator publik, pendukung
kebijakan, dan jurnalis. Studi dilakukan sepanjang waktu untuk menemukan opini tentang pembatasan aborsi, privatisasi
Jaminan Sosial, pendirian sekolah swasta, atau pembangunan sistem transportasi massal. Akibatnya, survei menjadi
semacam jajak pendapat mengenai nilai pilihan kebijakan. Jika kebanyakan orang mendukung suatu alternatif, maka hal
tersebut akan memberikan kepercayaan pada alternatif tersebut, tidak peduli apakah alternatif tersebut akan efektif atau
tidak. Sebaliknya, jika ada penolakan umum terhadap suatu alternatif, maka keputusan tersebut mungkin akan membuat
alternatif tersebut kurang bermanfaat, meskipun alternatif tersebut mempunyai peluang besar untuk berhasil.

Tidak ada contoh yang lebih penting mengenai bagaimana survei digunakan untuk mengukur dukungan dan
penolakan terhadap kebijakan publik selain dalam keputusan kota untuk membangun stadion olahraga. Di setiap kota
yang mempertimbangkan stadion baru untuk bisbol, sepak bola, bola basket, atau stadion serbaguna, terdapat jajak
pendapat yang dilakukan untuk mendiagnosis pandangan penduduk kota dan pejabat terpilih. Survei-survei ini dilakukan
oleh kelompok masyarakat yang menentang stadion yang dibiayai publik, kelompok bisnis yang mendukung, dan media
lokal yang tertarik pada penilaian yang lebih seimbang. Secara umum, hasil survei yang positif dapat memberikan kesan
terhormat pada proposal stadion, dan hasil survei yang negatif dapat membuat proposal stadion menjadi sangat sulit
untuk ditindaklanjuti. Pada tahun 2001, proposal untuk membangun stadion yang dibiayai publik di Minneapolis-St.
Paul sangat terpengaruh oleh survei opini publik yang dilakukan oleh St. Paul Pioneer Press. Di dalam
Machine Translated by Google

Penggunaan (dan Penyalahgunaan) Survei dalam Analisis Kebijakan 375

Sebagai berita di halaman depan, surat kabar tersebut melaporkan bahwa pendanaan publik untuk fasilitas olahraga
merupakan usulan yang tidak menarik di kalangan penduduk di Kota Kembar. Berdasarkan survei telepon terhadap
406 penduduk, 62 persen dari pemilih yang melakukan survei di St. Paul dan 71 persen dari mereka yang ditanyai
di Minneapolis menentang pendanaan publik yang signifikan untuk pembangunan rata-rata baru bagi si Kembar.
Setelah survei, usulan stadion ditolak oleh dewan kota. Meskipun survei tersebut bukan satu-satunya alasan
kehancurannya, hal ini tentu saja merupakan faktor utama

PENILAIAN DAMPAK

Survei juga dilakukan untuk menilai hasil kebijakan. Masyarakat mungkin disurvei mengenai apakah mereka
mengetahui adanya iklan publik, apakah mereka pernah menggunakan layanan yang diperbarui, atau apakah
mereka puas atau tidak puas dengan program baru atau yang sedang berjalan. Premisnya adalah bahwa kapasitas
sistem politik untuk menanggapi preferensi warga negaranya merupakan hal yang penting dalam teori dan praktik
demokrasi. Dari sudut pandang demokrasi, tidak terlalu penting apakah suatu kebijakan efektif atau efisien, namun
yang menjadi persoalan adalah apakah kebijakan tersebut memuaskan sebagian masyarakat berdasarkan hasil survei.
Evaluasi program Pendidikan Resistensi Penyalahgunaan Narkoba (DARE) adalah contoh yang baik tentang
bagaimana survei mengungguli metodologi lain dalam penilaian dampak. Program DARE melibatkan petugas polisi
berseragam dan terlatih khusus yang memberikan pelajaran kepada siswa sekolah dasar (biasanya anak berusia
delapan hingga dua belas tahun) tentang cara melawan narkoba. Dengan mempekerjakan petugas penegak hukum
untuk mengajarkan kurikulum, DARE membawa pengalaman langsung petugas dari jalanan ke ruang kelas.
Pelajaran ini memberikan informasi faktual tentang narkoba, dengan penekanan pada obat-obatan terlarang (ganja,
alkohol, dan tembakau), dan mengajarkan keterampilan penolakan melalui permainan peran dan teknik lainnya.
Dalam hal evaluasi DARE, studi-studi mengenai biaya-manfaat secara konsisten menemukan bahwa DARE tidak
efisien, dan desain quasi-experimental menyimpulkan bahwa DARE tidak begitu efektif dalam mencegah generasi
muda menggunakan narkoba (Lynman dkk. 1999). Meskipun demikian, program ini bertahan di distrik sekolah
karena survei secara konsisten menemukan bahwa orang tua, guru, administrator, dan siswa puas dengan
kinerjanya. Misalnya, survei tahun 1995 terhadap 1.800 orang tua, guru, dan lulusan DARE di Illinois menemukan
bahwa program ini berharga dan patut dipertahankan. Lebih dari 92 persen menilainya “sangat baik” atau “baik.”
Penilaian dampak ini dilaporkan di situs DARE (2004), yang bila digabungkan dengan survei serupa lainnya, menjadi
alasan mengapa program ini terus hadir di sekolah-sekolah umum.

PENYALAHGUNAAN SURVEI

Fakta bahwa survei digunakan sepanjang waktu tidak berarti survei tersebut sempurna. Survei mempunyai tiga
permasalahan: (1) survei yang sering dilakukan namun memiliki kelemahan metodologi, (2) survei yang sering
dilakukan namun bias secara politis, dan (3) survei digunakan secara tidak tepat sebagai pengganti bentuk
keterlibatan demokratis lainnya.

KEKURANGAN SURVEI

Tidak mudah untuk membuat survei yang sempurna, bahkan mungkin mustahil. Terlalu mudah untuk menemukan
survei dengan sampel yang tidak representatif yang terdiri dari sejumlah kecil orang yang memilih untuk
berpartisipasi, tingkat respons yang sangat rendah, pertanyaan yang sangat ambigu, kata-kata yang tidak jelas
dalam kuesioner, respons terhadap subjek yang kompleks terbatas. jawaban ya dan tidak, dan statistik yang
memberikan persentase, namun bukan jumlah sebenarnya orang yang menjawab pertanyaan. Faktanya adalah
siapa pun bisa melakukan survei, tanpa keahlian apa pun, dan tidak ada polisi yang melakukan survei
Machine Translated by Google

376 Buku Panduan Analisis Kebijakan Publik

aula peneliti buruk pergi. Hukuman bagi penelitian yang buruk adalah mengkritik analisis yang hanya terjadi sesekali,
atau mengabaikan hasil yang terjadi setiap saat.
Contoh survei yang dibangun dengan buruk adalah penilaian kebutuhan yang dilakukan oleh Koalisi Aksi
Perempuan Pusat Kota Los Angles pada tahun 2001, yang tujuannya adalah untuk memahami masalah yang dihadapi
perempuan tunawisma di Skid Row. Satu pertanyaan menanyakan, “Secara keseluruhan, bagaimana Anda menilai
perlakuan yang Anda terima dari staf di berbagai misi, tempat penampungan, dan lembaga layanan sosial di wilayah
Skid Row?” Kategori tanggapannya adalah: (1) sangat baik, (2) baik, (3) sedang, (4) buruk, (5) sangat buruk, dan (6)
tidak berpendapat. Permasalahan dari pertanyaan ini adalah sebenarnya ada tiga pertanyaan: satu tentang misi, satu
lagi tentang shelter, dan yang ketiga tentang lembaga pelayanan sosial. Pertanyaan tersebut juga tidak menjelaskan
apa yang dimaksud dengan staf dan mengasumsikan bahwa responden sepakat mengenai lokasi Skid Row. Selain
itu, kategori tanggapannya tidak jelas; Apakah mungkin membedakan antara sangat baik dan baik, atau sangat
miskin dan miskin? Sampel survei berjumlah 399, namun tidak ada upaya yang dilakukan untuk menunjukkan apakah
sampel tersebut mewakili populasi perempuan tunawisma. Survei ini diselesaikan hanya pada satu hari di musim
panas, sehingga tidak mungkin untuk mengetahui apakah terdapat variasi musiman dalam pendapat para perempuan.
Sederhananya, survei ini mempunyai banyak kelemahan metodologis, meskipun hal ini tidak menghentikan Koalisi
untuk mempublikasikan hasil-hasilnya dan mengutipnya dalam forum-forum pengambilan kebijakan. Mungkin
metodologinya tidak begitu penting karena hasilnya menegaskan kerja advokasi Koalisi atas nama perempuan
tunawisma di Los Angles.

BIAS SURVEI

Survei bisa saja masuk akal secara metodologi, namun bias. Ada kecenderungan dalam analisis kebijakan bahwa
survei dibuat hanya untuk alasan rasionalisasi, advokasi, dan serangan terhadap kebijakan publik. Dengan kata lain,
survei dalam analisis kebijakan seringkali lebih merupakan instrumen politik dibandingkan upaya ilmiah. Adakah yang
benar-benar percaya bahwa seseorang dengan ideologi konservatif akan menghasilkan survei yang menunjukkan
orang tua tidak puas dengan program voucher sekolah? Apakah American Association of Retired Persons (AARP)
pernah menyajikan statistik yang menunjukkan adanya penolakan umum bagi warga lanjut usia untuk membeli obat-
obatan murah di Kanada? Akankah Sierra Club benar-benar melakukan survei untuk membuktikan bahwa kebanyakan
orang tidak percaya bahwa perluasan wilayah merupakan masalah besar? Jelas sekali mengapa Presiden George
W. Bush pada tahun 2004 mengutip sebuah survei yang menunjukkan 70 persen warga Irak mendukung kebijakannya
dan juga jelas mengapa ia menolak survei yang menemukan 70 persen warga Eropa menentang kebijakannya.
Jarak antara objektivitas dan subjektivitas bersifat sementara. Misalnya, New Haven, Connecticut Town Green
District melakukan survei pada tahun 1999 dengan 900 survei dikirimkan melalui pos atau diserahkan langsung
kepada pemilik properti dan bisnis, menghasilkan 131 tanggapan dengan tingkat tanggapan sebesar 15 persen, yang
dengan bangga dicatat oleh distrik tersebut dalam buletinnya. peningkatan tanggapan sebesar 173 persen
dibandingkan survei tahun sebelumnya. Terhadap pertanyaan—“Apakah secara umum Anda puas dengan dampak
yang ditimbulkan oleh Town Green terhadap pusat kota?”—71,8 persen menjawab “ya” dan 6,9 persen menjawab
“tidak.” Ketika ditanya, “Apakah Anda melihat/merasakan perubahan positif di pusat kota sejak pembentukan
kabupaten ini pada bulan Januari 1997?”—70,2 persen menjawab “ya” dan 7,6 persen menjawab “tidak.” Masuk akal
jika kita berpikir bahwa Town Green District pernah melakukan survei dan menemukan bahwa lebih dari 70 persen
responden berada dalam kategori tidak untuk salah satu pertanyaan di atas. Tampaknya survei ini lebih bersifat
advokasi dibandingkan deskripsi empiris mengenai opini publik.

SURVEI YANG TIDAK DEMOKRATIS

Isu terakhir dalam penelitian survei adalah anggapan bahwa ukuran terbaik dari setiap kebijakan publik adalah dengan
memberikan serangkaian tanggapan terhadap pertanyaan survei. Faktanya, menanggapi survei telah menjadi
pengganti bentuk keterlibatan demokratis lainnya—menghadiri dengar pendapat publik, menulis surat kepada
Machine Translated by Google

Penggunaan (dan Penyalahgunaan) Survei dalam Analisis Kebijakan 377

pejabat publik, dan memberikan suara dalam pemilu. Survei adalah salah satu dari beberapa cara yang dapat dilakukan masyarakat untuk
mengungkapkan pandangan mereka mengenai metode pembuangan sampah alternatif di suatu wilayah atau usulan di suatu negara bagian
untuk mengurangi defisit anggaran dengan menerbitkan obligasi dan mengurangi layanan. Asumsinya adalah bahwa survei merupakan
upaya korektif terhadap pengaruh kelompok elit kaya dan kelompok kepentingan profesional dalam proses kebijakan. Selain pemungutan
suara, survei adalah salah satu dari sedikit peluang bagi masyarakat kurang beruntung dan orang-orang dengan kehidupan sibuk untuk
menganalisis dan membentuk kebijakan publik. Bahkan ada perasaan bahwa tindakan wawancara dapat mengurangi perasaan keterasingan
warga negara dari politik dan pemerintah (Benson 1981; Web dan Hatry 1973).

Salah satu permasalahan dalam penggunaan survei untuk mencerminkan demokrasi adalah rendahnya biaya dan manfaat bagi
responden yang diwawancarai (Berinsky 2004). Responden tidak menghubungi lembaga survei, namun lembaga survei dan sponsor politik
mereka menanggung biaya partisipasi dengan menghubungi masyarakat dan memobilisasi mereka ke dalam bentuk aksi politik terbatas.
Namun ini hanya separuh dari upaya yang dilakukan, menjawab jajak pendapat juga merupakan aktivitas yang tidak memberikan manfaat
besar. Responden tidak lebih baik pada awal wawancara dibandingkan pada akhir wawancara. Akibatnya, menggunakan survei dalam
proses kebijakan berarti mengandalkan partisipasi demokratis yang paling rendah.

Masalah lainnya adalah tidak semua responden memberikan reaksi yang sama terhadap kuesioner. Akibatnya, survei cenderung
memperkuat kesenjangan sosial. Hanya sedikit survei yang bersifat multibahasa dan sebagian besar mengharuskan responden untuk
terbiasa memproses informasi birokrasi. Semua jenis orang yang dikecualikan dari penelitian survei, seperti anak-anak, orang-orang di
institusi (penjara, rumah sakit, dll.), dan individu yang karena satu dan lain hal tidak memiliki waktu atau minat untuk menjawab pertanyaan
survei. Dalam hal wawancara telepon, rumah tangga yang tidak memiliki layanan telepon tidak dilibatkan, sehingga menurunkan nilai
pendapat mereka yang berpendapatan rendah, pekerjaan yang kurang stabil, dan keterikatan kelompok dan komunitas yang lebih sedikit
(O'Sullivan, Rassal, dan Bermer 2004). Ada keraguan bahwa survei melalui telepon mengenai kebijakan perumahan akan bermakna jika
survei tersebut mengecualikan mereka yang tidak memiliki telepon.

Jajak pendapat cenderung mencakup sebagian besar orang-orang yang suka mengemukakan pendapatnya tentang suatu isu. Ada
argumen bahwa memahami kepentingan publik harus lebih dari sekedar menghitung pendapat individu yang senang memberikan
pandangannya tentang segala hal. Faktanya, salah satu gagasan demokrasi perwakilan adalah bahwa pejabat terpilih dan administrator
publik mempunyai tanggung jawab untuk memahami mayoritas yang diam. Tujuan survei tentunya bukan untuk memaksa masyarakat
mempunyai pendapat.
Ada banyak masalah kebijakan ketika masyarakat tidak memiliki cukup informasi untuk melakukan penilaian. Kebanyakan orang Amerika
pernah mendengar tentang No Child Left Behind Act (Undang-undang No Child Left Behind Act), misalnya, namun hampir tujuh dari sepuluh
orang mengatakan bahwa mereka tidak memiliki pengetahuan yang cukup untuk membentuk opini mengenai inisiatif pendidikan yang
dilakukan oleh pemerintah federal.
Masalah terakhir adalah bahwa survei cenderung meringkas permasalahan yang rumit menjadi sekedar basa-basi, ungkapan yang
menarik, dan pertanyaan yang mudah dijawab. Apakah baik bagi demokrasi untuk memikirkan kebijakan publik dalam istilah yang paling
sederhana? Survei-survei yang sederhana mungkin tidak menghasilkan apa-apa selain menghasilkan ide-ide dan opini-opini yang tidak
jelas dan tidak menunjukkan apa pun selain dari kebingungan kebanyakan orang. Ambil contoh, Harris Poll yang dilakukan secara online
pada tahun 2002 terhadap sampel nasional yang terdiri dari 2.118 orang dewasa. Data tersebut dinilai mewakili seluruh orang dewasa di
AS. Jajak pendapat tersebut menemukan:

• Hampir semua orang, 93 persen dari seluruh orang dewasa, mendukung “Amerika Serikat yang terus berperang . . . perang melawan
terorisme untuk membunuh atau menangkap mereka yang merencanakan atau mendukung serangan 11 September.” ... pada

• Terkait dukungan AS terhadap negara-negara lain yang memerangi teroris di negaranya, masyarakat masih bersikap ragu-ragu.
Mayoritas moderat mendukung dukungan AS terhadap Israel (63%) dan Inggris di Irlandia Utara (56%). Masyarakat hampir terpecah
mengenai apakah pemerintah AS harus mendukung pemerintah India, pemerintah Rusia atau pemerintah Spanyol terhadap mereka
yang menyerang mereka di Kashmir, Chechnya dan wilayah Basque. Dan sebagian besar masyarakat menentang dukungan AS
terhadap pemerintah Tiongkok di Tibet (68%) atau terhadap “kediktatoran yang tidak demokratis, totaliter, atau militer” (64%).
Machine Translated by Google

378 Buku Panduan Analisis Kebijakan Publik

• Mayoritas 58 persen orang dewasa percaya bahwa “penggunaan bom dan senjata untuk melawan . . . pemerintah yang tidak
memberikan rakyatnya hak untuk menentukan masa depan mereka sendiri melalui pemilihan umum demokratis yang bebas”
dapat dibenarkan.
• Mayoritas 57 persen masyarakat mengatakan bahwa mereka “menganggap orang-orang yang berjuang untuk menggulingkan
pemerintahan yang diktator, militer, atau tidak demokratis” sebagai pejuang kemerdekaan, dan hanya 11 persen yang
menganggap mereka sebagai teroris.

• Ketika keadaan pemerintah cukup buruk, hampir semua orang berpikir bahwa penggunaan bom dan senjata terhadap pemerintah
dapat dibenarkan. Ketika diberitahu tentang upaya perwira Jerman untuk mengebom dan membunuh Hitler selama Perang
Dunia II, 89 persen orang dewasa mengatakan bahwa “membunuh orang adalah hal yang dibenarkan secara moral jika Anda
tidak mempunyai cara lain untuk melawan pemerintahan yang sangat buruk atau pemimpin."

Kesimpulan dari jajak pendapat ini adalah masyarakat bingung mengenai apa itu terorisme dan apa yang bukan. Tidak jelas
bagaimana informasi ini dapat membantu para pembuat kebijakan atau, dalam hal ini, bagaimana informasi ini dapat membantu
masyarakat yang memberikan bantuan. Terorisme adalah subjek rumit yang memerlukan pemikiran tentang banyak peristiwa dalam
sejarah manusia, mempertimbangkan keuntungan dan kerugian berbagai bentuk partisipasi dalam konteks berbeda, dan memahami
berbagai perilaku manusia. Sulit untuk memahami bagaimana penyederhanaan realitas melalui serangkaian pertanyaan yang
memberikan hasil yang bertentangan akan berkontribusi terhadap perbaikan kebijakan publik, yang merupakan salah satu tujuan jelas
dari analisis kebijakan.

KESIMPULAN

Fakta bahwa terdapat permasalahan dalam penggunaan survei tidak berarti survei harus dihilangkan dari proses kebijakan. Yang
dibutuhkan adalah pertimbangan yang lebih hati-hati mengenai cara penggunaannya dan pemahaman yang lebih baik mengenai
kemungkinan penyalahgunaannya. Sederhananya, pengetahuan adalah kunci kunci pemanfaatan yang baik.
Dalam hal ini, para pendidik harus mengerahkan lebih banyak upaya untuk mengkaji survei dalam buku teks analisis kebijakan dan di
ruang kelas perguruan tinggi. Akademisi harus menyadari bagaimana mereka melaporkan hasil survei di jurnal profesional karena
mereka secara implisit menetapkan standar bagaimana menilai nilai survei yang dilakukan di dunia politik dan administrasi. Saat
menyajikan temuan penelitian survei, setiap orang wajib menjelaskan metodologinya secara menyeluruh.

Ketelitian dapat membantu menghilangkan kesalahan, mengungkap bias, dan menunjukkan bagaimana hasil harus digunakan.
Laporan survei yang merinci bagaimana pertanyaan diajukan, mencatat semua aspek prosedur pengambilan sampel, dan menjelaskan
analisis statistik akan lebih mungkin digunakan dan dipahami. Dan ketika unsur-unsur penelitian survei diikuti dengan cermat dan
permasalahan dalam penelitian survei dapat dihindari, penggunaan survei dalam analisis kebijakan akan berkurang dan lebih mungkin
menghasilkan kebijakan publik yang baik.

REFERENSI

Benson, Paul R. (1981). Keterasingan Politik dan Kepuasan Masyarakat Terhadap Pelayanan Kepolisian. Pasifik c Sosiologis
Ulasan 24(1): 45–64.
Berinsky, Adam J. (2004). Suara Senyap: Opini Publik dan Partisipasi Politik. Princeton, NJ: Princeton
Pers Universitas.
Christenson, James A., dan Gregory S. Taylor. (1983). Konteks yang Dikonstruksi Secara Sosial dan Situasional Untuk
Penilaian Pelayanan Publik. Triwulanan Ilmu Sosial 64(2): 264–274.
Dillman, Don. (2000). Survei Surat dan Internet: Metode Desain yang Disesuaikan. New York: Wiley.
Koalisi Aksi Wanita Pusat Kota. (2001). Penilaian Kebutuhan Perempuan di Pusat Kota: Temuan dan Rekomendasi
perbaikan.
Glaser, Mark A., dan John W. Bardo. (1994). Pendekatan Lima Tahap Untuk Peningkatan Penggunaan Survei Warga di
Keputusan Investasi Publik. Tinjauan Pemerintah Negara Bagian dan Lokal 26(3): 161–172.
Machine Translated by Google

Penggunaan (dan Penyalahgunaan) Survei dalam Analisis Kebijakan 379

Hijau, Josuha. (2002). Ruang Perang Lainnya: Presiden Bush Tidak Percaya pada Jajak Pendapat—Tanyakan Saja pada Petugas
Jajak Pendapatnya. Bulanan Washington, (April).
Jajak Pendapat Harris. (2004). http://www.harrrispoll.com.
Kelly, Janet, dan David Swindell. (2002). Pendekatan Multi-Indikator Terhadap Evaluasi Pelayanan Kota: Mengkorelasikan
Pengukuran Kinerja dan Kepuasan Warga di Seluruh Yurisdiksi. Tinjauan Administrasi Publik 62(5): 610–621.

Lynam, Donald R., Richard Milich, Rick Zimmerman, Scott P. Novak, TK Logan, Catherine Martin, Carl Leukefeld, dan Richard
Clayton. (1999). Proyek DARE: Tidak Ada Efek pada Tindak Lanjut 10 Tahun. Jurnal Konsultasi dan Psikologi Klinis 67,
No. 4 (Agustus): 590–593.
Miller, Thomas L., dan Michelle A. Miller-Kobayahsi. (2000). Survei Warga: Bagaimana Melakukannya, Cara Menggunakannya
Mereka, Apa Artinya. Washington, DC: Asosiasi Manajemen Kota Internasional.
Nardi, Peter M. (2003). Melakukan Penelitian Survei: Panduan Metode Kuantitatif. New York: Manusia Panjang.
O'Sullivan, Elizabethann, Gary R. Rassal, dan Maureen Berner. (2004). Metode Penelitian Admin Publik
istrator. New York: Manusia Panjang.
Posavac, Emil J., dan Raymond G. Carey. (2003). Evaluasi Program: Metode dan Kasus. Sungai Saddle Atas, NJ: Prentice Hall.

Proyek BERANI (2004). http://www.dare.com.


Pers Perintis St. (2001). Sedikit Dukungan untuk Pembiayaan Publik untuk Stadion Kembar, (1 November), Internet
edisi.
Swindell, David, dan Janet Kelly. (2000). Menghubungkan Data Kepuasan Masyarakat dengan Ukuran Kinerja. Publik
Tinjauan Kinerja & Manajemen 24(1): 30–52.
Thompson, Lyke. (1997). Sikap Masyarakat tentang Mode Pemberian Layanan. Jurnal Urusan Perkotaan 19(3):
291–302.
Weimer, David L. Weimer, dan Aidan R. Vining. (2005). Analisis Kebijakan: Konsep dan Praktik. New York:
Aula Prentice.
Webb, Kenneth, dan Harry P. Hatry, H. (1973). Mendapatkan Umpan Balik Warga. Washington, DC: Perkotaan
Institut Pers.
Machine Translated by Google
Machine Translated by Google

25 Eksperimen Sosial dan


Kebijakan publik

Caroline Danielson

PERKENALAN

Eksperimen sosial secara acak menugaskan orang-orang (atau terkadang sekelompok orang, yaitu lingkungan atau
komunitas) ke dalam kelompok yang tunduk pada satu atau lebih “perlakuan” kebijakan atau kelompok yang terus
tunduk pada norma kebijakan yang berlaku (“pengendalian” ). Misalnya, sebuah eksperimen sosial mungkin menguji
keefektifan program kesejahteraan untuk bekerja dengan secara acak menugaskan pelamar kesejahteraan ke
program baru tersebut (mungkin pencarian kerja intensif dan terbimbing yang dikombinasikan dengan penyediaan
layanan seperti bantuan transportasi dan penitipan anak bersubsidi) dan mengikuti standar lama, yang menyerahkan
inisiatif untuk mencari pekerjaan sepenuhnya berada di tangan penerima kesejahteraan.1
Merupakan standar bagi mereka yang melakukan eksperimen untuk menyatakan bahwa metodologi mereka
adalah satu-satunya metodologi yang dapat dengan pasti mengisolasi dampak program yang sedang dievaluasi.
Eksperimen sosial saja dapat memastikan bahwa “perbedaan apa pun yang muncul dari waktu ke waktu dalam hal
lapangan kerja, pendapatan, atau hasil relevan lainnya dapat dikaitkan dengan program” (Berlin 2002, 3). Namun ini
bukan sekedar klaim yang beredar di komunitas riset. Eksperimen sosial juga mendapat penghormatan dari mereka
yang merancang kebijakan sosial (Baum 1991; Greenberg, Linksz, dan Mandell 2003; Greenberg, Mandell, dan
Onstott 2000; Haskins 1991). Eksperimen sosial menghasilkan rasa hormat ini karena tampaknya menawarkan
jawaban yang mudah diakses dan tidak dapat disangkal terhadap pertanyaan paling mendesak dalam penelitian
evaluasi: apakah program X menyebabkan hasil Y?2
Dalam bab ini, saya mengkaji faktor-faktor utama yang membuat eksperimen sosial menarik bagi para peneliti
dan pembuat kebijakan. Ciri-ciri eksperimen sosial ini tampaknya perlu ditelusuri karena tampaknya terdapat
konsensus di antara para peneliti dan pembuat kebijakan bahwa eksperimen merupakan standar emas dalam
evaluasi kebijakan. Sejauh konsensus ini ada, hal ini menghilangkan satu hambatan dalam penerapan penelitian
ilmu sosial dalam pembuatan kebijakan. Eksperimen sosial menjanjikan untuk menjadi penentu pilihan-pilihan politik
yang ketat dan lugas—sebuah metode yang sangat cocok untuk pembagian kerja yang menyerahkan pilihan tujuan
kepada pembuat kebijakan dan penilaian sarana kepada para ahli teknis.

Konsensus tersebut jelas tidak berarti bahwa hanya bukti dari eksperimen sosial yang akan digunakan dalam
proses kebijakan, atau bahkan penelitian apa pun akan memandu pembuatan kebijakan. Literatur yang menjelaskan
penggunaan sebenarnya penelitian dalam pembuatan kebijakan juga sangat luas. Greenberg, Linksz, dan Mandell
(2003) mengeksplorasi pengaruh eksperimen sosial dalam arena kebijakan kesejahteraan terhadap pembuat
kebijakan negara, dan Weaver (1999) meneliti peran penelitian kebijakan dalam perdebatan mengenai “mengakhiri

1. Saya menggunakan contoh-contoh dari bidang kebijakan kesejahteraan untuk menggambarkan prinsip-prinsip dan kelemahan
eksperimen sosial; namun, eksperimen sosial juga digunakan dalam bidang kebijakan sosial lainnya, termasuk kejahatan,
pendidikan, dan kesehatan. Untuk daftar eksperimen sosial besar yang dilakukan di Amerika Serikat, lihat Greenberg dan
Shroder (2004).
2. Saya fokus pada pengujian keefektifan suatu program, meskipun data eksperimen dapat digunakan untuk tujuan lain—misalnya,
menghitung penghitungan biaya-manfaat.

381
Machine Translated by Google

382 Buku Panduan Analisis Kebijakan Publik

kesejahteraan seperti yang kita kenal” yang terjadi pada tahun 1990an. Aaron dan Todd (1979) melaporkan pengaruh
eksperimen sosial sebelumnya terhadap kebijakan. Sebagai contoh penelitian lain yang meneliti secara lebih umum
penggunaan penelitian ilmu sosial dalam pembuatan kebijakan (lihat Danziger 2001; Haveman 1976; Hird 2005; Jones
1976; Lindblom dan Cohen 1979; Rich 2001; Shulock 1999; Stone 1997; Szanton, 1981).
Tentu saja, pembuat undang-undang dapat memilih apakah akan meminta, atau menggunakan, penelitian ilmiah sosial
untuk mengevaluasi usulan kebijakan meskipun pilihan mereka dibatasi oleh norma-norma yang berlaku mengenai
penerapan penelitian terhadap pengembangan dan evaluasi kebijakan. Bab ini akan mengkaji aspek-aspek kunci dari
norma-norma yang berlaku mengenai eksperimen sosial.
Sejumlah aspek penting dari eksperimen sosial telah dibahas secara luas di tempat lain: isu-isu teknis (misalnya
pengurangan selektif, penentuan dampak perlakuan), definisi perlakuan (apakah hanya jenis kebijakan tertentu yang
diuji? apakah program diuji secara intensif? cara yang cukup?), dan kepraktisan menjalankan eksperimen (mendapatkan
partisipasi berkomitmen dari lembaga-lembaga yang melaksanakan kebijakan, menyampaikan pesan secara memadai).
Diskusi terbaru termasuk Gennetian dkk. (2002), Grogger dan Karoly (2005), Haveman (1987), Heckman dalam Manski
dan Garfi nkel (1992), Lalonde (1995), dan Orr (1999).

Saya fokus di sini untuk mengungkap dua aspek eksperimen yang diterima dan menjadikannya menarik bagi
pembuat kebijakan: kemampuan mereka untuk mengisolasi penyebab dan transparansi metodologis mereka. Eksperimen
menawarkan manfaat-manfaat ini, namun bukan dengan cara yang tidak memenuhi syarat: eksperimen bukanlah
resep yang lengkap untuk evaluasi kebijakan. Saya juga menjawab pertanyaan etis yang diajukan oleh eksperimen
sosial. Saya berpendapat bahwa tidak adanya perdebatan nyata mengenai etika merupakan bukti lebih lanjut bahwa
eksperimen sosial adalah metodologi yang sudah mapan baik dari sudut pandang peneliti maupun pembuat kebijakan.
Argumen saya sejalan dengan diskusi lain tentang bagaimana metodologi dapat diutamakan dibandingkan perdebatan
substantif mengenai tujuan yang ingin dicapai oleh masyarakat demokratis dan cara-cara yang diperbolehkan untuk
digunakan untuk mencapai tujuan tersebut (Fischer 1990; Fischer 2003; Stone 1993) .
Setelah membuat sketsa sejarah eksperimen sosial di bagian berikutnya dan merangkum hal-hal penting dalam
melakukan eksperimen di bagian ketiga, saya membahas daya tarik intelektual utama dari eksperimen di bagian keempat
—kemampuan mereka untuk mengisolasi program dari peristiwa lain yang membentuk hasil subjek—dan di bagian
kelima saya membahas daya tarik politik utama dari eksperimen—yang saya sebut sebagai transparansi. Pada bagian
keenam saya meninjau pembenaran etis standar eksperimen sosial.

EVOLUSI EKSPERIMENTASI SOSIAL

Greenberg, Linksz, dan Mandell (2003) mengulas sejarah eksperimen sosial dan The Digest of Social Experiments
menjelaskan semua eksperimen sosial yang dilakukan hingga saat ini di Amerika Serikat (Green berg dan Shroder
2004). Ketika eksperimen sosial skala besar pertama kali diusulkan pada tahun 1960an, hal ini merupakan penyimpangan
dari praktik normal penelitian kebijakan. Bukti dari hal ini adalah bahwa kapasitas organisasi harus dibangun untuk
menangani permintaan baru: Manpower Demonstration Research Cor poration (sekarang hanya MDRC) sebuah
organisasi penelitian nirlaba dan non-partisan, dengan pendanaan awal dari Ford Foundation, adalah tujuannya.
-dibangun pada awal tahun 1970-an untuk menyelenggarakan Demonstrasi Kerja yang Didukung Nasional (Gueron
2000; Manski dan Garfi nkel 1992).3 Sejumlah organisasi lain juga memperlengkapi diri untuk melakukan eksperimen
(misalnya, Mathematica Policy Research, Abt Associates, Rand, unit penelitian terorganisir di beberapa universitas
besar). Skala dan cakupan kerja sama antara lembaga sipil dan peneliti juga belum pernah terjadi sebelumnya.

Haveman (1987) mencatat bahwa penelitian kemiskinan, dan organisasi yang mampu melatih para peneliti dan
melaksanakan penelitian, pada dasarnya dibentuk oleh Perang Melawan Kemiskinan, yang menyediakan pendanaan
dan lokasi lembaga federal untuk merangsang penelitian kebijakan di bidang ini. Intisari _

3. Ford Foundation juga mendanai pengembangan beberapa sekolah kebijakan publik (Haveman 1987), sebelum
mungkin untuk mengembangkan kapasitas untuk melakukan penelitian yang cermat dan relevan dengan kebijakan.
Machine Translated by Google

Eksperimen Sosial dan Kebijakan Publik 383

Penelitian Eksperimen Sosial mengungkapkan bahwa sebagian besar eksperimen sosial dilakukan dengan populasi
miskin sebagai subyek dalam bidang program yang mencakup kesehatan, pekerjaan, serta pendidikan dan pelatihan
(lihat Greenberg dan Shroder 2004).
Eksperimen sosial pertama, Eksperimen Pajak Penghasilan Negatif New Jersey (NIT), dilakukan oleh
Mathematica di bawah kontrak dari Institut Penelitian Kemiskinan Universitas Wisconsin. Eksperimen ini memiliki
beberapa kelompok perlakuan, yang masing-masing kelompok dikenakan kombinasi berbeda antara pendapatan
minimum yang dijamin dan tarif pajak atas pendapatan yang diperoleh di atas jaminan tersebut.
Tujuan utamanya adalah untuk menguji apakah orang dewasa akan mengurangi jam kerja mereka jika mereka tahu
bahwa mereka dijamin mendapat penghasilan minimum. Menurut seorang pengamat, tidak jelas bahwa mengubah
pendapatan individu secara eksperimental adalah hal yang etis. Melakukan NIT di New Jersey dibenarkan dengan
alasan bahwa tidak ada cara lain untuk mendapatkan jawaban atas pertanyaan tentang tanggapan individu terhadap
jaminan pendapatan (Haveman 1987).
Penting untuk disadari bahwa eksperimen pada awalnya dimaksudkan untuk digunakan bersama dengan
simulasi guna memberikan cara memproyeksikan dampak berbagai kebijakan. Menurut Haveman (1987), menulis
setelah gelombang pertama eksperimen sosial pada tahun 1970an berakhir, tujuan dari semua eksperimen ini adalah
untuk memperkirakan parameter struktural seperti respons perilaku (yang dinyatakan, misalnya, dalam jam kerja)
terhadap manipulasi pendapatan melalui kebijakan pajak. Artinya, selama asumsi dapat dipertahankan bahwa
perilaku individu dalam menanggapi insentif seperti pendapatan tambahan adalah konstan sepanjang waktu dan
tempat dan bervariasi dengan lancar, sebuah eksperimen yang menugaskan kelompok ke beberapa gradasi
perlakuan kebijakan pajak dapat digunakan untuk memperkirakan dampaknya. dampak berbagai kebijakan
perpajakan terhadap jam kerja.
Namun, menurut ekonom James Heckman, seiring dengan kemajuan eksperimen NIT, tujuannya menjadi
semakin terbatas: tujuannya adalah menghitung dampak rata-rata program (Heckman dalam Manski dan Garfi nkel
1992). Alih-alih satu atau beberapa eksperimen memberikan bahan mentah yang memungkinkan peneliti
mensimulasikan respons perilaku terhadap serangkaian kebijakan hipotetis, eksperimen hanya akan memberikan
perbedaan hasil antara kelompok perlakuan dan kelompok kontrol untuk kebijakan atau kebijakan yang diteliti.
Eksperimen jenis ini disebut eksperimen “kotak hitam” karena peneliti tidak membuat klaim yang kuat tentang
penyebab yang mendasari hasil; fokus mereka adalah melaporkan hasil dari perlakuan kebijakan tertentu.

Pengurangan ambisi peneliti sebagian disebabkan oleh kesulitan teknis dalam mengumpulkan data yang
memadai untuk melakukan simulasi tanggapan terhadap serangkaian kebijakan hipotetis. Hasil NIT khususnya tidak
sebersih yang diharapkan. Tampaknya tanggapan tersirat terhadap berbagai kebijakan pajak yang dihitung oleh para
peneliti bergantung pada data pendapatan yang dilaporkan sendiri, sehingga tidak lengkap, serta data eksperimen,
dan perhitungan tersebut tidak menghasilkan pola tanggapan yang mulus. Namun mengabaikan pendekatan
eksperimen yang lebih sarat teori ini mungkin juga mengkhianati pemahaman bahwa pendekatan yang lebih mudah
dikomunikasikan akan lebih menarik bagi para pembuat kebijakan.
Eksperimen kotak hitam melaporkan hasilnya, mengaitkannya dengan pengobatan, dan berhenti di situ.
Tujuan dalam melakukan eksperimen sosial telah jelas bergeser ke memperkirakan dampak rata-rata dari
perlakuan tersebut (Greenberg, Linksz, dan Mandell 2003). Cara melakukan eksperimen sosial inilah yang telah
mendapatkan persetujuan dari para pembuat kebijakan dan mendukung pernyataan percaya diri yang dibuat oleh
organisasi seperti MDRC tentang ketelitian metodologi evaluasi eksperimental. Sebagaimana dinyatakan oleh
presiden MDRC saat itu, “Dengan penugasan acak, Anda dapat mengetahui sesuatu dengan lebih pasti dan, sebagai
hasilnya, dapat lebih percaya diri memisahkan fakta dari advokasi” (Gueron 2000, 1).
Perasaan bahwa eksperimen kotak hitam adalah standar emas penelitian evaluasi telah berkembang pada
akhir tahun 1980an. Menurut mereka yang berperan penting dalam mengembangkan bahasa legislatif untuk
perombakan program Bantuan untuk Keluarga dengan Anak Tanggungan (AFDC) pada tahun 1988, Undang-Undang
Dukungan Keluarga (FSA), bukti eksperimental dari sejumlah proyek kesejahteraan untuk bekerja yang dilakukan
MDRC memainkan peran yang menentukan (Baum 1991; Haskins 1991). Hal ini terjadi karena sejumlah alasan
(waktu yang tidak disengaja, kemampuan MDRC untuk menyebarkan hasil secara luas dan tepat waktu serta
mempertahankan sikap non-partisan), namun termasuk tidak adanya perdebatan di kalangan peneliti mengenai
Machine Translated by Google

384 Buku Panduan Analisis Kebijakan Publik

hasil dan penghormatan yang diberikan oleh metodologi tersebut. FSA memasukkan ketentuan untuk evaluasi dampaknya
menggunakan eksperimen acak.
Beberapa tahun kemudian, ketentuan yang jarang digunakan dalam Judul IV-A, Bagian 413 Undang-Undang
Jaminan Sosial yang menyatakan bahwa persyaratan federal untuk AFDC dapat diabaikan oleh Sekretaris Departemen
Kesehatan dan Layanan Kemanusiaan AS, dieksploitasi untuk mengizinkan negara bagian secara luas untuk
bereksperimen dengan program AFDC mereka pada awal dan pertengahan tahun 1990an. Pasal 413 menyatakan bahwa
“Sekretaris dapat membantu Negara-negara dalam mengembangkan, dan harus mengevaluasi, pendekatan-pendekatan
inovatif untuk mengurangi ketergantungan pada kesejahteraan dan meningkatkan kesejahteraan anak-anak di bawah
umur yang tinggal di rumah”. Ia melanjutkan, “Dalam melakukan evaluasi…, Sekretaris harus, semaksimal mungkin,
menggunakan penugasan acak sebagai metodologi evaluasi” (42 USC 613).
Meskipun mendapatkan persetujuan untuk pengecualian terhadap peraturan program AFDC yang ada tampaknya
menjadi cukup mudah pada pertengahan tahun 1990an—pemerintahan Clinton tidak ingin dianggap menghalangi upaya
reformasi negara bagian—Administrasi untuk Anak dan Keluarga biasanya mewajibkan negara bagian untuk melakukan
uji coba secara acak. evaluasi program mereka, suatu persyaratan yang menghasilkan banyak data yang tidak akan ada
jika tidak ada. Empat puluh tiga negara bagian memperoleh keringanan antara bulan Januari 1993 dan Agustus 1996,
meskipun tidak setiap negara bagian benar-benar menerapkan program pelepasan hak tersebut (Boehnen dan Corbett
1996; Gordon, Jacobson, dan Fraker 1996). Dengan dorongan ini, sejumlah besar eksperimen sosial dimulai pada tahun
1990an.4 Jadi, dapat dikatakan bahwa awal dan pertengahan tahun 1990an merupakan titik puncak dalam evaluasi
kebijakan karena meluasnya penggunaan metodologi eksperimental.

Meskipun laju eksperimen di bidang kebijakan kesejahteraan telah melambat, para komentator terus menyerukan
evaluasi eksperimental terhadap usulan kebijakan yang baru masuk dalam agenda nasional.
Misalnya, ringkasan kebijakan yang diterbitkan oleh Brookings Institution mendukung evaluasi eksperimental terhadap
program pemerintah untuk mendorong pernikahan sebagai cara untuk meredakan kontroversi mengenai kepantasan
program tersebut—jika program yang mendorong pasangan untuk menikah meningkatkan angka pernikahan, maka,
mungkin, ada kekhawatiran mengenai intervensi dalam hal ini. kehidupan pribadi individu akan berkurang (Haskins dan
Offner 2003). Pada saat yang sama, alasan untuk melakukan evaluasi eksperimental terhadap usulan kebijakan juga
semakin meningkat di bidang kebijakan lainnya. Sebagaimana dibuktikan dalam UU No Child Left Behind tahun 2002,
para pembuat kebijakan kini menganjurkan evaluasi proposal kebijakan di bidang pendidikan dengan menggunakan
metodologi eksperimental (Glenn 2004; Mosteller dan Boruch 2002).

Mur dan Baut Eksperimen

Untuk melakukan percobaan, peneliti secara acak menugaskan beberapa anggota kelompok sasaran untuk program
yang sedang dipelajari dan beberapa untuk program saat ini. Dampak pengobatan diukur sebagai perbedaan rata-rata
antara kelompok perlakuan dan kelompok kontrol terhadap ukuran yang relevan (misalnya pendapatan, prestasi
pendidikan, kesehatan mental). Artinya, berapa banyak (atau lebih sedikit) pendapatan yang diperoleh kelompok
perlakuan pada akhir periode penelitian dibandingkan pendapatan kelompok kontrol? Atau, seberapa tinggi (atau rendah)
skor kelompok perlakuan pada tes standar yang diberikan pada kedua kelompok?
Validitas internal adalah kekuatan metodologi inti eksperimen. Menugaskan anggota kelompok sasaran secara
acak ke dalam kelompok pembanding perlakuan dan kontrol memastikan bahwa mereka secara statistik setara baik
dalam karakteristik terukur maupun tidak. Karena penyesuaian dapat dilakukan untuk perbedaan karakteristik yang
diukur, masalah yang dihadapi metode penelitian lain adalah ketidakmampuannya secara metodologis mengesampingkan
perbedaan sistematis antara perbandingan non-eksperimental.

4. Program yang dievaluasi meliputi Program Investasi Keluarga Minnesota (MFIP), Program Investasi Keluarga
Florida (FIP), Proyek Restrukturisasi Kesejahteraan Vermont (WRP), program EMPOWER Arizona, program
Jobs First Connecticut, Program Investasi Keluarga Iowa (FIP), dan Program Penempatan Tenaga Kerja dan
Pelatihan Komprehensif Indiana (IMPACT).
Machine Translated by Google

Eksperimen Sosial dan Kebijakan Publik 385

kelompok berdasarkan karakteristik yang tidak terukur.5 Eksperimen memungkinkan kita untuk menyatakan dengan
yakin bahwa tidak ada perbedaan (secara statistik) antara kelompok pembanding eksperimen berdasarkan karakteristik
yang tidak terukur. Oleh karena itu, setiap perbedaan antar kelompok yang diukur selanjutnya dapat dikaitkan dengan
perlakuan yang diberikan, dalam batas kepastian yang diberikan oleh statistik.
Untuk menjamin validitas internal eksperimen, peneliti harus berhasil mengacak peserta antara tes dan program
standar. Hal ini melibatkan pengembangan protokol untuk pengacakan awal yang mudah dan tidak mudah dimanipulasi
oleh pihak yang menerapkan protokol tersebut. Hal ini lebih lanjut melibatkan memastikan bahwa anggota kelompok
kontrol tidak menyeberang dan mendapatkan program yang disediakan untuk kelompok perlakuan. Hal ini juga
mengharuskan anggota kelompok perlakuan menyadari bahwa mereka tunduk pada aturan program yang berbeda dari
kelompok kontrol. Untuk pembahasan yang lebih luas tentang kepraktisan melakukan eksperimen, lihat Boruch (1997),
Hausman dan Wise (1985), dan Orr (1999).

Penting untuk memperjelas hasil apa yang dapat diukur secara eksperimental. Hasil eksperimen yang dapat
diukur bergantung pada titik terjadinya pengacakan.
Misalnya, jika beberapa penerima bantuan sosial ditetapkan untuk memiliki batasan jumlah bulan mereka berhak
menerima bantuan tunai dan ada pula yang tidak, maka hasil eksperimen yang dapat diukur adalah dalam kaitannya
dengan paparan terhadap batasan waktu tersebut . Misalnya, apakah mereka yang memiliki batasan waktu mendapatkan
pekerjaan lebih cepat dibandingkan mereka yang tidak memiliki batasan waktu? Atau, apakah mereka menggunakan
bulan kesejahteraan yang lebih sedikit dalam jangka waktu tertentu? Pengaruh batas waktu terhadap pendapatan dan
kesejahteraan mereka yang mencapainya dalam kelompok eksperimen bukanlah hasil eksperimen, karena kedua
kelompok tidak ditugaskan secara acak untuk mencapai batas waktu tersebut. Dimungkinkan untuk membandingkan
subkelompok yang ditentukan oleh karakteristik awal kelompok perlakuan dan kelompok kontrol karena kelompok
tersebut (secara statistik) identik pada ukuran-ukuran tersebut. Misalnya saja, kita bisa membandingkan perbedaan
antara penerima kesejahteraan jangka panjang yang ditugaskan pada kelompok yang tunduk dan tidak tunduk pada batas waktu.
Hal yang terkait adalah bahwa hasil eksperimen diukur sebagai perbedaan antara mereka yang menandatangani
program dan yang tidak ditugaskan. Dampak dari program baru seringkali tidak sama dengan dampak yang diukur
melalui percobaan karena tidak semua orang mendapatkan program tersebut. Misalnya, beberapa dari mereka yang
dimasukkan ke dalam kelompok perlakuan yang memenuhi syarat untuk serangkaian layanan pencarian kerja tidak
akan memanfaatkan layanan apa pun, atau hanya sebagian dari layanan tersebut.6 Yang terakhir, dampak program
terhadap peserta atau Jumlah mereka yang diacak agar memenuhi syarat untuk mengikuti program tidak sama dengan
dampak terhadap populasi jika program baru menjadi kebijakan karena eksperimen biasanya tidak secara acak
menetapkan seluruh populasi target ke dalam kelompok perlakuan dan kontrol. Hal krusial pertama di sini adalah bahwa
program baru mungkin akan mengubah jumlah pelamar. Misalnya, dengan adanya batasan waktu, beberapa dari
mereka yang sebelumnya langsung mengajukan permohonan bantuan tunai ketika kehilangan pekerjaan mungkin akan
bertahan selama beberapa bulan, karena menyadari bahwa mereka kini hanya memiliki beberapa bulan untuk memenuhi
syarat untuk mendapatkan bantuan tersebut. bantuan tunai.7 Alasan kedua adalah jika sebuah program baru diterapkan
secara luas, hal ini dapat mengubah lingkungan yang lebih luas di mana program tersebut dijalankan (yang disebut
efek “makro”) dengan cara yang tidak akan dilakukan oleh program percontohan kecil yang telah diuji secara eksperimental.
Misalnya, program pencarian kerja, jika dilaksanakan untuk semua penerima kesejahteraan, dapat mengubah pasar
tenaga kerja bagi pekerja berpenghasilan rendah, sehingga mengubah efektivitas program pencarian kerja.

5. Para peneliti yang menggunakan metode non-eksperimental dapat berargumentasi bahwa, karena alasan teoretis dan praktis, kecil
kemungkinan kelompok pembanding tersebut berbeda dalam karakteristik yang tidak terukur.
6. Eksperimen penugasan acak, dengan asumsi tertentu, mempunyai penduga variabel instrumental yang dapat digunakan untuk
memperkirakan pengaruh rata-rata perlakuan terhadap perlakuan (Angrist et al., 1996; Gennetian et al., 2002).

7. Meskipun dimungkinkan untuk secara acak menetapkan sampel dari seluruh populasi sasaran ke kelompok perlakuan dan kontrol,
hal ini akan lebih mahal (dan dalam banyak kasus sangat mahal) karena sampel yang cukup besar harus diacak untuk mendeteksi
efek pengobatan. Besarnya sampel ini akan bergantung pada tingkat penerapan program yang diharapkan di antara anggota
populasi sasaran.
Machine Translated by Google

386 Buku Panduan Analisis Kebijakan Publik

KONSEP KAUSALITAS

Berikut adalah versi sederhana dari pertanyaan inti yang ingin dijawab oleh pembuat kebijakan ketika mereka melakukan evaluasi
kebijakan: Jika kita menerapkan program X, apakah program Y akan menghasilkan hasil (atau, dalam kasus program yang sudah
dilaksanakan: Apakah program X menghasilkan hasil Y yang kita impikan)?
Evaluasi kebijakan pada dasarnya adalah pengujian sarana. Dengan menyederhanakan kompleksitas nyata dari proses pembuatan
kebijakan, kita dapat mengatakan bahwa pembuat kebijakan berusaha untuk mencapai suatu tujuan. Evaluasi ideal terhadap
suatu kebijakan akan menjawab pertanyaan, apakah suatu cara tertentu dapat membawa kita menuju tujuan tersebut jika
dibandingkan dengan cara lain?

Inilah pertanyaan yang dijawab oleh eksperimen sosial: Rata-rata, terdapat (atau tidak ada) perbedaan yang signifikan
secara statistik (pada tingkat konvensional) antara hasil kelompok perlakuan T dan kelompok kontrol C pada ukuran M (hasil Y) di
percobaan di mana program X diuji.
Misalnya, jika pembuat kebijakan ingin mengetahui apakah program kesejahteraan untuk bekerja yang menekankan proses
pencarian pekerjaan (X) meningkatkan kesejahteraan anak (Y), peneliti akan merancang eksperimen yang secara acak menetapkan
beberapa (T) ikut serta dalam rangkaian kegiatan pencarian kerja dan yang lainnya tidak (C). Kesejahteraan anak (Y) dapat diukur,
antara lain, dengan mensurvei orang tua mengenai perilaku bermasalah yang mungkin ditunjukkan anak mereka (M).

Apakah pertanyaan yang secara implisit diajukan oleh para pembuat kebijakan sama dengan pertanyaan yang diajukan oleh
para peneliti? Perbedaan utama antara dua pertanyaan yang diajukan di atas adalah kemampuan generalisasi. Tampak jelas dari
kerangka pertanyaan pertama di atas bahwa pembuat kebijakan tertarik pada hasil umum, atau sesuatu yang menyerupai perilaku
hukum. Jika program X didanai, maka hasil Y akan selalu (atau biasanya) diperoleh. Namun eksperimen tidak memberi tahu kita
apa pun secara langsung tentang hukum seperti halnya perilaku. Kebaikan metodologisnya justru berasal dari validitas internalnya.
Artinya, eksperimen adalah cara yang ampuh untuk menghubungkan dampak intervensi, dan bukan faktor lain, terhadap hasil yang
diamati oleh peneliti. Eksperimen mencapai hal ini dengan mengajukan kontrafaktual: apa yang akan terjadi seandainya program
tersebut tidak ada? Oleh karena itu, peneliti menggunakan eksperimen untuk mengidentifikasi penyebab dengan menggunakan
bukti dari kejadian unik, bukan berdasarkan pengamatan terhadap keteraturan atau deduksi logis.8

Mengingat ketertarikan para pembuat kebijakan terhadap pertanyaan yang lebih umum, maka kecenderungan alamiahnya
adalah melakukan generalisasi. Oleh karena itu, terjadilah kesalahan yang wajar: para peneliti dan pembuat kebijakan
memperlakukan eksperimen tersebut sebagai prediksi hasil di waktu dan tempat lain yang “cukup serupa”. Tapi apa yang dianggap cukup mirip?
Seperti apa garis besar argumen yang digeneralisasikan dari satu eksperimen tertentu?
Ada dua elemen kunci: (1) mengidentifikasi mekanisme perilaku paling penting yang menghasilkan hasil, dan (2) mengidentifikasi
fitur-fitur utama dari situasi yang membuatnya cukup mirip dengan situasi eksperimental sehingga individu yang ditempatkan dalam
situasi serupa akan berinteraksi dengan konteksnya. dengan cara yang sama seperti yang dilakukan subjek eksperimen.

Karena eksperimen menggunakan pendekatan kotak hitam, eksperimen tersebut tidak membahas respons perilaku yang
mungkin ditimbulkan oleh program (walaupun peneliti dapat dan memang menggunakan metodologi lain untuk memahami
mekanisme tersebut). Dan tidak seperti peneliti yang melakukan eksperimen laboratorium, mereka yang melakukan eksperimen
sosial tidak mengontrol konteks di mana program kelompok perlakuan dan kontrol dikembangkan. Dalam hal ini, mereka tidak
dapat secara tegas menentukan konteksnya. Setidaknya ada satu alasan kuat untuk meyakini bahwa situasi eksperimen adalah
pengecualian: mereka yang “diobati” tidak buta terhadap situasi mereka, dan mereka yang memberikan perlakuan sering kali
mengetahui keadaan eksperimen—ini adalah perbedaan penting antara eksperimen ganda. uji coba medis buta di mana kelompok
perlakuan dan kelompok kontrol diberi perlakuan dan baik peneliti maupun subjek tidak mengetahui siapa yang menerima perlakuan
dan eksperimen sosial.

Mereka yang menginterpretasikan dampak eksperimental harus membuat kesimpulan tambahan agar dapat
menggeneralisasikan hal-hal di luar contoh yang khusus, dan mereka harus melakukan hal tersebut atas dasar selain alasan yang masuk akal.

8. Max Weber (1949) mengembangkan konsepsi kausalitas ini.


Machine Translated by Google

Eksperimen Sosial dan Kebijakan Publik 387

validitas internal eksperimen tersebut.9 Oleh karena itu, pertanyaan kausal yang dicari jawabannya oleh para pembuat
kebijakan sangat berbeda dengan pertanyaan yang dijawab para peneliti dengan melakukan eksperimen sosial.

TRANSPARANSI METODOLOGI

Mungkin eksperimen harus diinterpretasikan dengan hati-hati karena eksperimen tersebut tidak mengungkap
mekanisme sebab akibat dan karena kesimpulan yang diambil dari eksperimen tersebut tidak mencakup program
yang dilaksanakan dalam konteks lain. Namun sebagai latihan yang berdiri sendiri, eksperimen memiliki keunggulan
dalam menggunakan metodologi yang lebih mudah dipahami dibandingkan metodologi evaluasi lainnya. Selain itu,
eksperimen ini menarik karena menjanjikan untuk menghindari perdebatan “duel dukun” yang meningkatkan politisasi
perdebatan kebijakan: ketika para ahli teknis tidak setuju, hal ini akan melemahkan kredibilitas proposal kebijakan
(Baum 1991).
Janji bahwa eksperimen sosial menghasilkan kebenaran yang lebih cepat dan tidak dapat dibantah dibandingkan
metodologi penelitian lain tampaknya bertumpu pada dua faktor. Pertama, memahami esensi eksperimen sosial
tampaknya tidak memerlukan pelatihan teknis yang tidak dapat diakses oleh pembuat kebijakan dan penasihat
mereka. Kedua, dan yang terkait dengan hal ini, hasil dari eksperimen tidaklah suram: eksperimen yang andal
memungkinkan para pengamat untuk membedakan secara tajam antara program yang berhasil dan program yang
tidak berdampak pada hasil yang diinginkan.
Ada yang mungkin mengeluh bahwa ujian utama metodologi ilmu sosial di bidang kebijakan seharusnya bukan
terletak pada kurangnya kompleksitas teknisnya, namun keluhan ini tidak tepat sasaran. Garfi nkel, Manski, dan
Michalopoulos mengklaim bahwa eksperimen sosial mendapat preferensi pendanaan dibandingkan penelitian dasar
dalam ilmu-ilmu sosial karena para pembuat kebijakan tidak mampu menafsirkan perselisihan yang dilakukan para
ilmuwan sosial mengenai hasil penelitian kuasi-eksperimental (dalam Manski dan Garfi nkel 1992 ).
Namun ketika, misalnya, para insinyur dan ahli biologi dipekerjakan oleh pembuat kebijakan, mereka menghasilkan
bukti kelayakan (atau ketiadaan) upaya mereka: kendaraan udara tak berawak yang dapat melacak jalan raya,
pesawat tak berawak berukuran terbang yang mengumpulkan bukti fotografis. . Para ilmuwan sosial pada umumnya
menghadapi permasalahan dimana mereka tidak dapat menghasilkan bukti nyata bahwa program-program sosial
berhasil tanpa adanya justifikasi dan penjelasan mengenai metodologi yang mereka gunakan dalam mengambil kesimpulan.
Artinya, program kesejahteraan untuk bekerja harus terbukti efektif; tidak terlihat dari pengamatan sederhana apakah
program tersebut meningkatkan jam kerja subjek atau tidak.
Faktanya, terdapat banyak literatur tentang teknis eksperimen yang halus. Kehalusan ini berkisar dari langkah
program di mana pengacakan terjadi (perbedaan eksperimental harus diukur sehubungan dengan langkah ini) hingga
perbedaan antara niat untuk melakukan pengobatan dan efek dari pengobatan hingga efek makro yang tidak
sepenuhnya ditangkap oleh eksperimen seperti difusi informasi. , pembentukan norma, dan perubahan keseimbangan
pasar.10 Kehalusan ini biasanya hanya mendapat sedikit perhatian ketika peneliti mengkomunikasikan hasil
penelitiannya kepada pembuat kebijakan (lihat, misalnya, Hamilton dkk. 2001, ES-9; Beecroft dkk. 2003, ii).

Perlu dicatat dalam konteks ini bahwa evaluasi eksperimental program kesejahteraan untuk bekerja, di antaranya
yang sangat mengesankan para perumus FSA pada akhir tahun 1980an, kini telah melalui beberapa analisis ulang
yang menimbulkan pertanyaan tentang validitas internal program tersebut. temuannya (Hotz, Imbens, dan Klerman
2001; Walker dkk. 2003). Artinya, terdapat perdebatan di kalangan peneliti mengenai hasil eksperimen yang
mempunyai pengaruh terhadap perumusan pendekatan work-first dalam reformasi negara dan pada akhirnya pada
bentuk kebohongan Bantuan Sementara untuk Keluarga yang Membutuhkan ( TANF) yang menggantikan Aid to
Families with Dependent Children (AFDC) pada tahun 1996. Seperti yang mungkin sering terjadi, perdebatan ilmiah
ini membutuhkan waktu yang lebih lama untuk matang dibandingkan perdebatan kebijakan.

9. Metodologi evaluasi lainnya juga menimbulkan masalah untuk generalisasi. Alamat Manski (1995).
permasalahan ini dalam arti yang lebih luas.

10. Untuk contoh diskusi ini, lihat Manski dan Garfi nkel1992. Lihat Haveman (1987) untuk diskusi
masalah yang dibagikan oleh rangkaian eksperimen sosial pertama.
Machine Translated by Google

388 Buku Panduan Analisis Kebijakan Publik

Faktanya, masuk akal bahwa tujuan eksperimen sosial dan cara pelaporan hasilnya sangat dipengaruhi oleh
keinginan untuk berkomunikasi secara transparan. Seperti yang saya jelaskan di bagian dua, tujuan awal eksperimen para
ekonom adalah untuk memulihkan parameter perilaku struktural yang dapat digunakan untuk mensimulasikan dampak
kebijakan yang sewenang-wenang. Namun tujuan yang lebih ambisius ini dengan cepat dibatalkan, mungkin sebagian
karena tujuan tersebut tidak menarik bagi para pembuat kebijakan.
Lebih jauh lagi, mungkin tampak membingungkan bahwa eksperimen biasanya bersifat agnostik terhadap hasilnya.
Bahkan jika teori atau intuisi memperkirakan bahwa penerima kesejahteraan yang menerima bantuan pencarian kerja
akan mendapatkan pekerjaan pada tingkat yang lebih tinggi dibandingkan mereka yang tidak menerima bantuan, peneliti
melakukan uji hipotesis dua sisi (yaitu, hipotesis alternatifnya adalah perbedaan rata-rata adalah sama). ke nol, bukan
perbedaan rata-rata yang lebih besar dari nol).11 Keengganan untuk memulai dari teori mungkin merupakan bukti lebih
lanjut bahwa eksperimen dimaksudkan untuk transparan, atau bebas asumsi. Alternatifnya, hal ini mungkin merupakan
bukti bahwa para peneliti berusaha sekonservatif mungkin.
Oleh karena itu, wajar jika dikatakan bahwa cara eksperimen sosial dilakukan dipengaruhi oleh kebutuhan pembuat
kebijakan akan kesederhanaan dan kejelasan. Namun menyesatkan jika menyatakan bahwa eksperimen bersifat
transparan secara metodologis.

JUSTIFIKASI ETIS
Seperti yang saya kemukakan di bagian kedua, melakukan percobaan NIT yang pertama dapat diterima karena dipandang
sebagai upaya terakhir: mereka yang mengusulkannya dan mereka yang mendukung penerapannya tidak dapat
membayangkan cara lain untuk menguji tanggapan individu terhadap jaminan pendapatan minimum. . Eksperimen sosial
tidak boleh lagi memenuhi standar yang ketat ini. Hal ini sekarang dianggap tepat: uji coba secara acak adalah etis
kecuali dalam keadaan khusus. Sebagai contoh mengenai standar pertahanan, lihat pernyataan presiden MDRC saat itu
(Gueron 2000): Singkatnya, sumber daya secara umum dapat dianggap terbatas, dan selama lebih banyak orang yang
berpotensi memenuhi syarat untuk mengikuti program ini dibandingkan dengan jumlah orang yang sebenarnya. dilayani,
penugasan acak adalah cara yang adil untuk mengalokasikan sumber daya yang langka.
Yang lebih mendasar, penugasan acak adalah cara untuk menentukan apakah program bermanfaat bagi populasi sasaran
atau tidak. Baik tujuan individu maupun sosial dapat dicapai dengan lebih baik jika program-program yang berhasil
dilaksanakan dengan dana pemerintah.
Meskipun jelas bahwa tidak semua situasi yang berkaitan dengan kepentingan kebijakan rentan terhadap
eksperimen karena alasan etis, versi penugasan acak tampaknya rentan terhadap eksperimen tersebut. Misalnya, tidak
mungkin membayangkan menyerahkan anak kepada orang tua, atau memberikan pendidikan kepada anak, padahal
sangat penting untuk mengetahui seberapa besar perbedaan latar belakang keluarga, dan seberapa besar pengaruh
pendidikan terhadap prestasi anak. Namun ada kemungkinan untuk mempertimbangkan untuk menugaskan orang tua
pada program yang meningkatkan kemungkinan mereka mengembangkan hubungan positif satu sama lain dan anak-anak
mereka (Haskins dan Offner 2003; Dion dkk. 2003). Meskipun program-program yang diusulkan tidak sama dengan
“menetapkan anak-anak kepada orang tua”, pembentukan pilihan-pilihan bahwa program-program ini, jika berhasil, akan
berdampak pada fakta bahwa beberapa anak akan mempunyai hubungan dengan orang tua yang tidak akan mereka miliki jika tidak demikian
Tampaknya mereka dianggap etis karena aspek metodologi yang digunakan.
Para peneliti menunjukkan bahwa jika sumber daya terbatas sehingga hanya sebagian pelamar yang dapat diakomodasi
dalam program ini, maka penugasan acak—yang merupakan ciri khas dari eksperimen sosial—adalah cara yang adil
untuk mendistribusikan peluang untuk berpartisipasi, dan lebih adil daripada cara lain. kemungkinan besar ada cara lain
untuk mengalokasikannya (misalnya, yang pertama datang, yang pertama dilayani). Argumen ini dapat ditentang. Para
peneliti harus memastikan bahwa kelompok perlakuan dan kelompok kontrol cukup besar untuk menghasilkan perkiraan
dampak program yang dapat diandalkan. Tergantung pada besarnya program yang dievaluasi, mereka mungkin
memperingatkan sponsor bahwa lokasi evaluasi perlu meningkatkan upaya perekrutan agar dapat mendaftarkan subjek
yang cukup untuk diacak (lihat, misalnya, Dion dkk. 2003). Dalam situasi seperti ini, setiap orang yang mencari layanan
atau program yang dievaluasi dapat diakomodasi, dan eksperimenlah yang menghasilkan

11. Ada juga frasa standar yang harus diulangi di sini—Kesalahan tipe I, kesalahan Tipe II, replikasi—saya hanya akan
mencatatnya di sini sekilas. Mereka juga menekankan keandalan pembedaan yang dibuat dengan cara yang krusial.
Machine Translated by Google

Eksperimen Sosial dan Kebijakan Publik 389

kebutuhan untuk menolak beberapa akses.


Dalam kasus di mana program bersifat wajib bagi semua pelamar, atau terbuka bagi semua yang memintanya, penugasan acak
dapat dianggap sebagai cara yang adil untuk menugaskan penerima ke program yang efektivitasnya tidak diketahui. Artinya, jika tidak
diketahui apakah program lama atau baru memberikan hasil yang lebih baik, eksperimen sosial dapat menentukan apakah program baru
tersebut harus dilanjutkan. Setelah eksperimen ini berjalan dengan baik, pengetahuan yang dihasilkannya akan bermanfaat bagi semua
pelamar di masa depan. Perhatikan bahwa jika eksperimen merupakan standar utama, maka secara tautologis benar bahwa dampak
program tidak diketahui—setidaknya tidak dapat dipercaya—karena tidak adanya satu atau beberapa eksperimen sosial yang dilakukan
untuk membuktikan kemanjuran program tersebut.12

Di Amerika Serikat, pemberian dukungan sosial biasanya tidak dipandang sebagai hak dan masyarakat miskin tidak dianggap sebagai
kelompok yang memerlukan perlindungan khusus. Sama seperti pemerintah yang dapat memberikan atau menahan keringanan pajak
sesuai keinginannya, penolakan akses seseorang terhadap suatu program yang tidak memiliki klaim kuat terhadapnya, bahkan jika orang
lain yang sebanding memiliki akses terhadap program tersebut, juga menimbulkan dilema etika yang lemah. Dilema etika ini semakin
dilemahkan oleh etika individualis.
Eksperimen sosial tidak menghalangi akses individu terhadap layanan yang mungkin mereka inginkan karena mereka yang berada dalam
kelompok kontrol sering kali, melalui inisiatif mereka sendiri, memperoleh pendidikan atau pencarian kerja sebagai bantuan yang diberikan
oleh program eksperimental kepada beberapa orang.
Dengan cara ini, menjadi mudah untuk membenarkan eksperimen acak sebagai alat evaluasi untuk program apa pun yang mungkin
disetujui oleh Kongres atau badan legislatif negara bagian. Pengacakan agar memenuhi syarat untuk mendapatkan tambahan pendapatan
(sementara), untuk mendapatkan tunjangan kesejahteraan yang terbatas waktu, dan untuk menerima bantuan pencarian kerja, semuanya
baru-baru ini telah disetujui. Jadi meskipun di lapangan tampaknya ada keraguan etis dalam menugaskan peserta ke kelompok perlakuan
dan kontrol yang cukup serius sehingga menyebabkan lembaga menolak untuk berpartisipasi dalam eksperimen—lihat, misalnya, Gueron
(2000)—pembenaran komunitas riset untuk eksperimen membuat jelas bahwa para peneliti tidak melihat adanya hambatan etis yang serius
terhadap pengacakan dalam berbagai kasus. Sampai batas tertentu, eksperimen sosial bahkan diperlakukan sebagai landasan bagi evolusi
etis kebijakan sosial: penugasan acak adalah cara yang adil untuk mengalokasikan sumber daya yang langka dan eksperimen dapat
memberi tahu kita program mana yang membantu, dan mana yang merugikan, populasi sasaran.

Ada pertanyaan terkait yang merupakan kelanjutan alami bagi mereka yang mempromosikan evaluasi kebijakan sosial melalui
eksperimen: Mengapa masyarakat bertujuan untuk memahami dampak program terhadap hasil? Jawaban yang jelas adalah bahwa para
anggotanya berupaya untuk memperbaiki nasib kelompok yang kurang beruntung. Karena program sosial terlihat menjanjikan tanpa benar-
benar menghasilkan dampak yang diharapkan, maka mengevaluasi kembali dampaknya adalah hal yang masuk akal, dan eksperimen sosial
adalah cara yang paling dapat diandalkan untuk mengevaluasi dampaknya.13

Dalam hal ini, pertanyaan etis telah muncul: Apakah etis menugaskan (atau bahkan mengundang) individu untuk berpartisipasi dalam
program tanpa mengetahui apakah perlakuan yang diberikan mempunyai dampak yang diinginkan? Bagaimanapun, pilihan sosial adalah
tentang mencapai tujuan. Meskipun program-program tersebut mungkin membatasi cara-cara yang diperbolehkan, program-program seperti
TANF terutama ditujukan untuk mencapai hasil-hasil tertentu (secara umum, memperbaiki nasib anak-anak di keluarga miskin). Eksperimen
sosial adalah sarana untuk mencapai tujuan sosial dengan membantu menentukan program mana yang dapat mencapai tujuan sosial.
Tanpa menggali mekanisme pilihan sosial dan pembenarannya, setidaknya mungkin untuk menegaskan bahwa metodologi penelitian yang
berupaya mengisolasi dampak program pada peserta memajukan pengambilan pilihan sosial dengan memajukan pencapaian tujuan sosial
seperti peningkatan kesejahteraan

12. Karena banyaknya faktor di luar kendali pihak yang mengatur eksperimen tersebut, mungkin cukup sulit untuk
mereplikasi eksperimen sosial. Meski begitu, argumen yang mendukung replikasi tetap kuat: seperti halnya
semua penelitian yang mengandalkan statistik, dampak eksperimen bisa saja mengalami kesalahan acak.
Kemudian pertanyaannya menjadi: pada titik manakah peneliti memutuskan bahwa mereka mengetahui apakah
program tersebut berhasil atau tidak, dan dengan demikian apakah pembenaran etis untuk pengacakan masih berlaku?
13. Lihat pernyataan O'Connor (2001) bahwa penelitian kemiskinan berfokus secara sempit pada keadaan dan
perilaku individu, bukan pada peluang sosial dan ekonomi yang dihadapi individu-individu tersebut.
Machine Translated by Google

390 Buku Panduan Analisis Kebijakan Publik

anak-anak berpenghasilan rendah.14 Eksperimen sosial mendapat nilai tinggi dalam hal ini karena diakui bahwa eksperimen
tersebut ketat secara metodologis.
Pertanyaan etis yang diajukan oleh eksperimen tidak lagi menjadi hambatan serius bagi penerapan eksperimen karena
manfaat teknis dari eksperimen tidak perlu dipertanyakan lagi. Sejumlah peneliti telah mengeksplorasi berbagai aspek yang
mendorong pengambilan keputusan yang netral dan efisien dalam bidang kebijakan, dan sering kali mereka menemukan
kaitannya dengan praktik anti-demokrasi (Fischer 1990; Fischer 2003; Stone 1993). Fischer (1990) berpendapat bahwa tujuan
teknokrat adalah menghilangkan sebanyak mungkin keputusan dari arena politik, dan mengalihkannya ke arena administrasi.

Dalam kasus eksperimen sosial, nampaknya menaruh kepercayaan pada keunggulan metodologis telah memungkinkan para
pembuat kebijakan untuk menjawab pertanyaan-pertanyaan etis dengan baik.

KESIMPULAN

Singkatnya, eksperimen sosial tampaknya menawarkan tiga kekuatan inti: keadilan, kesederhanaan, dan ketelitian.
Penugasan acak menawarkan cara yang adil (mungkin cara yang paling adil) dalam mengalokasikan sumber daya yang langka,
tidak diperlukan pelatihan khusus untuk memahami inti dari metode ini, dan eksperimen secara andal mengisolasi “program”
dari faktor-faktor lain yang mempengaruhi hasil subjek sehingga menjadi masukan bagi kebijakan. pembuat bagaimana
memajukan tujuan sosial. Eksperimen memang memiliki keunggulan-keunggulan ini, namun mereka tidak memilikinya dengan
cara yang tidak memenuhi syarat. Saya berpendapat bahwa, pada kenyataannya, kesimpulan yang dapat diambil dari
eksperimen sosial, seperti metodologi evaluasi lainnya, bertumpu pada asumsi-asumsi penting, dan mempunyai keterbatasan-
keterbatasan yang penting. Cara eksperimen sosial berkembang di Amerika Serikat telah mengurangi kerumitan dalam
mengevaluasi kebijakan sosial, namun tidak benar-benar menghapusnya. Para pembuat kebijakan sebaiknya tetap
mempertimbangkan kompleksitas dan keterbatasan ini, meskipun mereka menunjukkan kekuatan dari eksperimen. Terakhir,
fakta bahwa eksperimen menarik secara metodologis tidak boleh menjadi alasan untuk mengesampingkan pertanyaan etis.

REFERENSI

Aaron, Henry J., dan John Todd. 1979. “Penggunaan Temuan Eksperimen Pemeliharaan Pendapatan dalam Kebijakan Publik, 1977–78.”
Prosiding Asosiasi Penelitian Hubungan Industrial, 1979. Madison, WI: IRRA.
Angrist, Joshua D., Guido W. Imbens, dan Donald B. Rubin. 1996. “Identifikasi Efek Kausal Menggunakan Variabel Instrumental.” Jurnal
Asosiasi Statistik Amerika 91(434, Juni): 444–455.
Baum, Erica. 1991. “Ketika Para Dukun Setuju: Undang-Undang Dukungan Keluarga dan Penelitian Ilmu Sosial.”
Jurnal Analisis dan Manajemen Kebijakan 10 (Musim Gugur): 603–615.
Beecroft, Erik, Wang Lee, dan David Long. 2003. Evaluasi Reformasi Kesejahteraan Indiana: Dampak, Implementasi, Biaya dan Manfaat
Lima Tahun. Cambridge, MA: Abt Associates, September.
Berlin, Gordon L. 2002. “Mendorong Kerja, Mengurangi Kemiskinan: Dampak Program Insentif Kerja.”
New York: Perusahaan Penelitian Demonstrasi Tenaga Kerja, Maret.
Boehnen, Elisabeth, dan Corbett, Thomas. 1996. “Pengabaian Kesejahteraan: Beberapa Tren Penting.” Fokus 18(1):
34–41.

Boruch, Robert F. 1997. Eksperimen Acak untuk Perencanaan dan Evaluasi: Panduan Praktis. Ribu
Oaks, CA: Bijaksana.
Brady, Henry E., Nancy Nicosia, dan Eva Y. Seto. 2002. “Membangun Kausalitas dalam Penelitian Kesejahteraan: Penerapan Teori.
Naskah yang Tidak Diterbitkan.
Tak kenal lelah, Gary. 1995. “Kasus Uji Coba Lapangan Secara Acak dalam Penelitian Ekonomi dan Kebijakan. Jurnal Perspektif Ekonomi
9(2, Musim Semi): 63–84.
Danziger, Sheldon. 2001. “Reformasi Kesejahteraan dari Nixon hingga Clinton: Apa Peran Ilmu Sosial?” Di Sosial

14. Untuk tinjauan kritis terhadap beberapa isu dalam literatur pilihan sosial, lihat Sen 1982.
Machine Translated by Google

Eksperimen Sosial dan Kebijakan Publik 391

Sains dan Pembuatan Kebijakan: Pencarian Relevansi di Abad Kedua Puluh. DL Featherman dan MA Vinoviskis, penyunting.
Ann Arbor: Pers Universitas Michigan, 137–164.
Dion, M. Robin, Barbara Devaney, Sheena McConnell, Melissa Ford, Heather Hill, dan Pamela Winston. 2003.
“Membantu Orang Tua yang Tidak Menikah Membangun Pernikahan yang Kuat dan Sehat: Sebuah Kerangka Konseptual
untuk Intervensi. Laporan Akhir diserahkan ke Administrasi untuk Anak dan Keluarga, DHHS AS, Januari.
Fisher, Frank. 1990. Teknokrasi dan Politik Keahlian. Taman Newbury, CA: Sage.
Fisher, Frank. 2003. Membingkai Ulang Kebijakan Publik: Politik Diskursif dan Praktik Deliberatif. Oxford: Oxford
Pers Universitas.
Gennetian, Lisa A., Johannes M. Bos, dan Pamela A. Morris. 2002. “Menggunakan Analisis Variabel Instrumental untuk Belajar Lebih
Banyak dari Eksperimen Kebijakan Sosial.” Makalah Kerja MDRC tentang Metodologi Penelitian.
New York: Perusahaan Riset Demonstrasi Tenaga Kerja, Oktober.
Glenn, David. 2004. “Tidak Ada Kelas yang Belum Dipelajari.” Kronik Pendidikan Tinggi 50(38): A12.
Gordon, Anne, Jonathan Jacobson, dan Thomas Fraker. 1996. “Pendekatan untuk Mengevaluasi Reformasi Kesejahteraan: Pelajaran
dari Demonstrasi Lima Negara.” Cambridge, MA: Penelitian Kebijakan Mathematica, Oktober.
Greenberg, David dan Mark Shroder. 2004. Intisari Eksperimen Sosial (Edisi ke-3rd). Washington DC:
Pers Institut Perkotaan.
Greenberg, David, Donna Linksz, dan Marvin Mandell. 2003. Eksperimen Sosial dan Kebijakan Publik
ing. Washington, DC: Pers Institut Perkotaan.
Greenberg, David, Marvin Mandell, dan Matthew Onstott. 2000. “Penyebaran dan Pemanfaatan Eksperimen Kesejahteraan Kerja
dalam Pembuatan Kebijakan Negara.” Jurnal Analisis dan Manajemen Kebijakan. 19(3): 367–382.

Grogger, Jeffrey dan Lynn A. Karoly. 2005. Reformasi Kesejahteraan: Dampak Perubahan Satu Dekade. Cambridge, MA: Pers
Universitas Harvard.
Gueron, Judith M. 2000. “Politik Penugasan Acak: Implementasi Studi dan Dampak Kebijakan.
New York: Perusahaan Riset Demonstrasi Tenaga Kerja.
Gueron, Judith M. 2003. Menumbuhkan Keunggulan Penelitian dan Memberi Dampak pada Kebijakan dan Praktik: Kesejahteraan
Kisah Reformasi. Jurnal Analisis dan Manajemen Kebijakan 22(2, Musim Dingin): 163–174.
Gueron, Judith M. “Belajar Tentang Reformasi Kesejahteraan: Pelajaran dari Evaluasi Berbasis Negara.” Arah Baru untuk Evaluasi 76
(Musim Dingin 1997):79–94.
Hamilton, Gayle, Stephen Freedman, Lisa Gennetian, Charles Michalopoulos, Johanna Walter, Diana Adams Ciardullo, dan Anna
Gassman-Pines. 2001. “Evaluasi Nasional terhadap Strategi Kesejahteraan untuk Bekerja: Seberapa Efektif Berbagai
Pendekatan Kesejahteraan untuk Bekerja? Dampak Lima Tahun pada Orang Dewasa dan Anak-anak untuk Sebelas
Program.” New York: MDRC, Desember.
Haskins, Ron, dan Paul Offner. 2003. “Mencapai Kompromi dalam Reotorisasi Reformasi Kesejahteraan.” Ringkasan Kebijakan:
Reformasi Kesejahteraan dan Lebih Lanjutnya #25. Washington, DC: The Brookings Institution, Mei.
Haskins, Ron. 1991. “Kongres Menulis Undang-Undang: Reformasi Penelitian dan Kesejahteraan.” Jurnal Analisis Kebijakan dan
Manajemen 10(4, Musim Gugur): 616–32.
Hausman, Jerry, dan David Wise, penyunting. 1985. Eksperimen Sosial. Chicago: Pers Universitas Chicago
untuk Biro Riset Ekonomi Nasional.
Haveman, Robert H. 1987. Kebijakan Kemiskinan dan Penelitian Kemiskinan: Masyarakat Hebat dan Ilmu Sosial.
Madison, WI: Pers Universitas Wisconsin.
Haveman, Robert. 1976. “Analisis Kebijakan dan Kongres: Pandangan Seorang Ekonom.” Analisis Kebijakan 2:
235–250.
Heckman, James J. dan Jeffrey A. Smith. 1995. “Menilai Kasus Eksperimen Sosial.” Jurnal Perspektif Ekonomi 9(2, Musim Semi): 85–
110.
Hird, John A. 2005. “Analisis Kebijakan untuk Apa? Efektivitas Organisasi Penelitian Kebijakan Nonpartisan
tions.” Jurnal Studi Kebijakan 33(1, Februari): 83–105.
Hotz, V. Joseph, Guido Imbens, dan Jacob Alex Klerman. 2000. “Keuntungan Jangka Panjang dari GAIN: Analisis Ulang Dampak
Program GAIN California.” Makalah Kerja Biro Riset Ekonomi Nasional w8007, November.

Jones, Charles O. 1976. “Mengapa Kongres Tidak Dapat Melakukan Analisis Kebijakan (Atau Kata-kata yang Terkait).” Analisis Kebijakan
2(2): 251–264.
Lalonde, Robert J. 1995. “Janji Program Pelatihan Sektor Publik.” Jurnal Perspektif Ekonomi
Machine Translated by Google

392 Buku Panduan Analisis Kebijakan Publik

tives 9(2, Musim Semi): 149–168.


Lindblom, Charles E., dan David K. Cohen. 1979. Pengetahuan yang Dapat Digunakan: Ilmu Pengetahuan Sosial dan Masalah Sosial
Pemecahan. New Haven, CT: Pers Universitas Yale.
Manski, Charles F. 1995. Identifikasi Masalah dalam Ilmu Sosial. Cambridge, MA: Universitas Harvard
Tekan.

Manski, Charles F., dan Irwin Garfi nkel. 1992. Mengevaluasi Program Kesejahteraan dan Pelatihan. Cambridge, MA: Pers Universitas
Harvard.
Mosteller, Frederick, dan Robert Boruch. 2002. Bukti Penting: Uji Acak dalam Penelitian Pendidikan.
Washington, DC: Pers Institusi Brookings.
O'Connor, Alice. 2001. Pengetahuan Kemiskinan: Ilmu Sosial, Kebijakan Sosial, dan Masyarakat Miskin di Abad Kedua Puluh
Sejarah Amerika Serikat. Princeton, NJ: Pers Universitas Princeton.
Orr, Larry L. 1999. Eksperimen Sosial: Mengevaluasi Program Publik dengan Metode Eksperimental. Ribu
Oaks, CA: Bijaksana.
Kaya, Andrew. 2001. “Politik Keahlian di Kongres dan Media Berita.” Triwulanan Ilmu Sosial
82(3): 583–601.
Sen, Amartya. 1982. Pilihan, Kesejahteraan dan Pengukuran. Oxford: Basil Blackwell.
Shulock, Nancy. 1999. “Paradoks Analisis Kebijakan: Jika Tidak Digunakan, Mengapa Kita Menghasilkan Begitu Banyak
Dia?" Jurnal Analisis dan Manajemen Kebijakan 18(2): 226–244.
Stone, Deborah A. 1993. “Otoritas Klinis dalam Konstruksi Kewarganegaraan” Dalam Kebijakan Publik untuk Demokrasi. Ingram, Helen
dan Steven Rathgeb Smith, penyunting. Washington, DC: Institusi Brookings, 45–67.

Batu, Debora. 1997. Paradoks Kebijakan: Seni Pengambilan Keputusan Politik. New York: Norton.
Szanton, Peter. 1981. Tidak Disarankan dengan Baik. New York: Yayasan Russell Sage.
Walker, Robert, David Greenberg, Karl Ashworth, dan Andreas Cebulla. 2003. “Program Kesejahteraan Kerja yang Berhasil: Apakah
Riverside dan Portland Benar-benar Sebagus Itu?” Fokus. 22(3): 11–18.
Penenun, R.Kent. 1999. “Peran Penelitian Kebijakan dalam Debat Kesejahteraan, 1993-1996.” Manu yang tidak diterbitkan
naskah.
Weber, Maks. 1949. Metodologi Ilmu Pengetahuan Sosial. Diterjemahkan dan diedit oleh Edward A. Shils dan
Henry A.Finch. New York: Pers Bebas.
Machine Translated by Google

26 Evaluasi Kebijakan dan


Penelitian Evaluasi
Hellmut Wollmann

DEFINISI, KONSEP, DAN JENIS EVALUASI

Evaluasi di bidang kebijakan publik dapat didefinisikan, secara umum, sebagai alat dan prosedur analisis yang
dimaksudkan untuk melakukan dua hal. Pertama, penelitian evaluasi, sebagai alat analisis, melibatkan penyelidikan
program kebijakan untuk memperoleh semua informasi yang berkaitan dengan penilaian kinerjanya, baik proses maupun
hasil; kedua, evaluasi sebagai fase siklus kebijakan secara umum mengacu pada pelaporan informasi tersebut kembali
ke proses pembuatan kebijakan (lihat Wollmann 2003b, 4).
Namun, serangkaian konsep dan istilah yang membingungkan telah muncul dalam bidang ini, terutama mengingat
perkembangan kosakata baru “gelombang ketiga” baru-baru ini (seperti audit manajemen, audit kebijakan, dan
pemantauan kinerja). Mengingat definisi yang berfokus pada fungsi evaluasi dan, dengan demikian, melihat di balik
permukaan terminologi yang bervariasi, menjadi jelas bahwa istilah-istilah yang berbeda “mencakup lebih kurang
landasan yang sama” (Bemelmans-Videc 2002, 94 ). Dengan demikian, prosedur analitis, yang kemudian disebut “audit
kinerja” akan dimasukkan dalam definisi kami, kecuali, “audit keuangan”, yang memeriksa kepatuhan belanja publik
dengan ketentuan anggaran dan tidak akan dihitung sebagai evaluasi. (lihat Sandahl 1992, 115).

JENIS EVALUASI: FUNGSI DAN WAKTU

Dalam kaitannya dengan perbedaan hubungan temporal dan fungsional dengan “siklus kebijakan”, sering kali terdapat
perbedaan berikut ini (lihat Wollmann 2003b).
Evaluasi ex-ante, sebelum pengambilan keputusan, dimaksudkan untuk (secara hipotetis) mengantisipasi dan
menilai terlebih dahulu dampak dan konsekuensi dari kebijakan dan tindakan yang direncanakan atau ditetapkan untuk
“memasukkan” informasi ke dalam proses pengambilan keputusan yang akan datang atau yang sedang berlangsung.
Jika dilakukan terhadap arah kebijakan dan tindakan alternatif, evaluasi ex-ante merupakan sebuah instrumen untuk
membuat pilihan antara opsi-opsi kebijakan alternatif (idealnya) lebih transparan secara analitis, lebih dapat diperkirakan,
dan lebih dapat diperdebatkan secara politis. Hal ini mencakup pra-penilaian implementasi yang dimaksudkan untuk
mengantisipasi secara analitis jalannya implementasi kebijakan dengan berfokus pada prosesnya, serta dampak
lingkungan sebagai penilaian, yang dirancang untuk mengantisipasi atau memprediksi konsekuensi yang mungkin
ditimbulkan oleh kebijakan dan tindakan yang direncanakan terhadap lingkungan.
Evaluasi yang berkelanjutan mempunyai tugas untuk mengidentifikasi dampak (interim) dan hasil dari program
dan tindakan kebijakan, sedangkan dalam siklus kebijakan, implementasi dan realisasinya masih berlangsung. Fungsi
penting dari evaluasi “berkelanjutan” adalah untuk memberikan informasi yang relevan kembali ke dalam proses
implementasi pada titik dan tahap ketika informasi terkait dapat digunakan untuk menyesuaikan, memperbaiki atau
mengarahkan proses implementasi atau bahkan mendasari keputusan kebijakan utama.
Dalam penggunaan yang hampir sama, ada yang menyebut evaluasi yang berjalan paralel dengan proses implementasi
kebijakan. Dalam evaluasi yang “berkelanjutan” atau “yang menyertainya” seseorang dapat membedakannya

393
Machine Translated by Google

394 Buku Panduan Analisis Kebijakan Publik

antara modalitas utama “analitis” yang tetap “terpisah” dan “menjauhkan” dari proses implementasi untuk memastikan
objektivitas. Selanjutnya, istilah evaluasi yang menyertai intervensi telah diterapkan ketika, selain mandat analitis, para evaluator
juga diharapkan, jika tidak diwajibkan, untuk secara aktif melakukan intervensi dalam proses implementasi untuk memperbaiki
kekurangan dan kelemahan dalam proses implementasi yang membahayakan pencapaian tujuan. tujuan kebijakan yang telah
ditetapkan sebelumnya. Dalam orientasi “intervensionis” evaluasi “pendampingan” akan mendekati konsep penelitian tindakan.

Terakhir, pemantauan dapat dilihat sebagai prosedur evaluatif (berkelanjutan) yang bertujuan (secara deskriptif)
mengidentifikasi dan, dengan bantuan indikator yang tepat, jika mungkin dioperasionalkan, untuk “mengukur” dampak dari
kegiatan yang sedang berlangsung. Dalam kebangkitan “indikator kinerja” (PI) dalam konsep Manajemen Publik Baru,
pemantauan berbasis indikator menjadi sangat penting.

Evaluasi ex-post merupakan varian klasik evaluasi untuk menilai pencapaian tujuan dan dampak kebijakan dan tindakan,
setelah semuanya selesai. Dengan demikian, sumatif (Scriven 1972) diarahkan pada program kebijakan (sebagai bentuk
tindakan kebijakan yang menggabungkan tujuan kebijakan dan sumber daya keuangan, organisasi dan personel), yang
merupakan ciri khas kebijakan reformasi awal di Amerika Serikat, namun juga di negara-negara Eropa, evaluasi kebijakan ex-
post sering kali diidentikkan dengan evaluasi program (lihat Rist 1990 ) . Secara karakteristik, evaluasi kebijakan (atau program)
pada dasarnya diberikan pada dua tugas.

Pertama, hal ini dimaksudkan untuk menghasilkan penilaian mengenai sejauh mana tujuan kebijakan yang diinginkan
telah tercapai (“pencapaian tujuan”). Permasalahan konseptual yang muncul dari tugas ini berkisar pada konseptualisasi
indikator-indikator yang sesuai, jika mungkin dapat diukur, untuk membuat penilaian pencapaian tujuan. Namun, selain
mengidentifikasi konsekuensi yang “direncanakan”, penilaian terhadap dampak kebijakan dan program juga berkaitan dengan
konsekuensi yang tidak diharapkan.
Kedua, evaluasi terhadap kebijakan dan program juga diharapkan dan diamanatkan untuk menjawab pertanyaan (kausal)
apakah dampak dan perubahan yang diamati memang benar-benar (kausal) berkaitan dengan kebijakan atau program yang
bersangkutan. Dari sini timbul permasalahan metodologis dalam menerapkan alat dan keterampilan metodologis (mungkin dan
mudah-mudahan) yang mampu memecahkan “teka-teki sebab-akibat.”
Meta-evaluasi dimaksudkan untuk menganalisis evaluasi yang sudah selesai (primer) dengan menggunakan semacam
analisis sekunder. Dua varian dapat dilihat. Pertama, meta-evaluasi dapat meninjau evaluasi (primer) yang sudah selesai untuk
mengetahui apakah evaluasi tersebut memenuhi kriteria dan standar metodologis. Orang mungkin berbicara tentang meta-
evaluasi peninjauan metodologi. Kedua, meta-evaluasi mungkin harus mengumpulkan temuan-temuan substantif dari evaluasi
(primer) yang telah selesai dan mensintesis hasilnya. Ini mungkin disebut meta-evaluasi “sintesis”.

Meskipun evaluasi (yang ketat) bertujuan untuk memberikan gambaran komprehensif tentang apa yang telah terjadi di
bidang kebijakan dan proyek yang diteliti, mencakup rangkaian peristiwa yang berhasil dan tidak, pendekatan praktik terbaik
cenderung mengambil dan menceritakan kisah sukses kebijakan reformasi. dan proyek, dengan tujuan analitis untuk
mengidentifikasi faktor-faktor yang menjelaskan keberhasilan, dan dengan tujuan terapan (pembelajaran dan pedagogi) untuk
mendorong pembelajaran dari pengalaman tersebut dalam konteks intranasional serta antar dan transnasional. Di satu sisi,
kisah-kisah praktik baik seperti itu penuh dengan ancaman kekeliruan ekologis (secara konseptual dan metodologis), yaitu
penerjemahan dan pengalihan strategi (yang tampaknya positif) secara gegabah dan menyesatkan dari satu wilayah dan satu
negara ke negara lain. Di sisi lain, jika dilakukan dengan hati-hati memperhatikan kontekstualitas dan kondisionalitas spesifik
dari contoh-contoh praktik yang baik tersebut, menganalisis, menceritakan dan menyebarkan kasus-kasus tersebut dapat
memberikan jalur cepat yang berguna menuju pengetahuan evaluatif dan intra-nasional serta trans-internasional. pembelajaran
nasional

Berhadapan dengan berbagai macam rintangan konseptual dan metodologis, evaluasi menyeluruh atas reformasi sektor
publik pasti akan menghadapi jenis kuasi-evaluasi yang telah diusulkan (lihat Thoenig 2003) yang tidak terlalu penuh dengan
kesulitan konseptual dan metodologis dibandingkan dengan evaluasi menyeluruh terhadap reformasi sektor publik. bermata penuh
Machine Translated by Google

Evaluasi Kebijakan dan Penelitian Evaluasi 395

evaluasi dan lebih cenderung berfokus pada, dan membatasi diri pada, fungsi pengumpulan informasi dan data serta fungsi
deskriptif dari evaluasi dibandingkan fungsi penjelasan. Rangkaian utama mungkin merupakan varian kuasi-evaluasi yang
disederhanakan secara konseptual dan metodologis yang mungkin kondusif bagi komunikasi yang lebih saling percaya antara
pembuat kebijakan dan evaluator yang akan mendorong proses pembelajaran bertahap yang menumbuhkan budaya informasi
(Thoenig 2003).
Akhirnya, penilaian evaluabilitas dapat dilakukan. Hal ini terjadi sebelum evaluasi, baik yang bersifat ex-post, tetapi juga
jenis ex-ante dan berkelanjutan. Hal ini digunakan untuk mengetahui terlebih dahulu pendekatan dan varian evaluasi mana yang
harus digunakan berdasarkan kriteria kelayakan teknis, kelayakan ekonomi, dan manfaat praktis.

Evaluasi “Klasik” pertama-tama diarahkan pada (ex-post) menilai pencapaian atau kegagalan tujuan kebijakan dan
program atau pada (ex-ante) memperkirakan ketercapaian tujuan. Hal ini pada dasarnya berkaitan dengan efektivitas kebijakan
dan mengukur jumlah sumber daya yang digunakan (atau diinvestasikan) untuk mencapai tujuan tersebut. Hal ini berbeda
dengan analisis biaya-manfaat yang membandingkan hasil dengan sumber daya yang dikerahkan untuk mencapainya. Dengan
demikian, penekanan pada analisis biaya-manfaat yang efisien mungkin juga mempunyai orientasi ex-post.

JENIS EVALUASI: INTERNAL DAN EKSTERNAL

Salah satunya, evaluasi dapat dilakukan sebagai evaluasi internal. Evaluasi tersebut dilakukan secara internal oleh lembaga
pengoperasi itu sendiri. Dalam hal ini terjadi sebagai evaluasi diri. Faktanya, ada yang berpendapat bahwa cara evaluasi diri
yang informal dan tidak sistematis telah dipraktikkan sejak (dalam model birokrasi Weberian) pengawasan hierarkis dilakukan
berdasarkan bentuk pelaporan internal yang teratur. Namun penelitian evaluasi melibatkan pendekatan yang lebih formal.
Penelitian evaluasi telah menjadi komponen kunci dari berbagai teori administrasi publik. Dalam beberapa tahun terakhir,
Manajemen Publik Baru menekankan konsep pemantauan dan pengendalian berdasarkan indikator evaluasi kinerja. Indikator-
indikator tersebut, misalnya, memainkan peran penting dalam sistem operasi akuntansi pencapaian biaya internal yang
komprehensif (lihat Wollmann 2003b).

Sebaliknya, evaluasi eksternal diprakarsai atau didanai oleh sumber luar (yang dikontrak oleh lembaga atau pelaku di
luar unit administratif operasional). Lokus eksternal fungsi evaluasi tersebut dapat dilakukan oleh lembaga-lembaga dan aktor-
aktor yang, di luar dan di luar pemerintahan, mungkin mempunyai kepentingan politik atau struktural yang menggunakan
evaluasi sebagai sarana untuk mengawasi pelaksanaan kebijakan oleh pemerintah. Parlemen telah terbukti menjadi kandidat
yang tepat untuk memprakarsai dan melaksanakan evaluasi kebijakan dan program yang diresmikan oleh mereka. Dengan cara
yang sama, pengadilan audit telah menggunakan evaluasi sebagai cara analitis tambahan untuk menjelaskan efektivitas dan
efisiensi operasi administratif.

Namun aktor-aktor lain di pusat pemerintahan, seperti Kantor Perdana Menteri atau Kementerian Keuangan, mungkin
akan menggunakan evaluasi sebagai instrumen untuk mengawasi operasional kementerian dan lembaga sektoral. Yang
terakhir, perlu disebutkan badan-badan dan komisi-komisi ad hoc (yaitu komisi penyelidikan) yang diberi mandat untuk meneliti
permasalahan-permasalahan kompleks dan bidang-bidang kebijakan. Komisi-komisi tersebut dapat menggunakan evaluasi
sebagai alat pencarian fakta yang penting sebelum merekomendasikan penerapan kebijakan oleh pemerintah dan kementerian.

Semakin kompleks kebijakan dan program yang sedang dipertimbangkan, dan semakin besar tuntutan permasalahan
konseptual dan metodologis dalam melaksanakan evaluasi tersebut, semakin kecil kemampuan lembaga yang memprakarsai
dan melaksanakan evaluasi tersebut untuk melaksanakan evaluasi yang rumit dan canggih secara konseptual dan metodologis.
menganalisis diri mereka sendiri. Mengingat kompleksitas tersebut, penelitian evaluasi idealnya didasarkan pada penerapan
metodologi dan keahlian ilmu sosial.
Oleh karena itu, karena kurangnya personel yang cukup terlatih dan kurangnya waktu, lembaga-lembaga politik, administratif,
dan lembaga-lembaga lainnya sering kali beralih ke lembaga-lembaga penelitian dan perusahaan penelitian dari luar (ilmu sosial).
Machine Translated by Google

396 Buku Panduan Analisis Kebijakan Publik

menugaskan mereka untuk melaksanakan pekerjaan evaluasi berdasarkan kontrak (lihat Wollmann 2002).
Faktanya, perkembangan evaluasi, sejak pertengahan tahun 1960an, telah dibarengi dengan perluasan (yang terkadang
merajalela) dari “pasar uang kontraktual” yang didukung oleh sumber daya kementerian, parlemen, komisi ad hoc, dan lain-
lain. telah mengubah penelitian evaluasi menjadi sebuah “industri baru dengan proporsi yang cukup besar” (Freeman dan
Solomon 1981, 13), berputar di sekitar penelitian kontraktual” dan telah mengubah lanskap penelitian tradisional dalam
sebuah pergeseran penting dari penelitian “akademik ke penelitian kewirausahaan” (lihat Freeman dan Solomon 1981, 16),
sebuah topik yang akan kita bahas kembali.

TIGA GELOMBANG EVALUASI

Ada tiga fase yang dapat dibedakan dalam perkembangan evaluasi selama empat puluh tahun terakhir: gelombang evaluasi
pertama terjadi pada tahun 1960an dan 1970an, gelombang kedua dimulai pada pertengahan tahun 1970an, dan
gelombang ketiga terjadi sejak tahun 1990an.
Selama tahun 1960-an dan 1970-an, munculnya negara kesejahteraan maju disertai dengan konsep peningkatan
kemampuan negara untuk memberikan pembuatan kebijakan yang proaktif melalui modernisasi struktur politik dan
administratifnya yang bertujuan untuk mewujudkan pelembagaan dan penggunaan tenaga kerja. kapasitas perencanaan,
informasi, dan evaluasi dipandang berperan penting. Konsep “siklus kebijakan” berkisar, sebagaimana telah disebutkan,
seputar tiga serangkai pembentukan, implementasi, dan penghentian kebijakan, dimana evaluasi dianggap penting sebagai
lingkaran “cybernetic” dalam mengumpulkan dan memberikan informasi yang relevan dengan kebijakan. logika (Wittrock,
Wagner, dan Wollmann 1991, 615) dan visi model kebijakan berbasis sains dicontohkan oleh seruan terkenal Donald
Campbell untuk masyarakat yang bereksperimen (“reformasi sebagai eksperimen,” Campbell 1969).

Di Amerika Serikat, kebangkitan evaluasi terjadi seiring dengan diresmikannya program aksi sosial federal seperti
Perang Melawan Kemiskinan pada pertengahan tahun 1960an di bawah kepemimpinan Presiden Johnson dengan
evaluasi yang hampir secara rutin diamanatkan oleh undang-undang reformasi terkait, mengubah evaluasi kebijakan dan
program. hampir menjadi industri yang sedang berkembang. Eksperimen sosial skala besar yang disertai dengan evaluasi
besar juga mengikuti langkah yang sama.1 Di Eropa, Swedia, Jerman, dan Inggris menjadi pelopor evaluasi “gelombang
pertama” ini (lihat Levine 1981; Wagner, dan Wollmann 1986; Derlien 1990) ; di Jerman eksperimen sosial (experimentelle
Politik) dilakukan dalam skala yang tidak ada bandingannya di luar Amerika Serikat (lihat Wagner, dan Wollmann 1991, 74).

Mencerminkan konsensus reformis, yang pada saat itu dianut secara luas oleh aktor-aktor politik dan administratif
reformis serta para ilmuwan sosial, yang terlibat melalui bentuk-bentuk penelitian kontrak dan konsultasi kebijakan yang
hingga saat ini belum banyak diketahui, proyek-proyek evaluasi secara normatif menyetujui dan mendukung konsensus
reformis. kebijakan-kebijakan reformis sedang diawasi dengan cermat dan, oleh karena itu, dimaksudkan untuk
meningkatkan hasil kebijakan dan memaksimalkan efektivitas keluaran. (Wittrock, Wagner, dan Wollmann 1991, 52).

Masa kejayaan kebijakan negara kesejahteraan yang bersifat intervensionis terbukti hanya berumur pendek, ketika,
setelah kenaikan harga minyak pertama pada tahun 1973, perekonomian dunia merosot ke dalam resesi yang semakin
parah dan anggaran nasional mengalami tekanan keuangan yang semakin parah yang mengakibatkan sebagian besar
negara kesejahteraan menjadi miskin. kebijakan reformasi yang memakan banyak biaya terhenti. Hal ini mengarah pada
“gelombang kedua”. Ketika pembuatan kebijakan ditentukan oleh seruan untuk melakukan penghematan anggaran dan
penghematan biaya, maka mandat evaluasi kebijakan pun didefinisikan ulang dengan tujuan untuk mengurangi biaya
kebijakan dan program, atau bahkan menghilangkannya secara bertahap (lihat Wagner, dan Wollmann 1986;Derlien,
1990). Pada evaluasi gelombang kedua yang berfokus pada efisiensi biaya kebijakan dan program, evaluasi mengalami
perluasan yang signifikan di negara-negara lain, misalnya di Belanda (lihat Leeuw 2004, 60).
“Evaluasi gelombang ketiga” beroperasi di bawah pengaruh berbagai arus. Pertama, konsep dan keharusan
Manajemen Publik Baru (lihat Pollitt dan Bouckaert 2003, 2004) telah
Machine Translated by Google

Evaluasi Kebijakan dan Penelitian Evaluasi 397

mendominasi wacana modernisasi internasional dan, dalam satu atau lain varian, reformasi sektor publik di banyak
negara (lihat Wollmann 2003c) dengan “evaluasi internal” (melalui pembangunan dan penerapan pengendalian berbasis
indikator dan pencapaian biaya) -akuntansi, dll.) membentuk bagian integral dari “paket manajemen publik” (lihat Furubo
dan Sandahl 2002, hal. 19 dst.) dan memberikan momentum baru pada prosedur evaluatif (lihat Wollmann 2003b.). Selain
itu, di sejumlah bidang kebijakan, evaluasi menjadi penting dalam mengungkap kelemahan-kelemahan kebijakan yang
ada dan dalam mengidentifikasi potensi reformasi dan perbaikan. Perhatian (dan kegembiraan) yang besar yang muncul
baru-baru ini oleh studi “PISA” di seluruh Eropa, sebuah kegiatan evaluasi internasional yang besar mengenai sistem
pendidikan nasional, telah menyoroti dan, tidak diragukan lagi, mendorong peran dan potensi evaluasi sebagai instrumen
pengambilan kebijakan. . Ketiga, harus disebutkan bahwa, di Uni Eropa, evaluasi mendapat dorongan besar ketika Komisi
Eropa memutuskan untuk melakukan evaluasi sistematis terhadap pengeluaran Dana Struktural Eropa yang sangat besar
(lihat Leeuw 2004, 69 dst.). Karena dana struktural UE kini dievaluasi dalam siklus program lima tahunnya dengan cara
yang hampir seperti buku teks (dengan siklus evaluasi yang dimulai dari evaluasi ex-ante hingga ex-post), evaluasi
kebijakan dan program UE telah mengalami peningkatan yang signifikan. secara signifikan mempengaruhi dan mendorong
pengembangan evaluasi secara luas. Di beberapa negara, misalnya Italia (lihat Stame 2002; Lippi 2003), mandat untuk
mengevaluasi program-program UE seolah-olah merupakan tempat lahirnya penelitian evaluasi negara tersebut, yang
sebelumnya hampir tidak ada.

Dalam perspektif komparatif internasional pada awal milenium baru, evaluasi kebijakan telah diperkenalkan dan
dilaksanakan di banyak negara sebagai instrumen yang diterima secara luas dan digunakan untuk memperoleh (dan
“memberi umpan balik”) informasi yang relevan dengan kebijakan. Hal ini telah dianalisis dan didokumentasikan secara
mengesankan dalam sebuah studi baru-baru ini2 berdasarkan laporan dari dua puluh dua negara dan berdasarkan
serangkaian kriteria yang canggih (lihat Furubo dkk., 2002, dengan sintesis oleh Furubo, dan Sandahl 2002). Meskipun
Amerika Serikat masih memimpin dalam “budaya evaluasi” (Rist, dan Pakiolas 2002, 230 dst.), peringkat enam teratas di
antara negara-negara Eropa ditempati oleh Swedia, Belanda, Inggris, Jerman, Denmark, dan Finlandia (lihat Furubo, dan
Sandahl 2002; Leeuw 2004, 63).

MASALAH METODOLOGI EVALUASI

Penelitian evaluasi dihadapkan pada dua tugas konseptual dan metodologis utama: (1) untuk mengkonseptualisasikan
perubahan dunia nyata yang dapat diamati dalam kaitannya dengan konsekuensi yang diharapkan (atau tidak diharapkan)
sehingga evaluasi kebijakan dimaksudkan untuk mengidentifikasi dan menilai (seperti, secara metodologis, "Variabel
dependen"); dan (2) untuk mengetahui apakah dan bagaimana perubahan yang diamati mempunyai hubungan sebab
akibat dengan kebijakan dan tindakan yang dipertimbangkan (sebagai variabel “independen”).
Untuk menjawab pertanyaan-pertanyaan kunci ini, penelitian evaluasi dipandang sebagai bagian integral dari
penelitian ilmu sosial pada umumnya; dengan demikian, hal ini mencakup sebagian besar isu dan kontroversi konseptual
dan metodologis ilmu sosial. Faktanya, tampaknya perdebatan metodologis yang terjadi dalam komunitas ilmu sosial
pada umumnya (misalnya perselisihan antara aliran pemikiran “kuantitatif” dan “kualitatif”) merupakan salah satu
perdebatan yang paling menonjol (dan terkadang paling sengit) perjuangan dalam komunitas riset evaluasi.

Dua fase dapat dilihat dalam kontroversi ini. Yang pertama, dimulai pada tahun 1960an hingga awal tahun 1980an,
ditandai dengan dominasi model sains neopositivis-nomologis (dengan dominasi metode kuantitatif dan kuasi-
eksperimental). Periode kedua dan yang lebih baru adalah hasil dari kemajuan dalam pendekatan konstruktivis dan
interpretatif (dengan preferensi yang sesuai untuk metode heuristik kualitatif).

Oleh karena itu, dari perspektif neopositivis, evaluasi dicirikan oleh dua premis. Yang pertama adalah asumsi bahwa
untuk menilai secara valid apakah dan sejauh mana hal tersebut
Machine Translated by Google

398 Buku Panduan Analisis Kebijakan Publik

tujuan kebijakan (sebagai konsekuensi yang dimaksudkan) telah dicapai melalui perubahan nyata yang dapat
diamati, maka penting untuk mengidentifikasi terlebih dahulu apa maksud dan tujuan politik dari program
tersebut. Dalam pandangan ini, niat dari “satu” institusi atau aktor yang relevan diutamakan.
Kedua, untuk mengidentifikasi hubungan sebab akibat antara perubahan yang diamati dan kebijakan/
program yang sedang dipertimbangkan, pernyataan yang valid hanya dapat diperoleh melalui penerapan
desain penelitian eksperimental kuantitatif (kuasi-) positivis (Campbell, dan Stanley 1963). Namun, meskipun
paradigma penelitian ini sudah lama mendominasi, masalah dalam menerjemahkan premis-premis ini ke
dalam praktik evaluasi jelas terlihat oleh banyak pengamat. Misalnya, dalam mengidentifikasi tujuan yang
relevan, permasalahan serius akan muncul (lihat Wollmann 2003b, 6): (1) tujuan dan sasaran yang berfungsi
sebagai tolak ukur sulit untuk diidentifikasi, karena sering kali muncul sebagai “bundel”—tujuan sulit untuk
diterjemahkan menjadi indikator-indikator yang dapat dioperasionalkan dan diukur; (2) data empiris yang baik
untuk memenuhi indikator sulit diperoleh, dan semakin bermakna suatu indikator, semakin sulit pula
memperoleh data yang layak; (3) semakin jauh (dan seringkali semakin relevan) dimensi tujuan, semakin sulit
untuk mengoperasionalkan dan membuktikannya secara empiris; (4) efek samping dan akibat yang tidak
diinginkan sulit dilacak.
Selain itu, desain penelitian yang kuat secara metodologis (eksperimental semu, terkontrol, rangkaian
waktu, dll.) seringkali tidak dapat diterapkan, setidaknya tidak dapat diterapkan secara metodologis yang
memuaskan (Weiss dan Rein 1970). Di sini kita perlu mengamati kondisi ceteris paribus ( dimana penerapan
engsel desain kuasi-eksperimental) sulit, bahkan tidak mungkin, untuk dilakukan. Meskipun penerapan metode
kuantitatif didasarkan pada persyaratan metodologis “banyak kasus (N besar), sedikit variabel”, dalam situasi
penelitian di dunia nyata sering kali konstelasinya berlawanan: “sedikit kasus (N kecil), banyak (mungkin
mempengaruhi ) variabel.” Persoalan-persoalan ini cenderung mengesampingkan penggunaan metode
kuantitatif dan justru mengarah pada kualitatif. Dan yang terakhir, penerapan metode deret waktu (sebelum/
sesudah desain) sering kali memiliki batasan yang sempit, karena data “sebelum” sering kali tidak tersedia
dan tidak dapat diperoleh.
Pada fase kedua, paradigma penelitian yang sudah lama dominan mendapat kritik karena dua hal yang
saling terkait. Pertama, asumsi standar bahwa evaluasi harus mencari kerangka acuannya terlebih dahulu
dalam tujuan kebijakan lembaga atau aktor politik terkait telah terguncang—jika tidak hancur—oleh kemajuan
teori konstruktivis . -sekolah pemikiran interpretatif (Mertens 2004, 42 dst.). Pendekatan ini menganjurkan
pertanyaan atas dasar epistemologis mengenai kemungkinan untuk secara valid memastikan “satu” maksud
atau tujuan yang relevan dan sebaliknya menyerukan untuk mengidentifikasi pluralitas (seringkali) perspektif,
kepentingan, dan nilai. Misalnya, Stuffl ebeam (1983) berpengaruh dalam memajukan konsep evaluasi yang
disebut “model CIPP,” di mana C = konteks, I = masukan, P = proses, P = produk. Di antara keempat
komponen tersebut, elemen “konteks” (berfokus pada pertanyaan seperti: Apa tujuan program? Apakah tujuan
tersebut mencerminkan kebutuhan peserta?) dimaksudkan untuk mengarahkan perhatian evaluator, sejak
awal, ke kebutuhan (dan kepentingan). ) dari peserta program yang sedang dipertimbangkan (dan implikasi
normatif yang mendasarinya). Argumen umum ini diungkapkan dalam berbagai rumusan, seperti evaluasi
“responsif”, “partisipatif”, atau “pemangku kepentingan”. Secara metodologis, perdebatan konstruktivis berjalan
seiring dengan (kembali) mendapatkan landasan bagi metode kualitatif-hermeneutik dalam evaluasi (Mertens
2004, 47). Guba dan Lincoln (1989) menyebut perkembangan ini sebagai “evaluasi generasi keempat”.

Meskipun garis pertarungan antar kubu pemikiran cukup tajam sekitar dua puluh tahun yang lalu, namun
kini garis tersebut telah melunak. Di satu sisi, wawasan epistemologis, konseptual dan metodologis yang
dihasilkan dalam perdebatan konstruktivis diterima dan ditanggapi dengan serius, mandat dalam evaluasi
untuk sedekat mungkin dengan “objektif” masih tetap menjadi tujuan utama. Konsep “evaluasi realistis” yang
dirumuskan oleh Pawson dan Tilley (1997) cocok untuk mencapai tujuan tersebut. Lebih jauh lagi, secara luas
disepakati bahwa tidak ada “jalan raja” dalam desain metodologi penelitian evaluasi; sebaliknya, kita harus
mengakui pluralisme metode. Pemilihan dan kombinasi serangkaian metode tertentu bergantung pada
pertanyaan evaluatif yang harus dijawab, serta kerangka waktu dan sumber daya keuangan dan personel
yang tersedia.
Machine Translated by Google

Evaluasi Kebijakan dan Penelitian Evaluasi 399

PENELITIAN EVALUASI: ANTARA DASAR, TERAPAN, DAN KONTRAKtual


RISET

Kemunculan dan perluasan penelitian evaluasi sejak pertengahan tahun 1960an mempunyai dampak yang signifikan
terhadap lanskap penelitian ilmu sosial dan komunitas. Awalnya arena penelitian ilmu sosial didominasi oleh penelitian
akademis (dasar) yang sebagian besar berlokasi di universitas dan didanai oleh lembaga independen. Bahkan ketika
mengambil orientasi kebijakan terapan , penelitian ilmu sosial pada dasarnya tetap berkomitmen pada rumusan akademis/
dasar. Sebaliknya, penelitian evaluasi, sejauh dilakukan sebagai “penelitian kontraktual”, yang ditugaskan dan dibiayai oleh
lembaga politik atau administratif, melibatkan pergeseran dari “latar belakang akademis ke kewirausahaan” (Freeman dan
Solomon 1981).

Penelitian ilmu sosial akademis, biasanya berbasis universitas, didasarkan pada empat hal penting. Yang pertama
adalah komitmen untuk mencari kebenaran sebagai tujuan dan kriteria utama penelitian ilmiah. Yang kedua berkaitan dengan
otonomi intra-ilmiah dalam pemilihan pokok bahasan dan metode penelitiannya. Yang ketiga adalah pendanaan independen,
baik dari sumber universitas atau melalui pendanaan berbasis tinjauan sejawat oleh yayasan penelitian seperti National
Science Foundation. Komponen terakhir adalah pengujian kualitas temuan penelitian melalui debat ilmiah terbuka dan
tinjauan sejawat.

Meskipun ilmu sosial terapan masih berpegang pada independensi dan otonomi penelitian ilmu sosial, penelitian
kontraktual, yang kini menjadi wahana utama penelitian evaluasi, bergantung pada formula yang sangat berbeda. Hal ini
ditandai dengan prinsip komisaris/produsen atau konsumen/kontraktor: “konsumen mengatakan apa yang diinginkannya,
kontraktor melakukannya (jika dia bisa), dan konsumen membayar” (mengutip diktum Lord Rothschild, lihat Wittrock, Wagner,
dan Wollmann 1991, 47). Oleh karena itu, “permintaan proposal” (RFP) yang digunakan oleh badan komisioning untuk
menyampaikan kepada calon kontraktor (dalam penawaran umum, penawaran selektif, atau secara langsung), umumnya
mendefinisikan dan merinci pertanyaan-pertanyaan yang harus dijawab dan waktu bingkai tersedia. Dalam proposal proyek,
calon kontraktor menjelaskan rencana penelitiannya sesuai parameter yang ditentukan oleh pelanggan dan membuat
penawaran keuangan yang biasanya dihitung berdasarkan rumus biaya personel ditambah overhead.

Oleh karena itu, ketika ditugaskan dan didanai oleh pemerintah, penelitian evaluasi menghadapi tiga tantangan penting
yang berkaitan dengan pokok bahasan, pertanyaan-pertanyaan utama, dan metode penelitiannya. Dalam penelitian kontrak,
tidak seperti penelitian evaluasi tradisional, pertimbangan-pertimbangan ini ditentukan oleh lembaga yang menugaskan
evaluasi. Selain itu, dengan menyediakan dana, lembaga tersebut juga membahayakan otonomi para peneliti (“siapa yang
membayar, yang menentukan nasibnya”). Dan yang terakhir, temuan-temuan penelitian yang ditugaskan sering kali
dirahasiakan, atau setidaknya tidak dipublikasikan, sehingga tidak bisa didiskusikan secara terbuka di hadapan publik dan rekan sejawat.
Jadi, penelitian kontraktual terekspos dan mungkin rentan terhadap penyimpangan epistemik dan proses kolonisasi di mana
para evaluator dapat mengadopsi “kerangka perspektif dan konseptual” dari institusi dan aktor politik dan administratif yang
ditugaskan untuk mereka evaluasi (Elzinga 1983, 89 ).
Dalam menghadapi tantangan terhadap integritas intelektual dan kejujuran penelitian kontrak, inisiatif telah diambil
oleh evaluator profesional untuk merumuskan standar yang dapat memandu mereka dalam pekerjaan kontrak, khususnya
dalam negosiasi dengan “klien” mereka (Rossi, Freeman, dan Lipsey 1999, 425 dst.). Referensi dapat dibuat di sini, misalnya,
pada Prinsip-prinsip Panduan Evaluasi, yang diadopsi pada tahun 1995 oleh American Evaluation Association pada tahun
1995. Di antara lima prinsipnya, maksim integritas dan kejujuran penelitian sangat tertulis (Rossi, Freeman, dan Lipsey 1999,
427 dst.; dan Mertens 2004, 50 dst.).

PROFESIONALISASI

Sementara itu, evaluasi, di banyak negara, telah menjadi aktivitas dan pekerjaan kelompok mandiri dan komunitas peneliti
dan analis khusus yang semakin meningkat.
Machine Translated by Google

400 Buku Panduan Analisis Kebijakan Publik

profesionalisasi terlihat dalam pembentukan asosiasi profesi, munculnya publikasi profesional, dan
hadirnya evaluasi sebagai materi pelajaran di universitas dan pelatihan kejuruan.

Mengenai landasan asosiasi profesional, peran utama dan teladan diambil alih oleh American
Evaluation Society (AES), yang dibentuk pada tahun 1986 melalui penggabungan dua asosiasi
evaluasi yang lebih kecil, Evaluation Network dan Evaluation Research Society. Pada tahun 2003,
AES memiliki lebih dari tiga ribu anggota (Mertens 2004, 50). Produk yang penting adalah perumusan
kode etik profesional yang tercantum dalam “Prinsip Panduan untuk Evaluator” yang diadopsi oleh
AES pada tahun 1995. Di Eropa, Masyarakat Evaluasi Eropa didirikan pada tahun 1987 dan diikuti
dengan pembentukan lembaga evaluasi nasional. yang sesuai, dengan UK Evaluation Society
menjadi yang pertama3 (lihat Leeuw 2004, 64 f.). Sementara itu, sebagian besar dari mereka juga
telah menguraikan dan mengadopsi kode etik profesi yang menyatakan niat dan tekad untuk
mengkonsolidasikan dan memastikan evaluasi sebagai pekerjaan dan profesi baru.
Indikator penting lainnya mengenai pelembagaan evaluasi yang profesional adalah sejauh
mana evaluasi telah menjadi topik pasar publikasi yang menjamur. Hal ini termasuk penerbitan jurnal-
jurnal profesional, yang seringkali berhubungan erat dengan asosiasi nasional masing-masing. Oleh
karena itu, American Evaluation Association memiliki dua publikasi: The American Journal of
Evaluation dan seri monografi New Directions for Evaluation (Mertens 2004, 52).
Di Eropa, jurnal Evaluation diterbitkan bekerja sama dengan European Evaluation Society.
Selain itu, sejumlah jurnal evaluasi nasional (dalam masing-masing bahasa nasional) telah dimulai
di beberapa negara Eropa. Semua ini berfungsi sebagai sumber informasi yang berguna mengenai
topik penelitian evaluasi.

CATATAN

1. Misalnya, lihat “eksperimen Pajak Penghasilan Negatif New Jersey,” yang melibatkan $8 juta untuk pengeluaran
penelitian (Rossi dan Lyall 1978).
2. Untuk tinjauan bermanfaat sebelumnya, lihat Levine dkk. 1981; Levine 1981; Wagner dan Wollmann 1986: Rist
1990; Derlien 1990; Mayne dkk.. 1992.
3. Masyarakat Evaluasi Eropa, http://www.europeanevaluation.org. Asosiasi Italiana de Valuatazi satu, http://
www.valutazione.it. Evaluasi Deutsche Gesellschaft für, http://www.degeval.de. Masyarakat Evaluasi
Finlandia, email: petri.virtanen@vm.vn.fi. Evaluasi Schweizerischegesellschaft, http://www.
seval.ch. Société Française de l'Evaluation, http://www.sfe.asso.fr. Société Wallonne de l'Evaluation et de la
rospective, http://www.prospeval.org.UK Evaluation Society, http://www.evaluation.org.uk

REFERENSI

Campbell, Donald T. (1969). “Reformasi sebagai Eksperimen.” Psikolog Amerika, hal. 409 dst.
Campbell, Donald T., dan Stanley, Y. (1963). Evaluasi Eksperimental dan Quasi-Eksperimental dalam Ilmu Sosial
mencari. Chicago: Rand McNally.
Bemelmans-Videc, ML (2002). Evaluasi di Belanda 1990–2000. Konsolidasi dan Ekspansi.
Dalam Jan-Eric Furubo, Ray C. Rist, dan Rolf Sandahl (eds.), Atlas Evaluasi Internasional. London:
Transaksi, hlm.115–128.
Derlien, Hans-Ulrich (1990). Kejadian dan Struktur Upaya Evaluasi dalam Perspektif Komparatif. Dalam Ray C. Rist
(ed.), Evaluasi Program dan Manajemen Pemerintahan. London: Transaksi, hlm.147–177.

Freeman, Howard, dan Solomon, Marian A. (1981). Penelitian Evaluasi Dekade Berikutnya. Dalam, Robert A.
Levine, , Marian A. Solomon, Gerd-Michael Hellstern dan H. Wollmann. (eds.), Evaluasi Penelitian dan
Praktik. Perspektif Komparatif dan Internasional. Beverly Hills: Sage, hlm.12–26.
Machine Translated by Google

Evaluasi Kebijakan dan Penelitian Evaluasi 401

Furubo, J., Rist, RC, dan Sandahl, Rolf (eds.) (2002). Atlas Evaluasi Internasional. London: Transak
tion.
Furubo, J., dan R. Sandahl (2002). Perspektif Difusi tentang Perkembangan Global dalam Evaluasi. Dalam Jan-
Eric Furubo, Ray C. Rist, dan Rolf Sandahl (eds.), Atlas Evaluasi Internasional. London: Transaksi, hal.
1–26.
Elzinga, Aant. (1985). Birokrasi Penelitian dan Pergeseran Kriteria Epistemik. Dalam Björnand Wittrock, dan Aant
Elzinga (eds.), Sistem Penelitian Universitas. Stockholm: Almqvist dan Wiksell, hlm.191–220.
Guba, Y., dan Lincoln E. (1989). Evaluasi Generasi Keempat. London: Bijaksana.
Laswell, HD (1951). Orientasi Kebijakan. Dalam Daniel Lerner dan Harold D. Lasswell, (eds.), The Policy Sci
ences. Palo Alta, CA: Stanford University Press, hlm.3–15
Leeuw, FL (2004). Evaluasi di Eropa. Dalam R. Stockmann (ed.), Evaluationsforschung (edisi ke-2). Diisi:
Leske + Budrich, hlm.61–83.
Levine, Robert A., Solomon, MA, Hellstern, G., dan Wollmann, Hellmut (eds.) (1981). Evaluasi Penelitian dan
Praktek. Perspektif Komparatif dan Internasional. Beverly Hills: Bijak.
Levine, Robert A. (1981).. Evaluasi Program dan Analisis Kebijakan di Negara-negara Barat: Suatu Tinjauan.
Dalam, Robert A. Levine, Marian A. Solomon,, Gerd-Michael Hellstern dan H. Wollmann. (eds.), Evaluasi
Penelitian dan Praktik. Perspektif Komparatif dan Internasional, Beverly Hills: Sage, hlm.12–27.
Lippi, Andreas. (2003). Sebagai pilihan sukarela atau sebagai kewajiban hukum? Menilai kebijakan Manajemen
Publik Baru di Italia. Dalam Hellmut Wollmann (ed.), Evaluasi Reformasi Sektor Publik. Cheltenham,
Inggris: Edward Elgar, hlm.140–169
Mayne, JL, Bemelmans-Videc, ML, Hudson, J., dan Conner, R. (eds.) (1992). Memajukan Evaluasi Kebijakan
Publik. Amsterdam: Belanda Utara
Mertens, Donna M. (2004). Evaluasi Pelembagaan di Amerika Serikat. Di Saham Reinhard
man (ed.), Evaluationsforschung (edisi ke-2). Ditambahkan: Leske + Budrich, hlm.45–60
Pawson, Ray, Tilley, Nick. (1997). Evaluasi Realistis. London: Bijaksana.
Pollitt, Christopher. (1995). “Pembenaran karena Perbuatan atau Iman? Mengevaluasi Manajemen Publik Baru,”
Evaluasi, 1(2, Oktober), 133–154.
Pollitt, Christopher/ Bouckaert, Geert (2003). Mengevaluasi Reformasi Manajemen Publik. Perspektif Internasional.
Dalam Hellmut Wollmann (ed.), Evaluasi Reformasi Sektor Publik. Cheltenham, Inggris: Edward Elgar,
hlm.12–35 .
Pollitt, Christopher, dan Bouckaert, Geert. (2004). Reformasi Manajemen Publik (Edisi ke-2nd). Oxford: Oxford
Pers Universitas.
Rossi, Peter H., Freeman, Howard E., dan Lipsey, Mark W. (1999). Evaluasi. Pendekatan Sistematis (6th
ed.). Thousand Oaks, CA: Sage.
Rist, Ray (ed.) (1990). Evaluasi Program dan Manajemen Pemerintahan. London: Transaksi.
Rist, Ray, dan Paliokas, Kathleen. (2002). Bangkit dan Jatuh (dan Bangkit Lagi?) dalam Fungsi Evaluasi di
Pemerintahan AS. Dalam Jan-Eric Furubo, Ray C. Rist, dan Rolf Sandahl (eds.), Atlas Evaluasi
Internasional. London: Transaksi, hlm.225–245.
Sandahl, Rolf. (2002). Evaluasi di Biro Audit Nasional Swedia. Di JL Mayne, ML Bemelmans Videc, J. Hudson,
dan R. Conner. (eds.), Memajukan Evaluasi Kebijakan Publik. Amsterdam: Belanda Utara, hlm.115–121.

Penulis, Michael. (1972). Metodologi Evaluasi. Dalam Carol H. Weiss (ed.), Mengevaluasi Program Tindakan.
Boston, hal. 123 dst.
Barang ebeam, DL (1983). Model CIPP untuk Evaluasi Program. Dalam GF Madaus, M. Scriven, dan DL
Stuffl ebeam (eds.), Model Evaluasi. Boston: Kluwer-Nijhoff, hlm.117–142.
Stame, Nicoletta. (2003). Evaluasi di Italia. Urutan terbalik dari manajer Performange ke program Evaluaton?
Dalam Jan-Eric Furubo, Ray C. Rist, dan Rolf Sandahl (eds.), Atlas Evaluasi Internasional. London:
Transaksi, hlm.273–290.
Thoenig, Jean-Claude. (2003). Belajar dari Praktek Evaluasi: Kasus Reformasi Sektor Publik. Dalam Hellmut
Wollmann (ed.), Evaluasi Reformasi Sektor Publik. Cheltenham, Inggris: Edward Elgar, hlm.209–230.

Vedung, Evert (1997). Evaluasi Kebijakan Publik dan Program. New Brunwick: Transaksi.
Wagner, Peter, dan Wollmann, Hellmut. (1986). “Fluktuasi Perkembangan Penelitian Evaluasi: Apakah Pergeseran
Rezim Penting?” Jurnal Ilmu Sosial Internasional, 108, 205–218.
Machine Translated by Google

402 Buku Panduan Analisis Kebijakan Publik

Wagner, Peter, dan Wollmann, Hellmut. (1991). “Melampaui Melayani Negara dan Birokrasi: Ilmu Sosial Berorientasi
Masalah di Jerman (Barat).” Pengetahuan dan Kebijakan 4 (12), hlm.46–88.
Weiss, RS, dan Rein, Martin. (1970). “Evaluasi program bertujuan luas. Desain Eksperimental, kesulitannya dan
alternatifnya.” Triwulanan Ilmu Administrasi, hal. 97 dst.
Wittrock, Björn, Wagner, Peter, dan Wollmann, Hellmut (1991). Ilmu sosial dan negara modern. Dalam Peter
Wagner, C. Weiss, C. Hirschon, Björn Wittrock, dan Hellmut Wollmann (eds.), Ilmu Sosial dan Negara
Modern. Cambridge: Cambridge University Press, hal.28–85.
Wollmann, Hellmut. (2002). Penelitian Kontrak dan Pengetahuan Kebijakan. Dalam Ensiklopedia Internasional Ilmu
Sosial dan Perilaku (vol. 5), hlm.11574–11578.
Wollmann, Hellmut. (ed.) (2003a). Evaluasi dalam Reformasi Sektor Publik, Cheltenham, Inggris: Edward Elgar.
Wollmann, Hellmut. (2003b). Evaluasi Reformasi Sektor Publik. Menuju evaluasi “gelombang ketiga”. Dalam
Hellmut Wollmann, Evaluasi Reformasi Sektor Publik. Cheltenham, Inggris: Edward Elgar, hlm.1–11.
Wollmann, Hellmut. (2003c)., Evaluasi Reformasi Sektor Publik. Tren, Potensi dan Batasan dalam Perspektif
Internasional. Dalam Hellmut Wollmann (ed.), Evaluasi Reformasi Sektor Publik. Cheltenham, Inggris:
Edward Elgar, hlm.231–258.
Wollmann, Hellmut. (2005). Ilmu Sosial Terapan: Perkembangan, Kecanggihan, Konsekuensi. Dalam UNESCO
(ed.), Sejarah Kemanusiaan (vol. VII). New York: Routledge (akan terbit), bab 21.

Anda mungkin juga menyukai