Randomisasi?
Ben Olken
Universitas Harvard dan J-PAL
www.povertyactionlab.org
Agenda
• Contoh:
– Apakah pemberian beasiswa dapat meningkatkan kehadiran di
sekolah?
– Apakah mengaudit proyek-proyek pembangunan jalan dapat
mengurangi tingkat korupsi?
– Apakah pemakaian kelambu dapat mencegah penyakit malaria?
Susunan dasar untuk evaluasi program
• Definisi-definisi:
– Hasil (Y): Hasil yang mungkin dipengaruhi oleh tindakan/upaya
perbaikan
– Diberi Tindakan (T): Kelompok yang dipengaruhi program
– Kontrol (C): Kelompok yang tidak terpengaruh program
• Asumsi utama :
– Bila tidak dilakukan upaya perbaikan, maka hasilnya akan sama antara
kelompok yand diuji coba dan kelompok kontrol
– Atau, dengan kata lain – kelompok kontrol adalah kontrafaktual
www.povertyactionlab.org
Contoh: suplemen zat besi di Jawa
• Latar belakang:
– Anemia (kekurangan zat besi) menyebabkan kurangnya energi dan
menurunkan kemampuan orang untuk bekerja
– Masalah ini bisa jadi parah di wilayah-wilayah pertanian di mana
masyarakat biasanya makan makanan yang tak diperkaya dengan zat
tambahan
• Program:
– Program percontohan pengayaan zat besi di Purworejo, Jawa Tengah
– Tenaga kesehatan mendatangi rumah tangga dan memotivasi mereka
untuk mengonsumsi pil zat besi satu kali per minggu
9 (diamati)
Belum tentu!
7
(diamati)
waktu
2002 2003
PROGRAM
Kita perlu mengetahui apa yang akan
terjadi jika program tidak dilaksanakan
Penghasilan bulanan
(Rp100.000)
9 (diamati)
waktu
2002 2003
Kita perlu mengetahui apa yang akan
terjadi jika program tidak dilaksanakan
Penghasilan bulanan
(Rp100.000)
9 (diamati)
Dampak: 9 – X
waktu
2002 2003
Gagasan: Gunakan kelompok kontrol
untuk memperkirakan X
Penghasilan bulanan
(Rp100.000)
waktu
2002 2003
Apa yang membuat sebuah kelompok
kontrol baik/ buruk?
• Apabila terdapat perbedaan antara kelompok peserta
dan bukan-peserta
– Misalkan, suplemen zat besi hanya diberikan kepada rumah
tangga yang berada dekat Puskesmas
– Dalam hal ini. kelompok yang mendapatkan tindakan tinggal
dekat Puskesmas sedangkan kelompok kontrol tinggal jauh
dari Puskesmas
Dampak sesungguhnya: 9 –
7.9 = 1.1
X (Apa yang akan terjadi bila
tak ada program?)
Kelompok Kontrol
waktu
2002 2003
Bias Seleksi
Penghasilan bulanan
(Rp100.000) Kelompok Tindakan
waktu
2002 2003
Satu solusi … evaluasi teracak
• Dalam hal ini, mereka menentukan rumah tangga mana
yang menerima suplemen zat besi, dan mana yang
tidak, melalui undian
Dampak sesungguhnya:
9 – 7.9 =1.1
Dampak yang Anda
perkirakan jika
X menggunakan kelompok
kontrol yang salah : 9 – 7
=2
Kelompok Kontrol
waktu
2002 2003
Contoh: Hasil dari penelitian
Purworejo
10 9.36
penghasilan Bulanan Rp (100,000)
7.91
8
6.6
6 5.5
Tindakan
4 Kontrol
0
Laki-laki Perempuan
III – APA YANG DIMAKSUD
DENGAN EVALUASI
TERACAK ITU
SEBENARNYA?
www.povertyactionlab.org
Ketentuan-ketentuan Dasar
Dimulai dengan hal sederhana:
• Ambil sampel dari calon peserta program
• Secara acak masukkan mereka ke dalam:
– Kelompok Tindakan – mendapatkan upaya perbaikan
– Kelompok Kontrol – tidak diperbolehkan untuk mendapatkan upaya
perbaikan (selama masa evaluasi)
• Acak berarti bahwa penentuan suatu kelompok untuk
mendapatkan upaya perbaikan atau tidak dilakukan melalui
undian:
– Dapat diundi lewat komputer
– Dapat diundi langsung di tengah masyarakat
• Catatan: penetapan acak terhadap kelompok tindakan dan
kelompok kontrol tidak sama dengan pengambilan sampel
secara acak
Mengapa penempatan secara acak
dapat berhasil?
• Mengapa penempatan secara acak terhadap kelompok tindakan dan
kelompok kontrol dapat menghasilkan kontrafaktual yang baik?
• Maka…
– Apabila tidak ada upaya perbaikan, kedua kelompok akan sama
– Perbedaan satu-satunya antara kelompok tindakan dan kelompok kontrol
adalah dampak upaya perbaikan!
Persiapan Dasar suatu Evaluasi Acak
Populasi Sasaran
Peserta Potensial
Sampel Evaluasi
Penempatan Acak
Kelompok Kelompok
Tindakan Kontrol
• Faktor-faktor penting :
– Apa unit pengambil keputusannya?
– Pada tingkat mana data dapat dikumpulkan?
IV – KELEBIHAN DAN
KEKURANGAN DARI EVALUASI
TERACAK
www.povertyactionlab.org
Validitas
• Dalam menilai setiap penelitian, ada dua jenis masalah
yang harus dipikirkan:
– Validitas Internal: berhubungan dengan kemampuan untuk
menarik kesimpulan kausal, misalnya, dapatkah kita mengaitkan
perkiraan dampak dengan program, dan bukan dengan hal
lainnya?
– Validitas Eksternal
(misalnya, apakah hasil-hasilnya dapat digeneralisasikan
terhadap populasi yang diamati?)
• Ekuilibrium parsial
Kekurangan-kekurangan lain dari
Eksperimen
• Masalah Etika
– Sebagian besar program dijatahkan karena kurangnya sumber
daya
– Proses pemilihan acak merupakan cara yang “adil” untuk
mengalokasikan sumber daya.
– Mungkin ada baiknya juga menghapus unsur kebijaksanaan
dalam pengalokasian karena sebab-sebab lain (misalnya,
mencegah favoritisme)
– Masuk-bertahap atau proyek percontohan secara alami memberi
ruang pada randomisasi
– Mengeksploitasi proyek percontohan atau sisipan oleh sebab
keterbatasan anggaran
V –SEBERAPA JAUH ANDA BISA
SALAH: KAMPANYE VOTE 2002
www.povertyactionlab.org
Kasus 1 – Kampanye “Vote 2002”
• Intervensi yang dirancang untuk meningkatkan tingkat
partisipasi pemilih dalam pemilihan umum di A.S. pada
tahun 2002
• Panggilan telepon kepada ~60.000 orang
• Hanya ~35.000 orang yang berhasil dihubungi
• Pertanyaan utama: Apakah kampanye tersebut memiliki
dampak positif terhadap tingkat partisipasi pemilih?
– 5 metode digunakan untuk memperkirakan dampak
Metode 1-3
Perkiraan Dampak
Metode 1 10.8 pp *
Metode 2 6.1 pp *
Metode 3 4.5 pp *
Perkiraan Dampak