Program Pengembangan
Jika Anda atau anak-anak Anda bersekolah di sekolah umum di Amerika Serikat
dalam 30 tahun terakhir, ada kemungkinan Anda memiliki pengalaman dengan program
pencegahan penyalahgunaan zat yang disebut DARE (Pendidikan Perlawanan
Penyalahgunaan Narkoba). DARE melibatkan petugas polisi yang pergi ke ruang kelas di
sekolah-sekolah lokal untuk menyajikan kurikulum selama beberapa minggu. Petugas
menyajikan informasi tentang bahaya penggunaan narkoba dan mengajarkan keterampilan
penolakan untuk membantu siswa yang berpartisipasi menolak tekanan teman sebaya untuk
menggunakan narkoba. Program ini awalnya didasarkan pada kebijakan nol toleransi
terhadap penggunaan narkoba, dan siswa didorong untuk menandatangani janji yang
menyatakan bahwa mereka tidak akan menggunakan narkoba. Siswa yang menyelesaikan
program menerima sertifikat, T-shirt, dan materi lainnya yang mempromosikan pesan
"katakan saja tidak pada narkoba".
Jika Anda berpartisipasi dalam program DARE, luangkan waktu sejenak untuk
berpikir kembali. Apa yang Anda ingat tentang program ini? Apakah Anda menikmatinya?
Apakah Anda pikir itu efektif? Apakah Anda pikir itu membantu mencegah penyalahgunaan
narkoba di sekolah atau komunitas Anda? Sudahkah pemikiran Anda tentang program
berubah di tahun-tahun sejak partisipasi Anda?
DARE dimulai pada tahun 1983 oleh Departemen Kepolisian Los Angeles
bekerjasama dengan Los Angeles Unified School District. Selama bertahun-tahun, ia telah
mengembangkan sejumlah kurikulum yang berbeda yang menargetkan berbagai tingkatan
dan topik (seperti penyalahgunaan obat resep). Ini terus menjadi program pencegahan
penggunaan narkoba berbasis sekolah yang paling populer di Amerika Serikat. Menurut situs
web organisasi, DARE diajarkan di semua 50 negara bagian dan sebagian besar distrik
sekolah dan di 43 negara, menjangkau jutaan anak sekolah (DARE, 2009).
Tetapi sejumlah evaluasi kurikulum sekolah yang disampaikan oleh DARE hanya
memberikan bukti terbatas tentang keefektifannya. Misalnya, hasil dari evaluasi longitudinal
dari program di 36 sekolah di Illinois menunjukkan hanya dampak kecil pada penggunaan
narkoba siswa segera setelah intervensi dan tidak ada bukti dampak pada penggunaan
narkoba satu atau dua tahun setelah menerima instruksi DARE. Selain itu, evaluasi
menunjukkan bahwa program DARE hanya membatasi efek positif pada variabel seperti
harga diri dan tidak berpengaruh pada variabel keterampilan sosial seperti resistensi terhadap
tekanan teman sebaya (Enett et al., 1994, hal. 113). Evaluasi negatif terus menumpuk selama
bertahun-tahun. Pada 1998, sebuah laporan kepada National Institute of Justice
menyimpulkan bahwa DARE tidak efektif (Sherman et al., 1998), dan pada tahun 2001,
Surgeon General Amerika Serikat menempatkan DARE dalam kategori program pencegahan
“Tidak Berfungsi” ( Satcher, 2001).
Apakah hasil negatif ini sesuai dengan pengalaman Anda tentang program ini?
Menurut Anda apa yang mungkin menyebabkan hasil negatif ini?
Dalam bab ini, kita akan membahas bagaimana evaluasi program digunakan untuk
membantu mengembangkan, meningkatkan, dan mengevaluasi efektivitas program seperti
DARE. Salah satu tujuan bab ini adalah memberikan Anda beberapa model dan keterampilan
yang sangat spesifik yang dapat Anda gunakan untuk melakukan evaluasi jenis ini. Kami
akan kembali ke DARE, tetapi pertama-tama kami ingin menegaskan bahwa Anda sudah tahu
banyak tentang evaluasi program.
Evaluasi bukan hanya kegiatan yang dilakukan oleh para ilmuwan sosial. Kita semua
terlibat dalam apa yang pada dasarnya evaluasi program, dan pada dasarnya kita
melakukannya setiap hari. Ketika Anda pergi ke restoran baru atau menonton tim olahraga
favorit Anda, Anda terlibat dalam evaluasi. Di sebuah restoran, Anda berpikir tentang
kualitas layanan, kualitas makanan, biaya, dan suasana. Jika layanan lambat, makanan itu
tidak istimewa, dan biayanya tinggi, Anda mungkin tidak akan pergi ke sana lagi. Dan Anda
mungkin akan "menyebarluaskan hasil Anda." Jika seorang teman bertanya tentang
pengalaman Anda dengan restoran, Anda akan memberikan data Anda (layanan yang buruk,
makanan biasa-biasa saja, dan harga tinggi) dan evaluasi keseluruhan Anda (jangan repot-
repot pergi ke sana).
Ketika Anda menonton tim olahraga favorit Anda, Anda berpikir tentang kinerja
individu para pemain (dalam pertandingan itu, sepanjang musim, dan di musim-musim
sebelumnya), kinerja tim melawan tim lawan di masa lalu, kualitas pelatihan, dan mungkin
biaya untuk tim merekrut pemain individu. Anda juga mungkin akan mempertimbangkan
konteks permainan yang sedang dimainkan. Beberapa faktor kontekstual yang dapat Anda
pertimbangkan adalah cuaca, jika tim bermain di rumah atau jauh, apakah tim memiliki
kesempatan untuk beristirahat sejak pertandingan terakhir mereka, dan pendapat populer
tentang peluang tim untuk menang. Dengan tim olahraga, evaluasi Anda dan data yang Anda
pertimbangkan mungkin akan sangat tergantung pada tujuan Anda untuk tim. Jika tim tampil
jauh lebih baik daripada musim sebelumnya, dengan sejumlah pemain baru yang berbakat
dan pelatih baru, evaluasi Anda cenderung positif, bahkan jika tim tidak memiliki musim
yang luar biasa. Jika Anda mengevaluasi tim sepak bola anak Anda dan tujuan Anda adalah
agar para pemain belajar rukun dan bersenang-senang, dengan setiap anak memiliki
kesempatan untuk bermain, kinerja tim yang sebenarnya mungkin tidak ada hubungannya
dengan evaluasi Anda tentang keberhasilan tim.
Setiap tahun, miliaran dolar uang pajak, sumbangan amal, dan hibah dari yayasan
filantropi dihabiskan untuk melakukan hal-hal baik di masyarakat. Jutaan warga sukarela
waktu dan upaya untuk mempromosikan tujuan-tujuan ini. Bahkan anggota staf yang dibayar
dalam organisasi masyarakat sering memilih untuk bekerja dengan gaji rendah untuk
mempromosikan tujuan tersebut. Apakah waktu, tenaga, dan uang itu membuat perbedaan?
Sektor pemerintah, nirlaba, dan swasta ditantang untuk menunjukkan hasil (lihat Kantor
Akuntansi Pemerintah AS di http://www.gao.gov dan United Way di
http://liveunited.org/pages/about-united-wayworldwide) ). Ini biasanya disebut sebagai
akuntabilitas berbasis hasil. Pada awalnya, ini bisa menjadi prospek yang menakutkan bagi
orang yang menjalankan program. Berikut adalah beberapa keluhan dan kekhawatiran umum
tentang evaluasi program (disusun oleh Northwest Regional Education Laboratory, 1999):
3. Evaluasi dapat mengganggu kegiatan program atau bersaing dengan layanan untuk sumber
daya yang langka.
4. Hasil evaluasi dapat disalahgunakan dan disalahtafsirkan, terutama oleh lawan program.
Bayangkan diri Anda sebagai anggota dewan yayasan yang harus membuat keputusan
pendanaan tentang program komunitas. Anda mendapatkan lebih banyak permintaan
pendanaan daripada yang dapat Anda danai. Masuk akal untuk bertanya kepada penerima,
"Bagaimana kami bisa tahu jika program Anda, didukung oleh dana hibah kami, benar-benar
mencapai tujuannya?" Schorr (1997) menggambarkan beberapa jenis respons terhadap
pertanyaan ini yang sering diberikan oleh organisasi nirlaba dan lembaga pemerintah.
Kepercayaan dan Nilai-Nilai “Percayai kami. Apa yang kami lakukan sangat berharga,
sangat rumit, sangat sulit untuk didokumentasikan, sangat sulit untuk dinilai, dan kami sangat
bermaksud bahwa masyarakat harus mendukung kami tanpa menuntut bukti keefektifan.
Jangan biarkan penghitung kacang yang mengetahui biaya segala sesuatu dan nilai dari tidak
ada yang menghalangi upaya kita yang gagah berani untuk menyelesaikan pekerjaan dunia
”(Schorr, 1997, hal 116).
Masalah potensial dengan jawaban ini: Jika pendanaan program didasarkan pada
kepercayaan, warga dan pembuat keputusan tidak mengetahui proses bagaimana program
bekerja dan tidak tahu apakah ada hasil.
Proses dan Keluaran “Agen kami melihat 200 klien yang memenuhi syarat setiap tahun
dalam 20 program pendidikan orang tua yang kami tawarkan dengan 2 anggota staf berlisensi
kami yang didanai oleh hibah Anda.” Ini mungkin jawaban yang paling umum, dengan
dokumentasi terperinci dari program atau layanan yang disediakan dan sumber daya yang
dikeluarkan.
Masalah potensial: Menyediakan layanan tidak berarti bahwa layanan tersebut efektif.
Layanan mungkin salah arah, sehingga tidak mengatasi masalah sebenarnya. Mereka
mungkin direncanakan dengan baik tetapi tidak kuat atau tidak cukup dana untuk membuat
perbedaan. Mereka mungkin memiliki efek samping yang tidak diinginkan. Harapan yang
harapan tetapi tidak berdokumen mendasari banyak program komunitas.
Akuntabilitas Berbasis Hasil. Dengan menggunakan evaluasi program, staf lembaga dan
evaluator dapat menunjukkan bahwa program tertentu mencapai efek yang diinginkan.
Mereka juga dapat memodifikasinya untuk menjadi lebih efektif. Masalah potensial:
Seringkali, anggota staf lembaga tidak dilatih untuk melakukan evaluasi. Juga, apa yang
terjadi jika evaluasi menunjukkan bahwa program tidak memiliki hasil yang diinginkan?
Apakah program akan diberi kesempatan untuk meningkatkan dan sumber daya yang
diperlukan untuk melakukannya?
Evaluasi program dan keinginan untuk perbaikan. Anda dapat melihat sejumlah tema ini
dalam tanggapan dari direktur DARE terhadap hasil evaluasi negatif. Laporan 1998 dari
National Institute of Justice menyatakan bahwa, “Para pendukung DARE menentang hasil
evaluasi DARE ilmiah. Pejabat DARE Amerika sering dikutip mengatakan bahwa dukungan
publik yang kuat untuk program ini merupakan indikator yang lebih baik dari kegunaannya
daripada studi ilmiah ”(Sherman et al., 1998). Alih-alih menggunakan hasil evaluasi untuk
memperkuat program, para pendukung DARE awalnya menolak validitas hasil.
Tapi itu bukan akhir dari kisah DARE. Bahkan dengan hasil evaluasi yang
mengecewakan, ada alasan bagus untuk tidak hanya menghilangkan program DARE. DARE
memiliki sesuatu yang tidak dimiliki oleh program lain: dukungan pencegahan dan sistem
pengiriman nasional dan internasional yang sangat berhasil. Ingat diskusi kita tentang sistem
ini sebagai bagian dari Kerangka Sistem Interaktif untuk Penyebaran dan Implementasi di
Bab 10? DARE telah menunjukkan selama beberapa dekade bahwa petugas kepolisian dapat
berhasil dilatih untuk menyediakan program yang dirancang (petugas menerima minimal 80
jam pelatihan) dan bahwa sekolah dan departemen kepolisian yang bekerja bersama dapat
mengimplementasikan program dengan kesetiaan yang tinggi kepada audiens yang dituju
(Merrill et al., 2006). Seperti yang Anda ingat dari Bab 10, dukungan pencegahan dan sistem
pengiriman berskala besar yang efektif adalah sesuatu yang tidak dapat dikembangkan oleh
banyak program berbasis bukti, dan fakta bahwa DARE telah berhasil mengembangkannya
adalah temuan penting.
Selain itu, program DARE penuh termasuk kurikulum yang dikembangkan untuk
siswa sekolah dasar hingga sekolah menengah. Kurikulum sekolah dasar adalah yang paling
sering dievaluasi, tetapi para ilmuwan pencegahan setuju bahwa pendekatan yang
komprehensif dan sesuai dengan perkembangan direkomendasikan. Akhirnya, ingat diskusi
kita tentang efikasi vs studi efektivitas pada Bab 9? Studi efikasi umumnya dilakukan dalam
kondisi yang terkendali sementara program masih dalam pengembangan dan dirancang untuk
menguji apakah program tersebut mampu menghasilkan hasil yang positif. Studi efektivitas
dilakukan dalam berbagai pengaturan, seringkali dengan kontrol jauh lebih sedikit, dan
dirancang untuk menguji apakah program dapat menghasilkan hasil positif dalam kondisi
kehidupan nyata. Banyak program yang telah berhasil dalam studi efikasi telah gagal untuk
mereplikasi hasil tersebut dalam studi efektivitas. Karena keadaan unik di sekitar
perkembangannya, DARE pada dasarnya tidak pernah memiliki studi kemanjuran dan pada
dasarnya langsung ke standar efektivitas yang lebih sulit.
Para pejabat DARE mulai mengakui bahwa ada masalah dengan program mereka, dan
mereka mulai membuat modifikasi dan mengembangkan program baru. Bahkan program-
program baru ini seringkali menghasilkan hasil yang mengecewakan (Sloboda et al., 2009).
Baru-baru ini, DARE telah mengadopsi kurikulum sekolah menengah berbasis bukti baru
yang dikembangkan oleh para peneliti di Penn State University dan Arizona State University.
Program tersebut, yang disebut keepin 'REAL, telah dimasukkan dalam SAMSHA National
Registry Program dan Praktek Berbasis Bukti
(http://www.nrepp.samhsa.gov/ViewIntervention.aspx?id=133). Pada saat tulisan ini dibuat,
DARE baru memulai penggunaan program baru ini. Akan sangat menarik untuk melihat apa
yang terjadi ketika sebuah program berbasis bukti dikombinasikan dengan dukungan program
dan sistem pengiriman DARE yang telah terbukti.
Kisah DARE mengilustrasikan beberapa tema penting dalam bab ini: 1) Evaluasi
tentang efektivitas suatu program dapat mengarah pada upaya peningkatan program, dan 2)
apakah program bekerja dan untuk siapa harus memengaruhi pengambilan keputusan
berdasarkan informasi di masyarakat (misalnya, saat awal pendidikan pencegahan
penyalahgunaan zat adalah ide yang baik, pendekatan pendorong lanjutan dalam tahun-tahun
berisiko tinggi juga harus dipertimbangkan). Singkatnya, evaluasi program dan
pengembangan program perlu dihubungkan sehingga data dapat menginformasikan
keputusan. Tanpa keterkaitan itu, keputusan tentang program komunitas dibuat dengan
banyak informasi yang salah dan angan-angan tentang apa sebenarnya efek program tersebut.
Jika evaluasi program dan pengembangan program dikaitkan, bahkan hasil yang
mengecewakan pada awalnya dapat mengarah pada peningkatan sistematis dalam suatu
program dan keputusan berdasarkan informasi tentang strategi apa yang harus diterapkan
dengan siapa.
Untuk DARE, seperti halnya banyak program masyarakat, studi evaluasi pada awalnya
dirancang untuk menghasilkan putusan akhir tentang efektivitas program, bukan untuk
memberikan informasi spesifik tentang cara memperbaikinya. Studi tersebut sering
membandingkan kelompok intervensi yang menerima program dengan kelompok
pembanding yang tidak. Apakah kelompok berbeda secara signifikan atau tidak, studi hasil
seperti itu tidak memberi tahu kami secara spesifik mengapa intervensi berhasil (atau tidak
berhasil) atau apa yang harus dilakukan untuk meningkatkan hasil. Tanpa informasi tersebut,
staf program dan anggota masyarakat hanya memiliki sedikit panduan untuk keputusan
mereka tentang masa depan program.
Dalam evaluasi program, kami sering memusatkan perhatian pada dua poin utama: 1)
Apakah berhasil? dan 2) Mengapa atau mengapa tidak? Bagaimana kita bisa menganalisis
suatu program untuk melihat apakah program itu berfungsi (hasil) dan mengapa program itu
bekerja atau tidak berfungsi (proses)?
Setidaknya ada dua alasan mengapa program tidak bekerja: kegagalan teori dan
kegagalan implementasi. Kegagalan teori berkaitan dengan teori program: alasan mengapa
intervensi tertentu dianggap sesuai untuk masalah tertentu dengan populasi target tertentu
dalam konteks budaya dan sosial tertentu. Teori program juga membantu memilih
pengukuran atau metode yang tepat untuk mempelajari efek program. Mari kita kembali ke
penelitian tentang DARE yang dijelaskan di awal bab ini. Dalam kasus DARE, teori
programnya adalah: Menyajikan informasi kepada siswa tentang efek berbahaya dari
penggunaan narkoba, bersama dengan keterampilan penolakan tekanan teman sebaya, akan
menghasilkan lebih sedikit penyalahgunaan narkoba pada remaja. Kegagalan implementasi
menyangkut kualitas implementasi program. Anda mungkin memiliki teori program yang
sangat baik yang telah ditunjukkan di tempat lain untuk bekerja dengan populasi target Anda,
tetapi implementasi di lokasi Anda mungkin lemah karena kurangnya sumber daya, personel
yang tidak berpengalaman, pelatihan yang tidak memadai, atau alasan lain (lihat Bab 10).
Lihat logika DARE pada Tabel 13.1.
Sejak 1960-an, bidang evaluasi program telah mengembangkan konsep dan metode
berdasarkan metode ilmu sosial untuk mempelajari teori dan implementasi program. Bab ini
menggunakan banyak konsep evaluasi program dasar ini. Namun, kami fokus pada
pendekatan yang membuat evaluasi program ramah pengguna dan dapat diakses oleh audiens
yang lebih luas. (Untuk ulasan yang lebih detail, lihat Patton, 2008; Rossi, Lipsey, &
Freeman, 2004)
Penilai profesional dilatih untuk berpikir secara kausal. Mereka mengakui bahwa
kegiatan intervensi atau pencegahan harus didasarkan pada penggunaan teori atau model
variabel yang menyebabkan masalah (model masalah) dan teori program strategi yang akan
mengubah variabel-variabel ini untuk menghasilkan perbaikan (model solusi) ) (lihat
Goodman & Wandersman, 1994). Model-model ini dapat dengan jelas dinyatakan oleh
pengembang program atau program hanya dapat didasarkan pada asumsi implisit. Efek yang
diinginkan tidak akan terjadi jika:
1. Asumsi yang mendasari teori program tidak sesuai untuk konteks program.
Tujuan utama dari model logika kausal adalah untuk menunjukkan secara sederhana,
cara yang dapat dimengerti hubungan logis antara kondisi yang berkontribusi pada kebutuhan
akan suatu program dalam suatu komunitas, kegiatan yang ditujukan untuk mengatasi kondisi
ini, dan hasil serta dampak yang diharapkan terjadi. hasil dari kegiatan (misalnya,
http://toolkit.childwelfare.gov/toolkit).
Model logika adalah representasi grafis tentang cara kerja program. Gambar 13.1
mengilustrasikan model logika empat langkah yang dapat diterapkan untuk evaluasi program.
Baris teratasnya terdiri dari empat lingkaran, mewakili kondisi program, kegiatan, hasil, dan
dampak. Lingkaran dihubungkan bersama dengan garis-garis yang menunjukkan hubungan
logis yang diharapkan di antara mereka berdasarkan teori program. Hubungan-hubungan ini
di antara lingkaran juga menunjukkan urutan peristiwa yang dimaksudkan yang terjadi
sebagai akibat dari kegiatan program.
Pada lingkaran pertama, kondisi mencakup faktor atau proses risiko, masalah
komunitas, atau kesulitan organisasi yang ingin ditangani oleh program. Lingkaran kedua
mencakup kegiatan yang membahas setiap kondisi; satu atau lebih kegiatan dapat bertujuan
untuk menyelesaikan masing-masing kondisi. Lingkaran ketiga berisi hasil langsung yang
dihasilkan dari aktivitas (mis., Perubahan dalam pengetahuan atau sikap peserta program atau
perubahan dalam undang-undang setempat atau kebijakan organisasi). Lingkaran keempat
menyangkut dampak program pada akhirnya bagi masyarakat luas. Sebagai contoh, dampak
dalam ATOD mungkin termasuk menurunkan alkohol dan penyalahgunaan obat-obatan
lainnya di suatu komunitas serta konsekuensi terkait, seperti kejahatan yang lebih rendah dan
kesehatan pribadi yang lebih baik.
Pada tahun 1996, jaringan United Way organisasi filantropi komunitas mulai
mempromosikan buku kerja tentang pengukuran hasil, yang telah merevolusi evaluasi di
antara banyak organisasi komunitas nirlaba di Amerika Serikat. Sementara model United
Way berbeda dalam beberapa terminologi dari model empat langkah kami (dijelaskan di
bagian selanjutnya), esensinya serupa. Model United Way memberikan contoh model logika
yang sering digunakan dalam praktik komunitas (United Way, 1996).
Linney dan Wandersman (1991) berusaha untuk merancang bahan yang akan
merangsang pemikiran analitis tentang cara-cara di mana program pencegahan dapat
mempengaruhi hasil, pemikiran realistis tentang efek dari setiap upaya pencegahan, dan
perencanaan yang cermat untuk implementasi. Volume mereka, Prevention Plus III,
dikembangkan untuk mengajarkan orang-orang di tingkat lokal dasar-dasar tentang evaluasi
dan bagaimana melakukan evaluasi dasar dari program mereka sendiri. Buku ini merinci
evaluasi program menjadi empat langkah dasar (tujuan dan hasil yang diinginkan, evaluasi
proses, evaluasi hasil, dan evaluasi dampak) yang berhubungan dengan model logika (lihat
Gambar 13.1, baris tiga).
Dimulai dengan tujuan menetapkan pemandangan proyek. Sasaran mewakili apa yang
sedang diperjuangkan proyek (mis., Anak-anak yang memiliki hubungan sosial yang positif
dan dididik dengan baik sehingga mereka akan menjadi anggota masyarakat yang produktif).
Tujuan cenderung ambisius dan menetapkan kerangka kerja untuk hasil. Hasil lebih spesifik
dan mewakili apa proyek bertanggung jawab. Tujuan bisa bersifat umum; hasil harus spesifik
dan terukur (Schorr, 1997).
Jika suatu program komunitas memiliki tujuan pencegahan / promosi (lihat Bab 9
buku ini), tujuan dan hasil menyangkut masalah yang harus dicegah atau kompetensi dan
hasil kesehatan yang akan dipromosikan. Atau, jika inisiatif komunitas mengatasi masalah
komunitas yang lebih luas (lihat Bab 12), perubahan yang ingin dibuatnya mengindikasikan
tujuan dan hasil yang diinginkan.
Tujuan utama, seperti meningkatkan keterlibatan orang tua di sekolah atau mengurangi
penggunaan narkoba.
Kelompok sasaran, seperti guru, anak-anak dari usia tertentu, orang tua, atau masyarakat
umum. Kelompok sasaran dapat digambarkan dengan karakteristik demografis (misalnya,
usia, jenis kelamin, ras, status sosial ekonomi), transisi perkembangan (misalnya, memasuki
sekolah menengah, perceraian, berkabung), proses risiko (misalnya, tingkat rendah, beberapa
insiden perilaku di sekolah), lokalitas, atau kriteria lainnya.
Hasil yang diinginkan, seperti peningkatan sikap menolak merokok atau mengurangi
ketidakhadiran di sekolah. Hasil yang dirumuskan dengan baik didefinisikan dengan jelas dan
spesifik, realistis dan dapat dicapai, dan dapat diukur.
Tabel 13.2 menggambarkan metode evaluasi empat langkah dengan lembar kerja
yang diadaptasi dari Prevention Plus III (Linney & Wandersman, 1991). Langkah 1 dalam
tabel itu menunjukkan pertanyaan yang perlu diajukan perencana program kepada diri
mereka sendiri untuk menentukan tujuan program, kelompok sasaran, dan hasil yang
diinginkan.
Pada Langkah 2, kegiatan yang dirancang untuk mencapai hasil yang diinginkan dijelaskan.
Mereka menjawab pertanyaan, "Apa yang sebenarnya dilakukan program itu?"
Tujuan Evaluasi Proses. Evaluasi proses memiliki beberapa tujuan. Pertama, kegiatan
pemantauan program membantu mengatur upaya program. Ini membantu memastikan bahwa
semua bagian dari program dilaksanakan sesuai rencana. Ini juga membantu program
menggunakan sumber daya di tempat yang mereka butuhkan — misalnya, tidak
menghabiskan sebagian besar uangnya hanya untuk satu kegiatan atau kelompok sasaran.
Selain itu, ini memberikan informasi untuk membantu mengelola program dan memodifikasi
kegiatan, yang mengarah ke koreksi tengah jalan yang meningkatkan hasil proyek.
Ketiga, setelah evaluasi nanti atas hasil dan dampak, proses evaluasi dapat
memberikan informasi tentang mengapa program bekerja atau tidak bekerja. Dengan
memberikan informasi tentang apa yang dilakukan dan siapa yang dijangkau, perencana
program dapat mengidentifikasi alasan untuk mencapai hasil atau tidak mencapainya.
Informasi evaluasi proses juga dapat memberikan informasi untuk perbaikan di masa depan
dan untuk berbagi kiat praktis dengan orang lain yang merencanakan program serupa.
Keempat, proses evaluasi dapat membantu Anda memutuskan apakah Anda siap
untuk menilai efek dari program Anda. Misalnya, jika suatu program hanya ada untuk waktu
yang singkat dan Anda telah mengimplementasikan hanya aktivitas ketiga dari program tujuh
aktivitas, maka itu terlalu dini untuk menilai hasil program.
Kelima, kondisi kadang berubah dan apa yang direncanakan bukan yang sebenarnya
terjadi. Evaluasi proses membantu melacak perubahan tersebut. Menjawab pertanyaan
evaluasi proses sebelum, selama, dan setelah kegiatan yang direncanakan
mendokumentasikan apa yang sebenarnya terjadi.
Melakukan Evaluasi Proses. Evaluasi proses berpusat pada dua pertanyaan terkait: Apa
kegiatan yang dimaksud dan kegiatan program yang sebenarnya? Setelah diimplementasikan,
apa yang dipelajari perencana program dan anggota staf dari pengalaman mereka? (Lihat
Tabel 13.2 Bagian A dan B, Langkah 2.)
Mengenai kegiatan, evaluasi proses bertanya: Siapa yang seharusnya melakukan apa dengan
siapa dan kapan harus dilakukan? (Lihat Tabel 13.2.).
Siapa yang merujuk pada staf yang memberikan layanan. Berapa banyak anggota staf? Jenis
kualifikasi dan pelatihan apa yang mereka butuhkan?
Apa yang merujuk pada apa yang diminta oleh staf (mis., Mengadakan kelas, menunjukkan
film, perilaku model).
Ketika merujuk pada waktu dan pengaturan aktivitas (mis., Selama majelis sekolah,
setelah sekolah).
Semakin jelas pertanyaan dijawab, semakin berguna evaluasi proses (lihat Tabel 13.2,
Langkah 2, untuk pertanyaan spesifik). Semua informasi yang dikumpulkan dalam proses
evaluasi dapat digunakan untuk meningkatkan (atau membuang) kegiatan di masa depan
(lihat Tabel 13.2, Bagian B dari Langkah 2).
Evaluasi hasil menilai dampak langsung dari suatu program. “Bottom line” dari penilaian
programe menyangkut efek langsung ini (lihat Tabel 13.2, Langkah 3) dan dampak program
utama (Langkah 4). (Perhatikan bahwa bidang evaluasi program menggunakan istilah hasil
dan dampak sebagaimana dijelaskan dalam bab ini. Bidang kesehatan masyarakat
membalikkan ketentuan-ketentuan ini dan menggunakan istilah hasil untuk mengartikan
indikator dan dampak jangka panjang dengan mengartikan indikator jangka pendek. )
Evaluasi hasil, seperti istilah yang digunakan dalam evaluasi program dan psikologi
komunitas, berkaitan dengan mengukur efek jangka pendek atau langsung dari suatu program
pada peserta atau penerimanya. Ini mencoba untuk menentukan efek langsung dari program,
seperti sejauh mana program pencegahan penggunaan narkoba meningkatkan pengetahuan
tentang narkoba dan risiko yang dirasakan menggunakan narkoba.
Pada dasarnya, Langkah 3 melihat pada hasil yang diinginkan yang dijelaskan pada Langkah
1 dan mencari bukti mengenai sejauh mana hasil tersebut dicapai (lihat Tabel 13.2, Langkah
3). Bukti hasil program untuk program pencegahan penyalahgunaan narkoba dapat mencakup
peningkatan kesadaran akan bahaya narkoba atau peningkatan skor pada ukuran keterampilan
sosial untuk melawan tekanan untuk menggunakan narkoba. Merencanakan cara
mengumpulkan data atau bukti ini paling baik dimulai bersamaan dengan perencanaan tujuan
dan hasil program.
Ukuran Hasil. Ini harus terkait erat dengan tujuan tetapi lebih spesifik. Ada beberapa
cara potensial untuk mengukur hasil.
Kuisioner laporan diri biasanya digunakan untuk mengukur hasil. Seperti yang mungkin
Anda ketahui dari kursus metodologi sebelumnya, mereka harus dipilih dengan hati-hati, dan
keandalan serta validitasnya harus dipertimbangkan. Uji / uji ulang reliabilitas (stabilitas)
suatu ukuran adalah perhatian khusus jika harus diberikan sebelum dan sesudah intervensi.
Bangun validitas, sejauh mana kuesioner mengukur apa yang diklaimnya untuk diukur, juga
merupakan masalah penting. Apakah ukuran keterampilan pemecahan masalah tertentu
benar-benar mengukur keterampilan itu? Validitas prediktif juga menjadi perhatian. Apakah
ukuran sikap tentang penggunaan narkoba memprediksi penggunaan narkoba yang
sebenarnya satu tahun kemudian? Pengembang dan evaluator program perlu
mempertimbangkan pertanyaan-pertanyaan ini sehubungan dengan teori program mereka.
Apa ukuran konstruk apa yang paling mencerminkan hasil sebenarnya dari program? (Ukuran
harga diri yang berguna untuk orang dewasa mungkin tidak berfungsi dengan baik untuk
remaja atau untuk hasil yang berhubungan dengan narkoba.)
Kuisioner laporan diri bukan satu-satunya cara untuk mengumpulkan data hasil.
Untuk beberapa tujuan, penting untuk memperoleh informasi dari sumber lain tentang
peserta, seperti peringkat anak oleh orang tua atau peringkat siswa oleh guru. Orang yang
mengisi kuesioner yang tidak melaporkan diri mereka sendiri disebut informan kunci.
Wawancara mendalam dengan informan kunci atau peserta adalah sumber data kualitatif
yang sangat baik. Peringkat pengamatan perilaku mungkin berguna, meskipun mereka
seringkali sulit untuk dikumpulkan dan dianalisis.
Langkah 4: Evaluasi Dampak
Evaluasi dampak berkaitan dengan efek akhir yang diinginkan oleh suatu program. Dalam
alkohol dan program pencegahan narkoba lainnya, efek akhir mungkin termasuk
pengurangan dalam penggunaan narkoba secara keseluruhan (prevalensi), penurunan tingkat
siswa baru yang mulai menggunakan narkoba (kejadian), penurunan penangkapan
mengemudi dalam keadaan mabuk, dan penurunan tindakan disiplin sekolah untuk narkoba
atau pelanggaran alkohol (lihat Tabel 13.2, Langkah 4).
Hasil (Langkah 3) adalah hasil langsung atau jangka pendek dari suatu program,
sedangkan dampak (Langkah 4) adalah efek jangka panjang dari program.
Data arsip, berdasarkan catatan yang sering dikumpulkan untuk tujuan lain,
membantu menilai dampak. Contohnya termasuk catatan medis, catatan pengadilan remaja
atau polisi, atau nilai sekolah dan catatan kehadiran.
Langkah 2: Evaluasi Proses. Program ini akan dilaksanakan dengan beberapa cara.
Kampanye media dan pertemuan publik akan dilakukan untuk meningkatkan kesadaran
publik tentang masalah terkait narkoba. Kelas-kelas sekolah (kelas 7–9), termasuk latihan dan
sandiwara dramatis, dan majelis sekolah akan diadakan tentang masalah terkait narkoba,
termasuk keterampilan untuk menolak penggunaan narkoba. Kursus pelatihan orang tua akan
fokus pada keterampilan komunikasi dengan remaja. Intervensi perilaku untuk kesediaan
toko pengujian untuk menjual produk tembakau kepada anak di bawah umur dan memperkuat
penolakan mereka untuk menjual akan dilaksanakan. Untuk melakukan evaluasi proses,
berikut ini akan dicatat: jumlah pertemuan, kelas, majelis, dan lokakarya pelatihan yang
direncanakan dan benar-benar diadakan, waktu staf dihabiskan untuk masing-masing, dan
kehadiran di setiap sesi. Waktu dan orang yang terlibat dalam pelatihan penguji siswa dan
implementasi intervensi perilaku untuk toko pengujian juga akan dicatat (lihat Tabel 13.3,
Bagian A dari Langkah 2). Setelah setiap komponen program diimplementasikan, evaluasi
proses akan mencakup diskusi tentang apa yang dipelajari oleh staf program dan perencana
dari pengalaman (lihat Tabel 13.3, Bagian B dari Langkah 2).
Langkah 3: Evaluasi Hasil. Sebelum dan sesudah pertemuan publik dan survei
anggota masyarakat yang dilakukan sebelum dan sesudah kampanye media, kuesioner akan
menilai perubahan dalam pengetahuan warga tentang masalah penyalahgunaan narkoba dan
jumlah sukarelawan untuk kegiatan koalisi. Kuisioner yang mengukur keterampilan
pengasuhan anak untuk berkomunikasi dengan remaja akan diberikan sebelum dan sesudah
kursus pelatihan orang tua untuk mengukur perubahan di area ini di antara peserta kursus. Di
sekolah-sekolah, kuesioner yang diisi oleh siswa dan guru akan mengukur keuntungan siswa
dalam keterampilan untuk menentang penggunaan narkoba (diukur sebelum dan setelah
intervensi kelas). Kuesioner siswa juga dapat digunakan untuk mengukur perubahan sikap
dan perilaku terkait penggunaan narkoba. Akhirnya, tes perilaku keinginan atau penolakan
petugas toko untuk menjual tembakau ke anak di bawah umur akan dilakukan dan dicatat
(lihat Tabel 13.3, Langkah 3).
Langkah 4: Evaluasi Dampak. Sebagai contoh, efek jangka panjang dari program
ini dapat diukur dengan perubahan dalam tindakan disiplin sekolah terkait narkoba,
penangkapan polisi dan catatan kecelakaan untuk remaja, dan catatan rumah sakit tentang
perawatan terkait narkoba (lihat Tabel 13.3, Langkah 4).
Meskipun metode evaluasi program empat langkah dalam Prevention Plus III pada
awalnya dikembangkan untuk evaluasi dalam alkohol, tembakau, dan domain
penyalahgunaan narkoba lainnya, metode ini dapat disesuaikan dengan area program apa pun,
seperti program pencegahan kesehatan mental berbasis masyarakat (McElhaney, 1995 ).
Pada bagian ini, kami lebih lanjut menggambarkan konsep penilaian programe dengan
menerapkannya pada program mentoring. Bahan untuk bagian ini terutama ditulis oleh
Bernadette Sanchez dari DePaul University.
Istilah mentoring berasal dari mitologi Yunani, di mana Mentor adalah teman
Odysseus yang tepercaya dan menjabat sebagai wali dan pengajar putra Odysseus ketika
Odysseus pergi (Haskell, 1997). Hubungan mentoring umumnya melibatkan orang yang lebih
tua, lebih berpengalaman (mentor) dan orang yang lebih muda, kurang berpengalaman
(mentee). Mentor membantu mengembangkan karakter dan kompetensi mentee atau
membantu mentee dalam mencapai tujuan sambil juga menunjukkan kepercayaan,
kepercayaan, empati, dan persahabatan, memodelkan perilaku positif, dan melayani sebagai
penganjur mentee (DuBois & Karcher, 2005; Rhodes , 2002; Rhodes & DuBois, 2008;
Rhodes, Spencer, Keller, Liang, & Noam, 2006; Spencer, 2006).
Banyak dari evaluasi ini fokus pada apakah pendampingan berhasil. Dengan kata lain,
apakah pendampingan membuat perbedaan dalam kehidupan anak muda? Meskipun evaluasi
ini menunjukkan bahwa pendampingan mendorong perkembangan pemuda yang positif,
penting untuk mempertimbangkan proses yang terjadi dalam program pendampingan ini
untuk memahami apa yang berkontribusi pada hasil ini.
Kekuatan perempuan! adalah program pendampingan yang inovatif untuk gadis-gadis remaja
etnis minoritas, rendah, dan rendah, yang dipasangkan dengan sukarelawan dewasa wanita.
Program ini adalah bagian dari Big Brothers Big Sisters of Metropolitan Chicago
(BBBSMC), dan melengkapi model hubungan pendampingan satu-satu yang khas dalam
BBBS. Di GirlPOWER !, anak perempuan dan mentor wanita mereka bertemu secara teratur
(setidaknya setiap bulan) dalam sebuah grup dengan beberapa pasangan mentoring wanita
lainnya selama satu tahun. Pasangan Mentormentee juga diharapkan untuk bertemu secara
teratur di luar GirlPOWER! program. (GirlPOWER! Dijelaskan lebih rinci dalam DuBois et
al. (2008); para peneliti terlibat dengan pengembangan dan evaluasi GirlPOWER!)
Sejumlah langkah telah diambil dalam pengembangan program. Pertama, para peneliti
mewawancarai berbagai pemangku kepentingan, termasuk orang tua, pemuda, mentor dan
anggota staf, untuk menentukan tujuan dan topik yang harus dibahas dalam program
pendampingan serta bagaimana program harus dilaksanakan. Kedua, para peneliti meninjau
literatur teoritis, empiris, dan intervensi yang relevan. Ketiga, program percontohan
dilaksanakan berdasarkan dua langkah sebelumnya dan kemudian program direvisi
berdasarkan umpan balik dari para peserta.
Untuk menilai sejauh mana program berhasil mencapai tujuan dan hasil yang
diinginkan, komponen evaluasi proses dan hasil dilakukan. Beberapa pemangku kepentingan
yang berbeda dalam program disurvei dalam upaya untuk mendapatkan umpan balik mereka
tentang kepuasan dengan program saat ini dan saran untuk perbaikan. Stakeholder ini
termasuk mentor, mentee, orang tua, dan staf yang menjalankan program. Selain itu, lembar
kerja diselesaikan untuk mendokumentasikan komponen program penting (mis., Perekrutan
mentor, pelatihan, pengawasan).
Beberapa hasil hasil dari program pendampingan GirlPOWER mengecewakan. Ini dapat
memberikan petunjuk untuk pengembangan program dan peningkatan program. Karena
GirlPOWER! menyasar beragam hasil pemuda, mungkin upaya yang lebih terkonsentrasi di
bidang yang tidak mencapai hasil perlu dilakukan dalam program. Misalnya, jika peningkatan
nilai adalah tujuan, maka layanan bimbingan mungkin diperlukan untuk mengubah nilai.
Contoh lain adalah bahwa identitas etnis hanya tercakup dalam satu komponen lokakarya.
Mungkin menghabiskan lebih banyak waktu untuk topik ini akan membuat perbedaan dalam
identitas etnis anak perempuan. Selanjutnya, setiap lokakarya bulanan difokuskan pada topik
tertentu (mis., Budaya, harga diri). Mungkin efeknya tidak diamati pada beberapa hasil
karena lokakarya telah berlangsung berbulan-bulan sebelum evaluasi hasil itu dilakukan.
Mungkin saja waktu lokakarya terkait dengan evaluasi memengaruhi temuan. (Ini mungkin
contoh kegagalan evaluasi.)
Gambaran besar pada evaluasi program adalah bahwa hasil yang diukur dengan tema
dari banyak program pengobatan, pencegahan, dan pendidikan seringkali mengecewakan
(mis., Hasil dari DARE). Seringnya hasil yang mengecewakan telah memacu gerakan kuat
untuk akuntabilitas dan untuk peningkatan program dalam program masyarakat dan sosial.
Secara tradisional, evaluasi program berkaitan dengan apakah suatu program yang sudah
dikembangkan berfungsi dan mengapa. Namun, pendekatan evaluasi program tradisional
tidak mempelajari bagaimana mengembangkan program yang efektif.
Evaluasi program dapat dan harus menyediakan informasi penting tentang proses dan
hasil. Informasi ini penting tetapi jauh lebih bermakna jika anggota staf dan peserta program
masyarakat memahami bagaimana dan mengapa hasil program itu atau tidak dihasilkan. Jika
hasilnya positif, para pemangku kepentingan dapat menunjukkan dengan tepat beberapa
proses yang mengarah pada keberhasilan program. Sebaliknya, jika hasilnya kurang dari yang
diharapkan, mereka dapat mengidentifikasi apa yang perlu ditingkatkan.
EVALUASI PEMBERDAYAAN
Pada bagian ini, kami akan menjelaskan evaluasi pemberdayaan dalam hal 1) definisi, 2)
prinsip (nilai), dan 3) a "bagaimana caranya" —Mendapat Hasil. Model empat langkah (hlm.
435-438) menjelaskan beberapa logika dasar evaluasi dan mencoba untuk menjelaskan apa
evaluasi itu. Di bagian ini, kami akan menunjukkan bagaimana memperluas logika ini dapat
bermanfaat bagi para praktisi (mis., Guru, staf program afterschool) untuk merencanakan dan
mengimplementasikan program yang efektif serta mengevaluasi program. Pendekatan
inovatif untuk evaluasi program, yang disebut evaluasi pemberdayaan (EE), tumbuh dari
diskusi peran "baru" dan berkembang untuk evaluator, yang dirancang untuk mendorong
penentuan nasib sendiri praktisi program (misalnya, Fetterman, 2001; Fetterman &
Wandersman, 2005; Linney & Wandersman, 1991). EE memecah hambatan yang melekat
dalam metode dan nilai-nilai evaluasi tradisional, mempromosikan perspektif pemberdayaan
dan partisipasi warga negara (Fetterman, 1996).
EE Principles
EE berbagi beberapa nilai dan metode dengan pendekatan lain untuk evaluasi,
termasuk evaluasi tradisional dan kerabat dekat EE: evaluasi kolaboratif, evaluasi partisipatif,
dan evaluasi yang berfokus pada pemanfaatan. Namun, serangkaian prinsip EE (lihat Tabel
13.4) dipertimbangkan secara keseluruhan yang membedakan EE dari pendekatan evaluasi
lainnya. Penomoran prinsip tidak mencerminkan jenis hierarki atau prioritas satu prinsip di
atas prinsip lainnya. Sebaliknya, prinsip-prinsip tersebut harus dianggap sebagai seperangkat
keyakinan inti yang, secara keseluruhan, mengkomunikasikan nilai-nilai EE yang
mendasarinya dan memandu pekerjaan para evaluator pemberdayaan; prinsip-prinsip ini
sesuai dengan dan tumpang tindih dengan beberapa nilai psikologi masyarakat (Bab 1) dan
penelitian partisipatif (Bab 3). Deskripsi prinsip adalah deskripsi singkat yang dikutip dari
Wandersman et al. (2005, hlm. 29–38).
Prinsip 1: Peningkatan Para evaluator pemberdayaan ingin agar program berhasil. Untuk
mencapai tujuan itu, EE menghargai peningkatan dalam orang, program, organisasi, dan
komunitas.
Prinsip 3: Penilai pemberdayaan inklusi percaya evaluasi program atau organisasi mendapat
manfaat dari melibatkan pemangku kepentingan dan staf dari berbagai tingkatan yang terlibat
dalam perencanaan dan pengambilan keputusan. Menjadi inklusif berbeda dari bagaimana
orang membuat keputusan mereka sebagai kelompok, seperti bentuk partisipasi yang
demokratis (lihat Prinsip 4).
Prinsip 7: Strategi Berbasis Bukti EE menilai peran sains dan strategi berbasis bukti dan
meyakini bahwa peninjauan intervensi berbasis bukti atau praktik terbaik yang relevan
penting untuk dipertimbangkan sejak awal dalam proses merancang dan / atau memilih
program untuk ditangani kebutuhan masyarakat. Seperti halnya EE menghormati pekerjaan
komunitas dan basis pengetahuannya, EE juga menghormati basis pengetahuan para sarjana
dan praktisi yang telah memberikan informasi empiris tentang apa yang berhasil di area
tertentu (mis., Pencegahan, perawatan).
Foundation For the Future (FFF). Evaluasi pemberdayaan FFF dijelaskan dalam Keener,
Snell-Johns, Livet, dan Wandersman (2005). Menyadari bahwa pemuda yang mereka layani
dihadapkan pada berbagai faktor risiko (mis., Kemiskinan, kurangnya dukungan keluarga),
Klub Boys & Girls di Metro Spartanburg, South Carolina, menciptakan kemitraan komunitas:
Foundation For the Future (FFF). FFF akan memberikan layanan tambahan kepada keluarga
anggota Klub Boys & Girls sambil secara bersamaan meningkatkan kapasitas agensi lain
yang ada untuk mencapai populasi yang biasanya tidak dilayani oleh program mereka.
Kemitraan FFF didirikan atas dasar keyakinan bahwa organisasi dan program yang ada di
masyarakat dapat mencapai lebih banyak kerja sama daripada yang masing-masing dapat
beroperasi secara mandiri. Program-program itu meliputi lima program seni, program Prestasi
Junior, program Orangtua sebagai Guru untuk orang tua dari anak-anak, dan program
Universitas Induk untuk orang tua anggota Klub Boys & Girls. Komponen utama FFF adalah
program afterschool yang ditingkatkan. Meskipun masing-masing lembaga memiliki
serangkaian hasil unik yang diinginkan, kemitraan ini disatukan di sekitar tujuan keseluruhan
untuk meningkatkan rasa memiliki, kegunaan, pengaruh, dan kompetensi keluarga.
Inisiatif FFF memanfaatkan program berbasis bukti yang sudah ada di wilayah
Spartanburg. Kontrak evaluasi menyatakan bahwa tujuan pertama dari tim evaluasi adalah
untuk membantu membangun dan memelihara sistem evaluasi diri yang efektif. Untuk
memenuhi tugas ini, tim evaluasi bekerja sama dengan organisasi anggota FFF untuk
mengembangkan rencana dan produk evaluasi individual. Namun, tanggung jawab utama
untuk evaluasi adalah milik FFF (bukan evaluator). Ini konsisten dengan prinsip-prinsip EE
tentang kepemilikan masyarakat, inklusi, partisipasi demokratis, dan pembangunan kapasitas.
Sebagian dari temuan evaluasi memberi kesan pendekatan FFF. Salah satu tujuan FFF
adalah untuk meningkatkan nilai siswa pada tes standar di sekolah, yang akan dicapai oleh
program afterschool di Boys & Girls Clubs. Program-program itu termasuk jam penyelesaian
pekerjaan rumah harian dan program untuk pengembangan pendidikan dan karier. Klub
Lokal Anak Laki-Laki & Perempuan berkomitmen untuk memiliki lebih dari sepertiga
program mingguan mereka di bidang-bidang ini, dan staf menyiapkan laporan pelacakan
mingguan tentang program-program. Evaluasi hasil membandingkan 334 peserta program
dalam beberapa program FFF, dengan sekelompok 836 siswa yang sama dari sekolah yang
sama, pada tes standar tahunan di sekolah. Dalam bahasa Inggris, matematika, studi sosial,
dan sains, peserta FFF mengungguli kelompok pembanding. Efek program terbesar adalah
memindahkan siswa dari kategori skor terendah ke kategori kemampuan dasar, meskipun
efek positif terlihat pada beberapa tingkatan.
Kami meminta Greg Tolbert, direktur eksekutif Boys & Girls Club yang memimpin
proyek FFF, untuk memberikan pembaruan (2010), yang disediakan dalam Kotak 13.1.
Pembaruannya memberikan deskripsi yang berguna tentang penggunaan data evaluasi untuk
akuntabilitas dan peningkatan dan deskripsi masalah seputar mempertahankan program
setelah hibah awal berakhir.
Mengevaluasi Pemberdayaan Evaluasi. Campbell et al. (2004) melakukan evaluasi
pendekatan EE, mempelajari semua program pencegahan perkosaan dan layanan korban yang
didanai negara bagian di Michigan. Negara ingin membangun kapasitas evaluasi masing-
masing lembaga sehingga anggota staf dapat mengevaluasi program mereka sendiri. Para
penulis terlibat dalam menggunakan pendekatan evaluasi pemberdayaan dengan semua
organisasi yang meliputi pelatihan, bantuan teknis, dan manual. Mereka kemudian
mempelajari apa yang terjadi dan menemukan bahwa 90% dari program pencegahan dan 75%
dari program layanan korban berhasil mengembangkan dan meluncurkan evaluasi program
dan 90% melanjutkan proses evaluasi satu tahun setelah pendanaan program formal berakhir.
Campbell et al. juga mengukur peningkatan kapasitas evaluasi dan menemukan peningkatan
yang signifikan dari waktu ke waktu. Studi ini memberikan dukungan empiris untuk sejumlah
konsep kunci dalam evaluasi pemberdayaan.
Kontroversi dan Dialog Tentang Evaluasi Pemberdayaan. Sejak EE dimulai, debat dan
dialog yang hidup telah terjadi tentang isu-isu yang melibatkan EE, termasuk (a) ambiguitas
konseptual, spesifisitas metodologis, dan hasil; (B) memberdayakan orang lain; (c) bias; (d)
agenda sosial; dan (e) perbedaan antara evaluasi kolaboratif, partisipatif, dan pemberdayaan
(Alkin & Christie, 2004; Brown, 1997; Sepupu, 2005; Miller & Campbell, 2006; Scriven,
1997, 2005; Sechrest, 1997; Stufflebeam, 1994; Patton, 1997a, 2005). Fetterman dan
Wandersman (2007) menanggapi masalah ini. Sebagai contoh, sejumlah kritik prihatin bahwa
evaluator pemberdayaan mungkin bias dan mempromosikan evaluasi hasil yang bias.
Fetterman dan Wandersman menjawab kekhawatiran ini dengan mencatat bahwa tujuan
evaluasi pemberdayaan adalah untuk membantu program mencapai hasil dan bahwa hasilnya
sama dengan yang diukur dalam evaluasi tradisional. Oleh karena itu, jika hasilnya adalah
tindakan objektif (mis., Tes standar, jumlah kasus AIDS dalam suatu populasi), mereka
dinilai dengan cara yang sama dalam evaluasi pemberdayaan atau dalam evaluasi tradisional.
Diskusi telah menerangi dan mungkin menarik bagi pembaca yang ingin menggali lebih
dalam isu-isu penting di bidang evaluasi (dan juga untuk melihat bagaimana kontroversi di
antara para akademisi dimainkan).
MENDAPATKAN HASIL
Evaluasi pemberdayaan terdengar bagus dan menarik bagi banyak penyandang dana dan
praktisi. Bagaimana Anda bisa melakukan EE? Bagaimana Anda bisa mencapai
akuntabilitas? Menggunakan filosofi evaluasi pemberdayaan, Wandersman, Imm, Chinman,
dan Kaftarian (1999, 2000) mengembangkan pendekatan 10 langkah untuk akuntabilitas
berbasis hasil yang disebut Getting To Outcomes® (GTO®). (Getting To Outcomes dan
GTO adalah merek dagang terdaftar oleh University of South Carolina dan RAND.) Dengan
mengajukan dan menjawab 10 pertanyaan kunci, intervensi dapat diarahkan pada
akuntabilitas berbasis hasil dan peningkatan program.
Tabel 13.5 menyajikan 10 pertanyaan dan strategi GTO untuk menjawabnya. Dalam tabel, ini
disajikan dalam urutan kronologis untuk proyek yang baru memulai tahap perencanaannya.
Namun, pertanyaan GTO dapat digunakan pada tahap apa pun dalam siklus hidup suatu
program (mis., Jika Anda telah memilih suatu program, Anda dapat memilih gagasan yang
akan membantu Anda mengimplementasikannya dengan berkualitas). Pertanyaan-pertanyaan
berfungsi sebagai alat pengajaran yang berguna untuk menunjukkan kepada praktisi program
dan penyandang dana relevansi dan pentingnya evaluasi dan akuntabilitas program
(Wandersman, Imm, Chinman, & Kaftarian, 2000).
Dalam Tabel 13.5, pertanyaan 2, 6, 7, dan 8 berisi empat langkah Prevention Plus III
(dibahas sebelumnya dalam bab ini). Apa yang dilakukan oleh Wandersman et al. disadari
bahwa pendekatan Prevention Plus III dapat membantu pengembang program melakukan
program mereka dengan lebih baik, tetapi itu tidak membantu mereka bertanya apakah
mereka melakukan program yang benar. Dengan demikian, hanya menggunakan Prevention
Plus III akan seperti menyetel mesin mobil Anda dan mengisi ban Anda sehingga mobil Anda
berjalan lebih baik dan Anda bisa melaju pada kecepatan 70 mph alih-alih melambat pada
kecepatan 30: tetapi Anda mungkin lebih cepat menyusuri jalan yang salah. Pertanyaan 1
hingga 5 dalam pertanyaan GTO membantu rencana staf program, anggota memilih program
yang tepat, sementara pertanyaan 6 hingga 10 membantu staf program mengimplementasikan
dan meningkatkan program dan terus menjalankannya.
Untuk menentukan jenis program mana yang dibutuhkan dalam komunitas tertentu,
sekolah, atau lembaga lain, strategi perencanaan yang disebut penilaian kebutuhan sering
digunakan (Soriano, 1995; Altschuld, 2010). Penilaian ini dirancang untuk mengumpulkan
informasi tentang masalah yang paling membutuhkan perbaikan atau intervensi dalam
komunitas atau organisasi (mis., Kekerasan remaja, penyalahgunaan alkohol dan narkoba).
Penilaian kebutuhan yang baik juga mencakup penilaian sumber daya dan identifikasi
kekuatan individu, organisasi, dan masyarakat yang dapat digunakan untuk memenuhi
kebutuhan masyarakat. Aset dapat mencakup talenta individu, sistem mikro yang dapat
menawarkan sistem dukungan sosial bagi orang-orang yang terlibat dalam program, atau
organisasi yang dapat menyediakan dana, ruang pertemuan, atau tempat untuk diskusi publik
mengenai tujuan program. Penilaian sumber daya juga memberikan tandingan terhadap
penilaian kebutuhan. Identifikasi masalah masyarakat yang terlibat dalam penilaian
kebutuhan diseimbangkan dengan penilaian kekuatan masyarakat (Kretzmann & McKnight,
1993).
Pertanyaan 2: Apa tujuan, populasi sasaran, dan hasil (tujuan) yang diinginkan untuk
organisasi / sekolah / komunitas / negara bagian Anda? Setelah kebutuhan dan sumber
daya untuk suatu program telah ditentukan, penting untuk menentukan tujuan program,
kelompok sasaran spesifik program, dan hasil yang diinginkan. (Ini adalah Langkah 1 dari
metode evaluasi empat langkah Pencegahan Plus III yang dibahas sebelumnya dalam bab
ini.)
Pertanyaan 3: Intervensi berbasis bukti mana yang dapat digunakan untuk mencapai
tujuan Anda? Setelah personil program memutuskan bahwa ada kebutuhan untuk mengatasi
program tertentu dan telah mengembangkan tujuan dan hasil yang diinginkan, bagaimana
mereka mencapainya? Strategi perlu dilakukan untuk mencapai tujuan dan hasil yang
diinginkan. Keputusan harus dibuat mengenai program atau intervensi mana yang akan
digunakan. Sebagai contoh, administrator program sekolah dan komunitas dihujani dengan
produk email yang mengiklankan produk kurikulum multimedia untuk program-program
seperti pencegahan kekerasan, pendidikan seks, dan pencegahan penyalahgunaan zat.
Bagaimana mereka memutuskan program mana yang akan dipilih? Keputusan ini seringkali
didasarkan pada kenyamanan atau ketersediaan. Apakah seseorang mengandalkan program
yang digunakan tahun lalu, terlepas dari kesuksesan, atau menggunakan program yang dapat
dipinjam secara gratis dari sumber lain atau mungkin menggunakan program yang diiklankan
di konvensi terakhir? Penting untuk diingat bahwa meskipun kenyamanan dan ketersediaan
penting, mereka tidak memastikan efektivitas program.
Tujuan ilmu pencegahan adalah untuk menyediakan dua jenis informasi. Salah
satunya adalah temuan empiris (biasanya kuantitatif) tentang efektivitas program dalam
mencapai tujuan yang diidentifikasi. Lain adalah informasi (biasanya kualitatif) tentang
praktik terbaik, elemen dan metode program yang paling cocok untuk jenis masalah tertentu
dalam jenis populasi tertentu (ingat ide ini dari Bab 9 dan 10). Jenis pengetahuan ini berguna
dalam menjawab pertanyaan program mana yang akan dipilih. Agar efektif, program perlu
didasarkan pada teori masalah target dan dikaitkan dengan penelitian saat ini dan yang
relevan (Buford & Davis, 1995; Goodman & Wandersman, 1994; Green & Lewis, 1986;
Leviton, 1994; Nation et al ., 2003; Weiss, 1995). Sains dan praktik terbaik pengetahuan
membantu tidak hanya dalam pemilihan program tetapi juga dalam perencanaan dan
implementasi program. Beberapa agen federal, seperti Pusat Pencegahan Penyalahgunaan Zat
dan Departemen Pendidikan A.S., memiliki situs web dengan informasi tentang program
berbasis bukti (lihat akhir Bab 9 dan 10).
Ketika merancang program baru, penting untuk memastikan bahwa itu cocok dengan
kebutuhan masyarakat serta layanan yang tersedia yang sudah ada (Elias, 1995). Ketika
sebuah program baru akan dilaksanakan di sekolah atau lingkungan masyarakat lain,
pertimbangan utama harus memastikan bahwa intervensi baru akan meningkatkan upaya
yang ada. Untuk mengurangi duplikasi, praktisi harus terbiasa dengan program yang sudah
ada di sekolah atau komunitas mereka. Untuk mencegah tumpang tindih program atau
implementasi program yang tidak sesuai dengan tujuan lembaga atau masyarakat secara
keseluruhan, proses yang disebut pemetaan program dapat digunakan.
Pemetaan program adalah penilaian seberapa baik tujuan dan metode program yang
diusulkan akan sesuai dengan tujuan yang lebih luas atau filosofi motivasi dari organisasi
sponsor. Program dapat masuk ke dalam organisasi dalam tiga cara dasar: Mereka dapat
memiliki efek tambahan (satu program menambah yang lain), efek sinergis (satu program
melipatgandakan efek yang lain), atau efek interferensi (satu program mengurangi yang
lain) .
Pertanyaan 5: Kapasitas apa yang Anda butuhkan untuk menempatkan intervensi ini
dengan kualitas? Kapasitas organisasi terdiri dari sumber daya yang dimiliki organisasi
untuk mengarahkan dan mempertahankan program pencegahan (Flaspohler et al., 2008).
Beberapa program model mungkin terlalu sulit atau padat sumber daya untuk diberikan oleh
suatu organisasi. Dalam GTO, kapasitas organisasi untuk menilai mencakup memiliki (a)
jumlah staf yang memadai, dengan kredensial dan pengalaman yang sesuai untuk
mengimplementasikan program; (B) peran staf yang jelas dan komitmen staf yang kuat untuk
program; (c) kepemimpinan program yang kuat oleh para pemimpin yang memahami
program; (D) dana yang memadai dan sumber daya teknis untuk program atau rencana untuk
mendapatkannya.
Pertanyaan 6: Bagaimana intervensi ini akan dilakukan? Apa langkah-langkah yang akan
diambil oleh personil program untuk melaksanakannya? Selama tahap perencanaan ini,
pengembang program harus mengidentifikasi bagaimana mereka akan mengimplementasikan
program. Menjabarkan bagaimana suatu program akan dilaksanakan termasuk menentukan
langkah-langkah spesifik untuk melaksanakan program, mengidentifikasi dan melatih
personil untuk melaksanakan masing-masing langkah ini, dan mengembangkan garis waktu
atau jadwal untuk rencana ini. Staf program harus menentukan apa yang akan terjadi selama
kegiatan program yang dijadwalkan dan di mana kegiatan ini akan berlangsung. Semua
komponen ini harus didefinisikan dengan jelas untuk merencanakan dan
mengimplementasikan suatu program secara efektif.
Pertanyaan 8: Seberapa baik intervensi bekerja? Apakah program memiliki efek yang
diinginkan dan hasil yang diusulkan? Apakah ada konsekuensi yang tidak terduga?
(Mengevaluasi hasil dan dampak terdiri dari Langkah 3 dan 4 dari metode Pencegahan Plus
III yang dibahas sebelumnya).
Pelajaran tentang apa yang berjalan baik dengan program dan bidang apa yang dapat
menggunakan peningkatan berasal dari sumber-sumber informal seperti pengamatan pribadi
dan laporan lisan dari peserta dan anggota staf atau sumber-sumber formal seperti langkah-
langkah kepuasan peserta dan evaluasi proses dan hasil program. Namun dikumpulkan,
informasi untuk perbaikan program diperoleh dari jawaban pertanyaan 1 hingga 8.
Anggota staf program yang terbuka untuk belajar dari hasil evaluasi dapat terus
meningkatkan program mereka. Alih-alih melihat evaluasi sebagai murni dokumentasi /
laporan kepada penyandang dana, itu harus dilihat sebagai mekanisme umpan balik yang
dapat memandu perencanaan dan implementasi di masa depan.
Pertanyaan 10: Jika intervensi (atau komponen) berhasil, bagaimana intervensi akan
dipertahankan? Setelah penyedia layanan melewati waktu, energi, dan uang untuk
mengembangkan program yang sukses, apa yang akan mereka lakukan untuk melihatnya
berlanjut? Sayangnya, ini adalah pertanyaan yang sering diabaikan dalam pemrograman
pencegahan. Bahkan ketika program memiliki hasil yang sukses, mereka sering tidak
dilanjutkan karena kurangnya dana, pergantian staf, atau kehilangan momentum. Tinjauan
Lerner (1995) tentang program pencegahan untuk pengembangan pemuda menyimpulkan
bahwa ada banyak program yang efektif untuk mencegah risiko dan perilaku bermasalah,
tetapi sayangnya, program ini jarang bertahan dari waktu ke waktu.
Secara optimal, GTO adalah proses yang tidak pernah berakhir. Bahkan untuk
program yang dilaksanakan secara efektif dan terlembagakan secara menyeluruh, anggota
stafnya memulai dari awal lagi dengan pertanyaan 1. Gambar 13.2 mengilustrasikan bahwa
GTO adalah 1) berkelanjutan, 2) berorientasi pada hasil, dan 3) dapat diterima untuk
digunakan pada setiap tahap siklus kehidupan sebuah program (itu seperti komidi putar —
Anda melanjutkan pada tahap apa pun Anda berada).
Contoh Tindakan GTO: Mencegah Minum Di Bawah Umur
Bagian ini dikutip dari “Mencegah Minum Di Bawah Umur Menggunakan Getting To
Outcomes ™ dengan Kerangka Kerja Pencegahan Strategis SAMHSA untuk Mencapai
Hasil” oleh Pamela Imm, Matthew Chinman, Abraham Pengembara, David Rosenbloom,
Sarah Guckenburg, dan Roberta Leis (RAND, 2007). Izin diberikan oleh RAND untuk
digunakan.
Mengapa minum di bawah umur menjadi masalah? Haruskah kita benar-benar sangat
khawatir tentang "ritus perjalanan" ini? Singkatnya, ya. Alkohol adalah kontributor utama
penyebab utama kematian remaja (NIAAA, 2003). Antara 12 persen dan 20 persen dari
semua alkohol yang dikonsumsi di Amerika Serikat diminum oleh orang yang secara hukum
terlalu muda untuk minum sama sekali dan ada konsekuensi nyata, yang dapat dicegah,
negatif (Foster et al., 2003). Bagi banyak orang, periode minum terberat dalam kehidupan
mereka adalah sebelum mereka mencapai usia 21. Beberapa remaja akan muncul di usia dua
puluhan, mengurangi minum, dan baik-baik saja. Bagi yang lain, minum akan menyebabkan
cedera atau kematian, kekerasan seksual, kekerasan, dan peluang hidup yang berkurang.
Penelitian menunjukkan bahwa lebih dari 95 persen orang dewasa di Amerika Serikat yang
tergantung alkohol mulai minum sebelum mereka berusia 21 tahun (SAMHSA, 2004).
KESIMPULAN
Pengetahuan yang lebih luas (mis., Meningkatkan pemahaman tentang faktor-faktor yang
mendasari masalah publik).
Evaluasi tradisional terutama berorientasi pada tujuan kedua. Metode yang dijelaskan
dalam bab ini memperluas fokus untuk memasukkan tujuan pertama dan kedua dan dapat
menginformasikan penelitian tentang yang ketiga (Wandersman et al., 2004). Namun, ini
tidak menghalangi pendekatan evaluasi yang lebih tradisional (Fetterman, 2001). Nilai dari
setiap pendekatan evaluasi tergantung pada tujuan evaluasi (Chelimsky, 1997; Patton, 1997).
Tabel 13.4 menyajikan ringkasan mengapa, apa, kapan, di mana, bagaimana, dan siapa dari
evaluasi pemberdayaan (Wandersman & Snell-Johns, 2005).
Seperti yang telah kita lihat dalam bab ini, konsep evaluasi program dapat
dimasukkan ke dalam perencanaan program dan implementasi program. Ketika ini dilakukan,
batas-batas antara pengembangan program dan evaluasi program dikaburkan demi
meningkatkan program dan meningkatkan kemungkinan hasil yang sukses. GTO adalah
contoh dari pendekatan ini. Meskipun penekanan GTO sejauh ini adalah pada akuntabilitas
praktisi yang menerima uang untuk pencegahan (atau perawatan atau pendidikan),
Wandersman (2003) mencatat bahwa pertanyaan akuntabilitas juga berlaku untuk
penyandang dana dan peneliti atau evaluator. Misalnya, ketika penyandang dana
mempertimbangkan untuk mengembangkan inisiatif baru, pertanyaan tentang bagaimana
mereka tahu mereka membutuhkan inisiatif baru, bagaimana ia akan menggunakan ilmu
pengetahuan dan praktik terbaik, bagaimana hal itu sesuai dengan inisiatif lain, dan
seterusnya, harus ditanyakan dan dijawab. Untuk evaluator, pertanyaan yang sama akan
menyangkut apakah proses evaluasi baru atau intensif diperlukan atau dibenarkan, seberapa
cocok dengan prosedur evaluasi yang ada, dan bagaimana praktik terbaik untuk evaluasi
program akan digunakan dalam perencanaan evaluasi ini.
Ketika masyarakat, penyandang dana, dan warga negara menjadi lebih peduli tentang
akuntabilitas dan hasil untuk sekolah, perawatan kesehatan, layanan manusia, dan bidang
terkait, evaluasi dapat menyebabkan ketakutan dan perlawanan atau keterbukaan, kejujuran,
pemberdayaan, dan peningkatan. Evaluasi dan akuntabilitas tidak perlu ditakuti — jika kita
bekerja bersama untuk hasil.
446
trip.com = SANDYpr1ma