Strategi Evaluasi IDPS
Strategi Evaluasi IDPS
Strategi Evaluasi
Pilihan dan Pendekatan
Sanksi Pelanggaran Pasal 72
Undang-Undang Nomor 19 Tahun 2002
Tentang HAK CIPTA
ii
Strategi Evaluasi
Pilihan dan Pendekatan
Randy R. Wrihatnolo
iii
Strategi Evaluasi: Pilihan dan Pendekatan
Oleh: Randy R. Wrihatnolo
(c) 2011 Randy R. Wrihatnolo
Hak Cipta dilindungi oleh Undang-Undang
Diterbitkan pertama kali oleh:
Institute for Development and Policy Study
April 2011
iv
Daftar Isi
Daftar Isi v
Kata Pengantar xi
Bab 1 Pendahuluan 1
v
3.3.1. Program Pemrosesan 23
3.3.2. Program Pembelajaran 24
3.3.3. Program Kepramukaan 24
3.3.4. Program Pelayanan 24
3.3.5. Program Umum 25
3.4. Keunggulan dan Kelemahan Model
Evaluasi CSE-UCLA 25
3.5. Kesimpulan 25
vi
Program Model Tyler
6.3. Kesimpulan 60
viii
12.2.1. Reaction (Aksi Kembali) 137
12.2.2. Learning (Pembelajaran) 138
12.2.3. Behaviour (Perilaku) 139
12.2.4. Result (Hasil) 141
12.3. Evaluasi Model Kirkpatrick Plus 142
12.4. Contoh Penerapan Evaluasi Kirkpatrick 143
12.4.1. Merancang Pelatihan 143
12.4.2. Training Need Analysis 143
12.5. Alternatif Solusi 146
12.6. Metode Pelatihan 149
12.6.1. Pelatihan di Ruang Kelas 149
12.6.2. Belajar Mandiri 150
12.7. Evaluasi Pelatihan 152
12.8. Penerapan Hasil Pelatihan 155
12.9. Kesimpulan 156
ix
x
Prolog
xi
bagaimana evaluasi-evaluasi itu dapat dilakukan dalam
berbagai situasi, pelaku, dan konteks yang berbeda.
Semoga bermanfaat.
Randy R. Wrihatnolo
xii
Bab 1
Pendahuluan
1
penerima manfaat program, kelengkapan dan keadaan sarana
dan prasarana keprograman, karakteristik dan kesiapan
pelaksana program, pedoman dan materi keprograman,
strategi keprograman yang sesuai dengan sasaran program,
serta keadaan lingkungan dimana program berlangsung.
2
Bab 2
Model CIPP
2.1. Pengantar
4
• Evaluasi produk untuk melayani daur ulang keputusan.
Keunggulan model CIPP merupakan system kerja yang
dinamis. 1
5
mengatur menu yang andal, ahli kesehatan yang berkualitas,
dan sebagainya. Evaluasi ini menolong mengatur keputusan,
menentukan sumber-sumber yang ada, alternatif apa yang
diambil, apa rencana dan strategi untuk mencapai kebutuhan.
Bagaimana prosedur kerja untuk mencapainya.
6
pernyataan diatas maka dapat disimpulkan bahwa evaluasi
proses harus memiliki rekaman tentang program dan
pelaksanaannya, bagaimana membandingkan apa yang telah
direncanakan , dan bagaimana para pengamat dan pelaksana
meihat usaha yang telah dilakukan.
7
Evaluasi proses dalam model CIPP menunjuk pada “apa”
(what) kegiatan yang dilakukan dalam program, “siapa” (who)
orang yang ditunjuk sebagai penanggungjawab program,
“kapan” (when) kegiatan akan selesai. 3 Dalam model CIPP,
evaluasi proses diarahkan pada seberapa jauh kegiatan yang
dilaksanakan di dalam program sudah terlaksana dengan
rencana. Oleh Stufflebeam diusulkan pertanyaan-pertanyaan
untuk proses antara lain:
• Apakah pelaksanaan program sesuai dengan jadwal?
• Apakah staf yang terlihat di dalam pelaksanaan program
akan sanggup menangani kegiatan selama program
sedang berlangsung dan kemungkinan jika dilanjutkan?
• Apakah sarana dan prasarana yang disediakan
dimanfaatkan secara maksimal?
• Hambatan-hambatan apa saja yang dijumpai selama
pelaksanaan program dan kemungkinan jika program
dilanjutkan?
8
Pandangan yang demikian memang banyak dianut dalam
evaluasi hasil bahkan masih merupakan pandangan yang
dominan. Aspek lain dari hasil belajar hampir dapat dikatakan
tidak diperhatikan sama sekali. Contoh: untuk menentukan
kriteria bahwa suatu sekolah termasuk kategori unggul
biasanya dilihat dari tingginya pencapaian nilai rata-rata UAN.
Anggapan yang demikian ini sedikit demi sedikit perlu
diluruskan mengingat tujuan pendidikan tidak hanya
mencerdaskan peserta didik melainkan untuk membentuk
manusia yang utuh (bertakwa, berkepribadian,
bertanggungjawab, jujur, cerdas, terampil, dan sebagainya).
9
• Dalam hal-hal apakah berbagai kebutuhan siswa sudah
dapat dipenuhi selama proses pelaksanaan program?
• Apakah dampak yang diperoleh dalam waktu yang
relative panjang dengan adanya program tersebut?
2.3. Kesimpulan
10
Kotak 1.
Contoh Penelitian Evaluasi Program Model CIPP
11
pelaksanaan SMA Terbuka di Kabupaten Bogor sesuai dengan
pedoman pengelolaan SMA Terbuka.
B. Perumusan Masalah
C. Analisis Obyektif
1. Siswa
12
siswa yang sudah bekerja di SMA Terbuka Bogor sebanyak 62 orang
(14%), dan yang belym bekerja sebanyak 383 orang (86%). Dan 62
orang yang bekerja 56% penghasilannya kurang dari Rp. 200.000
perbulan. Pada komponen ini tidak sesuai target yang diharapkan,
karena tidak memebrikan kontribusi ekonomi kepada siswa sesuai
harapan orang tua agar anak bisa sekolah sambil bekarja dalam
membantu kehidupan ekonomi keluarga.
2. Kurikulum
3. Bahan Ajar
Bahan ajar yang digunakan adalah bahan ajar cetak berupa modul
yang dirancang khusus sehingga dapat dipelajari siswa secara
mandiri. Namun, modul untuk mata pelajaran Agama. Kesenian dan
Penjaskes belum ada bahan ajar penunjang seperti: program audio,
video/vcd dan media lainnya jumlahnya sangat terbatas dan hanya
ada di sekolah induk.
Persepsi tentang tugas dan fungsi guru bina dan guru pamong tidak
sesuai dengan pedoman pelaksanaan SMA Terbuka Guru Pamong
pada masing-masing TKB merangkap menjadi guru bina, karena
guru bina pada sekolah induk tidak pernah datang ke TKB. Pada
masing-masing TKB tidak ada guru pamong khusus yang
memberikan keterampilan kepada siswa. Sedangkan tenaga
administrasi khusus yang menangani SMA Terbuka hanya ada di
SMA Induk.
5. Sarana Belajar
13
Ruang tempat belajar menggunakan bangunan sekolah,
perpustakaan dan laboratorium rata-rata tidak memadai, baik dari
TKB Leuwiliang, Taman sari, Parung, cileingsi, cijeruk maupun tanjo
semuanya mengatakan bahwa mereka tidak memiliki perpustakaan
dan laboratorium sendriri, hanya mereka numpang dengan sekolah
induk. Siswa merasa kesulitan untuk meminjamkan buku pada
perpustakaan sekolah induk karena pada sore hari perpustakaan
tutup. Sementara untuk laboratorium sekolah induk memiliki
laboratorium fisika, kimia dan biologi tetapi SMA Terbuka tidak
menggunakan.
D. Evaluasi proses
1. Pelaksanaan tutorial
E. Implikasi
14
sehingga bila dipikirkan lokasi TKB yang lebih mudah dijangkau
oleh siswa tanpa harus mengeluarkan biaya dari kantongnya sendiri.
Sementara 95% siswa mengatakan bahwa alasan mereka mengikuti
pendidika pada SMA Terbuka karena tidak dipungut biaya.
--ooOOoo—
15
16
Bab 3
Model CSE-UCLA
3.1. Pengantar
17
3.2. Konsep Model Evaluasi Program CSE-UCLA
18
perbedaan tingkat pengambil-keputusan dan keputusan,
pendekatan ini menjelaskan siapa yang akan menggunakan
hasil evaluasi, bagaimana mereka akan menggunakannya, dan
aspek-aspek tentang sistem membuat keputusan. Pengambil-
Keputusan selalu mendengar untuk siapa suatu evaluasi
berorientasi manajemen diarahkan, dan perhatian pengambil-
keputusan, informasi tentang kebutuhan, dan ukuran-ukuran
untuk mengarahkan efektivitas dari studi.
19
untuk maksud menyediakan suatu informasi, kerangka yang
memudahkan tinjauan ulang publik tentang kebutuhan bidang
pendidikan, sasaran hasil, rencana, aktivitas, dan hasil. Dewan
sekolah dan administrator sekolah menemukan pendekatan ini
bermanfaat dalam menjelaskan informasi kepada publik.
20
3.2.2. Program Planning
21
beberapa alternatif. Ia mengemukakan lima macam evaluasi,
yakni:
• System assessment, yang memberikan informasi tentang
keadaan atau posisi system.
• Program planning, membantu pemilihan program tertentu
yang mungkin akan berhasil memenuhi kebutuhan
program.
• Program implementation, yang menyiapkan informasi
apakah program sudah diperkenalkan kepada kelompok
tertentu yang tepat seperti yang direncanakan?
• Program improvement, yang memberikan informasi
tentang bagaimana program berfungsi, bagaimana
program bekerja, atau berjalan? Apakah menuju
pencapaian tujuan, adakah hal-hal atau masalah-masalah
baru yang muncul tak terduga?
• Program Certification, yang memberi informasi tentang nilai
atau guna program.
22
3.3. Ketepatan Penentuan Model Evaluasi CSE-UCLA
23
3.3.2. Program Pembelajaran
24
3.3.5. Program Umum
3.5. Kesimpulan
25
kekhususan model evaluasi maka tidak ada alasan bahwa ada
model yang tidak cocok untuk program umum.
26
Bab 4
Model Formatif dan Sumatif
4.1. Pengantar
27
evaluasi, tentu sudah mengenal dengan baik apa yang
dimaksud dengan evaluasi formatif dan sumatif. Hampir setiap
bulan guru-guru melaksanakan evaluasi formatif dalam bentuk
ulangan harian. Menurut Tyler, evaluasi formatif adalah
evaluasi yang dilakukan guru selama dalam perkembangan
atau dalam kurun waktu proses pelaksanaan suatu program
pengajaran semester. Sementara itu, evaluasi sumatif adalah
evaluasi yang dilaksanakan oleh guru pada akhir semester.
28
lingkungan kebijakan yang berubah-ubah. Kesesuaian antara
perencanaan dan pelaksanaan program baik pada konteks
organisasi, personil, struktur, dan prosedur menjadi fokus
evaluasi formatif.
29
• Kadang-kadang ahli yang dibutuhkan telah ada dan
dibayar dengan murah.
30
Keuntungan dari evaluasi ini adalah evaluasi ini memberikan
informasi dari sudut pandang siswa, serta evaluasi ini dapat
dilakukan dengan mudah, cepat, murah, dan produktif.
Informasi yang dapat diperoleh dari evaluasi ini meliputi
beberapa aspek, antara lain:
• Materi (content); seperti tingkat kesulitan, kejelasan,
kemenarikan, serta kekinian materi.
• Disain instruksional; seperti kejelasan tujuan, kelogisan
sistematika penyampaian materi.
• Implementasi; seperti tingkat kesulitan penggunaan,
tingkat kemudahan dana, kemungkinan kesulitan yang
dihadapi.
• Kualitas teknis; seperti kualitas animasi, video, serta
layout.
31
• Kepribadian siswa: apakah cukup percaya diri dan
terbuka untuk mengekspresikan kritiknya selama
evaluasi.
32
Tabel 4.1. Perbedaan Evaluasi Formatif dan Evaluasi Sumatif.
33
Beberapa keuntungan dari evaluasi sumatif meliputi:
• Apabila dirancang dengan tepat, mereka
berkemampuan menyediakan bukti untuk sebuah
hubungan sebab-akibat.
• Menilai hubungan jangka panjang.
• Menyediakan data mengenai dampak program.
4.4. Kesimpulan
34
satu semester. Jadi fungsinya untuk mengetahui kemajuan anak
didik.
35
36
Bab 5
Model Responsif
5.1. Pengantar
37
data penting tentang biaya, keuntungan, dan permasalahan-
permasalahan dari berbagai alternative program. Terhadap
proses politis, temuan-temuan evaluasi digunakan sebagai
pembelaan terhadap perundang-undangan tertentu dan
anggaran yang digunakan. Evaluasi resposif juga berguna
sebagai pertanggungjawaban manajemen dan membantu
manajer membuat keputusan yang berhubungan dengan
desain program, personel dan biaya.
38
Pertama, Mempertemukan pengetahuan dan harapan, artinya
bertemunya antara evaluator dan klient, masing-masing datang
pada rapat dengan pengetahuan dan harapan yang telah ada
sebelumnya, diantara mereka terjadi pertukaran informasi
tentang;
• Apa tujuan utama evaluasi?
• Prosedur apa yang akan dilalui?
• Kerangka kerja evaluasinya seperti apa?
• Apa yang menjadi kebutuhan dan keinginan personal
program dan sponsor,?
• Pertanyaan dan isu apa yang akan dievaluasi?
• Pendekatan seperti apa yang akan dipakai, seperti apa
keahlian evaluator?
• Bagaimana mencapai persetujuan untuk mengevaluasi
program?
39
Tabel 5.1. Informasi Yang Dibutuhkan dan Pertanyaan untuk
Menggali Informasi.
Informasi Yang
Pertanyaan untuk Menggali Informasi
Dibutuhkan
40
Evaluasi Responsive dikembangkan oleh Stake. Perbedaan
antara model evaluasi responsive dengan model yang lainnya
adalah pengurangan penekanan pada ketelitian pengukuran,
koleksi data sesudah dan sebelum tes. Model Responsif secara
langsung memperhatikan aktivitas program dengan
melukiskan apa yang terjadi dengan program itu. Evaluasi ini
dapat digunakan dalam kegiatan program yang terus menerus
dan ketika dalam penyelesaian program tidak satupun yakin
dengan apa yang mungkin terjadi. Model ini sangat membantu
dalam evaluasi sumatif, dalam menyediakan pemahaman dari
aktivitas program dengan kekuatan dan kelemahannya.
Evaluasi ini tidak tepat jika data hanya berupa dokumentasi
dari tujuan yang harus ditemukan. dalam hal ini evaluasi tidak
diartikan sebagai pengukuran melainkan pemberian makna
atau melukiskan sebuah realitas dari sebuah perspektif orang-
orang yang terlibat, berminat dan berkepentingan dengan
program pembelajaran. tujuan evaluasi adalah untuk
memahami semua komponen program pembelajaran melalui
berbagai sudut pandang yang berbeda.
41
dalam format yang dapat digunakan. Sebuah definisi yang
lebih luas, dan yang berlaku pada pembahasan ini, evaluasi,
yaitu dalam konteks institusi apa yang diinginkan dan
bagaimana untuk memperoleh metode terbaik dari evaluasi ini
untuk memperoleh yang diinginkan/kebutuhan. Oleh karena
itu, evaluasi responsif dapat menggunakan strategi apapun,
untuk menjamin tujuan dan fungsi. Beberapa contoh jenis-jenis
evaluasi responsif terlihat dalam tabel 5.2 (Bob Thackwray,
1998).
42
Tabel 5.2. Jenis Evaluasi Responsif.
Jenis Contoh
43
Stake (1975) menciptakan istilah evaluasi responsif dan
berpendapat bahwa evaluasi harus peduli dengan kepentingan
berbagai pemangku kepentingan (stakeholder), seperti agen,
penerima manfaat, dan ‘korban’. Pemangku kepentingan harus
diidentifikasi pada kesempatan paling awal: siapa yang terlibat
dan dalam kapasitas apa? Siapa yang harus terlibat? Yang
berpikir mereka seharusnya terlibat dan tidak, demikian
seterusnya. Ajukan tiga pertanyaan kunci ke para pemangku
kepentingannya:
• Apakah program ini dan tindakan pengembangan
penting bagi mereka?
• Apa sebenarnya yang dipertaruhkan dalam program
ini?
• Apa nilai-nilai, ada bias, atau pengalaman yang dapat
mempengaruhi penilaian mereka tentang program ini?
44
Model Responsive memandang evaluasi kurikulum (a) sebagai
suatu isu daripada sebagai tujuan, (b) perpaduan perbedaan
standar nilai yang dipegang oleh group yang berbeda, (c)
termasuk pengamatan partisipasi di dalam kurikulum dan (d)
melibatkan Informasi dari para audien.
45
pandangan tanpa memperlihatkan penilaian sebagai orang
luar.
46
Gambar 5.1. Struktur Fungsional Evaluasi Responsif Dalam
Bentuk Jam Evaluasi.
Berbicara dengan
nasabah, staf
Satukan dengan laporan program, pemakai Identifikasi ruang
resmi, jika ada lingkup kurikulum
12
Ringkasan format untuk
11 1
Overview aktivitas
digunakan
10 2 kurikulum
47
Jam 1: Evaluator, bekerja sama dengan klien, memeriksa ruang
lingkup program yang akan dievaluasi. Seringkali apa yang di
dalam dan di luar program dipersepsi beragam dan ambigu.
Penulis menganggap evaluator akan mencoba untuk membawa
beberapa penjelasan dan pengertian tentang kompleksitas
dengan mendefinisikan batas-batas wilayah, periode dan
jangka waktu, karakteristik populasi, area konten, dan
sebagainya. Hasilnya ini meliputi pembatasan beberapa
pengamatan dan memfokuskan penyelidikan. Penulis
menyimpulkan bahwa dalam evaluasi responsif seperti,
keputusan akan fleksibel dan ditinjau kembali secara periodik
selama penelitian.
48
Jam 4: Evaluator menganalisa dan mensintesis masalah mereka,
sebagai memberikan dasar untuk membedakan kebutuhan
data. Untuk mencapai konseptualisasi, evaluator mungkin
mengumpulkan berbagai sudut pandang yang berbeda tentang
apa yang berharga dan tidak berharga dalam program ini dan
apa yang harus ditambahkan. Pasti juga akan berguna untuk
mendapatkan reaksi dari setiap audience tentang
konseptualisasi masalah baru. Stake mengingatkan evaluator
untuk tidak berkeinginan menjadi calo hanya untuk
mendapatkan informasi yang menguntungkan atau tidak
menguntungkan, ia juga memperingatkan mereka tidak hanya
menganggap keprihatinan evaluator dan otoritas luar adalah
layak didiskusikan.
49
standar dan penilaian pendahuluan berkaitan dengan program,
transaksi, dan hasil.
50
rangka menanggapi kebutuhan yang berbeda dari audience
yang berbeda.
51
Fase 3: Mengidentifikasi, mengumpulkan, dan menganalisis
informasi mengenai: (a) Obyek yang dievaluasi; (b) Standar
yang akan dipergunakan untuk menilai obyek evaluasi; dan (c)
Pendapat, isu dan nilai-nilai pemangku kepentingand. Metode
yang akan dipergunakano Observasi aturalistic, Wawancara,
Kuesioner, Tes standar
5.5. Kesimpulan
52
Bab 6
Model “Tyler”
(Black Box Tyler)
6.1. Pengantar
53
6.2. Model Black Box Tyler
54
minimal dua kali yaitu sebelum dan sesudah perlakuan
(treatmen) dicapai oleh pengembang kurikulum (Hamid Hasan,
2008).
55
dengan membandingkan hasil belajar ataupun perubahan
perilaku berdasarkan tujuan sebelum pembelajaran dengan
hasil dicapai setelah proses belajar berlangsung. Data hasil
evaluasi dapat melalui hasil tes sumatif.
56
tersebut. Alat ukur yang digunakan pada waktu tes awal dan
tes akhir harus sama, memiliki validitas konten yang tinggi dan
realibilitas tinggi pula. Persyaratan validitas dan realibilitas
mutlak untuk memberikan keyakinan bahwa informasi yang
diperoleh informasi awal dan tes akhir tersebut
menggambarkan kemampuan peserta didik pada waktu
mengikuti tes.
57
mewajibkan guru mengembangkan satuan pelajaran dengan
menggunakan Prosedur Pengembangan Sistem Instruksional
(PPSI). Tyler mengemukakan persyaratan tersebut, tujuan
dengan rumusan yang demikian masih merupakan sesuatu
yang baru bagi dunia pendidikan Amerika Serikat. Pada
gagasan Tyler ini yang kemudian mengilhami Bloom dan
kawan-kawannya mengembangkan ide tersebut menjadi
taksonomi tujuan pendidikan yang terkenal dengan nama
taksonomi tujuan pendidikan Bloom. Taksonomi Bloom dkk,
yang kemudian banyak diterapkan di Indonesia melalui
pengembangan Tujuan Instruksional Khusus (TIK) merupakan
salah satu komponen dalam model PPSI. Pada saat ini model
PPSI sudah tidak digunakan tetapi tujuan yang terukur dan
teramati masih tetap dianjurkan. Proses pengembangan KTSP
harus mengembangkan tujuan behavioral ini jika berkenaan
dengan model kurikulum berbasis kompetensi.
58
Keeratan hubungan pada prosedur pertama dan kedua,
demikian pula halnya keertan hubungan antara langkah kedua
dengan langkah ketiga. Pada waktu evaluator menentukan
situasi dalam langkah kedua secara implisit sebenarnya
evaluator telah menentukan langkah ketiga yaitu penentuan
alat evaluasi yang akan digunakan. Alat evaluasi dapat
berbentuk tes dan alat ini adalah alat yang banyak digunakan
orang. Tetapi alat evaluasi dapat pula berbentuk alat bukan tes
seperti panduan observasi, kuesioner, panduan wawancara
(interview guide) dan lain sebagainnya. Ketika evaluator
menentukan situasi dimana peserta didik diharapkan dapat
mengemukakan hasil belajar dengan baik, evaluator harus
memiliki pengetahuan tentang karakteristik alat tersebut,
kekuatan dan kelemahan yang ada dihubungkan dengan
tujuan yang diukur.
59
mengukur sikap kebangsaan sudah tersedia maka evaluator
boleh menggunakan instrumen tersebut. Tetapi jika instrumen
yang sudah ada itu megukur berbagai aspek dari sikap
kebangsaan yang berbeda dengan apa yang dirancang maka
evaluator tadi harus mengembangkan instrumen baru yang
sesuai dengan konstrak sikap kebangsaan yang diinginkan.
Yang terakhir dilakukan, mengembangkan instrumen baru,
evaluator tersebut harus mengembangkan instrumen sesuai
dengan prosedur yang dipersyaratkan oleh teori pengukuran.
Evaluator harus menjamin bahwa instrumen yang baik
menurut persyaratan pengukuran seperti validitas isi, validitas
konstrak karena berkaitan dengan konstrak sikap kebangsaan,
realibilitas. Prosedur untuk menguji validitas dan realibilitas ini
harus diikuti dengan ketat (John M. Owen. 2006).
6.3. Kesimpulan
60
sehingga evaluator dapat memfokuskan kajian evaluasinya
hanya pada satu dimensi kurikulum yaitu dimensi hasil belajar.
Dimensi kurikulum seperti proses tidak menjadi fokus. Dari
evaluasi ini dihasilkan informasi yang pada umumnya
pendidik setuju karena sesuai dengan misi mereka. Bahan
pustaka bervariasi dan evaluasi ini dapat merefleksikan apa
yang dimaksud dan menjelaskan generalisasi yang rancu
tentang hasil pendidikan (Muzayanah, 2007)
61
62
Bab 7
Model Iluminatif
7.1. Pengantar
63
menyatakan dirinya sebagai alternatif bagi model – model
evaluasi yang dikembangkan dari tradisi kuantitatif.
64
Untuk itulah kemudian muncul model evaluasi yang diambil
dari perspektif antropologi sosial untuk pendekatan evaluasi,
dan metodologi evaluasi illuminatif berupaya untuk
menyediakan informasi mendalam dan lebih realistis dan
holistik yang membantu para pengambil keputusan dalam
mewujudkan perbaikan.
65
Joan Poliner Shapiro, wakil dekan di College of Education di
Temple University, telah melakukan penelitian dan menulis
tentang pendekatan illuminatif dan pendekatan penilaian
partisipatif. Dalam tulisan-tulisannya Shapiro fokus terutama
pada evaluasi illuminatif sebagai pendekatan untuk menilai
penelitian studi perempuan dan program proyek. Sebagaimana
yang dijelaskan oleh Shapiro, evaluasi illuminatif merupakan
alternatif model evaluasi yang pertama untuk menangani
beberapa dari kritik dan pertanyaan yang diajukan oleh feminis
dan evauasi pendidikan non-tradisional.
66
terhadap proses belajar siswa. Hasil evaluasi ditekankan pada
deskripsi dan interpretasi, bukan pengukuran dan prediksi
sebagaimana model sebelumnya. Dalam pelaksanaan evaluasi,
model ini lebih menekankan penggunaan judgment, selaras
dengan semboyan the judgment is the evaluation.
67
akan mengalami modifikasi, reinterpretasi dan mungkin
berubah.
68
menghubungkan organisasi (departemen/lembaga
pendidikan/sekolah) dengan prakteknya dalam jangka panjang
pada siswa. Evaluasi kinerja siswa, hasil pembelajaran,
pengembangan intelektual siswa dan perubahan perilaku, tidak
akan dapat sepenuhnya dipahami tanpa pemahaman
mendalam tentang lingkungan belajar tertentu serta
budayanya.
69
Baik data kuantitatif maupun data kualitatif mempunyai
kedudukan yang sama dan saling mengisi (Hasan, 2008:235).
70
Evaluasi illuminatif meliputi tiga tahapan; pengamatan,
penyelidikan lebih lanjut, dan penjelasan lajutan. Ketiga
tahapan ini saling tumpang tindih dan saling berhubungan
secara fungsional satu sama lain seperti mengembangkan
model investigasi. Dimulai dengan basis data yang luas, dan
kemudian secara sistematis semakin memberikan perhatian
terhadap fenomena unik dan fenomena yang tidak
terduga. Empat sumber data yang digunakan dalam
penyusunan informasi adalah observasi, wawancara, kuesioner
dan tes, disamping dokumen-dokumen dan latar belakang.
71
Kedua, Tahap kedua adalah penyelidikan lebih lanjut (inquiry
further). Pada tahap ini, evaluator tidak berpegang teguh pada
temuannya dalam langkah pertama. Seperti telah dikemukakan
sebelumnya, temuan tersebut hanyalah bersifat pedoman bagi
evaluator. Dalam langkah kedua, perubahan – perubahan dari
hasil langkah pertama masih dimungkinkan. Misalnya, isu
yang telah ditemukan pada langkah pertama harus diganti
dengan isu baru karena isu yang ditemukan pada langkah
pertama sudah tidak relevan lagi. Ada isu baru yang
berkembang dan lebih relevan. Dengan demikian terjadi fokus
baru dalam evaluasi.
72
menggunakan pendekatan kualitatif yang menekankan
pentingnya menjalin kedekatan dengan orang dan situasi yang
sedang dievaluasi agar dapat memahami secara personal
realitas dan hal-hal rinci tentang program atau sistem yang
sedang dikembangkan. Di samping itu, faktor lainnya adalah
pandangan yang holistik dalam evaluasi, yang berasumsi
bahwa keseluruhan adalah lebih besar daripada sejumlah
bagian-bagian.
73
Model illuminatif menekankan pentingnya penilaian yang
kontinu selama proses pelaksanaan pendidikan sedang
berlangsung. Jarak antara pengumpulan data dan laporan hasil
penilaian cukup pendek sehingga informasi yang dihasilkan
dapat digunakan pada waktunya.
7.5. Kesimpulan
74
suatu bentuk penilaian yang dapat disebut bebas-tujuan (goal-
free evaluation) dan dengan demikian, sangat berguna untuk
mengevaluasi program-program baru ketika efek jangka
panjang tidak dapat diantisipasi. Pendekatan illuminatif juga
memiliki sejumlah kualitas yang tampaknya akan membuatnya
cocok untuk menilai program-program studi keperempuanan.
Sebelum metode ini digunakan, bagaimanapun juga, kekuatan
dan kelemahan sebagai sebuah metodologi/cara, harus
sepenuhnya dieksplorasi untuk memastikan apakah cocok atau
tidak untuk program yang hendak dievaluasi.
75
76
Bab 8
Model Berorientasi Tujuan
(Goal Oriented Evaluation)
8.1. Pengantar
77
Paradigma dalam program evaluasi menurut Potter (2006)
mengidentifikasi dan menjelaskan paradigm yang luas dalam
evaluasi program, yang pertama dan yang paling umum,
adalah pendekatan positivis, evaluasi hanya dapat terjadi di
mana terdapat “objektif”, aspek yang dapat diamati dan
terukur dari sebeuah program, yang membutuhkan bukti-bukti
kuantitatif domain. Pendekatan positivis mencakup dimensi
evaluasi seperti kebutuhan penilaian, penilaian teori program,
penilaian proses program, penilaian dampak dam penilaian
efisiensi (Rossi, Lipsey dan Freeman, 2005). Kedua, paradigma
yang diidentifikasi oleh Potter (20006) bahwa pendekatan
inteerpretatif, di mana ia berpendapat bahwa adalah penting
bahwa evaluator mengembangkan pemahaman tentang
perspektif, pengalaman dan harapan semua pemangku
kepentingan. Hal ini akan menyebabkan pemahaman yang
lebih baik dari berbagai makna dan kebutuhan yang
diselenggarakan oleh para pemangku kepentingan, yang sangat
penting sebelum seseorang mampu membuat penilaian tentang
manfaat atau nilai dari sebuah program. Kontak evaluator
dengan program ini sering (selama jangka waktu) dan,
meskipun tidak ada metode standar, observasi, wawancara dan
diskusi kelompok dengan focus umum yang digunakan.
78
Evaluasi program dilakukan, dalam instrument hendaknya
kegiatan yang dinilai mampu menjawab tiga hal, apa (what)
yang dilaksanakan, who siapa sasarannya, how bagaimana
melaksanakannya, dan ada tiga komponen yang perlu
diientifikasi yaitu tujuan, pelaksana, dan prosedur pelaksanaan
(Arikunto dan Safruddin dalam evaluasi program pendidikan,
2004). Dalam evaluasi program dapat ditentukan “standar” dan
‘indikator” dalam penilaian. Standar penilaian dapat dilakukan
scara kuantitatif dan kualitatif.
79
• Discrepancy (kesenjangan model) oleh Malcolm Provus,
yang menekankan pada pandangan adanya
kesenjangan dalam pelaksanan program.
• Adapun yang dibahas dalam makalah ini adalah hanya
Goal oriented evaluation model atau evaluasi yang
berorientasi pada tujuan.
80
perorangan. Untuk perorangan ditujukan dalam bidang
penilaian atau ditekankan pada menilai daripada melakukan
evaluasi program. Evaluasi yang berorientasi pada tujuan
dapat dilakukan untuk mempromosikan pegawai atau
menurunkan pegawai, khususnya yang berkenaan dalam
bidang organisasi dilakukan untuk pemberian bonus yang
didasarkan pada hasil penilaian prestasi individu (Owen,
1993;88)
81
telah dicapai. Perintis pendekatan ini adalah Tyler. Pemahaman
Tyler tentang evaluasi adalah proses penentuan sampai di
mana tujuan pendidikan dari suatu program sekolah atau
kurikulum telah tercapaiAdapun langkah-langkah dalam
pendekatan Tyler khusus dalam mengembangkan evaluasi
yang berorientasi pada tujuan sebagai berikut: (a) menetapkan
tujuan umum, (b) mengklasifikasi tujuan, (c) mendefinisikan
tujuan dalam istilah perilaku, (d) menentukan situasi dimana
hasil atau prestasi belajar dapat ditunjukkan, (e)
mengembangkan atau memilih teknik pengukuran, (f)
mengumpulkan data kinerja, dan (g) membandingkan data
kerja dengan tujuan yang dinyatakan dengan perilaku.
82
untuk mengidentifikasi isu-isupokok dari evaluasi, (b)
bekerjasama dengan pemangku kepentingan dalam
mengembangkan disain evaluasi, (c) membuat keputusan
tentang aturan-aturan dalam manajemen data, mengumpulkan
dan menganalisis informasi yang relevan, dan (d) terlibat
dalam strategi-strategi yang mendukung penggunaan temuan-
temuan evaluasi (Owen, 1993;100).
83
program. Yaitu yang menjadi isu-isu utama hasil adalah
apakah program memberikan suatu dampak terhadap para
siswa mengenai ilmu dan pengetahuan mereka yang
berhubungan dengan keadaan sebelum kehamilan, (2)
mengembangkan disain evaluasi bersama dengan pemberi
dana. Kebutuhan untuk mengumpulkan bukti tentang manfaat
program mendorong evaluator untuk merekomendasikan
penggunaan dari pree-test dan post-test hasil belajar yang
sederhana dan pengumpulan surat keterangan dari para siswa
dan para guru yang terlibat. Kenyataan, bahwa saat sebelum
merencanakan evaluasi dulu, program yang dilaksanakan
harus diperhitungkan dengan cermat, sesuai dengan
manakemen data pada daftar isu-isu yang diangkat oleh
pemberi dana, (3) membuat aturan-aturan dalam pengambilan
keputusan mengenai manajemen data.
84
untuk berdebat saat pengenalan kursus di pusat kesehatan
yang lain. Para evaluator sepakat untuk bekerjasama dengan
pemberi dana untuk mempresentasikan temuan-temuan
kepada berbagai agen-agen kesehatan. Besarnya komitmen
evaluator pada tahap ini ditentukan oleh kekuatan dari
temuan-temuan. Jika dampak dari program kecil atau negatif,
evaluator tidak boleh keras mengambil pengembang tugas
(Jhon Owen, 1993:101).
85
tes untuk evaluasi program. Dia berpendapat bahwa
membuang item-item yang dijawab dengan benar oleh terlalu
banyak, atau terlalu sedikit, responden tidak menyediakan
informasi yang diperlukan tentang apa siswa belajar. Tyler titik
pandang telah dikenal sebagai tujuan-berorientasi (atau tujuan-
direferensikan) evaluasi. Pendekatan berfokus pada (a)
merumuskan pernyataan tujuan pendidikan, (b)
mengelompokkan tujuan tersebut ke dalam jenis utama, (c)
mendefinisi kan dan menyempurnakan masing-masing Jenis
tujuan dalam hal perilaku, (d) mengidentifikasi situasi-situasi
di mana siswa dapat diharapkan untuk menampilkan jenis
perilaku, (e) memilih dan mencoba metode yang menjanjikan
untuk memperoleh bukti tentang setiap jenis tujuan, (f)
memilih berdasarkan uji coba awal lebih menjanjikan metode
penilaian untuk pengembangan lebih lanjut dan perbaikan, dan
(g) menyusun berarti untuk menafsirkan dan menggunakan
hasil (Tyler, 1942:498-500). Madaus dan Stufflebeam (1989)
menyatakan bahwa Tyler istilah "pendidikan evaluasi" di tahun
1930-an untuk menggambarkan prosedur-nya perbandingan
(baik-lain) hasil yang diharapkan (disebut tujuan) dengan
(baik-diukur) hasil actual.
86
demikian, ada situasi di mana orang harus berkompromi, maka
kadang-kadang perlu menggunakan ukuran pengganti, yaitu
digantikan untuk atau bertindak sebagai pengganti ukuran
ideal atau yang lebih disukai. Jika menggunakan ukuran
pengganti ukuran validitasnya harus dipertahankan manakala
mempresentasikan temuan-temuan evaluasi. Kasus berikut
adalah contoh dimana sebuah indikator hasil digunakan
sebagai pengganti untuk menunjukkan pengetahuan di dalam
mengevaluasi dampak dari program pendidikan, kesehatan.
87
menjadi komponen istimewa dan harus dilayanani sebaik-
sebaiknya adalah pelanggan, penyimpan, dan peminjam untuk
koperasi simpan pinjam dan pembelian untuk koperasi
penjualan. Sejak hari pertama buka dan melayani pelanggan,
evaluator sudah dapat mengadakan evaluasi melalui Tanya
jawab kepara para pelanggan tentang bagaimana kualitas
layanan yang diberikan oleh petugas koperasi, tentu dilakukan
terus-menerus. Begitu juga dengan program bank, para
nasabah bank harus diberi pelayanan sebaik mungkin. Begitu
juga program perpustakaan, para peminjam buku harus
dilayani sebaik-baiknya.
88
mudah untuk diikuti dan diterapkan, serta menghasilkan
informasi yang pada umumnya pendidik setuju, bahwa
pendekatan ini sesuai dengan misi para pendidik tersebut.
Menurut Mager, pendekatan evaluasi berorientasi pada tujuan
menyebabkan pendidik dapat merefleksikan apa yang
dimaksudkan dan menjelaskan generalisasi yang rancu tentang
hasil pendidikan (Worthen and Sanders, 1987)
89
ditunjukkan oleh bagian positif dalam pencapaian peserta
program.
90
ditentukan; (c) Wawancara dengan penyelenggara
program; dan (d) Combinasi lebih dari satu hal-hal di atas.
• Tentukan cara-cara yang paling tepat untuk memutuskan
apakah program dengan mudah mencapai tujuan. Sebagai
contoh, dengan hubungan untuk mendesain managemen
data, apakah control-group tersedia, apakah ini
memungkinkan untuk menggunakan desain “sebelum
dan sesudah”, dan kapan seseorang dapat mengumpulkan
hasil data.
• Pilih instrumen pengukuran yang tepat, atau buat yang
baru. Pertimbangkan kekonsistenan antara variabel hasil
dan tujuan program, gaya bahasa dan isi dari instrumen,
dan item yang digunakan. Apabila instrumen telah dibuat
berdasarkan tujuan, lebih baik instrumen tersebut
diujicoba dahulu.
• Identifikasi sumber-sumber bukti.
• Kumpulkan dan analisa bukti.
• Gambarkan hasilnya. Dalam beberapa kasus membuat
keputusan dengan tegas dan lengkap dalam pencapaian
variabel hasil, hal ini direkomendasikan.
• Laporkan hal-hal yang ditemukan.
91
8.4.2. Evaluasi dari Community Agency Human Development
Program
92
mereka terhadap program. Demikian pembangunan dari
instrumen akhir, menyandarkan pada wawancara dari pada
dokumentasi formal dari tujuan program.
8.5. Kesimpulan
93
statistika; (2) Terjadi kenaikan skor untuk murid-murid dari
semua sekolah; (3) Murid perempuan dan laki-laki memperoleh
pencapaian yang hampir sama; (4) Perolehan item dalam tes
sangat bervariasi; dan (5) Beberapa item yang dijawab dengan
baik mengindikasikan bahwa item tersebut tidak perlu
disertakan lagi dalam kursus selanjutnya.
94
Bab 9
Model Kaufman
(Need Assesment Evaluation)
9.1. Pengantar
95
lanjuti menjadi proposal program dan acuan pembuatan
instrumen evaluasi. 8
96
Sifat-sifat penting dari kebutuhan membawa kita untuk
memperhatikan lima elemen, sebagai berikut:
• Keinginan atau kondisi ideal atau hubungan yang tetap
atau yang seharusnya terjadi
• Kondisi yang aktual atau hubungan yang tetap
• Ketidaksesuaian antara keinginan dan kondisi yang aktual
• Alasan untuk ketidakcocokkan
• Memutuskan kebutuhan mana yang perlu diprioritaskan
untuk dilakukan melalui perlakuan atau melalui sebuah
program
97
kondisi yang diharapkan. Kebutuhan tersebut dapat terjadi
pada diri individu, kelompok, ataupun lembaga. 10
98
Sedangan bagaimana langkah-langkah need assesment dengan
pendekatan dua pengukuran tersebut (obyektif dan subyektif),
lebih rincinya dapat dijelaskan sebagai berikut:
99
dengan tingkat penerimaan (dari 5 ke 1, jika
menggunkan skala 5), dan seyogyanya skalanya
berbentuk interval.
• Jika sudah dutentukan skala, kumpulkan semua calon
evaluator untuk bersama-sama menentukan urutan
kebutuhan dan skala prioritas kebutuhan. Jika secara
kebetulan terdapat dua kebutuhan yang sejajar, maka
diperlukan lagi kesepakatan untuk menentukan mana
kebutuhan yang lebih mendesak.
100
Tabel 9.1. Tiga Langkah Penyiapan Need Assesment.
Mengapa
Apa Yang Bagaimana
mengajarakan
diajarkan mengajarkan
yang kita ajarkan
(analisis
(tujuan) (cara/media)
kebutuhan)
Keterangan:
(a) Seorang guru ketika akan memulai mengajar, dia harus
memusatkan perhatiannya ke arah pencapaian tujuan,
lalu memperhatikan materi yang menunjang pencapaian
tujuan, dan menentukan cara penyampaian materi.
(b) Setelah materi dipilih oleh sang guru, maka guru
menelaah kembali materi pilihan tersebut untuk
dicocokkan dengan kebutuhan siswa. Artinya pada PBM
inovatif siswa adalah fokus inti dari setiap proses
pembelajaran.
(c) Setalah ada kecocokan materi dengan kebutuhan siswa,
dan tidak melenceng dari tujuan PBM, maka berikutnya
guru menetukan strategi pemebelajaran yang tepat,
meliputi; metode, pengelolahan kelas, media
pembelajaran, dan lain-lain.
101
Gambar 9.2. Interaksi dalam Need Aassessment.
102
Contoh Kasus Penerapan Model Need Assessment dalam sebuah
evaluasi yang dilakukan oleh Jamil Effarah untuk mengetahui
kesenjangan kebutuhan di suatu sekolah kejuruan bisnis di
Oregon Amerika Serikat pada tahun 1977. Penelitian itu
dilakukan dengan membagikan angket kepada sejumlah guru
untuk mengetahui kecocokan materi dalam Electronic Data
Prosessing (EDP) diajarkan untuk program kecil (1 atau 2 orang
guru), dan proram besar (5 guru atau lebih). Hasil evaluasi
dapat dilihat dalam tabel 9.3.
9.5. Kesimpulan
103
nasional walaupun dengan setting lokal. Hal itu dimungkinkan
bila minimal sebagai pendidik paham betul akan siswa dan
keinginan secara individual maupun klasikal didesain secara
proporsional.
104
Bab 10
Model “Stake”
10.1. Pengantar
105
kognitif, afektif dan psikomotor. Pengukuran memiliki konsep
yang lebih luas dari pada tes. Kita dapat mengukur
karakateristik suatu objek tanpa menggunakan tes, misalnya
dengan pengamatan, skala rating atau cara lain untuk
memperoleh informasi dalam bentuk kuantitatif.
106
apa dalam pemberian remidial service, dan (iv) perbaikan atau
penyempurnaan program 13.
13 Ngalim Purwanto (1983), Prinsip-prinsip dan Teknik Evaluasi Program, Edisi IV,
UNJ, Jakarta.
107
tidak dipergunakan di sini karena dua hal itu adalah konsep
utama dalam model pengolahan data yang dikemukakan oleh
Stake. Kedua konsep itu tidak dapat mewakili keseluruhan ide
Stake mengenai evaluasi. jadi, nama countenance dipertahankan
sebagai nama model ini secara keseluruhan.
108
Model Stake pada prinsipnya sama dengan model-model
evaluasi lain yaitu mencoba membandingkan apa yang terjadi
dengan apa yang ditargetkan atau diharapkan terjadi. Dengan
kata lain membandingkan antara hasil yang diperoleh dengan
standar yang ditetapkan sebelumnya. Oleh Stake (Worthen
dan Sanders, 197:113), model evaluasi yang diajukan dalam
bentuk diagram, menggambarkan deskripsi dan tahapan
sebagai berikut.
109
Menurut Stake, ketika evaluator tengah mempertimbangkan
program, harus melakukan 2 perbandingan berikut: (1)
Membandingkan kondisi hasil evaluasi program tertentu
dengan dengan yang terjadi diprogram lain, dengan objek
sasaran yang sama (Perbandingan Relatif); dan (2)
Membandingkan kondisi hasil pelaksanaan program dengan
standar yang diperuntukkan bagi program yang bersangkutan,
didasarkan pada tujuan yang akan dicapai (Perbandingan
Mutlak) 14.
110
Dalam kenyataannya, data tentang rasionaltak mungkin
dukumpulkan seb3elum data mengenai tujuan telah
dikumpulkan. Oleh akrena itu waktu yang paling cepat untuk
segera mengumpulkan data mengenai rasional adalah
bersamaan dengan waktu pengumpulan data mengenai tujuan.
111
transaksi yang lebih efektif untuk mencapai apa yang
dikemukakan dalam prasyarat. Demikian pula mengenai
hubungan antara transaksi dengan hasil yang diharapkan.
112
Gambar 10.2. Analisis Data Deskriptif
congruence
Antescedent yang Antescedent yang
diharapkan diamati
congruence
Transaksi yang Transaksi yang
diharapkan diamati
congruence
Hasil yang Hasil yang
diharapkan diamati
113
Mengenai standar yang diinginkan Stake dapat dikembangkan
dari komponen-komponen yang ada dalam rencana besar
kurikulum tersebut (Standar Kompetensi dan Kompetensi
Dasar). Meskipun demikian, tidak salahnya apabila evaluator
juga mempergunakan standar yang dikembagkan dari para ahli
bidang pendidikan. Tentu saja masalah akan timbul apabila
antara standar yang dikembangkan dari kurikulum tidak
bersesuaian dengan yang dikembangkan dari para ahli.
Persoalan ini pasti akan dihadapi oleh setiap evaluator yang
mempergunakan model countenance ini. hal ini Stake (1972: 100)
menganjurkan agar evaluator jangan mengevaluasi kurikulum
dengan “mikroskop” tetapi seharusnya dengan ” a panoramic
view finder” . Adanya beragam standar akan memberikan
kesempatan kepada evaluator untuk mempergunakan standar
tersebut sebagai teropong panorma dan bukan mikroskop.
10.4. Kesimpulan
114
dikembangkan oleh Stake adalah Countenance Evaluation Model
dan Responsive Evaluation Model Countenance Evaluation Model
mengemukakan keseluruhan kegiatan evaluasi yang harus
dilakukan dan cara yang diinginkan bagaimana evaluasi
tersebut dilakukan.
115
116
Bab 11
Model Formatif-Sumatif
Untuk Program Proses dan
Program Pelayanan
11.1. Pengantar
117
penggambaran (delineating), penyediaan (providing) informasi
yang berguna (useful information) dan alternatif keputusan
(decision alternatives).
118
tujuan khusus. Tujuan umum diarahkan kepada program
secara keseluruhan sedangkan tujuan khusus lebih difokuskan
pada masing-masing komponen. Implementasi program harus
senantiasa di evaluasi untuk melihat sejauh mana program
tersebut telah berhasil mencapai maksud pelaksanaan program
yang telah ditetapkan sebelumnya. Tanpa adanya evaluasi,
program-program yang berjalan tidak akan dapat dilihat
efektifitasnya. Dengan demikian, kebijakan-kebijakan baru
sehubungan dengan program itu tidak akan didukung oleh
data. Karenanya, evaluasi program bertujuan untuk
menyediakan data dan informasi serta rekomendasi bagi
pengambil kebijakan (decision maker) untuk memutuskan
apakah akan melanjutkan, memperbaiki atau menghentikan
sebuah program. Pada bab ini penulis menggali model evaluasi
program yang dikemukakan oleh Michael Striven, yaitu Goal
Free Evaluation dan Formatif-Summatif Evaluation.
119
pengambil keputusan dan sekaligus penyedia informasi.
Dengan demikian ia membedakan antara “Goal of evaluation
dan role of evaluation”. Untuk mecapai tujuan dari evaluasi,
Scriven mengemukakan perlu adanya dasar yang menjadi
pijakan. Dalam hal ini ada dua pijakan atau premis yaitu: (a)
Premis faktual dan (b) Premis nilai. Premis faktual berkaitan
dengan sifat, kinerja, atau pengaruh. Sedangkan premis nilai
berkaitan dengan prinsip-prinsip ilmiah atau aturan yang
relevan.
120
jalan mengidentifikasi penampilan-penampilan yang terjadi,
baik hal-hal positif (hal yang diharapkan) maupun hal-hal
negatif (yang sebenarnya tidak diharapkan).
121
hasil kegiatan dapat diketahui termasuk didalamnya efek
sampingan (side effect) atau nurturrant effect yang ditimbulkan
suatu kegiatan.
122
formatif dalam bentuk ulangan harian. Evaluasi tersebut
dilaksanakan untuk mengetahui sampai berapa tinggi tingkat
keberhasilan atau ketercapaian tujuan untuk masing-masing
pokok bahasan. Dikarenakan luas atau sempitnya materi yang
tercakup didalam pokok bahasan setiap mata pelajaran tidak
sama, maka tidak dapat ditentukan dengan pasti kapan
eveluasi formatif dilaksanakan dan berapa kali untuk masing-
masing mata pelajaran. Berikut akan dijelaskan tahapan dan
lingkup objek yang dievaluasi:
123
mengenai kelemahan tersebut terlambat sampai kepada
pengambilan keputusan, maka evaluasi bersifat sia-sia.
124
dengan evaluasi internal (Internal-evaluation atau Intrinsic-
evaluation) karena evaluasi formatif dilakukan menyangkut isi,
tujuan, prosedur/proses, sikap guru, sikap murid, fasilitas dan
sebagainya.
125
informasi yang diperoleh dari evaluasi orang per orang,
kelompok kecil, atau uji lapangan; dan (2) kadang-kadang ahli
yang dibutuhkan telah ada dan dibayar dengan murah.
126
dilakukan dengan mudah, cepat, murah, dan produktif.
Informasi yang dapat diperoleh dari evaluasi ini meliputi
beberapa aspek, antara lain:
• Materi (content). Seperti tingkat kesulitan, kejelasan,
kemenarikan, serta kekinian materi.
• Disain instruksional. Seperti kejelasan tujuan, kelogisan
sistematika penyampaian materi.
• Implementasi. Seperti tingkat kesulitan penggunaan,
tingkat kemudahan dana, kemungkinan kesulitan yang
dihadapi.
• Kualitas teknis. Seperti kualitas animasi, video, serta
layout.
127
Ketiga, Evaluasi Kelompok Kecil (Small Group)
128
Berbeda dengan evaluasi formatif, evaluasi summatif lebih
diarahkan untuk menguji efek dari komponen-komponen
pendidikan/pembelajaran terhadap murid-murid, atau dapat
juga dikatakan bahwa evaluasi summatif dirancang untuk
mengetahui seberapa jauh kurikulum yang telah disusun
sebelumnya memberikan hasil pada siswa antara lain
mencakup aspek kognitif, afektif, dan psikomotor. Hal itu
dapat dilihat pada hasil pre test dan post test, antara kelompok
eksperimen dan control. Walaupun Scriven tidak mengarahkan
model ini pada evaluasi dalam proses belajar mengajar, namun
pelaksanaan kurikulum tidaklah dapat dipisahkan dari
kegiatan pendidikan.
129
merupakan totalitas sejak awal hingga akhir. Beberapa
keuntungan dari evaluasi sumatif meliputi: (1) Mereka bisa, jika
dirancang dengan tepat, menyediakan bukti untuk sebuah
hubungan sebab-akibat; (2) Menilai hubungan jangka panjang;
dan (3) Menyediakan data mengenai dampak program.
130
Berdasarkan penjelasan melalaui dua contoh program diatas
dapat disimpulkan bahwa model evaluasi sumatif dan formatif
sesuai untuk mengevaluasi program pemrosesan. Evaluasi
formatif dapat dilaksanakan pada penggalan kegiatan,
sedangkan evaluasi sumatif dilaksanakan pada akhir program.
131
11.4. Prasyarat Evaluator Dalam Evaluasi
132
11.5. Kemampuan Metodologis
11.6. Kesimpulan
133
model evaluasi program ini dikemukakan oleh Michael Striven,
professor psikologi di Claremont Graduate School dan terakhir
menjabat sebagai Presiden Asosiasi Evaluasi Amerika. Model
yang dikembangkannva adalah Goal Free Evaluation "evaluasi
bebas tujuan" dan Formatif-Summatif Evaluation. Dalam Goal Free
Evaluation bukan berarti lepas sama sekali dari tujuan evaluasi
tetapi hanya lepas dari tujuan khusus. Model ini hanya
mempertimbangkan tujuan umum yang akan dicapai oleh
program, bukan secara rinci per komponen. Singkatnya model
ini justru tidak memperhatikan apa yang menjadi tujuan
program sebagaimana model goal oriented evaluation. Yang
harus diperhatikan justru adalah bagaimana proses
pelaksanaan program, dengan jalan mengidentifikasi kejadian-
kejadian yang terjadi selama pelaksanaannya, baik hal-hal yang
positif maupun hal-hal yang negatif.
134
Bab 12
Model Kirkpatrick
12.1. Pengantar
135
efektifitas suatu program, ada pula evaluasi yang bertujuan
untuk menemukan hasil suatu program di luar tujuan program
yang direncanakan. Dari sisi program, seandainya kita
persempit menjadi program pendidikan, ada program
pendidikan dengan term waktu yang panjang dengan cakupan
bidang garapan program yang luas dan tujuan program yang
komprehensif, seperti penyelenggaraan kegiatan persekolahan
formal. Ada pula program pendidikan dengan term waktu
yang singkat dengan bidang garapan yang lebih spesifik serta
memiliki tujuan program yang lebih sempit. Contoh program
ini adalah program diklat, kursus, dan pelatihan.
136
terhadap pelaksanaan suatu pelatihan; (2) learning; adalah
evaluasi untuk mengukur tingkat tambahan pengetahuan,
ketrampilan maupun perubahan sikap peserta setelah
mengikuti pelatihan; (3) behaviour; adalah evaluasi untuk
mengetahui tingkat perubahan perilaku kerja peserta pelatihan
setelah kembali ke lingkungan kerjanya; dan (4) result; adalah
evaluasi untuk mengetahui dampak perubahan perilaku kerja
peserta pelatihan terhadap tingkat produktifitas organisasi.
Selanjutnya ke empat tahap evaluasi tersebut akan dijelaskan
secara lebih rinci.
137
kelas, fasilitas utama dan fasilitas pendukung, kebernilaian dan
kebermaknaan isi pelatihan, dan lain-lain yang berhubungan
dengan penyelenggaraan suatu pelatihan. Mengukur reaksi ini
relatif mudah karena bisa dilakukan dengan menggunakan
reaction sheet yang berbentuk angket. Evaluasi terhadap reaksi
ini sesungguhnya dimaksudkan untuk mendapatkan respon
seasaat peserta terhadap kualitas penyelenggaraan pelatihan.
Oleh karena itu waktu yang paling tepat untuk menyebarkan
angket adalah sesaat setelah pelatihan berakhir atau beberapa
saat sebelum pelatihan berakhir.
138
Evaluasi tahap kedua ini sesungguhnya evaluasi terhadap hasil
pelatihan. Program dikatakan berhasil ketika aspek-aspek
tersebut diatas mengalami perbaikan dengan membandingkan
hasil pengukuran sebelum dan sesudah pelatihan. Semakin
tinggi tingkat perbaikannya, dikatakan semakin berhasil pula
suatu program pelatihan.
139
rekan-rekan kerjanya. Jadi, yang ingin diketahui dalam evaluasi
ini adalah seberapa jauh perubahan sikap mental (attitude),
perbaikan pengetahuan, dan atau penambahan ketrampilan
peserta membawa pengaruh langsung terhadap kinerja peserta
ketika kembali ke lingkungan kerjanya. Apakah perubahan
sikap mental (attitude), perbaikan pengetahuan, dan atau
penambahan ketrampilan peserta itu diimplementasikan dalam
lingkungan kerja peserta ataukah dibiarkan berkarat dalam diri
peserta tanpa pernah diimplementasikan.
140
disarankan juga evaluasi ini dilakukan lebih dari satu kali
dalam rentang waktu yang cukup untuk mengetahui apakah
perubahan perilaku itu bersifat sementara ataukah permanen.
141
untuk mengetahui dampak pelatihan terhadap produktifitas
organisasi. Karena kebanyakan materi program pelatihan tidak
berdampak secara langsung terhadap result organisasi, maka
evaluasi di tahap ini membutuhkan jeda waktu yang lebih lama
dibanding evaluasi terhadap perilaku. Apalagi biasanya
perhitungan terhadap aspek-aspek result suatu organisasi
dilakukan dalam periode laporan tahunan. Oleh karenanya
evaluasi di tahap ini membutuhkan rentang waktu yang lebih
lama dalam pelaksanaannya.
142
yang dikeluarkan oleh perusahaan untuk suatu program
pelatihan.
143
Analisis di tingkat ini berusaha mengetahui apa tujuan yang
ingin dicapai oleh perusahaan dan juga apakah ada cukup
“buy-in” di dalam organisasi untuk memastikan bahwa
perbaikan yang ingin dicapai dapat terjadi. Dalam contoh kasus
ini, tujuan utama perusahaan di bidang kesehatan dan
keselamatan kerja adalah untuk memastikan adanya
lingkungan kerja yang aman dan sehat sehingga karyawan
dapat bekerja dengan kondisi kesehatan fisik maupun mental
yang optimal. Tujuan utama ini didasari oleh beberapa
pemikiran, antara lain sebagai berikut: (1) Legalitas: Untuk
memenuhi tuntutan legal dan menghindarkan adanya sanksi
dari pemerintah jika perusahaan tidak memenuhi standar
keamanan dan kesehatan di tempat kerja; (2) Efisiensi: Untuk
mengurangi biaya yang terbuang karena adanya kecelakaan
atau kondisi lain yang tidak sehat/aman di tempat kerja.
Tingkat kecelakaan yang tinggi juga bisa mempengaruhi
keadaan SDM secara umum, misalnya mempengaruhi
banyaknya karyawan yang mengundurkan diri dari
perusahaan, absen, atau mengajukan protes.
144
apakah yang dibutuhkan? (3) Apakah sikap karyawan di
tempat kerja dalam hal kesehatan dan keselamatan kerja perlu
diubah? (4) Hal-hal apa sajakah yang bisa menimbulkan resiko
kesehatan/keselamatan di tempat kerja? Bagaimana cara
perusahaan mengontrol resiko tersebut?Apakah ada langkah-
langkah yang perlu diketahui semua karyawan dalam rangka
melakukan kontrol tersebut?
145
pekerjaan (yang pada akhirnya akan mempengaruhi karir
seperti kenaikan gaji atau promosi). Data SDM yang sudah ada
mengenai pelatihan yang telah diikuti karyawan sebelumnya
dapat digabungkan dengan hasil survei untuk mengetahui
kesenjangan antara target perusahaan (dalam kasus ini di
bidang kesehatan dan keselamatan kerja) dengan KSA
karyawan yang telah dicapai selama ini. Pertanyaan yang bisa
diajukan di tingkatan individu antara lain: (1) Ketrampilan dan
pengetahuan apa saja yang sudah dimiliki karyawan? (2)
Pelatihan apa saja yang sudah diikuti masing-masing
karyawan? (3) Cara pelatihan seperti apa yang paling dapat
memenuhi kebutuhan individu karyawan? Pelatihan di ruang
kelas, pelatihan di tempat kerja, atau metode lain? Apakah
lebih baik menggunakan pelatih dari luar atau dari dalam
perusahaan? Apakah pelatihan sebaiknya dilakukan di dalam
atau di luar jam kerja? (4) Apakah ada karyawan yang
mempunyai keterbatasan bahasa sehingga pelatihan perlu
dilakukan dalam bahasa tertentu?
146
memberikan waktu istirahat yang lebih sering sehingga
karyawan tidak mengalami kecelakaan karena kelelahan.
Contoh lain adalah dengan memanfaatkan ilmu
ergonomik untuk mendesain lingkungan kerja yang dapat
meminimalkan resiko dalam hal kesehatan dan
keselamatan kerja, misalnya mendesain sabuk pengaman
yang mudah dan nyaman digunakan sehingga karyawan
mau dan mampu menggunakannya tanpa perlu pelatihan
terlebih dahulu.
• Merekrut karyawan yang tepat: Sebagai salah satu
alternatif, perusahaan dapat merekrut calon karyawan
yang sudah pernah menjalani pelatihan di bidang
kesehatan dan keselamatan kerja sehingga perusahaan
dapat menghemat biaya pelatihan (dengan asumsi calon
karyawan tersebut tetap memenuhi persyaratan lainnya).
• Alat bantu untuk karyawan baru: Untuk membantu
karyawan baru mempelajari prosedur keselamatan kerja
yang diterapkan perusahaan, mereka bisa diberi alat bantu
berupa checklist atau instruksi yang direkam secara audio
berisi hal-hal yang wajib dilaksanakan untuk memastikan
keselamatan di tempat kerja, misalnya checklist untuk
petugas kebersihan dalam gedung hotel antara lain terdiri
dari: memasang tanda “licin” ketika mengepel lantai
supaya tamu tidak terpeleset, mengenakan sarung tangan
karet ketika menggunakan bahan kimia yang keras untuk
membersihkan kamar mandi, dst.
• Menciptakan/memodifikasi kebijaksan perusahaan:
Untuk memastikan karyawan mengikuti prosedur
keselamatan kerja yang berkaitan dengan kewajiban
hukum (misalnya mengenakan sabuk pengaman bagi
supir perusahaan), perusahaan dapat
menciptakan/memodifikasi kebijakan perusahaan yang
terkait sehingga karyawan lebih termotivasi untuk
menaati hukum tersebut.
147
Untuk menentukan apakah pelatihan atau salah satu alternatif
di atas akan lebih efektif dari segi biaya, perusahaan dapat
melakukan langkah-langkah berikut ini:
• Menghitung biaya serta keuntungan yang didapatkan dari
pelatihan
• Menghitung biaya serta keuntungan yang didapatkan dari
alternatif yang lain dan membandingkannya dengan
biaya/keuntungan dari pelatihan
148
hanya dapat melaksanakan 50% dari prosedur yang
diminta, sementara pelatihan dapat memastikan bahwa
95% para manajer dapat melaksanakannya. Mengingat
sangsi dari pemerintah cukup tinggi jika perusahaan tidak
menaati undang-undang baru ini, keuntungan untuk
mengadakan pelatihan akan terasa jauh lebih tinggi
dibandingan dengan alternatif lainnya.
149
• Tujuan pelatihan: Para peserta pelatihan dapat menjadi
kompeten dalam memberikan P3K di tempat kerja.
Kompetensi ini mencakup kemampuan untuk: (a)
menganalisis apakah suatu keadaan dapat dianggap
darurat; (b) memanggil pertolongan termasuk ambulans;
(c) memeriksa orang sakit atau luka; (d) mencatat
pengobatan P3K yang diberikan pada pasien; (e)
menggunakan isi kotak P3K; (f) melakukan prosedur CPR
(cardio-pulmonary resuscitation); (g) mengenali berbagai
penyakit dan kecelakaan yang mungkin terjadi di tempat
kerja serta mengetahui P3K yang dapat dilakukan untuk
masing-masing kasus.
• Metode pelatihan: Pelatihan di ruang kelas dengan
fasilitator dari luar perusahaan (fasilitator ini haruslah
merupakan pengajar P3K yang disetujui oleh pemerintah).
• Lamanya pelatihan: 18 jam.
• Peserta: 1 karyawan per 50 orang karyawan dengan
maksimum 15 peserta per sesi pelatihan.
• Apakah perlu pelatihan ulang bagi peserta yang telah
lulus: Ya (setiap 3 tahun sekali).
150
Salah satu area yang memenuhi criteria di atas adalah pelatihan
mengenai Bahaya-Bahaya Kesehatan/Keselamatan di Tempat
Kerja. Dalam kasus ini, pelatihan dapat dilakukan dengan
struktur sebagai berikut:
• Tujuan pelatihan: Para peserta dapat mengenali bahaya-
bahaya kesehatan/keselamatan di tempat kerja (seperti
bahan kimia, listrik, kegiatan mengangkat barang berat,
terpeleset/jatuh, suara yang terlalu keras, dan bekerja di
tempat tinggi) serta meminimalkan efek negative dari
bahaya-bahaya tersebut dengan cara menerapkan
prosedur keselamatan. Kompetensi ini mencakup
kemampuan untuk: (a) mengenali berbagai bahaya
kesehatan/keselamatan di tempat kerja; (b) melaporkan
adanya bahaya-bahaya tersebut; (c) menjelaskan simbol-
simbol yang terkait dengan kesehatan/keselamatan kerja
(misalnya simbol aliran listrik tegangan tinggi); (d)
mengikuti prosedur kerja untuk meminimalkan resiko
yang ada (termasuk cara mengangkat beban berat,
mengatasi suara yang terlalu keras, bahaya bahan kimia,
penggunaan alat-alat listrik, dan bahaya jatuh dari tempat
tinggi) sehingga setiap karyawan dapat menjalankan
pekerjaannya dengan tetap menjaga kesehatan serta
keselamatan di tempat kerja; (e) mengikuti prosedur
untuk menggunakan, menyimpan, serta merawat alat-alat
pelindung pribadi (seperti sarung tangan karet untuk
menghindari bahaya bahan kimia).
• Metode pelatihan: Belajar mandiri dengan materi
pelajaran disediakan melalui intranet perusahaan.
Karyawan diberikan akses log in dan mereka wajib
menyelesaikan pelatihan ini dalam jangka waktu tertentu
(misalnya: 1 bulan).
• Lamanya pelatihan: 4 jam (yang harus diselesaikan dalam
jangka waktu yang telah ditetapkan tadi).
• Peserta: Semua karyawan.
151
• Apakah perlu pelatihan ulang bagi peserta yang telah
lulus: Ya (setiap 3 tahun sekali).
152
reaksi peserta, tapi juga mengetahui sejauh mana peserta
telah belajar dari pelatihan yang dilakukan (Tingkatan
Pembelajaran).
153
bahaya-bahaya yang paling utama di tempat kerja mereka,
menjelaskan arti simbol tertentu yang terkait dengan
kesehatan dan keselamatan kerja, serta menyebutkan alat
pelindung yang harus digunakan dalam situasi tertentu.
• Untuk keseluruhan program pelatihan: survei yang
digunakan untuk Tingkatan Reaksi dapat
mengikutsertakan beberapa pertanyaan umum mengenai
pengetahuan umum karyawan di bidang kesehatan dan
keselamatan kerja.
154
Keempat, Tingkatan Organisasi.
155
psikologis bisa dicapai melalui kegiatan role play.
Fasilitator dapat menciptakan skenario keadaan darurat
dan meminta peserta untuk berlatih menjadi petugas P3K
dalam situasi tersebut.
• Menyediakan alat bantu: Semua karyawan sebaiknya
diberi akses untuk memperoleh bahan bacaan yang
relevan dengan topik kesehatan dan keselamatan kerja.
Misalnya, perusahaan dapat menyediakan brosur bagi
seluruh karyawan, atau menyediakan materi secara online
di intranet perusahaan.
12.9. Kesimpulan
156
disebabkan oleh demikian banyak faktor. Namun dengan
beberapa modifikasi di sana-sini, kekurangan itu bisa kita
minimalisir sehingga nantinya bisa kita peroleh informasi yang
benar-benar berkualitas.
157
Daftar Pustaka
158
Donald Kirkpatrick (1998), Evaluation Training Programs: The
Four Level, Edisi II, Berrett-Koehler Publisher Inc., San
Fransisco.
Donald Kirkpatrick (2005), Kirkpatrick's Training Evaluation
Model, 23 Sepember 2005.
Fetterman, David M. (ed.) (1988), Qualitative Approaches to
Evaluation in Education: The Silent Scientific
Revolution, Praeger, New York.
Gary R. Morrison, Steven M. Ross, Jerrold E Kemp (2001),
Designing Effective Instruction, Third Edition John
Wiley and Sons, Inc.
Hamid Hasan (2008) Evaluasi Kurikulum, Rosda, Bandung.
Hamid Hasan (2008), Evaluasi Kurikulum, Remaja Rosdakarya,
Bandung.
Jhon M. Owen (2005), Program Evaluation, Forms And
Approach, Allen and Unwin Pty Ltd, St. Leonards -
NSW 2065.
Jody L. Fitzpatrick, James R. Sanders dan Blaine R. Worthen
(2004), Program Evaluation Alternative Approaches
And Practical Guidelines, Third Edition, Pearson
Education, New York.
John H. Pryor (2008), Advanced Quantitative Methods in
Education Research Program, Cooperative Institutional
Research Program, UCLA, Los Angeles.
John M. Owen (2006), Program Evaluation: Forms And
Approaches, Allen and Unwin, Canberra.
Malcoln L. Fleming (1981), Intructional Massage Design,
Educational Technology Publications, Inc., Englewood
Cliffs, New Jersey.
Michael Quinn Patton (2006), Metode Evaluasi Kualitatif,
Pustaka Pelajar, Yogyakarta.
Micheal Scriven (1999), The Nature of Evaluation, dalam
Practical, Assessment, Research and Evaluation, 6 (11).
159
Micheal Scriven (1999), The Nature of Evaluation, dalam
Practical, Assessment, Research and Evaluation, 6 (12).
Muzayana Sutikno (2009), Evaluasi Program, Pustaka Grafika,
Jakarta.
Muzayanah Sutikno (2007), Evaluasi Program Pendidikan,
Jakarta.
N. C. Gysbers dan P. Henderson (2006), Developing and
Managing Your School Guidance and Counseling
Program, Edisi IV, American Counseling Association,
Alexandria-Virginia.
N.C. Gysbers dan P. Henderson (2006), Developing and
Managing Your School Guidance and Counseling
Program, Edisi IV, American Counseling Association,
Alexandria.
Nana Sudjana dan Ibrahim (2001), Penelitian dan Penilaian
Pendidikan, Sinar Baru Algensindo, Bandung.
Ngalim Purwanto (1983), Prinsip-Prinsip dan Teknik Evaluasi
Pengjaran, Edisi Keempat, Penerbit Grafika, Jakarta.
Rahmad Qomari (2008), Model-model Evaluasi Pendidikan,
Jurnal Pemikiran Alternatif Pendidikan, INSANIA, Vol.
13, No. 2, Mei-Ags 2008.
Roger Kauman, F.W. English (1979), Needs Assessment,
Concept, and Application, Englewood Clift, New Jersey.
S. Eko Putro Widoyoko (2009), Evaluasi Program Pembelajaran,
Panduan Praktis Bagi Pendidik dan Calon Pendidik,
Pustaka Pelajar, Jogjakarta.
Said Hamid Hasan (1988), Evaluasi Kurikulum, Departemen
Pendidikan dan Kebudayaan, Jakarta.
Stufflebeam (1986), Systematic Evaluation, Kluwer Nijhoff
Publishing, New Jersey.
Suharsimi Arikunto dan Cepi Safrudin Abdul Jabar (2009),
Evaluasi Program Pendidikan, Edisi II, Bumi Aksara,
Jakarta.
160
Suharsimi Arikunto (1989), Dasar-dasar Evaluasi Pendidikan,
Bina Aksara, Jakarta.
Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar (2008),
Evaluasi Program Pendidikan, Pedoman Teoritis Praktis
Bagi Mahasiswa dan Praktisi Pendidikan, Bumi Aksara,
Jakarta.
Sukardi, 2009. Evaluasi Pendidikan: Prinsip dan
Operasionalnya. Bumi Aksara, Jakarta.
Tayibnapis dan Farida Yusuf (2008), Evaluasi Program dan
Instrumen Evaluasi untuk Program Pendidikan dan
Penelitian, Rineka Cipta, Jakarta.
Walter Dick dan Carey Lou (1990), The Systematic Design of
Instruction, Edisi III, Includes Bibliographical
References, Walter Dick and Lou Carey Publishing.
Widoyoko E (2009), Evaluasi Program Pembelajaran, Pustaka
Pelajar, Jogyakarta.
Zaenal Arifin (2009), Evaluasi Pembelajaran, Remaja
Rosdakarya, Bandung.
161
Biodata Penulis
162
Indonesia (Gramedia/ Elexmedia, 2006), Manajemen
Pemberdayaan (Gramedia/Elexmedia, 2007), Pengantar
Metode Penelitian (Aksara, 2007), Manajemen Privatisasi
(Gramedia/Elexmedia, 2008), Membumikan MDGs (IPR, 2008),
Pendekatan Kewilayahan Dalam Perencanaan Pembangunan
(IPR, 2008), Pendekatan Sektoral Dalam Perencanaan
Pembangunan (IPR, 2009), Konsep dan Pendekatan
Pembangunan (IPR, 2009), Perencanaan dan Penganggaran
Berbasis Kinerja (IPR, 2010), Model Logika Untuk Evaluasi
Pembangunan (IPR, 2010), dan Metode Evaluasi Kinerja (IPR,
2010).
163
164