Strategi Evaluasi IDPS

ii
Strategi Evaluasi
Pilihan dan Pendekatan
Sanksi Pelanggaran Pasal 72
Undang-Undang Nomor 19 Tahun 2002
Tentang HAK CIPTA
1. Barangsiapa dengan sengaja dan tanpa hak melakukan perbuatan

sebagaimana dimaksud dalam Pasal 2 ayat (1) atau Pasal 49 ayat
(1) dan ayat (2) dipidana dengan pidana penjara masing-masing
paling singkat 1 (satu) bulan dan/atau denda paling sedikit
Rp1.000.000,00 (satu juta rupiah), atau pidana penjara paling lama
7 (tujuh) tahun dan/atau denda paling banyak Rp5.000.000.000,00
(lima miliar rupiah).
2. Barangsiapa dengan sengaja menyiarkan, memamerkan,

mengedarkan, atau menjual kepada umum suatu Ciptaan atau
barang hasil pelanggaran Hak Cipta atau Hak Terkait
sebagaimana dimaksud pada ayat (1) dipidana dengan pidana
penjara paling lama 5 (lima) tahun dan/atau denda paling
banyak Rp500.000.000,00 (lima ratus juta rupiah).
ii
Strategi Evaluasi
Pilihan dan Pendekatan
Randy R. Wrihatnolo
Institute for Development and Policy Study
iii
Strategi Evaluasi: Pilihan dan Pendekatan
Oleh: Randy R. Wrihatnolo
(c) 2011 Randy R. Wrihatnolo
Hak Cipta dilindungi oleh Undang-Undang
Diterbitkan pertama kali oleh:
Institute for Development and Policy Study
April 2011
iv
Daftar Isi
Daftar Isi v
Kata Pengantar xi
Bab 1 Pendahuluan 1
Bab 2 Model CIPP 3

2.1. Pengantar 3
2.2. Konsep Model Evaluasi CIPP (Context,
Input, Process, Product) 4
2.2.1. Context Evaluation to Serve Planning
Decision 5
2.2.2. Input Evaluation, Structuring Decision 5
2.2.3. Process Evaluation, To Serve
Omplementing Decision 6
2.2.4. Product Evaluation, To Serve Recycling
Decision 8
2.3. Kesimpulan 9
Bab 3 Model CSE-UCLA 17

3.1. Pengantar 17
3.2. Konsep Model Evaluasi Program CSE-
UCLA 18
3.2.1. Needs Assessment 20
3.2.2. Program Planning 21
3.2.3. Formative Evaluation 21
3.2.4. Summative Evaluation 21
3.3. Ketepatan Penentuan Model Evaluasi CSE-
UCLA 23
v
3.3.1. Program Pemrosesan 23
3.3.2. Program Pembelajaran 24
3.3.3. Program Kepramukaan 24
3.3.4. Program Pelayanan 24
3.3.5. Program Umum 25
3.4. Keunggulan dan Kelemahan Model
Evaluasi CSE-UCLA 25
3.5. Kesimpulan 25
Bab 4 Model Formatif dan Sumatif 27

4.1. Pengantar 27
4.2. Evaluasi Formatif 28
4.2.1. Review Ahli (Expert Review) 29
4.2.2. Evaluasi Orang Per Orang (One-To-
One Evaluation) 30
4.2.3. Evaluasi Kelompok Kecil (Small
Group) 32
4.2.4. Uji Lapangan (Field Test) 32
4.3. Evaluasi Sumatif 33
4.4. Kesimpulan 34
Bab 5 Model Responsif 37

5.1. Pengantar 37
5.2. Fokus Evaluasi 38
5.3. Konsep Model Evaluasi Responsif 40
5.4. Fase-fase Proses Evaluasi Responsif 51
5.5. Kesimpulan 52
Bab 6 Model “Tyler” (Black Box Tyler) 53

6.1. Pengantar 53
6.2. Konsep Model Black Box Tyler 54
6.2.1. Tujuan Model Tyler 56
6.2.2. Prosedur Penggunaan Evaluasi 57
vi
Program Model Tyler
6.3. Kesimpulan 60
Bab 7 Model Iluminatif 63

7.1. Pengantar 63
7.2. Konsep Evaluasi Illuminatif 65
7.3. Metode Evaluasi Illuminatif 69
7.4. Keunggulan dan Kelemahan Evaluasi
Model Illuminatif 73
7.4.1. Keunggulan Evaluasi Model
Illuminatif 73
7.4.2. Keterbatasan Evaluasi Model
Illuminatif 74
7.4.3. Kontribusi Model Illuminatif 74
7.5. Kesimpulan 74
Bab 8 Model Berorientasi Tujuan (Goal Oriented

Evaluation) 77
8.1. Pengantar 77
8.2. Konsep Goal Oriented Evaluation Model 77
8.3. Langkah-Langkah Goal Oriented Evaluation
Model 89
8.4. Contoh Goal Oriented Evaluation Model 91
8.4.1. Kebutuhan Untuk Menentukan
Tujuan Program Yang Aktual 91
8.4.2. Evaluasi dari Community Agency
Human Development Program 92
8.5. Kesimpulan 93
Bab 9 Model Kaufman (Need Assesment Evaluation) 95

9.1. Pengantar 95
9.2. Konsep Need Assesment Evaluation 97
9.3. Langkah-langkah Need Assesment 98
9.3.1. Pengukuran Obyektif 99
vii
9.3.2. Pengukuran Subyektif 99
9.4. Desain Need Assesment dalam PBM 100
9.5. Kesimpulan 103
Bab 10 Model “Stake” 105

10.1. Pengantar 105
10.2. Konsep Evaluasi Countenance 107
10.3. Cara Kerja Model Evaluasi Countenance 110
10.4. Kesimpulan 114
Bab 11 Model Formatif - Sumatif Untuk Program Proses

dan Program Pelayanan 117
11.1. Pengantar 117
11.2. Jenis-Jenis Model Evaluasi Yang
Dikembangan Scriven 119
11.2.1. Goal Free Evaluation 119
11.2.2. Evaluasi Formatif-Summatif 122
11.2.3. Evaluasi Formatif 123
11.2.4. Teknik Evaluasi Formatif 125
11.3. Model Evaluasi Formatif-Sumatif Untuk
Program Proses dan Program Pelayanan 130
11.3.1. Model Formative-Summative
Evaluation untuk Program
Pemrosesan 130
11.3.2. Model Evaluasi Formative dan
Sumative Untuk Program Pelayanan 131
11.4. Prasyarat Evaluator Dalam Evaluasi 132
11.5. Kemampuan Metodologis 133
Bab 12 Model Kirkpatrick 135

12.1. Pengantar 135
12.2. Tahap Evaluasi Model Kirkpatrick 136
viii
12.2.1. Reaction (Aksi Kembali) 137
12.2.2. Learning (Pembelajaran) 138
12.2.3. Behaviour (Perilaku) 139
12.2.4. Result (Hasil) 141
12.3. Evaluasi Model Kirkpatrick Plus 142
12.4. Contoh Penerapan Evaluasi Kirkpatrick 143
12.4.1. Merancang Pelatihan 143
12.4.2. Training Need Analysis 143
12.5. Alternatif Solusi 146
12.6. Metode Pelatihan 149
12.6.1. Pelatihan di Ruang Kelas 149
12.6.2. Belajar Mandiri 150
12.7. Evaluasi Pelatihan 152
12.8. Penerapan Hasil Pelatihan 155
Daftar Pustaka 158
ix
x
Prolog
Evaluasi merupakan bagian dari proses manajemen dan

merupakan salah satu fungsi dalam siklus manajemen. Evaluasi
adalah suatu usaha untuk mengukur dan memberi nilai secara
obyektif pencapaian hasil-hasil yang telah direncanakan.
Evaluasi merupakan suatu proses untuk menjelaskan secara
sistematis untuk mencapai tujuan dengan efisien dan efektif,
serta untuk mengetahui dampak dari suatu kegiatan dan juga
membantu pengambilan keputusan untuk perbaikan satu atau
beberapa aspek program perencanaan yang akan datang.
Evaluasi merupakan instrumen bagi pengawasan manajerial
untuk mendapat hasil yang sesungguhnya dibandingkan
dengan hasil yang diharapkan.
Berdasarkan konsep di atas, maka hasil evaluasi apabila

difokuskan pada suatu usaha tertentu dapat menyediakan
informasi yang penting untuk membuat keputusan, serta dapat
menilai manfaat atau kegunaan tertentu dari suatu kebijakan.
Evaluasi sebagai salah satu fungsi manajemen berurusan dan
berusaha untuk mempertanyakan efektivitas dan efisiensi
pelaksanaan dari suatu rencana sekaligus mengukur seobyektif
mungkin hasil-hasil pelaksanaan itu dengan ukuran-ukuran
yang dapat diterima.
Berbagai model evaluasi tersedia dan dapat disesuaikan

dengan kebutuhan dan tujuan evaluasi itu sendiri. Buku ini
menyediakan pemahaman konsep dan cara tentang strategi
evaluasi, dan termasuk memahami berbagai pilihan dan
pendekatan yang ada serta memberikan pemahaman
xi
bagaimana evaluasi-evaluasi itu dapat dilakukan dalam
berbagai situasi, pelaku, dan konteks yang berbeda.
Semoga bermanfaat.
Jakarta, April 2011
Randy R. Wrihatnolo
xii
Bab 1
Pendahuluan
Para evaluator pembangunan seringkali menemui

permasalahan untuk memahami substansi dan konteks dalam
serangkaian kegiatan yang dilaksanakan dalam suatu program.
Salah satu contohnya adalah ketika evaluator ingin
menentukan apakah pelaksanaan program pendidikan yang
dijalankan dengan merujuk pada suatu kurikulum pendidikan
berbasis kompetensi telah memperolah hasil yang menjadi
harapan dalam kurikulum tersebut. Dalam pelaksanaannya,
kegiatan pendidikan sering mengalami banyak masalah yang
muncul di antaranya sistem pendidikan yang sering berubah,
kurikulum yang tidak sesuai dengan kebutuhan kurangnya
sumberdaya manusia yang mempunyai kompetensi sesuai
dengan bidangnya dan lain sebagainya. Permasalahan
demikian sering muncul tetapi kurang evaluasi yang efektif.
Evaluasi digunakan untuk mengetahui kelebihan dan
kekurangan program-program yang telah dilakukan. Kegiatan
ini dapat memberikan pendekatan yang lebih banyak dalam
memberikan informasi kepada pendidikan untuk membantu
perbaikan dan pengembangan kebijakan. Untuk itulah suatu
evaluasi yang menerapkan pendekatan kontekstual diperlukan.
Pendekatan kontekstual mempercayai asumsi bahwa substansi

suatu program merupakan sistem yang terdiri atas beberapa
unsur, yaitu masukan, proses dan keluaran/hasil; maka
terdapat tiga jenis evaluasi sesuai dengan sasaran evaluasi,
yaitu evaluasi masukan, proses dan keluaran/hasil. Evaluasi
masukan menekankan pada evaluasi karakteristik para
1
penerima manfaat program, kelengkapan dan keadaan sarana
dan prasarana keprograman, karakteristik dan kesiapan
pelaksana program, pedoman dan materi keprograman,
strategi keprograman yang sesuai dengan sasaran program,
serta keadaan lingkungan dimana program berlangsung.
Evaluasi proses program menekankan pada evalusi

pengelolaan program yang dilaksanakan oleh para pelaksana
program meliputi keefektifan strategi program yang
dilaksanakan, keefektifan media program, cara mengajar yang
dilaksanakan, dan minat, sikap serta cara pemanfaat program.
Evaluasi hasil program menggunakan tes untuk melakukan
pengukuran kemanfaatan program sebagai prestasi pencapaian
program, dalam hal ini adalah target-target yang dicatat oleh
serangkaian indicator program.
Terkait dengan ketiga jenis evaluasi program tersebut, dalam

praktek pelaksanaan program secara umum pelaksanaan
evaluasi program menekankan pada evaluasi proses
pembelajaran atau evaluasi manajerial, dan evaluasi hasil
program atau evaluasi substansial. Hal ini didasarkan pada
pemikiran bahwa dalam pelaksanaan program kedua jenis
evaluasi tersebut merupakan komponen sistem program yang
sangat penting. Evaluasi kedua jenis komponen yang dapat
dipergunakan untuk mengetahui kekuatan dan kelemahan
pelaksanaan dan hasil program. Selanjutnya dalam
pelaksanaan evaluasi berbasis program dapat dikenali
beberapa model evaluasi seperti (1) Model Evaluasi CIPP
(Context, Input, Process and Product); (2) Evaluasi Model
Kirkpatrick; (3) Evaluasi Model Wheel dari Beebe; (4) Evaluasi
Model Provus (Discrepancy Model); dan (5) Evaluasi Model Stake
(Countenance Model) dan lain-lain. Dalam buku ini akan dibahas
beberapa model.
2
Bab 2
Model CIPP
2.1. Pengantar
Model CIPP –yang merupakan kependekakan dari Context,

Input, Process, and Product -- mempunyai tujuan mengetahui
pencapaian tujuan program dengan langkah mengetahui
keterlaksanaan kegiatan program, karena evaluator program
ingin mengetahui bagian mana dari komponen dan
subkomponen program yang belum terlaksana dan apa
sebabnya.Oleh karena itu sebelum memulai dengan langkah
evaluasi, evaluator perlu memperjelas dirinya dengan apa
tujuan program yang akan dievaluasi.
Hasil evaluasi CIPP dapat ditujukan sebagai bahan

pertimbangan untuk mensupervisi program, mengadakan
peninjauan kembali atas pelaksanaan program, memperbaiki
program, serta memberikan pembinaan pada pelaksana
program. Langkah awal dalam pelaksanaan evaluasi adalah
mengumpulkan data yang tepat agar dapat dilanjutkan dengan
pemberian pembinaan yang tepat pula. Kebijakan yang
berlangsung saat ini dapat dikatakan sama dengan evaluasi
program, tetapi sasarannya ditekankan pada kegiatan dalam
program. Pencapaian program adalah obyek pengamatan
utama dalam evaluasi program.
Manfaat dilaksanakannya evaluasi program adalah: (1)

Memperoleh pemahaman pelaksanaan dan hasil pelaksanaan
program yang telah berlangsung/dilaksanakan pelaksana
program, (2) Membuat keputusan berkenaan dengan
3
pelaksanaan dan hasil pelaksanaan program, dan (3)
Meningkatkan kualitas proses dan hasil pelaksanaan program
dalam rangka upaya meningkatkan kualitas keluaran (output).
2.2. Konsep Model Evaluasi CIPP (Context, Input, Process,

Product)
Dalam evaluasi pelaksanaan program para evaluator dapat

menggunakan model evaluasi CIPP. Model evaluasi ini yang
paling banyak dikenal dan diterapkan oleh evaluator.
Stufflebeam (1969,1971,1981, Stufflebeam dan Shinkfield, 1985)
adalah ahli yang mengusulkan pendekatan yang berorientasi
kepada pemegang keputusan (a decision oriented evaluation
approach structured) untuk menolong administrator dalam
membuat keputusan. Ia merumuskan evaluasi sebagai suatu
proses menggambarkan, memperoleh, dan menyediakan
informasi yang berguna untuk menilai alternatif keputusan
(Stufflebeam, 1973:127). Dalam keputusannya kemudian
membagi evaluasi menjadi empat macam yaitu:
• Evaluasi konteks melayani keputusan perencanaan, yaitu
membantu merencanakan pilihan keputusan, menentukan
kebutuhan yang akan dicapai dan merumuskan tujuan
program.
• Evaluasi masukan untuk keputusan strukturisasi yaitu
menolong mengatur keputusan menentukan sumber-
sumber yang tersedia, alternatif-alternatif yang diambil,
rencana dan strategi untuk mencapai kebutuhan, serta
prosedur kerja untuk mencapai tujuan yang dimaksud.
• Evaluasi proses melayani keputusan implementasi, yaitu
membantu keputusan sampai sejauh mana program telah
dilaksanakan.
4
• Evaluasi produk untuk melayani daur ulang keputusan.
Keunggulan model CIPP merupakan system kerja yang
dinamis. 1
2.2.1. Context Evaluation to Serve Planning Decision
Konteks evaluasi ini membantu merencanakan keputusan,

menentukan kebutuhan yang akan dicapai oleh program, dan
merumuskan tujuan program. Pada tahun 1980 Sax
mendefinisikan evaluasi konteks sebagai ”...the delineation and
specification of project’s environment, its unmet, the population and
sample individual to se served, and the project objectives. Contect
evaluation provides a rationale for justifying a particular type of
program intervention”. Evaluasi konteks merupakan
penggambaran dan spesifikasi tentang lingkungan program,
kebutuhan yang belum dipenuhi, karakteristik populasi dan
sampel dari individu yang dilayani dan tujuan program.
Evaluasi konteks menurut Suharsimi (2008:46) dilakukan untuk
menjawab pertanyaan: (a) Kebutuhan apa yang belum
dipenuhi oleh kegiatan program,misalnya jenis makanan dan
siswa yang belum menerima?; (b) Tujuan pengembangan
manakah yang berhubungan dengan pemenuhan kebutuhan,
misalnya peningkatan kesehatan dan prestasi siswa karena
adanya makanan tambahan?; dan (c) Tujuan manakah yang
paling mudah dicapai, misalnya pemerataan makanan,
ketepatan penyediaan makanan?
2.2.2. Input Evaluation, Structuring Decision
Tahap kedua dalam evaluasi CIPP adalah evaluasi masukan.

Maksud evaluasi masukan adalah kemampuan awal siswa dan
sekolah dalam menunjang PMTAS. Antara lain kemampuan
sekolah dalam menyediakan petugas yang tepat untuk
1 Affifuddin (2008), Teori Evaluasi Dengan Pendekatan CIPP, Wordpres, Jakarta.
5
mengatur menu yang andal, ahli kesehatan yang berkualitas,
dan sebagainya. Evaluasi ini menolong mengatur keputusan,
menentukan sumber-sumber yang ada, alternatif apa yang
diambil, apa rencana dan strategi untuk mencapai kebutuhan.
Bagaimana prosedur kerja untuk mencapainya.
Pertanyaan-pertanyaan yang diajukan untuk program

pendidikan yang berkenaan dengan masukan antara lain: (a)
Apakah makanan yang diberikan kepada siswa berdampak
jelas pada perkembangan siswa?; (b) Berapa orang siswa yang
menerima dengan senang hati atas makanan tambahan itu?; (c)
Bagaimana reaksi siswa terhadap pelajaran setelah menerima
makanan tambahan?; dan (d) Seberapa tinggi kenaikan nilai
siswa setelah menerima makanan tambahan?
2.2.3. Process Evaluation, To Serve Omplementing Decision
Evaluasi proses merupakan upaya untuk melihat sejauh mana

aplikasi dari sebuah rencana program terlaksana di lapangan.
Salah satu tujuannya adalah untuk memberikan timbal balik
kepada para manager dan staf tentang berapa banyak kegiatan
pada program yang ada di dalam jadwal yang telah terlaksana
dilihat dari rencana kegiatan sebelumnya dengan
menggunakan sumber-sumber yang baik dan cara yang
efisien. 2 Tujuan yang lain adalah memberikan bimbingan
dalam memodifikasi rencana yang dibutuhkan, karena tidak
semua aspek dari sebuah rencana dapat ditentukan
kemajuannya dan juga Karena beberapa keputusan akan
dibuktikan setelah itu namun tidak semua harus
mengetahuinya. Tujuan selanjutnya adalah untuk menilai
secara berkala bagaimana para pelaksana program menerima
dan mampu membawa peranannya masing-masing. Dari
2 Stufflebeam (1986), Systematic Evaluation, Kluwer Nijhoff Publishing, New

Jersey.
6
pernyataan diatas maka dapat disimpulkan bahwa evaluasi
proses harus memiliki rekaman tentang program dan
pelaksanaannya, bagaimana membandingkan apa yang telah
direncanakan , dan bagaimana para pengamat dan pelaksana
meihat usaha yang telah dilakukan.
Evaluasi proses kadang-kadang disebut juga dengan istilah

implementasi program. Menggunakan istilah proses
dimaksudkan untuk memperkuat pengertian program sebagai
suatu proses. Istilah evaluasi proses dianggap lebih memberi
kedudukan yang sama antara dimensi program sebagai ide,
rencana, hasil dan program sebagai suatu kegiatan. Evaluasi
proses membuat perhatian evaluator diarahkan tidak saja
kepada apa yang terjadi dengan program sebagai suatu
kegiatan, tetapi evaluasi telah pula mencoba melihat mengenai
berbagai faktr yang berhubungan dengan pelaksanaan program
sebagai kegiatan. Evaluasi terhadap kepemimpinan kepala
sekolah, pengetahuan dan sikap serta kegiatan guru, faktor
siswa, dan peralatan belajar dianggap sebagai fokus yang
penting. Demikian pula interaksi yang terjadi dalam proses
pembelajaran.
Worthen dan Sanders (1981) menyebutkan bahwa evaluasi

proses menekankan pada tiga tujuan: (1) Mendeteksi atau
memprediksi rancangan prosedur atau rancangan
implementasi selama tahap implementasi; (2) Menyediakan
informasi untuk keputusan program; dan (3) Sebagai rekaman
atau arsip prosedur yang terjadi. Evaluasi proses meliputi
koleksi data penilaian yang telah ditentukan dan diterapkan
dalam praktik pelaksanaan program. Pada dasarnya evaluasi
proses untuk mengetahui sampai sejauh mana rencana telah
diterapkan dan komponen apa yang perlu diperbaiki.
7
Evaluasi proses dalam model CIPP menunjuk pada “apa”
(what) kegiatan yang dilakukan dalam program, “siapa” (who)
orang yang ditunjuk sebagai penanggungjawab program,
“kapan” (when) kegiatan akan selesai. 3 Dalam model CIPP,
evaluasi proses diarahkan pada seberapa jauh kegiatan yang
dilaksanakan di dalam program sudah terlaksana dengan
rencana. Oleh Stufflebeam diusulkan pertanyaan-pertanyaan
untuk proses antara lain:
• Apakah pelaksanaan program sesuai dengan jadwal?
• Apakah staf yang terlihat di dalam pelaksanaan program
akan sanggup menangani kegiatan selama program
sedang berlangsung dan kemungkinan jika dilanjutkan?
• Apakah sarana dan prasarana yang disediakan
dimanfaatkan secara maksimal?
• Hambatan-hambatan apa saja yang dijumpai selama
pelaksanaan program dan kemungkinan jika program
dilanjutkan?
2.2.4. Product Evaluation, To Serve Recycling Decision
Evaluasi produk atau hasil diarahkan pada hal-hal yang

menunjukkan perubahan yang terjadi pada masukan mentah.
Evaluasi produk merupakan serangkaian evaluasi program.
Evaluasi hasil merupakan jenis evaluasi yang paling tua.
Bahkan pada mulanya yang dimaksud evaluasi identik denagn
hasil. Lebih lanjut hasil yang dimaksud adalah hasil belajar
dalam pengertian pengetahuan yang dapat diserap oleh peserta
didik. Jumlah pengetahuan yang dimiliki peserta didik
merupakn indikator keberhasilan suatu program pembelajaran.
Makin banyak pengetahuan yang dimiliki peserta didik makin
tinggi tingkat keberhasilan suatu program pembelajaran.
3 Arikunto A (2009), Evaluasi Program Pendidikan, Bumi Aksara, Jakarta.
8
Pandangan yang demikian memang banyak dianut dalam
evaluasi hasil bahkan masih merupakan pandangan yang
dominan. Aspek lain dari hasil belajar hampir dapat dikatakan
tidak diperhatikan sama sekali. Contoh: untuk menentukan
kriteria bahwa suatu sekolah termasuk kategori unggul
biasanya dilihat dari tingginya pencapaian nilai rata-rata UAN.
Anggapan yang demikian ini sedikit demi sedikit perlu
diluruskan mengingat tujuan pendidikan tidak hanya
mencerdaskan peserta didik melainkan untuk membentuk
manusia yang utuh (bertakwa, berkepribadian,
bertanggungjawab, jujur, cerdas, terampil, dan sebagainya).
Fungsi evaluasi produk (hasil) seperti dirumuskan oleh Sax

(1980) adalah “to allow to project to make decision regarding
continuation, termination, or modification of program”. Dari hasil
evaluasi proses diharapkan dapat membantu pimpinan proyek
atau guru untuk membuat keputusan yang berkenaan dengan
kelanjutan, akhir maupun modifikasi program. Sementara
menurut Farida (2000) evaluasi produk untuk membantu
membuat keputusan selanjutnya, baik mengenai hasil yang
telah dicapai maupun apa yang dilakukan setelah program itu
berjalan. 4
Berdasarkan pendapat di atas dapat diketahui bahwa evaluasi

produk merupakan penilaian yang dilakukan untuk mengukur
keberhasilan dalam pencapaian tujuan yang telah ditetapkan.
Data yang dihasilkan sangat menentukan apakah program
diteruskan, dimodifikasi atau dihentikan. Pertanyaan yang
dapat diajukan antara lain:
• Apakah tujuan-tujuan yang ditetapkan sudah tercapai?
• Pertanyaan-pertanyaan apakah yang mungkin
dirumuskan berkaitan antara rincian proses dengan
pencapaian tujuan?
4 Widoyoko E (2009), Evaluasi Program Pembelajaran, Pustaka Pelajar, Jogyakarta.
9
• Dalam hal-hal apakah berbagai kebutuhan siswa sudah
dapat dipenuhi selama proses pelaksanaan program?
• Apakah dampak yang diperoleh dalam waktu yang
relative panjang dengan adanya program tersebut?
2.3. Kesimpulan
Evaluasi konteks adalah evaluasi yang memberikan keputusan

perencanaan, yaitu membantu merencanakan pilihan
keputusan, menentukan kebutuhan yang akan dicapai dan
merumuskan tujuan program. Evaluasi masukan mendukung
pengabilan keputusan strukturisasi yaitu menolong mengatur
keputusan menentukan sumber-sumber yang tersedia,
alternatif-alternatif yang diambil, rencana dan strategi untuk
mencapai kebutuhan, serta prosedur kerja untuk mencapai
tujuan yang dimaksud. Sementara itu, evaluasi proses melayani
keputusan implementasi, yaitu membantu keputusan sampai
sejauh mana program telah dilaksanakan. Sedangkan evaluasi
produk melayani daur ulang keputusan. Keunggulan model
CIPP merupakan system kerja yang dinamis. Pendekatan CIPP
dapat memberikan pemahaman pelaksanaan dan hasil
pelaksanaan program yang telah dilaksanakan pelaksana
program, memberikan informasi untuk mendukung
pengambilan keputusan, dan meningkatkan kualitas proses
pelaksanaan program.
10
Kotak 1.
Contoh Penelitian Evaluasi Program Model CIPP
Evaluasi Program Pengelolaan SMA Terbuka di Kabupaten Bogor

(Sutrianto, 2007) 5
A. Latar Belakang Masalah
Salah satu alternatif yang dapat digunakan untuk mengoptimalkan

daya jangkau SMA regular yang ada, sehingga dapat memberikan
layanan pendidikan kepada sasaran didik yang lebih luas terutama
bagi mereka yang memiliki kendala. Artinya SMA yang telah
menyelenggarakan pendidikan secara tatap muka ditambah
perannya, yaitu memberikan layanan kepada siswa yang memiliki
kendala.
System pendidikan yang dimungkinkan dapat diterapkan untuk itu

adalah system pendidikan terbuka jarak jauh. Karena system
pendidikan ini diterapkan pada jenjang pendidikan menengah
khususnya SMA maka kita sebut dengan SMA Terbuka.
Untuk itu pemerintah sejak tahun 2002/2003 telah membuat rintisan

SMA Terbuka di tujuh lokasi di Indonesia. Salah satu rintisan SMA
Terbuka terletak di kabupaten Bogor. Kabupaten Bogor merupakan
daerah yang memiliki tempat kegiatan belajar mengajar (TKBM)
paling banyak dalam pelaksanaan program rintisan SMA Terbuka
ini. Untuk menjamin mutu SMA Terbuka, pemerintah telah
menyiapkan system dan perangkat-perangkatnya termasuk
pedoman pengelolaan SMA Terbuka. Pedoman tersebut menjadi
tujuan pelaksanaan SMA Terbuka.
Pelaksanaan evaluasi untuk mengetahui pelaksanaan program

rintisan SMA Terbuka tersebut apakah sudah sesuai dengan
pedoman pengelolaan SMA Terbuka selama ini dirasakan masih
kurang memadai. Hal ini menarik untuk dievaluasi, apakah
5 Sutrianto (2007), Evaluasi Program Pengelolaan SMA Terbuka di Kabupaten

Bogor, UNJ, Jakarta.
11
pelaksanaan SMA Terbuka di Kabupaten Bogor sesuai dengan
pedoman pengelolaan SMA Terbuka.
Oleh karena itu perlu dilakukan evaluasi secara mendalam mengenai

pelaksanaan program rintisan SMA Terbuka di Kabupaten Bogor
yang akan memberikan masukan-masukan yang dapat dijadikan
dasar pertimbangan untuk pelaksanaan kegiatan yang akan datang.
B. Perumusan Masalah
Perumusan masalah dalam Evaluasi Program Pengelolaan SMA

Terbuka di Kabupaten Bogor adalah sebagai berikut:
(1) Bagaimana kesesuaian konteks program mengenai profil TKB,
latar belakang program SMA Terbuka, factor geografis-
demografis, latar belakang social ekonomi dan pendidikan
orangtua siswa SMA Terbuka?
(2) Bagaimana efektivitas input program mengenai siswa,
kurikulum, bahan ajar, guru dan tenaga administrasi serta
sarana belajar?
(3) Bagaimana ketercapaian proses mengenai pelaksanaan tutorial,
aktivitas belajar, penggunaan media pembelajaran,
kemampuan lab, kunjungan kepala sekolah, pemberian tugas
akhir unit, pemberian tugas akhir modul, fasilitas guru pamong
dan fasilitas guru bina?
(4) Bagaimana ketercapaian output mengenai hasil belajar siswa,
nilai rata-rata siswa SMA Terbuka Kabupaten Bogor dan
jumlah kelulusan siswa dalam UN tahun 2004/2005?
C. Analisis Obyektif
1. Siswa
Evaluasi input mengenai jumlah siswa sebanyak 655 siswa terdiri

dari Leuwiliang sebanyak 195 siswa. Taman sari sebanyak 79 siswa.
Parung sebanyak 82 siswa. Cileungsi sebanyak 94 siswa. Cijeruk
sebanyak 123 siswa, dan Tenjo sebanyak 82 siswa. Jumlah tersebut
meningkat 52 siswa (8%) disbanding siswa tahun sebelumnyayakni
sebanyak 603 siswa. Sedangkan jumlah siswa laki-laki 391 dan
perempuan 264 siswa. Mengenai latar belakang siswa yakni jumlah
12
siswa yang sudah bekerja di SMA Terbuka Bogor sebanyak 62 orang
(14%), dan yang belym bekerja sebanyak 383 orang (86%). Dan 62
orang yang bekerja 56% penghasilannya kurang dari Rp. 200.000
perbulan. Pada komponen ini tidak sesuai target yang diharapkan,
karena tidak memebrikan kontribusi ekonomi kepada siswa sesuai
harapan orang tua agar anak bisa sekolah sambil bekarja dalam
membantu kehidupan ekonomi keluarga.
2. Kurikulum
Kurikulum yang digunakan pada SMA Terbuka sama dengan yang

digunakan pada SMA Reguler yaitu kurikulum 1994. Berdasarkan
kurikulum tersebut dijabarkan dalam Pola Dasar Kegiatan
Pembelajaran (PDKP). Hasil evaluasi menunujukkan bahwa SMA
Terbuka Bogor tidak menyusun PDKP yang memuat kompetensi
keterampilan yang diharapkan siswa sesuai kebutuhan dan
karakteristik di wilayah tersebut.
3. Bahan Ajar
Bahan ajar yang digunakan adalah bahan ajar cetak berupa modul
yang dirancang khusus sehingga dapat dipelajari siswa secara
mandiri. Namun, modul untuk mata pelajaran Agama. Kesenian dan
Penjaskes belum ada bahan ajar penunjang seperti: program audio,
video/vcd dan media lainnya jumlahnya sangat terbatas dan hanya
ada di sekolah induk.
4. Guru dan Tenaga Administrasi
Persepsi tentang tugas dan fungsi guru bina dan guru pamong tidak
sesuai dengan pedoman pelaksanaan SMA Terbuka Guru Pamong
pada masing-masing TKB merangkap menjadi guru bina, karena
guru bina pada sekolah induk tidak pernah datang ke TKB. Pada
masing-masing TKB tidak ada guru pamong khusus yang
memberikan keterampilan kepada siswa. Sedangkan tenaga
administrasi khusus yang menangani SMA Terbuka hanya ada di
SMA Induk.
5. Sarana Belajar
13
Ruang tempat belajar menggunakan bangunan sekolah,
perpustakaan dan laboratorium rata-rata tidak memadai, baik dari
TKB Leuwiliang, Taman sari, Parung, cileingsi, cijeruk maupun tanjo
semuanya mengatakan bahwa mereka tidak memiliki perpustakaan
dan laboratorium sendriri, hanya mereka numpang dengan sekolah
induk. Siswa merasa kesulitan untuk meminjamkan buku pada
perpustakaan sekolah induk karena pada sore hari perpustakaan
tutup. Sementara untuk laboratorium sekolah induk memiliki
laboratorium fisika, kimia dan biologi tetapi SMA Terbuka tidak
menggunakan.
D. Evaluasi proses
1. Pelaksanaan tutorial
Pelaksanaan tutorial pada rintisan SMA Terbuka Bogor rata-rata

kurang mencukupi yakni sebesar 51, 33%. Dari enam TKB yang
melaksanakan kegiatan pembelajaran SMA Terbuka, hanya siswa
pada TKB Leuwiliang yang mengikuti tutorial, sebnayak 166 orang
dan TKB Taman Sari sebnayak 2 orang dengan total jumlah siswa
sebanyak 168 orang atau sebesar 38% dan total siswa sebanyak 455
orang. Sedangkan siswa lainnya 62% atau sebanyak 277 siswa tidak
pernah datang tutorial ke sekolah induk.
2. Aktivitas Belajar Siswa
Aktivitas belajar siswsa di SMA Terbuka Bogor rata-rata kurang dari

harapan dan dapat dikatakan satu arah. Karena 74% atau sebanyak
328 siswa mendengarkan guru bina mengajar. Sebaiknya siswa yang
selalu melakukan belajar mandiri sebanyak 166 orang atau sebesar
37% yang berhasil lulus sebanyak 38 orang atau 92,68%.
E. Implikasi
Hasil penelitian ini ,menunjukkan bahwa konteks program secara

geografis tidak sesuai dengan harapan penyelenggaraan program
maupun masyarakat sekitar. Terutama orangtua siswa karena jarak
TKB secara keseluruhan rata-rata harus ditempuh dengan kendaraan,
14
sehingga bila dipikirkan lokasi TKB yang lebih mudah dijangkau
oleh siswa tanpa harus mengeluarkan biaya dari kantongnya sendiri.
Sementara 95% siswa mengatakan bahwa alasan mereka mengikuti
pendidika pada SMA Terbuka karena tidak dipungut biaya.
Secara konseptual, SMA Terbuka merupakan system pendidikan

yang mungkin meniadakan batasan atau criteria kepada peserta
didik untuk menentukan metode strategi dan tujuan belajarnya
memberikan kebebasan pada peserta didik dalam proses belajar.
Dalam pendidikan terbuka, setiap siswa diberikan keleluasaan untuk
megatur proses belajarnya sesuai dengan kebutuhan dan kondisinya
namun, keadaan ini akan berimlikasi pada hasil belajar yang tidak
diharapkan, kalau siswa tidak memiliki semangat belajar,
kedewasaan, rasa tanggung jawab dan keseriusan yang mendalam
untuk pencapaian prestasi.
Secara umum, sasaran dari pelaksanaan program pendidikan pada

SMA Terbuka adalah untuk menampung siswa-siswa yang
mempunyai berbagai keterbatasan seperti keterbatasan geografis,
waktu, biaya dan sebagainya sehiongga tidak dapat melanjutkan
pendidikan pada SMA Reguler sehingga wajar kalau terjadi
peningkatan pendaftaran siswa baru. Namun dengan berbagai
pertimbangan dari pengelolaan SMA Terbuka Kabupaten Bogor
sehingga tidak semua pendaftar diterima pada tahun 2004/2005.
Keadaan ini akan berimplikasi kepada calon siswa dan orangtua
dengan berbagai persepsi terhadap aturan-aturan di SMA Terbuka.
--ooOOoo—
15
16
Bab 3
Model CSE-UCLA
3.1. Pengantar
Setiap kegiatan manajemen akan dikatakan sempurna jika

dalam prosesnya dilaksanakan suatu evaluasi, tidak terkecuali
dalam manajemen pendidikan. Program pendidikan sebagai
penjabaran dari perencanaan pendidikan harus dievaluasi
dengan menggunakan strategi yang tepat sehingga hasilnya
dapat dipertanggungjawabkan.
Kebijakan yang sudah dikeluarkan oleh pengambil keputusan

belum tentu dapat direalisasikan dengan baik sesuai dengan
jiwa kebijakan. Untuk mengetahui seberapa jauh dan bagian
mana dari tujuan yang sudah tercapai, dan bagian mana yang
belum tercapai serta apa penyebabnya, perlu adanya evaluasi
program. Tanpa ada evaluasi, keberhasilan dan kegagalan
program tidak dapat diketahui. Evaluasi program menurut
Suharsimi Arikunto dan Cepi Safruddin adalah upaya untuk
mengetahui tingkat keterlaksanaan suatu kebijakan secara
cermat dengan cara mengetahui efektifitas masing-masing
komponen.
Evaluasi terhadap program pendidikan dimaksudkan untuk

mengetahui tingkat keberhasilannya atau kegagalan suatu
program pendidikan dan hasil evaluasi dapat dijadikan
informasi sebagai masukan untuk menentukan tindak lanjut
dari program yang sedang atau telah dilaksanakan.
17
3.2. Konsep Model Evaluasi Program CSE-UCLA
Dalam ilmu evaluasi program pendidikan, ada banyak model

yang biasa digunakan untuk mengevaluasi suatu program.
Meskipun satu dengan lainnya berbeda, namun maksudnya
sama yaitu melakukan kegiatan pengumpulan data atau
informasi yang berkenaan dengan objek yang di evaluasi, yang
tujuannya menyediakan bahan bagi pengambil keputusan
dalam menentukan tindak lanjut suatu program. Model-model
evaluasi ada yang dikatagorikan berdasarkan ahli yang
menemukan dan yang mengembangkan serta ada juga yang
diberi sebutan sesuai dengan sifat kerjanya. Yang akan dibahas
di sini adalah Model Evaluasi CSE-UCLA. CSE-UCLA terdiri
dari dua singkatan, yaitu CSE dan UCLA. CSE merupakan
singkatan dari Center for the Study of Evaluation, sedangkan
UCLA merupakan singkatan dari University of California at Los
Angeles. Didirikan pada tahun 1966 dan dapat diterima sebagai
suatu program standar penilaian test dan juga sebagai pusat
Penelitian dan Evaluasi Pendidikan. Program ini merupakan
program pertama dalam usaha memperbaiki kualitas
pendidikan dan pembelajaran di Amerika.
Evaluasi yang berorientasi manajemen mendekati dalam

pendidikan dimaksud untuk melayani pengambilan keputusan.
Dasar pemikirannya adalah informasi yang evaluatif. Hal
tersebut adalah suatu bagian penting dari pengambilan
keputusan yang baik, dan penilai dapat memberikan penilaian
pendidikan terbaik yang dapat berguna bagi administrator,
penentu kebijaksanaan, dewan sekolah, para guru, dan yang
lainnya dalam bidang pendidikan yang memerlukan informasi
evaluatif yang baik. Pengembangan metoda ini sudah
bersandar pada suatu sistem di mana keputusannya tentang
masukan, proses, dan keluaran. Dengan memperhatikan
18
perbedaan tingkat pengambil-keputusan dan keputusan,
pendekatan ini menjelaskan siapa yang akan menggunakan
hasil evaluasi, bagaimana mereka akan menggunakannya, dan
aspek-aspek tentang sistem membuat keputusan. Pengambil-
Keputusan selalu mendengar untuk siapa suatu evaluasi
berorientasi manajemen diarahkan, dan perhatian pengambil-
keputusan, informasi tentang kebutuhan, dan ukuran-ukuran
untuk mengarahkan efektivitas dari studi.
Kontribusi penting bagi pendekatan secara manajemen ke

dalam evaluasi pendidikan dibuat oleh Stufflebeam dan Alkin
pada pertengahan tahun 1960. Aktif untuk memperluas dan
mengatur tentang studi administratif dan pengambilan
keputusan bidang pendidikan, mereka membangun konsep
yang mengisyaratkan di dalam peker.jaan yang lebih awal dari
Bernard, Mann, Harris, dan Washburne. Selama tahun 1960 dan
1970, mereka juga menyusun dari manajemen (sebagai contoh
Barybrcoke dan Lindblom, 1963). Baik Stufflebeam maupun
Alkin membuat keputusan para manajer program adalah
organisator yang sangat penting untuk evaluasi. Sasaran hasil
program adalah tidak menjadi perhatian yang utama. Di dalam
model yang diusulkan oleh kedua-duanya yang ahli teori,
penilai aktif yang merupakan bagian dari administrator,
mengidentifikasi keputusan adminstrator harus membuat dan
kemudian menyimpulkan informasi cukup tentang keuntungan
dan kerugian-kerugian dari masing-masing alternatif
keputusan untuk memberikan suatu keputusan yang
didasarkan pada kriteria yang telah ditetapkan. Keberhasilan
evaluasi bersandarkan pada mutu kerjasama antara pengambil
keputusan dan penilai. Teknik ini telah digunakan dengan
sukses oleh pemerintah pusat itu (Reinhard, 1972) dan oleh
sekolah (Sanders, 1982) untuk menghasilkan pilihan dan
menuntun tujuan akhir perancangan program bidang
pendidikan. Pendekatan evaluasi ini telah pula digunakan
19
untuk maksud menyediakan suatu informasi, kerangka yang
memudahkan tinjauan ulang publik tentang kebutuhan bidang
pendidikan, sasaran hasil, rencana, aktivitas, dan hasil. Dewan
sekolah dan administrator sekolah menemukan pendekatan ini
bermanfaat dalam menjelaskan informasi kepada publik.
Di antara para alumni UCLA salah satunya yaitu Fernandes

(1984) dan Alkin (1969) yang memperkenalkan program ini
kepada dunia pendidikan khususnya di Amerika pada saat itu.
Ciri dari model CSE-UCLA adalah adanya lima tahap yang
dilakukan dalam evaluasi yaitu perencanaan, pengembangan,
implementasi, hasil dan dampak. Fernandes (1984) memberikan
penjelasan tentang model CSE-UCLA menjadi empat tahap,
yaitu (1) needs assessment, (2) program planning, (3) formative
evaluation, dan (4) summative evaluation.
Gambar 3.1. Tahap-tahap Evaluasi Model CSE-UCLA
3.2.1 Needs Assessment
Dalam tahap ini evaluator memusatkan perhatian pada

penentuan masalah. Pertanyaan yang diajukan:
• Hal-hal apakah yang perlu dipertimbangkan sehubungan
dengan keberadaan program?
• Kebutuhan apakah yang terpenuhi sehubungan dengan
adanya pelaksanaan program ini?
• Tujuan jangka panjang apakah yang dapat dicapai melalui
program ini?
20
3.2.2. Program Planning
Dalam tahap kedua dari CSE model ini evaluator

mengumpulkan data yang terkait langsung dengan
pembelajaran dan mengarah pada pemenuhan kebutuhan yang
telah diidentifikasi pada tahap kesatu. Dalam tahap
perencanaan ini program PBM dievaluasi dengan cermat untuk
mengetahui apakah rencana pembelajaran telah disusun
berdasarkan hasil analisis kebutuhan. Evaluasi tahap ini tidak
lepas dari tujuan yang telah dirumuskan.
3.2.3. Formative Evaluation
Dalam tahap ketiga ini evaluator memusatkan perhatian pada

keterlaksanaan program. Dengan demikian, evaluator
diharapkan betul-betul terlibat dalam program karena harus
mengumpulkan data dan berbagai informasi dari pengembang
program.
3.2.4. Summative Evaluation
Dalam tahap keempat, yaitu evaluasi sumatif, para evaluator

diharapkan dapat mengumpulkan semua data tentang hasil
dan dampak dari program. Melalui evaluasi sumatif ini,
diharapkan dapat diketahui apakah tujuan yang dirumuskan
untuk program sudah tercapai, dan jika belum dicari bagian
mana yang belum dan apa penyebabnya.
Alkin (1969) menulis tentang kerangka kerja evaluasi yang

hampir sama dengan model CIPP. Alkin mendefinisikan
evaluasi sebagai suatu proses menyakinkan keputusan,
memilih informasi sehingga dapat melaporkan ringkasan data
yang berguna bagi pembuat keputusan dalam memilih
21
beberapa alternatif. Ia mengemukakan lima macam evaluasi,
yakni:
• System assessment, yang memberikan informasi tentang
keadaan atau posisi system.
• Program planning, membantu pemilihan program tertentu
yang mungkin akan berhasil memenuhi kebutuhan
program.
• Program implementation, yang menyiapkan informasi
apakah program sudah diperkenalkan kepada kelompok
tertentu yang tepat seperti yang direncanakan?
• Program improvement, yang memberikan informasi
tentang bagaimana program berfungsi, bagaimana
program bekerja, atau berjalan? Apakah menuju
pencapaian tujuan, adakah hal-hal atau masalah-masalah
baru yang muncul tak terduga?
• Program Certification, yang memberi informasi tentang nilai
atau guna program.
Seperti Alkin (1991) telah menunjukkan, dengan model

evaluasi membuat empat asumsi tentang evaluasi:
• Evaluasi adalah proses mengumpulkan informasi.
• Informasi yang dikumpulkan dalam suatu evaluasi akan
digunakan terutama untuk membuat keputusan tentang
tindakan alternatif.
• Informasi evaluasi harus disampaikan kepada pengambil
keputusan dalam bentuk yang ia dapat menggunakan
secara efektif dan yang dirancang untuk membantu
daripada pengajaran atau yang menyesatkan dirinya.
• Berbagai jenis keputusan membutuhkan berbagai jenis
prosedur evaluasi.
22
3.3. Ketepatan Penentuan Model Evaluasi CSE-UCLA
Bagian ini membahas ketepatan penentuan model evaluasi

CSE-UCLA. Dari makna kata “ketepatan” terkandung ada dua
hal yang perlu ditautkan. Tepat artinya cocok, jika tautan
antara dua hal yang ditautkan cukup baik, erat, berarti bahwa
ada ketepatan tautan antara dua hal yang ditautkan tersebut.
Ketepatan penentuan model evaluasi program mengandung
makna bahwa ada harapan keeratan tautan antara evaluasi
program dengan jenis program yang dievaluasi.
Sesuai dengan bentuk kegiatannya, program dapat dibedakan

menjadi lima bentuk, yaitu sebagai berikut.
3.3.1. Program Pemrosesan
Program pemrosesan adalah program yang kegiatan pokoknya

mengubah bahan mentah (input) menjadi bahan jadi sebagai
hasil proses atau keluaran (output). Ciri khusus dari program
pemrosesan ini adalah adanya sesuatu yang semula berada
dalam kondisi awal sebagai masukan, kemudian diolah dan
ditransformasi menjadi sesuatu keluaran yang dikehendaki
oleh tujuan program. Seperti yang sudah kita ketahui bahwa
model evaluasi CSE-UCLA terdiri dari empat tahapan proses,
yaitu perencanaan, proses, formatif dan sumatif. Dapat
disimpulkan bahwa model evaluasi CSE-UCLA sesuai
digunakan untuk mengevaluasi program pemrosesan. Jika
dicontohkan pada program pembelajaran dan kepramukaan
maka jelas bahwa model evaluasi CSE-UCLA dapat diterapkan
untuk mengevaluasi kedua program tersebut.
23
3.3.2. Program Pembelajaran
Program pembelajaran adalah bermaksud mengubah siswa

yang belum menguasai ilmu tertentu menjadi menguasai,
terjadi dalam suatu proses transformasi sampai lulus. Semua
pelaksana program dikerahkan demi suksesnya program yaitu
menghasilkan lulusan yang berkualitas tinggi, yaitu menguasai
ilmu pengetahuan yang berguna bagi kehidupan diri, keluarga
dan masyarakat.
3.3.3. Program Kepramukaan
Program kepramukaan adalah program yang kegiatan

utamanya mengubah siswa atau anggota pramuka yang semula
belum menguasai teori dan praktek kepramukaan,menjadi
mahir dan mampu melakukan tugas-tugas mulia
kepramukaan. Dalam program ini terjadi pengerahan segala
daya upaya dan dana demi tercapai tujuan yaitu diperolehnya
keluaran berupa siswa pramuka yang berkualitas tinggi.
3.3.4. Program Pelayanan
Program Pelayanan (service) adalah sebuah kesatuan kegiatan

yang bertujuan untuk memenuhi kebutuhan pihak tertentu
sehingga merasa puas sesuai dengan tujuan program. Model
evaluasi CSE-UCLA mengarahkan sasaran evaluasi program
pada empat komponen yang keempatnya merupakan dan
menunjukkan suatu proses. Telaah dibicarakan dalam kajian
terdahulu bahwa Program Pelayanan merupakan sebuah
proses. Dengan demikian, tanpa maksud mengurangi kejelasan
uraian dapat kita analogikan dari penjelasan sebelumnya
bahwa model evaluasi CSE-UCLA tepat serta cocok digunakan
untuk mengevaluasi Program Pelayanan.
24
3.3.5. Program Umum
Tidak seperti pada program jenis pemrograman dan layanan

yang dengan jelas dapat dikenali jenisnya karena ada masukan
(input) yang diolah menjadi keluaran (output), dan pada
Program Pelayanan ada “raja” yang dilayani, pada program
jenis ketiga justru tidak tampak apa yang menjadi ciri utama.
Oleh karena itu, program ini disebut juga dengan program
umum.
3.4. Keunggulan dan Kelemahan Model Evaluasi CSE-

UCLA
Menurut Djuju Sudjana, keunggulan model evaluasi ini adalah:

(a) Memperbaiki dan mengembangkan program; (b)
Menyajikan informasi yang berkaitan dengan pengambilan
keputusan; dan (c) memberikan umpan balik untuk
penyusunan program yang berkelanjutan. Sementara itu,
kelemahan model evaluasi ini adalah: (a) Pandangan evaluator
mungkin tidak sejalan dengan pandangan pengambil
keputusan tentang langkah-langkah penyusunan program dan
komponen-komponen program, dan (b) Fokus evaluasi yang
sangat, ditekankan pada hasil program.
3.5. Kesimpulan
Bertitik tolak dari pembahasan di atas, maka didapatkan

kesimpulan bahwa jenis program pemrosesan dan Program
Pelayanan memiliki ciri khusus dan berbagai model yang cocok
digunakan untuk mengevaluasi program pemrosesan dan
layanan yang sifatnya khas. Model evaluasi demikian cocok
untuk program umum. Mengingat bahwa program umum
tidak memiliki kekhususan, maka program ini tidak menuntut
25
kekhususan model evaluasi maka tidak ada alasan bahwa ada
model yang tidak cocok untuk program umum.
Model evaluasi CSE-UCLA dapat digunakan dan sesuai untuk

mengevaluasi semua program umum. Para evaluator harus
menggunakan strategi yang umum, yaitu mulai dari
identifikasi komponen dan indikator. Dari analisis mengenai
model-model evaluasi dapat dipahami bahwa meskipun semua
model tepat untuk digunakan pada semua program, namun
tingkat ketepatannya berbeda. Ada yang betul-betul tepat,
misalnya sama-sama menekankan proses, tetapi ada juga yang
seperti “dipaksa” tepat.
26
Bab 4
Model Formatif dan Sumatif
4.1. Pengantar
Model Evaluasi formatif-sumatif pertama kali dikembangkan

oleh Michael Scriven (1967). Model ini menunjuk adanya
tahapan dan lingkup obyek yang dievaluasi, yaitu: (1) Evaluasi
yang dilaksanakan pada waktu program masih berjalan
(evaluasi formatif). Evaluasi ini digunakan untuk memberikan
umpan balik bagi penyempurnaan program dan untuk
mengetahui kelemahan-kelemahan yang memerlukan
perbaikan, sehingga hasil program menjadi lebih baik; dan (2)
Evaluasi yang dilakukan di akhir suatu program (evaluasi
sumatif). Evaluasi ini dimaksudkan untuk memperoleh
informasi tentang hasil yang dicapai berkaitan dengan rencana
dari suatu program tersebut. Data yang diperoleh dari evaluasi
sumatif sangat berguna bagi pengambilan keputusan dalam
menentukan kebijakan selanjutnya, oleh karena itu evaluasi ini
lebih mengarah pada keputusan tentang kelanjutan program,
berhenti, atau diteruskan, pengadopsian atau selanjutnya.
Pada evaluasi formatif-sumatif, ketika melaksanakan evaluasi,

evaluator tidak dapat melepaskan diri dari tujuan. Tujuan
evaluasi formatif memang berbeda dengan tujuan evaluasi
sumatif. Dengan demikian model yang dikemukakan oleh
Michael Scriven ini menunjukkan tentang “apa, kapan, dan
tujuan” evaluasi tersebut dilaksanakan. Para evaluator
pendidikan, termasuk guru-guru yang mempunyai tugas
27
evaluasi, tentu sudah mengenal dengan baik apa yang
dimaksud dengan evaluasi formatif dan sumatif. Hampir setiap
bulan guru-guru melaksanakan evaluasi formatif dalam bentuk
ulangan harian. Menurut Tyler, evaluasi formatif adalah
evaluasi yang dilakukan guru selama dalam perkembangan
atau dalam kurun waktu proses pelaksanaan suatu program
pengajaran semester. Sementara itu, evaluasi sumatif adalah
evaluasi yang dilaksanakan oleh guru pada akhir semester.
4.2. Evaluasi Formatif
Menurut Scriven (1991), evaluasi formatif adalah suatu evaluasi

yang biasanya dilakukan ketika suatu produk atau program
tertentu sedang dikembangkan dan biasanya dilakukan lebih
dari sekali dengan tujuan untuk melakukan perbaikan.
Sedangkan Weston, Mc Alpine dan Bordonaro (1995)
menjelaskan bahwa tujuan dari evaluasi formatif adalah untuk
memastikan tujuan yang diharapkan dapat tercapai dan untuk
melakukan perbaikan suatu produk atau program. Hal ini
senada dengan Worthen dan Sanders (1997) yang menyatakan
bahwa evaluasi formatif dilakukan untuk memberikan
informasi evaluatif yang bermanfaat untuk memperbaiki suatu
program. Baker mengatakan ada dua faktor yang
mempengaruhi kegunaan evaluasi formatif, yaitu kontrol dan
waktu. Bila saran perbaikan akan dijalankan, maka evaluasi
formatif diperlukan sebagai kontrol. Informasi yang diberikan
menjadi jaminan apakah kelemahan dapat diperbaiki. Apabila
informasi mengenai kelemahan tersebut terlambat sampai
kepada pengambilan keputusan, maka evaluasi bersifat sia-sia.
Evaluasi formatif dapat menanggapi program dalam konteks

yang dinamis, dan berusaha untuk memperbaki keadaan yang
berantakan dari kerumitan yang merupakan bagian yang tidak
dapat dihindarkan dari berbagai bentuk program dalam
28
lingkungan kebijakan yang berubah-ubah. Kesesuaian antara
perencanaan dan pelaksanaan program baik pada konteks
organisasi, personil, struktur, dan prosedur menjadi fokus
evaluasi formatif.
Evaluasi formatif secara prinsip merupakan evaluasi yang

dilaksanakan ketika program masih berlangsung atau ketika
program masih dekat dengan permulaan kegiatan. Tujuan
evaluasi formatif tersebut adalah mengetahui seberapa jauh
program yang dirancang dapat berlangsung, sekaligus
mengidentifikasi hambatan. Dengan diketahuinya hambatan
dan hal-hal yang menyebabkan program tidak lancar,
pengambil keputusan secara dini dapat mengadakan perbaikan
yang mendukung kelancaran pencapaian tujuan program.
Menurut Martin Tessmer (1996) menjelaskan teknik evaluasi

formatif. Evaluasi formatif terdiri dari beragam bentuk, dapat
dilakukan sebagai berikut:
4.2.1. Review Ahli (Expert Review)
Evaluasi dimana ahli yang mengkaji ulang Program Pelayanan

dengan atau tanpa kehadiran evaluator. Ahli bisa ahli materi,
ahli teknis, perancang, atau instruktur. Evaluasi ini dilakukan
terhadap program muatan layanan yang masih kasar atau
masih dalam rancangan (draft) untuk mengetahui kelebihan
dan kelemahannya.
Kelebihan dari review ahli adalah:

• Review menghasilkan tipe informasi yang berbeda jika
dibandingkan dengan informasi yang diperoleh dari
evaluasi orang per orang, kelompok kecil, atau uji
lapangan.
29
• Kadang-kadang ahli yang dibutuhkan telah ada dan
dibayar dengan murah.
Sedangkan kelemahannya adalah:

• Review ahli tidak memberikan pandangan atau
pendapat dari sudut pandang siswa.
• Review ahli membutuhkan biaya tinggi jika orang ahli
harus didatangkan dari wilayah yang jauh.
Informasi yang dapat digali dari pelaksanaan review ahli

antara lain:
• Informasi yang berkaitan dengan content (materi),
seperti kelengkapan, akurasi, kepentingan, serta
kedalaman.
• Informasi yang berkaitan dengan disain instruksional,
seperti kesesuain dengan karakteristik, dan tugas
perkembangan siswa, kesesuaian antara tujuan-materi-
evaluasi, ketepatan pemilihan media, dan ketertarikkan
bagi siswa.
• Informasi yang berkaitan dengan implementasi, seperti
kemudahan penggunaan, kesesuaian dengan
lingkungan belajar sebenarnya, kesesuaian dengan
lingkungan.
4.2.2. Evaluasi Orang-per-Orang (One-To-One Evaluation)
Evaluasi ini dilakukan dengan wawancara yang dilakukan

secara perorangan oleh evaluator terhadap beberapa siswa
dimana secara satu persatu siswa diminta untuk memberikan
komentarnya mengenai Program Pelayanan yang sedang
dikembangkan. Selain itu siswa juga biasanya diminta untuk
menyelesaikan pre dan post test untuk mengukur efektifitas
Program Pelayanan.
30
Keuntungan dari evaluasi ini adalah evaluasi ini memberikan
informasi dari sudut pandang siswa, serta evaluasi ini dapat
dilakukan dengan mudah, cepat, murah, dan produktif.
Informasi yang dapat diperoleh dari evaluasi ini meliputi
beberapa aspek, antara lain:
• Materi (content); seperti tingkat kesulitan, kejelasan,
kemenarikan, serta kekinian materi.
• Disain instruksional; seperti kejelasan tujuan, kelogisan
sistematika penyampaian materi.
• Implementasi; seperti tingkat kesulitan penggunaan,
tingkat kemudahan dana, kemungkinan kesulitan yang
dihadapi.
• Kualitas teknis; seperti kualitas animasi, video, serta
layout.
Menurut Tessmer (1996), untuk memilih subyek dalam evaluasi

satu per satu, ada beberapa karakteristik yang bisa dijadikan
patokan, yakni:
• Pengetahuan siswa: meliputi seberapa jauh mereka
dapat mengetahui tentang materi yang akan diberikan
(pre test).
• Kemampuan siswa: apakah siswa mempunyai
kemampuan intelektual dan strategi yang menunjukkan
bahwa dirinya sebagai siswa dapat belajar cepat atau
lambat.
• Minat siswa: meliputi apakah mereka akan
menunjukkan motivasi yang kuat untuk mempelajari
dan mereview Program Pelayanan yang sedang
dikembangkan.
• Keterwakilan siswa: seberapa jumlah siswa dari
populasi yang memiliki kemampuan, keterampilan, dan
motivasi.
31
• Kepribadian siswa: apakah cukup percaya diri dan
terbuka untuk mengekspresikan kritiknya selama
evaluasi.
4.2.3. Evaluasi Kelompok Kecil (Small Group)
Evaluasi di mana evaluator mengujicobakan suatu Program

Pelayanan pada suatu kelompok siswa dan mencatat
performance dan komentar-komentarnya.
4.2.4. Uji Lapangan (Field Test)
Evaluasi di mana evaluator mengobservasi Program Pelayanan

yang diujicobakan kepada sekelompok siswa tertentu dalam
suatu situasi nyata. Evaluasi ini dilakukan terhadap suatu
Program Pelayanan yang sudah selesai dikembangkan, tapi
masih membutuhkan atau memungkinkan untuk direvisi akhir.
Salah satu kelebihan dari uji lapangan adalah bahwa dengan

evaluasi ini akan diperoleh informasi apakah Program
Pelayanan dengan menggunakan menggunakan metode
tertentu akan benar-benar berjalan sesuai dengan apa yang
diharapkan.
Menurut Tessmer (1996), beberapa fokus penggalian informasi

yang perlu dijadikan patokan dalam uji lapangan adalah:
• Kemampuan untuk dilaksanakan.
• Kesinambungan.
• Efektifitas.
• Kecocokan dengan lingkungan.
• Digunakan dalam beberapa variasi lingkungan.
32
Tabel 4.1. Perbedaan Evaluasi Formatif dan Evaluasi Sumatif.
Evaluasi Formatif Evaluasi Sumatif
1. Tujuannya untuk memperbaiki 1. Tujuannya untuk mengetahui

PBM. hasil atau tingkat kemajuan
2. Dilaksanakan setelah selesai belajar siswa.
mengajarkan suatu unit 2. Dilaksanakan setelah
pengajaran tertentu. mengajarkan seluruh unit
3. Frekuensi 2 – 4 kali dalam satu pengajaran, yang menjadi forsi
semester. sesuatusemester
4. Lingkup atau scope bahannya 3. Frekuensinya 1 kali dalam satu
sempit. semester.
5. Obyeknya hanya terdapat 4. Lingkup atau scope bahannya
suatu aspek perilaku. luas.
6. Bobot atau kadar nilainya 5. Obyeknya meliputi berbagai
rendah. aspek perilaku.
6. Bobot atau kadar nilainya
tinggi.
4.3. Evaluasi Sumatif
Evaluasi sumatif dilakukan setelah program berakhir. Tujuan

dari evaluasi sumatif adalah untuk mengukur pencapaian
program. Fungsi evaluasi sumatif dalam evaluasi program
pembelajaran dimaksudkan sebagai sarana untuk mengetahui
posisi atau kedudukan individu di dalam kelompoknya.
Mengingat bahwa obyek sasaran dan waktu pelaksanaan
berbeda antara evaluasi formatif dan sumatif maka lingkup
sasaran yang dievaluasi juga berbeda.
Pola evaluasi sumatif ini dilakukan apabila guru bermaksud

untuk mengetahui tahap perkembangan terakhir dari siswanya.
Asumsi yang mendasarinya adalah bahwa hasil belajar
merupakan totalitas sejak awal hingga akhir.
33
Beberapa keuntungan dari evaluasi sumatif meliputi:
• Apabila dirancang dengan tepat, mereka
berkemampuan menyediakan bukti untuk sebuah
hubungan sebab-akibat.
• Menilai hubungan jangka panjang.
• Menyediakan data mengenai dampak program.
4.4. Kesimpulan
Evaluasi formatif –dalam hal ini dicontohkan untuk evaluasi

program pendidikan-- adalah evaluasi yang dilakukan oleh
guru selama dalam perkembangan atau dalam kurun waktu
proses pelaksanaan suatu Program Pengajaran Semester.
Dengan maksud agar segera dapat mengetahui kemungkinan
adanya penyimpang-penyimpangan, ketidaksesuaian
pelaksanaan dengan rencana yang telah disusun sebelumnya.
Karena dilaksanakan setelah selesai mengajarkan satu unit
pengajaran (mungkin sesuatu topik atau pokok bahasan), maka
ternyata apabila ada ketidaksesuaian dengan tujuan segera
dapat dibetulkan. Oleh karena itu, fungsi dari pada evaluasi ini
terutama ditujukan untuk memperbaiki proses bolajar
mengajar. Dan karena scope bahannya hanya satu unit
pengajaran, dan dalam satu semester terdiri dari beberapa unit,
maka pelaksanaan evaluasi ini frekuensinya akan lebih banyak
dibanding evaluasi sumatif. Umumnya frekuensi tes formatif
ini berkisar antara 2 - 4 kali dalam satu semester.
Sedangkan yang dimaksud dengan evalusi sumatif adalah

evaluasi yang dilaksanakan oleh guru pada akhir semester. Jadi
guru baru dapat melakukan evaluasi sumatif apabila guru yang
bersangkutan selesai mengajarkan seluruh pokok bahasan atau
unit pengajaran yang merupakan forsi dari semester yang
bersangkutan. Oleh karena itu evaluasi ini dimaksudkan untuk
mengetahui tingkat keberhasilan yang dicapai siswa selama
34
satu semester. Jadi fungsinya untuk mengetahui kemajuan anak
didik.
35
36
Bab 5
Model Responsif
5.1. Pengantar
Evaluasi merupakan proses yang menentukan kondisi, dimana

suatu tujuan telah dapat dicapai (Cross, 1973:5). Definisi ini
menerangkan secara langsung hubungan evaluasi dengan
tujuan suatu kegiatan yang mengukur derajat, dimana suatu
tujuan yang mengukur derajat, dimana suatu tujuan dapat
dicapai. dalam evaluasi mengandung proses. proses evaluasi
harus tepat terhadap tipe tujuan yang biasanya dinyatakan
dalam bahasa perilaku. Dikarenakan tidak semua perilaku
dapat dinyatakan dengan alat evaluasi yang sama, maka
evaluasi menjadi salah satu hal yang sulit dan menantang.
Tujuan dilaksanakannya evaluasi program adalah untuk

memperoleh data dan mengatasi persoalan dengan berusaha
menangkap masalah dari berbagai sudut pandang dari orang
yang terlibat, berminat dan berkepentingan dari program
tersebut. Mengumpulkan dan menggunakan kedua metode
kuantitatif dan kualitatif untuk mengevaluasi pelatihan dan
tindakan-tindakan pembangunan akan meningkatkan
kemampuan staf pengembang untuk mendapatkan tindakan
dilaksanakan.
Kegunaan utama dari evaluasi pendidikan adalah melakukan

evaluasi pendidikan dipandang sebagai alat penting dalam
analisis kebijakan, proses politis, dan manajemen program.
Terhadap analisis kebijakan, penelitian evaluasi memberikan
37
data penting tentang biaya, keuntungan, dan permasalahan-
permasalahan dari berbagai alternative program. Terhadap
proses politis, temuan-temuan evaluasi digunakan sebagai
pembelaan terhadap perundang-undangan tertentu dan
anggaran yang digunakan. Evaluasi resposif juga berguna
sebagai pertanggungjawaban manajemen dan membantu
manajer membuat keputusan yang berhubungan dengan
desain program, personel dan biaya.
Menurut Cronbach (1963) menjelaskan “Evaluation used to

improved the course while it is still fluid contributes more to
improvement of education than evaluation used to appraise a product
already on the market”. Manfaat dari evaluasi memang cukup
luas, bergantung dari sudut mana melihatnya. Menurut
Worten, Blaine R, Sanders (1987), bahwa evaluasi memegang
peranan penting dalam pendidikan antara lain memberi
Informasi yang dipakai sebagai dasar untuk: (1) Membuat
kebijaksanaan dan keputusan; (2) Menilai hasil yang dicapai
para pelajar; (3) Menilai kurikulum; (4) Memberi kepercayaan
kepada sekolah; (5) Memonitor dana yang telah diberikan; serta
(6) Memperbaiki materi dan program pendidikan.
5.2. Fokus Evaluasi
Menurut Farida Yusuf (2008: 44-54) bahwa memfokuskan

evaluasi berarti mengkhususkan pada apa dan bagaimana
evaluasi akan dilakukan, focus evaluasi berarti melihat
beberapa variable dengan teliti, biasanya variable ini menjadi
objek yang akan di evaluasi. Kata “Apa” mengacu pada objek
/program apa yang akan dievaluasi, apakah dalam bentuk
kursus, lokakarya, kurikulum dan lain sebaginya. Sedangkan
kata “Bagaimana”, proses apa dan bagaimana perjalanan
evaluasi akan ditempuh. Kata “Bagaimana” mengacu pada
proses pemfokusan evaluasi dalam tiga proses, yaitu:
38
Pertama, Mempertemukan pengetahuan dan harapan, artinya
bertemunya antara evaluator dan klient, masing-masing datang
pada rapat dengan pengetahuan dan harapan yang telah ada
sebelumnya, diantara mereka terjadi pertukaran informasi
tentang;
• Apa tujuan utama evaluasi?
• Prosedur apa yang akan dilalui?
• Kerangka kerja evaluasinya seperti apa?
• Apa yang menjadi kebutuhan dan keinginan personal
program dan sponsor,?
• Pertanyaan dan isu apa yang akan dievaluasi?
• Pendekatan seperti apa yang akan dipakai, seperti apa
keahlian evaluator?
• Bagaimana mencapai persetujuan untuk mengevaluasi
program?
Kedua, pengumpulan informasi? Kedua pihak baik evaluator

maupun klien harus akrab, maksudnya agar banyak tahu
tentang program yang akan dievaluasi. Informasi yang
dibutuhkan bergantung pada pertanyaan yang akan
ditanyakan sehingga menghasilkan informasi yang
dibutuhkan, seperti dijelaskan dalam Tabel Informasi Yang
Dibutuhkan dan Pertanyaan untuk Menggali Informasi berikut.
39
Tabel 5.1. Informasi Yang Dibutuhkan dan Pertanyaan untuk
Menggali Informasi.
Informasi Yang
Pertanyaan untuk Menggali Informasi
Dibutuhkan
Keterangan • Siapa peserta program?

tentang program • Pelayanan-pelayanan apa yang diberikan?
• Apa tujuan program
• Bagaimana mengukur keberhasilannya?
• Berapa jumlah karyawan yang terlibat?
• Apa jadwal kegiatan program
• Berapa lokasi yang terlibat?
Evaluator harus • Bagaimana evaluasi hasil akan dipakai?
tahu apa yang • Mengapa evaluasi diadakan?
diinginkan klien • Mengapa program memutuskan memakai
evaluator dari luar?
Apakah ada • Siapa yang berminat terhadap informasi yang
individu atau akan dihasilkan dalam evaluasi?
kelompok lain
yang berminat
atas hasil
evaluasi?
Sumber-sumber • Keterbatasan-keterbatasan apa yang mungkin

apa yang dapat akan dihadapi yang akan membatasi ruang
dimanfaatkan? gerak evaluasi?
5.3. Konsep Model Evaluasi Responsif
Tujuan metode evaluasi berdasarkan Kirkpatrick dan lainnya

seperti Warr, Bird dan Rackham tidak disukai sebagian
kalangan minimal dua puluh tahun terakhir. Hal ini sebagian
besar disebabkan oleh kesadaran, minat dan pemahaman
mengenai sifat evaluasi yang sangat politis termasuk
penggunaan strategi evaluasi (Bob Thackwray, 1998).
40
Evaluasi Responsive dikembangkan oleh Stake. Perbedaan
antara model evaluasi responsive dengan model yang lainnya
adalah pengurangan penekanan pada ketelitian pengukuran,
koleksi data sesudah dan sebelum tes. Model Responsif secara
langsung memperhatikan aktivitas program dengan
melukiskan apa yang terjadi dengan program itu. Evaluasi ini
dapat digunakan dalam kegiatan program yang terus menerus
dan ketika dalam penyelesaian program tidak satupun yakin
dengan apa yang mungkin terjadi. Model ini sangat membantu
dalam evaluasi sumatif, dalam menyediakan pemahaman dari
aktivitas program dengan kekuatan dan kelemahannya.
Evaluasi ini tidak tepat jika data hanya berupa dokumentasi
dari tujuan yang harus ditemukan. dalam hal ini evaluasi tidak
diartikan sebagai pengukuran melainkan pemberian makna
atau melukiskan sebuah realitas dari sebuah perspektif orang-
orang yang terlibat, berminat dan berkepentingan dengan
program pembelajaran. tujuan evaluasi adalah untuk
memahami semua komponen program pembelajaran melalui
berbagai sudut pandang yang berbeda.
Evaluasi responsif dikembangkan berdasarkan kenyataan

bahwa pada umumnya orang-orang tidak suka dievaluasi.
Evaluation responsif menekankan pada metode inkuiri
subyektif untuk meningkatkan pemahaman yang mendalam
terhadap concern, issue dan hal yang berhubungan lainnya.
Concern adalah segala sesuatu yang mana para pemangku
kepentingan merasa tidak nyaman atau terancam. Atau juga
setiap klaim yang mana mereka ingin untuk mendapatkan
dukungan. Isu adalah setiap poin pernyataan tentang para
pemangku kepentingan (Guba dan Lincoln,1990).
Definisi sempit evaluasi responsif dibatasi untuk mencari tahu

pandangan pemangku kepentingan dan mereka menyajikan
41
dalam format yang dapat digunakan. Sebuah definisi yang
lebih luas, dan yang berlaku pada pembahasan ini, evaluasi,
yaitu dalam konteks institusi apa yang diinginkan dan
bagaimana untuk memperoleh metode terbaik dari evaluasi ini
untuk memperoleh yang diinginkan/kebutuhan. Oleh karena
itu, evaluasi responsif dapat menggunakan strategi apapun,
untuk menjamin tujuan dan fungsi. Beberapa contoh jenis-jenis
evaluasi responsif terlihat dalam tabel 5.2 (Bob Thackwray,
1998).
Evaluator juga mengadopsi pendekatan yang bermacam-

macam dalam penelitiannya dan dalam masalah mencari tahu
dinamika organisasi. Evaluasi responsive ditandai oleh ciri-ciri
penelitian yang kualitatif, naturalistic, bukan kuantitatif. Bukan
mengumpulkan data dengan instrument tes atau kuesioner,
tapi evaluator mengandalkan observasi yang langsung atau
tidak langsung terhadap kejadian dan interpretasi data yang
impresionistik. Evaluator mengobservasi, merekam, menampi
data, mengecek pengetahuan awal (preliminary understanding)
peserta program, dan mencoba membuat model yang
mencerminkan pandangan berbagai kelompok. Dengan jalan
ini evaluator mencoba responsive terhadap orang-orang yang
berkepentingan pada hasil evaluasi, bukan pada permintaan
desain penelitian atau teknik pengukuran. Tapi bukan berarti
evaluator menghindari pengukuran dan teknik responsive ini
yaitu pengumpulan dan menyintesis data. Uji tradisional dan
instrument biasanya merupakan pertimbangan kedua. Data
utama dalam pendekatan responsive yaitu observasi langsung
dan tak langsung, dan bentuk laporan ialah studi kasus atau
gambaran yang deskriptif. Evaluator bertindak sebagai
organisator antropologis, pencari pengertian realitas melalui
perspektif orang program, peserta program, dan kelompok lain
yang dipengaruhi oleh program tersebut.
42
Tabel 5.2. Jenis Evaluasi Responsif.
Jenis Contoh
Pemenuhan Legalitas, memenuhi persyaratan sektoral atau

(Compliance) institusional.
Kriteria terfokus Berkualitas, berorientasi kepada kepuasan
(Criterion focused) pemangku kepentingan.
Pengembangan Para pengembang staf (evaluator adalah bagian
(Developmental) dari kelompok yang mendesain,
mengembangkan, memberikan pelatihan atau
tindakan pengembangan
Eksternal Independent specialists are used, often to enhance
(External) credibility
Ahli spesialis independen dapat dipekerjakan,
seringkali diarahkan untuk meningkatkan
kredibilitas.
Berbasis Tujuan Penilaian penelitian dilakukan berdasarkan unjuk
(Goal based) kinerja.
Secara bersamaan Sebuah studi peserta dan pelatihan serta
Berkesinambungan tindakan-tindakan pengembangan selama periode
(Longitudinal) waktu - telah investasi dalam program-program
yang mendukung penelitian dan kegiatan
penelitian yang berkaitan dengan menghasilkan
peningkatan kinerja Penilaian Latihan Penelitian?
Norma Perbandingan kinerja dengan bidang tertentu di
berreferensi (Norm institusi-institusi lain.
referenced)
Partisipatoris Keterlibatan langsung para peserta, seperti dalam
(Participatory) sebuah ulasan pengamatan rekan kerja mengajar
oleh kelompok sendiri.
Proses (Process) Isu operasional harian dan perbaikan pelayanan
dalam mendukung pelaksanaan pelatihan dan
tindakan-tindakan pengembangan.
Jaminan Kualitas Apakah standar minimum dan standard yang
(Quality assurance) diakui telah menjadi rutinitas dan sistematis
diberikan?
43
Stake (1975) menciptakan istilah evaluasi responsif dan
berpendapat bahwa evaluasi harus peduli dengan kepentingan
berbagai pemangku kepentingan (stakeholder), seperti agen,
penerima manfaat, dan ‘korban’. Pemangku kepentingan harus
diidentifikasi pada kesempatan paling awal: siapa yang terlibat
dan dalam kapasitas apa? Siapa yang harus terlibat? Yang
berpikir mereka seharusnya terlibat dan tidak, demikian
seterusnya. Ajukan tiga pertanyaan kunci ke para pemangku
kepentingannya:
• Apakah program ini dan tindakan pengembangan
penting bagi mereka?
• Apa sebenarnya yang dipertaruhkan dalam program
ini?
• Apa nilai-nilai, ada bias, atau pengalaman yang dapat
mempengaruhi penilaian mereka tentang program ini?
Elemen ini penting yang memungkinkan komunikasi yang

berguna untuk mengetahui maksud, peran dan posisi antara
staf dan para pemangku kepentingan. (Diadaptasi dari Philips,
1991). Evaluasi responsive merupakan pendekatan yang paling
lain dari kelima bentuk evaluasi yang dibicarakan dalam
tulisan ini karena perspektif dalam usulan evaluasi dan metode
pencapaiannya. Evaluasi ini mencari pengertian suatu isu dari
berbagai sudut pandangan dari semua orang yang terlibat,
yang berminat, dan yang berkepentingan dengan program.
Evaluator tak percaya ada satu jawaban untuk suatu evaluasi
proram yang dapat ditemukan dengan memakai tes, kuesioner,
atau analisis statistik. Tapi setiap orang yang dipengaruhi oleh
program merasakannya secara unik, dan evaluator mencoba
menolong menjawab pertanyaan yang berhubungan dengan
melukiskan atau menguraikan kenyataan melalui pandangan
orang-orang tersebut. Tujuan evaluator adalah berusaha
mengerti urusan program melalui berbagai sudut pandangan
yang berbeda.
44
Model Responsive memandang evaluasi kurikulum (a) sebagai
suatu isu daripada sebagai tujuan, (b) perpaduan perbedaan
standar nilai yang dipegang oleh group yang berbeda, (c)
termasuk pengamatan partisipasi di dalam kurikulum dan (d)
melibatkan Informasi dari para audien.
Kelebihan evaluasi responsive ini ialah kepekaannya terhadap

berbagai titik pandangan, dan kemampuannya
mengakomodasi pendapat yang ambigis dan tidak focus.
Evaluasi responsif dapat beroperasi dalam situasi di mana
terdapat banyak perbedaan minat dari kelompok yang
berbeda-beda, karena mereka dapat mengatur pendapat
tersebut dengan cara yang tepat. Demikian juga evaluasi
responsive dapat mendorong proses perumusan masalah
dengan menyediakan informasi yang dapat menolong orang
mengerti isu lebih baik.
Keterbatasan evaluasi responsive ialah keengganannya membuat

prioritas atau penyederhanaan informasi untuk pemegang
keputusan dan kenyataan yang praktis tidak mungkin
menampung semua sudut pandangan dari berbagai kelompok,
Membuat keputusan sulit, membutuhkan waktu dan tenaga,
serta evaluator harus dapat beradaptasi dengan lingkungan
yang diamati.
Pengaruh evaluasi ini terhadap pemfokusan evaluasi ialah

evaluator menghabiskan banyak waktu berbicara dengan klien,
mengamati kegiatan program, mencoba menyaring hal-hal
yang dipandang penting oleh klien, dan masalah-masalah,
konsep-konsep dan isu-isu dari berbagai sudut pandangan.
Akibatnya, evaluator harus dapat menjadi pengamat yang baik.
Mereka harus dapat beradaptasi dengan berbagai sudut
45
pandangan tanpa memperlihatkan penilaian sebagai orang
luar.
Evaluator harus dilatih melakukan teknik-teknik penilaian

kualitatif. Ini termasuk strategi open ended atau strategi akhir
terbuka untuk mengumpulkan data, seperti observasi dan
wawancara yang semi-struktor. Ini termasuk juga teknik
mengorganisir dan analisis data kualitatif, seperti analisis
impressionistic dan indexing.
Proses Evaluasi. proses evaluasi responsif digambarkan oleh

Stake dengan skema mirip 12 jam, Stake (1975:5) menyajikan
struktur fungsional evaluasi responsif dalam bentuk jam
evaluasi. Dia menekankan bahwa ini bukan jam standar;
bergerak searah jarum jam, berlawanan, atau bersilangan arah
jarum jam. Hal ini adalah cara terbaik diperlukan untuk
memenuhi kebutuhan klien. Penulis menganggap jam hanya
sebagai satu set heuristik bukan pedoman teknis, karena dalam
artikel tersebut tidak dijelaskan atau diilustrasikan
penggunaannya. Oleh karena itu Stake menawarkan skema
sebagai berikut.
46
Gambar 5.1. Struktur Fungsional Evaluasi Responsif Dalam
Bentuk Jam Evaluasi.
Berbicara dengan
nasabah, staf
Satukan dengan laporan program, pemakai Identifikasi ruang
resmi, jika ada lingkup kurikulum
12
Ringkasan format untuk
11 1
Overview aktivitas
digunakan
10 2 kurikulum
Validasi, konfirmasi, dan

Temukan tujuan,
hal yang tidak dapat 9 3 fokus evaluasi
dikonfirmasi
Temasisasi, persiapkan 8 4 Konseptualisasi fokus,

portrayal, studi hal khusus isu, masalah
7 5
Observasi anteseden, 6 Identifikasi data yang
transaksi dan hasil diperlukan
Pilih pengamat, hakim,
instrument, bila
diperlukan
Jam 12: Evaluator berbicara dengan klien, staf program, dan

audien. Pertukaran informasi sering terjadi selama evaluasi
untuk menyentuh berbagai macam topic masalah. Ini juga
termasuk apakah mereka ingin evaluasi dan jika ya, mengapa?
apa yang mereka lihat sebagai pertanyaan penting? apa
pendapat mereka tentang gambaran dari evaluator tentang
nilai pertanyaan, kegiatan, isi kurikulum, produk siswa; dan
sejenisnya. Rupanya, langkah ini adalah salah satu cara untuk
menyelesaikan sebagian besar, jika tidak semua tugas-tugas
lain yang diidentifikasi pada saat jam. Sebuah saran umum,
yang ditawarkan oleh Stake, adalah bahwa evaluator mungkin
menyimpan data dari pertukaran dan berdasarkan tindakan
audien pada pertukaran informasi; seperti merekam, akan
digunakan dalam tugas-tugas seperti mengklarifikasi masalah,
fokus pengamatan, dan pembuatan laporan.
47
Jam 1: Evaluator, bekerja sama dengan klien, memeriksa ruang
lingkup program yang akan dievaluasi. Seringkali apa yang di
dalam dan di luar program dipersepsi beragam dan ambigu.
Penulis menganggap evaluator akan mencoba untuk membawa
beberapa penjelasan dan pengertian tentang kompleksitas
dengan mendefinisikan batas-batas wilayah, periode dan
jangka waktu, karakteristik populasi, area konten, dan
sebagainya. Hasilnya ini meliputi pembatasan beberapa
pengamatan dan memfokuskan penyelidikan. Penulis
menyimpulkan bahwa dalam evaluasi responsif seperti,
keputusan akan fleksibel dan ditinjau kembali secara periodik
selama penelitian.
Jam 2: Evaluator meninjau kegiatan program. Penulis

mengambil ini menjadi agak tidak terstruktur, yang
berhubungan dengan penyelidikan karakterisasi, aktivitas,
sejak langkah ke-7 disebut pengamatan terstruktur
menggunakan beberapa bentuk koleksi data seperti yang
disediakan oleh kertas kerja countenance. Point utama
observasi pada tahap 2 ini, penulis berpikir, adalah untuk
melihat dan mengetahui program tanpa memaksakan terlalu
cepat struktur yang substantif.
Jam 3: Evaluator berupaya menemukan tujuan untuk

mengevaluasi dan memperhatikan banyak orang yang terkait
dengan program (Tujuan yang ditetapkan oleh kelompok-
kelompok tertentu tidak mungkin menjadi tujuan yang mereka
pikirkan sekarang ini). Kelompok-kelompok yang berbeda
mungkin akan melihat tujuan yang berbeda untuk evaluasi.
Salah satu cara mengungkap tujuan yang berbeda untuk
evaluasi ini adalah mendaftar keprihatinan berbagai kelompok
dan kemudian mengetahui masalah yang paling
mengkhawatirkan untuk kelompok.
48
Jam 4: Evaluator menganalisa dan mensintesis masalah mereka,
sebagai memberikan dasar untuk membedakan kebutuhan
data. Untuk mencapai konseptualisasi, evaluator mungkin
mengumpulkan berbagai sudut pandang yang berbeda tentang
apa yang berharga dan tidak berharga dalam program ini dan
apa yang harus ditambahkan. Pasti juga akan berguna untuk
mendapatkan reaksi dari setiap audience tentang
konseptualisasi masalah baru. Stake mengingatkan evaluator
untuk tidak berkeinginan menjadi calo hanya untuk
mendapatkan informasi yang menguntungkan atau tidak
menguntungkan, ia juga memperingatkan mereka tidak hanya
menganggap keprihatinan evaluator dan otoritas luar adalah
layak didiskusikan.
Jam 5: Evaluator mengidentifikasi kebutuhan data dengan

respect untuk menginvestigasi masalah. Ini akan menjadi lebih
interaktif dari awal mula konseptualisasi masalah ', bekerja
bolak-balik antara data potensi dan konteks masalah. Bertujuan
untuk memastikan bahwa data yang berkaitan dengan isu-isu
yang dianggap paling penting oleh khalayak akan
dikumpulkan. Kemudian mengecek kelengkapan data yang
diperlukan, tentu saja, dan evaluator kembali ke point ini
berulang kali.
Jam 6: Evaluator merencanakan pengumpulan data kegiatan:

membuat rencana observasi, memilih pengamat dan instrumen
(jika ada), mengidentifikasi catatan untuk diperiksa, memilih
sampel (jika mungkin), dan mengatur untuk observations dan
mengumpulkan data kegiatan lainnya.
Jam 7: Evaluator mengamati antecedent, transaksi, dan

outcomes. Penulis menganggap evaluator juga dapat
memeriksa program yang masuk akal dan mengumpulkan
49
standar dan penilaian pendahuluan berkaitan dengan program,
transaksi, dan hasil.
Jam 8: Evaluator menganalisis informasi yang diperoleh

dengan mengembangkan tema dilihat dari segi informasi,
menggunakannya untuk menyiapkan gambaran dari program
dan mungkin melakukan studi kasus. Dengan bantuan
pengamat, evaluator mungkin mengembangkan narasi singkat,
menampilkan produk, grafik, menampilkan fotografik, sketsa,
a.sociodrama, presentasi direkam dan sebagainya. Sesuai
dengan prosedur yang disarankan dalam kertas kerja
countenance, evaluator juga bisa melakukan analisis kesesuaian
antara tujuan dan observasi, serta kemungkinan diantara
anteseden, transaction, dan outcomes.
Jam 9: Evaluator memeriksa dan menganalisis validitas

temuan. Berbagai uji kualitas rekaman dilakukan. Program
personil kemudian bereaksi terhadap kualitas penggambaran.
Evaluator mungkin orang yang berbeda mengembangkan hal
yang berlawanan dan anjuran laporan mengenai manfaat
program dan mungkin tunduk kepada “ juri sidang” Dia akan
pergi keluar dari jalan untuk mencari bukti yang akan
temuannya tidak kuat , serta mencari triangulasi dan
konfirmasi.
Jam 10: Evaluator memisahkan dan menyelesaikan format

informasi untuk membuat berguna secara maksimal bagi
audience. Audiens harus diberitahu tentang data dan
pertanyaan yang harus dikumpulkan mengenai yang akan
menjadi bernilai penting bagi mereka. Reaksi harus
dikumpulkan dari kedua figur otoritas dan anggota lain dari
audience. Evaluator kemudian harus merancang komunikasi
sehingga memaksimalkan informasi yang tersedia dalam
50
rangka menanggapi kebutuhan yang berbeda dari audience
yang berbeda.
Jam 11: Evaluator menyiapkan laporan formal jika mereka

meminta. Tergantung pada perjanjian sebelumnya dengan
klien dan kebutuhan audience, sebuah laporan yang dicetak
mungkin tidak diperlukan. Evaluator mungkin menyerahkan
video rekaman pada “juri sidang” dari program atau naskah
untuk sosiodrama dimaksudkan untuk menggambarkan
temuan ini. Secara umum, media harus dipilih yang dapat
diakses penonton dan itu akan meningkatkan komunikasi dan
menjamin kesetiaan pesan.
5.4. Fase-fase Proses Evaluasi Responsif
Model evaluasi responsif merupakan evaluasi yang lebih

menekankan kepada merespon para pemangku kepentingan
program. Proses evaluasi responsif melalui beberapa fase,
yaitu:
Fase 1: Merencanakan dan mengorganisir evaluasi yang berisi

beberapa aktivitas, antara lain: Negosiasi dan kontrak evaluator
dengan klien (yang meminta dilaksanakannya evaluasi). Isi
kontrak: (a) Obyek evaluasi, (b) Tujuan evaluasi, (c) Hak untuk
mengakses dokumen dan informasi, (d) Jaminan kerahasiaan
dan anonimitas responden dan informasi, (e) Identifikasi jenis
dan jumlah pemangku kepentingan serta hak-haknya
Fase 2: Mengidentifikasi para pemangku kepentingan, yang

dilakukan diantaranya yaitu: (a) Mengidentifikasi jenis dan
jumlah pemangku kepentingan; dan (b) Menarik sampel dari
pemangku kepentingan
51
Fase 3: Mengidentifikasi, mengumpulkan, dan menganalisis
informasi mengenai: (a) Obyek yang dievaluasi; (b) Standar
yang akan dipergunakan untuk menilai obyek evaluasi; dan (c)
Pendapat, isu dan nilai-nilai pemangku kepentingand. Metode
yang akan dipergunakano Observasi aturalistic, Wawancara,
Kuesioner, Tes standar
Fase 4: Menyusun laporan dan rekomendasi. Laporan dibahas

dengan pemangku kepentingan dan berupaya mencapai
kesepakatan dengan pemangku kepentingan.
5.5. Kesimpulan
Evaluator memiliki kemampuan menggambarkan dan menilai

program. Evaluator menyediakan layanan untuk orang-orang
tertentu (klien)untuk membantu klien memahami masalah dan
mengungkap kekuatan dan kelemahan dalam program (seperti
yang terlihat oleh berbagai kelompok). Evaluator memiliki
kemampuan berkomunikasi dengan klien yang terjadi secara
alami, informal lebih santai sehingga terjadi pertukaran
informasi terus menerus. Antara evaluator dan klien terlihat
oleh Stake menjadi penting, karena tujuannya adalah untuk
melakukan pencarian terus-menerus untuk pertanyaan kunci
dan untuk menyediakan klien dengan informasi berguna
karena menjadi tersedia. Evaluator mampu melakukan teknik-
teknik penelitian kualitatif, ini termasuk strategi open ended
atau strategi akhir terbuka untuk pengumpulan data, seperti
observasi, wawancara semi-struktur, dan analisa data kualitatif.
52
Bab 6
Model “Tyler”
(Black Box Tyler)
6.1. Pengantar
Perkembangan model-model evaluasi kurikulum di Indonesia

dikemukakan untuk memperlihatkan suatu gejala yang tidak
berbeda dengan perkembangan disiplin ilmu pendidikan dan
upaya-upaya pendidikan yang pernah dilakukan manusia.
Meskipun demikian, sejarah perkembangan bidang evaluasi
kurikulum dan menghasilkan model-model kurikulum yang
memperlihatkan sesuatu yang khas (Suharsimi Arikunto dan Cepi
Safruddin A.J, 2009). Perkembangan model ini awalnya tidak
dilakukan secara khusus tetapi dalam satu nafas dengan model
pengembangan kurikulum.
Keterkaitan model dengan pengembangan kurikulum adalah

faktor yang menarik untuk diamati. Ada model yang
mencakup keseluruhan proses pengembangan kurikulum
(Curicullum Development) tetapi ada juga yang memiliki fokus
khusus pada suatu fase kegiatan pengembangan kurikulum
(Curicullum Construction, Curriculum Implementation dan
dimensi kurikulum sebagai hasil). Dari kenyataan model yang
pernah dikembangkan, harus diakui bahwa fokus pada
implemetasi kurikulum atau sebagai proses lebih banyak
menarik minat para evaluator. Model evaluasi yang
memperhatikan hasil lebih dari fase kegiatan pengembangan
kurikulum lainnya. Model yang dikembangkan Tyler
memperhatikan dimensi kurikulum sebagai suatu hasil.
53
6.2. Model Black Box Tyler
Model yang dikembangkan oleh Tyler didasarkan atas tujuan

instruksional yang telah ditetapkan bersamaan dengan
persiapan mengajar, ketika guru berinteraksi dengan siswanya
menjadi sasaran pokok dalam pembelajaran. Proses
pembelajaran dikatakan berhasil apabila para siswa yang
mengalami pembelajaran dapat mencapai tujuan yang telah
ditetapkan dalam proses belajar mengajar (Sukardi,2009).
Pendekatan ini bersifat sistematis, elegan, akurat dan secara
internal memiliki rasional yang logis. Model Tyler dinamakan
Black Box karena tidak ada nama resmi yang diberikan oleh
pengembanganya. Tyler, yang mengajukan model ini
menuliskan buah pikirannya tersebut tidak dalam suatu tulisan
lepas mengenai evaluasi kurikulum. Tyler mengemukakan
pikirannya mengenai model evaluasi kurikulum tersebut dalam
suatu buku kecil tentang kurikulum. Dengan buku kecil itu
pula namanya terangkat sebagai seorang ahli yang disegani
baik dalam kurikulum maupun dalam evaluasi.
Buku yang diberi judul Basic Principles of Curicullum and

Instruction ditulis Ralph Tyler ketika bertugas sebagai Profesor
di Universitas Chicago pada tahun 1949. Lebih dari 10 tahun
model ini terus digunakan karena kuatnya hubungan antara
model yang dikembangkan dengan tradisi psikometrik yang
menguasai dunia pendidikan di negara Amerika Serikat dan
evaluasi belum merupakan suatu daerah inkuiri yang mandiri.
Dalam implementasinya, model Tyler menggunakan unsur
pengukuran dengan usaha secara konstan, pararel, dengan
inquiri ilmiah dan melengkapi legitimasi untuk mengangkat
pemahaman tentang evaluasi. Fokus model Tyler menekankan
perhatian pada sebelum dan sesudah perencanaan kurikulum.
Selain itu menekankan bahwa perilaku yang diperlukan diukur
54
minimal dua kali yaitu sebelum dan sesudah perlakuan
(treatmen) dicapai oleh pengembang kurikulum (Hamid Hasan,
2008).
Berdasarkan kedua dasar ini, Tyler ingin mengatakan bahwa

evaluasi kurikulum yang yang sebenarnya hanya berhubungan
dengan dimensi hasil belajar. Tyler menghendaki evaluator
dapat menentukan perubahan tingkah laku yang terjadi sebagai
hasil belajar yang diperoleh dari kurikulum. Kenyataan seperti
itu menurut Tyler tidak mungkin dapat ditetapkan apabila
evaluator hanya melihat tingkah laku peserta didik setelah
mereka mengikuti kurikulum tersebut. Ketika menentukan
tujuan kurikulum yang akan dievaluasi harus pula
dipertimbangkan tingkah laku yang bagaimana yang dianggap
merupakan pernyataan bahwa tujuan tersebut telah tercapai.
Menurut model ini seorang evaluator harus dapat menentukan
jenis tingkah laku yang harus diperlihatkan peserta didik
sesuai dengan materi yang dipelajarinya. Di sini evaluator
dituntut untuk mengembangkan kisi-kisi tujuan yang akan
dievaluasi dalam tabel dua dimensi. Tabel dua dimensi yaitu
dimensi tingkah laku dan dimensi materi. Tabel tersebut dapat
dikembangkan dengan baik apabila para pengembang
kurikulum dan guru telah merumuskan tujuan belajar yang
harus dicapai peserta didik dalam bentuk behavioral objectives.
Adanya taksonomi tujuan pendidikan yang dikembangkan
Bloom bertujuan dapat memberikan arahan bagi perencanaan
hasil belajar yang terukur.
Dikutip dari buku Bloom, 1981 model Black Box digambarkan

bahwa preactive teaching merupakan bagian perlakuan sebelum
guru masuk kedalam kelas sedangkan Interactive teaching
merupakan wilayah proses pembelajaran yang dilakukan guru
sendiri. Proses terjadi dalam pembelajaran yang interaktif
berdasarkan tujuan pembelajaran. Siklus evaluasi terjadi
55
dengan membandingkan hasil belajar ataupun perubahan
perilaku berdasarkan tujuan sebelum pembelajaran dengan
hasil dicapai setelah proses belajar berlangsung. Data hasil
evaluasi dapat melalui hasil tes sumatif.
6.2.1. Tujuan Model Tyler
Model Tyler mengharapkan agar pengembang

kurikulum/program merumuskan tujuan kurikulum/program
dalam bentuk behavioral objectives. Seringkali terjadi, evaluator
harus berkonsultasi terlebih dahulu dengan para pengembang
kurikulum mengenai tujuan apa yang akan dievaluasi
mengenai tingkat pencapainnya. Tahun 1982, Braithwaite dan
Koop memberikan contoh menerapkan model black box Tyler
untuk mengevaluasi penataran yang dilakukan di bagian barat
metropolitan Sydney. Mereka membicarakan tujuan program
yang akan dievaluasi dan mengembangkan tujuan tersebut
dalam bentuk tujuan bahavioral atau juga sering diistilahkan
dengan tujuan yang operasional. Karena itu evaluasi program
yang menggunakan model Tyler mestinya memerlukan
informasi perubahan tingkah laku pada dua titik waktu yaitu
sebelum dan sesudah belajar dari suatu kurikulum. Dalam
istilah yang banyak digunakan sekarang diperlukan adanya tes
awal (pretest) dan tes akhir (posttest) untuk mengumpulkan
kedua informasi tersebut. Dalam kata-katanya sendiri (Tyler
1949:106 dalam Hasan, 2008) menulis, “On this basis, one is able
to evaluate an instructional program by testing students only at
the end of the program. Without knowing where the students
were at the beginning, it is not possible to tell how far changes
have taken place”. Informasi yang diperoleh dari tes awal
merupakan gambaran kemampuan awal peserta didik
sedangkan informasi yang diperoleh dari hasil tes akhir
menggambarkan perubahan perilaku yang diperoleh peserta
didik setelah mengikuti proses pendidikan melalui kurikulum
56
tersebut. Alat ukur yang digunakan pada waktu tes awal dan
tes akhir harus sama, memiliki validitas konten yang tinggi dan
realibilitas tinggi pula. Persyaratan validitas dan realibilitas
mutlak untuk memberikan keyakinan bahwa informasi yang
diperoleh informasi awal dan tes akhir tersebut
menggambarkan kemampuan peserta didik pada waktu
mengikuti tes.
Model Tyler tidak memberikan perhatian mengenai proses

yang terjadi antar kedua tes tersebut dan oleh karena itu model
Tyler ini dikenal dengan nama black box. Apabila model ini
digunakan dengan desain eksperimen maka bagian proses
mungkin saja terjadi sesuai dengan apa yang diharapkan dari
suatu kurikulum. Tetapi ketika model ini digunakan dengan
desain penelitian deskriptif dan proses yang terjadi tidak
dievaluasi maka ada kekhawatiran bahwa sesungguhnya apa
yang terjadi pada diri peserta didik dalam proses tidak seperti
yang dirancang oleh kurikulum. Karena itu bagian proses ini
dianggap sebagai kotak hitam yang menyimpan segala macam
teka teki.
6.2.2. Prosedur Penggunaan Evaluasi Program Model Tyler
Pada pelaksanaannya Tyler mengemukakan ada tiga prosedur

utama yang harus dilakukan. Ketiga prosedur yang dimaksud
Tyler tersebut ialah:
Pertama, Menentukan tujuan kurikulum yang akan

dievaluasi.
Pengembangan kurikulum/program yang dipersyaratkan

behavioral objectives seperti yang dikemukakan Tyler memang
sudah umum dilakukan di Indonesia. Model tujuan behavioral
ini diperkenalkan sejak diberlakukannya kurikulum 1975,
57
mewajibkan guru mengembangkan satuan pelajaran dengan
menggunakan Prosedur Pengembangan Sistem Instruksional
(PPSI). Tyler mengemukakan persyaratan tersebut, tujuan
dengan rumusan yang demikian masih merupakan sesuatu
yang baru bagi dunia pendidikan Amerika Serikat. Pada
gagasan Tyler ini yang kemudian mengilhami Bloom dan
kawan-kawannya mengembangkan ide tersebut menjadi
taksonomi tujuan pendidikan yang terkenal dengan nama
taksonomi tujuan pendidikan Bloom. Taksonomi Bloom dkk,
yang kemudian banyak diterapkan di Indonesia melalui
pengembangan Tujuan Instruksional Khusus (TIK) merupakan
salah satu komponen dalam model PPSI. Pada saat ini model
PPSI sudah tidak digunakan tetapi tujuan yang terukur dan
teramati masih tetap dianjurkan. Proses pengembangan KTSP
harus mengembangkan tujuan behavioral ini jika berkenaan
dengan model kurikulum berbasis kompetensi.
Kedua, Menentukan situasi di mana peserta didik

mendapatkan kesempatan untuk memperlihatkan tingkah
laku yang berhubungan dengan tujuan.
Model Tyler tampak sederhana tetap sangat menentukan

keberhasilan evaluasi model Tyler. Apabila situasi yang
ditetapkan tidak tepat, tingkah laku peserta didik yang
diharapkan tidak akan terungkapkan dengan baik atau dengan
kata lain proses pembelajaran yang terjadi tidak
mengungkapkan hasil belajar yang dirancang kurikulum.
Dengan kata lain, tujuan kurikulum tidak terevaluasi
sebagaimana seharusnya.
Ketiga, Menentukan alat evaluasi yang akan digunakan

untuk mengukur tingkah laku peserta didik.
58
Keeratan hubungan pada prosedur pertama dan kedua,
demikian pula halnya keertan hubungan antara langkah kedua
dengan langkah ketiga. Pada waktu evaluator menentukan
situasi dalam langkah kedua secara implisit sebenarnya
evaluator telah menentukan langkah ketiga yaitu penentuan
alat evaluasi yang akan digunakan. Alat evaluasi dapat
berbentuk tes dan alat ini adalah alat yang banyak digunakan
orang. Tetapi alat evaluasi dapat pula berbentuk alat bukan tes
seperti panduan observasi, kuesioner, panduan wawancara
(interview guide) dan lain sebagainnya. Ketika evaluator
menentukan situasi dimana peserta didik diharapkan dapat
mengemukakan hasil belajar dengan baik, evaluator harus
memiliki pengetahuan tentang karakteristik alat tersebut,
kekuatan dan kelemahan yang ada dihubungkan dengan
tujuan yang diukur.
Meskipun secara implisit evaluator telah menentukan alat

evaluasi yang akan digunakan, evaluator masih harus
menyatakannya secara eksplisit. Evaluator harus merancang
jenis alat evaluasi yang akan digunakan serta tujuan yang akan
diukur dengan alat evaluasi tersebut. Kemudian, model
evaluasi kurikulum Tyler menghendaki evaluator untuk
melakukan kajian mengenai alat evaluasi yang tersedia.
Pertanyaan pokok disini ialah apakah alat evaluasi yang
tersedia sesuai dengan tujuan yang akan diukur. Menurut Tyler
(1949: 113) (dalam Hasan,2008), “It is only after the objectives have
been identified, clearly defined, and the situations listed which give
oppurtunity for the expression of the behaviour desired that it is
possible to examine available evaluation instruments to see how for
they may serve the evaluation purpose desired”. Evaluator dapat
menggunakan instrumen yang sudah tersedia jika instrumen
tersebut memang cocok untuk informasi yang akan
dikumpulkan. Misalnya, seorang evaluator ingin mengukur
sikap kebangsaan peserta didik dan instrumen untuk
59
mengukur sikap kebangsaan sudah tersedia maka evaluator
boleh menggunakan instrumen tersebut. Tetapi jika instrumen
yang sudah ada itu megukur berbagai aspek dari sikap
kebangsaan yang berbeda dengan apa yang dirancang maka
evaluator tadi harus mengembangkan instrumen baru yang
sesuai dengan konstrak sikap kebangsaan yang diinginkan.
Yang terakhir dilakukan, mengembangkan instrumen baru,
evaluator tersebut harus mengembangkan instrumen sesuai
dengan prosedur yang dipersyaratkan oleh teori pengukuran.
Evaluator harus menjamin bahwa instrumen yang baik
menurut persyaratan pengukuran seperti validitas isi, validitas
konstrak karena berkaitan dengan konstrak sikap kebangsaan,
realibilitas. Prosedur untuk menguji validitas dan realibilitas ini
harus diikuti dengan ketat (John M. Owen. 2006).
Dalam mengukur hasil belajar, validitas isi yang tinggi

memberikan jaminan bahwa hasil belajar yang diukur sesuai
dengan hasil belajar yang diharapkan dimiliki peserta didik.
Reliabilitas yang tinggi memberikan jaminan bahwa instrument
tadi secara konsisten akan memberikan hasil yang sama
walaupun dilakukan di sekolah yang berbeda dan dalam
waktu yang berbeda. Instrumen yang memiliki reliabilitas
tinggi akan menempatkan seseorang sesuai dengan
kemampuan yang dimilkinya.
6.3. Kesimpulan
Hal yang penting dari hasil evaluasi adalah: (1) pengarahan

hasil evaluasi mampu membantu mengubah perilaku dari yang
sebelumnya; (2) Keberhasilan pencapaian akan selalu
dievaluasi; dan (3) Keberhasilan pencapaian tujuan didapat
dari evaluasi sumatif dan formatif yang hasilnya dilaporkan
kepada penanggung-jawab program. Keunggulan evaluasi
Tyler adalah kesederhanaan modelnya dan mudah dipahami
60
sehingga evaluator dapat memfokuskan kajian evaluasinya
hanya pada satu dimensi kurikulum yaitu dimensi hasil belajar.
Dimensi kurikulum seperti proses tidak menjadi fokus. Dari
evaluasi ini dihasilkan informasi yang pada umumnya
pendidik setuju karena sesuai dengan misi mereka. Bahan
pustaka bervariasi dan evaluasi ini dapat merefleksikan apa
yang dimaksud dan menjelaskan generalisasi yang rancu
tentang hasil pendidikan (Muzayanah, 2007)
Kelemahan dari model ini adalah fokus pada hasil belajar

mengabaikan proses tidak sejalan dengan pendidikan. Hasil
belajar adalah produk dari proses belajar dan oleh karena itu
hasil belajar yang diperoleh peserta didik hanya dapat
dijelaskan dari proses belajar yang mereka alami.Bahkan
implementasi kurikulum seringkali tidak sesuai dengan apa
yang dikehendaki oleh kurikulum sebagai rencana. Oleh
karena itu, proses merupakan variabel penting dalam kegiatan
evaluasi (Hasan, 2008). Selain itu, evaluasi ini memiliki
kelemahan adanya kesenjangan penilaian antara tahap kinerja
dengan tujuan, mengabaikan perubahan yang terjadi selama
program dievaluasi dan mengabaikan peristiwa dalam
program yang tidak merefleksikan tujuan (Muzayanah, 2007).
61
62
Bab 7
Model Iluminatif
7.1. Pengantar
Illuminative model evaluation atau model evaluasi illuminatif

adalah salah satu model evaluasi yang muncul untuk
menanggapi model – model evaluasi yang sebelumnya telah
ada. Evaluasi yang berkembang lebih dulu adalah model-
model evaluasi kuantitatif yang bersifat menyederhanakan dan
dianggap tidak mampu memberikan pemahaman mendalam
terhadap suatu masalah. Model evaluasi illuminatif adalah
bagian dari model evaluasi naturalistik yang selama ini banyak
dipakai oleh orang-orang yang berkecimpung dalam bidang
antropologi. Model evaluasi illuminatif banyak dikembangkan
di Inggris yang kemudian menyebar ke seluruh dunia.
Model illuminatif sebenarnya sudah dilaporkan

penggunaannya oleh Hanley (1969), tetapi baru menjadi
populer setelah adanya tulisan Parlett dan Hamilton,
“Evaluation as Illumination: A New Approach to the Study of
Innovatory Programs” pada (1976). Oleh karenanya, kebanyakan
tulisan mengenai model ini, seperti Stenhouse (1979) dan
Scrimshaw (1979) merujuk kepada tulisan Parlett dan Hamilton
tersebut. Tawney dalam Curriculum Evaluation Today: Trends and
Application (1976) pun menggunakan tulisan Parlett dan
Hamilton sebagai rujukan.
Model illuminatif dianggap sebagai model yang perlu dikaji,

karena dianggap merupakan model pertama yang secara utuh
63
menyatakan dirinya sebagai alternatif bagi model – model
evaluasi yang dikembangkan dari tradisi kuantitatif.
Munculnya ‘evaluasi naturalistik' yang dimotori oleh Barry

MacDonald, Lawrence Stenhouse, David Hamilton dan
Malcolm Parlett di Inggris, dan Robert E. Stake, Louis Smith
serta Elliot Eisner di Amerika Serikat di bidang evaluasi
pendidikan berawal dari suatu keyakinan yang kuat bahwa
pendekatan kualitatif yang didasarkan pada paradigma
antropologis deskriptif dan interpretatif secara efektif dapat
memberikan kontribusi pada proses melukiskan, mendapatkan
dan memberikan informasi yang berguna untuk membuat
keputusan dan penilaian (Stufflebeam dkk., 1971). Model
evaluasi illuminatif mendasarkan dirinya pada paradigma
antropologi sosial sehingga model ini lebih memberikan
perhatian terhadap lingkungan luas. Sebagai contoh, dalam
evaluasi kurikulum, evaluasi illuminatif dilakukan tidak hanya
pada kelas dimana suatu inovasi kurikulum dilaksanakan.
Perhatian terhadap lingkungan luas ini merupakan dalah satu
kekuatan model illuminatif. Menurut Hasan (2008:234), bagi
Indonesia, perhatian yang luas dari model illuminatif dapat
memberikan kemungkinan pemahaman terhadap KTSP suatu
kesatuan pendidikan yang lebih baik.
Paradigma kuantitatif dalam evaluasi tradisional dipandang

sebagai hal yang masih dapat diperdebatkan dan kurang
memuaskan dalam memberikan informasi yang akurat dan
berguna untuk meningkatkan pemahaman dan memfasilitasi
pengambilan keputusan dalam inovasi kurikulum.
Penyederhanaan atas perubahan perilaku/sikap siswa yang
kemudian diukur dengan psikometri, yang merupakan inti dari
pendekatan kuantitatif, belum mampu membantu 'stake holders'
untuk membawa perbaikan dalam praktek pendidikan di
sekolah-sekolah.
64
Untuk itulah kemudian muncul model evaluasi yang diambil
dari perspektif antropologi sosial untuk pendekatan evaluasi,
dan metodologi evaluasi illuminatif berupaya untuk
menyediakan informasi mendalam dan lebih realistis dan
holistik yang membantu para pengambil keputusan dalam
mewujudkan perbaikan.
7.2. Konsep Evaluasi Illuminatif
Seperti dikatakan oleh pengembangnya, Parlett dan Hamilton,

tujuan evaluasi illuminatif adalah, “to study the innovatory
project: how it operates, how it is influenced by the various school
situations in which it is applied; what those directly concerned regard
as its advantages and disadvantages; and how students intellectual
tasks and academic experiences are most affected” (Parlett dan
Hamilton, 1976:89). Richards (1985) menguraikan evaluasi
iIluminatif adalah sebuah Evaluasi Aksi Budaya. Ia menyatakan
bahwa evaluasi illuminatif adalah strategi penelitian budaya
yang dibangun untuk meminimalkan penggunaan prosedur
statistik, meski tidak melarang penggunaannya. Evaluasi ini
juga menggunakan metode subjektif, dan terutama evaluasi ini
lebih tertarik pada fungsi sebagai pemberi informasi yang lebih
baik daripada penelitian biasa.
Dia menyatakan bahwa evaluasi illuminatif adalah: holistik –

evaluator secara ketat menghadirkan berbagai konteks program
yang sedang dievaluasi dan mencari informasi sebanyak-
banyaknya untuk menggambarkan program ini sebagai sebuah
program evaluasi yang menyeluruh dan diperiksa secara
simultan dari perspektif yang berbeda. Responsif –peneliti
dengan ketat mengumpulkan informasi dari semua pihak yang
terkait dengan program yang akan benar-benar berguna bagi
pelaporan.
65
Joan Poliner Shapiro, wakil dekan di College of Education di
Temple University, telah melakukan penelitian dan menulis
tentang pendekatan illuminatif dan pendekatan penilaian
partisipatif. Dalam tulisan-tulisannya Shapiro fokus terutama
pada evaluasi illuminatif sebagai pendekatan untuk menilai
penelitian studi perempuan dan program proyek. Sebagaimana
yang dijelaskan oleh Shapiro, evaluasi illuminatif merupakan
alternatif model evaluasi yang pertama untuk menangani
beberapa dari kritik dan pertanyaan yang diajukan oleh feminis
dan evauasi pendidikan non-tradisional.
Model evaluasi illuminatif digunakan sebagai contoh

pendekatan non tradisional untuk mengukur keberhasilan atau
kegagalan proyek-proyek inovatif meliputi modus
fenomenologis dan juga etnografi. Evaluasi illuminatif tidak
hanya menggunakan teknik observasi partisipan, wawancara,
dan analisis dokumen dalam bentuk studi kasus, tetapi juga
memasukkan kuesioner dan instrumen kuantitatif lainnya bila
dianggap sesuai. Keuntungan dari evaluasi illuminatif adalah
bahwa baik metode kualitatif dan kuantitatif dapat
dikombinasikan untuk "menerangi subjek."
Perhatian utama evaluasi illuminatif, seperti yang diterangkan

oleh Parlett dan Hamilton (1972), adalah dengan deskripsi dan
interpretasi daripada dengan cara pengukuran dan
pembenaran. Metode ini merupakan bagian integral dari
paradigma kualitatif. ‘It 'seeks to address and illuminate a complex
array of questions' (Trow, 1970). Adanya penilaian, menurut
model ini bertujuan untuk mengadakan studi yang cermat
terhadap sistem yang bersangkutan. Studi difokuskan pada
permasalahan bagaimana implementasi suatu sistem
dipengaruhi oleh situasi sekolah, tempat sistem tersebut
dikembangkan, keunggulan, kelemahan, serta pengaruhnya
66
terhadap proses belajar siswa. Hasil evaluasi ditekankan pada
deskripsi dan interpretasi, bukan pengukuran dan prediksi
sebagaimana model sebelumnya. Dalam pelaksanaan evaluasi,
model ini lebih menekankan penggunaan judgment, selaras
dengan semboyan the judgment is the evaluation.
Dalam evaluasi kurikulum, objek evaluasi yang diajukan dalam

model ini mencakup; latar belakang dan perkembangan yang
dialami oleh sistem yang bersangkutan, proses implementasi
(pelaksanaan) sistem, hasil belajar yang diperlihatkan oleh
siswa, serta kesukaran-kesukaran yang dialami dari tahap
perencanaan hingga implementasinya di lapangan. Di samping
itu, dampak yang ditimbulkan dari suatu sistem seperti;
kebosanan yang terlihat pada siswa dan guru, ketergantungan
secara intelektual, hambatan terhadap perkembangan sikap
sosial, dan sebagainya. Ringkasnya, objek evaluasi dalam
model ini meliputi kurikulum yang terlihat maupun
tersembunyi (hidden curriculum).
Evaluasi illuminatif dikembangkan atas dasar dua dasar

konsep utama, yaitu sistem pembelajaran (instructional system)
dan lingkungan belajar (learning milieu). Dalam sebuah evaluasi
kurikum, sistem instruksional (instructional system) diartikan
sebagai katalog, prospektus, dan laporan – laopran
kependidikan yang secara khusus berisi berbagai macam
rencana dan pernyataan yang resmi berhubungan dengan
pengaturan suatu pengajaran. Dengan kata lain, para evaluator
illuminatif melihat sistem pembelajaran, yang pada dasarnya
adalah berupa katalog pendidikan, buku-buku dan laporan
yang berisi berbagai rencana formal dan laporan yang
berkaitan dengan pengaturan pengajaran tertentu, yang
merupakan seperangkat asumsi pedagogis, silabus-silabus
baru, dan rincian teknik dan peralatan, sebagai suatu sistem
yang ketika diadopsi dan beroperasi dalam lingkungan tertentu
67
akan mengalami modifikasi, reinterpretasi dan mungkin
berubah.
Meskipun sistem pembelajaran (kurikulum) dapat

dipertahankan sebagai sebuah gagasan yang ideal, namun
bentuk aplikasinya kemudian dapat berubah-ubah dan berbeda
tergantung dari interpretasi dan pemahaman yang ditangkap
oleh guru, kepala sekolah, orang-orang kedinasan dan
siswanya sendiri. Sehingga aplikasinya bisa jadi sangat
berbeda-beda dari sekolah ke sekolah yang lainnya.
Sedangkan lingkungan belajar (learning milieu) diartikan

sebagai lingkungan sosial-psikologis dan materi di mana siswa
dan guru berinteraksi. Ini merupakan suatu jaringan budaya,
variabel-variabel lainnya seperti sosial, kelembagaan dan
psikologis yang berinteraksi dengan cara yang rumit untuk
menghasilkan pola keadaan yang unik, tekanan, adat istiadat,
pendapat dan gaya kerja yang meliputi pengajaran dan
pembelajaran yang terjadi. Konfigurasi lingkungan belajar ini
tergantung pada pola interaksi dan gaya dari berbagai faktor-
faktor yang berbeda; berbagai kendala administrasi di
organisasi pengajaran di sekolah, asumsi operasional dan
pengalaman staf pedagogik; karakteristik individu guru, dan
siswa.
Evaluasi illuminatif mengakui keragaman dan kompleksitas

lingkungan belajar serta peran pentingnya dalam
mempengaruhi inovasi pendidikan dan
pelaksanaannya. Pengenalan suatu inovasi yang memicu reaksi
berantai seluruh lingkungan pembelajaran dapat membawa
akibat-akibat yang tak diharapkan, yang pada gilirannya
mempengaruhi inovasi. Sehingga studi tentang pembelajaran
lingkungan menjadi perlu untuk menganalisis keterkaitan
antara proses belajar dan mengajar, dan untuk
68
menghubungkan organisasi (departemen/lembaga
pendidikan/sekolah) dengan prakteknya dalam jangka panjang
pada siswa. Evaluasi kinerja siswa, hasil pembelajaran,
pengembangan intelektual siswa dan perubahan perilaku, tidak
akan dapat sepenuhnya dipahami tanpa pemahaman
mendalam tentang lingkungan belajar tertentu serta
budayanya.
Deskripsi lain yang jelas tentang lingkungan belajar dapat

diambil dari Parlett dan Dearden (1977), adalah sebagai sebuah
lingkungan psikologi-sosial dan lingkungan material di mana
guru dan siswa bekerja sama, sebuah jaringan atau hubungan
budaya, sosial, kelembagaan, dan variabel psikologis yang unik
untuk setiap situasi pendidikan. Lingkungan mencakup
berbagai hukum, administrasi, pekerjaan, arsitektur dan
kendala keuangan yang mempengaruhi bagaimana proses
belajar-mengajar diselenggarakan di sekolah-sekolah (Parlett
dan Dearden, 1977). Konsep lingkungan belajar diperlukan
untuk menganalisis ketergantungan pada proses pembelajaran
dan untuk menarik berhubungan antara organisasi dan praktek
yang disertai instruksi dengan jawaban siswa (Parlett dan
Dearden, 1977). Perkembangan intelektual siswa tidak dapat
dipahami jika dipisahkan dari konteks belajar dalam
lingkungan sekolah.
7.3. Metode Evaluasi Illuminatif
Dalam pengertian metodologis dikatakan bahwa model

evaluasi illuminatif bukanlah suatu paket model yang standar.
Model illuminatif bersifat adaptif dan eklektik. Oleh karena itu
berbagai model yang tersedia dapat digunakan dalam model
evaluasi illuminatif asalkan metode tersebut sesuai dengan
persoalan yang dihadapi. Selain itu model illuminatif tidak
terikat pada satu jenis data tertentu yang harus dikumpulkan.
69
Baik data kuantitatif maupun data kualitatif mempunyai
kedudukan yang sama dan saling mengisi (Hasan, 2008:235).
Evaluasi illuminatif adalah suatu bentuk penelitian naturalistik

dan menggunakan strategi penelitian yang umum dalam
paradigma kualitatif untuk penjajakan secara holistik (Parlett
dan Hamilton, 1972). Evaluasi jenis ini telah diidentikkan
sebagai jenis evaluasi yang deskriptif dan interpretatif.
Tugas utama evaluator illuminatif adalah untuk mempelajari,

menjelaskan dan melaporkan realitas sehari-hari subjek yang
dipilihnya dengan mengambil pendekatan antropologi
sosial. Evaluator harus memiliki perhatian dengan fitur-fitur
yang signifikan, melukiskan siklus sebab dan akibat,
memahami hubungan antara keyakinan dan praktiknya, serta
mengamati pola-pola yang telah ditetapkan (oleh organisasi)
dan tanggapan individu terhadapnya.
Parlett dan Hamilton menegaskan bahwa evaluasi tidak cukup

berupa klaim saja meskipun evaluator tradisional mengabaikan
hal ini. Evaluator tradisional dikendalikan oleh paradigma
untuk selalu mencari temuan yang bersifat umum dan terjadi
secara bersama sehingga definisinya tentang realitas empiris
adalah sempit sehingga efeknya adalah bahwa ia mengalihkan
perhatian dari pertanyaan-pertanyaan dari praktik pendidikan
terhadap keprihatinan birokrasi yang lebih terpusat.
Mereka mengkontraskan bentuk evaluasi tradisional dengan

apa yang mereka sebut evaluasi illuminatif dan paradigma
sosial-antropologi. Mereka berpendapat bahwa bentuk
evaluasi:
• Memperhitungkan konteks yang lebih luas, dan,
• Terutama berkaitan dengan deskripsi dan interpretasi
daripada pengukuran dan prediksi.
70
Evaluasi illuminatif meliputi tiga tahapan; pengamatan,
penyelidikan lebih lanjut, dan penjelasan lajutan. Ketiga
tahapan ini saling tumpang tindih dan saling berhubungan
secara fungsional satu sama lain seperti mengembangkan
model investigasi. Dimulai dengan basis data yang luas, dan
kemudian secara sistematis semakin memberikan perhatian
terhadap fenomena unik dan fenomena yang tidak
terduga. Empat sumber data yang digunakan dalam
penyusunan informasi adalah observasi, wawancara, kuesioner
dan tes, disamping dokumen-dokumen dan latar belakang.
Dalam langkah pelaksanaannya, model evaluasi illuminatif

memiliki 3 kegiatan, yaitu:
Pertama, Tahap pertama adalah mengamati (observe). Pada

tahap ini, evaluator mengunjungi sekolah atau lembaga yang
sedang mengembangkan sistem tertentu. Evaluator
mendengarkan dan melihat berbagai peristiwa, persoalan, serta
reaksi dari guru maupun siswa terhadap pelaksanaan sistem
tersebut. Evaluator dapat melakukan studi dokumen,
wawancara, menyebarkan kuesioner dan melakukan tes untuk
mengumpulkan informasi yang diperlukan. Data hasil
obeservasi ini merupakan bekal utama bagi evaluator untuk
bekerja. Dari data yang berhasil dikumpulkan, evaluator
menemukan isu pokok; kecenderungan yang sering muncul,
dan persoalan – persoalan penting lain yang terjai dalam
pelaksanaan suatu program. Isu pokok, kecenderungan, serta
persoalan yang teridentifikasi merupakan pedoman bagi
evaluator untu masuk kedalam langkah berikutnya. Isu,
kecenderungan dan persoalan tersebut diteliti lebih lanjut
dalam langkah kedua.
71
Kedua, Tahap kedua adalah penyelidikan lebih lanjut (inquiry
further). Pada tahap ini, evaluator tidak berpegang teguh pada
temuannya dalam langkah pertama. Seperti telah dikemukakan
sebelumnya, temuan tersebut hanyalah bersifat pedoman bagi
evaluator. Dalam langkah kedua, perubahan – perubahan dari
hasil langkah pertama masih dimungkinkan. Misalnya, isu
yang telah ditemukan pada langkah pertama harus diganti
dengan isu baru karena isu yang ditemukan pada langkah
pertama sudah tidak relevan lagi. Ada isu baru yang
berkembang dan lebih relevan. Dengan demikian terjadi fokus
baru dalam evaluasi.
Dalam penyelidikan lebih lanjut ini evaluator memantapkan

isu, kecenderungan, serta persoalan – persoalan yang ada
sampai suatu titik dimana evaluator menarik kesimpulan
bahwa tidak ada lagi persoalan baru yang muncul. Pada titik
tersebut, evaluator yakin bahwa sudah tidak ada lagi persoalan
lain yang mungkin lebih penting dibandingkan dengan
persoalan yang telah diidentifikasi. Artinya persolan yang ada
pada evaluator sudah memiliki validitas permasalahan yang
sudah tidak diragukan lagi.
Ketiga, Tahap ketiga adalah penjelasan lanjutan (seek to explain).

Pada tahap ini, evaluator mulai meneliti sebab akibat dari
masing-masing persoalan. Pada tahap ini, faktor-faktor yang
menyebabkan timbulnya persoalan dicoba untuk ditelusuri.
Data semula terpisah satu dengan lainnya mulai disusun dan
dihubungkan dalam kesatuan situasi. Langkah selanjutnya
dilakukan interpretasi data yang diharapkan dapat dijadikan
bahan dalam pengambilan keputusan.
Dari langkah-langkah tersebut, faktor penting dalam evaluasi

model ini adalah perlunya kontak langsung antara evaluator
dengan pihak yang dievaluasi. Hal ini disebabkan model ini
72
menggunakan pendekatan kualitatif yang menekankan
pentingnya menjalin kedekatan dengan orang dan situasi yang
sedang dievaluasi agar dapat memahami secara personal
realitas dan hal-hal rinci tentang program atau sistem yang
sedang dikembangkan. Di samping itu, faktor lainnya adalah
pandangan yang holistik dalam evaluasi, yang berasumsi
bahwa keseluruhan adalah lebih besar daripada sejumlah
bagian-bagian.
Melalui observasi dan dokumentasi kegiatan sehari-hari serta

kehadiran dalam berbagai kegiatan sekolah, data dan informasi
pendahuluan dapat dikumpulkan. Wawancara peserta dan
individu yang terkait lainnya akan ditambahkan setelah
mendapatkan pemahaman yang lebih baik tentang pandangan
dan sikap individu-individu tersebut terhadap
inovasi. Penggunaan kuesioner, survei, komentar tertulis,
checklist dan bahan non-tes lainnya akan membantu
memverifikasi temuan tentatif sebelumnya. Demikian pula,
dokumen-dokumen lain yang relevan dan latar belakang
informasi dari sumber-sumber resmi dan setengah resmi akan
memberikan pemahaman yang lebih mendalam tentang
'kejadian'. Parlett dan Hamilton menyarankan bahwa evaluasi
illuminatif berkonsentrasi pada pengumpulan informasi
daripada komponen pengambilan keputusan evaluasi. Tugas
utama evaluator adalah untuk memberikan pemahaman yang
komprehensif tentang realitas kompleks yang ada di sekitar
proyek.
7.4. Keunggulan dan Kelemahan Evaluasi Model

Illuminatif
7.4.1. Keunggulan Evaluasi Model Illuminatif
73
Model illuminatif menekankan pentingnya penilaian yang
kontinu selama proses pelaksanaan pendidikan sedang
berlangsung. Jarak antara pengumpulan data dan laporan hasil
penilaian cukup pendek sehingga informasi yang dihasilkan
dapat digunakan pada waktunya.
7.4.2. Keterbatasan Evaluasi Model Illuminatif
Kelemahan terutama terletak pada segi teknis pelaksanaannya

yang meliputi: (1) Kegiatan penilaian tidak didahului oleh
adanya perumusan kriteria secara eksplisit; (2) Objektivitas
penilaian yang dilakukan perlu dipersoalkan; (3) Adanya
kecenderungan untuk menggunakan alat penilaian yang
“terbuka” dalam arti kurang spesifik dan berstruktur; dan (4)
Tidak menekankan pentingnya penilaian terhadap program
bahan-bahan kurikulum selama bahan-bahan tersebut disusun
dalam tahap perencanaan.
7.4.3. Kontribusi Model Illuminatif
Sumbangan terbesar model illuminatif adalah kritikannya

terhadap penggunaan model scientific experiment dalam
penilaian pendidikan yang dirasakan kurang tepat. Pendidikan
sebagai upaya “memanusiakan manusia” tidak dapat
dideskripsikan secara matematis. Aspek-aspek kemanusiaan
tidak semuanya dapat dilakukan pengukuran secara mudah
dan tepat, seperti perasaan, sikap, motivasi, semangat, dan
sebagainya.
7.5. Kesimpulan
Evaluasi illuminatif, sebagai sebuah strategi/model evaluasi

tidak dibuat untuk objektivitas sempurna. Evaluasi tidak
seharusnya bebas nilai. Evaluasi illuminatif juga merupakan
74
suatu bentuk penilaian yang dapat disebut bebas-tujuan (goal-
free evaluation) dan dengan demikian, sangat berguna untuk
mengevaluasi program-program baru ketika efek jangka
panjang tidak dapat diantisipasi. Pendekatan illuminatif juga
memiliki sejumlah kualitas yang tampaknya akan membuatnya
cocok untuk menilai program-program studi keperempuanan.
Sebelum metode ini digunakan, bagaimanapun juga, kekuatan
dan kelemahan sebagai sebuah metodologi/cara, harus
sepenuhnya dieksplorasi untuk memastikan apakah cocok atau
tidak untuk program yang hendak dievaluasi.
75
76
Bab 8
Model Berorientasi Tujuan
(Goal Oriented Evaluation)
8.1. Pengantar
Evaluasi pendidikan merupakan alat untuk mengevaluasi hal-

hal yang berkenaan dengan pendidikan seperti evaluasi hasil
belajar, evaluasi kinerja, evaluasi diri, dan evaluasi program.
Evaluasi adalah suatu tindakan sebagai atau kegiatan (yang
dilaksanakan dengan maksud untuk) atau suatu proses (yang
berlangsung dalam rangka) menentukan nilai dari segala
sesuatu dalam dunia pendidikan (yaitu segala sesuatu yang
berhubungan dalam, atau yang terjadi di lapangan
pendidikan). Atau singkatnya evaluasi pendidikan adalah:
kegiatan atau proses penetuan nilai pendidikan, sehingga dapat
diketahui mutu/hasil-hasilnya. Secara umum evaluasi
merupakan alat untuk mengevaluasi hasil belajar secara
kuantitatif.
Evaluasi program secara umum merupakan evaluasi yang

digunakan untuk mengevaluasi suatu program secara
mendalam dan menghasilkan justment yang dapat memiliki
dampak pada institusi atau suatu program yang di
evaluasifikasikan dan menjelaskan tiga paradigma. Evaluasi
program adalah suatu metode sistematis untuk
mengumpulkan, menganalisis dan menggunakan informasi itu
untuk menjawab pertanyaan dasar tentang program, kebijakan
dan pelaksanaannya.
77
Paradigma dalam program evaluasi menurut Potter (2006)
mengidentifikasi dan menjelaskan paradigm yang luas dalam
evaluasi program, yang pertama dan yang paling umum,
adalah pendekatan positivis, evaluasi hanya dapat terjadi di
mana terdapat “objektif”, aspek yang dapat diamati dan
terukur dari sebeuah program, yang membutuhkan bukti-bukti
kuantitatif domain. Pendekatan positivis mencakup dimensi
evaluasi seperti kebutuhan penilaian, penilaian teori program,
penilaian proses program, penilaian dampak dam penilaian
efisiensi (Rossi, Lipsey dan Freeman, 2005). Kedua, paradigma
yang diidentifikasi oleh Potter (20006) bahwa pendekatan
inteerpretatif, di mana ia berpendapat bahwa adalah penting
bahwa evaluator mengembangkan pemahaman tentang
perspektif, pengalaman dan harapan semua pemangku
kepentingan. Hal ini akan menyebabkan pemahaman yang
lebih baik dari berbagai makna dan kebutuhan yang
diselenggarakan oleh para pemangku kepentingan, yang sangat
penting sebelum seseorang mampu membuat penilaian tentang
manfaat atau nilai dari sebuah program. Kontak evaluator
dengan program ini sering (selama jangka waktu) dan,
meskipun tidak ada metode standar, observasi, wawancara dan
diskusi kelompok dengan focus umum yang digunakan.
Potter (2006) juga mengidentifikasi pendekatan kritis-

emansipatoris untuk evaluasi program, yang sebagian besar
berdasarkan pada penelitian tindakan untuk untuk tujuan
transformasi social. Jenis pendekatan ini jauh lebih ideologis
dan sering kali berisi tingkat yang lebih besar dari aktivitas
social dipihat evaluator tersebut. Karena focus utama pada
struktur kekuasaan masyarakat dan penekanannya partisipasi
dan pemberdayaan, Potter berpendapat jenis evaluasi ini dapat
sangat berguna di Negara berkembang.
78
Evaluasi program dilakukan, dalam instrument hendaknya
kegiatan yang dinilai mampu menjawab tiga hal, apa (what)
yang dilaksanakan, who siapa sasarannya, how bagaimana
melaksanakannya, dan ada tiga komponen yang perlu
diientifikasi yaitu tujuan, pelaksana, dan prosedur pelaksanaan
(Arikunto dan Safruddin dalam evaluasi program pendidikan,
2004). Dalam evaluasi program dapat ditentukan “standar” dan
‘indikator” dalam penilaian. Standar penilaian dapat dilakukan
scara kuantitatif dan kualitatif.
Ada beberapa model evaluasi program yang dikemukakan

Arikunto dan Safruddin dalam evaluasi program pendidikan
(2004), yaitu:
• Goal oriented evaluation model oleh Tyler, dimana
evaluasi dilaksanakan secara berkesinambungan dan
terus menerus terhadap tujuan yang akan dicapai.
• Goal Free Evaluation Model oleh Michael Scriven,tidak
terlalu terfokus pada tujuan khusus tetapi pada tujuan
umum kegiatan dan bagaimana proses
pelaksanaannya.
• Formatif-Summatif Evaluation Model, oleh Michael
Scriven, evaluasi pada program berjalan dan ketika
program selesai.
• Countenance Evaluation Model, oleh Stake dan
Fernander (1984), evaluasi ini mengidentifikasi konteks,
proses dan outcomes dalam sebuah matriks deskriptif
pertimbangan.
• CSE-UCLA Evaluation Model, oleh Fernander (1984),
model ini dibagi 4 tahap yaitu need assessment, program
planning, formative evaluation, summative evaluation.
• CIPPO Evaluation Model, oleh Stuffebeam dan kawan-
kawan (1967) yaitu pendekatan konteks, input, proses
dan product/outcomes.
79
• Discrepancy (kesenjangan model) oleh Malcolm Provus,
yang menekankan pada pandangan adanya
kesenjangan dalam pelaksanan program.
• Adapun yang dibahas dalam makalah ini adalah hanya
Goal oriented evaluation model atau evaluasi yang
berorientasi pada tujuan.
8.2. Goal Oriented Evaluation Model
Model evaluasi yang dikemukakan oleh Tyler yang dikutif oleh

Suharsimi yaitu goal oriented evaluation atau evaluasi yang
berorientasi pada tujuan adalah sebuah model evaluasi yang
menekankan peninjauan pada tujuan sejak awal kegiatan dan
berlangsung secara berkesinambungan, terus menerus, mencek
sejauh mana tujuan tersebut sudah terlaksana didalam proses
pelaksanaan program.
Goal oriented evaluation merupakan suatu pendekatan dari

evaluasi dampak yang bertujuan untuk menilai apakah tujuan
yang telah ditetapkan atau yang menjadi sasaran dari suatu
program sudah tercapai. Tyler (1950) menyatakan bahwa
sesuatu yang menjadi pokok dari evaluasi ini didasarkan pada
pencapaian tujuan, didalam pendekatan ini, tujuan-tujuan dari
suatu program yang sudah ditentukan sama dengan yang
dijalankan, dan keputusan tentang suksesnya dari suatu
program didasarkan pada ketercapaian atau sejauh mana
tujuan-tujuan tersebut telah dicapai, sesuai dengan sejumlah
standar yang sudah ditentukan atau tingkat pencapaian.
Tyler menjelaskan bahwa evaluasi dampak ini ditekankan pada

pencapaian tujuan pada bidang pendidikan, tetapi pendekatan
ini juga sudah digunakan untuk membantu profesi lain dan
dalam manajemen. Manajemen yang didasarkan pada tujuan
program dan dapat diputuskan pada organisasi atau
80
perorangan. Untuk perorangan ditujukan dalam bidang
penilaian atau ditekankan pada menilai daripada melakukan
evaluasi program. Evaluasi yang berorientasi pada tujuan
dapat dilakukan untuk mempromosikan pegawai atau
menurunkan pegawai, khususnya yang berkenaan dalam
bidang organisasi dilakukan untuk pemberian bonus yang
didasarkan pada hasil penilaian prestasi individu (Owen,
1993;88)
Menurut Tyler (1950) evaluasi program adalah proses untuk

mengetahui apakah tujuan pendidikan atau program sudah
dapat direalisasikan. Sedangkan Cronbach (1982) berpendapat
bahwa dalam evaluasi program pendidikan, meskipun
evaluator menyediakan informasi, evaluator bukanlah
pengambilan keputusan tentang suatu program. menurut
Arikunto dan Safruddin (2004) dalam evaluasi program
penidikan harus dirancang khusus supaya tujuan dapat dicapai
dengan baik, dan untuk mengetahui seberapa jauh atau bagian
mana dari tujuan sudah direalisasikan atau belum dan apa
penyebabnya.
Tyler mengemukakan rasionalnya secara ilmiah logis, dapat

diterima dan dapat diadopsi oleh para valuator pendidikan,
dan mempunyai pengaruh yang luas pada para ahli teori
evaluasi. Tyler mendeskripsikan enam kategori tujuan dari
sekolah, sebagai berikut: (a) menguasai informasi, (b)
mengembangkan kebiasaan kerja dan ketrampilan belajar, (c)
mngembangkan cara berpikir yang efektif, (d)
menginternalisasi sikap, minat, apresiasi, dan kepekaan sosial,
(e) menjaga kesehatan badan, dan (f) mengembangkan filosofi
hidup (Owen, 1993;89)
Pendekatan evaluasi berorientasi pada tujuan memfokuskan

pada tujuan spesifik dan menentukan sampai di mana tujuan
81
telah dicapai. Perintis pendekatan ini adalah Tyler. Pemahaman
Tyler tentang evaluasi adalah proses penentuan sampai di
mana tujuan pendidikan dari suatu program sekolah atau
kurikulum telah tercapaiAdapun langkah-langkah dalam
pendekatan Tyler khusus dalam mengembangkan evaluasi
yang berorientasi pada tujuan sebagai berikut: (a) menetapkan
tujuan umum, (b) mengklasifikasi tujuan, (c) mendefinisikan
tujuan dalam istilah perilaku, (d) menentukan situasi dimana
hasil atau prestasi belajar dapat ditunjukkan, (e)
mengembangkan atau memilih teknik pengukuran, (f)
mengumpulkan data kinerja, dan (g) membandingkan data
kerja dengan tujuan yang dinyatakan dengan perilaku.
Model evaluasi yang berorientasi pada tujuan menggunakan

dua tujuan yaitu tujuan pembelajaran umum dan khusus
sebagai criteria untuk menentukan keberhasilan. Evaluasi
diartikan sebagai proses pengukuran untuk mengetahui sejauh
mana tujuan pembelajaran telah tercapai. Model goal oriented
evaluation dianggap lebih praktis karena menentukan hasil yang
diinginkan dengan rumusan yang dapat diukur, dengan
demikian dapat dikatakan bahwa terdapat hubungan yang
logis antara kegiatan, hasil dan prosedur pengukuran
hasil.tujuan modl ini adalah membantu guru merumuskan
tujuan dan menjelaskan hubungan antara tujuan dengan
kegiatan. Model ini juga dapat membantu guru rencana
pelaksanaan kegiatan pembelajaran dengan proses pencapaian
tujuan, (Zaenal Arifin, 2009:75).
Studi-studi kasus tentang evaluasi yang berbasiskan pada

tujuan yang cocok dalam sebuah kerangka kerja dari pihak luar
untuk pihak dalam. Dalam hal itu evaluator mengadopsi suatu
penggunaan yang terfokus pada pendekatan yang mempunyai
fungsi, yaitu; (a) membantu pemangku kepentingan bertugas
sebagai pengawas (komisi) evaluasi dan/atau audien evaluasi,
82
untuk mengidentifikasi isu-isupokok dari evaluasi, (b)
bekerjasama dengan pemangku kepentingan dalam
mengembangkan disain evaluasi, (c) membuat keputusan
tentang aturan-aturan dalam manajemen data, mengumpulkan
dan menganalisis informasi yang relevan, dan (d) terlibat
dalam strategi-strategi yang mendukung penggunaan temuan-
temuan evaluasi (Owen, 1993;100).
Tyler menggunakan aturan ini untuk menyususn deskripsi dari

masing-masing strudi. Pada contoh yang pertama, tujuan
program digunakan sebagai basis untuk merencanakan studi
dan membuat keputusan mengenai manajemen data.
Walaupun demikian tujuan-tujuan ini tidak jelas (eksplisit).
Maka harus ditentukan oleh evaluasi sebelum penyelidikan
terhadap hasil yang diharapkan. Ini adalah situasi yang bukan
luar biasa, sering para pengembang tidak menyediakan dengan
baik dokumentasi program dari tujuan yang telah
dikembangkan.
Contoh: Evaluasi mengenai informasi kehamilan di Pusat

Kesehatan Masyarakat Richmond. Saat manajemen RCHC
mendapatkan dana untuk evaluasi, pemberi dana program
menunjuk dua perawat dan seorang dokter. Topik utama yang
menjadi bahan diskusi awal dari pemberi dana adalah potensi
penggunaan informasi dari studi tersebut. Hal ini akan menjadi
jelas bila pemberi dana tertarik untuk mendapatkan bukti yang
bisa digunakan dalam negosiasi di RCHC dan dengan agen-
agen pemberi dana supaya memperluas pengaruh dari
program mereka. Beberapa hal yang perlu dilakukan dalam
studi ini adalah: (1) membantu para pemberi dana
mengidentifikasi tentang isu-isu utama evaluasi. Hal ini
merupakan dasar yang penting dipertimbangkan untuk
meliput komponen hasil yang kuat dan untuk memperluas
upaya yang masih kevil pada sebuah pengujian proses
83
program. Yaitu yang menjadi isu-isu utama hasil adalah
apakah program memberikan suatu dampak terhadap para
siswa mengenai ilmu dan pengetahuan mereka yang
berhubungan dengan keadaan sebelum kehamilan, (2)
mengembangkan disain evaluasi bersama dengan pemberi
dana. Kebutuhan untuk mengumpulkan bukti tentang manfaat
program mendorong evaluator untuk merekomendasikan
penggunaan dari pree-test dan post-test hasil belajar yang
sederhana dan pengumpulan surat keterangan dari para siswa
dan para guru yang terlibat. Kenyataan, bahwa saat sebelum
merencanakan evaluasi dulu, program yang dilaksanakan
harus diperhitungkan dengan cermat, sesuai dengan
manakemen data pada daftar isu-isu yang diangkat oleh
pemberi dana, (3) membuat aturan-aturan dalam pengambilan
keputusan mengenai manajemen data.
Instrumen pengumpulan data dirancang oleh evaluator, dan

juga melakukan analisis untuk semua tahap studi. Metode-
metode dan hasil meliputi: (a) sebuah analisis permintaan
terhadap program di atas beberapa tahun yang lalu. Ini
memperlihatkan bahwa para siswa yang dating dari luar
wilayah kependidikan di mana pusat itu berada lebih banyak
dari pada dari dalam, dan di atas 15% adalah para siswa dari
daerah, dan (b) pengembangan dan pengambilan tes yang valid
dari isi program. Uji ini dikumpulkan segera sebelum kursus
dan langsung, satu hari sesudah kursus. Pendapat-pendapat
mengenai program juga disampaikan oleh para siswa dan para
guru mereka, terutama aspek-aspek yang paling buruk dan
yang paling baik. Siswa paling sering menanggapi kategori
yang pertama, yaitu apresiasi terhadap gaya presentasi. Para
siswa menyukai suasana atau atmospir kelas yang ramah,
informal dan tatacara pembicaraan yang menghadap lurus ke
depan. Dan (4) menggunakan strategi-strategi yang mendorong
penggunaan temuan-temuan. Temuan-temuan digunakan
84
untuk berdebat saat pengenalan kursus di pusat kesehatan
yang lain. Para evaluator sepakat untuk bekerjasama dengan
pemberi dana untuk mempresentasikan temuan-temuan
kepada berbagai agen-agen kesehatan. Besarnya komitmen
evaluator pada tahap ini ditentukan oleh kekuatan dari
temuan-temuan. Jika dampak dari program kecil atau negatif,
evaluator tidak boleh keras mengambil pengembang tugas
(Jhon Owen, 1993:101).
Kerangka model berorientasi pada tujuan dapat

dikombinasikan dari sudut pandang agen-berorientasi, dengan
fokus pada analisis kebutuhan-tahap awal, sehingga
memungkinkan untuk penggambaran eksplisit aspek tingkat
tinggi dari domain tersebut, sebelumnya telah ditunjukkan
bahwa tujuan penciptaan model dapat berguna untuk
memahami, komunikasi, dokumentasi, dan ekstraksi
persyaratan dan/atau desain tingkat tinggi. Namun,
penggunaan lebih lanjut dapat dibuat dari model tujuan
dengan menerapkan prosedur analisis eksplisit. Sering kali,
ketika model tujuan digunakan, mereka tidak dianalisis atau
dievaluasi oleh metode analisis eksplisit; hanya ad-hoc jenis
analisis argumentatif dilakukan. Menerapkan prosedur analisis
sistematis untuk model tujuan dapat menghasilkan manfaat
sebagai berikut: (1) Mendapatkan pemahaman yang lebih baik
dari model domain yang lengkap; (2) Menguji semantik model,
merangsang elisitasi lebih lanjut dan meningkatkan kualitas
model sambil meningkatkan pengetahuan tentang aspek yang
disengaja dari domain; (3) Evaluasi dan seleksi antara desain
alternatif 6.
Tyler, Fokus utamanya adalah pada spesifikasi tujuan dan

pengukuran hasil. Dia menolak penerapan norma-referenced
6 Jennifer Horkoff, Evaluation and Analysis of Goal-Oriented Models, Department

of Computer Science, University of Toronto, Toronto.
85
tes untuk evaluasi program. Dia berpendapat bahwa
membuang item-item yang dijawab dengan benar oleh terlalu
banyak, atau terlalu sedikit, responden tidak menyediakan
informasi yang diperlukan tentang apa siswa belajar. Tyler titik
pandang telah dikenal sebagai tujuan-berorientasi (atau tujuan-
direferensikan) evaluasi. Pendekatan berfokus pada (a)
merumuskan pernyataan tujuan pendidikan, (b)
mengelompokkan tujuan tersebut ke dalam jenis utama, (c)
mendefinisi kan dan menyempurnakan masing-masing Jenis
tujuan dalam hal perilaku, (d) mengidentifikasi situasi-situasi
di mana siswa dapat diharapkan untuk menampilkan jenis
perilaku, (e) memilih dan mencoba metode yang menjanjikan
untuk memperoleh bukti tentang setiap jenis tujuan, (f)
memilih berdasarkan uji coba awal lebih menjanjikan metode
penilaian untuk pengembangan lebih lanjut dan perbaikan, dan
(g) menyusun berarti untuk menafsirkan dan menggunakan
hasil (Tyler, 1942:498-500). Madaus dan Stufflebeam (1989)
menyatakan bahwa Tyler istilah "pendidikan evaluasi" di tahun
1930-an untuk menggambarkan prosedur-nya perbandingan
(baik-lain) hasil yang diharapkan (disebut tujuan) dengan
(baik-diukur) hasil actual.
Metode empiris untuk mengevaluasi tujuan mencakup; (a)

mengumpulkan data untuk mendeskripsikan keputusan nilai
tujuan, (b) pengaturan ahli, dengan pendapat, panel untuk
mereview dan mengevaluasi tujuan, (c) melaksanakan studi
terhadap catatan, arsip, editorial, newsletter, (d) melaksanakan
pilot study untuk melihat apakah tujuan dapat dicapai.
Pengembangan taksonomi belajar oleh Bloom dan Kreathwol
dipengaruhi oleh pendekatan evaluasi berorientasi tujuan.
Ukuran Pengganti Hasil atau Dampak. Suatu prosedur standar

dalam evaluasi berbasis tujuan adalah mengembangkan ukuran
hasil yang mempunyai validitas awal yang kuat. Walaupun
86
demikian, ada situasi di mana orang harus berkompromi, maka
kadang-kadang perlu menggunakan ukuran pengganti, yaitu
digantikan untuk atau bertindak sebagai pengganti ukuran
ideal atau yang lebih disukai. Jika menggunakan ukuran
pengganti ukuran validitasnya harus dipertahankan manakala
mempresentasikan temuan-temuan evaluasi. Kasus berikut
adalah contoh dimana sebuah indikator hasil digunakan
sebagai pengganti untuk menunjukkan pengetahuan di dalam
mengevaluasi dampak dari program pendidikan, kesehatan.
Contoh: evaluasi dampak suatu program pendidikan kesehatan

untuk para Ibu dari latar belakang kesukuan. Evaluasi program
tergantung klien, dan cocok itu adalah tergantung evaluator.
Pusat kesehatan, di antara pegawainya di pinggiran kota besar,
ada keperihatinan mengenai mutu makanan yang disajikan di
dalam rumah tangga suku local. Setelah konsultasi yang luas
dengan keluarga-keluarga ini, pusat kesehatan melaksanakan
suatu program yang mengarahkan secara khusus wanita-
wanita dengan anak-anak kecil dari sebuah kelompok suku.
Program ini diberikan selama waktu dua jam pertemuan pada
sore hari yang ditujukan untuk yaitu (a) mempromosikan
kembali untuk memakan makanan tradisional kelompok suku,
(b) mempromosikan makan untuk anak yang sedang menyusui
(semua peserta telah mimiliki sedikitnya satu anak di bawah
usia dua tahun), dan (c) mengurangi tingkat kegemukan di
antara anak-anak dalam keluarga-keluarga tersebut. Dalam
waktu singkat, setelah program usai, pusat kesehatan
memutuskan dewan komisi untuk mengevaluasi dalam skala
kecil menyangkut dampak dari intervensi yang diberikan.
Goal oriented evaluation Model dapat digunakan pada banyak

program diantaranya menurut atikunto cocok diterapkan
untuk mengevaluasi program yang jenisnya pemerosesan
dalam bentuk pembelajaran. Seperti koperasi karena koperasi
87
menjadi komponen istimewa dan harus dilayanani sebaik-
sebaiknya adalah pelanggan, penyimpan, dan peminjam untuk
koperasi simpan pinjam dan pembelian untuk koperasi
penjualan. Sejak hari pertama buka dan melayani pelanggan,
evaluator sudah dapat mengadakan evaluasi melalui Tanya
jawab kepara para pelanggan tentang bagaimana kualitas
layanan yang diberikan oleh petugas koperasi, tentu dilakukan
terus-menerus. Begitu juga dengan program bank, para
nasabah bank harus diberi pelayanan sebaik mungkin. Begitu
juga program perpustakaan, para peminjam buku harus
dilayani sebaik-baiknya.
Pemanfaatan kontekstual model evaluasi, metode berorientasi

pada tujuan diaplikasikan pada program psikologi kesehatan,
program doctor pada tahap awal di Universty of California, San
Francisco. Ada lima tahap yang terlibat dalam pelaksanaan
metode ini: (a) klarifikasi tujuan dan sasaran program, (b)
memprioritaskan tujuan, (c) menilai pencapaian tujuan, (d)
organisasi fakultas sasaran/input mahasiswa, dan (e) umpan
balik kepada manajemen program. Semua dosen dan
mahasiswa diundang untuk berpartisipasi sebagai self
evaluators daalam upaya evaluasi. Hasil penelitian
menunjukkan bahwa ada perbedaan yang signifikan antara
kelompok fakultas (dosen) dan kelompok mahasiswa pada
peringkat mereka dan peringkat pentingnya spesifik tujuan
pendidikan (tujuan pendidikan khusus) dan sumber daya.
Selama satu tahun tindak lanjut diperoleh dengan wawancara
pada direktur program untuk menilai dampak dari proyek
terhadap perencanaan program. 7
Kekuatan utama pendekatan evaluasi berorientasi pada tujuan

terletak pada kesederhanaan. Pendekatan ini mudah dipahami,
7 Richard E. Shaw (1982), Managing Evaluation Goals, University of California, San

Francisco.
88
mudah untuk diikuti dan diterapkan, serta menghasilkan
informasi yang pada umumnya pendidik setuju, bahwa
pendekatan ini sesuai dengan misi para pendidik tersebut.
Menurut Mager, pendekatan evaluasi berorientasi pada tujuan
menyebabkan pendidik dapat merefleksikan apa yang
dimaksudkan dan menjelaskan generalisasi yang rancu tentang
hasil pendidikan (Worthen and Sanders, 1987)
Pendekatan evaluasi yang berorientasi pada tujuan disamping

memiliki kekuatan, tetapi juga terdapat beberapa kelemahan,
yaitu (a) lemah dalam komponen evaluasi yang sebenarnya, (b)
lemah dalam strandar untuk menilai kesenjangan antara tahap
kinerja dan tujuan, (c) mengabaikan alternative penting yang
seharusnya dipertimbangkan dalam merencanakan program
pendidikan, (d) mengabaikan perubahan yang terjadi selama
program atau aktivitas yang sedang dievaluasi, (e)
mengabaikan konteks di mana evaluasi dilakukan, (f)
mengabaikan hasil penting lain yang tidak direncanakan dalam
aktivitas, (g) mengabaikan peristiwa dalam program yang tidak
merefleksikan tujuan, dan (h) mempromosikan pendekatan
yang linier dan tidak fleksibel pada evaluasi.
8.3. Langkah-Langkah Model Goal Oriented Evaluation
Pendekatan ini menentukan bahwa tujuan-tujuan yang telah

ditetapkan dari program tersebut telah diraih. Tyler (1950),
Bapak dari evaluasi program, adalah pendukung dari evaluasi
yang didasari pencapaian tujuan. Dalam pendekatan ini,
tujuan-tujuan dari suatu program diambil seperti yang
diberikan, keputusan tentang kesuksesan suatu program
didasarkan pada keluasan dimana tujuan itu telah dicapai, hal
ini berdasarkan pada beberapa standar atau level dari
pencapaian. Pada beberapa kasus, tujuan-tujuan ini
89
ditunjukkan oleh bagian positif dalam pencapaian peserta
program.
Pendekatan ini digunakan sebagai alat dalam managemen di

sektor publik dan sektor pribadi. Managemen dengan tujuan
digunakan untuk dayaguna dari organisasi, untuk
mengorganisasikan unit, dan untuk individu. Dalam situasi
lanjutan, kita berpindah pada bidang penilaian dari pada
evaluasi program. Pembangunan prosedur yang valid dan adil
untuk menilai dayaguna dari individu adalah hal yang masih
diperdebatkan. Karena hasil dari penilaian tersebut
mempunyai akibat yang langsung kepada mereka. Staff bisa
dipromosikan atau tidak dipromosikan dan bonus gaji
menyesuaikan sebagai hasil dari penilaian dayaguna individu.
Peralihan tujuan program kepada pengukuran hasil yang valid,

bersangkutan dengan kumpulan pengambilan keputusan
secara metodologi. Ini bisa jadi memungkinkan untuk
menggunakan intrumen sebelumnya, tapi evaluator harus bisa
meyakinkan bahwa instrument tersebut mempunyai validitas,
dan meyakinkan audience untuk evaluasi bahwa evaluasi akan
mencari pengukuran tujuan yang kredibel. Ada godaan untuk
menggunakan instrumen yang “off-the-shelf”, walaupun mereka
tidak perlu dikenai tes validitas. Kadang-kadang evaluator
harus membuat instrumen, jadi keahlian dalam membangun
instrumen dan hasil pengukuran lainnya sangat dibutuhkan.
Tugas-tugas utama dalam mengatur evaluasi berdasarkan
tujuan adalah sebagai berikut:
• Tentukan masalah-masalah utama dalam pencapaian hasil
evaluasi. Pusatkan dalam pikiran bahwa program harus
menempati hasil yang kredibel.
• Tentukan tujuan-tujuan dari program. Sumber-sumber
informasi yang memungkinkan tentang tujuan program
termasuk: (a) Dokumen kebijakan; (b) Program yang telah
90
ditentukan; (c) Wawancara dengan penyelenggara
program; dan (d) Combinasi lebih dari satu hal-hal di atas.
• Tentukan cara-cara yang paling tepat untuk memutuskan
apakah program dengan mudah mencapai tujuan. Sebagai
contoh, dengan hubungan untuk mendesain managemen
data, apakah control-group tersedia, apakah ini
memungkinkan untuk menggunakan desain “sebelum
dan sesudah”, dan kapan seseorang dapat mengumpulkan
hasil data.
• Pilih instrumen pengukuran yang tepat, atau buat yang
baru. Pertimbangkan kekonsistenan antara variabel hasil
dan tujuan program, gaya bahasa dan isi dari instrumen,
dan item yang digunakan. Apabila instrumen telah dibuat
berdasarkan tujuan, lebih baik instrumen tersebut
diujicoba dahulu.
• Identifikasi sumber-sumber bukti.
• Kumpulkan dan analisa bukti.
• Gambarkan hasilnya. Dalam beberapa kasus membuat
keputusan dengan tegas dan lengkap dalam pencapaian
variabel hasil, hal ini direkomendasikan.
• Laporkan hal-hal yang ditemukan.
8.4. Contoh Model Goal Oriented Evaluation
8.4.1. Kebutuhan Untuk Menentukan Tujuan Program Yang

Aktual
Kadang-kadang ketika seorang evaluator diminta untuk

melaksanakan evaluasi berdasarkan tujuan, tujuan dari
program itu sering kali tidak jelas. Tujuan itu harus ditentukan
terlebih dahulu oleh evaluator sebelum mengejar hasil. Ini
bukan hal yang tidak biasa, seringnya pencipta program tidak
menyediakan tujuan yang baik dalam dokumentasi program.
91
8.4.2. Evaluasi dari Community Agency Human Development
Program
Selama beberapa tahun, the Richmond Community Health Centre

(RCHC) telah menawarkan suatu program yang unik. Program
ini menyediakan layanan untuk berdiskusi masalah-masalah
seperti kontrasepsi dan akibat dari penggunaan narkoba.
Layanan ini untuk siswa pada kelas 11 (usia 15-16 tahun).
Instruksi-intruksi tersebut dibawakan oleh perawat dan ahli
genekologi di RCHC. Materi diskusi tidak seperti kurikulum di
sekolah.
Ketika managemen RCHC mempunyai dana untuk melakukan

evaluasi, penyelenggara program (2 perawat dan 1 dokter)
mensetting petunjuk evaluasi. Topik utama yang didiskusikan
oleh penyelenggara dan evaluator adalah penggunaan
informasi yang potensial dari penelitian itu. Ini menjadi jelas
bahwa penyelenggara mempunyai agenda untuk menghasilkan
informasi yang bisa digunakan dalam negosiasi di RCHC dan
dengan lembaga keuangan untuk memperluas pengaruh dari
program itu.
Dalam kasus ini, masalah tentang hasil yang sangat penting

adalah untuk menentukan apakah program memberikan
pengaruh yang kuat dalam memberikan pengetahuan dan
keahlian kepada murid-murid berkaitan dengan fase sebelum
kehamilan.
Ketika ada perluasan dokumentasi program, ternyata ada

pernyataan dari tujuan program yang tidak jelas. Untuk
membangun ini, evaluator mewawancarai penyelenggara
mengenai maksud mereka dan kehadiran 2 sesi program.
Anggota staf yang tidak bekerja lagi pada program diminta
untuk mengecek item-item percobaan untuk kekonsistenan
92
mereka terhadap program. Demikian pembangunan dari
instrumen akhir, menyandarkan pada wawancara dari pada
dokumentasi formal dari tujuan program.
8.5. Kesimpulan
Kebutuhan untuk meyakinkan kebaikan program memastikan

evaluator untuk merekomendasikan penggunaan dari pre-post
test pencapaian dan pengumpulan testimoni dari keterlibatan
murid-murid dan guru-guru. Fakta menunjukkan bahwa ada
waktu untuk merencanakan evaluasi lanjutan dalam program
penyampaian, hal ini memungkinkan mencocokkan data
dengan daftar masalah-masalah oleh penyelenggara. Telah
menjadi kesepakatan bahwa penyelenggara akan
mengadministrasikan intrumen yang mudah untuk murid-
murid sebelum dan sesudah sesi program. Hal ini untuk
mengukur pencapaian dan untuk mengumpulkan opini murid-
murid tentang sesi itu. Lalu, evaluator akan menganalisa data-
data tersebut, mengumpulkan informasi tambahan tentang
permintaan untuk program yang bersangkutan beberapa tahun
belakangan diambil dari catatan RCHC. Setelah itu evaluator
mendesain, membawa hasil wawancara bersama dengan guru-
guru yang terlibat.
Instrumen pengumpulan data didisain oleh evaluator yang

juga menganalisis untuk semua fase dalam penelitian. Metode
pengumpulan data dan hasil termasuk: (1) Analisis permintaan
untuk program selama beberapa tahun ke belakang; dan (2)
Pembuatan dan pengadministrasian dari validitas tes dari isi
program. Administrasikan segera sebelumnya dan langsung
setelah kursus 1 hari.
Setelah dilakukan pengumpulan data, hasilnya adalah: (1)

Rata-rata perolehan skor dari partisipan signifikan secara
93
statistika; (2) Terjadi kenaikan skor untuk murid-murid dari
semua sekolah; (3) Murid perempuan dan laki-laki memperoleh
pencapaian yang hampir sama; (4) Perolehan item dalam tes
sangat bervariasi; dan (5) Beberapa item yang dijawab dengan
baik mengindikasikan bahwa item tersebut tidak perlu
disertakan lagi dalam kursus selanjutnya.
94
Bab 9
Model Kaufman
(Need Assesment Evaluation)
9.1. Pengantar
Berbicara evaluasi pada dasarnya adalah upaya reflektif atras

segala aktiftas yang akan dilakukan, sedang berlangsung, dan
telah berjalan. Upaya tersebut dimaksudkan untuk menilai,
mengukur, dan menindak lanjuti secara sistematis atas segala
aktitas yang berjalan.
Pada pertemuan sebelumnya sudah banyak dijelaskan tentang

evaluasi program secara filosofis, model-model evaluasi, serta
upaya menemukan bentuk ideal terkait berbedaan obyek
evaluasi. Sehingga alat, proses, serta hasil evaluasi memang
benar-benar valid dan dapat dipertanggung jawabkan secara
ilmiah dan publik pengguna hasil evaluasi.
Need Assesment Evaluation adalah model yang ditokohi oleh

pakar pendidikan asal Amerika yang sudah memiliki segudang
karya dan pengalaman dalam aktifitas penelitian dan evaluasi
program. Bahkan kalau mengacu pada penelusuran biografi
sang tokoh evaluator ini, justru yang terlihat Roger Kaufman
adalah salah satu pelatak dasar evaluasi program berbasis need
assesment, terutama terkait analisis kebutuhan sebagai bagian
dari langkah-langkah evaluasi. Tepatnya pada bagian upaya
merumuskan perencanaan evaluasi program untuk ditindak
95
lanjuti menjadi proposal program dan acuan pembuatan
instrumen evaluasi. 8
Lebih lanjut dalam makalah ini akan dikupas tentang need

assement sebagai bagian dari aktifitas eveluasi program
pendidikan. Terkait konsep, langkah-langkah, dan praktek
menggunakan pendekatan need assesment dalam melaksanakan
evaluasi program.
Penilaian kebutuhan didefinisikan sebagai suatu kumpulan

prosedur yang sistematik dijalankan untuk tujuan pengaturan
yang diprioritaskan, membuat keputusan tentang program atau
perkembangan organisasi, dan alokasi dari sumber-sumber.
Prioritas didasarkan pada kebutuhan. (Witkin dan Altschuld,
1995)
Dalam menjalankan penilaian kebutuhan, seseorang harus

berpegangan pada gagasan yaitu “kebutuhan”. Hal ini bukan
ide yang mudah, dimana sangat banyak pandangan yang kita
artikan sebagai kebutuhan (Scriven 1991). Menggunakan kata
“Kebutuhan” sebagai sebuah kata benda, menyediakan dasar
untuk mendefinisikan apa yang dimaksud dengan penilaian
kebutuhan. Kebutuhan itu adalah perbedaan antara hasrat dan
situasi atau kondisi terkini. Kebutuhan adalah
ketidakcocokakan. Hal ini sangat kontras dengan penggunaan
kata “kebutuhan” dalam kegiatan sehari-hari sebagai kata
kerja. Penggunaan kata “kebutuhan” sebagai kata kerja
memfokuskan pada solusi, misalnya sebuah komunitas berkata:
“Kita butuh pusat kesehatan yang baru di lingkungan kita”.
Sekarang kita berbicara tentang program untuk menyelesaikan

kebutuhan, daripada investigasi yang mendahului hal ini.
8 Suharsimi Arikunto (2009), Evaluasi Program Pendidikan, Bumi Aksara, Jakarta.
96
Sifat-sifat penting dari kebutuhan membawa kita untuk
memperhatikan lima elemen, sebagai berikut:
• Keinginan atau kondisi ideal atau hubungan yang tetap
atau yang seharusnya terjadi
• Kondisi yang aktual atau hubungan yang tetap
• Ketidaksesuaian antara keinginan dan kondisi yang aktual
• Alasan untuk ketidakcocokkan
• Memutuskan kebutuhan mana yang perlu diprioritaskan
untuk dilakukan melalui perlakuan atau melalui sebuah
program
9.2. Konsep Need Assesment Evaluation
Menurut Roger F. Kaufman dan Fenwick W. English dalam

bukunya bahwa need assesment (analisis kebutuhan) tidak dapat
melepaskan diri dari prmbicaraan sistem pendidikan secara
keseluruhan. Dalam artian evaluasi need assesment tidak bisa
dilepaskan dari peoses, konteks, masukan, dan produk (hasil).
Labih singkatnya runang lingkup need assesment adalah
manejemen dan kurikulum. 9
Lebih lanjut dijelaskan bahwa ciri-ciri dalam melakukan need

assesment adalah analisis sistem, mengidentifikasi dan
mengklarifikasi masalah, menentukan gejala dan asumsi
pemyebab masalah, sehingga dapat menentukan alternatif
strategis penyelesaian masalah.
Pada keterangan lain Anderson dkk., menjelaskan need

assesment adalah suatu proses yang dilakukan seseorang untuk
mengidetifikasi kebutuhan sekaligus menentukan prioritas
diantaranya. Dalam dunia pendidikan dan pemebelajaran,
kebutuhan diartikan suatu kondisi yang memperlihatkan
adanya kesenjangan antara kondisi nyata (yang ada) dengan
9 Suharsimi Arikunto (2009), Evaluasi Program Pendidikan, Bumi Aksara, Jakarta.
97
kondisi yang diharapkan. Kebutuhan tersebut dapat terjadi
pada diri individu, kelompok, ataupun lembaga. 10
Roger F. Kaufman dan Fenwick W. English (1979), menjelaskan

need assesment adalah suatu proses formal untuk menentukan
jarak atau kesenjangan antara keluaran dan dampak yang nyata
dengan keluaran dan dampak yang diharapkan, kemudian
menempatkan deratan kesenjangan tersebut dalam deretan
skala prioritas, lalu melihat hal yang paling penting untuk
diselesaikan. 11
Dalam pengertiannya need assessment adalah suatu proses

untuk mengidentifikasi kebutuhan-kebutuhan dan keputusan-
keputusan tentang prioritas dalam konteks pendidikan. Need
atau kebutuhan sendiri diartikan sebagai kesenjangan antara
kondisi yang ada dengan kondisi yang diinginkan.
9.3. Langkah-langkah Need Assesment
Secara umum langkah-langkah dalam menjalankan need

assessment (analisis kebutuhan) terdapat beberapa pendekatan
cara dijelaskan oleh Anderson bahwa keluasan atau besarnya
kebutuhan dapat diukur dengan dua cara, yaitu dengan cara
subyektif dan cara obyektif.
Pengukuran subyektif, apabila pelaku membandingkan suatu

kebutuhan dengan kondisi yang dapat diterima olehnya.
Sedangkah pengukuran subyektif dalam analisis kebutuhan,
apabila kebutuhan yang diukur itu dibandingkan dengan
besarnya kebutuhan seseuatu bidang yang terkait dan sesuai
dengan bidang yang akan dievalusi.
10 Scarvia B. Anderson et.al (1975), Encyclopedia on Evaluation, Jossey-Bass, Davis.

11 Roger F.W. Kauman (1979), Needs Assessment: Concept, and Application,
Englewood Clift, New Jersey.
98
Sedangan bagaimana langkah-langkah need assesment dengan
pendekatan dua pengukuran tersebut (obyektif dan subyektif),
lebih rincinya dapat dijelaskan sebagai berikut:
9.3.1. Pengukuran Obyektif
Pengukuran obyektif melakukan sebagai berikut:

• Mengidentifikasi lingkup tujuan-tujuan penting dalam
program yang akan dievaluasi
• Menentukan indikator dan cara pengukuran tujuan-
tujuan.
• Menyusun kreteria (standard) untuk tiap-tiap indikator
dengan acuan yang ada dalam sistem dan bidang yang
dievaluasi.
• Menyusun alat pengukuran untuk masing-masing
indikator.
• Membandingkan kondisi yang diperoleh dengan
kreteria. Artinya jika data yang diperoleh lebih rendah
dari kreteria standart, maka berarti ada kebutuhan.
9.3.2. Pengukuran Subyektif
Pengukuran subyektif melakukan sebagai berikut:

• Mengidentifikasi tujuan penting dalam program yang
akan dievaluasi
• Menentukan pilihan kreteria atau menyusun kreteria
yang sesuai dengan setiap tujuan masing-masing
bidang dan indikator. Dalam langkah ini evaluator
perlu mengumpulkan banyak bukti formal yang akan
digunakan untuk dasar pertimbangan kebutuhan.
• Menyusun skala bertingkat yang digunakan untuk
mempertimbangkan tingkat penampilan indikator.
Dalam pembuatan skala hendaknya diurutkan sesuai
99
dengan tingkat penerimaan (dari 5 ke 1, jika
menggunkan skala 5), dan seyogyanya skalanya
berbentuk interval.
• Jika sudah dutentukan skala, kumpulkan semua calon
evaluator untuk bersama-sama menentukan urutan
kebutuhan dan skala prioritas kebutuhan. Jika secara
kebetulan terdapat dua kebutuhan yang sejajar, maka
diperlukan lagi kesepakatan untuk menentukan mana
kebutuhan yang lebih mendesak.
Selain memilih diantara dua cara tersebut, evaluator juga dapat

mengambil nominasi dari keduanya. Pilihan langkah-langkah
tersebut sangat dintentukan situasi kondisi obyek yang ingin
dievaluasi.
9.4. Desain Need Assesment dalam PBM
Dalam memberikan uraian tentang Need Assesment dalam

praktek pembelajaran, Kaufman dan English menjelaskannya
melalui deskripsi perbandingan antara upaya pemecahan
masalah secara tradisonal dengan cara yang inovatif, yaitu
menggambarkan proses penyusunan rencana pembelajaran
dalam sebuah digram atau bagan proses yang menunjukkan
letak need assessment. Tiga langkah penting yang harus
dilakukan oleh guru inovatif dalam proses penyiapan rencana
pembelajaran dengan memasukkan unsure need assessment
yang disisipkan diantara pemilihan materi dengan pemilihan
strategi pembelajaran. Lebih jelasnya lihat bagan di bawah ini:
100
Tabel 9.1. Tiga Langkah Penyiapan Need Assesment.
Mengapa
Apa Yang Bagaimana
mengajarakan
diajarkan mengajarkan
yang kita ajarkan
(analisis
(tujuan) (cara/media)
kebutuhan)
Keterangan:
(a) Seorang guru ketika akan memulai mengajar, dia harus
memusatkan perhatiannya ke arah pencapaian tujuan,
lalu memperhatikan materi yang menunjang pencapaian
tujuan, dan menentukan cara penyampaian materi.
(b) Setelah materi dipilih oleh sang guru, maka guru
menelaah kembali materi pilihan tersebut untuk
dicocokkan dengan kebutuhan siswa. Artinya pada PBM
inovatif siswa adalah fokus inti dari setiap proses
pembelajaran.
(c) Setalah ada kecocokan materi dengan kebutuhan siswa,
dan tidak melenceng dari tujuan PBM, maka berikutnya
guru menetukan strategi pemebelajaran yang tepat,
meliputi; metode, pengelolahan kelas, media
pembelajaran, dan lain-lain.
Lebih singkatnya need assessment dan interaksinya dapat dilihat

di bawah ini:
101
Gambar 9.2. Interaksi dalam Need Aassessment.
Tabel 9.3. Contoh Hasil Evaluasi.

Program Kecil Program Besar
Tujuan Pengajaran
No Seka- Seharus- Seka- Seharus-
EDP
rang nya rang nya
Memahami Sejarah
01 0.33 2.00 2.14 3.28
EDP
Memahami
02 perkembangan dan 1.00 2.44 2.28 3.38
pertumbuhan bisnis
Memahami konsep
03 0.61 2.44 2.10 3.21
dasar EDP
Keterampilan
04 0.67 2.28 2.12 3.14
menampilkan data
Mengenal dasar
05 operasi perangkat 0.50 2.00 1.81 2.81
keras
Mengerti cara
06 0.06 1.00 1.12 1.12
mengukur data
Memahami perangkat
07 lunak dan menyusun 0.11 1.06 1.10 2.32
program
Catatan:
• Tabel menunjukan adanya kesenjangan antara tujuan EDP untuk
yang diajarkan sekarang dengan yang seharusnya.
• Angka menunjukkan rata-rata pada rating scale.
102
Contoh Kasus Penerapan Model Need Assessment dalam sebuah
evaluasi yang dilakukan oleh Jamil Effarah untuk mengetahui
kesenjangan kebutuhan di suatu sekolah kejuruan bisnis di
Oregon Amerika Serikat pada tahun 1977. Penelitian itu
dilakukan dengan membagikan angket kepada sejumlah guru
untuk mengetahui kecocokan materi dalam Electronic Data
Prosessing (EDP) diajarkan untuk program kecil (1 atau 2 orang
guru), dan proram besar (5 guru atau lebih). Hasil evaluasi
dapat dilihat dalam tabel 9.3.
9.5. Kesimpulan
Makna needs assessment seperti yang sudah dijelaskan di atas,

menunjukkan adanya proses menggali, memilah dan
menyisihkan. Dalam memulai langkah-langkah tersebut
sebenarnya pelaku tidak mungkin melepaskan diri dari
pekerjaan mengukur dan menilai sesuatu. Untuk menentukan
hasil menggali, memilah, dan menyisihkan ada proses
membandingkan gejala yang sedang dikenali dab dipilah
dengan suatu patokan (meski kadang tidak secara jelas
disadari).
Dari bahasan di atas dapat dipahami bahwa seorang pendidik

yang profesional sudah seharusnya paham akan tuntutan
profesi baik secara administrasi, akademis, praktik, lebih
penting lagi masalah bagaimana mendesain sebuah
pembelajaran yang harmoni yaitu mendesain content atau
materi pembelajaran yang aktual dan relevan dengan tuntutan
atau kebutuhan life skill siswa dan sesuai jamannya, mendesain
learning objective sesuai dengan kebutuhan siswa dan tingkat
kesulitannya, futuristik/ke depan tidak menjadikan siswa
ketinggalan zaman dengan komunitasnya. Kesemuanya
terencana berdasarkan apa yang mesti ada dan dihadirkan
sesuai dengan kondisi siswa secara klasikal, regional ataupun
103
nasional walaupun dengan setting lokal. Hal itu dimungkinkan
bila minimal sebagai pendidik paham betul akan siswa dan
keinginan secara individual maupun klasikal didesain secara
proporsional.
104
Bab 10
Model “Stake”
10.1. Pengantar
Evaluasi adalah proses menentukan hasil yang telah dicapai

beberapa kegiatan yang direncanakan untuk mendukung
tercapainya tujuan12. Jadi, evaluasi berorientasi pada tujuan
yang ingin dicapai oleh peneliti atau evaluator. Evaluasi
berbeda dengan pengukuran dan penilaian. Evaluasi lebih luas
pengertiannya dibandingkan penilaian dan pengukuran atau
dengan kata lain, penilaian dan pengukuran adalah bagian dari
evaluasi.
Pengukuran (measurement) dapat didefinisikan sebagai the

process by which information about the attributes or characteristics of
thing are determinied and differentiated (Oriondo,1998:2). Guilford
mendefinisi pengukuran dengan “assigning numbers to, or
quantifying, things according to a set of rules” (Griffin dan Nix,
1991:3). Pengukuran dinyatakan sebagai proses penetapan
angka terhadap individu atau karakteristiknya menurut aturan
tertentu (Ebel dan Frisbie. 1986:14). Allen dan Yen
mendefinisikan pengukuran sebagai penetapan angka dengan
cara yang sistematik untuk menyatakan keadaan individu
(Djemari Mardapi, 2000:1). Dengan demikian, esensi dari
pengukuran adalah kuantifikasi atau penetapan angka tentang
karakteristik atau keadaan individu menurut aturan-aturan
tertentu. Keadaan individu ini bisa berupa kemampuan
12 Suharsimi Arikunto dan Cepi Safrudin (2008), Evaluasi Program Pendidikan,

Bumi Aksara, Jakarta.
105
kognitif, afektif dan psikomotor. Pengukuran memiliki konsep
yang lebih luas dari pada tes. Kita dapat mengukur
karakateristik suatu objek tanpa menggunakan tes, misalnya
dengan pengamatan, skala rating atau cara lain untuk
memperoleh informasi dalam bentuk kuantitatif.
Penilaian (assessment) memiliki makna yang berbeda dengan

evaluasi. The Task Group on Assessment and Testing (TGAT)
mendeskripsikan asesmen sebagai semua cara yang digunakan
untuk menilai unjuk kerja individu atau kelompok (Griffin dan
Nix, 1991: 3). Popham (1995: 3) mendefinisikan asesmen dalam
konteks pendidikan sebagai sebuah usaha secara formal untuk
menentukan status siswa berkenaan dengan berbagai
kepentingan pendidikan. Boyer dan Ewel mendefinisikan
asesmen sebagai proses yang menyediakan informasi tentang
individu siswa, tentang kurikulum atau program, tentang
institusi atau segala sesuatu yang berkaitan dengan sistem
institusi. “processes that provide information about individual
students, about curricula or programs, about institutions, or about
entire systems of institutions” (Stark dan Thomas,1994: 46).
Bahwa fungsi pokok evaluasi adalah untuk mengetahui

tentang: (a) kemajuan dan perkembangan anak didik setelah
mengalami didikan/melakukan kegiatan belajar mengajar
selama jangka waktu tertentu, (b) sampai dimana keberhasilan
suatu metode sistem pembelajaran yang dipergunakan, dan (c)
kekurangan serta kelebihan yang diperoleh dari hasil evaluasi
yang dimaksud. Di samping itu, data yang diperoleh dari
evaluasi dimaksud dapat dipergunakan untuk: (i) bahan
kelengkapan bimbingan bagi setiap individu/peserta didik, (ii)
membuat diagnosa mengenai kelemahan-kelemahan dan
kekuatan serta kelebihan peserta didik, (iii) menentukan hal-hal
106
apa dalam pemberian remidial service, dan (iv) perbaikan atau
penyempurnaan program 13.
Dalam evaluasi program pendidikan, banyak model yang

digunakan untuk mengevaluasi suatu program. Meskipun
antara satu dengan yang lainnya berbeda, namun maksudnya
sama , yaitu melakukan kegiatan pengumpulan data atau
informasi yang berkenaan dengan objek yang dievaluasi, yang
tujuannya menyediakan bahan bagi pengmabil keputusan
dalam menentukan tindak lanjut suatu program. Diantara
beberapa model evaluasi program, dikenal model evaluasi
program yang dikembangkan oleh Stake. Dalam pembahasan
makalah ini, penulis akan membahas sebagian evaluasi
program yang dikembangkan oleh Stake, yaitu hanya
membahas tentang model evaluasi countenance.
10.2. Konsep Evaluasi Countenance
Model ini adalah model pertama evaluasi kurikulum yang

dikembangkan oleh Stake. Dalam tulisannya, ia sendiri tidak
memberikan nama khusus terhadap model ini. Nama
Countenance dipergunakannya sesuai dengan judul artikel
yang ditulisnya walaupun pengertian countenance itu sendiri
mempunyai makna ambigu. Dalam satu pengertian,
countenance berarti keseluruhan sedangkan dalam pengertian
yang lain countenance berati sesuatu yang disenangi
(favourable). Dalam tulisan itu, Stake ingin mengemukakan
keseluruhan kegiatan evaluasi yang harus dilakukan dan cara
yang diinginkannya bagaimana evaluasi tersebut dilakukan.
Oleh karena itu, walaupun beberapa penulis lain yang
membicarakan model ini mempergunakan judul sepertim
model congruence atau model contigency. Nama-nama tersebut
13 Ngalim Purwanto (1983), Prinsip-prinsip dan Teknik Evaluasi Program, Edisi IV,
UNJ, Jakarta.
107
tidak dipergunakan di sini karena dua hal itu adalah konsep
utama dalam model pengolahan data yang dikemukakan oleh
Stake. Kedua konsep itu tidak dapat mewakili keseluruhan ide
Stake mengenai evaluasi. jadi, nama countenance dipertahankan
sebagai nama model ini secara keseluruhan.
Dalam evaluasi program ini, Morrison mengemukakan ada 3

komponen yang harus diperhatikan, yaitu: 1) deskripsi, 2)
kriteria, 3) judgement atau pertimbangan. Deskripsi program
diperlukan untuk pengumpulan informasi tentang sesuatu
yang dinilai (deskriptor). Kriteria berhubungan dengan dasar
yang dipergunakan untuk sampai pada judgement. Dalam
pelaksanaanya, model evaluasi Stake menekankan pada 2 jenis
operasi yaitu: deskripsi dan pertimbangan (judgements), yang
dibedakan dalam 3 fase dalam evaluasi program yaitu:
• Persiapan atau pendahuluan (antecedent).
• Proses/transaksi (transaction-processes).
• Keluaran/hasil (outcomes, output).
Descriptions matrix berhubungan dengan intens (goal = tujuan)

dan obsevations (effect = akibat). Judgement berhubungan
dengan standar (tolak-ukur = kriteria /dan judgement
(pertimbangan). Penekanan paling besar pada model ini adalah
pendapat bahwa evaluator membuat keputusan tentang
program yang sedang dievaluasi.
Matriks pertama deskripsi, berkaitan atau menyangkut 2 hal

yang menunjukkan posisi sesuatu (yang menjadi sasaran
evaluasi), yaitu apa maksud/tujuan yang diharapkan oleh
program, dan pengamatan /akibat, atau apa yang
sesungguhnya terjadi atau apa yang betul-betul terjadi.
Selanjutnya evaluator mengikuti matrix kedua, yang
menunjukkan langkah pertimbangan, yang dalam langkah
tersebut mengacu pada standar.
108
Model Stake pada prinsipnya sama dengan model-model
evaluasi lain yaitu mencoba membandingkan apa yang terjadi
dengan apa yang ditargetkan atau diharapkan terjadi. Dengan
kata lain membandingkan antara hasil yang diperoleh dengan
standar yang ditetapkan sebelumnya. Oleh Stake (Worthen
dan Sanders, 197:113), model evaluasi yang diajukan dalam
bentuk diagram, menggambarkan deskripsi dan tahapan
sebagai berikut.
Gambar 10.1. Evaluasi Model Stake.

Rational Intens Observation Standard Judgement
Antecedent
Transaction
Outcomes
Description matrix Judgement matrik
Sumber: Worthen, B. R., dan Sanders, J. R., (1984). Figure 6 A layout of
Statements and Data to Be Collected by the Evaluator of an Educational
Program.
Tiga hal yang dituliskan diantara dua diagram, menunjukan

objek atau sasaran evaluasi. Dalam setiap program yang
dievaluasi, evaluator harus mampu mengidentifikasikan tiga
hal, yaitu (1) anteseden yang diartikan sebagai konteks, (2)
transaksi yang diartikan sebagai proses, (3) outcomes yang
diartikan sebagai hasil. Selanjutnya kedua matrik digambarkan
sebagai deskripsi dan pertimbangan, menunjukan langkah-
langkah yang terjadi selama proses evaluasi.Matriks pertama,
yaitu deskripsi, berkaitan atau menyangkut dua hal yang
menunjukan posisi suatu yang menjadi sasaran evaluasi, yaitu
apa maksud dan tujuan yang diharapkan oleh program, dan
pengamatan/akibat apa yang sesungguhnya terjadi atau apa
yang betul-betul terjadi. Selanjutnya evaluator mengikuti
matriks kedua, yang menunjukan langkah pertimbangan, yang
dalam langkah tersebut mengacu pada standar.
109
Menurut Stake, ketika evaluator tengah mempertimbangkan
program, harus melakukan 2 perbandingan berikut: (1)
Membandingkan kondisi hasil evaluasi program tertentu
dengan dengan yang terjadi diprogram lain, dengan objek
sasaran yang sama (Perbandingan Relatif); dan (2)
Membandingkan kondisi hasil pelaksanaan program dengan
standar yang diperuntukkan bagi program yang bersangkutan,
didasarkan pada tujuan yang akan dicapai (Perbandingan
Mutlak) 14.
10.3. Cara Kerja Model Evaluasi Countenance
Cara kerja model ini adalah evaluator mengumpulkan data

mengenai apa yang dinginkan pengembang program baik
yanng berhubungan dengan antecedent (persyratan awal),
transaksi (proses), dan juga hasil. Data dapat dikumpulkan
melalui studi dokumen tetapi dapat pula dilakukan dengan
jalan wawancara. Cara terakhir ini dilakukan apabila dokumen
tidak diperoleh karena sesuatu dan lain hal. Cara yang terbaik
tentulah melalui studi dokumen.
Bersamaan dengan pengumpulan data mengenai intens (tujuan)

ini dapat pula dikumpulkan rasional dari setiap tujuan
tersebut. Disini Stake memperingatkan agar data mengenai
rasional janganlah dikumpulkan dngan jalan mendikte
pengembang program/guru tersebut. Biarkanlah mereka
berbicara dengan pengertian dan bahasa yang ada pada diri
mereka. Evaluator mendengarkan dan mencatat apa yang
dikemukakan oleh pengembang program. Suatu hal yang perlu
diperhatikan, walaupun dalam gambar korak rasional berada
di sebelah kiri matrik deskripsi, hal ini tidaklah berarti bahwa
pengumpulan data tentang rasional dilakukan terlebih dahulu.
14 Yuli Argana (2008), Aplikasi Model STAKE, Pustaka Pelajar, Jogjakarta.
110
Dalam kenyataannya, data tentang rasionaltak mungkin
dukumpulkan seb3elum data mengenai tujuan telah
dikumpulkan. Oleh akrena itu waktu yang paling cepat untuk
segera mengumpulkan data mengenai rasional adalah
bersamaan dengan waktu pengumpulan data mengenai tujuan.
Kegiatan berikutnya adalah pengumpulan data observasi

mengenai persyaratan awal, transaksi (proses), dan hasil.
Sesuai dengan namanya, data untuk bagian ini dikumpulkan
melalui observasi. Dan, seperti ditekankan Stake, observasi ini
haruslah observasi formal. Maksudnya, observasi tersebut
hendaklah dilakukan dengan mempergunakan instrumen (alat
pengumpulan data yang dikembangkan khusus). Stake (1972:
98) mengemukakan bahwa isntrumen yang dipakai dapat
meliputi: daftar inventori, daptar pertanyaan tentang data
biografis, daftar wawancara, daftar cek, pertanyaan tentang
opini, dan semua jenis tes psikometrik. yang penting adalah
data tersebut berhubungan dengan apa yang dikemukakan
dalam tujuan.
Dalam pengolahan data matrik deskripsi, Stake menggunakan

dua konsep yaitu contigency dan congruence. Kedua konsep ini
berbeda dalam pengggunaannya. Contigency dipergunakan
untuk mengalanalisis data secara vertikal, mencari keseuaian
antara kotak atas dengan kotak di bawahnya. Ada dua jenis
analsis mengenai kesesuaian ini, yaitu kesesuaian secara logika
dan kesesuaian secara empirik.
Analisis logis dipergunakan dalam memberikan pertimbangan

mengenai keterhubungan antara persyaratan awal, transaksi,
dan hasil dari matrik tujuan (intent). evaluator harus dapat
menentukan apakah persyaratan awal yang telah dikemukakan
pengembang program/guru akan tercapai dengan rencana
transaksi yang dikemukakan, ataukah sebetulnya ada model
111
transaksi yang lebih efektif untuk mencapai apa yang
dikemukakan dalam prasyarat. Demikian pula mengenai
hubungan antara transaksi dengan hasil yang diharapkan.
Analisis empiris bekerja seperti analisis logis, tetapi yang

dipergunakan adalah basis data. Dalam analisis ini evaluator
harus mempertimbangkann keterhubungan tersebut
berdasarkan data empirik yang telah dikumpulkannya.
Pertanyaan-pertanyaan yang diajukan untuk analisis logis
dipergunakan untuk analisis empirik ini.
Selanjutnya evaluator melakukan analisis congruence

(kesesuaian) antara apa yang dikemukakan dalam tujuan
dengan apa yang terjadi dalam kegiatan (observasi).
Pertanyakan yanng dapat diajukan di sini adalah apakah yang
telah direncanakan dalam tujuan memangn sesuai dengan
pelaksanaannya di lapangan (observasi). Apakah terjadi
penyimpangan-penyimpangan antara yang direncanakan
(intent) dengan yang terjadi (observasi) dan jika ada
penyimpangan, faktor-faktor apa yang berperan dalam
penyimpangan tersebut. Apabila kedua analisis tersebut telah
diselesaikan, tugas evaluator adalah menyerahkan hasilnya
kepada tim yang terdiri dari para ahli dan orang yang terlibat
dalam program. Tim ini yang akan meneliti kesahihan analisis
evaluator tersebut. Lebih lanjut tim ini pula yang akan
memberikan persepsinya mengenai faktor penting baik dalam
contigency maupun congruence. Analisis data deskriptif tersebut
digambarkan sebagai berikut.
112
Gambar 10.2. Analisis Data Deskriptif
congruence
Antescedent yang Antescedent yang
diharapkan diamati
Contigency logis Contigency empirik
congruence
Transaksi yang Transaksi yang
diharapkan diamati
Contigency logis Contigency empirik
congruence
Hasil yang Hasil yang
diharapkan diamati
Selanjutnya evaluator memberikan pertimbangan mengenai

program yang sedang dikaji. Untuk itu, evaluator
membutuhkan standar atau kriteria. Dalam model countenance
digambarkan bahwa dalam matriks pertimbangan ada yang
dinamakan standar dan pertimbangan. Standar dapat
berbentuk standar mutlak dan relatif. Standar mutlak adalah
standar yang dianggap berlaku untuk suatu kurikulum atau
program. Standar relatif berhubungan dengan komparasi
antara satu program dengan program yang lainnya dalam satu
bidang studi yang sama.
Menurut Stake, model ini lebih dapat dipergunakan untuk

melakukan evaluasi mengenai pelaksanaan implementasi
kurikulum dalam konteks pendidikan di Indonesia. Proses
pengembangan kurikulum di Indonesia sedemikian rupa
sehingga kurikulum sebagai rencana yang dirancang di tingkat
nasional dan bersifat “tidak siap pakai”. Guru masih harus
mengembangkan rencana besar tersebut menjadi rencana yang
lebih operasional yang disebut dengan rencana pelakasanaan
pembelajaran (RPP). RPP ini yang dapat dipergunakan untuk
mengisi matrik intent model yang ada dalam countenance.
113
Mengenai standar yang diinginkan Stake dapat dikembangkan
dari komponen-komponen yang ada dalam rencana besar
kurikulum tersebut (Standar Kompetensi dan Kompetensi
Dasar). Meskipun demikian, tidak salahnya apabila evaluator
juga mempergunakan standar yang dikembagkan dari para ahli
bidang pendidikan. Tentu saja masalah akan timbul apabila
antara standar yang dikembangkan dari kurikulum tidak
bersesuaian dengan yang dikembangkan dari para ahli.
Persoalan ini pasti akan dihadapi oleh setiap evaluator yang
mempergunakan model countenance ini. hal ini Stake (1972: 100)
menganjurkan agar evaluator jangan mengevaluasi kurikulum
dengan “mikroskop” tetapi seharusnya dengan ” a panoramic
view finder” . Adanya beragam standar akan memberikan
kesempatan kepada evaluator untuk mempergunakan standar
tersebut sebagai teropong panorma dan bukan mikroskop.
Untuk konteks pendidikan di Indonesia, selain untuk

mengevaluasi dimensi kurikulum sebagai kegiatan, model ini
dapat dipergunakan dalam pengembangan kurikulum di
tingkat nasional apabila eksperimaen dilakukan. Pada waktu
eksperimean, pengembang evaluasi dapat menerapkan model
ini sepenuhnya karena semua persyaratan countenance
terpenuhi.
10.4. Kesimpulan
Evaluasi mempunyai makna sebagai alat untuk mengetahui

sampai sejauh mana ketercapaian dan kegagalan suatu
program kegiatan dalam mewujudkan tujuan yang seharusnya
dicapai. Tujuan evaluasi pendidikan adalah untuk
mendapatkan data pembuktian yang menunjukkan samapai
dimana tingkat kemampuan dan keberhasilan peserta didik
dalam pelaksanaan proses pembelajarannya. Model yang
114
dikembangkan oleh Stake adalah Countenance Evaluation Model
dan Responsive Evaluation Model Countenance Evaluation Model
mengemukakan keseluruhan kegiatan evaluasi yang harus
dilakukan dan cara yang diinginkan bagaimana evaluasi
tersebut dilakukan.
Countenance Evaluation Model menekankan kepada dua hal

pokok, yaitu deskripsi dan pertimbangan, serta membedakan
adanya tiga tahap dalam evaluasi program yaitu antesenden ,
transaksi, dan hasil. Perbedaan antara Countenance Evaluation
Model dengan Responsive Evaluation Model adalah model
countenance mempunyai fokus yang lebih luas dibandingkan
dengan model responsive. Sedangkan perbedaan kedua adalah
model countenance berdsarkan pengembangan kriteria fidelity,
model responsive mengembangkan kriterianya berdasarkan
pendekatan proses dalam pendekatan pengembangan kriteria.
115
116
Bab 11
Model Formatif-Sumatif
Untuk Program Proses dan
Program Pelayanan
11.1. Pengantar
Menurut Suharsimi Arikunto (2004: 1) evaluasi adalah kegiatan

untuk mengumpulkan informasi tentang bekerjanya sesuatu,
yang selanjutnya informasi tersebut digunakan untuk
menentukan alternatif yang tepat dalam mengambil keputusan.
Fungsi utama evaluasi dalam hal ini adalah menyediakan
informasi-informasi yang berguna bagi pihak decision maker
untuk menentukan kebijakan yang akan diambil berdasarkan
evaluasi yang telah dilakukan. Menurut Worthen dan Sanders
(1979: 1) evaluasi adalah mencari sesuatu yang berharga
(worth). Sesuatu yang berharga tersebut dapat berupa
informasi tentang suatu program, produksi serta alternatif
prosedur tertentu. Karenanya evaluasi bukan merupakan hal
baru dalam kehidupan manusia sebab hal tersebut senantiasa
mengiringi kehidupan seseorang. Seorang manusia yang telah
mengerjakan suatu hal, pasti akan menilai apakah yang
dilakukannya tersebut telah sesuai dengan keinginannya
semula.
Menurut Stufflebeam dalam Worthen dan Sanders (1979: 129)

evaluasi adalah: “…process of delineating, obtaining and providing
useful information for judging decision alternatives..”. Dalam
evaluasi ada beberapa unsur yang terdapat dalam evaluasi
yaitu: adanya sebuah proses (process) perolehan (obtaining),
117
penggambaran (delineating), penyediaan (providing) informasi
yang berguna (useful information) dan alternatif keputusan
(decision alternatives).
Dari pengertian-pengertian tentang evaluasi yang telah

dikemukakan beberapa orang diatas, kita dapat menarik
benang merah tentang evaluasi yakni evaluasi merupakan
sebuah proses yang dilakukan oleh seseorang untuk melihat
sejauh mana keberhasilan sebuah program. Keberhasilan
program itu sendiri dapat dilihat dari dampak atau hasil yang
dicapai oleh program tersebut. Oleh sebab itu, dalam
keberhasilan ada dua konsep yang terdapat didalamnya yaitu
efektifitas dan efisiensi. Efektifitas merupakan perbandingan
antara output dan inoutnya sedangkan efisiensi adalah taraf
pendayagunaan input untuk menghasilkan output lewat suatu
proses (Sudharsono 1994: 2).
Dalam evaluasi terdapat perbedaan yang mendasar dengan

penelitian meskipun secara prinsip, antara kedua kegiatan ini
memiliki metode yang sama. Perbedaan tersebut terletak pada
tujuan pelaksanaannya. Jika penelitian bertujuan untuk
membuktikan sesuatu (prove) maka evaluasi bertujuan untuk
mengembangkan. Terkadang, penelitian dan evaluasi juga
digabung menjadi satu frase, penelitian evaluasi. Sebagaimana
disampaikan oleh Sudharsono (1994: 3) penelitian evaluasi
mengandung makna pengumpulan informasi tentang hasil
yang telah dicapai oleh sebuah program yang dilaksanakan
secara sistematik dengan menggunakan metodologi ilmiah
sehingga darinya dapat dihasilkan data yang akurat dan
obyektif.
Setiap kegiatan yang dilaksanakan mempunyai tujuan tertentu.

demikian juga dengan evaluasi. Menurut Suharsimi Arikunto
(2004: 13) ada dua tujuan evaluasi yaitu tujuan umum dan
118
tujuan khusus. Tujuan umum diarahkan kepada program
secara keseluruhan sedangkan tujuan khusus lebih difokuskan
pada masing-masing komponen. Implementasi program harus
senantiasa di evaluasi untuk melihat sejauh mana program
tersebut telah berhasil mencapai maksud pelaksanaan program
yang telah ditetapkan sebelumnya. Tanpa adanya evaluasi,
program-program yang berjalan tidak akan dapat dilihat
efektifitasnya. Dengan demikian, kebijakan-kebijakan baru
sehubungan dengan program itu tidak akan didukung oleh
data. Karenanya, evaluasi program bertujuan untuk
menyediakan data dan informasi serta rekomendasi bagi
pengambil kebijakan (decision maker) untuk memutuskan
apakah akan melanjutkan, memperbaiki atau menghentikan
sebuah program. Pada bab ini penulis menggali model evaluasi
program yang dikemukakan oleh Michael Striven, yaitu Goal
Free Evaluation dan Formatif-Summatif Evaluation.
11.2. Jenis-Jenis Model Evaluasi Yang Dikembangan

Scriven
11.2.1. Goal Free Evaluation
Dalam Goal Free Evaluation, Scriven mengemukakan bahwa

dalam melaksanakan evaluasi program evaluator tidak perlu
memperhatikan apa yang menjadi tujuan program. Yang perlu
diperhatikan dalam program tersebut adalah bagaimana
kerjanya (kinerja) suatu program, dengan jalan
mengidentifikasi penampilan-penampilan yang terjadi
(pengaruh) baik hal-hal yang positif (yaitu hal yang
diharapkan) maupun hal-hal yang negatif (yang tidak
diharapkan).
Scriven menekankan bahwa evaluasi itu adalah interpretasi

Judgement ataupun explanation dan evaluator adalah
119
pengambil keputusan dan sekaligus penyedia informasi.
Dengan demikian ia membedakan antara “Goal of evaluation
dan role of evaluation”. Untuk mecapai tujuan dari evaluasi,
Scriven mengemukakan perlu adanya dasar yang menjadi
pijakan. Dalam hal ini ada dua pijakan atau premis yaitu: (a)
Premis faktual dan (b) Premis nilai. Premis faktual berkaitan
dengan sifat, kinerja, atau pengaruh. Sedangkan premis nilai
berkaitan dengan prinsip-prinsip ilmiah atau aturan yang
relevan.
Alasan mengapa tujuan program tidak perlu diperhatikan

karena ada kemungkinan evaluator terlalu rinci mengamati
tiap-tiap tujuan khusus. Jika masing-masing tujuan khusus
tercapai, artinya terpenuhi dalam penampilan, tetapi evaluator
lupa memperhatikan sejauh mama masing-masing penampilan
tersebut mendukung penampilan akhir yang diharapkan oleh
tujuan umum maka akibatnya jumlah penampilan khusus ini
tidak banyak manfaatnya. Dari uraian ini jelaslah bahwa yang
dimaksud dengan Goal Free Evaluation atau "evaluasi lepas dari
tujuan" dalam model ini bukannya lepas sama sekali dari
tujuan tetapi hanya lepas dari tujuan khusus. Model ini hanya
mempertimbangkan tujuan umum yang akan dicapai oleh
program, bukan secara rinci per komponen.
Model evaluasi yang dikembangkan oleh Michael Scriven ini

dapat dikatakan berlawanan dengan model yang
dikembangkan oleh Tyler. Jika dalam model yang
dikembangkan oleh Tyler, evaluator terus-menerus memantau
tujuan, yaitu sejak awal proses terus melihat sejauh mana
tujuan tersebut sudah dapat dicapai, dalam model ini justru
menoleh dari tujuan. Menurut Sriven dalam melaksanakan
evaluasi program evaluator tidak perlu memperhatikan apa
yang menjadi tujuan program. Yang perlu diperhatikan dalam
program tersebut adalah bagaimana kerjanya program, dengan
120
jalan mengidentifikasi penampilan-penampilan yang terjadi,
baik hal-hal positif (hal yang diharapkan) maupun hal-hal
negatif (yang sebenarnya tidak diharapkan).
Alasan mengapa tujuan program tidak perlu diperhatikan

karena ada kemungkinan evaluator terlalu rinci mengamati
tiap-tiap tujuan khusus. Jika masing-masing tujuan khusus
tercapai, artinya terpenuhi dalam penampilan, tetapi evaluator
lupa memperhatikan seberapa jauh masing-masing penampilan
tersebut mendukung penampilan akhir yang diharapkan oleh
tujuan umum maka akibatnya jumlah penampilan khusus ini
tidak banyak manfaatnya.
Sebagai contoh, pembelajaran bahasa inggris untuk murid

sekolah dasar. Apabila kegiatan demi kegiatan yang dinilai
pada setiap kegiatan mengajar, maka akan didapati
kemampuan belajar murid tersebar antara baik sekali, baik,
cukup, kurang, kurang sekali atau dapat pula dalam bentuk
lulus atau gagal, atau juga dalam bentuk angka/huruf,
sehingga dapat dikatakan tujuan telah tercapai atau sebagian
telah tercapai. Namun yang tidak terungkap melalui evaluasi
berdasarkan tujuan itu adalah akibat yang terjadi karena resiko
kegiatan itu sendiri atau hal-hal yang tidak terjangkau pada
waktu tujuan dirumuskan. Seperti tidakkah mungkin dengan
pemberian bahasa inggris terlalu dini akan mengurangi
kemampuan berbahasa Indonesia dan kebanggaan nasional.
Dalam evaluasi hasil belajar bahasa inggris tidak semuanya
dapat dinilai dengan jumlah butir soal yang terbatas.
Dalam hal ini Scriven secara tegas menekankan bahwa evaluasi

program dan product hendaklah menilai efek nyata dari suatu
kegiatan. Ini berarti bahwa evaluasi itu tidaklah terikat hanya
pada tujuan yang dirumuskan pada permulaan program, tetapi
juga memperhatikan efek nyatanya. Dengan cara ini semua
121
hasil kegiatan dapat diketahui termasuk didalamnya efek
sampingan (side effect) atau nurturrant effect yang ditimbulkan
suatu kegiatan.
Jadi kesimpulan nya adalah Model yang dikembangkan oleh

Michael Scriven ini yakni Goal Free Evaluation Model justru tidak
memperhatikan apa yang menjadi tujuan program
sebagaimana model goal oriented evaluation. Yang harus
diperhatikan justru adalah bagaimana proses pelaksanaan
program, dengan jalan mengidentifikasi kejadian-kejadian yang
terjadi selama pelaksanaannya, baik hal-hal yang positif
maupun hal-hal yang negatif.
11.2.2. Evaluasi Formatif-Summatif
Michael Scriven Juga mengembangkan sebuah model evaluasi

yaitu model formatif-sumatif. Model ini menunjukkan adanya
tahapan dan lingkup objek yang dievaluasi, yaitu evaluasi yang
dilakukan pada waktu program masih berjalan (disebut
evaluasi formatif) dan ketika program sudah selesai atau
berakhir (disebut evaluasi sumatif).
Berbeda dengan model yang pertama dikembangkan, model

yang kedua ini ketika melaksanakan evaluasi, evaluator tidak
dapat melepaskan diri dari tujuan. Tujuan evaluasi formatif
memang berbeda dengan tujuan evaluasi sumatif. Dengan
demikian model yang dikemukakan oleh Michael Scriven ini
menunjukkan tentang “apa, kapan, dan tujuan” evaluasi
tersebut dilaksanakan.
Para evaluator pendidikan, termasuk guru-guru yang

mempunyai tugas evaluasi, tentu sudah mengenal dengan baik
apa yang dimaksud dengan evaluasi formatif dan sumatif.
Hampir setiap bulan guru-guru melaksanakan evaluasi
122
formatif dalam bentuk ulangan harian. Evaluasi tersebut
dilaksanakan untuk mengetahui sampai berapa tinggi tingkat
keberhasilan atau ketercapaian tujuan untuk masing-masing
pokok bahasan. Dikarenakan luas atau sempitnya materi yang
tercakup didalam pokok bahasan setiap mata pelajaran tidak
sama, maka tidak dapat ditentukan dengan pasti kapan
eveluasi formatif dilaksanakan dan berapa kali untuk masing-
masing mata pelajaran. Berikut akan dijelaskan tahapan dan
lingkup objek yang dievaluasi:
11.2.3. Evaluasi Formatif
Menurut Scriven (1991) dalam diktat teori dan praktek evaluasi

program bimbingan dan konseling (Aip Badrujaman, 2009),
evaluasi formatif adalah suatu evaluasi yang biasanya
dilakukan ketika suatu produk atau program tertentu sedang
dikembangkan dan biasanya dilakukan lebih dari sekali dengan
tujuan untuk melakukan perbaikan. Sedangkan Weston,
McAlpine dan Bordonaro (1995) dalam diktat teori dan praktek
evaluasi program bimbingan dan konseling (Aip Badrujaman, 2009)
menjelaskan bahwa tujuan dari evaluasi formatif adalah untuk
memastikan tujuan yang diharapkan dapat tercapai dan untuk
melakukan perbaikan suatu produk atau program. Hal ini
senada dengan Worthen dan Sanders (1997) dalam diktat teori
dan praktek evaluasi program bimbingan dan konseling (Aip
Badrujaman, 2009) yang menyatakan bahwa evaluasi formatif
dilakukan untuk memberikan informasi evaluatif yang
bermanfaat untuk memperbaiki suatu program. Baker
mengatakan ada dua faktor yang mempengaruhi kegunaan
evaluasi formatif, yaitu kontrol dan waktu. Bila saran
perbaikan akan dijalankan, maka evaluasi formatif diperlukan
sebagai kontrol. Informasi yang diberikan menjadi jaminan
apakah kelemahan dapat diperbaiki. Apabila informasi
123
mengenai kelemahan tersebut terlambat sampai kepada
pengambilan keputusan, maka evaluasi bersifat sia-sia.
Evaluasi formatif dapat menanggapi program dalam konteks

yang dinamis, dan berusaha untuk memperbaki keadaan yang
berantakan dari kerumitan yang merupakan bagian yang tidak
dapat dihindarkan dari berbagai bentuk program dalam
lingkungan kebijakan yang berubah-ubah. Kesesuaian antara
perencanaan dan pelaksanaan program baik pada konteks
organisasi, personil, struktur, dan prosedur menjadi fokus
evaluasi formatif.
Evaluasi formatif secara prinsip merupakan evaluasi yang

dilaksanakan ketika program masih berlangsung atau ketika
program masih dekat dengan permulaan kegiatan. Tujuan
evaluasi formatif tersebut adalah mengetahui seberapa jauh
program yang dirancang dapat berlangsung, sekaligus
mengidentifikasi hambatan. Dengan diketahuinya hambatan
dan hal-hal yang menyebabkan program tidak lancar,
pengambil keputusan secara dini dapat mengadakan perbaikan
yang mendukung kelancaran pencapaian tujuan program.
Sebetulnya Scriven merancang model ini dalam hubungan

pengembangan kurikulum. Ia menyatakan suatu kurikulum
mempunyai bentuk yang siap (final). Evaluasi formatif
merupakan pengumpulan data/bukti selama penyusunan dan
uji coba dari kurikulum baru. Revisi atau perbaikan dilakukan
berdasarkan bukti-bukti tersebut yang dikumpulkan melalui
evaluasi formatif. Dengan menggunakan evaluasi formatif,
evaluator dapat melihat kekurangan dalam pelaksanaan
program/kegiatan, dan dapat juga memantau proses
pelaksanaan, sehingga akan dapat membantu dalam
penyempurnaan dan kelengkapan product yang
dikembangkan. Karena itu evaluasi formatif dapat juga disebut
124
dengan evaluasi internal (Internal-evaluation atau Intrinsic-
evaluation) karena evaluasi formatif dilakukan menyangkut isi,
tujuan, prosedur/proses, sikap guru, sikap murid, fasilitas dan
sebagainya.
Evaluasi formatif yang dikembangkan Scriven untuk menilai

kurikulum pada prinsipnya dapat pula dimanfaatkan dan
digunakan dalam evaluasi proses belajar mengajar, sebagai
salah satu kegiatan dalam pelaksanaan kurikulum. Dalam hal
ini evaluasi dilakukan selama proses belajar mengajar
berlangsung pada setiap satuan pelajaran. Informasi tersebut
akan dapat menunjukkan kekurangan baik pada guru maupun
pada murid dan komponen lainnya, sehingga informasi itu
dapat digunakan sebagai bahan dalam penyempurnaan proses
belajar mengajar berikutnya.
11.2.4. Teknik Evaluasi Formatif
Evaluasi formatif terdiri dari beragam bentuk. Menurut Martin

Tessmer (1996) dalam diktat teori dan praktek evaluasi program
bimbingan dan konseling (Aip Badrujaman, 2009) evaluasi
formatif dapat dilakukan sebagai berikut:
Pertama, Ulasan Ahli (Expert Review).
Evaluasi dimana ahli yang mengkaji ulang Program Pelayanan

dengan atau tanpa kehadiran evaluator. Ahli bisa ahli materi,
ahli teknis, perancang, atau instruktur. Evaluasi ini dilakukan
terhadap program muatan layanan yang masih kasar atau
masih dalam rancangan (draft) untuk mengetahui kelebihan
dan kelemahannya.
Kelebihan dari review ahli adalah: (1) review menghasilkan

tipe informasi yang berbeda jika dibandingkan dengan
125
informasi yang diperoleh dari evaluasi orang per orang,
kelompok kecil, atau uji lapangan; dan (2) kadang-kadang ahli
yang dibutuhkan telah ada dan dibayar dengan murah.
Sedangkan kelemahannya adalah: (1) review ahli tidak

memberikan pandangan atau pendapat dari sudut pandang
siswa; dan (2) review ahli membutuhkan biaya tinggi jika orang
ahli harus didatangkan dari wilayah yang jauh.
Informasi yang dapat digali dari pelaksanaan review ahli

antara lain: (1) Informasi yang berkaitan dengan content
(materi), seperti kelengkapan, akurasi, kepentingan, serta
kedalaman; (2) Informasi yang berkaitan dengan disain
instruksional, seperti kesesuain dengan karakteristik, dan tugas
perkembangan siswa, kesesuaian antara tujuan-materi-evaluasi,
ketepatan pemilihan media, dan ketertarikkan bagi siswa; (3)
Informasi yang berkaitan dengan implementasi, seperti
kemudahan penggunaan, kesesuaian dengan lingkungan
belajar sebenarnya, kesesuaian dengan lingkungan; dan (4)
Informasi kualitas teknis, seperti kualitas layout, grafis, audio,
visual, dll.
Kedua, Evaluasi Orang-per-Orang (One-To-One Evaluation)
Evaluasi ini dilakukan dengan wawancara yang dilakukan

secara perorangan oleh evaluator terhadap beberapa siswa
dimana secara satu persatu siswa diminta untuk memberikan
komentarnya mengenai Program Pelayanan yang sedang
dikembangkan. Selain itu siswa juga biasanya diminta untuk
menyelesaikan pre dan post test untuk mengukur efektifitas
Program Pelayanan.
Keuntungan dari evaluasi ini adalah evaluasi ini memberikan

informasi dari sudut pandang siswa, serta evaluasi ini dapat
126
dilakukan dengan mudah, cepat, murah, dan produktif.
Informasi yang dapat diperoleh dari evaluasi ini meliputi
beberapa aspek, antara lain:
• Materi (content). Seperti tingkat kesulitan, kejelasan,
kemenarikan, serta kekinian materi.
• Disain instruksional. Seperti kejelasan tujuan, kelogisan
sistematika penyampaian materi.
• Implementasi. Seperti tingkat kesulitan penggunaan,
tingkat kemudahan dana, kemungkinan kesulitan yang
dihadapi.
• Kualitas teknis. Seperti kualitas animasi, video, serta
layout.
Menurut Tessmer (1996) dalam diktat teori dan praktek evaluasi

program bimbingan dan konseling (Aip Badrujaman, 2009) untuk
memilih subyek dalam evaluasi satu per satu, ada beberapa
karakteristik yang bisa dijadikan patokan, yakni:
• Pengetahuan siswa: meliputi seberapa jauh mereka
dapat mengetahui tentang materi yang akan diberikan
(pre test).
• Kemampuan siswa: apakah siswa mempunyai
kemampuan intelektual dan strategi yang
menunjukkan bahwa dirinya sebagai siswa dapat
belajar cepat atau lambat.
• Minat siswa: meliputi apakah mereka akan
menunjukkan motivasi yang kuat untuk mempelajari
dan mereview Program Pelayanan yang sedang
dikembangkan.
• Keterwakilan siswa: seberapa jumlah siswa dari
populasi yang memiliki kemampuan, keterampilan,
dan motivasi.
• Kepribadian siswa: apakah cukup percaya diri dan
terbuka untuk mengekspresikan kritiknya selama
evaluasi.
127
Ketiga, Evaluasi Kelompok Kecil (Small Group)
Evaluasi di mana evaluator mengujicobakan suatu Program

Pelayanan pada suatu kelompok siswa dan mencatat
performance dan komentar-komentarnya.
Keempat, Uji Lapangan (Field Test)
Evaluasi di mana evaluator mengobservasi Program Pelayanan

yang diujicobakan kepada sekelompok siswa tertentu dalam
suatu situasi nyata. Evaluasi ini dilakukan terhadap suatu
Program Pelayanan yang sudah selesai dikembangkan, tapi
masih membutuhkan atau memungkinkan untuk direvisi akhir.
Salah satu kelebihan dari uji lapangan adalah bahwa dengan

evaluasi ini akan diperoleh informasi apakah Program
Pelayanan dengan menggunakan menggunakan metode
tertentu akan benar-benar berjalan sesuai dengan apa yang
diharapkan.
Menurut Tessmer (1996) dalam diktat teori dan praktek evaluasi

program bimbingan dan konseling (Aip Badrujaman, 2009)
beberapa fokus penggalian informasi yang perlu dijadikan
patokan dalam uji lapangan adalah:
• Kemampuan untuk dilaksanakan
• Kesinambungan
• Efektifitas
• Kecocokan dengan lingkungan
• Digunakan dalam beberapa variasi lingkungan
Kelima, Evaluasi Sumatif
128
Berbeda dengan evaluasi formatif, evaluasi summatif lebih
diarahkan untuk menguji efek dari komponen-komponen
pendidikan/pembelajaran terhadap murid-murid, atau dapat
juga dikatakan bahwa evaluasi summatif dirancang untuk
mengetahui seberapa jauh kurikulum yang telah disusun
sebelumnya memberikan hasil pada siswa antara lain
mencakup aspek kognitif, afektif, dan psikomotor. Hal itu
dapat dilihat pada hasil pre test dan post test, antara kelompok
eksperimen dan control. Walaupun Scriven tidak mengarahkan
model ini pada evaluasi dalam proses belajar mengajar, namun
pelaksanaan kurikulum tidaklah dapat dipisahkan dari
kegiatan pendidikan.
Contoh, dalam sebuah kurikulum kimia di SMA , untuk

menilai kurikulum kimia itu, maka setiap unit atau satuan
pelajaran harus dicobakan/dilaksanakan. Pada akhir
pelaksanaan setiap kegiatan belajar mengajar, atau pada
pertengahan dan akhir semester evaluasi hasil belajar dapat
dan perlu dilakukan baik untuk menentukan tingkatan atau
angka yang dicapai siswa dalam bidang tersebut maupun
proses pendidikan berikutnya.
Evaluasi sumatif juga dilakukan setelah program berakhir.

Tujuan dari evaluasi sumatif adalah untuk mengukur
pencapaian program. Fungsi evaluasi sumatif dalam evaluasi
program pembelajaran dimaksudkan sebagai sarana untuk
mengetahui posisi atau kedudukan individu di dalam
kelompoknya. Mengingat bahwa obyek sasaran dan waktu
pelaksanaan berbeda antara evaluasi formatif dan sumatif
maka lingkup sasaran yang dievaluasi juga berbeda.
Pola evaluasi sumatif ini dilakukan apabila guru bermaksud

untuk mengetahui tahap perkembangan terakhir dari siswanya.
Asumsi yang mendasarinya adalah bahwa hasil belajar
129
merupakan totalitas sejak awal hingga akhir. Beberapa
keuntungan dari evaluasi sumatif meliputi: (1) Mereka bisa, jika
dirancang dengan tepat, menyediakan bukti untuk sebuah
hubungan sebab-akibat; (2) Menilai hubungan jangka panjang;
dan (3) Menyediakan data mengenai dampak program.
11.3. Model Evaluasi Formatif-Sumatif Untuk Program

Proses dan Program Pelayanan
11.3.1. Model Formative-Summative Evaluation untuk Prog-

ram Pemrosesan
Model evaluasi formatif-sumatif yang juga dikemukakan oleh

Scriven ini mengemukakan adanya dua macam evaluasi, yaitu
formatif (yang dilakukan selama program berlangsung), dan
evaluasi sumatif (yang dilakukan sesudah program berakhir
atau pada akhir penghujung program). Program pembelajaran
dan kepramukaan adalah program yang kegiatannya
memproses masukan melalui transformasi dan menghasilkan
keluaran. Kata“memproses” sudah menunjukkan bahwa
kegiatan dalam program tersebut berkesinambungan.
Dalam memahami bentuk kegiatan yang berkesinambungan

kita dapat berpikir tentang pemenggalan beberapa kali sesuai
dengan kesatuan yang dibentuk di dlaam program. Dengan
pemenggalan para evaluator dapat melakukan evaluasi
formative ketika proses berlangsung. Dalam program
pembelajaran, bentuk pemenggalan tertera dalam
terselesaikannya pokok bahasan setelah habis diajarkan kepada
siswa. Dalam program kepramukaan, bentuk pemenggalannya
terletak pada akhir setiap jenis latihan. Untuk evaluasi sumatif
tampaknya tidak ada masalah. Setiap jenis program tentu akan
berakhir, dan pada akhir kegiatan program itulah evaluasi
sumatif dilakukan.
130
Berdasarkan penjelasan melalaui dua contoh program diatas
dapat disimpulkan bahwa model evaluasi sumatif dan formatif
sesuai untuk mengevaluasi program pemrosesan. Evaluasi
formatif dapat dilaksanakan pada penggalan kegiatan,
sedangkan evaluasi sumatif dilaksanakan pada akhir program.
11.3.2. Model Evaluasi Formative dan Sumative Untuk

Program Pelayanan
Dalam pembahasan mengenai ketepatan model-model evaluasi

untuk tiga buah layanan (program perpustakaan, program
koperasi, program bank) yang dicontohkan, sudah secara dikaji
pula kemungkinan evaluasi dilaksanakan sejak awal hingga
akhir program secara berkesinambungan. Evaluasi formatif dan
sumatif merupakan dua jenis kegiatan evaluasi yang dapat
dikatakan merupakan bagian dari evaluasi berkesinambungan.
Dengan penjelasan ini, dapat disimpulkan bahwa model
evaluasi formatif dan sumatif tepat digunakan untuk Program
Pelayanan.
Dalam konteks bimbingan dan konseling, evaluasi formatif

dapat didefinisikan sebagai suatu proses pengumpulan data
untuk menentukan keberhasilan atau menilai tentang kelebihan
dan kelemahan suatu program ketika program tersebut masih
dalam tahap pengembangan, kemudian setelah teridentifikasi
(melalui evaluasi formatif) barulah dapat dilakukan revisi
(perbaikan). Tujuan evaluasi formatif adalah untuk merevisi
Program Pelayanan yang sedang dikembangkan dengan cara
mengumpulkan data dari berbagai sumber dengan
menggunakan berbagai metode dan alat pengumpulan data
tertentu.
131
11.4. Prasyarat Evaluator Dalam Evaluasi
Dalam menggunakan model ini ada beberapa kemampuan

logika evaluator yang harus disiapkan dalam melakukan
evaluasi:
• Memahami perbedaan dan hubungan antara evaluasi
dengan kegiatan penelitian, pengkajian, khususnya
dalam hal pendeskripsian evaluasi, pengklasifikasian,
generalisasi, prediksi, eksplanasi, dan rekomendasi.
• Memahami perbedaan antara: tingkatan, peringkat,
penskoran, kualitas, kebermaknaan, dan arti penting.
Dengan memahami perbedaan-perbedaan ini, akan
sangat membantu dalam mengambil suatu kesimpulan
evaluasi.
• Memahami argumen yang mendukung kesimpulan
dari sebuah evaluasi (seperti: alasan dan landasan
filosofi)
• Perlu memahami perbedaan antara evaluasi yang
bersifat holistic dan evaluasi yang bersifat analitik, yang
di dalamnya terdapat tiga macam komponen yakni
dimensi, komponen, dan teori.
• Memahami perbedaan antara evaluasi formatif dan
summative, termasuk argumen yang mendasarinya.
• Memahami perbedaan dan hubungan antara evaluasi
yang bersifat obyektif dan subyektif (bias,
kecenderungan, dll)
• Memahami perbedaan antara berbagai macam bukti
yang mendukung
• dan tidak mendukung.
• Memahami bagaimana dan mengapa evaluasi
dikembangkan untuk keperluan praktis, professional,
kebutuhan pengembangan ilmu tertentu, dan
interdisipliner.
132
11.5. Kemampuan Metodologis
Kemampuan metodologis dalam evaluasi adalah:

• Pendekatan dengan check list, termasuk di dalamnya
check point terhadap out come, process, cost, comparacy.
• Prosedur meta-evaluasi yang di dalamuya terdapat
empat lan.gkah yaitu: re-check, re-do, do differently
(melakukan dengan cara yang berbeda), dan special
checklists
• Kemampuan melakuakan analisis biaya, khususnya
untuk analisis non biaya.
• Kemampuan melakukan penelitian kualitatif.
• Kemampuan intradisipliner, khususnya teori evaluasi.
• Kemampuan mengidentifikasi nilai-nilai yang relevan
dan lidak relevan (kontra).
• Kemampuan memberikan laporan, baik kepada
pemangku kepentingan, client, nonclient, khususnya
laporan yang berupa nonteks.
• Kemampuan memahami psikologi evaluasi
• Kemampuan dalam berbagai bidang ilmu tertentu,
seperti technology assessment, personnel evaluation,
business evaluation, non-profit management, developmental
evaluation, proposal evaluation, evaluative questionnaire
design, etc.
11.6. Kesimpulan
Dalam ilmu evaluasi program pendidikan, ada banyak model

yang dapat digunakan untuk mengevaluasi suatu program.
Meskipun antara satu dengan yang lainnya berbeda, namun
maksudnya sama yaitu melakukan kegiatan pengumpulan data
atau informasi yang berkenaan dengan obyek yang dievaluasi,
yang tujuannya menyediakan bahan bagi pengambil keputusan
dalam mengambil tindak lanjut suatu program. Salah satu
133
model evaluasi program ini dikemukakan oleh Michael Striven,
professor psikologi di Claremont Graduate School dan terakhir
menjabat sebagai Presiden Asosiasi Evaluasi Amerika. Model
yang dikembangkannva adalah Goal Free Evaluation "evaluasi
bebas tujuan" dan Formatif-Summatif Evaluation. Dalam Goal Free
Evaluation bukan berarti lepas sama sekali dari tujuan evaluasi
tetapi hanya lepas dari tujuan khusus. Model ini hanya
mempertimbangkan tujuan umum yang akan dicapai oleh
program, bukan secara rinci per komponen. Singkatnya model
ini justru tidak memperhatikan apa yang menjadi tujuan
program sebagaimana model goal oriented evaluation. Yang
harus diperhatikan justru adalah bagaimana proses
pelaksanaan program, dengan jalan mengidentifikasi kejadian-
kejadian yang terjadi selama pelaksanaannya, baik hal-hal yang
positif maupun hal-hal yang negatif.
Sedangkan Evaluasi Formatif dalam hal ini evaluasi dilakukan

selama proses belajar mengajar berlangsung pada setiap satuan
pelajaran. Informasi tersebut akan dapat menunjukkan
kekurangan baik pada guru maupun pada murid dan
komponen lainnya, sehingga informasi itu dapat digunakan
sebagai bahan dalam penyempurnaan proses belajar mengajar
berikutnya. Lalu Evaluasi Summatif dirancang untuk
mengetahui seberapa jauh kurikulum yang telah disusun
sebelumnya memberikan hasil pada siswa antara lain
mencakup aspek kognitif, afektif, dan psikomotorik.
134
Bab 12
Model Kirkpatrick
12.1. Pengantar
Salah satu permasalahan ketika kita hendak melakukan

evaluasi adalah pemilihan model yang dianggap paling sesuai
terhadap program yang hendak dievaluasi. Pemilihan model
evaluasi ini menjadi penting dikarenakan setiap program
memiliki karakteristik yang berbeda dan setiap model evaluasi
memiliki asumsi, pendekatan, terminologi, dan logika berpikir
yang berbeda pula. Oleh karenanya penggunaan lebih dari satu
model dalam suatu evaluasi sangat tidak disarankan karena
justru akan memunculkan kerancuan dan benturan logika antar
model. Meskipun setiap model evaluasi tetap memiliki
keterbatasan, namun pemilihan model yang tepat akan
berimplikasi langsung terhadap kualitas informasi yang
dihasilkan oleh suatu evaluasi. Kualitas informasi dalam suatu
evaluasi bisa menjadi ukuran keberhasilan suatu evaluasi.
Sebab tujuan utama evaluasi adalah menyediakan informasi
bagi pengambil keputusan mengenai suatu program untuk
menentukan apakah suatu program dihentikan, diteruskan
dengan perbaikan, atau diteruskan dengan pengembangan.
Untuk menentukan jenis atau model evaluasi yang hendak

digunakan, seorang evaluator biasanya mempertimbangkan
dua hal yaitu jenis program yang hendak dievaluasi dan tujuan
atau untuk kepentingan apa suatu evaluasi dilakukan. Dari sisi
tujuan evaluasi, ada evaluasi yang digunakan untuk
mengetahui tingkat kesenjangan suatu program, tingkat
135
efektifitas suatu program, ada pula evaluasi yang bertujuan
untuk menemukan hasil suatu program di luar tujuan program
yang direncanakan. Dari sisi program, seandainya kita
persempit menjadi program pendidikan, ada program
pendidikan dengan term waktu yang panjang dengan cakupan
bidang garapan program yang luas dan tujuan program yang
komprehensif, seperti penyelenggaraan kegiatan persekolahan
formal. Ada pula program pendidikan dengan term waktu
yang singkat dengan bidang garapan yang lebih spesifik serta
memiliki tujuan program yang lebih sempit. Contoh program
ini adalah program diklat, kursus, dan pelatihan.
Salah seorang tokoh yang mencoba memperkenalkan model

evaluasi untuk program-program short-term dengan bidang
garapan dan tujuan yang spesifik adalah Kirkpatrick.
Kirkpatrick memperkenalkan model evaluasinya pertama kali
pada tahun 1959. Model ini diakui memiliki kelebihan karena
sifatnya yang menyeluruh, sederhana, dan dapat diterapkan
dalam berbagai situasi pelatihan. Menyeluruh dalam artian
model evaluasi ini mampu menjangkau semua sisi dari suatu
program pelatihan. Dikatakan sederhana karena model ini
memiliki alur logika yang sederhana dan mudah dipahami
serta kategorisasi yang jelas dan tidak berbelit-belit. Sementara
dari sisi penggunaan, model ini bisa digunakan untuk
mengevaluasi berbagai macam jenis pelatihan dengan berbagai
macam situasi. Menurut Kirkpatrick, evaluasi didefinisikan
sebagai kegiatan untuk menentukan tingkat efektifitas suatu
program pelatihan.
12.2. Tahap Evaluasi Model Kirkpatrick
Dalam model Kirkpatrick, evaluasi dilakukan melalui empat

tahap evaluasi atau kategori. Tahap ini adalah: (1) reaction;
adalah evaluasi untuk mengetahui tingkat kepuasan peserta
136
terhadap pelaksanaan suatu pelatihan; (2) learning; adalah
evaluasi untuk mengukur tingkat tambahan pengetahuan,
ketrampilan maupun perubahan sikap peserta setelah
mengikuti pelatihan; (3) behaviour; adalah evaluasi untuk
mengetahui tingkat perubahan perilaku kerja peserta pelatihan
setelah kembali ke lingkungan kerjanya; dan (4) result; adalah
evaluasi untuk mengetahui dampak perubahan perilaku kerja
peserta pelatihan terhadap tingkat produktifitas organisasi.
Selanjutnya ke empat tahap evaluasi tersebut akan dijelaskan
secara lebih rinci.
12.2.1. Reaction (Aksi Kembali)
Evaluasi terhadap reaksi bertujuan untuk mengetahui tingkat

kepuasan peserta pelatihan terhadap penyelenggaraan
pelatihan. Yang menjadi pertanyaan adalah: Mengapa tingkat
kepuasan peserta mesti diukur? Apakah ada relevansinya
terhadap pelatihan itu sendiri? Pertama, sesungguhnya
evaluasi reaksi ini merupakan evaluasi terhadap proses
pelatihan itu sendiri. Kualitas proses atau pelaksanaan suatu
pelatihan dapat kita ukur melalui tingkat kepuasan pesertanya.
Keduanya berbanding lurus. Semakin bagus pelaksanaan suatu
pelatihan, akan semakin bagus pula respon kepuasan peserta
terhadap penyelenggaraan suatu pelatihan. Kedua, kepuasan
peserta terhadap penyelenggaraan atau proses suatu pelatihan
akan berimplikasi langsung terhadap motivasi dan semangat
belajar peserta dalam pelatihan. Peserta pelatihan akan belajar
dengan lebih baik ketika dia merasa puas dengan suasana dan
lingkungan tempat ia belajar.
Mengetahui tingkat kepuasan peserta dapat dilakukan dengan

mengukur beberapa aspek dalam pelatihan. Aspek itu meliputi:
pelayanan panitia penyelenggara, kualitas instruktur,
kurikulum pelatihan, materi pelatihan, metode belajar, suasana
137
kelas, fasilitas utama dan fasilitas pendukung, kebernilaian dan
kebermaknaan isi pelatihan, dan lain-lain yang berhubungan
dengan penyelenggaraan suatu pelatihan. Mengukur reaksi ini
relatif mudah karena bisa dilakukan dengan menggunakan
reaction sheet yang berbentuk angket. Evaluasi terhadap reaksi
ini sesungguhnya dimaksudkan untuk mendapatkan respon
seasaat peserta terhadap kualitas penyelenggaraan pelatihan.
Oleh karena itu waktu yang paling tepat untuk menyebarkan
angket adalah sesaat setelah pelatihan berakhir atau beberapa
saat sebelum pelatihan berakhir.
12.2.2. Learning (Pembelajaran)
Menurut Kirkpatrick (1988: 20) learning can be defined as the

extend to which participans change attitudes, improving knowledge,
and/or increase skill as a result of attending the program. Belajar
dapat didefinisikan sebagai perubahan sikap mental (attitude),
perbaikan pengetahuan, dan atau penambahan ketrampilan
peserta setelah selesai mengikuti program. Ada tiga hal yang
dapat instruktur ajarkan dalam program training, yaitu
pengetahuan, sikap maupun ketrampilan. Peserta training
dikatakan telah belajar apabila pada dirinya telah mengalamai
perubahan sikap, perbaikan pengetahuan maupun peningkatan
ketrampilan. Oleh karena itu untuk mengukur efektivitas
program training maka ketiga aspek tersebut perlu untuk
diukur. Tanpa adanya perubahan sikap, peningkatan
pengetahuan maupun perbaikan ketrampilan pada peserta
training maka program dapat dikatakan gagal. Penilaian
evaluating learning ini ada yang menyebut dengan penilaiah
hasil (output) belajar. Oleh karena itu dalam pengukuran hasil
belajar (learning measurement) berarti penentuan satu atau lebih
hal berikut: (1). Pengetahuan apa yang telah dipelajari?, (2)
Sikap apa yang telah berubah?, (3) Ketrampilan apa yang telah
dikembangkan atau diperbaiki?
138
Evaluasi tahap kedua ini sesungguhnya evaluasi terhadap hasil
pelatihan. Program dikatakan berhasil ketika aspek-aspek
tersebut diatas mengalami perbaikan dengan membandingkan
hasil pengukuran sebelum dan sesudah pelatihan. Semakin
tinggi tingkat perbaikannya, dikatakan semakin berhasil pula
suatu program pelatihan.
Kegiatan pengukuran dalam evaluasi tahap kedua ini relatif

lebih sulit dan lebih memakan waktu jika dibanding dengan
mengukur reaksi peserta. Oleh karenanya penggunaan alat
ukur dan pemilihan waktu yang tepat akan dapat membantu
kita mendapatkan hasil pengukuran yang sahih dan akurat.
Alat ukur yang bisa kita gunakan adalah tes tertulis dan tes
kinerja. Tes tertulis kita gunakan untuk mengukur tingkat
perbaikan pengetahuan dan sikap peserta, sementara tes
kinerja kita gunakan untuk mengetahui tingkat penambahan
ketrampilan peserta. Untuk dapat mengetahui tingkat
perbaikan aspek-aspek tersebut, tes dilakukan sebelum dan
sesudah program. Disamping itu, Kirkpatrick juga
menyarankan penggunaan kelompok pembanding sebagai
referensi efek pelatihan terhadap peserta. Kelompok
pembanding ini adalah kelompok yang tidak ikut program
pelatihan. Kedua kelompok diukur dan diperbandingkan hasil
pengukuran keduanya hingga dapat diketahui efek program
terhadap pesertanya.
12.2.3. Behaviour (Perilaku)
Evaluasi terhadap perilaku ini difokuskan pada perilaku kerja

peserta pelatihan setelah mereka kembali ke dalam lingkungan
kerjanya. Perilaku yang dimaksud di sini adalah perilaku kerja
yang ada hubungannya langsung dengan materi pelatihan, dan
bukan perilaku dalam konteks hubungan personal dengan
139
rekan-rekan kerjanya. Jadi, yang ingin diketahui dalam evaluasi
ini adalah seberapa jauh perubahan sikap mental (attitude),
perbaikan pengetahuan, dan atau penambahan ketrampilan
peserta membawa pengaruh langsung terhadap kinerja peserta
ketika kembali ke lingkungan kerjanya. Apakah perubahan
sikap mental (attitude), perbaikan pengetahuan, dan atau
penambahan ketrampilan peserta itu diimplementasikan dalam
lingkungan kerja peserta ataukah dibiarkan berkarat dalam diri
peserta tanpa pernah diimplementasikan.
Evaluasi perilaku ini dapat dilakukan melalui observasi

langsung ke dalam lingkungan kerja peserta. Disamping itu
bisa juga melalui wawancara dengan atasan maupun rekan
kerja peserta. Dari sini diharapkan akan diketahui perubahan
perilaku kerja peserta sebelum dan setelah ikut program.
Karena terkadang ada kesulitan untuk mengetahui kinerja
peserta sebelum ikut pelatihan, disarankan juga untuk
melakukan dokumentasi terhadap catatan kerja peserta
sebelum mengikuti pelatihan. Pada program pelatihan yang
sifatnya rutin yang merupakan kerjasama suatu institusi
dengan penyelenggara pelatihan, mengukur perilaku kerja
peserta dapat dilakukan secara simultan dari angkatan yang
satu ke angkatan berikutnya. Dalam kasus ini, biasanya
pimpinan organisasi atau institusi memegang peranan penting
dan biasanya pimpinan organisasi lah yang mengambil inisiatif
sebab merekalah yang paling berkepentingan dengan hasil
pelatihan yang sudah dikenakan pada anak buahnya.
Seringkali peserta pelatihan membutuhkan waktu transisi

dalam merubah perilaku kerjanya setelah ikut program. Oleh
karena itu sangat disarankan pelaksanaan evaluasi perilaku ini
dilakukan dengan terlebih dahulu memberi waktu jeda untuk
masa transisi itu. Sementara pakar evaluasi menyarankan
paling cepat 3 bulan setelah pelatihan berakhir. Disamping itu
140
disarankan juga evaluasi ini dilakukan lebih dari satu kali
dalam rentang waktu yang cukup untuk mengetahui apakah
perubahan perilaku itu bersifat sementara ataukah permanen.
12.2.4. Result (Hasil)
Evaluasi terhadap result bertujuan mengetahui dampak

perubahan perilaku kerja peserta pelatihan terhadap tingkat
produktifitas organisasi. Aspek yang bisa disasar dalam
evaluasi ini meliputi kenaikan produksi, peningkatan kualitas
produk, penuruna biaya, penurunan angka kecelakaan kerja
baik kualitas maupun kuantitas, penurunan turn over, maupun
kenaikan tingkat keuntungan. Jika kita persempit untuk
organisasi persekolahan yang mengirim gurunya dalam
program pelatihan, aspek yang bisa kita ukur dalam evaluasi
result ini adalah suasana belajar di kelas, tingkat partisipasi
siswa dalam pembelajaran, maupun nilai belajar siswa. Dalam
skala yang lebih luas, aspek ini bisa dikembangkan menjadi
kenaikan peringkat sekolah secara akademis, pandangan
masyarakat mengenai kualitas sekolah yang bersangkutan,
kenaikan jumlah pendaftar, dan kenaikan kualitas input siswa.
Satu hal yang perlu disadari bahwa yang bisa dimasukkan

dalam aspek evaluasi result ini tidak hanya melulu yang
berhubungan dengan produktifitas, namun bisa lebih luas dari
itu. Terbangunnya teamwok yang makin solid dan kompak yang
berimplikasi langsung terhadap motivasi dan suasana kerja
dalam suatu organisasi juga merupakan aspek yang bisa
dijadikan pertimbangan dalam evaluasi di tahap ini.
Selain melalui observasi langsung dan wawancara dengan

pimpinan organisasi, evaluasi terhadap result ini sangat
disarankan menggunakan metode dokumentasi. Dokumentasi
terhadap catatan atau laporan organisasi dapat digunakan
141
untuk mengetahui dampak pelatihan terhadap produktifitas
organisasi. Karena kebanyakan materi program pelatihan tidak
berdampak secara langsung terhadap result organisasi, maka
evaluasi di tahap ini membutuhkan jeda waktu yang lebih lama
dibanding evaluasi terhadap perilaku. Apalagi biasanya
perhitungan terhadap aspek-aspek result suatu organisasi
dilakukan dalam periode laporan tahunan. Oleh karenanya
evaluasi di tahap ini membutuhkan rentang waktu yang lebih
lama dalam pelaksanaannya.
12.3. Evaluasi Model Kirkpatrick Plus
Selain keempat tahap seperti yang telah disebutkan di atas, saat

ini telah pula dikembangkan evaluasi model Kirkpatrick Plus
dengan memasukkan satu lagi tahap evaluasi. Tahap ini
dikenal sebagai tahap evaluasi return on investment (ROI).
Tahapan ini biasanya diterapkan pada saat kita melakukan
evaluasi terhadap peserta pelatihan yang berasal dari
organisasi profit atau perusahaan. Logika berpikir yang
melatarbelakangi dilakukannya evaluasi ROI ini adalah asumsi
bahwa setiap kepeng yang keluar dari kantong perusahaan
selalu dianggap sebagai investasi yang pada gilirannya harus
mendatangkan profit atau keuntungan bagi perusahaan yang
bersangkutan. Oleh karena itu pada tahapan evaluasi ROI ini
seorang evaluator dituntut mampu membuat perbandingan
antara biaya yang dikeluarkan oleh perusahaan untuk
mengirim pekerjanya mengikuti suatu pelatihan dengan
keuntungan yang akan diperoleh oleh perusahaan dari
keikutsertaan pekerjanya dalam pelatihan tersebut. Dalam
tahapan ini seorang evaluator bisa melakukan dokumentasi
terhadap berbagai catatan yang diperlukan. Catatan tersebut
bisa berujud produktifitas atau keuntungan perusahaan
sebelum dan sesudah program pelatihan, serta besarnya biaya
142
yang dikeluarkan oleh perusahaan untuk suatu program
pelatihan.
12.4. Contoh Penerapan Evaluasi Kirkpatrick
12.4.1. Merancang Pelatihan
Pernahkah Anda diminta untuk merancang sebuah pelatihan

untuk sebuah perusahaan? Jika Anda belum pernah melakukan
hal ini, barangkali Anda akan bertanya-tanya, bagaimana
caranya Anda memulai rancangan Anda? Apakah Anda mulai
dengan mengumpulkan materi-materi pelatihan yang sudah
ada di pasaran dan kemudian menyesuaikannya dengan
kebutuhan perusahaan? Jika iya, dari mana Anda tahu apa
kebutuhan perusahaan? Jika Anda sudah tahu kebutuhan
perusahaan, apakah Anda yakin bahwa pelatihan yang Anda
rancang merupakan pilihan yang terbaik?
Tulisan ini dimaksudkan untuk memberikan ilustrasi mengenai

langkah-langkah merancang suatu pelatihan dari nol. Untuk
mempermudah ilustrasi, contoh kasus berikut ini akan
digunakan: Anda diminta untuk merancang pelatihan di
bidang kesehatan dan keselamatan kerja (occupational health and
safety, OHS) bagi para manajer dan karyawan sebuah hotel.
Mengingat keterbatasan budget, klien Anda meminta agar
Anda merancang pelatihan yang seekonomis mungkin dari segi
waktu maupun sumber daya.
12.4.2. Training Need Analysis
Training need analysis sebaiknya dilakukan pada tiga tingkatan

analisis:
Pertama, Tingkatan Organisasi.
143
Analisis di tingkat ini berusaha mengetahui apa tujuan yang
ingin dicapai oleh perusahaan dan juga apakah ada cukup
“buy-in” di dalam organisasi untuk memastikan bahwa
perbaikan yang ingin dicapai dapat terjadi. Dalam contoh kasus
ini, tujuan utama perusahaan di bidang kesehatan dan
keselamatan kerja adalah untuk memastikan adanya
lingkungan kerja yang aman dan sehat sehingga karyawan
dapat bekerja dengan kondisi kesehatan fisik maupun mental
yang optimal. Tujuan utama ini didasari oleh beberapa
pemikiran, antara lain sebagai berikut: (1) Legalitas: Untuk
memenuhi tuntutan legal dan menghindarkan adanya sanksi
dari pemerintah jika perusahaan tidak memenuhi standar
keamanan dan kesehatan di tempat kerja; (2) Efisiensi: Untuk
mengurangi biaya yang terbuang karena adanya kecelakaan
atau kondisi lain yang tidak sehat/aman di tempat kerja.
Tingkat kecelakaan yang tinggi juga bisa mempengaruhi
keadaan SDM secara umum, misalnya mempengaruhi
banyaknya karyawan yang mengundurkan diri dari
perusahaan, absen, atau mengajukan protes.
Untuk memperoleh informasi seperti di atas, pihak perancang

pelatihan dapat mengadakan kegiatan seperti wawancara atau
Focus Group Discussion (FGD) dengan peserta dari pihak
manajemen perusahaan. Metode temu muka seperti ini akan
sangat bermanfaat dalam mengumpulkan informasi mengenai
sikap dan buy-in pihak manajemen, karena kesuksesan
pelatihan baik dari segi pelaksanaan maupun hasilnya akan
tergantung pada ada atau tidaknya dukungan dari pihak
manajemen. Pertanyaan yang dapat diajukan dalam
wawancara atau FGD antara lain: (1) Apakah visi dan target
perusahaan dari segi kesehatan dan keselamatan kerja? (2)
Apakah ada tugas atau tanggung jawab karyawan yang perlu
diubah untuk dapat memenuhi target ini? Jika iya, perubahan
144
apakah yang dibutuhkan? (3) Apakah sikap karyawan di
tempat kerja dalam hal kesehatan dan keselamatan kerja perlu
diubah? (4) Hal-hal apa sajakah yang bisa menimbulkan resiko
kesehatan/keselamatan di tempat kerja? Bagaimana cara
perusahaan mengontrol resiko tersebut?Apakah ada langkah-
langkah yang perlu diketahui semua karyawan dalam rangka
melakukan kontrol tersebut?
Kedua, Tingkatan Operasional.
Tingkatan ini berkaitan dengan job requirement. Untuk

mengumpulkan informasi mengenai Knowledge, Skills dan
Attitudes (KSAs) yang dibutuhkan oleh perusahaan, pihak
perancang pelatihan dapat melakukan kegiatan antara lain:
melakukan analisis terhadap job description yang sudah ada,
membagikan kuesioner, dan observasi. Mengingat tingginya
biaya serta waktu yang dibutuhkan untuk wawancara atau
FGD, kedua kegiatan ini hanya perlu dilakukan di tingkat
operasional untuk pekerjaan yang dianggap sangat penting.
Pertanyaan yang dapat diajukan di tingkatan ini antara lain: (1)
Apa sajakah tugas dan tanggung jawab dari pekerjaan tertentu?
(2) Apakah ada perubahan tugas dan tanggung jawab dalam
pekerjaan sehubungan dengan adanya perubahaan kebijakan di
tingkat organisasi dalam bidang kesehatan dan keselamatan di
tempat kerja? Jika iya, perubahaan apakah itu? (3) Ketrampilan
dan pengetahuan apa sajakah yang perlu dimiliki karyawan
agar dapat memenuhi tugas dan tanggung jawabnya secara
kompeten tanpa resiko terhadap kesehatan dan keselamatan?
Ketiga, Tingkatan Individu.
Analisis di tingkat ini akan difokuskan pada KSA yang

dibutuhkan oleh individu. Karyawan membutuhkan pelatihan
baik untuk prestasi pribadi dan juga untuk memenuhi tuntutan
145
pekerjaan (yang pada akhirnya akan mempengaruhi karir
seperti kenaikan gaji atau promosi). Data SDM yang sudah ada
mengenai pelatihan yang telah diikuti karyawan sebelumnya
dapat digabungkan dengan hasil survei untuk mengetahui
kesenjangan antara target perusahaan (dalam kasus ini di
bidang kesehatan dan keselamatan kerja) dengan KSA
karyawan yang telah dicapai selama ini. Pertanyaan yang bisa
diajukan di tingkatan individu antara lain: (1) Ketrampilan dan
pengetahuan apa saja yang sudah dimiliki karyawan? (2)
Pelatihan apa saja yang sudah diikuti masing-masing
karyawan? (3) Cara pelatihan seperti apa yang paling dapat
memenuhi kebutuhan individu karyawan? Pelatihan di ruang
kelas, pelatihan di tempat kerja, atau metode lain? Apakah
lebih baik menggunakan pelatih dari luar atau dari dalam
perusahaan? Apakah pelatihan sebaiknya dilakukan di dalam
atau di luar jam kerja? (4) Apakah ada karyawan yang
mempunyai keterbatasan bahasa sehingga pelatihan perlu
dilakukan dalam bahasa tertentu?
12.5. Alternatif Solusi
Selain pelatihan, ada alternatif-alternatif solusi lain yang dapat

dipertimbangkan untuk mencapai target yang diinginkan
perusahaan berdasarkan training need analysis. Alternatif
tersebut antara lain:
• Job redesign: Dilakukan dengan mengevaluasi posisi-posisi
yang ada di perusahaan dan mengidentifikasi posisimana
yang memiliki resiko tinggi dalam hal kesehatan atau
keselamatan kerja (misalnya dalam contoh kasus
perusahaan berupa hotel, pembersih jendela memiliki
resiko yang lebih tinggi dibandingkan dengan petugas
kebersihan dalam gedung). Jika memungkinkan, posisi-
posisi yang memiliki resiko paling tinggi didesain ulang
untuk meminimalkan resiko tersebut, misalnya dengan
146
memberikan waktu istirahat yang lebih sering sehingga
karyawan tidak mengalami kecelakaan karena kelelahan.
Contoh lain adalah dengan memanfaatkan ilmu
ergonomik untuk mendesain lingkungan kerja yang dapat
meminimalkan resiko dalam hal kesehatan dan
keselamatan kerja, misalnya mendesain sabuk pengaman
yang mudah dan nyaman digunakan sehingga karyawan
mau dan mampu menggunakannya tanpa perlu pelatihan
terlebih dahulu.
• Merekrut karyawan yang tepat: Sebagai salah satu
alternatif, perusahaan dapat merekrut calon karyawan
yang sudah pernah menjalani pelatihan di bidang
kesehatan dan keselamatan kerja sehingga perusahaan
dapat menghemat biaya pelatihan (dengan asumsi calon
karyawan tersebut tetap memenuhi persyaratan lainnya).
• Alat bantu untuk karyawan baru: Untuk membantu
karyawan baru mempelajari prosedur keselamatan kerja
yang diterapkan perusahaan, mereka bisa diberi alat bantu
berupa checklist atau instruksi yang direkam secara audio
berisi hal-hal yang wajib dilaksanakan untuk memastikan
keselamatan di tempat kerja, misalnya checklist untuk
petugas kebersihan dalam gedung hotel antara lain terdiri
dari: memasang tanda “licin” ketika mengepel lantai
supaya tamu tidak terpeleset, mengenakan sarung tangan
karet ketika menggunakan bahan kimia yang keras untuk
membersihkan kamar mandi, dst.
• Menciptakan/memodifikasi kebijaksan perusahaan:
Untuk memastikan karyawan mengikuti prosedur
keselamatan kerja yang berkaitan dengan kewajiban
hukum (misalnya mengenakan sabuk pengaman bagi
supir perusahaan), perusahaan dapat
menciptakan/memodifikasi kebijakan perusahaan yang
terkait sehingga karyawan lebih termotivasi untuk
menaati hukum tersebut.
147
Untuk menentukan apakah pelatihan atau salah satu alternatif
di atas akan lebih efektif dari segi biaya, perusahaan dapat
melakukan langkah-langkah berikut ini:
• Menghitung biaya serta keuntungan yang didapatkan dari
pelatihan
• Menghitung biaya serta keuntungan yang didapatkan dari
alternatif yang lain dan membandingkannya dengan
biaya/keuntungan dari pelatihan
Beberapa contoh konkret yang dapat mengilustrasikan hal ini:

• Contoh 1: Perusahaan ingin memastikan bahwa semua
petugas kebersihan mengikuti prosedur keselamatan
kerja. Biaya pelatihan untuk semua karyawan baru akan
sangat tinggi (termasuk antara lain tetap menggaji
karyawan walaupun mereka tidak bekerja selama
mengikuti pelatihan dan juga biaya pelatihan itu sendiri),
sementara biaya untuk mencetak checklist jauh lebih
murah. Keuntungan dari pengadaan pelatihan adalah 99%
dari seluruh karyawan baru akan mengikuti prosedur
keselamatan kerja yang ditetapkan. Namun checklist pun
dapat memastikan 96% success rate karena checklist
merupakan alat bantu yang mudah dimengerti dan
karyawan tidak ada alasan untuk tidak mengikutinya.
Maka dalam kasus ini, checklist merupakan pilihan yang
lebih baik dibandingkan dengan pelatihan.
• Contoh 2: Karena adanya undang-undang baru di bidang
keselamatan kerja, para manajer di perusahaan wajib
memahami dan melaksanakan undang-undang baru
tersebut. Biaya pelatihan bagi seluruh manajer termasuk
tinggi, sementara biaya untuk mengubah kebijakan
perusahaan yang terkait jauh lebih rendah. Undang-
undang baru ini cukup rumit sehingga para manajer yang
diminta membaca sendiri kebijakan perusahaan yang baru
148
hanya dapat melaksanakan 50% dari prosedur yang
diminta, sementara pelatihan dapat memastikan bahwa
95% para manajer dapat melaksanakannya. Mengingat
sangsi dari pemerintah cukup tinggi jika perusahaan tidak
menaati undang-undang baru ini, keuntungan untuk
mengadakan pelatihan akan terasa jauh lebih tinggi
dibandingan dengan alternatif lainnya.
12.6. Metode Pelatihan
Jika perusahaan memutuskan bahwa pelatihan merupakan

solusi yang terbaik untuk meningkatkan kinerja karyawan di
bidang kesehatan dan keselamatan di tempat kerja, pertanyaan
selanjutnya adalah metode pelatihan apakah yang akan
digunakan?
12.6.1. Pelatihan di Ruang Kelas
Salah satu metode pelatihan yang paling sering dipilih oleh

perusahaan adalah pelatihan di ruang kelas. Pelatihan
semacam ini bisa dipilih untuk keperluan pelatihan di bidang
kesehatan dan keselamatan kerja jika target pelatihan
memenuhi kriteria berikut ini:
• Resiko tinggi jika karyawan tidak berhasil menguasai
topik pelatihan ini (baik dari segi sanksi legal, kecelakaan
yang mungkin terjadi, atau yang lainnya).
• Jumlah peserta relatif sedikit (tidak semua karyawan perlu
mengikuti pelatihan ini).
• Pelatihan mencakup ketrampilan yang memerlukan
latihan berulang-ulang.
Salah satu area yang memenuhi kriteria di atas adalah

pelatihan P3K. Dalam kasus ini, pelatihan dapat dilakukan
dengan struktur sebagai berikut:
149
• Tujuan pelatihan: Para peserta pelatihan dapat menjadi
kompeten dalam memberikan P3K di tempat kerja.
Kompetensi ini mencakup kemampuan untuk: (a)
menganalisis apakah suatu keadaan dapat dianggap
darurat; (b) memanggil pertolongan termasuk ambulans;
(c) memeriksa orang sakit atau luka; (d) mencatat
pengobatan P3K yang diberikan pada pasien; (e)
menggunakan isi kotak P3K; (f) melakukan prosedur CPR
(cardio-pulmonary resuscitation); (g) mengenali berbagai
penyakit dan kecelakaan yang mungkin terjadi di tempat
kerja serta mengetahui P3K yang dapat dilakukan untuk
masing-masing kasus.
• Metode pelatihan: Pelatihan di ruang kelas dengan
fasilitator dari luar perusahaan (fasilitator ini haruslah
merupakan pengajar P3K yang disetujui oleh pemerintah).
• Lamanya pelatihan: 18 jam.
• Peserta: 1 karyawan per 50 orang karyawan dengan
maksimum 15 peserta per sesi pelatihan.
• Apakah perlu pelatihan ulang bagi peserta yang telah
lulus: Ya (setiap 3 tahun sekali).
12.6.2. Belajar Mandiri
Metode belajar mandiri dapat digunakan target pelatihan

memenuhi kriteria berikut ini:
• Resiko tidak terlalu tinggi jika karyawan tidak berhasil
menguasai topik pelatihan ini (baik dari segi sanksi legal,
kecelakaan yang mungkin terjadi, atau yang lainnya).
• Jumlah peserta relatif banyak (semua karyawan perlu
mengikuti pelatihan ini).
• Pelatihan lebih banyak mencakup pengetahuan dan tidak
terlalu banyak mencakup ketrampilan.
150
Salah satu area yang memenuhi criteria di atas adalah pelatihan
mengenai Bahaya-Bahaya Kesehatan/Keselamatan di Tempat
Kerja. Dalam kasus ini, pelatihan dapat dilakukan dengan
struktur sebagai berikut:
• Tujuan pelatihan: Para peserta dapat mengenali bahaya-
bahaya kesehatan/keselamatan di tempat kerja (seperti
bahan kimia, listrik, kegiatan mengangkat barang berat,
terpeleset/jatuh, suara yang terlalu keras, dan bekerja di
tempat tinggi) serta meminimalkan efek negative dari
bahaya-bahaya tersebut dengan cara menerapkan
prosedur keselamatan. Kompetensi ini mencakup
kemampuan untuk: (a) mengenali berbagai bahaya
kesehatan/keselamatan di tempat kerja; (b) melaporkan
adanya bahaya-bahaya tersebut; (c) menjelaskan simbol-
simbol yang terkait dengan kesehatan/keselamatan kerja
(misalnya simbol aliran listrik tegangan tinggi); (d)
mengikuti prosedur kerja untuk meminimalkan resiko
yang ada (termasuk cara mengangkat beban berat,
mengatasi suara yang terlalu keras, bahaya bahan kimia,
penggunaan alat-alat listrik, dan bahaya jatuh dari tempat
tinggi) sehingga setiap karyawan dapat menjalankan
pekerjaannya dengan tetap menjaga kesehatan serta
keselamatan di tempat kerja; (e) mengikuti prosedur
untuk menggunakan, menyimpan, serta merawat alat-alat
pelindung pribadi (seperti sarung tangan karet untuk
menghindari bahaya bahan kimia).
• Metode pelatihan: Belajar mandiri dengan materi
pelajaran disediakan melalui intranet perusahaan.
Karyawan diberikan akses log in dan mereka wajib
menyelesaikan pelatihan ini dalam jangka waktu tertentu
(misalnya: 1 bulan).
• Lamanya pelatihan: 4 jam (yang harus diselesaikan dalam
jangka waktu yang telah ditetapkan tadi).
• Peserta: Semua karyawan.
151
• Apakah perlu pelatihan ulang bagi peserta yang telah
lulus: Ya (setiap 3 tahun sekali).
12.7. Evaluasi Pelatihan
Evaluasi apakah pelatihan telah terlaksana secara efektif dapat

dilakukan dengan menggunakan model yang dikembangkan
oleh Kirkpatrick. Menurut model ini, ada empat tingkatan
evaluasi sebagai berikut:
Pertama, Tingkatan Reaksi.
Menangkap reaksi peserta terhadap program pelatihan secara

umum. Melanjutkan contoh kasus sebelumnya, mtode evaluasi
yang dapat digunakan untuk tingkatan in adalah sebagai
berikut:
• Untuk pelatihan P3K: Reaksi peserta diperoleh dengan
menggunakan kuesioner yang diisi peserta di akhir
pelatihan. Fasilitator juga sebaiknya diminta memberikan
reaksinya terhadap program pelatihan karena fasilitator
dapat memberikan masukan mengenai hal-hal apa yang
sudah cukup baik dalam program pelatihan, bagaimana
respon peserta selama jalannya pelatihan, serta bagaimana
program masih dapat ditingkatkan lagi.
• Untuk pelatihan Bahaya-Bahaya Kesehatan/Keselamatan
di Tempat Kerja: Reaksi peserta diperoleh dengan
menggunakan kuesioner online yang merupakan bagian
dari modul di intranet. Peserta wajib menyelesaikan
kuesioner ini sebelum dinyatakan “lulus” dari pelatihan.
• Untuk keseluruhan program pelatihan: perusahaan dapat
melakukan survei secara umum pada seluruh karyawan
untuk mengetahui pendapat mereka mengenai pelatihan
yang telah dijalankan perusahaan di bidang Kesehatan
dan Keselamatan Kerja. Survei ini tidak hanya menangkap
152
reaksi peserta, tapi juga mengetahui sejauh mana peserta
telah belajar dari pelatihan yang dilakukan (Tingkatan
Pembelajaran).
Kuesioner yang dibagikan kepada para peserta bisa mencakup

pertanyaan-pertanyaan sebagai berikut: seberapa
bermanfaatnya pelatihan dirasakan oleh peserta, seberapa
yakin peserta bahwa mereka dapat menerapkan apa yang telah
mereka pelajari, dan juga di sini apa pelatihan masih dapat
diperbaiki. Kuesioner untuk fasilitator bisa mencakup
pertanyaan-pertanyaan sebagai berikut: apakah bahan
pelajaran terlalu sulit untuk peserta, apakah susunan ruang
pelatihan cukup efektif sehingga fasilitator dapat mengamati
dan juga berespon terhadap seluruh peserta, dsb.
Kedua, Tingkatan Pembelajaran.
Mengetahui apakah peserta benar-benar belajar dalam

pelatihan.
• Untuk pelatihan P3K: Apakah tujuan pelatihan telah
dicapai dapat diketahui melalui tes singkat di akhir
pelatihan dengan pertanyaan yang relevan mengenai
kompetensi peserta di bidang P3K. Selain itu, fasilitator
pelatihan juga diminta melakukan observasi dan
memberikan laporan apakah peserta telah memahami dan
dapat melaksanakan prosedur P3K yang diajarkan.
Misalnya, fasilitator pelatihan dapat mengobservasi dan
memberikan laporan mengenai kemampuan CPR masing-
masing peserta.
di Tempat Kerja: Tingkat pembelajaran diketahui juga
melalui tes singkat di akhir setiap sub-modul. Pertanyaan
yang diajukan mencakup pengetahuan yang diajarkan
dalam pelatihan, misalnya peserta diminta menyebutkan
153
bahaya-bahaya yang paling utama di tempat kerja mereka,
menjelaskan arti simbol tertentu yang terkait dengan
kesehatan dan keselamatan kerja, serta menyebutkan alat
pelindung yang harus digunakan dalam situasi tertentu.
• Untuk keseluruhan program pelatihan: survei yang
digunakan untuk Tingkatan Reaksi dapat
mengikutsertakan beberapa pertanyaan umum mengenai
pengetahuan umum karyawan di bidang kesehatan dan
keselamatan kerja.
Ketiga, Tingkatan Ketrampilan.
Mengetahui apakah ada peningkatan ketrampilan setelah

peserta mengikuti pelatihan.
• Untuk pelatihan P3K: Hal ini diketahui dengan cara
meminta seluruh peserta untuk menghadiri sesi evaluasi 1
tahun setelah mereka mengikuti pelatihan. Dalam sesi ini,
peserta diminta menyelesaikan tes baik tertulis maupun
praktek, misalnya prosedur CPR atau menangani luka.
Hasil tes ini akan menunjukkan apakah peserta
mengalami peningkatan ketrampilan yang diajarkan
dalam program pelatihan.
di Tempat Kerja: Tingkat ketrampilan diketahui melalui
proses penilaian kinerja (performance appraisal). Setelah
karyawan menyelesaikan seluruh modul pelatihan,
mereka diharapkan untuk menunjukkan kinerja sesuai
standar yang diharapkan pada waktu menangani bahaya
kesehatan/keselamatan di tempat kerja.
• Untuk keseluruhan program pelatihan: Peningkatan
kinerja di bidang kesehatan dan keselamatan kerja secara
umum diketahui melalui proses penilaian kinerja yang
rutin dilakukan perusahaan.
154
Keempat, Tingkatan Organisasi.
Tahapan terakhir dalam model evaluasi ini adalah mengetahui

sejauh mana program pelatihan dapat meningkatkan tingkat
kesadaran serta sikap seluruh anggota perusahaan terhadap
kesehatan dan keselamatan kerja. Tingkatan ini hanya relevan
untuk keseluruhan program pelatihan, dan tidak dapat diukur
untuk masing-masing modul pelatihan. Untuk mengetahui
keberhasilan di tingkatan ini, perusahaan dapat membagikan
kuesioner kepada seluruh karyawan 6 bulan setelah seluruh
program pelatihan diselesaikan. Kuesioner ini didesain untuk
mengukur perubahan sikap karyawan di bidang kesehatan dan
keselamatan kerja.
12.8. Penerapan Hasil Pelatihan
Perusahaan dapat mengambil langkah-langkah untuk

memastikan bahwa hasil pelatihan diterapkan dalam pekerjaan
sehari-hari sebagai berikut:
• Pengawasan: Karyawan yang baru menyelesaikan
pelatihan masih perlu diawasi oleh atasan untuk
memastikan bahwa mereka dapat menerapkan hasil
pelatihan di tempat kerja.
• Kedekatan psikologis (psychological fidelity): Cara lain yang
dapat digunakan adalah menggunakan konsep kedekatan
psikologis. Misalnya, dalam pelatihan Bahaya-Bahaya
Kesehatan/Keselamatan di Tempat Kerja, fasilitator dapat
menggunakan teknologi multimedia untuk mendesain
model 3 dimensi dari hotel tempat mereka bekerja
sehingga karyawan lebih mudah memahami di mana letak
bahaya-bahaya yang dijelaskan oleh fasilitator. Dengan
demikian, karyawan dapat dengan mudah menerapkan
apa yang diajarkan dalam pelatihan pekerjaan mereka
sehari-hari. Pada kasus pelatihan P3K, kedekatan
155
psikologis bisa dicapai melalui kegiatan role play.
Fasilitator dapat menciptakan skenario keadaan darurat
dan meminta peserta untuk berlatih menjadi petugas P3K
dalam situasi tersebut.
• Menyediakan alat bantu: Semua karyawan sebaiknya
diberi akses untuk memperoleh bahan bacaan yang
relevan dengan topik kesehatan dan keselamatan kerja.
Misalnya, perusahaan dapat menyediakan brosur bagi
seluruh karyawan, atau menyediakan materi secara online
di intranet perusahaan.
Memasukkan kesehatan dan keselamatan kerja sebagai salah

satu komponen dalam proses penilaian kinerja: Karyawan akan
termotivasi untuk mempraktekkan prosedur kesehatan dan
keselamatan kerja jika mereka tahu bahwa prosedur ini dinilai
penting oleh perusahaan dan mereka akan mendapatkan reward
jika menaatinya (dengan asumsi bahwa proses penilaian kerja
di perusahaan benar-benar relevan dan terkait dengan reward
seperti kenaikan gaji atau kenaikan pangkat). Karyawan yang
dinilai berkinerja rendah di bidang kesehatan dan keselamatan
kerja perlu diperhatikan lebih lanjut. Perusahaan dapat
mempertimbangkan apakah karyawan tersebut perlu
mengikuti pelatihan ulang atau tindakan lain perlu diambil
(misalnya memberikan peringatan tertulis).
12.9. Kesimpulan
Evaluasi model Kirkpatrick memiliki beberapa kelebihan.

Meskipun demikian evaluasi ini juga mengandung beberapa
kelemahan. Kelemahan itu adalah: (1) evaluasi model ini
mengasumsikan bahwa input dalam suatu program pelatihan
dianggap sudah terstandar; dan (2) kesulitan mengukur
dampak program pelatihan terhadap kenaikan produktifitas,
sebab sering kali ditemui bahwa kenaikan produktifitas
156
disebabkan oleh demikian banyak faktor. Namun dengan
beberapa modifikasi di sana-sini, kekurangan itu bisa kita
minimalisir sehingga nantinya bisa kita peroleh informasi yang
benar-benar berkualitas.
157
Daftar Pustaka
Affifuddin (2008), Teori Evaluasi Dengan Pendekatan CIPP,

Wordpres, Jakarta.
Aip Badrujaman (2009), Teori dan Praktek Evaluasi Program
Bimbingan dan Konseling, Grafika, Jakarta.
Aip Badrujaman (2009), Teori dan Praktek Evaluasi Program
Bimbingan dan Konseling, Grafika, Jakarta.
Atwi Suparman (2001), Desain Instructional, Proyek
pengembangan Universitas Terbuka Direktorat Jenderal
Pendidikan Tinggi Departemen Pendidikan Nasional.
Benjamin S. Bloom, et al (1981), Evaluation To Improve
Learning, McGraw-Hill Book Company.
Blaine R. Worthen dan James R. Sanders (1987), Educational
Evaluation: Alternative Approaches and Practical
Guidelines, Longman, New York.
Blaine Worthen dan James R. Sanders (1973), Educational
Evaluation: Theory; and Practice, Wadsworth
Publishing Company Inc., Ohio.
Center Partners (2006), Implementing the Kirkpatrick
Evaluation Model Plus, 2 Januari 2008.
Charles K. West, James A. Farmer, Phillip M. Wolff (1991),
Intructional Design, Allyn and Bacon, University of
Illinois at Urbana-Champaign, Boston.
Debora Naugle (2000), Kirkpatrick’s Evaluation Model as A
Mean of Evaluation Teacher Performance, 2 Januari
2008.
Djuju Sudjana (2006), Evaluasi Program Pendidikan Luar
Sekolah, Remaja Rosdakarya, Bandung.
158
Donald Kirkpatrick (1998), Evaluation Training Programs: The
Four Level, Edisi II, Berrett-Koehler Publisher Inc., San
Fransisco.
Donald Kirkpatrick (2005), Kirkpatrick's Training Evaluation
Model, 23 Sepember 2005.
Fetterman, David M. (ed.) (1988), Qualitative Approaches to
Evaluation in Education: The Silent Scientific
Revolution, Praeger, New York.
Gary R. Morrison, Steven M. Ross, Jerrold E Kemp (2001),
Designing Effective Instruction, Third Edition John
Wiley and Sons, Inc.
Hamid Hasan (2008) Evaluasi Kurikulum, Rosda, Bandung.
Hamid Hasan (2008), Evaluasi Kurikulum, Remaja Rosdakarya,
Bandung.
Jhon M. Owen (2005), Program Evaluation, Forms And
Approach, Allen and Unwin Pty Ltd, St. Leonards -
NSW 2065.
Jody L. Fitzpatrick, James R. Sanders dan Blaine R. Worthen
(2004), Program Evaluation Alternative Approaches
And Practical Guidelines, Third Edition, Pearson
Education, New York.
John H. Pryor (2008), Advanced Quantitative Methods in
Education Research Program, Cooperative Institutional
Research Program, UCLA, Los Angeles.
John M. Owen (2006), Program Evaluation: Forms And
Approaches, Allen and Unwin, Canberra.
Malcoln L. Fleming (1981), Intructional Massage Design,
Educational Technology Publications, Inc., Englewood
Cliffs, New Jersey.
Michael Quinn Patton (2006), Metode Evaluasi Kualitatif,
Pustaka Pelajar, Yogyakarta.
Micheal Scriven (1999), The Nature of Evaluation, dalam
Practical, Assessment, Research and Evaluation, 6 (11).
159
Micheal Scriven (1999), The Nature of Evaluation, dalam
Practical, Assessment, Research and Evaluation, 6 (12).
Muzayana Sutikno (2009), Evaluasi Program, Pustaka Grafika,
Jakarta.
Muzayanah Sutikno (2007), Evaluasi Program Pendidikan,
Jakarta.
N. C. Gysbers dan P. Henderson (2006), Developing and
Managing Your School Guidance and Counseling
Program, Edisi IV, American Counseling Association,
Alexandria-Virginia.
N.C. Gysbers dan P. Henderson (2006), Developing and
Managing Your School Guidance and Counseling
Program, Edisi IV, American Counseling Association,
Alexandria.
Nana Sudjana dan Ibrahim (2001), Penelitian dan Penilaian
Pendidikan, Sinar Baru Algensindo, Bandung.
Ngalim Purwanto (1983), Prinsip-Prinsip dan Teknik Evaluasi
Pengjaran, Edisi Keempat, Penerbit Grafika, Jakarta.
Rahmad Qomari (2008), Model-model Evaluasi Pendidikan,
Jurnal Pemikiran Alternatif Pendidikan, INSANIA, Vol.
13, No. 2, Mei-Ags 2008.
Roger Kauman, F.W. English (1979), Needs Assessment,
Concept, and Application, Englewood Clift, New Jersey.
S. Eko Putro Widoyoko (2009), Evaluasi Program Pembelajaran,
Panduan Praktis Bagi Pendidik dan Calon Pendidik,
Pustaka Pelajar, Jogjakarta.
Said Hamid Hasan (1988), Evaluasi Kurikulum, Departemen
Pendidikan dan Kebudayaan, Jakarta.
Stufflebeam (1986), Systematic Evaluation, Kluwer Nijhoff
Publishing, New Jersey.
Suharsimi Arikunto dan Cepi Safrudin Abdul Jabar (2009),
Evaluasi Program Pendidikan, Edisi II, Bumi Aksara,
Jakarta.
160
Suharsimi Arikunto (1989), Dasar-dasar Evaluasi Pendidikan,
Bina Aksara, Jakarta.
Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar (2008),
Evaluasi Program Pendidikan, Pedoman Teoritis Praktis
Bagi Mahasiswa dan Praktisi Pendidikan, Bumi Aksara,
Jakarta.
Sukardi, 2009. Evaluasi Pendidikan: Prinsip dan
Operasionalnya. Bumi Aksara, Jakarta.
Tayibnapis dan Farida Yusuf (2008), Evaluasi Program dan
Instrumen Evaluasi untuk Program Pendidikan dan
Penelitian, Rineka Cipta, Jakarta.
Walter Dick dan Carey Lou (1990), The Systematic Design of
Instruction, Edisi III, Includes Bibliographical
References, Walter Dick and Lou Carey Publishing.
Widoyoko E (2009), Evaluasi Program Pembelajaran, Pustaka
Pelajar, Jogyakarta.
Zaenal Arifin (2009), Evaluasi Pembelajaran, Remaja
Rosdakarya, Bandung.
161
Biodata Penulis
Randy R. Wrihatnolo, adalah perencana di Kementerian

Perencanaan Pembangunan Nasional/Badan Perencanaan
Pembangunan Nasional (Bappenas). Lulus S1 dari Universitas
Brawijaya Malang (1995) dan S2 dari Ruhr-Universität Bochum
Jerman dan University of Western Cape Afrika Selatan (2002-
2004) dengan spesialisasi Development Research and Development
Policy. Pengabdiannya sebagai abdi negara dimulai sejak tahun
1996 sebagai staf proyek Inpres Desa Tertinggal (IDT) dan di
Biro Pembangunan Daerah Tingkat II dan Perdesaan (1997-
1998), melanjutkan karier sebagai pembantu Deputi Ekonomi
(1998-1999), lalu menjadi Kasie Pengembangan Destinasi
Pariwisata di Direktorat Industri, Perdagangan, dan Pariwisata
(2004-2005) dan Kepala Subdirektorat Evaluasi Kinerja
Pembangunan Perekonomian (2008-2011). Saat ini sedang
menjadi Pejabat Fungsional Perencana Madya. Selama menjadi
ambtenaar aktif sebagai koordinator penulisan Laporan
Pencapaian Millennium Development Goals Indonesia tahun 2007
dan 2009, serta menjadi anggota penyusunan Peta Jalan MDGs
Indonesia tahun 2010-2015.
Beberapa publikasinya antara lain: Membangun Indonesia

Emas (Gramedia/Elexmedia, 2004), Manajemen Pembangunan
162
Indonesia (Gramedia/ Elexmedia, 2006), Manajemen
Pemberdayaan (Gramedia/Elexmedia, 2007), Pengantar
Metode Penelitian (Aksara, 2007), Manajemen Privatisasi
(Gramedia/Elexmedia, 2008), Membumikan MDGs (IPR, 2008),
Pendekatan Kewilayahan Dalam Perencanaan Pembangunan
(IPR, 2008), Pendekatan Sektoral Dalam Perencanaan
Pembangunan (IPR, 2009), Konsep dan Pendekatan
Pembangunan (IPR, 2009), Perencanaan dan Penganggaran
Berbasis Kinerja (IPR, 2010), Model Logika Untuk Evaluasi
Pembangunan (IPR, 2010), dan Metode Evaluasi Kinerja (IPR,
2010).
Aktif sebagai pengajar tidak tetap di beberapa kursus/diklat

yang diselenggarakan beberapa perguruan tinggi, narasumber
kebijakan pembangunan di beberapa lembaga pelatihan dan
pemerintah daerah, peneliti kebijakan publik, kebijakan
pembangunan, perencanaan pembangunan, pembangunan
daerah, penanggulangan kemiskinan, dan pemberdayaan
masyarakat. Ia dapat disapa di wrihatnolo@yahoo.com.
163
164

Strategi Evaluasi IDPS

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Strategi Evaluasi IDPS

Diunggah oleh

Hak Cipta:

Format Tersedia

ii

1. Barangsiapa dengan sengaja dan tanpa hak melakukan perbuatan

2. Barangsiapa dengan sengaja menyiarkan, memamerkan,

Institute for Development and Policy Study

Bab 2 Model CIPP 3

Bab 3 Model CSE-UCLA 17

Bab 4 Model Formatif dan Sumatif 27

Bab 5 Model Responsif 37

Bab 6 Model “Tyler” (Black Box Tyler) 53

Bab 7 Model Iluminatif 63

Bab 8 Model Berorientasi Tujuan (Goal Oriented

Bab 9 Model Kaufman (Need Assesment Evaluation) 95

Bab 10 Model “Stake” 105

Bab 11 Model Formatif - Sumatif Untuk Program Proses

Bab 12 Model Kirkpatrick 135

Daftar Pustaka 158

Evaluasi merupakan bagian dari proses manajemen dan

Berdasarkan konsep di atas, maka hasil evaluasi apabila

Berbagai model evaluasi tersedia dan dapat disesuaikan

Jakarta, April 2011

Para evaluator pembangunan seringkali menemui

Pendekatan kontekstual mempercayai asumsi bahwa substansi

Evaluasi proses program menekankan pada evalusi

Terkait dengan ketiga jenis evaluasi program tersebut, dalam

Model CIPP –yang merupakan kependekakan dari Context,

Hasil evaluasi CIPP dapat ditujukan sebagai bahan

Manfaat dilaksanakannya evaluasi program adalah: (1)

2.2. Konsep Model Evaluasi CIPP (Context, Input, Process,

Dalam evaluasi pelaksanaan program para evaluator dapat

2.2.1. Context Evaluation to Serve Planning Decision

Konteks evaluasi ini membantu merencanakan keputusan,

2.2.2. Input Evaluation, Structuring Decision

Tahap kedua dalam evaluasi CIPP adalah evaluasi masukan.

1 Affifuddin (2008), Teori Evaluasi Dengan Pendekatan CIPP, Wordpres, Jakarta.

Pertanyaan-pertanyaan yang diajukan untuk program

2.2.3. Process Evaluation, To Serve Omplementing Decision

Evaluasi proses merupakan upaya untuk melihat sejauh mana

2 Stufflebeam (1986), Systematic Evaluation, Kluwer Nijhoff Publishing, New

Evaluasi proses kadang-kadang disebut juga dengan istilah

Worthen dan Sanders (1981) menyebutkan bahwa evaluasi

2.2.4. Product Evaluation, To Serve Recycling Decision

Evaluasi produk atau hasil diarahkan pada hal-hal yang

3 Arikunto A (2009), Evaluasi Program Pendidikan, Bumi Aksara, Jakarta.

Fungsi evaluasi produk (hasil) seperti dirumuskan oleh Sax

Berdasarkan pendapat di atas dapat diketahui bahwa evaluasi

4 Widoyoko E (2009), Evaluasi Program Pembelajaran, Pustaka Pelajar, Jogyakarta.

Evaluasi konteks adalah evaluasi yang memberikan keputusan

Evaluasi Program Pengelolaan SMA Terbuka di Kabupaten Bogor

A. Latar Belakang Masalah

Salah satu alternatif yang dapat digunakan untuk mengoptimalkan

System pendidikan yang dimungkinkan dapat diterapkan untuk itu

Untuk itu pemerintah sejak tahun 2002/2003 telah membuat rintisan

Pelaksanaan evaluasi untuk mengetahui pelaksanaan program

5 Sutrianto (2007), Evaluasi Program Pengelolaan SMA Terbuka di Kabupaten

Oleh karena itu perlu dilakukan evaluasi secara mendalam mengenai

Perumusan masalah dalam Evaluasi Program Pengelolaan SMA

Evaluasi input mengenai jumlah siswa sebanyak 655 siswa terdiri

Kurikulum yang digunakan pada SMA Terbuka sama dengan yang

4. Guru dan Tenaga Administrasi

Pelaksanaan tutorial pada rintisan SMA Terbuka Bogor rata-rata

2. Aktivitas Belajar Siswa

Aktivitas belajar siswsa di SMA Terbuka Bogor rata-rata kurang dari

Hasil penelitian ini ,menunjukkan bahwa konteks program secara