Anda di halaman 1dari 12

Evaluasi Program

Evaluasi merupakan kegiatan yang rutin dilakukan baik di sekolah, perusahaan


negara dan swasta maupun instansi-instansi pemerintahan. Evaluasi umumnya
juga dilakukan pada program-program yang telah dilaksanakan oleh karena itu,
penting kiranya dijabarkan di sini tentang definisi dan konsep dari evaluasi
program itu sendiri.
Menurut Djaali dan Mulyono (2004:1) mengungkapkan evaluasi sebagai
proses menilai sesuatu berdasarkan kriteria atau tujuan yang telah ditetapkan,
kemudian diambil keputusan atas obyek yang dievaluasi.
Arikunto dan Cepi Safruddin (2010: 2) mengatakan evaluasi adalah
kegiatan untuk mengumpulkan informasi tentang bekerjanya sesuatu, yang
selanjutnya informasi tersebut digunakan untuk menentukan alternatif yang tepat
dalam mengambil sebuah keputusan. Kedua Pendapat di atas mengemukakan
betapa pentingnya suatu proses dan pengumpulan informasi guna pengambilan
keputusan. Adapun pengambilan keputusan tersebut dapat tidak sebatas pada
penghakiman, namun lebih jauh dapat berupa upaya perbaikan maupun
penyebaran informasi yang berkelanjutan.
Senada dengan yang diungkapkan oleh Gall (2003: 542) tentang evaluasi
is the process of making judgment about merit, value or worth of educational
program.
Adapun menurut Stufflebeam, Madaus dan Kellaghan (2002:35) Evaluasi
merupakan Evaluation means a study designed and conducted to assist some
audience to asses an objects merit and worth. Evaluasi merupakan studi yang
dirancang dan dilakukan untuk membantu khalayak untuk mengetahuinilai dan
manfaat suatu objek (program).
Stake (2004:4) mengatakan Evaluation is the comparison of the condition
or performance of something to one more standars; the report of such a
comparasion. Evaluasi adalah perbandingan kondisi atau kinerja sesuatu untuk
satu standars atau lebih. Dalam hal ini, Stake lebih menekankan kesesuaian antara
suatu kondisi kerja yang biasa disebut kinerja dengan suatu patokan, acuan atau
standarisasi yang telah ditetapkan.
Pendapat Stake juga didukung oleh Worthen dan Sanders (2004:5)
Evaluation as the identification, clarification and application of defensible
criteria to determine an evaluation objects value (worth and merit) in relation to
those criteria. Evaluasi (program) sebagai identifikasi, klarifikasi dan penerapan
kriteria yang dapat dipertanggungjawabkan untuk menentukan nilai dari suatu
objek evaluasi (nilai dan manfaat) dalam kaitannya dengan kriteria yang telah
ditetapkan.
Berdasarkan pendapatpendapat di atas, maka dapat dipahami bahwasanya
Evaluasi program merupakan serangkaian proses untuk menemukan sesuatu yang
bernilai manfaat untuk dasar sebagai pengambilan keputusan. Pandangan para ahli
di atas juga mengisyaratkan pentingnya kriteria atau standar tertentu sebagai
pembanding yang objektif untuk pengambilan keputusan. Oleh karena itu, kriteria
hendaknya disusun atau diajukan sebelum kegiatan evaluasi dilaksanakan, agar
tidak terjadi kekeliruan dalam pengambilan keputusan.
Berdasarkan beberapa pendapat-pendapat para ahli, dapat diketahui bahwa
evaluasi program merupakan kegiatan yang sistematis dalam memperoleh,
menggambarkan dan menganalisis seperangkat informasi (data) dari suatu
kegiatan maupun program sebagai dasar dalampertimbangan dan pengambilan
keputusan berdasarkan standar atau kriteria yang telah ditetapkan sebelumnya.
Oleh karena itu, evaluasi erat kaitannya dengan proses pertimbangan dan
pengambilan keputusan terhadap keberhasilan suatu perencanaan, proses dan hasil
yang diharapkan.
Evaluasi yang sekarang banyak dikenal dalam bidang pendidikan adalah
evaluasi program pendidikan. Pembahasan tentang evaluasi program pendidikan
sangat variatif, sehingga berperan dalam mempengaruhi jenis dan model evaluasi.
Berbagai jenis dan model evaluasi, umumnya bermuara pada pengukuran,
penyediaan serta penggambaran informasi yang diakhiri dengan pengambilan
keputusan setelah melalui berbagai pertimbangan dalam berbagai aspek.
Evaluasi program dalam bidang pendidikan yang berkembang dewasa ini,
merupakan suatu langkah maju bagi dunia pendidikan. Hampir setiap aspek dalam
bidang pendidikan dapat dijadikan bahan evaluasi program. Hal ini dapat
dipahami, sebagai dampak kesadaran dari berbagai pihak akan pentingnya
pendidikan, serta terpanggilnya berbagai kalangan untuk ikut serta dan
berkontribusi terhadap kemajuan pendidikan.
Owen (2008:290) menyatakan bahwa Evaluation as complementary to
and supportive of, the development and provision of effective and responsive
public and private sector inteventions (evaluands). Evaluasi (program) sebagai
pelengkap dan mendukung, pengembangan dan penyediaan intervensi sektor
publik dan swasta yang efektif dan responsif.
Menurut Arikunto (2008:290) evaluasi program adalah suatu rangkaian
kegiatan yang dilakukan dengan sengaja untuk melihat tingkat keberhasilan
program. Senada dengan pendapat Owen di atas, dikemukakan oleh Gelmon,
Foucek dan Waterbury (2005:2) yang mengatakan:
Evaluation is necessary to gain information about program efficacy and to
identify areas for program improvement. Valuable information can result from
learning that a program achieved its goals, but equally valuable information can
be derived from examining why a program did not achieve its goals. Evaluation is
not only intended to look at "did it work" or not, but also for whom, where, and
under what circumstances.
Evaluasi ini diperlukan untuk mendapatkan informasi tentang efektivitas program
dan mengidentifikasi area untuk perbaikan program. Informasi berharga dapat
hasil dari belajar bahwa program mencapai tujuannya, tetapi informasi yang sama
berharga dapat diturunkan dari memeriksa mengapa program tidak mencapai
tujuannya. Evaluasi tidak hanya ditujukan untuk melihat "apakah hal tersebut
bekerja" atau tidak, tetapi juga untuk siapa, di mana, dan dalam keadaan apa.
Lebih lanjut Stufflebeam, Madaus dan Kellaghan (2002:280) menerangkan
bahwa evaluasi program merupakan:
... the process of delineating,obtaining, reporting, and applying descriptive and
judgmental information about some objects merit and worth in order to guide
decision making, support accountability, disseminate effective practices, and
increase understanding of the involved phenomena.
Proses menggambarkan, memperoleh, pelaporan,dan menerapkan informasi
deskriptif dan mempertimbangkan tentang beberapa obyek prestasi dan layak
untuk dasar pengambilan keputusan, mendukung akuntabilitas, menyebarkan
praktek-praktek yang efektif, dan meningkatkan pemahaman tentang suatu
fenomena (program).
Pendapat para ahli di atas, mengisyaratkan sekurang-kurangnya ada 3 hal
penting yang hendaknya diperhatikan dalam melakukan evaluasi program, yaitu:
1) Pentingnya suatu proses dengan rangkaian rencana yang sistematis,
2) Penetapan standar atau kriteria atau indikator yang jelas dan terukur
sebelum dimulainya evaluasi,
3) Pertimbangan dan pengambilan keputusan yang dapat dipertanggung
jawabkan secara objektif.
Kirkpatrick (2006:17) menambahkan ada tiga alasan mengapa diperlukan
evaluasi program, yaitu:
1) Untuk menunjukan eksistensi dan dana yang dikeluarkan terhadap
pencapaian tujuan dan sasaran program yang dilakukan,
2) Untuk memutuskan apakah kegiatan yang dilakukan akan diteruskan atau
dihentikan,
3) Untuk mengumpulkan informasi bagaimana cara untuk mengembangkan
program dimasa mendatang.
Menurut Arikunto dan Cepi Safruddin (2010: 22) ada empat kemungkinan
kebijakan yang dapat dilakukan berdasarkan hasil evaluasi pelaksanaan program
yaitu :
1) Menghentikan program, karena dipandang bahwa program tersebut tidak
ada manfaatnya, atau tidak dapat terlaksana sebagaimana diharapkan.
2) Merevisi program, karena ada bagian-bagian yang kurang sesuai dengan
harapan (terdapat kesalahan tetapi sedikit).
3) Melanjutkan program, karena pelaksanaan program menunjukkan bahwa
segala sesuatu sudah berjalan sesuai dengan harapan dan memberikan hasil
yang bermanfaat.
4) Menyebarkan program (melaksanakan program ditempat lain atau
mengulangi lagi program di lain waktu), karena program tersebut berhasil
dengan baik, maka sangat baik jika dilaksanakan lagi di tempat dan waktu
lain

Menurut Kaufman dan Thomas yang dikutip oleh Arikunto (2009: 40),
membedakan model evaluasi menjadi delapan, yaitu:
a. Goal Oriented Evaluation Model, dikembangkan oleh Tyler.
b. Goal Free Evaluation Model, dikembangkan oleh Michael Scriven.
c. Formatif Summatif Evaluation Model, dikembangkan oleh Michael
Scriven.
d. Countenance Evaluation Model, dikembangkan oleh Stake.
e. CSE-UCLA Evaluation Model
f. CIPP Evaluation Model, dikembangkan oleh Stufflebeam.
g. Discrepancy Model, dikembangkan oleh Provus.

Model CIPP (Stufflebeam)


Model CIPP dikemukakan pertama kali oleh Stufflebeam. Model ini mencakup
evaluasi context, input, process dan product. CIPP merupakan model yang dewasa
ini sering digunakan para evaluator pendidikan. Hal ini dikarenakan model ini
terbilang objektif dan efektif dalam cara pandangnya terhadap suatu program.
CIPP merupakan sebuah singkatan dari:
Context Evaluatio : evaluasi terhadap konteks
Input Evaluation : evaluasi terhadap masukan
Process Evaluation : evaluasi terhadap proses
Product Evaluation : evaluasi terhadap hasil
Stufflebeam (2007: 281) mengatakan bahwa The CIPP Model reflects an
objectivist orientation. Objectivist evaluations are based on the theory that moral
good is objective and independent of personal or merely human feelings.,
Mengenai penjelasan tentang evaluasi konteks Lebih lanjut dikemukakan
oleh Stufflebeam (2003:31) :
Context evaluations assess needs, problems, and opportunities within a defined
environment; they aid evaluation users to define and assess goals and later
reference assessed needs of targeted beneficiaries to judge a school program,
course of instruction, counseling service, teacher evaluation system, or other
enterprise.
Dalam evaluasi konteks, evaluator berkepentingan untuk mengungkap
masalah-masalah yang terjadi berdasarkan dasar keberadaan program tersebut.
Adapun program tersebut berjalan dapat berupa dasar hukum, kebijakan maupun
dasar kebutuhan.Kemudian proses evaluasi konteks dapat pula dikaitkan dengan
kebutuhan stakeholders atau pemangku kepentingan pendidikan baik guru, kepala
sekolah, maupun pemangku kepentingan lainnya.
Mengenai evaluasi input (masukan) dikemukakan oleh stufflebeam
(2003:31) bahwa:
Input evaluations assess competing strategies and the work plans and budgets of
approaches chosen for implementation; they aid evaluation users to design
improvement efforts, develop defensible funding proposals, detail action plans,
record the alternative plans that were considered, and record the basis for
choosing one approach over the others.
Evaluasi masukan merupakan suatu penilaian atas strategi, rencana kerja
dan anggaran dari pendekatan yang dipilih untuk pelaksanaannya.Evaluator
membantu pemangku kepentingan (stakeholders) untuk merancang upaya
perbaikan, mengembangkan program, detil rencana aksi, mempertimbangkan
alternatif rencana, dan mencari dasar untuk memilih suatu pendekatan yang akan
digunakan dalam pelaksanaan program.
Mengenai evaluasi proses, Stufflebeam (2003:31) menekankan Process
evaluations monitor, document, and assess activities; they help evaluation users
carry out improvement efforts and maintain accountability records of their
execution of action plans. Pada tahapan ini, evaluasi lebih mengutamakan
kegiatan pencatatan dan pemantauan dari perjalanan suatu program. Oleh sebab
itu, keterlibatan pengelola program hendaknya lebih dilibatkan di tahap ini. Hal
ini disebabkan, pengelola program umumnya lebih mempunyai mengakses secara
administratif dibandingkan orang lain.
Sedangkan dalam evaluasi Produk seperti dikatakan Stufflebeam
(2003:31) bahwa:
Product evaluations identify and assess short-term, long-term, intended, and
unintended outcomes. They help evaluation users maintain their focus on meeting
the needs of students or other beneficiaries; assess and record their level of
success in reaching and meeting the beneficiaries' targeted needs; identify
intended and unintended side effects; and make informed decisions to continue,
stop, or improve the effort.
Model CIPP pada dasarnya merupakan model yang komprehensif dan
terbilang lengkap. Namun demikian, sudut pandang dari model ini lebih kepada
manajemen pelaksanaan program dibanding keikutsertaan atau partisipasi
evaluator di dalam pelaksanaan program tersebut. Padahal evaluasi partisipatif
dalam beberapa program, merupakan suatu hal yang teramat penting untuk
memunculkan rekomendasi yang tepat.
Hal ini diperkuat oleh Stufflebeam (2003:31) yang mengatakan:
The CIPP evaluation model is a comprehensive framework for conducting
formative and summative evaluations of programs, projects, personnel, products,
organizations,policies, and evaluation systems. Basically, the model provides
direction for assessing context (in terms of an enterprises need for corrections or
improvements); inputs (strategies, operational plan, resources, and agreements
for proceeding with a needed intervention); process (the interventions
implementation and costs); and products (the efforts positive and negative
outcomes).
Gambaran tentang model CIPP dengan program yang akan dievaluasi
dapat digambarkan sebagai berikut:

Gambar 9.1 Kaitan CIPP dengan Program yang dievaluasi


Sumber: Thomas Kellaghan, Daniel L. Stufflebeam, dan Lori
A.Wingate,International Handbook of Educational Evaluation (Dordrecht:
Kluwer Academic Publishers, 2003),h.33.
Keterlibatan evaluator terhadap tujuan program terlihat berada pada
evaluasi konteks. Evaluasi konteks mengukur dan menilai sejauh mana tujuan
program sesuai dengan kenyataan yang terjadi. Begitu pula pada evaluasi
masukan, evaluator mengukur dan menilai kondisi perencanaan yang kemudian
disandingkan dengan pelaksanaan program.
Pelaksanaan program di evaluasi melalui evaluasi proses, evaluator lebih
kepada memantau, mendeskripsikan, mengadministrasikan dan mencatat proses
yang berlangsung melalui rekam jejak program. Sedangkan evaluasi produk lebih
berorientasi pada hasil yang bermanfaat atau hasil yang mengakibatkan efek
positif bagi pengelola program maupun untuk program itu sendiri.

Model Responsive (Stake)


Pendekatan ini bersifat relativistik karena evaluator tidak berusaha
menentukan kesimpulan akhir yang baku maupun proses yang tegas. Dalam
melaksanakan evaluasi dengan menggunakan model responsif seringkali
ditemukan perbedaan penafsiran tentang data-data dan arah evaluasi yang pada
akhirnya bertentangan dengan keinginan pemangku kepentingan (stakeholders).
Namun demikian, model ini sangat baik dalam mengungkap fakta-fakta yang
mungkin tidak dapat terungkap oleh model evaluasi lain dikarenakan model lain
terlalu terpaku pada acuan-acuan yang telah ditetapkan oleh model itu sendiri
(Stake, 2004:86).
Dalam pendekatan ini diperlukan kemampuan dalam mempelajari secara
komprehensif sebuah program.Komprehensif yang dimaksud adalah gambaran
menyeluruh dari suatu program sertahasil pengumpulan data dariberbagai laporan
dan beragam perspektif.
Model ini pada dasarnya mengutamakan perspektif yang bersifat umum
dan bebas dari belenggu suatu permodelan yang umumnya digunakan dalam
sebuah kegiatan evaluasi program. Seperti yang dikatakan Stake (Stake,2004:86):
Responsive evaluation is a general perspective in the search for quality in a
program. It is an attitude more than model a recipeNo matter what the role or
design fo evaluation, it can be made more responsive or less. Being responsive
orienting to the experience of personally being there, feeling the activity, the
tension knowing the people and their values. It relies heavily on personal
interpretation.
Model responsif seringkali menggunakan kekuatan pemikiran yang
negatif, investigatif ataupun keraguan sebagai bekal awal dalam mengevaluasi.
Oleh karena itu, tidak jarang penelitian dengan model ini berkembang justru ke
arah yang tidak diduga sebelumnya. Walaupun model responsif banyak dikenal
dengan model evaluasi yang tidak bermodel, akan tetapi stake berusaha
memunculkan tahapan-tahapan atau langkah-langkah yang memandu evaluator
dalam melaksanakan model ini yang disebut The Responsive clock. Tahapan-
tahapan model responsif dimulai dari pertemuan dengan pemangku kepentingan,
identifikasi program, sampai kepada menyusun pelaporan.
Untuk lebih jelasnya dapat dideskripsikan sebagai berikut:

Gambar 9.5 The Responsive Clock: Prominent event in Responsive Evaluation


Sumber : Robert E. Stake, Standar Based & Responsive Evaluation (California:
SAGE Publising. 2004), h. 103
Model Countenance (Stake)
Model Countenance adalah model pertama evaluasi kurilulum yang
dikembangkan Stake. Pengertian Countenance adalah keseluruhan, sedangkan
pengertian lain adalah sesuatu yang disenangi (favourable). Tujuan dari model
Countenance Stake adalah melengkapi kerangka untuk pengembangan suatu
rencana penilaian kurikulum.
Perhatian utama Stake (2004:376)adalah hubungan antara tujuan penilaian
dengan keputusan berikutnya berdasarkan sifat data yang dikumpulkan. Hal
tersebut dikarenakan Stake melihat adanya ketidaksesuaian antara harapan penilai
dan guru.
Model ini menekankan pada adanya pelaksanaan dua hal pokok, yaitu
(1) deskripsi (description) dan
(2) pertimbangan (judgment)
serta membedakan adanya tiga tahap dalam evaluasi program, yaitu
(1) anteseden (antecedents/context),
(2) traksaksi (transaction/process), dan
(3) keluaran (output outcomes).
Stake (2004:377) mendasarkan modelnya pada evaluasi formal, suatu
kegiatan evaluasi yang menyarankan evaluator untuk mengklarifikasi tanggung
jawab mereka dalam hal evaluasi individu dengan menjawab lima pertanyaan
1. Is the evaluation to be descriptive, judgmental, or both?
2. Is the evaluation to emphasize antecedents, transactions, outcomes, and/or
their functional contingencies?
3. Is the evaluation to emphasize congruence?
4. Is the evaluation to focus on a single program, or will it be comparative?
5. Is the evaluation intended to guide development, or will it be used to choose
among available curricula?
Stakes mempunyai keyakinan bahwa suatu evaluasi haruslah memberikan
deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dalam model ini stake
sangat menekankan peran evaluator dalam mengembangkan tujuan kurikulum
menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisi
pengukuran behavioristik dan kuantitatif.
Model Countenance Stake terdiri atas dua matriks. Matriks pertama
dinamakan matriks Deskripsi dan yang kedua dinamakan Matriks Pertimbangan.
Matriks pertimbangan baru dapat dikerjakan oleh evaluator setelah matriks
Deskripsi diselesaikan. Matriks Desktripsi terdiri atas kategori rencana (intent)
dan observasi.
Matriks Pertimbangan terdiri atas kategori standard dan pertimbangan.
Pada setiap kategori terdapat tiga fokus yaitu:
1. Antecedents Antecedents refer to relevant background information. In
particular, Stake saw this type of information as including any condition existing
prior to teaching and learning that may relate to outcomes.
2. Transaction, the instructional transactions, includes students countless
encounters with other persons, such as teachers, parents, counselors, tutors, and
other students. Stake advised evaluators to conduct a kind of ongoing process
evaluation to discern and document the programs actual operations
3. Outcomes Outcomes pertain to what results from a program. These include
abilities, achievements, attitudes, and aspirations. They also include impacts on
all participants: teachers, parents, administrators, custodians, students, and
others. They include results that are evident and obscure, intended and
unintended, short range and long range. (Stake, 2004: 377)

Gambar 9.6 Model Countenance dari Stake


Sumber: Jodi L. Fitzpatrick, James R. Sanders, dan Blaine R. Worthen, Program
Evaluation: Alternatives Approach and Practical Guidelines (Boston: Pearson
Education Inc., 2004), h. 135.

Anda mungkin juga menyukai