Anda di halaman 1dari 60

MAKALAH

EVALUASI PROSES DAN HASIL PEMBELAJARAN KIMIA

“MODEL DAN PENDEKATAN EVALUASI”

DISUSUN OLEH :

KELOMPOK 7

ANGGOTA : 1. WELA JULIA (A1C1100)

2. WINARSIH (A1C1150)

3. NINA OKTRIANI ( A1C115033)

4. SAFITRI TLASIH ( A1C115035)

5. AAN NOFIA NENGSIH (A1C115037)

PROGRAM STUDI PENDIDIKAN KIMIA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS JAMBI

2013
KATA PENGANTAR

Puji syukur kami panjatkan kehadapan Tuhan Yang Maha Esa, di mana atas
anugerahNya maka selesailah penulisan makalah evaluasi proses dan hasil pembelajaran ini
yang berjudul Model dan Pendekatan Evaluasi. Makalah ini disusun untuk memenuhi tugas
evaluasi proses dan hasil pembelajaran, dimana evaluasi proses dan hasil pembelajaran
merupakan salah satu mata kuliah yang ada di program studi pendidikan kimia Universitas
Jambi. Makalah ini disusun sebagai upaya untuk membantu mahasiswa dalam memahami
masalah-masalah dan konsep-konsep yang berhubungan dengan evaluasi proses dan hasil
pembelajaran.
Pada kesempatan ini, kami mengucapkan terima kasih kepada:
1. Tuhan Yang Maha Esa yang telah memberi Rahmat-Nya dalam pembuatan makalah
ini.
2. Dosen Pembimbing mata kuliah evaluasi proses dan hasil pembelajaran, Drs. Abu
Bakar, Mpd.
3. Kedua orang tua yang telah memberi motivasi serta doa-doanya.
4. Serta teman-teman yang telah memberi bantuan berupa moril maupun materil.
Penulis menyadari bahwa makalah ini jauh dari kesempurnaan, untuk itu kritik dan
saran dari pembaca sangat dibutuhkan dalam penyempurnaan makalah ini. Akhirnya semoga
makalah ini bermanfaat bagi para mahasiswa khususnya dan pembaca pada umumnya.

Jambi, Agustus 2013

Penulis
DAFTAR ISI

Halaman

KATA PENGANTAR ............................................................................................... i

DAFTAR ISI.............................................................................................................. ii

BAB I PENDAHULUAN

1.1 Latar Belakang ................................................................................. 1


1.2 Rumusan Masalah ............................................................................ 1
1.3 Tujuan Penulisan............................................................................... 2

BAB II PEMBAHASAN

2.1 Model Evaluasi ................................................................................ 3


2.2 Macam-Macam Model Evaluasi .................................................. 3
2.3 Pendekatan Evaluasi ........................................................................ 21
2.4 Macam-Macam Pendekatan Evaluasi .............................................. 21

BAB III PENUTUP

3.1 Kesimpulan ...................................................................................... 47

DAFTAR PUSTAKA ................................................................................................ 48


BAB I
PENDAHULUAN

1.1 Latar Belakang


Dalam proses pembelajaran komponen yang ikut menentukan keberhasilan sebuah
proses adalah evaluasi. Dengan evaluasi orang akan mengetahui sejauh mana penyampaian
pembelajaran atau tujuan pembelajaran dapat dicapai sesuai dengan yang diinginkan.
Evaluasi menurut Kumano (2001) merupakan penilaian terhadap data yang
dikumpulkan melalui kegiatan asesmen.Sementara itu menurut Calongesi (1995) evaluasi
adalah suatu keputusan tentang nilai berdasarkan hasil pengukuran. Sejalan dengan
pengertian tersebut, Zainul dan Nasution (2001) menyatakan bahwa evaluasi dapat
dinyatakan sebagai suatu proses pengambilan keputusan dengan menggunakan informasi
yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes
maupun non tes.
Dalam mengevaluasi juga terdapat beberapa model dan pendekatan.Menurut Zaenal
Arifin (2009) Pada tahun 1949, Tyler pernah mengembangkan model Black box.Lebih
kurang 10 tahun lamanya orang memakai evaluasi dengan melakukan model
tersebut.Selanjutnya than 1972, model evaluasi mulai berkembang.Taylor dan Cowley
berhasil mengemukakan berbagai pemikiran tentang model evaluasi dan menerbitkan dalam
suatu buku.Berdasarkan pernyataan diatas maka penulis mengangkat judul “Model dan
Pendekatan Evaluasi”.

1.2 Rumusan Masalah


Adapun rumusan masalah dari makalah ini antara lain :
1. Apa yang dimaksud dengan model evaluasi?
2. Apa saja macam-macam model evaluasi?
3. Apa yang dimaksud dengan pendekatan evaluasi?
4. Apa saja macam-macam pendekatan evaluasi?
1.3 Tujuan Penulisan
Tujuan yang ingin dicapai dari penulisan makalah ini diantaranya:
1. Untuk memahami pengertian dari model evaluasi
2. Untuk memahami macam-macam model evaluasi
3. Untuk memahami pengertian dari pendekatan evaluasi
4. Untuk memahami macam-macam pendekatan evaluasi
BAB II
PEMBAHASAN

2.1 Pengertian Model Evaluasi


Dalam melakukan evaluasi, perlu dipertimbangkan model evaluasi yang akan dibuat.
Model evaluasi merupakan suatu desain yang dibuat oleh para ahli atau pakar
evaluasi.Biasanya model evaluasi ini dibuat berdasarkan kepentingan seseorang, lembaga
atau instansi yang ingin mengetahui apakah program yang telah dilaksanakan dapat mencapai
hasil yang diharapkan.

2.2 Macam-Macam Model Evaluasi


Dalam studi tentang evaluasi, banyak sekali dijumpai model-model evaluasi dengan
format atau sistematika yang berbeda, sekalipun dalam beberapa model juga ada yang sama.
Misalnya, Said Hamid Hasan (1998) mengelompokkan model evaluasi sebagai berikut :
1. Model evaluasi kuantitatif, yang meliputi : model Tyler, Model teoritik Tyler dan
Maguire, model pendekatan system Alkin, model Countenance Stake, model CIPP,
model ekonomi mikro
2. Model evaluasi kualitatif, yang meliputi : model studi kasus, model iluminatif, dan
model responsive.
Sementara itu, Kaufan dan Thomas dalam Suharsini Arikunto dan Cepi Safruddin AJ
(2007) membedakan model evaluasi menjadi delapan, yaitu :
1. Goal Oriented Evaluation Model, dikembangkan oleh Tyler
2. Goal Free Evaluation Model, dikembangkan oleh Scriven
3. Formatif Sumatif Evaluation Model, dikembangkan oleh Scriven
4. Countenance Evaluation Model, dikembangkan oleh Stake
5. Responsive Evaluation Model, dikembangkan oleh Stake
6. CSE-UCLA Evaluation Model, menekankan pada “kapan” evaluasi dilakukan.
7. CIPP Evaluation Model, dikembangkan oleh Stufflebeam
8. Discrepancy Model, dikembangkan oleh Provus
Ada juga model evaluasi yang dikelompokkan oleh Nana Sudjana dan R. Ibrahim
(2007 : 234) yang membagi model evaluasi menjadi empat model utama, yaitu
“measurement, congruence, educational system, dan illuminatif.”
Dari beberapa model diatas, diantaranya akan pemakalah uraikan sebagai berikut :
2.2.1 Model Tyler
Nama model ini diambil dari pengembangnya yaitu Tyler. Dalam buku Basic
Principles of Curriculum and Instruction, Tyler banyak mengemukakan ide dan gagasannya
tentang evaluasi. Salah satu bab dari buku tersebut diberinya judul how can the effectiveness
of learning experience be evaluated? Model ini dibangun atas dua dasar pemikiran.Pertama,
evaluasi ditujukan pada tingkah laku peserta didik.Kedua, evaluasi harus dilakukan pada
tingkah laku awal peserta didik sebelum melaksanakan kegiatan pembelajaran dan sesudah
melaksanakan kegiatan pembelajaran (hasil). Dasar pemikiran yang kedua ini menunjukkan
bahwa seorang evaluator harus dapat menentukan perubahan tingkah laku apa yang terjadi
setelah peserta didik mengikuti pengalaman belajar tertentu, dan menegaskan bahwa
perubahan yan terjadi merupakan perubahan yang disebabkan oleh pembelajaran.
Penggunaan model Tyler memerlukan informasi perubahan tingkah laku terutama
pada saat sebelum dan sesudah terjadinya pembelajaran. Istilah yang popular di kalangan
guru adalah tes awal dan tes akhir.Model ini mensyaratkan validitas informasi pada tes
akhir.Untuk menjamin validitas ini, maka perlu adanya control dengan menggunakan desain
eksperimen. Model Tyler disebut juga model Black box karena model ini sangat menekankan
adanya tes awal dan tes akhir. Dengan demikian, apa yan terjadi dalam proses tidak perlu
diperhatikan. Dimensi proses ini dianggap sebagai kontak hitam yang menyimpan segala
macam teka-teki. Menurut Tyler ada tiga langkah pokok yang harus dilakukan, yaitu:
a. Menentukan tujuan pembelajaran yang akan dievaluasi
b. Menentukan situasi dimana peserta didik memperoleh kesempatan untuk
menunjukkan tingkah laku yang berhubungan dengan tujuan, dan
c. Menentukan alat evaluasi yang akan dipergunakan untuk mengukur tingkah laku
peserta didik.
Keunggulan Model Tyler
 Model paling popular
 Digunakan dalam perkembangan kurikulum
 Sistematik
 Mudah digunakan
 Logikal
 Evaluator dapat memfokuskan kajian evaluasinya hanya pada satu dimensi kurikulum
yaitu dimensi hasil belajar. Sedang dimensi dokumen dan proses tidak menjadi focus
evaluasi.
Keterbatasan Model Tyler
 Model ini cenderung tidak peduli terhadap proses padahal hasil belajar adalah produk
dari proses belajar. Sehingga evaluasi yang mengabaikan proses berarti mengabaikan
komponen penting dari kurikulum.
 Model ini tidak dapat digunakan untuk mencari alasan atas kegagalan suatu
kurikulum.

2.2.2 Model yang Berorientasi pada Tujuan


Dalam pembelajaran, kita mengenal adanya tujuan pembelajaran umum dan tujuan
pembelajaran khusus.Model evaluasi ini menggunakan kedua tujuan tersebut sebagai kriteria
untuk menentukan keberhasilan. Evaluasi diartikan sebagai proses pengukuran untuk
mengetahui seberapa sejauh mana tujuan pembelajaran telah tercapai. Model ini dianggap
lebih praktis karena menentukan hasil yang diinginkan dengan rumusan tujuan pembelajaran
dapat diobservasi dan diukur, maka kegiatan evaluasi pembelajaran akan menjadi praktis dan
simple. Disamping itu, model ini dapat membantu guru menjelaskan rencana pelaksanaan
kegiatan pembelajaran dengan proses pencapaian tujuan. Instrument yang digunakan
bergantung pada tujuan yang ingin diukur. Hasil evaluasi akan menggambarkan tingkat
keberhasilan tujuan program pembelajaran berdasarkan kriteria program khusus. Kelebihan
model ini terletak pada hubungan antara tujuan kegiatan dan pembelajaran. Kekurangannya
adalah memungkinkan terjadinya proses evaluasi melebihi konsekuensi yang tidak
diharapkan.
Model Goal oriented evaluation model ini merupakan model yang muncul paling
awal. Yang menjadi objek pengamatan pada model ini adalah tujuan dari program yang
sudah ditetapkan jauh sebelum program dimulai.Evaluasi dilakukan secara
berkesinambungan, terus-menerus, mencek seberapa jauh tujuan tersebut sudah terlaksana
di dalam proses pelaksanaan program. Model ini dikembangkan oleh Tyler(suharsimi
arikunto, 2009 : 41).
Kelebihan :
Model penilaian yang berorientasi tujuan ini secara teknologis telah merangsang
berkembangnya proses-proses perumusan tujuan secara spesifik serta pengembangan atau
penemuan instrument-instrumen maupun prosedur pengukuran yang beragam. Dilihat dari
kajian dan literature, pendekatan penilaian berorientasi tujuan sudah lebih banyak dan
terarah kepada persoalan bagaimana pendekatan ini diaplikasikan dalam penilaian di kelas,
penilaian sekolah, penilaian program sekolah di satu kabupaten, atau lainnya.Oleh karena
itu, secara sederhana dapat dikatakan bahwa kelebihan pendekatan ini adalah mudah
dipahami, mudah untuk diimpelementasikan, dan disepakati banyak pendidik dapat
menghasilkan informasi yang relevan dengan misi mereka.
Model ini juga telah menyebabkan para pendidik merefleksikan dan mengklarifikasi
perhatian mereka terhadap pemikiran-pemikiran terdahulu berkaitan dengan ambiguitas
tujuan-tujuan pendidikan. Diskusi-diskusi bersama masyarakat tentang tujuan pendidikan
yang dianggap paling tepat, dijadikan ajang untuk meningkatkan validitas program
pendidikan yang dilakukan.Dengan behitu, akuntabilitas dan legitimasi program yang sudah
dirancang menjadi lebih kuat. Sebagai hasil dari perhatian berlebih para ahli terhadap
pendekatan ini adalah berkembangnya tes (ujian) dan praktek-praktek pengukuran lainnya
yang broadened unobtrusive and non paper and pencil evidence.
Kelemahan :
Disamping manfaat dan keungulan sebagaimana dipaparkan di atas, model ini juga
mendapatkan beberapa kritik yang sekaligus meggambarkan sebagai kelembahan dari
pendekatan tersebut. Beberapa kritik yang mengemuka adalah (Worten and Sander, 1987):
1) komponen penilaian kurang realistis ( lebih memfasilitasi pengukuran dan penilaian
ketercapaian tujuan daripada menghasilkan pertimbangan-pertimbangan tentag kebenaran
dan merit secara eksplisit)
2) kurangnya standar untuk memberi pertimbangan pentingnya diskrepansi yang nampak
antara tujuan dan kinerja;
3) mengabaikan nilai (value) dari tujuan itu sendiri;
4) mengabaikan alternative penting yang harus dipertimbangkan dalam perencaaan suatu
program pendidikan
5) mengabaikan transaksi yang terjadi selama proses atau aktifitas program yang dinilai
6) mengabaikan konteks dimana suatu penilaian dilakukan;
7) mengabaikan tujuan-tujuan penting lainnya diluar yang tujuan yag dirumuskan (termasuk
tercapainya tujuan-tujuan yang tidak diharapkan);
8) omit fakta dari nilai suatu program tidak merefleksikan tujuan
9) mempromosikan penilaian yang linier dan tidak fleksibel
Dari kesembilan kelemahan tersebut, secara umum dapat disimpulkan bahwa kelemahan
pendekatan penilaian berorientasi tujuan dapat menghasilkan suatu tunnel vision yang
cenderung membatasi efektifitas dan potensi penilaian (yang dari nina )

2.2.3 Model Evaluasi Lepas dari Tujuan


Model evaluasi yang dikembangkan oleh Michael Scriven ini dapat dikatakan
berlawanan dengan model pertama yang dikembangkan oleh Tyler. Jika dalam model yang
dikembangkan oleh Tyler, evaluator terus-menerus memantau tujuan, yaitu sejak awal proses
terus melihat sejauh mana tujuan tersebut sudah dapat dicapai, dalam model goal free
evaluation (evaluasi lepas dari tujuan)justru menoleh dari tujuan. Menurut Michael Scriven,
dalam melaksanakan evaluasi program evaluator tidak perlu memerhatikan apa yang
menjadi tujuan program. Yang perlu diperhatikan dalam program tersebut adalah
bagaimana kerjanya program, dengan jalan mengidentifikasi penampilan-penampilan yang
terjadi, baik hal-hal positif (yaitu hal yang diharapkan) maupun hal-hal negatif (yang
sebetulnya memang tidak diharapkan).
Alasan mengapa tujuan program tidak perlu diperhatikan karena ada kemungkinan
evaluator terlalu rinci mengamati tiap-tiap tujuan khusus.Jika masing-masing tujuan khusus
tercapai, artinya terpenuhi dalam penampilan, tetapi evaluator lupa memerhatikan seberapa
jauh masing-masing penampilan tersebut mendukung penampilan akhir yang diharapkan
oleh tujuan umum maka akibatnya jumlah penampilan khusus ini tidak banyak manfaatnya.
Dari uraian ini jelaslah bahwa yang dimaksud dengan "evaluasi lepas dari tujuan"
dalam model ini bukannya lepas sama sekali dari tujuan, tetapi hanya lepas dari tujuan
khusus. Model ini hanya mempertimbangkan tujuan umum yang akan dicapai oleh program,
bukan secara rinci per komponen (suharsimi arikunto, 2009 : 41-42).

2.2.4 Model Pengukuran (Measurement Model)


Model pengukuran (measurement model) banyak mengemukakan pemikiran-
pemikiran dari R. Thorndike dan R.L.Ebel.sesuai dengan namanya, model ini sangat
menitikberatkan pada kegiatan pengukuran. Pengukuran digunakan untuk menentukan
kualitas suatu sifat (atribut) tertentu yang dimiliki oleh objek, orang maupun peristiwa, dalam
bentuk unit ukuran tertentu.Dalam bidang pendidikan, model ini telah diterapkan untuk
mengungkapkan perbedaan-perbedaan individual maupun kelompok dalam hal kemampuan,
minat dan sikap.Hasil evaluasi digunakan untuk keperluan seleksi peserta didik, bimbingan,
dan perencanaan pendidikan.Objek evaluasi dalam model ini adalah tingkah laku peserta
didik, mencakup hasil belajar (kognitif), pembawaan, sikap, minat, bakat, dan juga aspek-
aspek kepribadian peserta didik.Instrument yang digunakan pada umumnya adalah tes tertulis
(paper and pencil test) dalam bentuk tes objektif, yang cenderung dibakukan.Oleh sebab itu,
dalam menganalisis soal sangat memperhatikan difficulty index dan index of
discrimination.Model ini menggunakan pendekatan Penilaian Acuan Norma (Norm-
referenced assessment).
Sesuai dengan namnya, model ini sangat menitik beratkan peranan kegiatan
pengukuran di dalam melaksanakan proses evaluasi. Pengukuran dipandang sebagai suatu
kegiatan yang ilmiah dan dapat diterapkan dalam berbagai bidang persoalan termasuk k
edalamnya bidang pendidikan.
Pengukuran menurut model ini tidak dapat dilepaskan dari pengertian kuantitas atau
jumlah. Jumlah ini akan menunjukkan besarnya (magnitude) objek, orang ataupun peristiwa
yang dilukiskan dalam bentuk unit-unit ukuran tertentu seperti misalnya menit, derajat,
meter, percentile, dan sebagainya, sehingga pengukuran itu selalu dinyatakan dalam bentuk
bilangan.
Dalam bidang pendidikan, model ini telah diterapkan dalam proses evaluasi untuk
melihat dan mengungkapkan perbedaan-perbedaan individual maupun perbedaan-perbedaan
individual maupun perbedaan-perbedaan kelompok dalam hal kemampuan serta minat dan
sikap. Hasil pengukuran mengenai aspek-aspek tingkah laku di atas digunakan untuk
keperluan seleksi siswa, bimbingan, dan perencanaan pendididkan bagi para siswa itu
sendiri.
Dapat disimpulkan bahwa menurut model ini, evaluasi pendidikan pada dasarnya
tidak lain adalah pengukuran terhadap berbagai aspek tingkah laku dengan tujuan untuk
melihat perbedaan-perbedaan individual atau kelompok yang hasilnya diperlukan dalam
rangka seleksi, bimbingan dan perencanaan pendidikan bagi para siswa di sekolah
(Daryanto, 2005 : 72-73).
Tokoh model pengukuran adalah Edward L. thorndike dan Robert L. Ebel. Menurut
kedua tokoh ini dalam Purwanto (2009) beberapa ciri dari model pengukuran, adalah :
a. Mengutamakan pengukuran dalam proses evaluasi. Pengukuran merupakan kegiatan
ilmiah yang dapat diterapkan pada berbagai bidang termasuk pendidikan
b. Evaluasi adalah pengukuran terhadap berbagai aspek tingkah laku untuk melihat
perbedaan individu atau kelompok. Oleh karena tujuannya adalah untuk
mengungkapkan perbedaan, maka sangat diperhatikan tingkat kesukaran dan daya
pembeda masing-masing butir, serta dikembangkan acuan norma kelompok yang
menggambarkan kedudukan siswa dalam kelompok
c. Ruang lingkup adalah hasil belajar aspek kognitif
d. Alat evaluasi yang digunakan adalah tes tertulis terutama bentuk objektif
e. Meniru model evaluasi dalam ilmu alam yang menggunakan objektivitas. Oleh karena
itu model ini cenderung mengembangkan alat-alat evaluasi yang baku. Pembakuan
dilakukan dengan mencobakan kepala sampel yang cukup besar untuk melihat
validitas dan reabilitasnya.
Yang dijadikan objek dari kegiatan evaluasi model ini adalah tingkah laku, terutama
tingkah laku siswa. Aspek tingkah laku siswa yang dinilai di sini mencakup kemampuan hasil
belajar, kemampuan pembawaan (inteligensi, bakat), minat, sikap dan juga aspek-aspek
kepribadian siswa. Dengan kata lain, objek evaluasi disini mencakup baik aspek kognitif
maupun dengan kegiatan evaluasi pendidikan di sekolah, model ini menitik beratkan pada
pengukuran terhadap hasil belajar yang dicapai siswa pada masing-masing bidang
pelajaran dengan menggunakan tes. Hasil belajar yang dijadikan objek evaluasi di sini
adalah hasil belajar dalam bidang pengetahuan (kohnitif) yang mencakup berbagai tingkat
kemampuan seperti kemampuan ingatan, pemahaman aplikasi, dan sebagainya, yang
evaluasinya dapat dilakukan secara kuantitatif-objektif dengan menggunakan prosedur yang
dapat distandardisasikan (Daryanto, 2005 : 74).
Keunggulan Model Pengukuran (Measurement Model)
Keunggulan dari model ini adalah sumbangannya yang sangat berarti dalam hal
penekannya terhadap pentingnya objektivitas proses penilaian. Aspek objektivitas yang
ditekankan oleh model ini perlu dijadikan landasan yang terus-menerus dalam rangka
mengembangkan sistem penilaian pendidikan.Di samping itu, evaluasi dalam model ini
memungkinkan untuk melakukan analisis intrumen dan hasil evaluasi secara statistik.
Keterbatasan Model Pengukuran (Measurement Model)
Keterbatasan dari model ini terletak pada penekanannya yang berlebihan pada aspek
pengukuran dalam kegiatan penilaian pendidikan. Konsekuensinya, penilaian cenderung
dibatasi pada dimensi tertentu dari sistem pendidikan yang “dapat diukur”, dalam hal ini
adalah hasil belajar yang bersifat kognitif. Yang menjadi persoalan adalah hasil belajar yang
bersifat kognitif tersebut bukan merupakan satu-satunya indikator bagi keberhasilan
kurikulum.Kurikulum sebagai suatu “alat” untuk mencapai tujuan pendidikan diharapkan
dapat mengembangkan berbagai potensi yang ada pada diri siswa, tidak terbatas hanya pada
potensi kognitif saja.
Adanya beberapa ketidakserasian dengan peranan penilaian dalam proses
pengembangan kurikulum/sistem pendidikan berikut ini.
a. Dalam pengembangan alat penilaian, model ini banyak dipengaruhi oleh prosedur
yang ditempuh dalam pengembangan tes psikologis, antara lain tes intelegensi dan tes
bakat. Untuk mengembangkan tes tersebut berlaku ketentuan bahwa soal tes yang
memiliki daya pembeda rendah perlu direvisi atau diganti dengan tes lain, yang
mempunyai daya pembeda tinggi. Prosedur semacam ini kurang cocok untuk
diterapkan dalam penilaian hasil belajar. Hal itu dalam rangka/pengembangan
pendidikan karena dalam penilaian pendidikan yang penting adalah butir soal tes yang
dibuat betul-betul konsisten dengan tujuan pendidikan yang ingin dinilai
pencapaiannya.
b. Dalam pengolahan hasil tes, model ini dipengaruhi oleh prosedur pengolahan hasil tes
psikologis, dan nilai yang dicapai oleh masing-masing siswa lebih mencerminkan
“kedudukannya” dalam kelompok. Dalam proses pengembangan pendidikan, nilai
semacam ini kurang mempunyai arti karena sifatnya relatif. Yang lebih berarti dalam
proses pengembangan pendidikan adalah nilai-nilai yang menunjukkan sejauh mana
tujuan-tujuan pendidikan telah dicapai oleh siswa, secara individual maupun
kelompok, bukan nilai relatif yang mencerminkan posisi siswa dalam kelompoknya.
c. Informasi yang disajikan menurut model ini lebih berbentuk nilai keseluruhan (total
score) yang dicapai setiap siswa, yang dilengkapi dengan data mengenai nilai rata-rata
dan standar deviasi yang dicapai kelompok. Informasi semacam ini kurang relevan
dengan kebutuhan yang dirasakan dalam proses pengembangan pendidikan karena
nilai keseluruhan lebih banyak “menyembunyikan” daripada mengungkapkan
informasi yang diperlukan untuk kepentingan penyempurnaan sistem. Yang lebih
diperlukan dalam proses pengembangan pendidikan adalah bentuk penyajian hasil tes
yang dapat memberikan petunjuk tentang bagian-bagian mana dari sistem pendidikan
yang masih lemah, dan karenanya memerlukan perbaikan.

2.2.5 Model Kesesuaian (Congruence Model)


Menurut model ini, evaluasi adalah suatu kegiatan untuk melihat kesesuaian
(congruence) antara tujuan dengan hasil belajar yang telah dicapai.Hasil evaluasi digunakan
untuk menyempurnakan system bimbingan peserta didik dan untuk memberikan informasi
kepada pihak-pihak yang memerlukan.Objek evaluasi adalah tingkah laku peserta didik, yaitu
perubahan tingkah laku yang diinginkan (intended behavior) pada akhir kegiatan pendidikan,
baik yang menyangkut aspek kognitif, afektif, maupun psikomotor.Untuk itu, teknik evaluasi
yang digunakan tidak hanya tes (tulisan, lisan, dan perbuatan), tetapi juga non-tes (observasi,
wawancara, skala sikap, dan sebagainya).Model evaluasi ini memerlukan informasi
perubahan tingkah laku pada dua tahap, yaitu sebelum dan sesudah kegiatan
pembelajaran.Berdasarkan konsep ini, maka guru perlu memerlukan pre dan post-test.
Adapun langkah-langkah yang harus ditempuh dalam model evaluasi ini adalah merumuskan
tujuan tingkah laku (behavioural objectivitas), menentukan situasi dimana peserta didik dapat
memperlihatkan tingkah laku yang akan dievaluasi menyusun alat evaluasi, dan
menggunakan hasil evaluasi. Oleh sebab itu, model ini menenkankan pada pendekatan
penilaian acuan patokan (criterion-referenced assessment).
Tyler menggambarkan pendidikan sebagai suatu proses, yang di dalamnya terdapat
tiga hal yang perlu kita bedakan, tujuan pendidikan, pengalaman belajar, dan penilaian
terhadap hasil belajar. Hubungan di antara ketiga dimensi di atas dalam proses pendidikan
digambarkan dalam diagram di bawah ini:
Gambar
Garis (a) menunjukkan hubungan antara tujuan pendidikan dan pengalaman belajar,
garis (b) menunjukkan antara pengalaman belajar dan hasil belajar, dan (c) menunjukkan
hubungan antara tujuan dan hasil belajar.
Dalam diagram di atas, kegiatan evaluasi dinyatakan oleh garis (c), atau dengan kata
lain, evaluasi sini dimaksudkan sebagai kegiatan untuk melihat sejauh mana tujuan-tujuan
pendidikan telah dapat dicapai siswa dalam bentuk hasil belajar yang mereka perlihatkan
pada akhir kegiatan pendidikan.Ini berarti bahwa evaluasi itu dasarnya ingin memperoleh
gambaran mengenai efektivitas dari sistem pendidikan yang bersangkutan dalam mencapai
tujuannya. Mengingat tujuan-tujuan pendidikan mencerminkan perubahan-perubahan
tingkah diinginkan pada maka yang penting dalam proses evaluasi adalah memeriksa sejauh
mana perubahan-perubahan tingkah laku yang diinginkan itu telah terjadi pada anak didik.
Dengan diperolehnya informasi mengenai sejauh mana tujuan-tujuan pendidikan itu
telah dicapai siswa secara individual maupun secara kelompok, dapat diambil keputusan
tentang tindakan-tindakan apa yang perlu diambil sehubungan dengan sistem pendidikan
dan siswa yang bersangkutan. Tindak lanjut hasil evaluasi yang langsung menyangkut
kepentingan anak didik yang bersangkutan adalah dalam membentuk pemberian bimbingan
untuk enemperbaiki hasil yang telah dan merencanakan program studi bagi masing-masing
siswa.Ditinjau dari kepentingan sistem pendidikan, hasil evaluasi ini dimaksudkan sebagai
umpan balik untuk kebutuhan memperbaiki bagian-bagian sistem yang masih "lemah".
Di samping untuk kepentingan bimbingan siswa dan perbaikan sistem, evaluasi ini
dimaksudkan pula untuk memberikan informasi kepada pihak-pihak di luar pendidikan
tentang sejauh mana tujuan-tujuan yang diinginkan itu telah dapat dicapai oleh sistem
pendidikan yang ada.
Akhirnya, berdasarkan uraian-uraian di atas, dapat disimpulkan bahwa menurut
model ini, evaluasi itu tidak lain adalah usaha untuk memeriksa persesuaian (congruence)
antara tujuan-tujuan pendidikan yang diinginkan dan hasil belajar yang telah dicapai.
Berhubung tujuan-tujuan pendidikan menyangkut perubahan perubahan tingkah laku yang
diinginkan pada diri didik, maka evaluasi yang diinginkan itu telah terjadi Hasil evaluasi
yang diperoleh berguna bagi kepentingan, menyempurnakan sistem bimbingan siswa dan
untuk memberikan informasi kepada pihak-pihak di luar pendidikan mengenai hasil-hasil
yang telah dicapai(Daryanto, 2005 : 77-79).
Tokoh yang mengembangkan evaluasi model kesesuaian adalah Ralph W Tyler, John
B Carrol dan Lee J Cronbach. Ciri-ciri evaluasi model kesesuaian yang dikembangkan oleh
tokoh tersebut di atas adalah :
a. Pendidikan adalah proses yangmemuat tiga hal, yaitu tujuan pendidikan, pengalaman
belajar dan penilaian hasil belajar. Kegiatan evaluasi dilakukan untuk melihat sejauh
mana tujuan pendidikan yang diberikan dalam pengalaman belajar telah dapat dicapai
siswa dalam bentuk hasil belajar. Dengan kata lain, evaluasi dilakukan untuk melihat
kesesuaian antara tujuan pendidikan yang diinginkan dengan hasil belajar yang
dicapai.
b. Objek evaluasi adalah tingkah laku siswa dan penilaian atas perubahan dalam tingkah
laku pada akhir kegiatan pendidikan. Tujuan pendidikan adalah mencerminkan
perubahan-perubahan perilaku yang diinginkan pada anak. Evaluasi dilakukan untuk
memeriksa sejauh mana perubahan itu telah terjadi dalam hasil belajar. Oleh karena
itu, penilaian dilakukan atas perubahan perilaku sebelum dan sesudah kegiatan
pendidikan.
c. Perubahan perilaku hasil belajar terjadi dalam aspek kognitif, afektif dan psikomotor.
Oleh karena hasil belajar bukan hanya aspek kognitif, maka alat evaluasi bukan hanya
berupa tes tertulis, tetapi semua kemungkinan alat evaluasi dapat digunakan sesuai
dengan hakikat tujuan yang ingin dicapai.
Berhubung evaluasi menurut model yang kedua ini nmarihin nersesuaian
(congruence) antara tujuan dan hasil belajar, maka yang dijadikan objek evaluasi adalah
tingkah laku siswa. Secara lebih khusus, yang dinilai di sini adalah perubahan tingkah laku
yang diinginkan intended behavior) yang diperlihatkan oleh siswa pada akhir kegiatan
pendidikan. Dengan kata lain, pertanyaan yang dijawab oleh adalah apakah siswa telah
mencapai tujuan-tujuan dari sistem pendidikan melalui kegiatan belajar (learning tasks)
telah ditempuhnya. Yang perlu kita bahas lebih lanju sekarang adalah ruang lingkup
pengertian tingkah laku siswa yang merupakan objek yang ditekankan dalam proses evaluasi
menurut model ini. Pengertian tingkah laku siswa yang dimaksudkan di atas, sebagaimana
ter kandung secara implisit dalam uraian-uraian yang lalu, terutama diartikan sebagai
tingkah laku hasil belajar yang dicapai siswa.
Tingkah laku hasil belajar ini tidak hanya terbatas pada segi pengetahuan (kognitif),
melainkan juga men- cakup dimensi-dimensi lain dari tingkah laku yang ter gambar dalam
tujuan-tujuan pendidikan. Dalam bukunya yang terkenal: Basic Principle of Curriculum and
Instruction, Tyler memberikan ilustrasi tentang dimensi-dimensi tujuan pendidikan dalam
suatu unit pelajaran tertentu, seperti yang terlihat dalam bagan di bawah ini:
Gambar
Dari bagan di atas, dapat dikemukakan bahwa tingkah laku hasil belajar yang perlu
dinilai menurut model ini mencakup aspek pengetahuan, keterampilan dan nilai/ sikap,
sejauh aspek-aspek tersebut tercantum di dalam rumusan tujuan dari suatu sistem
pendidikan.Pernyataan mengenai ruang lingkup tingkah laku yang dimaksudkan di dalam
model ini perlu ditegaskan untuk menunjukkan bahwa objek yang dinilai di sini bukan hanya
aspek kognitif saja.
Sebagai kesimpulan dari bagian ini dapat dikemukakan bahwa objek evaluasi yang
dikemukakan dalam model ini adalah tingkah laku siswa, khususnya tingkah laku hasil
belajar sebagaimana yang dimaksudkan dalam rumusan tujuan pendidikan. Tingkah laku
tersebut men cakup baik aspek pengetahuan maupun aspek keteram an dan sikap, sebagai
hasil dari proses pendidikan.
Akhirnya, mengenai langkah-langkah yang perlu ditempuh di dalam proses evaluasi
menurut model ini, tyler mengajukan 4 langkah pokok, yaitu :
a) Merumuskan atau mempertegas tujuan-tujuan pengajaran.
Berhubung evaluasi diadakan untuk memeriksa sejauh mana tujuan-tujuan yang telah
dirumuskan itu telah dapat dicapai, perlu masing-masing tujuan itu diperjelas
rumusannya sehingga memberikan arah yang lebih tegas di dalam proses
perencanaan evaluasi yang akan dilakukan.
b) Menetapkan "test situation" yang diperlukan.
Dalam langkah ini ditetapkan jenis-jenis situasi yang akan memungkinkan para siswa
untuk memperlihatkan tingkah laku yang akan dievaluasi tersebut. Situasi-situasi
yang dimaksudkan dalam demonstrasi menggunakan mikroskop, memecahkan
persoalan-persoalan secara tertulis memimpin kegiatan kelompok, dan sebagainya.
c) Menyusun alat evaluasi.
Berdasarkan rumusan tujuan dan test situation yang telah ditetapkan dalam langkah-
langkah sebelumnya, kini dapat ditetapkan dan disusun alat-alat evaluasi yang cocok
untuk digunakan dalam menilai jenis- jenis tingkah laku yang tergambar dalam
tujuan tersebut di atas.
d) Menggunakan hasil evaluasi. Setelah tes dilaksanakan, hasilnya diolah sedemikian
rupa agar dapat memenuhi tujuan diadakannya evaluasi tersebut, baik untuk
kepentingan bimbingan siswa maupun untuk perbaikan siswa(Daryanto, 2005 : 79-
83).
Keunggulan model kesesuaian(Congruence Model)
Sumbangan yang cukup berarti congruence model adalah:
 Menghubungkan hasil belajar dengan tujuan pendidikan sebagai criteria perbandingan
 Memperkenalkan system pengolahan hasil penilaian secara bagian demi bagian, yang
ternyata lebih relevan dengan kebutuhan pengembangan system
Keterbatasan model kesesuaian(Congruence Model)
Tidak menjadikan inputdan proses pelaksanaan sebagai objek penilaian secara
langsung. Dengan model pre da post testinformasi yang dihasilkan hanya dapat menjawab
pertanyaan tentang tujuan-tujuan mana yang telah dan belum dicapai.

2.2.6 Educational System Evaluation Model


Model ketiga yang akan dibahas di sini merupakan reaksi terhadap kedua model
terdahulu yang telah dibahas. G v class dalam tulisannya yang berjudul Two Generations of
Evaluation Models menyebut model ketiga ini sebagai lingkupnya Systems Evaluations
Model karena ketiga yang yang jauh lebih luas dari kedua model terdahulu. Tokoh-tokoh
evaluasi yang dipandang sebagai pengembang dari model yang ketiga ini antara lain adalah
Stufflebeam, Michael Scriven, Robert E. Stake Malcolm M. Provus, yang masing-masing
pandangannya akan dibahas di dalam bagian lain.
Model ini bertitik tolak dari pandangan, bahwa keberhasilan dari suatu sistem
pendidikan dipengaruhi oleh berbagai faktor, karakteristik anak didik maupun lingkungan di
sekitarnya, tujuan sistem dan peralatan yang dipakai, serta prosedur dan mekanisme
pelaksanaan sistem itu sendiri.Pandangan tersebut di atas ternyata mempengaruhi konsep
evaluasi yang dikembangkan oleh model ini.Evaluasi, menurut model ini dimaksudkan untuk
membandingkan performance dari berbagai dimensi sistem yang sedang dikembangkan
dengan sejumlah kriteria tertentu, untuk akhirnya sampai pada suatu deskripsi dan
judgement mengenai yang dinilai tersebut.
Ada beberapa hal di dalam isi pandangan di atas yang perlu digarisbawahi dan
diuraikan lebih lanjut menginga pentingnya hal-hal tersebut di dalam konteks pandangan
tentang evaluasi yang dianut oleh model ini
a) Dengan mengemukakan "berbagai dimensi sist model ini menekankan pentingnya
sistem sebaga suatu keseluruhan dijadikan objek evaluasi, tanpa membatasi hanya
pada aspek hasil yang dicapai saja Gene V. Class dalam tulisannya Two Generation
of Evaluation Models menegaskan bahwa the complete and detailed description of
what constitutes of educational program is a concern of the educational system
evaluation model. Dengan kata lain, di samping hasil yang dicapai, dimensi-dimensi
lainnya dari sistem yang berpengaruh terhadap hasil yang akan dicapai, juga
menjadi objek evaluasi dari model yang ketiga ini.
b) Perbandingan antara performance dan kriteria juga merupakan salah satu inti yang
penting dalam konsep evaluasi menurut model ini. Malcolm M. Provus, dalam
pembahasannva mengenai The Discrepancy Evaluation Model mengemukakan bahwa
there can be non evaluation without discrepancy information; the can be non
discrepancy without standards or criteria. Yang penting di sini adalah bahwa untuk
setiap dimensi sistem pendidikan yang sedang dikembangkan itu perlu ditetapkan
dengan tegas kriteria yang akan dijadikan ukuran dalam mengevaluasi performance
dari masing-masing dimensi tersebut. Salah satu kelemahan dari evaluasi yang ada
sekarang, menurut Daniel L. Stufflebeam, adalah kurang jelasnya kriteria ang
digunakan sebagai dasar di dalam mengadakan evaluasi tersebut.
c) Akhirnya, model ini berpandangan bahwa kegiatan evaluasi tidak hanya berakhir
pada suatu deskripsitentang keadaan dari sistem yang telah dinilainya. melainkan
harus sampai pa tidaknya, sistem efektif pendidikan yang bersangkutan. Dalam of
Educational Eaaluation, Stake mengemukakan bahwa from relative judgment or as
MM jud rment, tae obtain an ovenal ampwssite salixe of merit, a nating to be used in
making ze educational dicision. sesuai dengan apa yang terkandung dalam ucapan
Stake di atas, dalam mengadakan jadsment, kita dapat menggunakan suatu standar
yang mutlak yang sudah ditetapkan, ataupun yang relatif dalam bentuk perbandingan
dengan sistem pendidikan yang lain.
Informasi yang diperolah dari hasil evaluasi berfungsi sebagai bahan atau input bagi
pengambilan keputusan mengenai sistem yang bersangkutan dalam rangka:
(1) Penyempurnaan sistem selama sistem tersebut masih dalam tahap
pengembangan, dan
(2) Penyimpulan mengenai kebaikan (merit, worth) dari sistem pendidikan yang
bersangkutan dibandingkan dengan sistem yang lain.
Dalam hubungan dengan fungsi evaluasi tersebut di atas Michael Scriven
membedakan antara formative evaluation dan summatite evaluation, yang pertama
dihubungkannya dengan keperluan penyempurnaan sistem sedangkan yang terakhir
dihubungkannya dengan penyimpulan kebaikan dari secara keseluruhan.Formative
etuluation diadakan pada saat kurikulum atau Pendidikan itu masih dalam tahap
pengembangannya penyempurnaan penyempu terus dilakukan berdasarkan atas hasil
evaluasi. Sebaliknya, pada saat kurikulum itusudah dalam keadaan "siap" setelah selesai
menempuh fase pengujian dan penyempurnaan selama tahap pengembangan
Sebagai kesimpulan, ada empat hal yang perlu dikemukakan mengenai pandangan
model yang ketiga evaluasi.
Pertama, evaluasi itu ditujukan kepada berbagai dimensi dari sistem yang sedang
dikembangkan, tidak hanya dimensi hasilnya saja.Kedua, proses evaluasi itu mencakup
perbandingan antara performance dan kriteria, baik kriteria yang sifatnya mutlak maupun
relatif Ketiga, evaluasi tidak hanya berakhir dengan suatu deskripsi mengenai keadaan
sistem yang bersangkutan tetapi juga menuntut adanya judgment sebagai kesimpulan dari
hasil evaluasi. Keempat, hasil evaluasi digunakan sebagai bahan atau input bagi
pengambilan keputusan dalam rangka penyempurnaan sistem maupun penyimpulan
mengenai kebaikan sistem yang bersangkutan secara keseluruhan.
Sesuai dengan pandagan yang pertama di atas dimensi dari sistem pendidikan yang
dijadikan objek evaluasi di dalam model yang ketiga ini lebih luas yaitu mencakup dimensi
peralatan/sarana proses dan hasil atau produk yang diperlihatkan oleh sistem yang
bersangkutan.
Stake membagi objek evaluasi atas tiga kategori yaitu antecedents, transactions, dan
outcomes. Dengan antecedents dimaksudkan adalah sumber/model/input yang ada pada saat
sistem itu dikembangkan, seperti tenaga, keuangan, karakteristik siswa, dan tujuan yang
ingin dicapai. Dimensi yang disebut transaction mencakup rencana kegiatan yang disebut
pelaksanaannya di lapangan, termasuk maupun proses waktu, ke dalamnya urutan antara
guru murid, cara menilai hasil di kelas, dan sebagainya. Dengan outcomes di sini
dimaksudkan antara lain adalah hasil yang dicapai para tersebut, dan efek sampingan dari
sistem yang bersangkutan.
Stufflebeam, dalam bukunya Educational Evaluation and Decision Making,
menggolongkan sistem pendidikan atas 4 dimensi yaitu context, input, process, dan product,
serta mengajukan suatu model evaluasi dengan nama CIPP model yang merupakan
singkatan dari keempat dimensi di atas.
Keempat dimensi perlu selama dan pada akhir proses pengembangan kurikulum atau
sistem pendidikan. Pengertian untuk masing-masing dimensi di atas adalah sebagai berikut:
a) Context Situasi atau latar belakang yang mem pengaruhi jenis-jenis tujuan dan
strategi pendidikan yang akan dikembangkan dalam sistem yang bersangkutan,
seperti misalnya masalah pendidikan yang dirasa- kan, keadaan ekonomi negara,
pandangan hidup masyarakat dan seterusnya.
b) input Sarana/modal/bahan dan rencana stategi yang ditetapkan untuk mencapai
tujuan pendidikan tersebut.
c) Process Pelaksanaan strategi dan penggunaan sarana/modal/bahan di dalam
kegiatan nyata di lapangan.
d) Product Hasil yang dicapai baik selama maupun pada akhir pengembangan sistem
pen didikan yang bersangkutan.
Dari uraian di atas dapat disimpulkan bahwa bahkan menambahkan satu dimensi
lagi dalam evaluasi yaitu dimensi context yang belum sepenuhnya tercakup dalam dimensi
yang diajukan oleh Stake.Dengan kata lain menurut Stufflebeam, sistem pendidikan itu
hendaknya dinilai dari segi belakangnya kegiatannya, proses pelaksanaannya dan hasil yang
dicapainya, agar dapat diperoleh informasi yang luas.
Scriven, dalam tulisannya The Methodology of Evaluation membedakan antara
instrumental evaluation dan conseguential evaluation. Instrumental evaluation mencakup
evaluasi terhadap tujuan, isi, cara yang ditetapkan, maupun pelaksanaan dari cara-cara
tersebut di kelas. Sedangkan consequential evaluation mencakup evaluasi terhadap hasil
yang dicapai, terutama dari segi para siswa itu sendiri Dengan demikian, objek evaluasi
yang diajukan oleh Scriven di sini mencakup sarana/bahan, proses dan hasil yang dicapai.
Akhirnya, dalam membahas tahap-tahap evaluasi yang perlu ditempub, Provus
mengemukakan 4 dimensi yang perlu dinilai dalam proses pengembangan sistem pendidikan,
yaitu design, operation program, interim products dan terminal products. Pengertian design
di sini dapat dihubungkan dengan rencana/sarana, sedangkan program operation dapat
diartikan sebagai proses pelaksanaan. Yang dimaksudkan dengan interim products oleh
Provus adalah hasil belajar jangka pendek sedangkan terminal products adalah hasil belajar
dalam jangka waktu yang lebih panjang.Dengan demikian, objek evaluasi yang diajukan oleh
Provus di sini mencakup pula dimensi sarana/rencana proses, dan hasil yang dicapai.
Sehubungan dengan ruang lingkup objek evaluasi yang diajukan oleh model yang
ketiga ini, jenis-jenis data yang dikumpulkan dalam kegiatan evaluasi menuru model ini baik
data-data objektif (skor hasil tes) maupun data-data subjektif atau judgmental data
(pandangan guru-guru, reaksi para siswa, dan sebagainya).Model evaluasi ini memberikan
tempat yang penting bagi pengumpulan judgmental data.
Menurut model ini, kenyataan bahwa judgment itu mengandung unsur-unsur subjektif
tidak mengu- rangi pentingnya hal tersebut dalam proses evaluasi. Yang perlu adalah
mengembangkan cara yang akan memungkinkan unsur-unsur subjektif dalam judgment
tersebut dapat ditekankan sampai seminimal mungkin.
Kesimpulan yang dapat kita ambil mengenai ruang lingkup evaluasi yang diajukan
oleh model ketiga ini adalah bahwa :
a) objek evaluasi dalam rangka pengembangan kuri- kulum atau sistem pendidikan
mencakup sekurang- kurangnya 3 dimensi, yaitu dimensi peralatan/sarana, proses,
dan hasil yang dicapai
b) sehubungan dengan hal di atas, jenis-jenis data yang diperlukan dalam proses
penilaian mencakup data objektif maupun data subjektif Gudgmental data)(Daryanto,
2005 : 84-90)

2.2.7 CSE-UCLA Evaluasi Model


CSE- UCLA terdiri dari dua singkatan, yaitu CSE dan UCLA. CSE merupakan
singkatan dari Center for the Study of Evaluation, sedangkan UCLA merupakan singkatan
dari University of California in Los Angeles. Ciri dari model CSE-UCLA adalah adanya lima
tahap yang dilakukan dalam evaluasi, yaitu perencanaan, pengembangan, implementasi,
hasil, dan dampak. Fernandes (1984) memberikan penjelasan tentang model CSE-UCLA
menjadi empat tahap, yaitu (1) needs assessment, (2) program planning, (3) formative
evaluation, dan (4) summative evaluation.

Keterangan:

(1) CSE Model: Needs Assessment


Dalam tahap ini evaluator memusatkan perhatian pada penentuan masalah.
Pertanyaan yang diajukan:
 Hal-hal apakah yang perlu dipertimbangkan sehubungan dengan keberadaan
program?
 Kebutuhan apakah yang terpenuhi sehubungan dengan adanya pelaksanaan program
ini?
 Tujuan jangka panjang apakah yang dapat dicapai melalui program ini?
(2) CSE Model: Program Planning
Dalam tahap kedua dari CSE model ini evaluator mengumpulkan data yang terkait
langsung dengan pembelajaran dan mengarah pada pemenuhan kebutuhan yang
telah diidentifikasi pada tahap kesatu.tahap perencanaan ini program PBM
dievaluasi dengan cermat untuk mengetahui apakah rencana telah disusun
berdasarkan hasil analisis kebutuhan. Evaluasi pembelajaran tahap ini tidak lepas
dari tujuan yang telah dirumuskan.
(3) CSE Model: Formative Evaluation
Dalam tahap ketiga ini evaluator memusatkan perhatian pada keterlaksanaan
program.Dengan demikian, evaluator diharapkan betul-betul terlibat dalam program
karena harus mengumpulkan data dan berbagai informasi dari pengembang
program.
(4) CSE Model: Summative Evaluation
Dalam tahap keempat, yaitu evaluasi sumatif, para evaluator diharapkan dapat
mengumpulkan semua data tentang hasil dan dampak dari program. Melalui evaluasi
sumatif ini, diharapkan dapat diketahui apakah tujuan yang dirumuskan untuk
program sudah tercapai, dan jika belum dicari bagian mana yang belum dan apa
penyebabnya(suharsimi arikunto, 2009 : 44-45).

2.2.8 Model CIPP


Model evaluasi CIPP yang dikemukakan oleh Stufflebeam & Shinkfield (1985)
adalah sebuah pendekatan evaluasi yang berorientasi pada pengambil keputusan (a decision
oriented evaluation approach structured) untuk memberikan bantuan kepada administrator
atau leader pengambil keputusan. Stufflebeam mengemukakan bahwa hasil evaluasi akan
memberikan alternatif pemecahan masalah bagi para pengambil keputusan. Model evaluasi
CIPP ini terdiri dari 4 hurup yang diuraikan sebagai berikut:
a. Contect evaluation to serve planning decision. Seorang evaluator harus cermat dan
tajam memahami konteks evaluasi yang berkaitan dengan merencanakan keputusan,
mengidentifikasi kebutuhan, dan merumuskan tujuan program.
b. Input Evaluation structuring decision. Segala sesuatu yang berpengaruh terhadap
proses pelaksanaan evaluasi harus disiapkan dengan benar. Input evaluasi ini akan
memberikan bantuan agar dapat menata keputusan, menentukan sumber-sumber yang
dibutuhkan, mencari berbagai alternatif yang akan dilakukan, menentukan rencana
yang matang, membuat strategi yang akan dilakukan dan memperhatikan prosedur
kerja dalam mencapainya.
c. Process evaluation to serve implementing decision. Pada evaluasi proses ini berkaitan
dengan implementasi suatu program. Ada sejumlah pertanyaan yang harus dijawab
dalam proses pelaksanaan evaluasi ini. Misalnya, apakah rencana yang telah dibuat
sesuai dengan pelaksanaan di lapangan? Dalam proses pelaksanaan program adakah
yang harus diperbaiki? Dengan demikian proses pelaksanaan program dapat
dimonitor, diawasi, atau bahkan diperbaiki.
d. Product evaluation to serve recycling decision. Evaluasi hasil digunakan untuk
menentukan keputusan apa yang akan dikerjakan berikutnya. Apa manfaat yang
dirasakan oleh masyarakat berkaitan dengan program yang digulirkan? Apakah
memiliki pengaruh dan dampak dengan adanya program tersebut? Evaluasi hasil
berkaitan dengan manfaat dan dampak suatu program setelah dilakukan evaluasi
secara seksama. Manfaat model ini untuk pengambilan keputusan (decision making)
dan bukti pertanggung jawaban (accountability) suatu program kepada masyarakat.
Tahapan evaluasi dalam model ini yakni penggambaran (delineating), perolehan atau
temuan (obtaining), dan penyediakan (providing) bagi para pembuat keputusan.
Model evaluasi ini merupakan model yang paling banyak dikenal dan diterapkan oleh
para evaluator.Oleh karena itu, uraian yang diberikan relatif panjang dibandingkan model-
model lainnya.Model CIPP ini dikembangkan oleh Stufflebeam, dkk.(1967) di Ohio state
university. CIPP yang merupakan sebuah singkatan dari huruf awal empat buah kata, yaitu:
 Context evaluation : evaluasi terhadap konteks
 Input evaluation : evaluasi terhadap masukan
 Process : evaluasi terhadap proses
 Product evaluation : evaluasi terhadap hasil
Keempat kata yang disebutkan dalam singkatan CIPP tersebut merupakan sasaran
evaluasi, yang tidak lain adalah komponen dari sebuah proses program kegiatan. Dengan
kata lain, model CIPP adalah model evaluasi yang memandang program yang dievaluasi
sebagai sebuah sistem. Dengan demikian, jika tim evaluator sudah menentukan model CIPP
sebagai model yang akan digunakan untuk mengevaluasi program yang ditugaskan maka
mau tidak mau mereka harus menganalisis program tersebut berdasarkan komponen-
komponennya.
Seorang ahli evaluasi dari University of Washington bernama Gilbert Sax (1980)
memberikan arahan kepada evaluator tentang bagaimana mempelajari tiap-tiap komponen
yang ada dalam setiap program yang dievaluasi dengan mengajukan beberapa pertanyaan.
Model ini sekarang disempurnakan dengan satu komponen O, singkatan dari outcome (s)
sehingga menjadi model CIPPO.
Model CIPP hanya berhenti pada mengukur output (product) .sebagai contoh, jika
product .berhenti pada lulusan, sedangkan outcome (s) sampai pada bagaimana kiprah
lulusan tersebut dimasyarakat atau dipendidikan lanjutannya. Atau untuk product pabrik,
bukan hanya mengandalkan kualitas barang, tetapi pada kepuasan pemakai atau konsumen.
1. Evaluasi Konteks
Evaluasi konteks adalah upaya untuk menggambarkan dan merinci lingkungan,
kebutuhan yang tidak terpenuhi, populasi dan sampel yang dilayani, dan tujuan
proyek.Contoh pengajuan pertanyaan, untuk evaluasi yang diarahkan pada program
makanan tambahan anak sekolah (PMTAS).Ada empat pertanyaan yang dapat
diajukan sehubungan dengan evaluasi konteks, yaitu sebagai berikut.
 Kebutuhan apa saja yang belum terpenuhi oleh program, misalnya jenis
makanan dan siswa yang belum menerima?
 Tujuan pengembangan apakah yang belum dapat tercapai oleh program,
misalnya peningkatan kesehatan dan prestasi siswa karena adanya makanan
tambahan?
 Tujuan pengembangan apakah yang dapat membantu mengembangkan
masyarakat, misalnya kesadaran orang tua untuk memberikan makanan
bergizi kepada anak-anaknya? 4) Tujuan-tujuan mana sajakah yang paling
mudah dicapai, misalnya pemerataan makanan, ketepatan penyediaan
makanan?
2. Evaluasi Masukan
Tahap kedua dari model CIPP adalah evaluasi masukan. Maksud dari evaluasi
masukan adalah kemampuan awal siswa dan sekolah dalam menunjang PMTAS,
antara lain kemampuan sekolah dalam menyediakan petugas yang tepat, pengatur
menu yang andal, ahli kesehatan yang berkualitas, dan sebagainya. Pertanyaan-
pertanyaan yang diajukan untuk program pendidikan yang berkenaan dengan
masukan, antara lain:
 Apakah makanan yang diberikan kepada siswa berdampak jelas pada
perkembangan siswa?
 Berapa orang siswa yang menerima dengan senang hati atas makanan
tambahan itu?
 Bagaimana reaksi siswa terhadap pelajaran setelah menerima makanan
tambahan?
 Seberapa tinggi kenaikan nilai siswa setelah menerima makanan tambahan?
Menurut stufflebeam pertanyaan yang berkenaan dengan masukan meng arah pada
pemecahan masalah yang mendorong diselenggarakannya program yang
bersangkutan.
3. Evaluasi Proses
Evaluasi proses dalam model CIPP menunjuk pada "apa" kegiatan yang (what
dilakukan dalam program, "siapa" (who orang yang ditunjuk sebagai penanggung
jawab program, "kapan" (when) kegiatan akan selesai. Dalam model CIPP evaluasi
proses diarahkan pada seberapa jauh kegiatan yang dilaksanakan di dalam program
sudah terlaksana sesuai dengan rencana. Oleh Stufflebeam diusulkan pertanyaan-
pertanyaan untuk proses antara lain sebagai berikut.
 Apakah pelaksanaan program sesuai dengan jadwal?
 Apakah staf yang terlibat di dalam pelaksanaan program akan sanggup
menangani kegiatan selama program berlangsung dan kemungkinan jika
dilanjutkan?
 Apakah sarana dan prasarana yang disediakan dimanfaatkan secara
maksimal?
 Hambatan-hambatan apa saja yang dijumpai selama pelaksanaan program
dan kemungkinan jika program dilanjutkan?
4. Evaluasi Produk atau Hasil
Evaluasi produk atau hasil diarahkan pada hal-hal yang menunjukkan perubahan
yang terjadi pada masukan mentah, dalam contoh PMTAS adalah siswa yang
menerima makanan tambahan.Evaluasi produk merupakan tahap akhir dari
serangkaian evaluasi program. Dalam program PMTAS, pertanyaan-pertanyaan
yang dapat diajukan, antara lain:
 Apakah tujuan-tujuan ditetapkan sudah tercapai?
 Pernyataan-pernyataan apakah yang mungkin dirumuskan berkaitan antara
rincian proses dengan pencapaian tujuan?
 Dalam hal-hal apakah berbagai kebutuhan siswa sudah dapat dipenuhi
selama proses pemberian makanan tambahan (misalnya variasi makanan
banyaknya ukuran makanan, dan ketepatan waktu pemberian)?
 Apakah ampak yang diperoleh siswa dalam waktu yang relatif panjang
dengan adanya program makanan tambahan ini?(Suharsimi arikunto, 2009 :
45-46)

Model CIPP telah banyak digunakan di berbagai belahan Negara Amerika Serikat,
baik oleh pemerintah maupun agen-agen swasta.Penggunaan pendekatan evaluasi ini banyak
digunakan dalam rangka menjamin akuntabilitas public dari suatu program pendidikan.
Stuffelbeam dan Shinkield (1985) menggambarkan pemanfaatan CIPP model dalam dua
kepentingan, yakni pembuatan keputusan (orientasi formatif) dan akuntabilitas (orientasi
sumatif), sebagai berikut :
Kelebihan :
Keunggulan atau kelebihan yang paling menonjol dari model ini adalah
penekanannya pada informasi-informasi yang penting dan dibutuhkan pada setiap level
pengambilan keputusan. Dengan demikian informasi yang dikumpulkan sangat terarah pada
isu-isu pokok yang memerlukan jawaban pada setiap level dan aspek program, sehingga
evaluasi lebih terfokus. House (1982) mendeskripsikan keunggulan model ini dalam sebuah
kalimat sebagai berikut:
“…model ini telah memberikan masukan yang sangat bernilai terhadap evaluasi,
dengan penekanannya pada informasi yang bermanfaat dan penting. Informasi evaluasi telah
digunakanya secara berarti. Menghubungkan kegiatan evaluasi dengan pengambilan
keputusan telah melandasi bermanfaatnya evaluasi. Secara praktis hal ini telah shape
evaluasi secara konseptual dengan pertimbangan-pertimbangan pengamblan keputusan.
Walaupun seseorang tidak dapat mendefinisikan secara tepat alternative-alternatif
keputusan, tetapi seseorang dapat mengeliminasi sejumlah hal-hal yang tidak relevan”
Model penilaian berorietasi manajemen telah mengantarkan seorang evaluator atau
pendidik untuk tidak menunggu waktu berjalannya program sebelum melakukan evaluasi.
Faktanya, seorang pendidik dapat melakukan evaluasi sebelum program dilakukan, misalnya
ketika ide program muncul. Pelaksanaan evaluasi yang dilakukan setelah program berjalan
saja akan mengakibatkan kerugian investasi sumberdaya dan kesempatan yang besar. Hal ini
merupakan keunggulan atau kelebihan lain dari model penilaian ini.
Hal lain yang dianggap kelebihan model ini adalah memungkinkannya dilakukan
perangkat heuristic secara sederhana melalui pengembangan pertanyaan-pertanyaan dalam
setiap level dan aspek program. Dengan demikian model ini terbuka untuk dapat mengali
hal-hal lain yang lebih mendalam dan mudah dijelaskan kepada kelompok sasaran pengguna
informasi evaluasi.
Kelemahan :
Kelemahan yang potensial dari model ini adalah ketidakmampuan evaluator untuk
merespon pertanyaan-pertanyaan atau isu-isu yang bermakna karena takut terjadi
pertentangan atau setidaknya tidak pas dengan perhatian para pengambil keputusan yang
nota bene mengendalikan evaluasi. Berkaitan dengan ini House (1980) mengingatkan:
“Mengapa harus pengambil keputusan, yang seringkali diidentifikasi sebagai
administrator program, yang diberi banyak peran? Apakah hal ini tidak menempatkan
evaluator sebagai pelayan manajemen puncak dan membuat evaluator sebagai the hired gun
dari penetapan proram? Apakah juga tidak membuat evaluasi secara ppotensial tidak adil
dan mungkin tidak demokrtis? Ini adalah kelemahan potensial dari pendekatan penilaian
yang berorientasi pengambilan keputusan.” (dari nina)

2.2.9 Model Stake atau Model Countenance


Hakikat evaluasi menurut sistem model adalah untuk membandingkan performance
dari berbagai dimensi sistem yang sedang dikembangkan dengan sejumlah kriteria tertentu,
akhirnya sampai pada suatu deskripsi dan judgment mengenai sistem yang dinilai tersebut.
Model evaluasi Stake(1967), merupakan analisis proses evaluasi yang membawa
dampak yang cukup besar dalam bidang ini, meletakkan dasar yang sederhana namun
merupakan konsep yang cukup kuat untuk perkembangan yang lebih jauh dalam bidang
evaluasi. Stake menekankan pada dua jenis operasi yaitu deskripsi (descriptions) dan
pertimbangan (judgments) serta membedakan tiga fase dalam evaluasi program yaitu :
 Persiapan atau pendahuluan (antecedents)
 Proses/transaksi (transaction-processes)
 Keluaran atau hasil (outcomes, output)
Model stake tersebut dapat digambarkan dalam bentuk diagram sebagai berikut :
a. Rational : menjelaskan pentingnya suatu program pelatihan.
b. Antecedents : kondisi-kondisi yang diharapkan sebelum kegiatan pelatihan
berlangsung, seperti motivasi, tingkat keterampilan dan minat.
c. Transactions : proses atau kegiatan-kegiatan yang saling mempengaruhi selama
pelatihan.
d. Outcomes : hasil yang diperoleh dari pelatihan, seperti pengetahuan, keterampilan,
sikap dan nilai-nilai.
e. Intents : tujuan apa yang diharapkan dari suatu program pelatihan.
f. Observations : apa yang dilihat oleh para pengamat tentang pelaksanaan pelatihan.
g. Standards : apa yang diharapkan dari para stakeholders.
h. Judgements : menilai pendekatan dan prosedur yang digunakan dalam pelatihan, para
pelatih/instruktur dan bahan-bahan atau menilai suatu program, baik yang dilakukan
oleh penilai itu sendiri maupun dari pihak-pihak lain.
Descriptions matrix menunjukkan Intents (goal=tujuan) dan observations
(effect=akibat) atau yang sebenarnya terjadi. Judgment berhubungan dengan standar (tolak
ukur = kriteria)/dan judgment (pertimbangan). Stake menegaskan bahwa ketika kita
menimbang-nimbang di dalam menilai suatu program pendidikan, kita tentu melakukan
pembandingan relatif (antara satu program dengan standard).
Model ini menekankan kepada evaluator agar membuat keputusan/penilaian tentang
program yang sedang dievaluasi secara benar, akurat dan lengkap.Stake menunjukkan bahwa
description disatu pihak berbeda dengan pertimbangan (judgment) atau menilai.Di dalam
model ini data tentang Antecendent (input), Transaction (process) dan Outcomes (Product)
data tidak hanya dibandingkan untuk menentukan kesenjangan antara yang diperoleh dengan
yang diharapkan, tetapi juga dibandingkan dengan standar yang mutlak agar diketahui dengan
jelas kemanfaatan kegiatan di dalam suatu program.
Keunggulan Model Stake atau model Countenance
Menurut Howard, E (2008), kelebihan evaluasi model Countenance Stake’s adalah:
 Dalam penilaiannya melihat kebutuhan program yang dilayani oleh evaluator.
 Upaya untuk mendeskripsikan kompleksitas program sebagai realita yang mungkin
terjadi.
 Memiliki potensi besar untuk memperoleh wawaasan baru dan teori-teori tentang
lapangan dan program yang akan di evaluasi.
Selain hal tersebut menurut Kemble (2010), mengatakan bahwa kelebihan evaluasi model
Countenance Stake antaralain adalah:
 Dalam evaluasi memasukkan data tentang latar belakang program, proses dan hasil
yang merupakan perluasan ruang lingkup evaluasi pada tahun 1970-an.
 Evaluator memegang kendali dalam evaluasi dan juga memutuskan cara yang paling
tepat untuk hadir dan menggambarkan hasil
 Fokus pada kekhawatiran stakeholder dan isu-isu meningkatkan komunikasi antara
evaluator dan stakeholder.
Sedangkan Menurut Robinson (2006) kelebihan model Countenance Stake yaitu
bahwa model tersebut memiliki kehatian-hatian dalam memberikan judgment mengenai nilai
aspek yang bervariasi.Model ini juga dapat memfasilitasi sebuah pemahaman yang mendalam
mengenai semua aspek program pembelajaran, yang tidak hanya memnugkinkan evaluator
untuk menentukan out come pembelajaran, tetapi juga menunjukkan alasan dan konsekuensi
dampaknya.Model ini memberikan dasar yang kuat untuk memberikan rekomendasi dan
judgment yang menarik atas nilai sebuah pembelajaran.Depwell, F & Glynis. (2008)
kekuatan model Contenance Stake adalah di akomodasi dan penataan berbagai tingkat data.
Dalam evaluasi yang dilakukan data yang dikumpulkan adalah campuran data kualitatif dan
kuantitatif, formal dan informal, primer dan sekunder.Dalam model countenance stake semua
data diolah sesuai dengan kategori melayani dalam matriks. Woods (1988) mengatakan
bahwa kekuatan model countenance stake adalah cara dan tindakannya pasti dan dapat
diamati secara bersamaan antara standard dan judgement.
Kelemahan dari Model Stake atau Countenance :
Menurut Howard, E (2008), kelemahan evaluasi model Countenance Stake’s adalah:
 Pendekatan yang dilakukan terlalu subjektif.
 Terjadinya kemungkinan dalam meminimalkan pentingnya instrument pengumpulan
data dan evaluasi kuantitatif.
 Kemungkinan biaya yang terlalu besar dan padat karya.

2.2.10 Model Alkin


Menurut Alkin (1969) evaluasi adalah suatu proses meyakinkan keputusan, memilih
informasi yang tepat, mengumpulkan, dan menganalisa informasi sehingga dapat melaporkan
ringkasan data yang berguna bagi pembuat keputusan dalam memilih beberapa alternatif. Ia
mengemukakan lima macam evaluasi yakni :
a. Sistem assessment, yaitu memberikan informasi tentang keadaan atau posisi sistem.
b. Program planning, membantu pemilihan program tertentu yang mungkin akan
berhasil memenuhi kebutuhan progam.
c. Program implementation, yang menyiapkan informasi apakah rogram sudah
diperkenalkan kepada kelompok tertentu ng tepat seperti yang direncanakan?
d. Program improvement, yang memberikan informasi tentang bagaimana program
berfungsi, bagaimana program bekerja, atau berjalan? Apakah menuju pencapaian
tujuan, adakah hal-hal atau masalah-masalah baru yang muncul takterduga?
e. Program certification, yang memberi informasi tentang nilai atau guna program.
Keunggulan Model Alkin
Keterikatannya dengan sistem.Dengan model pendekatan system ini kegiatan sekolah dapat
diikuti dengan seksama mulai dari variable-variabel yang ada dalam komponen masukan,
proses dan keluaran.Komponen masukan yang dimaksudkan adalah semua informasi yang
berhubungan dengan karakteristik peserta didik, kemampuan intelektual, hasil belajar
sebelumnya, kepribadian, kebiasaan, latar belakang keluarga, latar belakang lingkungan dan
sebagainya.
Keterbatasan Model Alkin
keterbatasannya dalam fokus kajian yaitu yang hanya fokus pada kegiatan persekolahan.
Sehingga model ini hanya dapat digunakan untuk mengevaluasi kurikulum yang sudah siap
dilaksanakan disekolah.

2.2.11 Model Brinkerhoff


Brinkerhoff & Cs. (1983) mengemukakan tiga golongan evaluasi yang disusun
berdasarkan penggabungan elemen-elemen yang sama, seperti evaluator-evaluator lain,
namun dalam komposisi dan versi mereka sendiri sebagai berikut :
1. Fixed vs Emergent Evaluation Design.
Desainevaluasi fixed (tetap) harus direncanakan dan disusun secara sistematik-
terstruktur sebelum program dilaksanakan. Namun demikian, desain fixed dapat juga
disesuaikan dengan kebutuhan yang sewaktu-waktu dapat berubah. Desain evaluasi ini
dikembangkan berdasarkan tujuan program, kemudian disusun pertanyaan-pertanyaan untuk
mengumpulkan berbagai informasi yang diperoleh dari sumber-sumber tertentu. Begitu juga
dengan model analisis yang akan digunakan harus dibuat sebelum program dilaksanakan.
Pihak pemakai (user) akan menerima informasi sebagai hasil evaluasi sesuai dengan tujuan
yang telah ditetapkan. Pada umumnya, evaluasi formal yang dibuat secara individual
menggunakan desain fixed, karena tujuan program sudah ditetapkan sebelumnya. Begitu juga
dengan anggaran biaya dan organisasi pelaksana yang semuanya dituangkan dalam sebuah
proposal evaluasi.
Kegiatan-kegiatan evaluasi yang dilakukan dalam desain fixed ini antara lain
menyusun pertanyaan-pertanyaan, menyusun dan menyiapkan instrument, menganalisis hasil
evaluasi dan melaporkan hasil evaluasi secara formal kepada pihak pemakai. Dalam
menyusun pertanyaan-pertanyaan atau merumuskan masalah, seorang evaluator harus
mengacu kepada tujuan program.Disamping itu, evaluator juga harus merangsang audience
untuk memperbaiki pertanyaan-pertanyaan yang dianggap kurang relevan. Sesuai dengan
kegiatan-kegiatan evaluasi ini, maka wajar bila desain fixed ini banyak memerlukan biaya.
Belum lagi proses komunikasi yang harus dibangun secara teratur dan kontinu, baik secara
langsung maupun tak langsung antara evaluator dengan audience atau klien.
Untuk mengumpulkan data dalam desain ini dapat menggunakan berbagai teknik
seperti tes, observasi, wawancara, kuisioner dan skala penilaian.Untuk itu, syarat-syarat
penyusunan instrument yang baik, seperti validitas dan reliabilitas tetap harus diperhatikan
karena data yang dikumpulkan biasanya bersifat kuantitatif.Dalam penyusunan desain
biasanya didiskusikan terlebih dahulu dengan pihak pemakai sehingga jika terdapat
kekurangan dapat segera diperbaiki.
Sementara itu, dalam desain evaluasi emergent, tujuan evaluasi adalah untuk
beradaptasi dengan situasi yang sedang berlangsung dan berkembang, seperti menampung
pendapat audience, masalah-masalah dan kegiatan program. Proses adaptasi ini tentu
memerlukan waktu yang cukup lama, mulai dari awal sampai dengan akhir kegiatan guna
menetapkan dan merumuskan tujuan dan isu. Hal ini wajar karena hal tersebut tidak
ditentukan sebelumnya. Disini, seorang evaluator tidak perlu mendorong audiensi untuk
memikirkan tentang suatu program atau isu-isu evaluasi karena audiensi akan menentukan
sendiri isu-isu dan informasi penting lainnya yang diperlukan dalam desain emergent.
Selama proses evaluasi, seorang evaluator harus tetap menjalin komunikasi yang
kontinu dengan audiensi, sehingga data dan informasi yang dikumpulkan tidak terputus dan
tetap utuh. Teknik pengumpulan data dapat menggunakan observasi, studi kasus dan laporan
tim pendukung. Pengukuran tidak selalu mengacu kepada tujuan program seperti yang biasa
dilakukan bahkan seorang evaluator sering mengabaikan panggunaan teknik pengukuran
karena informasi yang dibutuhkan lebih bersifat kualitatif-naturalistik. Hal ini dimaksudkan
agar informasi yang dikumpulkan lebih banyak, mendalam dan bermanfaat. Dengan
demikian, desain akan terus berkembang dan berubah sesuai dengan situasi dan kondisi
dilapangan.
2. Formative vs Summative Evaluation.
Istilah formatif dan sumatif pertama kali dipopulerkan oleh Michael Scriven.Untuk
dapat memahami kedua jenis evaluasi ini dapat dilihat dari fungsinya.Evaluasi formatif
berfungsi untuk memperbaiki kurikulum dan pembelajaran, sedangkan evaluasi sumatif
berfungsi untuk melihat kemanfaatan kurikulum dan pembelajaran secara
menyeluruh.Artinya, jika hasil kurikulum dan pembelajaran memang bermanfaat bagi semua
pihak yang terkait (terutama peserta didik) maka kurikulum dan pembelajaran dapat
dilanjutkan.Sebaliknya, jika hasil kurikulum dan pembelajaran tidak mempunyai manfaat,
maka kurikulum dan pembelajaran dapat dihentikan. Dengan demikian, evaluasi sumatif
dapat menentukan apakah suatu kurikulum dan pembelajaran akan diteruskan atau
dihentikan. Oleh sebab itu, seorang evaluator harus betul-betul memiliki kemampuan
professional dan dapat dipercaya dalam menentukan keputusan tersebut.Fokus evaluasi
sumatif adalah variabel-variabel yang dianggap penting dalam kurikulum dan pembelajaran.
3. Experimental and Quasi Experimental Design vs Natural/ Unobtrusive Inquiry.
Desain eksperimental banyak menggunakan pendekatan kuantitatif, random sampling,
memberikan perlakuan, dan mengukur dampak.Tujuannya adalah untuk menilai manfaat
hasil percobaan program pembelajaran.Untuk itu, perlu dilakukan manipulasi terhadap
lingkungan dan pemilihan strategi yang dianggap pantas. Dalam praktiknya, desain evaluasi
ini agak sulit dilakukan karena pada umumnya proses pembelajaran sudah atau sedang
terjadi. Jika prosesnya sudah terjadi, evaluator cukup melihat dokumen-dekumen sejarah atau
menganalisishasil tes.Jika prosesnya sedang terjadi, evaluator dapat melakukan pengamatan
atau wawancara dengan orang-orang yang terlibat.Untuk itu, kriteria internal dan eksternal
sangat diperlukan. Dalam proses pengamatan dan wawancara, evaluator harus selalu
merendah (low profile) sehingga program yang dievaluasi tidak terancam dan berubah karena
kehadiran evaluator. Desain evaluasi ini harus disusun bersama dan biasanya memerlukan
waktu dan biaya yang cukup banyak, terutama dalam menyusun instrument untuk menilai
perlakuan, mengumpulakn data kuantitatif, dan mengolah data secara statistik.Pengambilan
sampel secara acak dilakukan untuk menarik suatu generalisasi yang dapat berlaku secara
umum.
Dalam desain evaluasi natural-inkuiri, evaluator banyak menghabiskan waktu untuk
melakukan pengamatan dan wawancara dengan orang-orang yang terlibat.Kegiatan ini
dilakukan secara berkesinambungan dengan pendekatan informal.Disamping itu, evaluator
juga dapat menggunakan teknik studi dokumentasi.

2.2.12 Model Illuminative


Tujuan penilaian menurut model ini adalah mengadakan studi yang cermat terhadap
sistem yang bersangkutan. Studi difokuskan pada permasalahan bagaimana implementasi
suatu sistem dipengaruhi oleh situasi sekolah, tempat sistem tersebut dikembangkan,
keunggulan, kelemahan, serta pengaruhnya terhadap proses belajar siswa. Hasil evaluasi
ditekankan pada deskripsi dan interpretasi, bukan pengukuran dan prediksi sebagaimana
model sebelumnya. Dalam pelaksanaan evaluasi, model ini lebih menekankan penggunaan
judgment, selaras dengan semboyannya the judgment is the evaluation. Objek evaluasi yang
diajukan dalam model ini mencakup; latar belakang dan perkembangan yang dialami oleh
sistem yang bersangkutan, proses implementasi (pelaksanaan) sistem, hasil belajar yang
diperlihatkan oleh siswa, serta kesukaran-kesukaran yang dialami dari tahap perencanaan
hingga implementasinya di lapangan.Di samping itu, dampak yang ditimbulkan dari suatu
sistem seperti; kebosanan yang terlihat pada siswa dan guru, ketergantungan secara
intelektual, hambatan terhadap perkembangan sikap sosial, dan sebagainya.Ringkasnya,
objek evaluasi dalam model ini meliputi kurikulum yang terlihat maupun tersembunyi
(hidden curriculum).
Tahapan evaluasi dalam Illuminatif model terdiri dari tiga fase sebagai berikut.
a. Tahap pertama observe. Pada tahap ini, evaluator mengunjungi sekolah atau lembaga
yang sedang mengembangkan sistem tertentu. Evaluator mendengarkan dan melihat
berbagai peristiwa, persoalan, serta reaksi dari guru maupun siswa terhadap
pelaksanaan sistem tersebut.
b. Tahap kedua Inquiry further. Pada tahap ini, berbagai persoalan yang terlihat atau
terdengar dalam tahap pertama diseleksi untuk mendapatkan perhatian dan penelitian
lebih lanjut.
c. Tahap ketiga Seek to explain. Pada tahap ini, evaluator mulai meneliti sebab akibat
dari masing-masing persoalan. Pada tahap ini, faktor-faktor yang menyebabkan
timbulnya persoalan dicoba untuk ditelusuri. Data semula terpisah satu dengan
lainnya mulai disusun dan dihubungkan dalam kesatuan situasi. Langkah selanjutnya
dilakukan interpretasi data yang diharapkan dapat dijadikan bahan dalam
pengambilan keputusan.
Dari langkah-langkah tersebut, faktor penting dalam evaluasi model ini adalah
perlunya kontak langsung antara evaluator dengan pihak yang dievaluasi. Hal ini disebabkan
model ini menggunakan pendekatan kualitatif yang menekankan pentingnya menjalin
kedekatan dengan orang dan situasi yang sedang dievaluasi agar dapat memahami secara
personal realitas dan hal-hal rinci tentang program atau sistem yang sedang dikembangkan.30
Di samping itu, faktor lainnya adalah pandangannya yang holistic dalam evaluasi, yang
berasumsi bahwa keseluruhan adalah lebih besar daripada sejumlah bagian-bagian.
Model yang ini pun dikembangkan sebagai reaksi terhadap da model evaluasi yaitu
measurement oleh Penggunaan nama Illuminative Model pengembangannya didasarkan atas
alasan bahwa penggunaan berbagai cara penilaian di dalam model ini bila akan "help
illuminative and significant program features". Model ini dikembangkan terutama di Inggris
dan banyak dikaitkan dengan pendekatan dalam bidang antropologi.Salah seorang tokoh
yang paling menonjol dalam usahanya mengembangkan model ini adalah Malcolm Parlett.
Sebagaimana telah disinggung di atas, model yang keempat ini dikembangkan
sebagai reaksi terhadap model measurement congruence. Kedua model ini dipandang kurang
menghasilkan suatu informasi yang tuntas dan riil mengenai sistem pendidikan yang
dinilainya.
Bila model measurement dan congruence lebih ber- orientasi pada evaluasi secara
kuantitatif dan berstruktur, model yang keempat ini lebih menekankan pada evaluasi
kualitatif dan "terbuka". Sistem pendidikan yang dinilai tidak ditinjau sebagai suatu yang
terpisah melainkan dalam hubungan dengan suatu learning milieu, dalam konteks sekolah
sebagai lingkungan material dan psiko- sosial, yang guru dan muridnya bekerja sama.
Menghubungkan kegiatan evaluasi dengan suatu learning milieu membawa penilai
kepada situasi yang konkret tapi juga kompleks, karena sistem yang akan (berdiri itu tidak
dipandang sebagai unsur yang terpisah sendiri) melainkan sebagai bagian dari sistem
pendidikan di sekolah. Dan ini merrang tidak dipungkiri, karena bila sistem yang dievaluasi
tersebut ditempatkan dalam suatu isolasi, hal ini dapat menghasilkan situasi yang
artificial.Sehubungan dengan pendekatan evaluasi yang diajukan oleh model lebih mirip
dengan pendekatan yang diterapkan dalam studi dalam bidang antropologi.
Tujuan evaluasi menurut model yang keempat ini adalah mengadakan studi yang
cermat terhadap sist yang bersangkutan: bagaimana pelaksanaan sistem tersebut di
lapangan, bagaimana pelaksanaan itu dipengaruhi oleh situasi sekolah tempat yang
bersangkutan dikembangkan, apa kebaikan-kebaikan dan kelemahan- kelemahannya dan
bagaimana sistem tersebut mem- pengaruhi pengalaman-pengalaman belajar para siswa.
Hasil evaluasi yang dilaporkan lebih bersifat deskripsi dan interpretasi, bukan pengukuran
dan prediksi.Oleh karena itu dalam pelaksanaan evaluasi, model yang keempat ini lebih
banyak menekankan pada penggunaan judgment. Atau dengan kata lain, dalam mengadakan
evaluasi, model ini berpegang pada semboyan bahwa the judgment is the evaluation.
Akhirnya, model ini juga memandang fungsi evaluasi sebagai bahan atau input untuk
kepentingan pengambilan keputusan dalam rangka penyesuaian-penyesuaian dan
penyempurnaan sistem sedang dikembangkan.
Sebagaimana halnya model yang ketiga, model yang keempat ini juga mengarahkan
kegiatan evaluasinya tidak hanya pada aspek hasil belajar siswa melainkan pada aspek yang
lebih luas. Objek evaluasi yang diajukan oleh model ini mencakup:
a) Latar belakang dan perkembangan yang dialami oleh sistem yang bersangkutan;
b) Proses pelaksanaan sistem itu sendiri
c) Hasil belajar yang diperlihatkan oleh para siswa;
d) Kesukaran-kesukaran yang dialami dari perencanaan sampai dengan
pelaksanaannya di lapangan.
Di samping itu, iktit pula dijadikan objek evaluasi di dalam model ini adalah efek
samping dari sistem yang bersangkutan seperti kebosanan yang terlihat pada siswa,
ketergantungan secara intelektual, hambatan terhadap perkembangan sikap sosial, dan
sebagainya. Dengan kata lain, objek evaluasi dari model ini mencakup baik kuri- kulum yang
"terlihat" maupun kurikulum yang "tersem- bunyi". Menurut model ini, kedua jenis kurikulum
di atas sama pentingnya karena keduanya mempunyai penga- ruh di dalam, dalam rangka
pencapaian tujuan pendidikan (Daryanto, 2005 : 94-96).
Keunggulan Model Illuminative
Menekankan pentingnya dilakukan penilaian yang kontinu selama proses pelaksanaan
pendidikan sedang berlangsung. Jarak antara pengumpulan data dan laporan hasil penilaian
cukup pendek sehingga informasi yang dihasilkan dapat digunakan pada waktunya.
Keterbatasan Model Illuminative
Keterbatasan terutama terletak pada segi teknis pelaksanaannya yang meliputi:
 Kegiatan penilaian tidak didahului oleh adanya perumusan kriteria secara eksplisit.
 Objektivitas penilaian yang dilakukan perlu dipersoalkan.
 Adanya kecenderungan untuk menggunakan alat penilaian yang “terbuka” dalam arti
kurang spesifik dan berstruktur.
 Tidak menekankan pentingnya penilaian terhadap program bahan-bahan kurikulum
selama bahan-bahan tersebut disusun dalam tahap perencanaan.

2.2.13 Model Responsif


Sebagaimana model illuminatif, model ini juga menekankan pada pendekatan
kualitatif-naturalistik.Evaluasi tidak diartikan sebagai pengukuran melainkan pemberian
makna atau melukiskan sebuah realitas dari berbagai perspektif orang-orang yang terlibat,
berminat dan berkepentingan dengan program.Tujuan evaluasi adalah untuk memahami
semua komponen program melalui berbagai sudut pandang yang berbeda.Sesuai dengan
pendekatan yang digunakan maka model ini kurang percaya terhadap hal-hal yang bersifat
kuantitatif.Instrument yang digunakan pada umumnya mengandalkan observasi langsung
maupun tak langsung dengan interpretasi data yang impresionistik.Langkah-langkah kegiatan
evaluasi meliputi observasi, merekam hasil wawancara, mengumpulkan data, mengecek
pengatahuan awal peserta didik dan mengembangkan desain atau model.Berdasarkan
langkah-langkah ini, evaluator mencoba responsif terhadap orang-orang yang berkepentingan
pada hasil evaluasi.Hal yang penting dalam model responsif adalah pengumpulan dan sintesis
data.
Kelebihan model ini adalah peka terhadap berbagai pandangan dan kemampuannya
mengakomodasi pendapat yang ambigus serta tidak fokus.
Kekurangannya antara lain :
 pembuat keputusan sulit menentukan prioritas atau penyederhanaan informasi
 tidak mungkin menampung semua sudut pandangan dari berbagai kelompok
 membutuhkan waktu dan tenaga. Evaluator harus dapat beradaptasi dengan
lingkungan yang diamati.
2.3 Pengertian Pendekatan Evaluasi
Pendekatan merupakan sudut pandang seseorang dalam mempelajari sesuatu.Dengan
demikian, pendekatan evaluasi merupakan sudut pandang seseorang dalam menelaah atau
mempelajari evaluasi.

2.4 Macam-Macam Pendekatan Evaluasi


Dilihat dari komponen pembelajaran, pendekatan evaluasi dapat dibagi dua, yaitu
pendekatan tradisional dan pendekatan sistem.Dilihat dari penafsiran hasil evaluasi,
pendekatan evaluasi dibagi menjadi dua, yaitu criterion-referenced evaluation dan norm-
referenced evaluation.

2.4.1 Pendekatan berdasarkan komponen pembelajaran


2.4.1.1 Pendekatan Tradisional
Pendekatan ini berorientasi pada praktik evaluasi yang telah berjalan selama ini
disekolah yang ditujukan pada perkembangan aspek intelektual peserta didik.Aspek-aspek
keterampilan dan pengembangan sikap kurang mendapat perhatian yang serius. Dengan kata
lain, peserta didik hanya dituntut untuk menguasai mata pelajaran. Kegiatan-kegiatan
evaluasi juga lebih difokuskan pada komponen produk saja, sementara komponen proses
cenderung diabaikan. Hasil kajian Spencer cukup memberikan gambaran betapa pentingnya
evaluasi pembelajaran.Dia mengemukakan sejumlah isi pendidikan yang dapat dijadikan
dasar pertimbangan untuk merumuskan tujuan pendidikan secara komprehensif dan pada
gilirannya menjadi acuan dalam menbuat perencanaan evaluasi.Namun, tidak sedikit guru
mengalami kesulitan untuk mengembangkan sistem evaluasi disekolah karena bertentangan
dengan tradisi yang selama ini sudah berjalan.Misalnya, ada tradisi bahwa target kuantitas
kelulusan setiap sekolah harus diatas 95%, begitu juga untuk kenaikan kelas.Ada juga tradisi
bahwa dalam mata pelajaran tertentu nilai peserta didik dalam rapor harus minimal
enam.Seharusnya, kebijakan evaluasi lebih menekankan pada target kualitas, yaitu
kepentingan dan kebermaknaan pendidikan bagi anak.

2.4.1.2 Pendekatan Sistem


Sistem adalah totalitas dari berbagai komponen yang saling berhubungan dan
ketergantungan. Jika pendekatan sistem dikaitkan dengan evaluasi, maka pembahasan lebih
difokuskan pada kompenen evaluasi, yang meliputi komponen kebutuhan dan feasibility,
komponen input, komponen proses, dan komponen produk. Dalam bahasa Stufflebeam
disingkat CIPP, yaitu context, input, process, dan product.Komponen-komponen ini harus
menjadi landasan pertimbangan dalam evaluasi pembelajaran secara sistematis. Berbeda
dengan pendekatan tradisional yang hanya menyentuh komponen produk saja, yaitu
perubahan perilaku apa yang terjadi pada peserta didik setelah mengikuti proses
pembelajaran. Pendekatan ini tentu tidak salah, hanya tidak sistematis. Padahal, hasil belajar
tidak aka ada jika tidak melalui proses, dan proses tidak bisa berjalan jika tidak ada masukan
dan guru yang melaksanakan.
Selanjutnya, akan dikemukakan pula pendekatan evaluasi yang digunakan dalam
menafsirkan hasil evaluasi. Dalam literatur modern tentang evaluasi, terdapat dua pendekatan
yang dapat digunakan untuk menafsirkan hasil evaluasi, yaitu penilaian acuan patokan
(criterion-referenced evaluation) dan penilaian acuan norma (norm-referenced evaluation).
Artinya, setetlah diperoleh skor mentah dari setiap peserta didik maka langkah selanjutnya
adalah mengubah skor mentah menjadi nilai dengan menggunakan pendekatan tertentu.

2.4.2 Pendekatan berdasarkan penafsiran hasil evaluasi


2.4.2.1 Penilaian Acuan Patokan (PAP)
Pendekatan Penilaian Acuan Patokan (PAP) disebut juga penilaian dengan norma
absolut atau kriteria. Pendekatan PAP berarti membandingkan skor-skor hasil tes peserta
didik dengan kriteria atau patokan yang secara absolut/mutlak telah ditetapkan oleh guru. Jadi
skor peserta didik tidak dibandingkan dengan
kelompoknya tetapi skor-skor itu akan dikonversi menjadi nilai-nilai berdasarkan
skor teoritisnya. Guru juga dapat menggunakan langkah-langkah tertentu untuk menggunakan
PAP, seperti menentukan skor ideal, mencari rata-rata dan simpangan baku ideal, kemudian
menggunakan pedoman konversi skala nilai. Pendekatan ini cocok digunakan dalam evaluasi
formatif yang berfungsi untuk perbaikan proses pembelajaran.
Umumnya seorang guru yang menggunakan PAP sudah dapat menyusun
pedoman konversi skor-skor menjadi nilai standar sebelum tes dimulai. Oleh sebab itu,
umumnya hasil pengukuran dari periode ke periode berikutnya dalam kelompok berbeda
maupun yang sama akan dapat dipertahankan keajegannya atau
konsistensinya.
Pendekatan PAP tidak berorientasi pada “apa adanya”. Pertama, pendekatan ini tidak
semata-mata mempergunakan angka rata-rata yang dihasilkan oleh kelompok yang diuji,
melainkan telah terlebih dahulu menetapkan kriteria keberhasilan, yaitu “batas lulus”
penguasaan bahan pelajaran.Siswa yang telah mencapai batas ini dianggap telah berhasil
dalam belajar dan diperkenankan mempelajari bahan pelajaran yang lebih tinggi, sedangkan
yang belum mencapai batas tersebut dianggap belum berhasil dan diharuskan memantapkan
kembali pelajarannya itu.Kedua, dalam proses pengajaran, tenaga pengajar tidak begitu saja
membiarkan siswa menjalani sendiri proses belajarnya, melainkan terus-menerus secara
langsung ataupun tidak langsung merangsang dan memeriksa kemajuan belajar siswa serta
membantunya melewati tahap-tahap pengajaran secara berhasil.
Hasil penerapan PAP dalam penilaian peserta didik akan dapat Anda ramalkan
dengan terlebih dahulu melihat skor teoritis dan kualitas para peserta didik dalam kelompok
atau kelas. Misal pada penilaian dengan skala-5, PAP Anda berlakukan pada kelompok/kelas
yang kurang pandai maka diperkirakan banyak peserta didik mendapatkan nilai prestasi
kurang, yaitu ditandai dengan banyaknya peserta didik dengan nilai E, D, serta C sedangkan
nilai B dan A lebih sedikit seperti pada kurva-A berikut.

Apabila PAP diberlakukan kepada kelompok/kelas dengan rata-rata pandai


maka diperkirakan distribusi nilai seperti pada kurva-B. Peserta didik yang mendapat nilai E,
D, dan C lebih sedikit bila dibandingkan jumlah peserta didik dengan nilai B dan A. Secara
ideal dalam sudut pandang produk penilaian maka kurva yang diharapkan terjadi dalam PAP
adalah kurva-B, namun apabila memberikan hasil seperti kurva-A bukan berarti Anda gagal
dalam pembelajaran, tetapi sebagai sebuah proses Anda diwajibkan mengidentifikasi proses
pembelajaran yang telah berlangsung dan menemukan titik lemah pembelajaran kemudian
melakukan perbaikan-perbaikan.
Distribusi nilai suatu kelas/kelompok mungkin saja membentuk kurva-A apabila
perangkat tes yang digunakan memiliki butir-butir soal yang terkategori ”sulit” meskipun
prestasi mereka di atas rata-rata. Sebaliknya suatu kelas/kelompok dengan prestasi di bawah
rata-rata, distribusi nilainya akan membentuk seperti kurva-B karena perangkat soalnya
terlalu mudah. Sebab itu, sekali lagi PAP akan dapat menggambarkan prestasi siswa yang
obyektif bila perangkat tes yang digunakan adalah perangkat tes terstandar.

Aplikasi Pendekatan PAP


Metode PAP digunakan pada sistem penilaian skala-100 dan skala-5.Skala-100
berangkat dari persentase yang mengartikan skor prestasi sebagai proporsi penguasaan
peserta didik pada suatu perangkat tes dengan batas minimal angka 0 sampai 100 persen
(%).Pada skala-5 berarti skor prestasi diwujudkan dalam nilai A, B, C, D, dan E atau
berturutan mewakili nilai 4, 3, 2, 1, dan 0.Adapun langkah-langkah PAP sebagai berikut.
1) Menentukan skor berdasarkan proporsi

B = banyaknya butir yang dijawab benar (dalam bentuk pilihan ganda) atau jumlah skor
jawaban benar pada setiap butir/item soal (pada tes bentuk menguraikan)
St = Skor teoritis

2) Menentukan batas minimal nilai ketuntasan


Nilai ketuntasan adalah nilai yang menggambarkan proporsi dan kualifikasi
penguasaan peserta didik terhadap kompotensi yang telah dikontrakkan dalam
pembelajaran.Untuk menentukan batas minimal nilai ketuntasan peserta tes dapat
menggunakan pedoman yang ada.Depdiknas RI atau beberapa sekolah biasanya telah
menentukan batas minimal siswa dikatakan tuntas menguasai kompetensi yang dikontrakkan
misalnya 60%.
Umumnya pada tingkat pendidikan dasar dan menengah di negara kita menggunakan
skala-100 sedangkan skala-5 dipakai di perguran tinggi.Namun sekarang, ada perguruan
tinggi yang mengembangkan skala-5 menjadi skala delapan, sembilan, atau tiga belas dengan
memodifikasi ragam tingkatannya. Misal, semula ragam nilai skala-5 adalah A, B, C, D, dan
E kemudian dimodifikasi dengan menambah ragam tingkatan nilai menjadi delapan sebagai
berikut: A, B+, B, C+, C, D+, D, dan E. Pada beberapa perguruan tinggi ada yang
mengembangkan lagi menjadi tiga belas variasi seperti berikut: A+, A, A-, B+, B, B-, C+, C,
C -, D+, D, D-, dan E.
Contoh 1:
Suatu perangkat tes terdiri dari beberapa bentuk soal seperti pada tabel berikut.
Tabel 6.5. Perangkat Tes dengan Beberapa Bentuk Soal
Nomor Bentuk soal Bobot St
1s/d 30 Bentuk pilihan ganda model asosiasi 1 30
31 s/d 45 Bentuk pilihan ganda model melengkapi 2 30
Berganda
46 s/d 50 Bentuk uraian 5 25
Jumlah St = 85

Berdasarkan tabel di atas skor teoritis perangkat tes adalah 85.Peserta didik yang
mengikuti ada 40 anak, setelah mereka mengerjakan perangkat tes dilakukan penskoran oleh
guru.Hasil skor itu selanjutnya diolah dengan PAP, hasilnya sebagai berikut (yang
ditampilkan hanya 10 peserta tes).
Tabel 6.6. Skor Peserta Tes (Rekayasa) untuk Diolah dengan Pendekatan PAP

* Skor tertinggi dan terendah dari 40 peserta


Coba Anda gunakan pendekatan PAP untuk melakukan penilaian dan mengkonversi
skor-skor tersebut dengan skala-100 dan skala-5.
Jawab (skala-100): untuk mengerjakan contoh tersebut, setiap skor peserta tes diubah
menjadi persentase dari skor teoritis dengan menggunakan rumus yang telah ditentukan.
Adapun hasil perhitungannya ditampilkan dalam tabel berikut ini.
Tabel 2.

Catatan: batas minimal kualifikasi tuntas 60%

Melalui Tabel di atas berarti Anda tidak lagi menganggap nilai peserta tes pada kolom
”skor” tetapi Anda menggunakan kolom ”nilai (%)” dan ”kualifikasi” sebagai hasil dari PAP
dengan skala-100. Jadi peserta didik dengan nama Hadi mendapat nilai 63 dengan kualifikasi
tuntas, artinya Hadi mampu menguasai 63% kompetensi yang dikontrakkan dalam
pembelajaran.
Dari peserta dalam tabel di atas, ternyata Imam mendapat nilai 59 dengan
kualifikasi tidak tuntas karena nilainya di bawah batas minimal kualifikasi (60%).
Keadaan yang sama juga terjadi pada Nila dengan nilai 53 dan kualifikasi tidak tuntas.
Bagaimanakah dengan peserta berkualifikasi tidak tuntas?Anda dapat melakukan langkah
berikutnya yaitu memberikan keputusan kepada Iman dan Nila untuk remedial atau
melakukan tes ulang.
Jawab (skala-5): untuk membuat skala-5 pada umumnya sekolah sudah punya
pedoman konversi skala-5 untuk semua matapelajaran. Apabila di sekolah Anda belum
memiliki maka Anda harus membuat sendiri pedoman itu dengan mempertimbangkan batas
minimal kualifikasi tuntas yang telah disepakati.Berikut ini disusun pedoman konversi skala-
5 dengan memperhatikan bahwa batas minimal kualifikasi tuntas adalah 60%.
Tabel 6.7. Contoh Pedoman Konversi Skala-5
Melalui tabel di atas berarti setiap skor peserta didik harus dikonversi menjadi nilai
huruf dan kualifikasi, hasil konversinya sebagai berikut.
Tabel 6.8. Contoh Hasil Konversi Skala-5

Catatan: Batas minimal kualifikasi adalah nilai C atau nilai 60%


Melalui tabel hasil penilaian di atas, Anda jangan menganggap nilai peserta tes pada
kolom ”skor” tetapi gunakanlah kolom ”nilai (%)”, ”nilai (huruf)” dan ”kualifikasi” sebagai
hasil dari PAP dengan skala-5. Jadi peserta didik dengan nama Suyono mendapat nilai A
dengan kualifikasi sangat memuaskan, artinya Suyono mampu menguasai 80% kompetensi
yang dikontrakkan dalam pembelajaran. Dari peserta yang lain, misalnya; Imam mendapat
nilai D dengan kualifikasi kurang memuaskan karena nilainya di bawah batas minimal
kualifikasi 60% atau nilai C. Keadaan yang sama juga terjadi pada Nila dengan nilai D dan
kualifikasi kurang memuaskan.
Bagaimanakah dengan peserta berkualifikasi kurang memuaskan?Anda dapat
melakukan langkah berikutnya yaitu memberikan keputusan kepada Iman dan Nila untuk
mengikuti remedial, mengulang pada semester berikutnya (kalau di perguruan tinggi) atau
melakukan tes ulang.
Apabila hasil PAP dengan pedoman konversi skala-100 dan skala-5 Anda gunakan
untuk mengkonversi skor-skor hasil tes prestasi pada kelas/kelompok lain maka hasilnya
akan tetap reliabel dengan catatan perangkat tes yang digunakan sama dengan
kelompok/kelas sebelumnya.
3) Penilaian Acuan Norma (PAN)
Pada penjelasan sebelumnya disebutkan bahwa salah satu beda PAN dari PAP terletak
pada tolok ukur skor yang digunakan sebagai pembanding. Pendekatan ini menggunakan cara
membandingkan prestasi atau skor mentah peserta didik dengan sesama peserta didik dalam
kelompok/kelasnya sendiri. Makna nilai dalam bentuk angka maupun kualifikasi memiliki
sifat relatif, artinya bila sudah berhasil menyusun pedoman konversi skor berdasarkan tes
yang sudah dilakukan pada suatu kelas/kelompok maka pedoman itu hanya berguna bagi
kelompok/kelas itu dan kemungkinan besar pedoman itu tidak berguna bagi kelompok/kelas
lain karena distribusi skor peserta tes sudah lain. Kecuali, pada saat pengolahan skor
kelompok/kelas yang lain tadi disatukan dengan kelompok/kelas pertama.
Pendekatan PAN dapat dipakai untuk semua mata pelajaran, dari mata pelajaran yang
paling teoritis (penuh dengan materi kognitif) sampai ke mata pelajaran yang paling praktis
(penuh dengan materi keterampilan). Angka-angka hasil pengukuran yang menyatakan
penguasaan kompetensi-kompetensi kognitif, keterampilan, dan bahkan sikap yang dimiliki
atau dicapai oleh sekelompok siswa sebagai hasil dari suatu pengajaran, dapat
dikurvekan.Dalam pelaksanaannya dapat ditempuh prosedur yang sederhana.Setelah
pengajaran diselenggarakan, kelompok siswa yang menerima pengajaran tersebut menjawab
soal-soal atau melaksanakan tugas-tugas tertentu yang dimaksudkan sebagai ujian.Hasil ujian
ini diperiksa dan angka hasil pemeriksaan diberikan untuk masing-masing siswa dan
selanjutnya angka tersebut disusun dalam bentuk kurva. Kurva dan segala hasil perhitungan
yang menyertainya (terutama angka rata-rata dan simpangan baku dapat segera dipakai dalam
rangka PAN).
Langkah pendekatan PAN
Seperti pada PAP, pendekatan penilaian PAN dapat digunakan juga pada sistem
penilaian skala-100 dan skala-5. Bahkan pada PAN, Anda dapat mengembangkan menjadi
skala-9 dan skala-11. Pada skala-100 berangkat dari persentase yang mengartikan skor
prestasi sebagai proporsi penguasaan peserta didik pada suatu perangkat tes dengan batas
minimal angka 0 sampai 100 persen (%).Pada skala-5 berarti skor prestasi diwujudkan dalam
nilai A, B, C, D, dan E atau berturutan mewakili nilai 4, 3, 2, 1, dan 0.Adapun langkah-
langkah pendekatan PAN sebagai berikut.
1) Menghitung rerata ( x ) skor prestasi
 Untuk data tidak berkelompok

xi= skor peserta tes ke-i


n = jumlah peserta tes

 Untuk data berkelompok


xi= tanda kelas
fi= frekuensi yang sesuai dengan xi

2) Menghitung standar deviasi ( s ) skor prestasi


 Untuk data tidak berkelompok

xi= nilai ke-i

 Untuk data berkelompok

xi= nilai ke-i


fi= frekuensi ke-i
i = panjang kelas
xi'= nilai sandi

3) Membuat pedoman konversi untuk mengubah skor menjadi nilai standar (berdasarkan
skalanya, ada PAN dengan skala lima, skala sembilan, skala sebelas, dan dengan nilai
Zscore atau Tscore)
 Pedoman konversi skala-5
Pedoman konversi skala-5 berarti membagi nilai standar menjadi lima skala, lima
angka/huruf atau lima kualifikasi. Cara menyusun skala lima dengan membagi wilayah di
bawah lengkung kurva normal menjadi lima daerah, perhatikan kurva normal berikut.
Kurva normal tersebut terbagi menjadi lima daerah dan setiap daerah menunjukkan
kualifikasi atau nilai dari kanan ke kiri A, B, C, D dan E. Berdasarkan pembagian itu,
pedoman konversi skala-5 disusun sebagai berikut.

 Pedoman konversi skala-9


Pedoman konversi skala-9 berarti membagi nilai standar menjadi sembilan skala,
sembilan angka/huruf atau sembilan kualifikasi. Cara menyusun skala Sembilan sama
dengan skala lima yaitu dengan membagi wilayah di bawah lengkung kurva normal
menjadi Sembilan daerah, perhatikan kurva normal berikut.

Kurva normal tersebut terbagi menjadi sembilan daerah dan setiap daerah menunjukkan
kualifikasi atau nilai dari kanan ke kiri 1, 2, 3, 4, 5, 6, 7, 8 dan 9.Berdasarkan pembagian
itu, pedoman korversi skala-9 disusun sebagai berikut.
 Pedoman konversi skala-11
Pedoman konversi skala-11 berarti membagi nilai standar menjadi sebelas skala, sebelas
angka/huruf atau sebelas kualifikasi. Cara menyusun skala sebelas sama dengan skala
lima dan sembilan yaitu dengan membagi wilayah di bawah lengkung kurva normal
menjadi sebelas daerah, perhatikan kurva normal berikut.

Kurva normal tersebut terbagi menjadi sebelas daerah dan setiap daerah menunjukkan
kualifikasi atau nilai dari kanan ke kiri 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 dan 10.Berdasarkan
pembagian itu, pedoman korversi skala-11 disusun sebagai berikut.
 Pedoman konversi dengan Zscore atau Tscore
Dengan tidak menyusun pedoman konversi Anda dapat langsung menentukan atau
mengkonversi skor menjadi nilai standar dengan menggunakan dua nilai yaitu nilai Zscore
dan Tscore. Nilai Zscore berarti mengubah skor kasar menjadi nilai standar Z. Biasanya Zscore
digunakan sebagai cara untuk membandingkan beberapa nilai matapelajaran seorang
peserta tes dari berbagai jenis pengukuran yang berbeda. Konsep Tscore hampir sama
dengan Zscore. Adapun rumus untuk menghitung nilai Zscore dan Tscore adalah sebagai
berikut.

Keterangan:
x = skor
S = standar deviasi
x = rata-rata

Tscore = 50 +10× Zscore

Aplikasi pendekatan PAN


Contoh-1 (untuk data tidak berkelompok):
Seorang guru Matematika membina sepuluh orang peserta didik, ia berencana mengolah
dengan PAN skor akhir matematika menjadi nilai standar. Skornya seperti pada tabel
berikut.Pertanyaan: susunlah pedoman konversi skala-5 dan konversikan sepuluh skor
tersebut menjadi nilai standar.
Jawab:
1) Menghitung x dan s
No Nama Peserta xi xi2
1 Hadi 53 2809
2 Suyono 68 4624
3 Jamil 61 3721
4 Fatma 75 5625
5 Joko 82 6724
6 Romlah 65 4225
7 Imam 50 2500
8 Yoyok 71 5041
9 Nila 45 2025
10 Tiyas 54 2916
Jumlah = 624 40210

2) Membuat dan mengkonversi nilai dengan PAN skala-5


Menentukan batas nilai:
Membuat pedoman konversi skala-5:

Mengkonversi skor menjadi nilai skala-5:

3) Membuat dan mengkonversi nilai dengan PAN skala-9


Menentukan batas nilai:

Membuat pedoman konversi skala-9:


Mengkonversi skor menjadi nilai skala-9:

4) Membuat dan mengkonversi nilai dengan PAN skala-11


Membuat batas nilai:

Memuat pedoman konversi skala-11


Mengkonversi skor menjadi nilai skala-11:

Contoh-2 (untuk data berkelompok):


Seorang guru Bahasa Indonesia membina 80 orang peserta didik, ia berencana mengolah
dengan PAN skor akhir matapelajaran Bahasa Indonesia menjadi nilai standar. Skornya
seperti pada tabel berikut.Pertanyaan: susunlah pedoman konversi skala-5, 9, dan 11 dan
konversikan sepuluh skor siswa pada kolom pertama menjadi nilai standar.

Jawab:
1) Menghitung x dan s
a. Menentukan rentang
Rentang (r) = data terbesar – data terkecil
= 99 – 35 = 64

b. Menentukan banyak kelas interval


Banyak kelas (k) = 1 + 3,3 . log n
dimana n = banyak data
= 1 + 3,3 . log 80
= 1 + 3,3 . 1,9031
= 7,2802
Catatan: nilai “k” dibulatkan sehingga banyak kelas interval = 7 (pembulatan “k” harus
mengikuti kaidah matematik)

c. Menentukan panjang kelas


𝑘
Panjang kelas = 𝑖
7
= 64

= 9, 14

Catatan: khusus untuk panjang kelas pembulatan dapat Tidak mengikuti kaidah
matematik, jadi kalau pembulatan ke atas (=10) atau ke bawah (=9). Alasan; supaya
semua skor dapat masuk ke dalam setiap kelas interval.

d. Membuat tabel distribusi frekuensi kelompok


Mula-mula menentukan ujung bawah kelas interval pertama. Ujung bawah kelas
interval pertama = 35 (diambil skor terkecil). Dengan banyak kelas interval 7 serta
panjang kelas 9 dan 10 dapat disusun dua buah rencana kelas interval sebagai berikut.
Dengan panjang kelas = 9 memiliki kelas interval terakhir 89 – 97, dengan demikian
data berat badan lebih dari 97 tidak dapat masuk ke dalam kelas interval terakhir.
Dengan pajang kelas = 10 memiliki kelas interval terakhir 95 – 104, dengan demikian
semua data berat badan lebih dari 97 dapat masuk kedalam kelas interval terakhir.
Jadi sebaiknya menggunakan panjang kelas = 10. Selanjutnya disusun tabel distribusi
frekuensi kelompok seperti pada tabel dibawah ini.

e. Menentukan x dan s

Berdasarkan tabel di atas ditentukan nilai x dan s


2) Membuat dan mengkonversi nilai dengan PAN skala-5
Menentukan batas nilai:

Membuat pedoman konversi skala-5:

Mengkonversi skor menjadi nilai skala-5:

3) Membuat dan mengkonversi nilai PAN skala-9


Menentukan batas nilai:
Membuat pedoman konversi skala-9:

Mengkonversi skor menjadi nilai skala-9:

4) Membuat dan mengkonversi nilai dengan PAN skala-11


Menentukan batas nilai:
Membuat pedoman konversi skala-11:

Mengkonversi skor menjadi nilai skala-11:

4) Membuat dan mengkonversi skor menjadi nilai dengan Zscore


Berdasarkan pada contoh-2, bila Toni mendapat skor 82 berapakah nilai bila menggunakan
Zscore?

Berarti nilai Toni adalah 0,4 dari rata-rata 76, jadi nilai Toni adalah 76,4

Implikasi pendekatan panilaian yang dipakai


Pendekatan penilaian yang dipakai menimbulkan berbagai akibat dan kegiatan yang
menuntut pertimbangan seksama dan penanggulangan yang memadai.Sistem penunjang dan
berbagai kebijaksanaan baik setempat maupun tingkat pusat mempunyai sangkut-paut yang
tidak bisa diabadikan. Kedua pendekatan penilaian tersebut diatas, terutama PAP, menuntut
keterpaduan program pengajaran dan penilaian. Hal ini mengandung berbagai implikasi yang
menyangkut bidang manajemen, pengelolaan proses belajar mengajar, dan penentuan tugas
pengajar dan siswa.
1) Program pengajaran dan penilaian dalam pendekatan kompetensi menuntut
pelaksanaan pengajaran yang terencana, terarah, dinamis, dan membimbing.
Pengajaran seperti ini akan lebih mudah terlaksana bila jumlah siswa dalam kelas
tidak terlalu besar (paling banyak sekitar 40 orang). Jumlah yang terbatas ini akan
memungkinkan sebagian terbesar siswa dapat terjangkau oleh staf pengajar dan
sebagian terbesar siswa dapat memanfaatkan bantuan pengajar secara langsung. Tentu
saja jumlah siswa yang terbatas ini akan mempengaruhi dan dipengaruhi oleh jumlah
tenaga pengajar dan ruangan yang tersedia.
2) Pengajar perlu memiliki kemantapan keterampilan dalam menyusun program
pengajaran dan sekaligus program penilaiannya yang berorientasikan pada
kompetensi. Prosedur pengukuran dan penilaian yang sekaligus diintegrasikan ke
dalam proses pengajaran yang menyeluruh perlu dikuasai benar. Di samping itu
pengajar juga perlu menguasai praktek-praktek pengajaran yang berpusat pada tujuan
dan menguasai teknik-teknik pendekatan terhadap siswa secara perseorangan maupun
kelompok. Teknik-teknik ujian dan pengukuran lainnya serta pengetahuan statistik
dasar diperlukan untuk penerapan pengukuran/penilaian yang terarah itu.
3) Baik pengajar maupun siswa memerlukan sumber-sumber dan sarana belajar-
mengajar yang cukup. Pengajar memerlukannya untuk menyusun dan melaksanakan
program pengajaran, sedangkan siswa memerlukan untuk kegiatan perseorangan
maupun kelompok guna memenuhi kriteria keberhasilan. Penyusun dan pelaksanaan
program pengajaran serta hasil belajar siswa banyak sekali ditentukan oleh
tersedianya sumber dan sarana belajar-mengajar.
4) Dalam program penilaian terbuka siswa perlu mengetahui program penilaian, kriteria
keberhasilan dan hasil-hasil penilaian. Siswa perlu mengetahui silabi pengajaran,
jadual dan cara-cara penilaian yang akan dikenakan kepada mereka. Hal ini menuntut
keterampilan pengajar menyusun silabi dan sikap pengajar yang terbuka.
5) Kegiatan mengajar tidak semata-mata di muka kelas. Sesuai dengan ketentuan sistem
kredit semester, kegiatan pelajaran dengan harga 1 sks mencakup beban pengajaran
untuk pengajaran untuk penyelenggaraan tiga jenis kegiatan setiap minggu, yaitu :
60 menit untuk pengembangan bahan pelajaran;
50 menit untuk kegiatan tatap muka dengan siswa;
60 menit untuk usaha penilaian dan kegiatan perencanaan lanjutan.Dalam 60
menit terakhir itu pengajar dituntut untuk menyediakan diri bagi pertemuan dengan
siswa baik secara perseorangan maupun dalam kelompok, untuk membahas hal-hal
khusus berkenaan dengan kemajuan dan masalah-masalah pelajaran yang dihadapi
siswa.Pertemuan ini diselenggarakan baik atas prakarsa pengajar ataupun atas
permintaan siswa.Untuk kegiatan-kegiatan praktikum di laboratorium, kerja lapangan,
dan kegiatan lainnya perlu dilakukan kegiatan yang setara dengan penyelenggaraan
tiga kegiatan tersebut.
6) Siswa dituntut untuk belajar secara dinamis. Dalam rangka memenuhi kriteria
keberhasilan, mereka diminta untuk tidak ragu-ragu menyampaikan dan membahas
masalah yang dihadapinya dengan pengajar. Hal ini akan bisa terjadi apabila pengajar
dapat bersikap terbuka dan dapat menerima siswa dengan senang hati.
7) Program penilaian yang terarah dan terencana menuntut sistem pelaporan yang
lengkap dan rapi, baik untuk keperluan siswa sendiri dan keperluan pengajar, maupun
untuk keperluan lembaga. Hasil ujian pembinaan, ujian akhir, skala ukuran, dan daftar
cek memerlukan sistem pelaporan yang tersendiri, baik untuk keperluan bimbingan
siswa ataupun untuk keperluan laporan akhir.
8) Pengajar memerlukan berbagai sarana administrasi untuk penyusunan dan
pelaksanaan program pengajar dan penilaian. Untuk memperbanyak silabi, ujian, alat
pengukur lainnya, dan berbagai format diperlukan alat tulis-menulis dan kemudahan
dalam perbanyakkan bahan.
9) Program pengajaran dan penilaian perlu dicatat dan hasil-hasilnya disimpan secara
baik. Hal ini berguna untuk perbaikan dan perencanaan program sejenis dimasa
mendatang maupun untuk kepentingan siswa yang bersangkut apabila mereka
memerlukannya.
10) Karena program pengajaran dan penilaian ini bersifat menyeluruh dan relatif
menuntut lebih banyak waktu dan keterlibatan pengajar, perlu dipikirkan variasi jenis
mata pelajaran yang dipegang oleh setiap tenaga pengajar beserta konsekuensinya.
Misalnya, seorang tenaga pengajar yang mempunyai beban mengajar lima kelas
dengan dua mata pelajaran yang berbeda, relatif lebih ringan bebannya dari pengajar
lain yang memegang empat mata pelajaran yang berbeda.

Anda mungkin juga menyukai