Anda di halaman 1dari 33

PROSEDUR PENGEMBANGAN EVALUASI PEMBELAJARAN

Makalah ini dibuat guna memenuhi tugas

Mata kuliah Evaluasi Pembelajaran Fisika

Dosen Pengampu : Affa Ardhi Saputri, M.Pd.

Disusun oleh:

Say Fajar Sidiq (1808066039)

Apriliya Maghfiroh (1808066041)

Risma Islamiyati (1808066046)

Salma Fikriya S. (1808066048)

Widiya Ningsih (1808066053)

FAKULTAS SAINS DAN TEKNOLOGI

UIN WALISONGO SEMARANG

TAHUN 2020
KATA PENGANTAR

Puji syukur kehadirat Allah Subhanallahu wa Ta’ala atas limpahan rahmat dan
inayah-Nya sehingga penulis dapat menyelesaikan makalah tentang "Prosedur
Pengembangan Evaluasi Pembelajaran"

Shalawat serta salam semoga senantiasa tercurahkan kepada junjungan kita Nabi
Muhammad SAW yang telah membawa kita dari zaman kegelapan menuju zaman yang
terang benderang yang disinari oleh iman dan Islam.

Penulis sangat bersyukur karena dapat menyelesaikan makalah yang menjadi tugas
mata kuliah Evaluasi Pembelajaran dengan judul “Prosedur Pengembangan Evaluasi
Pembelajaran" ini dan mengucapkan terimakasih kepada semua pihak yang telah membantu
penulis selama pembuatan makalah ini.

Demikian yang dapat penulis sampaikan. Semoga makalah ini dapat bermanfaat bagi
pembaca. Penulis mengharapkan kritik dan saran, karena penulis sadar bahwa makalah yang
dibuat masih banyak kekurangan.

Semarang, 22 Februari 2020

Penulis

[i]
DAFTAR ISI

Kata Pengantar ................................................................................................................... i

Daftar Isi ........................................................................................................................... ii

BAB I PENDAHULUAN ................................................................................................. 1

A. Latar Belakang ...................................................................................................... 1


B. Rumusan Masalah ................................................................................................. 1
C. Tujuan ................................................................................................................... 1

BAB II PEMBAHASAN .................................................................................................. 2

A. Prosedur Pengembangan Evaluasi Pembelajaran ................................................. 2


B. Pengembangan Instrumen Pengumpulan Data ................................................... 10
C. Model Evaluasi Pembelajaran............................................................................. 14

BAB III PENUTUP ........................................................................................................ 28

A. Kesimpulan ......................................................................................................... 28
B. Saran ................................................................................................................... 29

Daftar Pustaka .................................................................................................................. iii

[ii]
BAB I

PENDAHULUAN

A. Latar Belakang

Salah satu komponen yang harus dikiasai gura adalah evaluasi pembelajaran.
Kompetensi ini melintasi dengan tugas dan tanggung jawab guru dalam pembelajaran.
Kompetensi tersebut melintasi pula dengan instrumen skor kemampuan guru,yang salah
satu indikatornya adalah melakukan evaluasi pembelajaran, agar tahu kekurangan-
kekurangan dalam pembelajaran tersebut, sehingga mampu memperbaikinya.

Evaluasi dalam arti luas adalah proses merencanakan, memperoleh, dan


meyediakan informasi yang sangat diperlukan untuk membuat alternative-alernatif
keputusan. Evaluasi adalah suatu proses sistematis dan berkelanjuatan untuk menentukan
kualitas (nilai dalam arti) dari sesuatu,berdasarkan pertimbangan dan kriteria tertentu
dalam rangka pembuatan keputusan.
Kata dasar dari pembelajaran adalah belajar. Sedangkan pengertian belajar adalah
suatu usaha sadar yang dilakukan oleh induvidu dalam perubahan tingkah laku, baik
melalui latihan dan pengalaman yang menyangkut aspek kognitif, afektif, dan
psikomotorik untuk memperoleh tujuan tertentu.

B. Rumusan Masalah
1. Bagaimana prosedur pengembangan evaluasi pembelajaran?
2. Bagaimana pengembangan instrumentasi evaluasi pembelajaran?
3. Apa saja macam-macam model evaluasi pembelajaran?

C. Tujuan
1. Untuk mengetahui prosedur pengembangan evaluasi pembelajaran
2. Untuk mengetahui pengembangan instrumentasi evaluasi pembelajaran
3. Untuk mengetahui macam-macam model evaluasi pembelajaran

[1]
BAB II

PEMBAHASAN

A. Prosedur Pengembangan Evaluasi Pembelajaran

Suatu kegiatan evaluasi dikatakan berhasil jika sang evaluator mengikuti prosedur
dalam melaksanakan evaluasi. Prosedur disini dimaksudkan sebagai langkah-langkah
pokok yang harus ditempuh dalam melakukan evaluasi. Tujuannya adalah agar evaluasi
yang diberikan sesuai dengan kebutuhan, sistematis, efisien dan dapat dipertanggung
jawabkan. Diantara prosedur tersebut adalah; perencanaan evaluasi, monitoring
pelaksanaan evaluasi, pengolahan data dan analisis, pelaporan hasil evaluasi, dan
penggunaan hasil evaluasi.

1. Perencanaan Evaluasi

Perencanaan evaluasi dimaksudkan agar hasil yang diperoleh dari evaluasi


dapat lebih maksimal. Perencanaan ini penting bahkan mempengaruhi prosedur
evaluasi secara menyeluruh. Perencanaan evaluasi dilakukan untuk memfasilitasi
pengumpulan data, sehingga memungkinkan membuat pernyataan yang valid
tentang pengaruh sebuah efek atau yang muncul di luar program, praktik, atau
kebijakan yang di teliti. Kegunaan dari perencanaan evaluasi adalah : (1)
perencanaan evaluasi membantu untuk mengetahui apakah standar dalam
menyatakan sikap atau perilaku telah mencapai sasaran atau tidak, jika demikian
sasaran akan dinyatakan ambigu dan akan kesulitan merancang tes untuk mengukur
prestasi siswa; (2) perencanaan evaluasi adalah proses awal yang dipersiapkan untuk
mengumpulkan informasi yang tersedia; (3) rencana evaluasi menyediakan waktu
yang cukup untuk mendesain tes.
Dalam melakukan perencanaan evaluasi, hal-hal yang patut diperhatikan adalah
sebagai berikut:
a. Analisis Kebutuhan
Adalah suatu proses yang dilakukan oleh seseorang untuk
mengidentifikasi kebutuhan dan menentukan skala prioritas pemecahannya.
Analisis kebutuhan merupakan bagian integral dari sistem pembelajaran secara
keseluruhan, yang dapat digunakan untuk menyelesaiakan masalah-masalah
pembelajaran. langkah-langkah yang dilakukan adalah mengindentifikasi dan

[2]
mengklarifikasi masalah, mengajukan hipotesis, mengumpulkan data, analisa
data dan kesimpulan.
b. Menentukan Tujuan Penilaian

Tujuan penilaian merupakan dasar untuk menentukan arah, ruang lingkup


materi, jenis/model dan karakter alat penilaian. Ada empat kemungkinan tujuan
penilain : (1) penilaian formatif, yaitu untuk memperbaiki kinerja atau proses
pembelajaran; (2) penialian sumatif, yaitu untuk menentukan keberhasilan
peserta didik; (3) penialian diagnostik, yaitu untuk mengidentifikasi kesulitan
belajar peserta didik dalam proses pembelajaran; (4) penilaian penempatan,
yaitu untuk menempatkan posisi peserta didik sesuai dengan kemampuannya.

c. Mengidentifikasi Kompetensi dan Hasil Belajar

Bertujuan untuk mengidentifikasi kompetensi yang akan diuji sesuai


dengan standar kompetensi, kompetensi dasar, hasil belajar dan indikator yang
terbagi dalam tiga domain (1) domain kognitif meliputi: pengetahuan,
pemahaman, aplikasi, analisis, sisntesis dan evaluasi; (2) domain afektif
meliputi: penerimaan, respons, penilaian, organisasi, kakaterisasi; (3) domaian
psikomotor meliputi: persepsi, kesiapan melakukan pekerjaan, respon
terbimbing, kemahiran, adaptasi dan orijinasi

d. Menyusun Kisi-Kisi

Kisi-kisi adalah format pemetaan soal yang menggambarkan distribusi


item untuk berbagai topik atau pokok bahasan berdasarkan jenjang kemampuan
tertentu yang berfungsi sebagai pedoman untuk menulis soal atau merakit soal
menjadi perangkat tes. Kisi-kisi yang baik akan memperoleh perangkat soal
yang relatif sama sekalipun penulis soalnya berbeda. Kisi-kisi penting dalam
perencanaan penilaian hasil belajar karena di dalamnya terdapat sejumlah
indikator sebagai acuan dalam mengembangkan instrumen (soal) dengan
persyaratan (1) representatif, yaitu harus betul-betul mewakili isi kurikulum
sebagai sampel perilaku yang akan di nilai; (2) komponen-komponennya harus
terurai/terperinci, jelas, dan mudah dipahami; (3) soalnya dapat dibuat sesuai
dengan indikator dan bentuk soal yang diterapkan. Manfaat dari indikator dalam

[3]
kisi-kisi adalah (1) dapat memilih materi, metode, media dan sumber belajar
yang tepat, sesuai dengan kompetensi yang telah di tetapkan; (2) sebagai
pedoman dan pegangan untuk menyusun soal atau isntrumen penilaian lain yang
tepat, sesuai dengan standar kompetensi dan kompetensi dasar yang telah di
tetapkan. Dalam menyusun kisi-kisi harus memperhatikan domain hasil belajar
yang akan diukur dengan sistematika : (1) aspek recall, yang berkenaan dengan
aspek-aspek pengetahuan tentang istilah-istilah, definisi, fakta, konsep, metode
dan prinsip-prinsip; (2) aspek komprehensif, yaitu berkenaan dengan
kemampuan-kemampuan antara lain: menjelaskan, menyimpulkan suatu
informasi, menafsirkan fakta (grafik, diagram, tabel, dan lain-lain), mentransfer
pernyataan dari suatu bentuk ke dalam bentuk lain (pernyataan verbal ke non-
verbal atau dari verbal ke dalam bentuk rumus), memprakirakan akibat atau
konsekuensi logis dari suatu situasi; (3) aspek aplikasi yang meliputi
kemampuan-kemampuan antara lain: menerapkan hukum/prinsip/teori dalam
suasana sesungguhnya, memecahkan masalah, membuat (grafik, diagram dan
lain-lain), mendemonstrasikan penggunaan suatu metode, prosedur dan lain-
lain.

e. Mengembangkan Draft

Draft instrumen merupakan penjabaran indikator menjadi pertanyaan-


pertanyaan yang karakteristiknya sesuai dengan pedoman kisi-kisi. Setiap
pertanyaan harus jelas dan terfokus serta menggunakan bahasa yang efektif,
baik bentuk pertanyaan maupun bentuk jawabannya. Kualitas butir soal akan
menentukan kualitas tes secara keseluruhan. Dengan prosedur soal yang disusun
ditelaah oleh tim ahli yang terdiri dari ahli bahasa, ahli bidang studi, ahli
kurikulum dan ahli evaluasi. Untuk draft dalam bentuk non-tes dapat dibuat
dalam bentuk angket, pedoman observasi, pedoman wawancara, studi
dokumentasi, skala sikap, penilaian bakat, minat dan sebagainya.

f. Uji Coba dan Analisis Soal

Bertujuan untuk mengetahui soal-soal mana yang perlu diubah, diperbaiki,


bahkan dibuang sama sekali, serta soal mana yang baik untuk diperguankan
selanjutnya. Soal yang baik adalah soal yang sudah mengalami beberapa kali uji

[4]
coba dan revisi yang didasarkan atas: (1) analisis empiris, yang dimaksudkan
untuk mengetahui kelemahan-kelemahan setiap soal yang digunakan. Informasi
empiris pada umumnya menyangkut segala hal yang dapat memengaruhi
validitas soal meliputi: aspek-aspek keterbacaan soal, tingkat kesukaran soal,
bentuk jawaban, daya pembeda soal, pengaruh kultur, dan sebagainya; (2)
analisis rasional, yang dimaksudkan untuk memperbaiki kelemahan-kelemahan
setiap soal. Kedua analisis tersebut dilakukan pula terhadap instrumen evaluasi
dalam bentuk nontes.

g. Revisi dan Merakit Soal (Instrumen Baru)

Soal yang sudah di uji coba dan di analisis, direvisi kembali sesuai dengan
proporsi tingkat kesukaran soal dan daya pembeda. Dengan demikian, ada soal
yang masih dapat diperbaiki dari segi bahasa, atau direvisi total, baik
menyangkut pokok soal (stem) maupun alternatif jawaban (option) yang
kemudian dilakukan perakitan soal menjadi suatu instrumen yang terpadu
dengan memperhatikan validitas skor tes, nomor urut soal, pengelompokkan
bentuk soal, penataan soal dan sebagainya.

2. Pelaksanaan Evaluasi

Pelaksanaan evaluasi artinya bagaimana cara melaksanakan suatu evaluasi


sesuai dengan perencanaan evaluasi. Dengan kata lain tujuan evaluasi, model dan
jenis evaluasi, objek evaluasi, instrumen evaluasi, sumber data, semuanya sudah
dipersiapkan pada tahap perencanaan evaluasi yang pelaksanaannya bergantung
pada jenis evaluasi yang digunakan. Jenis evaluasi yang digunakan akan
mempengaruhi seorang evaluator dalam menentukan prosedur, metode, instrumen,
waktu pelaksanaan, sumber data dan sebagainya, yang pelaksanaannya dapat
dilakukan dengan :

a. Non-tes yang dimaksudkan untuk mengetahui perubahan sikap dan tingkah laku
peserta didik setelah mengikuti proses pembelajaran, pendapat terhadap
kegiatan pembelajaran, kesulitan belajar, minat belajar, motivasi belajar dan
mengajar dan sebagainya. Instrumen yang digunakan (1) angket; (2) pedoman

[5]
observasi; (3) pedoman wawancara; (4) skala sikap; (5) skala minat; (6) daftar
chek; (7) rating scale; (8) anecdotal records; (9) sosiometri; (10) home visit
b. Untuk mengetahui tingkat penguasaan kompetensi menggunakan bentuk tes
pensil dan kertas (paper and pencil test) dan bentuk penilaian
kinerja (performance), memberikan tugas atau proyek dan menganalisis hasil
kerja dalam bentuk portofolio.

Tujuannya adalah untuk mengumpulkan data dan informasi mengenai


keseluruhan aspek kepribadian dan prestasi belajar peserta didik yang meliputi (1)
data pribadi (personal) yang meliputi nama, tempat dan tanggal lahir, jenis kelamin,
golongan darah, alamat dan lain-lain; (2) data tentang kesehatan yang meliputi
pengelihatan, pendengaran, penyakit yang sering diderita dan kondisi fisik; (3) data
tentang prestasi belajar (achievement) di sekolah; (4) data tentang
sikap (attitude) meliputi sikap terhadap teman sebaya, sikap terhadap kegiatan
pembelajaran, sikap terhadap pendidik dan lembaga pendidikan dan sikap terhadap
lingkungan sosial; (5) data tentang bakat (aptitude) yang meliputi data tentang bakat
di bidang olahraga, keterampilan mekanis, keterampilan manajemen, kesenian dan
keguruan; (6) persoalan penyesuaian (adjustment) meliputi kegiatan dalam
organisasi di sekolah, forum ilmiah, olahraga dan kepanduan; (7) data tentang
minat (interest); (8) data tentang rencana masa depan yang dibantu oleh pendidik,
orang tua sesuai dengan kesanggupan peserta didik; (9) data tentang latar belakang
yang meliputi latar belakang keluarga, pekerjaan orang tua, penghasilan tiap bulan,
kondisi lingkungan, serta hubungan dengan orang tua dan saudara-saudaranya.
Sedangkan kecenderungan evaluasi yang tidak memuaskan dapat ditinjau
dari beberapa segi (1) proses dan hasil evaluasi kurang memberi keuntungan bagi
peserta didik, baik secara langsung maupun tidak langsung; (2) penggunaan teknik
dan prosedur evaluasi kurang tepat berdasarkan apa yang sudah dipelajari peserta
didik; (3) prinsip-prinsip umum evaluasi kurang dipertimbangkan dan pemberian
skor cenderung tidak adil; (4) cakupan evaluasi kurang memperhatikan aspek-aspek
penting dari pembelajaran..

3. Monitoring Pelaksanaan Evaluasi

[6]
Monitoring dilakukan untuk melihat apakah pelaksanaan evaluasi
pembelajaran telah sesuai dengan perencanaan evaluasi yang telah ditetapkan atau
belum, dengan tujuan untuk mencegah hal-hal negatif dan meningkatkan efisiensi
pelaksanaan evaluasi. Monitoring mempunyai dua fungsi pokok (1) melihat
relevansi pelaksanaan evaluasi dengan perencaan evaluasi; (2) melihat hal-hal apa
yang terjadi selama pelaksanaan evaluasi dengan mencatat, melaporkan dan
menganalisis faktor-faktor penyebabnya. Dalam pelaksanaannya dapat digunakan
teknik : observasi partisipatif, wawancara bebas atau terstruktur, dan studi
dokumentasi. Hasil dari monitoring dapat dijadikan landasan dan acuan untuk
memperbaiki pelaksanaan evaluasi selanjutnya.

4. Pengolahan Data

Mengolah data berarti mengubah wujud data yang sudah dikumpulkan


menjadi sebuah sajian data yang menarik dan bermakna. Data hasil evaluasi yang
berbentuk kualitatif diolah dan dianalisis secara kualitatif, sedangkan data hasil
evaluasi yang berbentuk kuantitatif diolah dan dianalisis dengan bantuan statistika
deskriptif maupun statistika inferensial. Ada empat langkah pokok dalam mengolah
hasil penelitian :
a. Menskor, yaitu memberikan skor pada hasil evaluasi yang dapat dicapai oleh
perserta didik. Untuk menskor atau memberikan angka diperlukan tiga jenis alat
bantu yaitu kunci jawaban, kunci skoring dan pedoman konversi
b. Mengubah skor mentah menjadi skor standar dengan norma tertentu
c. Mengkonversikan skor standar ke dalam nilai, baik berupa huruf atau angka
d. Melakukan analisis soal (jika diperlukan) untuk mengatahui derajat validitas
dan reliabilitas soal, tingkat kesukaran sola (difficulty index) dan daya pembeda

Mengolah data dengan sendirinya akan menafsirkan hasil pengolahan itu.


Memberikan interpretasi maksudnya adalah memberikan
pernyataan (statement) mengenai hasil pengolahan data. Interpretasi terhadap suatu
hasil evaluasi didasarkan atas kriteria tertentu yang ditetapkan terlebih dahulu secara
rasional dan sistematis sebelum kegiatan evaluasi dilaksanakan, tetapi dapat pula
dibuat berdasarkan hasil-hasil yang diperoleh dalam melaksanakan evaluasi.
Sebaliknya jika penafsiran data tidak berdasarkan kriteria atau norma tertentu, maka
ini termasuk kesalahan besar dan ada dua jenis penafsiran data.:

[7]
a. Penafsiran kelompok

yaitu penafsiran yang dilakukan untuk mengetahui karakteristik kelompok


berdasarkan data hasil evaluasi yang meliputi prestasi kelompok, rata-rata
kelompok, sikap kelompok terhadap pendidik dan materi yang diberikan, dan
distribusi nilai kelompok. Tujuannya adalah sebagai persiapan untuk melakukan
penafsiran kelompok, untuk mengetahui sifat-sifat tertentu pada suatu kelompok
dan untuk menggandakan perbandingan antarkelompok.

b. Penafsiran individual

Yaitu penafsiran yang hanya dilakukan secara perseorangan diantaranya


bimbingan dan penyluhan atau situasi klinis lainnya. Tujuannya adalah untuk
melihat tingkat kesiapan peserta didik (readiness), pertumbuhan fisik, kemajuan
belajar dan kesulitan-kesulitan yang dihadapinya. Dengan penafsiran ini dapat
diputuskan bahwa peserta didik mencapai taraf kesiapan yang memadai atau
tidak, ada kemajuan yang berarti atau tidak, ada kesulitan atau tidak.

5. Pelaporan Hasil Evaluasi


Laporan kemajuan belajar peserta didik merupakan sarana komunikasi antara
sekolah, peserta didik dan orang tua dalam upaya mengembangkan dan menjaga
hubungan kerja sama yang harmonis, oleh karena itu ada beberapa hal yang perlu
diperhatikan:
a. Konsisten dengan pelaksanaan nilai di sekolah
b. Memuat perincian hasil belajar peserta didik beradasarkan kriteria yang telah
ditentukan dan dikaitkan dengan penilaian yang bermanfaat bagi perkembangan
peserta didik
c. Menjamin orang tua akan informasi permasalahan peserta didik dalam belajar
d. Mengandung berbagai cara dan strategi berkomunikasi
e. Memberikan informasi yang benar, jelas, komprehensif dan akurat.

Laporan kemajuan dapat dikategorikan menjadi dua jenis.:

a. Laporan prestasi mata pelajaran, yang berisi informasi tentang pencapaian


komptensi dasar yang telah ditetapkan dalam kurikulum. Prestasi peserta didik

[8]
dilaporkan dalam bentuk angka yang menunjukkan penguasaan komptensi dan
tingkat penguasaannya
b. Laporan pencapaian, yang menggambarkan kualitas pribadi peserta didik
sebagai internalisasi dan kristalisasi setelah peserta didik belajar melalui
berbagai kegiatan, baik intra, ekstra dan ko kurikuler

6. Penggunaan Hasil Evaluasi

Salah satu pengguanan hasil evaluasi adalah laporan. Laporan yang


dimaksudkan untuk memberikan feedback kepada semua pihak yang terlibat dalam
pembelajaran, baik secara langsung maupun tidak langsung. Secara umum terdapat
lima penggunaan hasil evaluasi untuk keperluan berikut:
a. Laporan Pertanggungjawaban, dengan asumsi banyak pihak yang
berkepentingan terhadap hasil evaluasi, oleh karena itu laporan ke berbagai
pihak sebagai bentuk akuntabilitas publik
b. Seleksi, dengan asumsi setiap awal dan akhir tahun terdapat peserta didik yang
masuk sekolah dan menamatkan sekolah pada jenjang pendidikan tertentu
dimana hasil evaluasi dapat digunakan untuk menyeleksi baik ketika masuk
sekolah/jenjang atau jenis pendidikan tertentu, selama mengikuti program
pendidikan, pada saat mau menyelesaikan jenjang pendidikan, maupun ketika
masuk dunia kerja
c. Promosi, dengan asumsi prestasi yang diperoleh akan diberikan ijazah atau
sertifikat sebagai bukti fisik setelah dilakukan kegiatan evaluasi dengan kriteria
tertentu baik aspek ketercapaian komptensi dasar, perilaku dan kinerja peserta
didik.
d. Diagnosis, dengan asumsi hasil evaluasi menunjukkan ada peserta didik yang
kurang mampu menguasai kompetensi sesuai dengan kriteria yang yang telah
ditetapkan maka perlu dilakukan diagnosis untuk mencari faktor-faktor
penyebab bagi peserta didik yang kurang mampu dalam menguasai komptensi
tertentu sehingga diberikan bimbingan atau pembelajaran remedial. Bagi yang
telah menguasai kompetensi lebih cepat dari peserta didik yang lain, mereka
juga berhak mendapatkan pelayanan tindak lanjut untuk mengoptimalkan laju
perkembangan mereka.

[9]
e. Memprediksi Masa Depan Peserta Didik, tujuannya adalah untuk mengetahui
sikap, bakat, minat dan aspek-aspek kepribadian lainnya dari peserta didik, serta
dalam hal apa peserta didik diangap paling menonjol sesuai dengan indikator
keunggulan, agar dapat dianalisis dan dijadikan dasar untuk pengembangan
peserta didik dalam memilih jenjang pendidikan atau karier pada masa yang
akan datang

B. Pengembangan Instrumen Pengumpulan Data


1. Pengertian Instrumen Pengumpulan data

Menurut pendapat Colton dan Covert instrumen adalah suatu alat yang
digunakan untuk mengukur fenomena, merekam informasi yang ditujukan untuk
penilaian dan pengambilan keputusan.1 An instrument is a tool for measuring,
observing, or documenting quantitative data. Instrumen adalah alat untuk mengukur,
mengamati, atau mendokumentasikan data.2 Menurut Suharsimi Arikunto instrumen
pengumpulan data adalah alat bantu yang dipilih dan digunakan oleh peneliti dalam
kegiatannya mengumpulkan agar kegiatan tersebut menjadi sistematis dan
dipermudah olehnya.3 Dari beberapa pendapat di atas dapat ditarik kesimpulan bahwa
instrumen penelitian adalah alat–alat yang digunakan untuk memperoleh atau
mengumpulkan data dalam rangka memecahkan masalah penelitian atau mencapai
tujuan penelitian ataupun pengambilan sebuah keputusan.

2. Langkah Penyusunan Instrumen.

Menurut Johnson & Clark dalam Creswell tahap-tahap umum dalam


pengembangan atau penyusunan sebuah isntrumen yaitu planning, construction,
quantitative evaluation, dan validation.4 Dalam setiap tahap tersebut masih ada
langkah-langkah yang harus dilakukan agar terciptanya sebuah instrumen yang baik.

1
Colton, D., and Covert, R.W, Designing and ConstructingInstruments for social research and Evaluation, (San
Fransisco: John Wiley and Sons Inc, 2007), hlm. 5
2
Cresswell, Jhon W, Eduactional Research: Planning, Conducting, and Evaluating Quantitative and
Qualitative Research, (New Jersey: Person Education, Inc, 2012), hlm. 151

3
Suharsini Arikunto, Prosedur Penelitian suatu pendekatan praktik (Jakarta: Rineka Cipta, 2006), hlm. 160
4
Cresswell, Jhon W, op. cit., hlm. 158

[10]
Menurut Muljono langkah-langkah penyusunan dan pengembangan instrumen
adalah sebagai berikut : 5

a. Berdasarkan sintesis dari teori-teori yang dikaji tentang suatu konsep dari variabel
yang hendak diukur, kemudian dirumuskan konstruk dari variabel tersebut.
Konstruk pada dasarnya adalah bangun pengertian dari suatu konsep yang
dirumuskan oleh peneliti.
b. Berdasarkan konstruk tersebut dikembangkan dimensi dan indicator variabel yang
sesungguhnya telah tertuang secara eksplisit pada rumusan konstruk variabel
pada langkah pertama.
c. Membuat kisi-kisi instrumen dalam bentuk tabel spesifikasi yang memuat
dimensi, indikator, nomor butir dan jumlah butir untuk setiap dimensi dan
indikator.
d. Menetapkan besaran atau parameter yang bergerak dalam suatu rentangan
kontinum dari suatu kutub ke kutub lain yang berlawanan, misalnya dari rendah
ke tinggi, dari negatif ke positif, dari otoriter ke demokratik, dari dependen ke
independen, dan sebagainya.
e. Menulis butir-butir instrumen yang dapat berbentuk pernyataan atau
pertanyaan.Biasanya butir instrumen yang dibuat terdiri atas dua kelompok yaitu
kelompok butir positif dan kelompok butir negatif.Butir positif adalah pernyataan
mengenai ciri atau keadaan, sikap atau persepsi yang positif atau mendekat ke
kutub positif, sedang butir negatif adalah pernyataan mengenai ciri atau keadaan,
persepsi atau sikap negatif atau mendekat ke kutub negatif.
f. Butir-butir yang telah ditulis merupakan konsep instrumen yang harus melalui
proses validasi, baik validasi teoretik maupun validasi empirik.
g. Tahap validasi pertama yang ditempuh adalah validasi teoretik, yaitu melalui
pemeriksaan pakar atau melalui panel yang pada dasarnya menelaah seberapa
jauh dimensi merupakan jabaran yang tepat dari konstruk, seberapa jauh indikator
merupakan jabaran yang tepat dari dimensi, dan seberapa jauh butir-butir
instrumen yang dibuat secara tepat dapat mengukur indikator.
h. Revisi atau perbaikan berdasarkan saran dari pakar atau berdasarkan hasil panel.
i. Setelah konsep instrumen dianggap valid secara teoretik atau secara konseptual,
dilakukanlah penggandaan instrumen secara terbatas untuk keperluan ujicoba.

5
Djali. H., Muljono P, Pengukuran Dalam Bidang Pendidikan, (Jakarta: Grasindo, 2007), hlm 3-4

[11]
j. Ujicoba instrumen di lapangan merupakan bagian dari proses validasi empirik.
Melalui uji coba tersebut, instrumen diberikan kepada sejumlah responden
sebagai sampel uji-coba yang mempunyai karakteristik sama atau ekivalen
dengan karakteristik populasi penelitian. Jawaban atau respon dari sampel ujicoba
merupakan data empiris yang akan dianalisis untuk menguji validitas empiris atau
validitas kriteria dari instrumen yang dikembangkan.
k. Pengujian validitas dilakukan dengan menggunakan kriteria baik kriteria internal
maupun kriteria eksternal. Kriteria internal, adalah instrumen itu sendiri sebagai
suatu kesatuan yang dijadikan kriteria sedangkan kriteria eksternal, adalah
instrumen atau hasil ukur tertentu di luar instrumen yang dijadikan sebagai
kriteria.
l. Berdasarkan kriteria tersebut diperoleh kesimpulan mengenai valid atau tidaknya
sebuah butir atau sebuah perangkat instrumen. Jika kita menggunakan kriteria
internal, yaitu skor total instrumen sebagai kriteria maka keputusan pengujian
adalah mengenai valid atau tidaknya butir instrumen dan proses pengujiannya
biasa disebut analisis butir. Dalam kasus lainnya, yakni jika kita menggunakan
kriteria eksternal, yaitu instrumen atau ukuran lain di luar instrumen yang dibuat
yang dijadikan kriteria maka keputusan pengujiannya adalah mengenai valid atau
tidaknya perangkat instrumen sebagai suatu kesatuan.
m. Untuk kriteria internal atau validitas internal, berdasarkan hasil analisis butir
maka butir-butir yang tidak valid dikeluarkan atau diperbaiki untuk diujicoba
ulang, sedang butir-butir yang valid dirakit kembali menjadi sebuah perangkat
instrumen untuk melihat kembali validitas kontennya berdasarkan kisi-kisi. Jika
secara konten butir-butir yang valid tersebut dianggap valid atau memenuhi
syarat, maka perangkat instrumen yang terakhir ini menjadi instrumen final yang
akan digunakan untuk mengukur variabel penelitian kita

Untuk keperluan penyusunan dan pengembangan instrumen pertama-tama


yang dilakukan adalah menetap kaji konstruk variabel penelitian yang merupakan
sistesis dari teori-teori yang telah dibahas dan dianalisis yang penyajiannya diuraikan
dalarn pengkajian teoritik atau tinjauan pustaka. Konstruk tersebut dijelaskan dalam
definisi konseptual variabel, yang di dalamnya tercakup demensi dan indikator dari
variabel yang hendak diukur, berdasarkan konstruk tersebut ditetapkan indikator-
idikator yang akan diukur dari variabel tersebut. Selanjutnya item-item instrumen

[12]
dibuat untuk mengukur indikator- indikator yang telah ditetapkan dengan cara, seperti
telah dikemukakan pada proses penyusunan dan pengembangan instrumen point d dan
e. Karena bentuk item-item instrumen yang akan dibuat harus sesuai dengan
instrumen yang dipilih, maka. sebelum menulis item-item instrumen terlebih dahulu
peneliti harus memilih jenis instrumen apa yang sesuai untuk mengukur indikator dari
variabel yang akan diteliti.

Berkaitan dengan instrumen penelitian, peneliti perlu memahami bagaimana


mengembangkan instrumen penelitian yang diperlukan untuk mengumpulkan data
sesuai dengan yang dibutuhkannya. Secara umum ada beberapa hal yang perlu
diperhatikan dalam menulis butir instrumen. Hal-hal yang perlu diperhatikan di
antaranya adalah sebagai berikut:

a. Butir harus langsung mengukur indikator, yaitu penanda konsep yang berupa
sesuatu kenyataan atau fakta (das solen) seperti keadaan, perasaan, pikiran,
kualitas, kesediaan, dan sebagainya.
b. Jawaban terhadap butir instrumen dapat mengindikasikan ukuran indikator
apakah keadaan responden berada atau dekat ke kutub positif atau ke kutub
negatif. Misalnya jika berada atau dekat ke kutub positif menandakan sikap
positif, motivasi tinggi, produktivitas tinggi, dan seterusnya. Sedang jika berada
atau dekat ke kutub negatif berarti menandakan sikap negatif, motivasi rendah,
produktivitas rendah, dan seterusnya.
c. Butir dapat berbentuk pertanyaan atau pernyataan dengan menggunakan bahasa
yang sederhana, jelas, tidak mengandung tafsiran ganda, singkat dan komunikatif.
d. Opsi dari setiap pertanyaan atau pernyataan itu harus relevan menjawab
pertanyaan atau pernyataan tersebut.

Dari uraian tentang prosedur atau langkah-langkah dalam penyusunan sebuah


instrumen yang baik dapat disimpulkan bahwa prosedur yang harus ditempuh dalam
penyusunan sebuah instrumen yang baik yaitu:

a. Perencanaan
b. Penulisan butir soal
c. Penyuntingan
d. Ujicoba
e. Penganalisaan hasil

[13]
f. Revisi

C. Model Evaluasi Pembelajaran


1. Model Tyler.

Nama model ini diambil dari nama pengembangan yaitu Tyler. Dalam buku
Basic Principle of Curriculum and Instruction. Tyler banyak mengemukakan ide dan
gagasannya tentang evaluasi. Model ini dibangun atas dua dasar pemikiran. Pertama
evaluasi ditujukan pada tingkah laku peserta didik. Kedua evaluasi harus dilakukan
pada tingkah awal peserta didik sebelum melaksanakan kegiatan pembelajaran dan
sesudah melaksanakan kegiatan pembelajaran (hasil). Penggunaan model Tyler
memerlukan informasi perubahan tingkah laku terutama pada saat sebelum dan
sesudah terjadinya pembelajaran. Istilah yang popular di kalangan guru adalah tes
awal (pre test) dan tes akhir (post test). Model Tyler disebut juga nodel black box,
karena model ini sangat menekankan adanya tes awal dan tes akhir. Menurut Tyler
ada tiga langkah pokok yang harus dilakukan yaitu menentukan tujuan pembelajaran
yang akan di evaluasi, menentukan situasi dimana peserta didik memperoleh
kesempatan untuk menunjukan tingkah laku yang berhubungan dengan tujuan, dan
menentukan alat evaluasi yang akan di pergunakan untuk megukur tingkah laku
peserta didik.

2. Model yang berorientasi pada tujuan

Dalam model pembelajaran, kita mengenal adanya tujuan pembelajaran umum


dan tujuan pembelajaran khusus. Model evaluasi ini menggunakan kedua tujuan
tersebut sebagai kriteria untuk menentukan keberhasilan. Evaluasi diartikan sebagai
proses pengukuran untuk mengetahui sejauh manatujuan pembelajaran telah
ditercapai. Model ini dianggap lebih praktis karena menentukan hasil yang diinginkan
dengan rumusan yang dapat diukur. Tujuan model ini adalah menetukan guru
merumuskan tujuan dan menjelaskan hubungan antara tujuan dengan kegiatan. Hasil
evaluasi akan menggambarkan tingkat keberhasilan tujuan program pembelajaran
berdasarkan kriteria program khusus. Kelebihan model ini terletak pada peserta didik
sebgai aspek penting dalam program pembelajaran. Kekurangannya adalah
memmungkinkan terjadikannya proses evaluasi melebihi konsekuensi yang tidak
diharapkan.

[14]
3. Model pengukuran

Model pengukuran (measurement model) banyak mengemukakan pemikiran-


pemikiran dari R. I. Ebel. Sesuai dengan Namanya, model ini sangat menitik beratkan
pada kegiatan pengukuran. Pengukuran digunakan untuk menentukan kuantitas suatu
sifat (attribute) tertentu yang dimiliki oleh objek, orang maupun peristiwa,dalam
bentuk unit ukuran tertentu. Hasil evaluasi digunakan untuk seleksi peserta
didik,bimbingan, dan perencanaan Pendidikan. Obejek evaluasi dalam model ini
adalah tingkah laku peserta didik, mencangkup hasil belajar (kognitif), pembawaan,
sikap, minat, bakat, dan juga spek-aspek kepribadian peserta dididk. Instrument yang
digunakan pada umumnya adalah tes tertulis (paper and pencil test) dalam bentuk tes
objektif, yang cenderung dilakukan. Model ini menggunakan pendekatan penilaian
acuan Norma (norm-refenced assessment).

4. Model kesesuaian (Ralph W. Tyler, John B.Carrol, and Lee J.Cronbach)

Menurut model ini, evaluasi adalah suatu kesiatan untuk melihat


kesesusaian(congruence) antara tujuan dengan hasil belajar yang telah dicapai. Hasil
evaluasi digunakan untuk menyempurnakan sistem bimbingan peserta didik dan untuk
memberikan informasi kepada pihak-pihak yang memerlukan. Objek evaluasi adalah
tingkah laku peseta didik, yaitu perubahan tingkah laku yang diinginkan (intended
behavior) pada akhir kegiatan Pendidikan, baik yang meyangkut aspek kognitif,afektif
,psikomotor. Untuk itunteknik yang dilakuka tidak hanya tes (tulisan,lisan,perbuatan)
tetapi juga non-test (obsevasi ,wawncara,skala sikap,dan sebagainya). Adapun
langkah-langkah yang harus ditempuh dalam model evaluasi ini adalah meeumuskan
tujuan tingkah laku (nehavioural objectives), menetukan situasi di mana peseta didik
dapatb memperlihatkan tingkah laku yang akan dievaluasi, menyusun alat evaluasi
dan menggunakan hasil evaluasi. Oleh sebab itu model ini menekankan pada
pendekatan penilaian acuan patokan (criterion-referenced assessment).

5. Evaluasi Model CIPP

Model evaluasi ini banyak dikenal dan diterapkan oleh para evaluator. Konsep
evaluasi model CIPP (Context, Input, Process and Product) pertama kali dikenalkan
oleh Stufflebeam pada 1965 sebagai hasil usahanya mengevaluasi ESEA (the
Elementary and Secondary Education Act). Menurut Madaus, Scriven, Stufflebeam,
tujuan penting evaluasi model ini adalah untuk memperbaiki, dikatakan: “the CIPP
[15]
approach is based on the view that the most important purpose of evaluation is not to
prove but to improve". Evaluasi model Stufflebeam terdiri dari empat dimensi, yaitu:
context, input, process, dan product, sehingga model evaluasinya diberi nama CIPP.
Keempat kata yang disebutkan dalam singkatan CIPP tersebut merupakan sasaran
evaluasi, yaitu komponen dan proses sebuah program kegiatan.

a) Evaluasi Konteks (Context Evaluation)


Banyak rumusan evaluasi konteks yang dinyatakan oleh para ahli
evaluasi, di antaranya adalah Sax. Ia menjelaskan bahwa evaluasi konteks adalah:
Context evaluation is the delineation and specification of project‟s environment,
its unmet needs, the population and sample of individuals to be served, and the
project objectives. Context evaluation provides a rationale for justifying a
particular type of program intervention. Inti dari kutipan di atas yaitu evaluasi
konteks adalah kegiatan pengumpulan informasi untuk menentukan tujuan,
mendefinisikan lingkungan yang relevan. Sejalan dengan Sax, Stufflebeam &
Shinkfield lebih lanjut menjelaskan bahwa evaluasi konteks: To assess the
object‟s overall status, to identify its deficiencies, to identify the strengths at hand
that could be used to remedy the deficiencies, to diagnose problems whose
solution would improve the object‟s well-being, and, in general, to characterize
the program‟s environment. A context evaluation also is aimed at examining
whether existing goals and priorities are attuned to the needs of whoever is
supposed to be served. Inti dari kutipan Stufflebeam & Shinkfield di atas dapat
dipahami bahwa evaluasi konteks berusaha mengevaluasi status objek secara
keseluruhan, mengidentifikasi kekurangan, kekuatan, mendiagnosa problem, dan
memberikan solusinya, menguji apakah tujuan dan prioritas disesuaikan dengan
kebutuhan yang akan dilaksanakan.
b) Evaluasi Masukan (Input Evaluation)

Menurut Stufflebeam & Shinkfield orientasi utama evaluasi input adalah


menentukan cara bagaimana tujuan program dicapai. Evaluasi masukan dapat
membantu mengatur keputusan, menentukan sumber-sumber yang ada, alternatif
apa yang diambil, apa rencana dan strategi untuk mencapai tujuan, bagaimana
prosedur kerja untuk mencapainya. Komponen evaluasi masukan meliputi: (a)
sumber daya manusia (b) sarana dan peralatan pendukung, (c) dana/anggaran, dan
(d) berbagai prosedur dan aturan yang diperlukan.

[16]
c) Evaluasi Proses (Process Evaluation)

Menurut Stufflebeam & Shinkfield esensi dari evaluasi proses adalah:


mengecek pelaksanaan suatu rencana/program. Tujuannya adalah untuk
memberikan feedback bagi manajer dan staf tentang seberapa aktivitas program
yang berjalan sesuai dengan jadwal, dan menggunakan sumber-sumber yang
tersedia secara efisien, memberikan bimbingan untuk memodifikasi rencana agar
sesuai dengan yang dibutuhkan, mengevaluasi secara berkala seberapa besar yang
terlibat dalam aktifitas program dapat menerima dan melaksanakan peran atau
tugasnya. Senada dengan Stufflebeam & Shinkfield, Worthen & Sanders,
menjelaskan bahwa evaluasi proses menekankan pada tiga tujuan:

 Do detect or predict in procedural design or its implementation during


implementation stage,
 To provide information for programmed decisions, and
 To maintain a record of the procedure as it occurs. Evaluasi proses
digunakan untuk mendeteksi atau memprediksi rancangan prosedur atau
rancangan implementasi selama tahap implementasi, menyediakan informasi
untuk keputusan program, dan sebagai rekaman atau arsip prosedur yang
telah terjadi. Evaluasi proses meliputi koleksi data penilaian yang telah
ditentukan dan diterapkan dalam praktik pelaksanaan program.

d) Evaluasi Hasil (Product Evaluation)

Stufflebeam & Shinkfield menjelaskan bahwa tujuan dari Product


Evaluation adalah: untuk mengukur, menafsirkan, dan menetapkan pencapaian
hasil dari suatu program, memastikan seberapa besar program telah memenuhi
kebutuhan suatu kelompok program yang dilayani. Sedangkan menurut Sax
fungsi evaluasi hasil adalah “…to make decision regarding continuation,
termination, or modification of program”. Jadi, fungsi evaluasi hasil adalah
membantu untuk membuat keputusan yang berkenaan dengan kelanjutan, akhir
dan modifikasi program, apa hasil yang telah dicapai, serta apa yang dilakukan
setelah program itu berjalan.

Berdasarkan beberapa pendapat di atas, dapat diketahui bahwa evaluasi


produk merupakan penilaian yang dilakukan untuk mengukur keberhasilan dalam

[17]
pencapaian tujuan yang telah ditetapkan. Data yang dihasilkan akan sangat
menentukan apakah program diteruskan, dimodifikasi atau dihentikan. Model
CIPP saat ini disempurnakan dengan satu komponen O, singkatan dari outcome,
sehingga menjadi model CIPPO. Bila model CIPP berhenti pada mengukur
output, sedangkan CIPPO sampai pada implementasi dari output.

Dibandingkan dengan model-model evaluasi yang lain, model CIPP


memiliki beberapa kelebihan antara lain: lebih komprehensif, karena objek
evaluasi tidak hanya pada hasil semata tetapi juga mencakup konteks, masukan
(input), proses, maupun hasil. Selain memiliki kelebihan, model CIPP juga
memiliki keterbatasan, antara lain penerapan model ini dalam bidang program
pembelajaran di kelas perlu disesuaikan atau modifikasi agar dapat terlaksana
dengan baik. Sebab untuk mengukur konteks, masukan maupun hasil dalam arti
yang luas banyak melibatkan pihak, membutuhkan dana yang banyak dan waktu
yang lama. .

6. Evaluasi Model Provus (Discrepancy Model)

Kata discrepancy berarti kesenjangan, model ini menurut Madaus, Sriven &
Stufflebeam berangkat dari asumsi bahwa untuk mengetahui kelayakan suatu
program, evaluator dapat membandingkan antara apa yang seharusnya diharapkan
terjadi (standard) dengan apa yang sebenarnya terjadi (performance). Dengan
membandingkan kedua hal tersebut, maka dapat diketahui ada tidaknya kesenjangan
(discrepancy), yaitu standar yang ditetapkan dengan kinerja yang sesungguhnya.
Model ini dikembangkan oleh Malcolm Provus, bertujuan untuk menganalisis suatu
program apakah program tersebut layak diteruskan, ditingkatkan, atau dihentikan.

Model ini menekankan pada terrumuskannya standard, performance, dan


discrepancy secara rinci dan terukur. Evaluasi program yang dilaksanakan oleh
evaluator mengukur besarnya kesenjangan yang ada di setiap komponen program.
Dengan adanya penjabaran kesenjangan pada setiap komponen program, maka
langkah-langkah perbaikan dapat dilakukan secara jelas.

7. Evaluasi Model Stake (Countenance Model)

Model ini dikembangkan oleh Robert E. Stake dari University of Illinois.


Menurut Worthen & Sanders, Stake menekankan adanya dua dasar kegiatan dalam

[18]
evaluasi, yaitu description dan judgment, dan membedakan adanya tiga tahap, yaitu:
antecedent (context), transaction/process, dan outcomes. Deskripsi menyangkut dua
hal yang menunjukkan posisi sesuatu yang menjadi sasaran evaluasi, yaitu: apa tujuan
yang diharapkan oleh program, dan apa yang sesungguhnya terjadi. Evaluator
menunjukkan langkah pertimbangan yang mengacu pada standar.

Stufflebeam & Shinkfield menjelaskan tiga tahap evaluasi program model


Stake, yaitu: antecedents, transaction, dan outcomes. Antecedents mengacu pada
informasi dasar yang terkait, kondisi/kejadian apa yang ada sebelum implementasi
program. Menurut Stake, informasi pada tipe ini misalnya, terkait dengan kegiatan
belajar mengajar sebelumnya, dan terkait dengan outcome, seperti: apakah siswa telah
makan pagi sebelum datang ke sekolah, apakah siswa telah menyelesaikan pekerjaan
rumahnya, apakah siswa tidur malam dengan cukup. Untuk mendeskripsikan secara
lengkap dan menetapkan sebuah program atau pembelajaran pada suatu waktu. Stake
mengusulkan bahwa evaluator harus mengidentifikasi dan menganalisis kondisi yang
berhubungan dengan antecendent.

Pada tahap transactions, apakah yang sebenarnya terjadi selama program


dilaksanakan, apakah program yang sedang dilaksanakan itu sesuai dengan rencana
program. Termasuk tahap ini adalah informasi yang dialami oleh peserta didik
berkaitan dengan guru, orang tua, konselor, tutor, dan peserta didik lainnya. Stake
menganjurkan kepada evaluator agar bertindak secara bijak dalam proses pelaksanaan
evaluasi, sehingga dapat melihat aktualisasi program. Sedangkan outcomes, berkaitan
dengan apa yang dicapai dengan program tersebut, apakah program itu dilaksanakan
sesuai dengan yang diharapkan termasuk di dalamnya: kemampuan, prestasi, sikap
dan tujuan. .

8. Evaluasi Model Kirkpatrick

Model evaluasi yang dikembangkan oleh Kirkpatrick ini telah mengalami


beberapa penyempurnaan, terakhir diperbarui tahun 1998 yang dikenal dengan
Evaluating Training Programs: the Four Levels atau Kirkpatrick‟s evaluation model.
Evaluasi terhadap program pelatihan mencakup empat level evaluasi, yaitu:.

a) Evaluasi Reaksi (Reaction Evaluation)

[19]
Catalanello & Kirkpatrick menjelaskan bahwa evaluasi terhadap reaksi
peserta pelatihan berarti mengukur kepuasan peserta. Program pelatihan dianggap
efektif apabila proses pelatihan dirasa menyenangkan peserta, sehingga mereka
tertarik dan termotivasi untuk belajar dan berlatih. Sebaliknya, apabila peserta
tidak merasa puas terhadap proses pelatihan yang diikutinya, maka mereka tidak
akan termotivasi untuk mengikuti pelatihan lebih lanjut. Keberhasilan proses
kegiatan pelatihan tidak terlepas dari minat, perhatian, dan motivasi peserta dalam
mengikuti jalannya kegiatan ini. Orang akan belajar lebih baik manakala mereka
memberi reaksi positif terhadap lingkungan belajar. Kepuasan peserta dapat dikaji
dari beberapa aspek, yaitu materi yang diberikan; fasilitas yang tersedia; strategi
penyampaian materi yang digunakan media pembelajaran; jadwal kegiatan,
sampai menu dan penyajian konsumsi yang disediakan. Instrumen untuk
mengukur reaksi antara lain dengan reaction sheet dalam bentuk angket. Menurut
Kirkpatrick dalam menentukan instrumen tersebut dapat digunakan prinsip
mampu mengungkap informasi sebanyak mungkin; tetapi dalam pengisiannya
seefisien mungkin. Evaluasi pada level ini difokuskan pada reaksi peserta yang
terjadi pada saat kegiatan dilakukan, disebut juga sebagai evaluasi proses
pelatihan. .

b) Evaluasi Belajar (Learning Evaluation)

Menurut Kirkpatrick & Kirkpatrick evaluasi hasil belajar dapat dilihat


pada perubahan sikap, perbaikan pengetahuan, dan atau peningkatan keterampilan
peserta setelah selesai mengikuti program. Peserta program dikatakan telah
belajar apabila pada dirinya telah mengalami perubahan sikap, perbaikan
pengetahuan maupun peningkatan keterampilan. Untuk mengukur efektivitas
program maka ketiga aspek tersebut perlu untuk diukur. Tanpa adanya perubahan
sikap, peningkatan pengetahuan maupun perbaikan keterampilan pada peserta
training maka program dapat dikatakan gagal. Penilaian ini ada yang rnenyebut
dengan penilaian hasil (output) belajar. Oleh karena itu, dalam pengukuran hasil
belajar harus menentukan:

(a) pengetahuan apa yang telah dipelajari

(b) perubahan sikap apa yang telah dilakukan

[20]
(c) keterampilan apa yang telah dikembangkan atau diperbaiki.

Mengukur hasil belajar membutuhkan waktu yang lama jika


dibandingkan dengan mengukur reaksi. Mengukur reaksi dapat dilakukan dengan
reaction sheet dalam bentuk angket. Menurut Kirkpatrick & Kirkpatrick
penilaian terhadap hasil belajar dapat dilakukan dengan dengan kelompok
pembanding. Kelompok yang ikut pelatihan dan kelompok yang tidak ikut
pelatihan perkembangannya diperbandingkan dalam periode waktu tertentu. Di
samping itu, penilaian terhadap hasil belajar dapat juga dilakukan dengan
membandingkan hasil pre test dengan post test, tes tertulis maupun tes kinerja.

c) Evaluasi Perilaku (Behavior Evaluation)

Penilaian difokuskan pada perubahan tingkah laku setelah peserta


kembali ke tempat kerja, disebut juga evaluasi terhadap outcomes dan kegiatan
pelatihan. Perubahan apa yang terjadi di tempat kerja setelah peserta mengikuti
program tersebut, baik menyangkut pengetahuan, sikap maupun keterampilannya.
Menurut Kirkpatrick & Kirkpatrick, evaluasi perilaku dapat dilakukan dengan:

 Membandingkan perilaku kelompok kontrol dengan perilaku peserta program


 Membandingkan perilaku sebelum dan sesudah mengikuti program maupun,
 Survei/interview dengan pelatih, atasan maupun bawahan peserta program
setelah kembali ke tempat kerja.

d) Evaluasi Hasil (Result Evaluation)

Evaluasi pada tahap ini difokuskan pada hasil akhir yang terjadi karena
peserta telah mengikuti suatu program. Beberapa contoh dari hasil akhir dalam
konteks perusahaan antara lain: kenaikan produksi, peningkatan kualitas,
penurunan biaya, penurunan kecelakaan kerja, kenaikan keuntungan. Cara
melakukan evaluasi hasil akhir menurut Kirkpatrick & Kirkpatrick adalah
dengan: (1) membandingkan kelompok kontrol dengan kelompok peserta
program, (2) mengukur kinerja sebelum dan setelah mengikuti pelatihan, (3)
membandingkan biaya yang digunakan dengan keuntungan yang didapat setelah
dilakukan pelatihan, dan bagaimana peningkatannya.

[21]
Evaluasi program model Kirkpatrick dapat diterapkan dalam program
pembelajaran di sekolah, karena: (1) fokusnya sama, yaitu diarahkan pada proses
dan hasil belajar dengan mengikuti suatu program, (b) perubahan pembelajaran
pada empat level sama-sama diarahkan pada aspek pengetahuan, sikap, dan
kecakapan. Namun demikian, penerapan evaluasi model ini dalam program
pembelajaran perlu dimodifikasi dengan setting sekolah.

Pertama, evaluasi terhadap outcome maupun impact kegiatan


pembelajaran di kelas sulit untuk dilakukan, karena sekolah sulit memonitor
sejauhmana peserta didik mampu mengaplikasikan pengetahuan maupun
kecakapan yang diperolehnya dalam kegiatan pembelajaran di sekolah, maupun
di tengah masyarakat dalam waktu tertentu. Sebab untuk menjangkau pada level
ini membutuhkan waktu yang lama, tenaga dan biaya yang besar, terlebih lagi
dilanjutkan pada evaluasi dampak. Kedua, fokus program pembelajaran pada
setting sekolah dapat diarahkan pada kompetensi yang telah ditentukan.

Menurut Holton dan Praslova, kekuatan dari model ini adalah


kesederhanaan model, kemampuannya membantu memperjelas kriteria, dan
membuat indikator penilaian. Dengan adanya kejelasan kriteria dan indikator
yang sudah ditetapkan, maka capaian suatu program akan dapat diukur dengan
baik. Model ini dapat diterapkan untuk mengevaluasi program pembelajaran di
sekolah, bahkan pada level yang lebih kecil, misalnya kelas dan suatu program
tertentu. Model ini juga memiliki beberapa kelemahan, jika diterapkan dalam
setting sekolah. Oleh karena itu, harus ada penyesuaian dan modifikasi, sehingga
tujuan evaluasi program suatu sekolah dapat tercapai dengan penggunaan model
ini.

Menurut Bates, Alliger & Janak model ini terlalu menyederhanakan


efektivitas pelatihan, karena tidak mempertimbangkan individu atau pengaruh
kontekstual dalam evaluasi program. Padahal karakteristik organisasi, lingkungan
kerja/sekolah, dan karakteristik individu peserta pelatihan--sebagai masukan
penting dari input--turut mempengaruhi efektivitas proses dan hasil pelatihan.
Sedangkan model Kirkpatrick ini secara implisit mengasumsikan bahwa
pemeriksaan faktor-faktor ini tidak penting bagi evaluasi program yang efektif. .

9. Evaluasi Model Brinkerhoff

[22]
Brinkerhoff, et.al. mengemukakan tiga pendekatan evaluasi yang disusun
berdasarkan penggabungan elemen-elemen yang sama, yaitu:

a) Fixed vs Emergent Evaluation Design.

Desain evaluasi yang baik ditentukan dan direncanakan secara sistematik


sebelum implementasi dikerjakan. Desain dikembangkan berdasarkan tujuan
program disertai seperangkat pertanyaan yang akan dijawab dengan informasi
yang akan diperoleh dari sumber-sumber tertentu. Rencana analisis dibuat
sebelumnya yang pemakainya akan menerima informasi seperti yang telah
ditentukan dalam tujuan. Desain ini dapat disesuaikan dengan kebutuhan yang
mungkin berubah.

b) Formative vs Sumative Evaluation

Evaluasi formatif digunakan untuk memperoleh informasi yang dapat


membantu memperbaiki program, dilaksanakan pada saat implementasi program
sedang berjalan. Fokus evaluasi berkisar pada kebutuhan yang telah dirumuskan
oleh evaluator. Evaluasi sumatif dilaksanakan untuk menilai manfaat suatu
program, dari hasil evaluasi ini dapat ditentukan apakah suatu program tertentu
akan diteruskan atau dihentikan. Pada evaluasi sumatif difokuskan pada variabel
yang dianggap penting bagi pembuat keputusan. Waktu pelaksanaan evaluasi
sumatif pada akhir pelaksanaan program.

c) Experimental & Quasi-Experimental Designs vs. Unobtrusive Inquiry.

Beberapa evaluasi memakai metodologi penelitian klasik. Dalam hal


seperti ini subjek penelitian diacak, perlakuan diberikan dan pengukuran dampak
dilakukan. Tujuan dari penelitian untuk menilai manfaat suatu program yang
dicobakan. Apabila siswa atau program dipilih secara acak, maka generalisasi
dibuat pada populasi yang agak lebih luas. Dalam beberapa hal intervensi tidak
mungkin dilakukan atau tidak dikehendaki. Apabila proses sudah diperbaiki,
evaluator harus melihat dokumen-dokumen, seperti mempelajari nilai tes atau
menganalisis penelitian yang dilakukan dan sebagainya. Strategi pengumpulan
data terutama menggunakan instrumen formal seperti tes, survey, kuesioner serta
memakai metode penelitian yang terstandar.

[23]
Selain berbagai model di atas, Nana Sudjana & Ibrahim mengelompokkan
model-model evaluasi pendidikan menjadi empat kelompok berdasarkan
perkembangannya, yaitu: measurement model, congruence model, educational
system evaluation model dan illuminative model.

10. Measurement Model

Model ini dapat dipandang sebagai model yang tertua di dalam sejarah
penilaian dan lebih banyak dikenal di dalam proses penilaian pendidikan. Tokoh-
tokoh penilaian yang dipandang sebagai pengembang model ini adalah R. Thorndike
dan R.I. Ebel. Sesuai dengan namanya, model ini sangat menitikberatkan peranan
kegiatan pengukuran di dalam melaksanakan proses evaluasi. Pengukuran dipandang
sebagai suatu kegiatan yang ilmiah dan dapat diterapkan dalam berbagai bidang
persoalan termasuk ke dalam bidang pendidikan. Pengukuran, menurut model ini
tidak dapat dilepaskan dari pengertian kuantitas atau jumlah. Jumlah ini akan
menunjukkan besarnya (magnitude) objek, orang ataupun peristiwa sehingga dengan
demikian hasil pengukuran itu selalu dinyatakan dalam bentuk bilangan.

Pengukuran dengan demikian dipandang sebagai kegiatan menentukan


besarnya suatu sifat (attribute) tertentu yang dimiliki objek, orang, dan peristiwa
dalam bentuk unit ukuran tertentu. Dalam bidang pendidikan, model ini telah
diterapkan dalam proses penilaian untuk melihat dan mengungkapkan perbedaan-
perbedaan individual maupun perbedaan-perbedaan kelompok dalam hal kemampuan
serta minat dan sikap. Hasil pengukuran mengenai aspek-aspek tingkah laku di atas
digunakan untuk keperluan seleksi siswa, bimbingan, dan perencanaan pendidikan
bagi siswa itu sendiri.

11. Congruence Model

Model yang ini dipandang sebagai reaksi terhadap model yang pertama,
sekalipun dalam beberapa hal masih menunjukkan adanya persamaan dengan model
yang pertama. Tokoh-tokoh evaluasi yang merupakan pengembangan model ini antara
lain W. Tyler, John B. Carrol, dan Lee J. Cronbach. Tyler menggambarkan
pendidikan sebagai suatu proses yang di dalamnya terdapat tiga hal yaitu: tujuan
pendidikan, pengalaman belajar, dan penilaian terhadap hasil belajar. Kegiatan
evaluasi dimaksudkan sebagai kegiatan untuk melihat sejauh mana tujuan-tujuan

[24]
pendidikan telah dapat dicapai siswa dalam bentuk hasil belajar yang mereka
perlihatkan pada akhir kegiatan pendidikan. Mengingat tujuan pendidikan
mencerminkan perubahan-perubahan tingkah laku yang diinginkan pada anak didik,
maka yang penting dalam proses evaluasi adalah memeriksa sejauhmana perubahan-
perubahan tingkah laku yang diinginkan itu telah terjadi pada anak didik.

Dengan diperolehnya informasi tentang pencapaian tujuan pendidikan yang


telah dicapai oleh siswa, baik secara individual maupun secara kelompok, dapat
diambil keputusan tentang tindakan-tindakan apa yang perlu diambil. Tindak lanjut
hasil evaluasi yang menyangkut kepentingan siswa tersebut, misalnya: memberikan
layanan atau bimbingan untuk memperbaiki hasil yang telah dicapai, memberikan
pengayaan materi, dan merencanakan program lain bagi masing-masing siswa.
Ditinjau dari kepentingan sistem pendidikan, hasil evaluasi dimaksudkan sebagai
umpan balik untuk kebutuhan memperbaiki bagian-bagian sistem yang masih lemah.

Selain untuk kepentingan bimbingan siswa dan perbaikan sistem, evaluasi ini
dimaksudkan pula untuk memberikan informasi kepada pihak-pihak di luar
pendidikan tentang sejauh mana tujuan-tujuan yang diinginkan itu telah dapat dicapai
oleh sistem pendidikan yang ada. Secara singkat dapat dikatakan bahwa model
evaluasi berusaha memeriksa persesuaian (congruence) antara tujuan-tujuan
pendidikan yang diinginkan dengan hasil belajar yang telah dicapai.

12. Illuminative Model

Model illuminatif ini lebih menekankan pada penilaian kualitatif. Tujuan


evaluasi model ini adalah mengadakan studi yang cermat terhadap sistem maupun
program yang bersangkutan, yang meliputi:

(1) Bagaimana implementasi program di lapangan

(2) Bagaimana implementasi dipengaruhi oleh situasi sekolah tempat program yang
bersangkutan dikembangkan

(3) Apa kebaikan-kebaikan dan kelemahan-kelemahannya dan bagaimana program


tersebut mempengaruhi pengalamam-pengalaman belajar para siswa. Hasil
evaluasi yang dilaporkan bersifat deskripsi dan interpretasi, bukan pengukuran

[25]
dan prediksi. Oleh karena itu, dalam pelaksanaan evaluasi model yang keempat
ini lebih banyak menekankan pada penggunaan judgement.

Perbedaan penelitian dengan penelitian evaluasi adalah adanya kriteria pada


penelitian evaluasi. Berdasarkan kriteria, peneliti pada penelitian evaluasi
memberikan nilai terhadap objek yang ditelitinya. Menilai kriteria keefektifan suatu
model evaluasi program tidak dapat dilepaskan dari tujuan/fungsi evaluasi program.
Evaluasi program mempunyai fungsi menyediakan informasi yang digunakan untuk
membantu pembuatan keputusan/penyusunan kebijakan maupun penyusunan program
selanjutnya. Agar keputusan yang dihasilkan merupakan keputusan yang baik, maka
dibutuhkan informasi yang lengkap, akurat, dan dapat dipercaya (valid, dan reliable)
serta tepat waktu (timely). Informasi yang lengkap mempunyai makna bahwa
informasi yang dihasilkan dari evaluasi mencakup komponen-komponen program
secara lengkap. Informasi yang akurat mempunyai makna bahwa informasi yang
dihasilkan dari evaluasi merupakan informasi yang tepat menggambarkan keadaan
yang sebenarnya dari objek evaluasi dan dapat dipercaya. Untuk mendapatkan
informasi yang akurat dibutuhkan instrumen pengumpulan data yang valid dan
reliable.

Informasi yang tepat waktu mempunyai makna bahwa informasi yang


diperoleh dari hasil evaluasi dapat disampaikan kepada pihak-pihak yang
membutuhkan, untuk mengambil keputusan, menyusun kebijakan maupun menyusun
program selanjutnya. Syarat ketepatan waktu ini berkaitan dengan kepraktisan dalam
pengumpulan, pengolahan, dan penyajian/pelaporan informasi. Hal ini membutuhkan
panduan evaluasi yang sederhana dan mudah dipahami oleh pemakai model evaluasi,
sehingga proses evaluasi dapat berlangsung lebih cepat tanpa mengabaikan
kelengkapan dan keakuratan informasi. Jadi model evaluasi program yang baik
adalah:

a) Bersifat komprehensif, menyangkut semua komponen/subkomponen


program, baik input, proses, output, dan outcome
b) Praktis, yaitu mudah dalam penggunaan dan pengelolaan
c) Ekonomis, yaitu membutuhkan biaya relatif sedikit, demikian halnya
dengan waktu dan tenaga
d) Instrumen pengumpulan data valid dan reliabel.

[26]
13. Model Logik (Logic Model)
Model logik adalah suatu penggambaran program yang logis dan tepat
menurut kondisi tertentu dalam rangka memecahkan problem. Pada umumnya bentuk
penggambaran menggunakan diagram alur yang menjelaskan aktivitas yang
direncanakan dan outcome yang diharapkan dari model evaluasi ini. Senada dengan
pendapat di atas, W.K. Kellogg Foundation menjelaskan bahwa: basically, a logic
model is a systematic and visual way to present and share your under standing of the
relationships among the resources you have to operate program, the activities you
plan, and the changes or results you hope to achieve. Kekhasan dari model logik
adalah penggunaan tabel dan grafik alir yang berisi input, aktivitas, dan hasil.
Sebagian besar menggunakan teks dan anak panah atau grafik untuk menggambarkan
urutan aktivitas untuk menghasilkan perubahan, dan bagaimana aktivitas tersebut
terhubung dengan hasil program yang diharapkan tercapai. Dibutuhkan keputusan
yang tepat sebelum menggunakan model logik, karena penyusunan model logik
merupakan hal yang kompleks dan menyangkut satu dari tiga pendekatan, yaitu:
pendekatan model (conceptual), pendekatan outcomes, dan pendekatan aktivitas
(applied) atau merupakan campuran dari beberapa tipe di atas.
Model logik telah banyak digunakan dalam berbagai bidang semenjak tahun
1980-an dan awal 1990-an. Sebagai contoh, model logik telah digunakan untuk
menggambarkan program di bidang pendidikan, kesehatan, pembangunan
internasional, kerja sosial, pelayanan sosial, serta bidang-bidang lain.Elemen model
logik yang penting menurut United Way of America (1996) terdiri dari tiga bagian,
yaitu: inputs, outputs (activities and participants or methodology), and outcomes.
Inputs berkaitan dengan sumber-sumber penting yang akan ditanamkan dalam
program (what we invest), outputs berkaitan dengan aktivitas apa yang dijalankan
(what we do, and who we reach) dan outcome berkaitan dengan pengaruh atau
perubahan yang diinginkan dengan adanya program yang dijalankan. Agar model
logik lebih fokus, maka perlu dibuat cakupannya, misalnya menyangkut jangka waktu
program dilaksanakan, jangka waktu output dan outcomes yang dikehendaki, dan
bentuk perubahan yang diinginkan.

[27]
BAB III

PENUTUP

A. Kesimpulan

Suatu kegiatan evaluasi pembelajaran dapat dikatakan berhasil jika dilakukan


melalui beberapa prosedur pengembangan evaluasi pembelajaran, di antara prosedur
tersebut adalah ; perencanaan evaluasi, monitoring pelaksanaan evaluasi, pengolahan
data dan analisi, pelaporan hasil evaluasi, dan penggunaan hasil evaluasi.

Dalam mencapai tujuan penelitian, memecahkan masalah penelitian ataupun


pengambilan sebuah keputusan diperlukannya alat-alat yang digunakan untuk
memperoleh atau mengumpulkan data dan alat-alat tersebut bias disebut juga dengan
instrument penelitian. Tahap-tahap umum dalam pengembangan atau penyusunan sebuah
isntrumen yaitu planning, construction, quantitative evaluation, dan validation.
Berkaitan dengan instrumen penelitian, peneliti perlu memahami bagaimana
mengembangkan instrumen penelitian yang diperlukan untuk mengumpulkan data sesuai
dengan yang dibutuhkannya. Dari uraian tentang prosedur atau langkah-langkah dalam
penyusunan sebuah instrumen yang baik dapat disimpulkan bahwa prosedur yang harus
ditempuh dalam penyusunan sebuah instrumen yang baik yaitu:

1. Perencanaan
2. Penulisan butir soal
3. Penyuntingan
4. Ujicoba
5. Penganalisaan hasil
6. Revisi

Terdapat beberapa macam model evaluasi pembelajaran, diantaranya.:

1. Model Tyler.
2. Model yang berorientasi pada tujuan
3. Model pengukuran
4. Model kesesuaian (Ralph W. Tyler, John B.Carrol, and Lee J.Cronbach)
5. Evaluasi Model CIPP
6. Evaluasi Model Provus (Discrepancy Model)

[28]
7. Evaluasi Model Stake (Countenance Model)
8. Evaluasi Model Kirkpatrick
9. Evaluasi Model Brinkerhoff
10. Measurement Model
11. Congruence Model
12. Illuminative Model
13. Model Logik (Logic Model)

B. Saran
Demikianlah makalah ini kami susun, semoga dapat bermanfaat semua pihak,
khususnya bagi pembaca Dalam penyusunan makalah ini tentunya banyak kesalahan
baik yang di sengaja maupun tidak di sengaja serta jauh dari kata sempurna. Oleh sebab
itu, kami mohon kritik dan saran dari semua pihak supaya dalam penyusunan makalah
berikutnya menjadi lebih baik. Semoga makalah ini dapat memberikan pengetahuan
kepada kita semua.

[29]
Daftar Pustaka

Arifin,zainal.2016.Evaluasi Pembelajaran.Bandung: PT remaja Posdakarya.

Arikunto. S.2006.Prosedur Penelitian suatu pendekatan praktik.Jakarta: Rineka Cipta.

Colton, D., and Covert, R.W.2007.Designing and ConstructingInstruments for social


research and Evaluation.San Fransisco: John wiley and Sons Inc.
Cresswell, Jhon W.2012.Eduactional Research: Planning, Conducting, and Evaluating
Quantitative and Qualitative Research.Ney Jersey: Person Education, Inc.
Djali. H., Muljono P.2007.Pengukuran Dalam Bidang Pendidikan.Jakarta: Grasindo.
Gall, M.D., Gall, J.P. and Borg, W.R.2003.Educational Research: An Introduction, Seventh
Edition.New York: Pearson education Inc.
Kellogg, W.K. Foundation.2004.Using logic models to bring planning, evaluation, and
action.Michigan: WK Kellogg Foundation. Dikutip pada tanggal 22 februari 2020,
dari http://www.wkkf.org.

[iii]

Anda mungkin juga menyukai