Kapita Selekta

Pertemuan ke-1 : Topik Diskusi Karakteristik Evaluasi, Penelitian,
Pengembangan, Assesmen Dalam Pembelajaran
1.1 Evaluasi
Batasan konseptual evaluasi adalah suatu kegiatan atau tindakan
yang sistematik dalam upaya menjaring dan menganalisis informasi atau
data yang relevan dengan teknik tertentu untuk membuat keputusan yang
terkait dengan tingkat efektifitas, efisiensi, dan kemenarikan suatu progam
yang dikembangkan untuk mencapai tujuan. Indikator langkah eksplisit
dalam konteks evaluasi adalah adanya kejelasan peran komponen dan
kejelasan tahapan-tahapan proses yang harus dilakukan dan dapat
direplikasi oleh pihak lain dalam upaya mencapai suatu tujuan (Hicks,
1981), yang wujud upayanya menetapkan konteks dan ranah yang dijadikan
objek suatu evaluasi, menentukan dimensi atau aspek yang akan dievaluasi,
mengidentifikasi berbagai data dan atau informasi yang diperlukan,
mengembangkan alat ukur (instrument) pengumpulan data atau informasi,
menentukan tolak ukur, mencari, mengolah, menganalisis dengan teknik
tertentu (Mukhadis, 2013).
Wujud progam dalam evaluasi berupa progam pembelajaran,
progam pelatihan, progam suatu proyek, progam pendidikan, progam
pengentasan kemiskinan, progam pemberdayaan masyarakat dan
sebagainya. Bila dipandang dari sudut sistem sebagai konteks
pengembangan suatu progam, kegiatan evaluasi dapat dikenakan pada pusat
sistem (tidak harus nasional) sampai tingkat lesson (operasional dari setiap
dimensi sistem). Sedangkan dari sisi komponen-komponen progam yang
dijadikan sasaran evaluasi dapat pada lingkup tahapan perencanaan, tahapan
pelaksanaan, tahapan evaluasi, dan tahapan hasil program dengan
seperangkat dimensi dan indikatornya (Mukhadis, 2013).
1.2 Penelitian
Penelitian merupakan upaya sistematik dan komprehensif untuk
menggali, memperoleh, menganalisis, menginterpretasikan, menghasilkan,
memanfaatkan, dan menyebarluaskan ilmu pengetahuan, teknologi, dan seni
(ipteks) yang benar dan dapat dipertanggung-jawabkan secara metodologis.
Aktifitas penelitian di bidang ipteks ditandai dengan upaya yang bersifat
sistematik, adanya sesuatu hasil temuan, adanya kebermanfaatan, dan
adanya tindak lanjut yang diakhiri dengan penyebarluasan temuan atau
pengurusan dan pemberian atau pengakuan hak atas kekayaan intelektual
(Haki), baik berupa hak cipta maupun hak paten. Penelitian mempunyai tiga
jenis yaitu pendekatan penelitian secara kuantitatif, pendekatan penelitian
secara kualitatif, dan pendekatan penelitian secara kuantilatif (Mukhadis,
2013).
Muara akhir dari upaya kegiatan penelitian ilmiah (apakah
menggunakan pendekatan kuantitatif, kualitatif, atau kuantilatif, mixed
method) berorientasi lebih ke arah pada untuk mengetahui (to know),
menjelaskan (to explain), mengkontruksi proposisi (to construct) sebagai
representasi jawaban atas permasalahan yang dipecahkan berdasarkan data
empirik di lapangan (Mukhadis, 2013).
1.3 Pengembangan
Ditinjau dari substansi masalah dan pertimbangan kemanfaatan dari
aktivitas pengembangan lebih mengarah dan berorientasi pada fenomena
masalah-masalah nyata pada latar tertentu (real problem). Latar masalah
dalam konteks ini dapat berupa pelaksanaan suatu program, suatu institusi,
atau suatu sistem atau nahkan suatu organisasi tertentu. Substansi masalah
yang cocok melalui kegiatan pengembangan adalah masalah-masalah nyata
karena keberadaannya akan berpotensi kurang mendukung terhadap
optimnalisasi proses pelaksanaan dan pencapaian hasil suatu program dari
suatu institusi atau suatu sistem atau suatu organisasi. Indikator dari prioritas
masalah program pengembangan adalah adanya kesenjangan yang nyata
antara sesuatu yang dirancang (proses atau hasil) dalam suatu program dan
keberlangsungan proses dan hasil yang dicapai dalam ukuran interval waktu
tertentu (dapat diawal, ditengah, ataupun di akhir). Aktivitas pengembangan
dalam konteks pemecahan masalah merupakan suatu upaya atau suatu
proses sitematik untuk menghasilkan produk (bisa berwujud sistem, model,
peralatan, atau prosedur operasional) sebagai representasi wahana dalam
pemecahan masalah berdasarkan prinsip-prinsip tertentu pada ranah
masalah yang dipecahkan. Hasil dari suatu aktivitas pengembangan dapat
dipilah menjadi dua yaitu menghasilkan prototipe produk yang teruji dan
atau uji efektivitas prototipe hasil pengembangan. Kerangka pikir dalam
kegiatan pengembangan yaitu kegiatan studi pendahuluan, kegiatan
menentukan dan mengembangkan prototipe model, dan terakhir melakukan
kegiatan uji efektifitas dan efisiensi dari prototipe model hasil dari
pengembangan (Mukhadis, 2013).
1.4 Asesmen
Asesmen merupakan upaya bentuk lain dari evaluasi, penelitian,
atau pengembangan dalam pemecahan masalah yang terkait dengan proses
pelaksanaan dan hasil suatu program (pelatihanan, pembelajaran, atau yang
lain. Bahwa asesmen sebagai salah satu bentuk upaya optimalisasi
keberlangsungan proses dan hasil suatuu program yang dirancang. Orientasi
asesmen dalam suatu program (misalnya program pembelajaran) lebih
berupaya memerikan sesuatu aktivitas atau pencapaian tingkat kemajuan
yang telah dicapai oleh peserta suatu program yang terancang berdasarkan
serangkaian informasi (fakta) untuk menggambarkan beberapa karakteristik
pada ranah pencapaian hasil program (Mukhadis, 2013).
1.5 Perbedaan Evaluasi dan Penelitian

 Hasil akhir kegiatan penelitian berwujud simpulan yaitu memiliki dua
persyaratan dari sisi pola berfikir deduktif dan pola berfikir induktif
yang diharapkan dapat diberlakukan atau digeneralisasi dalam
tingkatan teoritik dan empirik pada konteks yang lebih luas yang
memiliki karakteristik latar yang relatif sama
 Hasil akhir dari upaya kegiatan evaluasi lebih berorientasi pada
kepentingan untuk pengambilan keputusan dalam menetapkan suatu
pilihan terhadap suatu program (bersifat lokal, regional, nasional, atau
internasional) yang sedang dan telah dijalankan. Keputusan tersebut ada
dua yaitu kegiatan evaluasi formatif (keputusan pada tahapan program
yang sedang berlangsung) dan kegiatan evaluasi sumatif (kepurusan
pada tahapan program yang sudah berakhir) (Mukhadis, 2013).
1.6 Perbedaan Evaluasi, Penelitian, dan Pengembangan

 Bila dikaitkan dengan upaya pemecahan masalah suatu kegiatan
pengembangan erat sekali dengan kegiatan evaluasi dan penelitian. Hal
ini dikarenakan ketiga bidang ini (evaluasi, penelitian, dan
pengembangan) memiliki interhubungan fungsional, namun juga
memiliki orientasi penekanan pencapaian tujuan akhir yang berbeda.
 Penekanan orientasi kegiatan penelitian lebih pada memenuhi atas
kebutuhan untuk mengetahui (need to khow), penekanan kegiatan
evaluasi lebih pada memenuhi atas kebutuhan untuk memilih (need to
choose), dan penekanan kegiatan pengembangan lebih pada memenuhi
atas kebutuhan untuk berbuat (need to do) (Mukhadis, 2013).
1.7 Perbedaan Asesmen dan Evaluasi

 Asesmen dalam konteks pembelajaran atau pelatihan lingkup bidang
garapannya lebih berorientasi pada pemerian hasil belajar atau hasil
pelatihan yang dicapai oleh peserta didik (pelatihan) dalam interval
waktu tertentu. Implikasi dari hasil asesmen adalah pemilahan atas
peserta didik (pelatihan) yang telah memenuhi standar ketuntasan dan
yang belum memenuhi standar ketuntasan untuk ditindaklanjuti
(Mukhadis, 2013).
 Lingkup bidang garapan kegiatan evaluasi (dalam konteks
pembelajaran atau pelatihan) tidak hanya pemerian hasil, tetapi juga
pemerian proses. Untuk itu, bidang garapan kegiatan evaluasi dapat
dikatakan lebih luas daripada kegiatan asesmen. Implikasi hasil
evaluasi tidak hanya memeriakan hasil, tetapi juga memerikan proses
dari setiap peranan komponen sistem dalam upaya mencapai hasil yang
telah ditetapkan (Mukhadis, 2013).
1.8 Perbedaan Asesmen dan Penelitian
 Kegiatan asesmen tidak dimaksudkan untuk mengembangkan simpulan
dari hasil analisis hubungan anat variabel (faktor) seperti yang
dilakukan dalam kegiatan penelitian (Mukhadis, 2013).
 Bila dalam penelitiaan dilakukan pengujian hipotesis tetapi untuk
asesmen tidak dilakukan pengujian hipotesis tersebut. Namun asesmen
lebih menekankan pada upaya mengungkap, memerikan dan
mengklarifikasi berdasarkan letak geografis dimana program
dikembangkan, klasifikasi berdasarkan lingkup atau cakupan program,
dan klasifikasi berdasarkan perian hasil suatu program (Mukhadis,
2013).
1.9 Perbedaan Asesmen dan Penilaian

 Setiap asesmen selalu melalui aktifitas penilaian dalam konteks
program pembelajaran atau pelatihan
1.10 Perbedaan Penelitian, Evaluasi, Pengembangan, dan Asesmen

 Batasan dalam (1) Penelitian adalah upaya sistematik menemukajn atau
mengembangkan pengetahuan yang benar; (2) Evaluasi adalah upaya
sistematik melihat efektivitas dan efisiensi program; (3) Pengembangan
adalah upaya menghasilkan produk pemecahan masalah; Asesmen
adalah upaya sistematik menghasilkan profil pencapaian hasil belajar
seseorang (Mukhadis, 2013).
 Proses dalam (1) Penelitian mengenai aplikasi berfikir ilmiah; (2)
Evaluasi mengenai aplikasi berfikir sistematik operasional; (3)
Pengembangan mengenai aplikasi teori, prinsip dan prosedur, aktifitas
pemecahan masalah; (4) Asesmen mengenai aplikasi teori, prinsip dan
prosedur mendapatkan data atau informasi (Mukhadis, 2013).
 Hasil dalam (1) Penelitian merupakan pengetahuan yang benar; (2)
Evaluasi merupakan keputusan efektivitas dan efisiensi program; (3)
Pengembangan merupakan produk prosedur pemecahan masalah; (4)
Asesmen merupakan perian atau profil pencapaian hasil belajar
seseorang (Mukhadis, 2013).
Daftar Rujukan
Majid, Abdul. 2015. Penilaian Autentik Proses dan Hasil Belajar. Bandung:
Remaja Rosdakarya
Mukhadis, A. 2013. Evaluasi Program Pembelajaran Bidang Teknologi.
Terminologi,Prosedur Pengembangan Program dan Instrrumen. Malang:
Bayu Media
Sagala, Syaiful. 2009. Konsep dan Makna Pembelajaran. Bandung: Alfabeta
Tim Dosen FIP IKIP Malang.1988. Pengantar Dasar-Dasar Kependidikan.
Surabaya: Usaha Nasional
UU No.20 tahun 2003 tentang Sistem Pendidikan Nasional
Pertemuan ke-2 : Topik Diskusi Hubungan Evaluasi, Testing, Pengukuran
dalam Evaluasi dan Penilaian hasil Pembelajaran
2.1 Hubungan Evaluasi, Testing, Pengukuran dalam Evaluasi dan Penilaian

hasil Pembelajaran
Untuk mengetahui hubungan antara evaluasi, testing, pengukuran
dalam evaluasi dan penilai dapat dilihat dari langkah sistematiknya. Pertama,
testing sebagai upaya dalam melakukan kegiatan pemberian intrumen-
intrumen atau alat-alat kepada responden, sebagai suatu prosedur yang
sistematis guna mengobservasi dan memberi deskripsi sejumlah atau lebih dari
sejumlah ciri seseorang dengan suatu skala numerik atau suatu sistem
kategoris. Bila diselenggarakan suatu tes maka pada saat itu juga
berlangsunglah pengukuran akan tetapi belum semua pengukuran itu adalah
tes. Kedua adalahkegiatan pengukuran (measurement),yaitu suatu aktivitas
untuk memperolah data atau informasi dari kelompok subjek atau objek kajian
yang diperlukan dalam upaya memecahkan masalah melalui penelitian atau
evaluasi. Hasil dari kegiatan pengukuran merupakan skor atau nilai mentah
daripada sesuatu.
Dalam kegiatan penelitian atau evaluasi aktivitas pengukuran
merupakan suatu proses memerikan dana tau proses pengkuantifikasian atas
sifat dari suatu atribut fenomena (bisa berupa benda, peristiwa atau waktu)
(Mukhadis, 2017:91).Ketiga, yaitu penilaian yang mana merupakan upaya
melakukan konfirmasi antara data atau informasi yang diperoleh dan standar
atau acuan yang telah ditetapkan untuk sebagai dasar dalam membuat suatu
interpretasi suatu bentuk justifikasi kualitatif berdasarkan perian profil hasil
belajar dan standar minimal yang telah ditetapkan. Dengan pengertian
penilaian sebagai wujud konformasi antara data yang diperoleh dan standar
yang telah ditetapkan untuk sebagai dasar dalam membuat juatifikasi kualitatif
(Mukhadis,2017:106).
Keempat adalah proses evaluasi, yaitu suatu kegiatan atas tindakan
yang sistematik dalam upaya menjaring dan menganalisis informasi atau data
yang relevan dengan teknik tertentu untuk membuat keputusan yang terkait
dengan tingkat efektivitas, efisiensi, dan kemenarikan suatu program yang
dikembangkan untuk mencapai tujuan (Mukhadis, 2017:61). Dari proses
evaluasi sendiri nantinya didapatkan keputusan yang dapat berupa rekomendasi
untuk memutuskan tindak lanjut atas suatu program yang dijadikan objek
evaluasi.
Jika hubungan antara evaluasi, testing, pengukuran, dan penilaian

disajikan dalam bentuk tabel, berorientasi pada batasan, proses, dan hasil
makakurang lebih seperti berikut.
Batasan Proses Hasil

testing Upaya Melakukan atau Informasi atau data
menyediakan memberikan yang digunakan
informasi sejumlah instrumen dalam proses
atau data kepada responden evaluasi
yang
digunakan
dalam
keperluan
evaluasi
pengukuran Upaya untuk  Memperoleh data Pengkuantifikasian
memperoleh atau informasi dari atribut fenomena
data atau kelompok subjek dengan berbagai
informasi atau objek kajian lambing dan sibul-
dari dengan simbul
kelompok perhitungan dan
subjek atau pengukuran
objek kajian  Memerikan
dan/atau proses
pengkuantifikasian
atas sifat dari
suatu atribut
fenomena
penilaian Upaya Mengkonfirmasikan Interpretasi suatu
melakukan Antara data atau bentuk justifikasi
konfirmasi informasi dan kualitatif
antara data standar atau acuan
atau
informasi dan
standar atau
acuan yang
ditetapkan
Evaluasi Upaya Aplikasi berpikir Keputusan
sistematik sistematik efektivitas dan
melihat operasional efisiensi program
efektivitas
dan efisiensi
program
Daftar Rujukan
Djamarah & Zain. 2006. Strategi Belajar Mengajar. Jakarta: Rineka Cipta
Sudjana,N. 2009. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT

Remaja Rosdakarya
Sajekti, R. 1988.Tes dan Pengukuran dalam Pendidikan. Jakarta: Departemen

Pendidikan dan Kebudayaan.
Majid, A. 2015.Penilaian Autentik Proses dan Hasil belajar. Bandung: Remaja

Rosdakarya.
Mukhadis, A. 2017. Evaluasi Program Pembelajaran Bidang Teknologi. Malang:

Media Nusa Creative.
Pertemuan ke-3 : Topik Diskusi Evaluasi dan Penilaian sebagai Bentuk
Pengukuran (langkah, objek, subjek dan bentuknya)
3.1 Pengertian Evaluasi, Penilaian, dan Pengukuran

Evaluasi berasal dari kata evaluation (bahasa Inggris). Kata tersebut diserap
ke dalam perbendaharaan istilah bahasa Indonesia dengan tujuan mempertahankan
kata aslinya dengan sedikit penyesuaian lafal Indonesia menjadi "evaluasi". Istilah
"penilaian" merupakan kata benda dari "nilai". Pengertian "pengukuran" mengacu
pada kegiatan membandingkan sesuatu hal dengan satuan ukuran tertentu, sehingga
sifatnya menjadi kuantitatif.
Dari penjelasan di atas, apakah perbedaan antara evaluasi pembelajaran
dengan penilaian proses hasil belajar? Tentu istilah-istilah tersebut berbeda satu
sama lain, baik baik ruang lingkup maupun fokus yang di nilai. Evaluasi lebih luas
ruang lingkupnya daripada penilaian, sedangkan penilaian lebih terfokus pada
aspek tertentu saja yang merupakan bagian dari ruang lingkup tersebut. Jika hal
yang ingin di nilai adalah sistem pembelajaran, maka ruang lingkupnya adalah
semua komponen pembelajaran, misalnya hasil belajar, maka istilah yang tepat
digunakan adalah penilaian, bukan evaluasi. Di samping itu ada juga istilah
pengukuran. Jika evaluasi dan penilaian bersifat kualitatif, maka pengukuran
bersifat kuantitatif (skor/angka) yang diperoleh menggunakan suatu alat ukur atau
instrument yang santandar (baku). Dalam konteks hasil belajar, alat ukur atau
instrument tersebut dapat berupa tes atau non tes. Berikut akan dijelaskan lebih
lanjut tentang pengertian ketiga istilah tersebut.
3.1.1 Evaluasi
Mukhadis (2013:61) mendefinisikan "secara umum evaluasi adalah suatu
kegiatan atau tindakan yang sistematik dalam upaya menjaring dan menganalis
informasi/data yang relevan dengan teknik tertentu untuk membuat keputusan yang
terkait dengan tingkat efektifitas, efisiensi, dan kemenarikan suatu program yang
dikembangkan untuk mencapai tujuan". Representasi dari kegiatan atau tindakan
sistematik ini, merupakan langkah-langkah eksplisit dari tahapan dalam
melaksanakan suatu kegiatan evaluasi. Menurut Hikcks (dalam Mukhadis, 2013:61)
indikator suatu langkah-langkah eksplisit dalam konteks ini adalah adanya
kejelasan perian komponen dan kejelasan tahapan-tahapan proses yang harus
dilakukan dan dapat di replikasi oleh pihak lain dalam upaya mencapai suatu tujuan.
Untuk itu, karakteristik dari kegiatan yang bersifat sistematik dalam konteks ini,
yaitu setiap langkah yang ditempuh (mulai menetapkan konteks dan ranah sampai
pada embuatan simpulan hasil) dalam upaya melakukan evaluasi suatu program
dapat diperikan secara eksplisit, jelas komponen-komponennya dan dapat
direplikasi oleh pihak lain yang memiliki kepentingan yang sama, baik dalam
interval waktu yang bersamaan atau sesudahnya.
3.1.2 Pengukuran
Kegiatan pengukuran (measurement) adalah suatu aktivitas untuk
memperoleh data atau informasi dari kelompok subjek atau objek kajian yang
diperlukan dalam upaya memecahkan masalah melalui penelitian atau evaluasi
(Mukadis, 2013:89).
Menurut Nunnaly (dalam Mukadis, 2013:89) secara umum data atau
informasi yang diperlukan dapat diperoleh melalui dua cara, yaitu yang pertama
dengan cara perhitungan dan yang kedua dengan cara pengukuran. Pengukuran
menjadi sangat penting keberadaannya bila dikaitkan dengan kegiatan penelitian
dan evaluasi. Hal ini disebabkan karena tingkat kualitas hasil kegiatan dari
penelitian (simpulan) atau evaluasi (keputusan) sangat tergantung oleh batasan
faktor/fenomena yang dijadikan objek pengukuran, kualitas alat ukur, proses, dan
hasil kegiatan pengukuran yang dilakukan. Indikator batasan faktor atau fenomena
yang dijadikan objek pengukuran adalah adanya batasan substansi fenomena yang
dijadikan objek pengukuran secara operasional, sehingga jelas rincian dari dimensi-
dimensi dan indikatornya atau deskriptornya. Kejelasan rincian dari dimensi,
indikator atau deskriptor atas suatu objek yang dijadikan evaluasi atau penelitian
sangat tergantung dari tingkat operasional dalam memberikan definisi
operasionalnya. Kejelasan dalam memberikan definisi operasional atas objek atau
subjek yang dievaluasi atau diteliti akan berpotensi sebagai acuan pengembangan
instrument yang baik dan berkualitas. Indikator kualitas alat pengukuran atau biasa
lebih dikenal dengan sebutan instrument pengukuran adalah dapat dilihat dari aspek
tingkat validitas dan realibilitas instrument. Tingkat validitas suatu instrument dapat
dilihat dari sisi validitas isi dan validitas empirik. Tingkat validitas isi suatu
instrument penelitian atau evaluasi ditentukan berdasarkan hasil penilaian kelompo
ahli yang relevan (Gronlund dalam Mukadis, 2013:88).
Dalam kegiatan penelitian atau evaluasi aktivitas pengukuran merupakan
suatu proses memberikan dan/atau proses pengkuantifikasian atas sifat dari suatu
atribut fenomena (bisa berupa benda, peristiwa, atau waktu). Dalam kegiatan
pengukuran tergantung tiga aspek utama, yaitu yang pertama adanya penggunaan
lambang atau symbol angka, yang kedua adanya aturan main tertentu yang perlu
dibangun untuk disepakati dalam penggunaan simbol atau lambang angka, dan yang
terakhir adalah factor ketaatan dalam penggunaan aturan angka-angka yang telah
disepakati. Proses pelaksanaan pengukuran atas suatu fenomena yang dijadikan
objek pengukuran, baik pada pengukuran atribut kuantitatif yang bersifat konkret
atau atribut kuantitatif yang bersifat abstrak, yang terkait dengan penggunaan dan
aturan penggunan lambing secara visualisasi disajikan pada Gambar 2.1.
PENGGUNAAN PROSES ATURAN PENGGUNAAN
PENGUKURAN ANGKA
ANGKA
KEJELASAN
PECAHAN
ARAH PENGGUNAAN
HASIL PENGUKURAN
BULAT
MAKNA
KONTINUM
DESKRIT
JENIS SKALA
DATA
Gambar 2.1. Pelaksanaan Pengukuran Atribut Fenomena

(sumber: Mukhadis, 2013: 95)
Berdasarkan uraian gambar diatas, maka dapat dikatakan bahwa dalam

kegiatan pengukuran terkandung dua aspek utama, yaitu adanya penggunaan
lambing atau simbul angka, dan adanya aturan main tertentu yang perlu dibangun
untuk disepakati dalam penggunaan simbul angka bilangan bulat yamg biasa
disebut deskrit atau digunakan lambing bilangan pecahan yang biasa disebut
kontinum
3.1.3 Penilaian
Depdikbud (dalam Arifin, 2014:4) mengemukakan penilaian adalah suatu
kegiatan untuk memberikan berbagai informasi secara berkesinambungan dan
menyeluruh tentang proses dan hasil yang telah dicapai siswa. Selanjutnya,
Gronlund (dalam Arifin, 2014:4) mengartikan "penilaian adalah suatu proses yang
sistematis dari pengumpulan, analisis, dan interpretasi informasi/data untuk
menentukn sejauh mana peserta didik telah mencapai tujuan pembelajaran".
Menurut Mardapi (1999:8) penilaian adalah kegiatan menafsirkan atau
mendeskripsikan hasil pengukuran. Ada dua acuan yang dapat dipergunakan dalam
melakukan penilaian yaitu acuan norma dan acuan kriteria. Dalam melakukan
penilaian dibidang pendidikan, kedua acuan ini dapat dipergunakan. Acuan norma
berasumsi bahwa kemampuan seseorang berbeda serta dapat digambarkan menurut
kurva distribusi normal. Sedangkan acuan kriteria berasumsi bahwa apapun bisa
dipelajari semua orang namun waktunya bisa berbeda. Penggunaan acuan norma
dilakukan untuk menyeleksi dan mengetahui dimana posisi seseorang terhadap
kelompoknya. Misalnya jika seseorang mengikuti tes tertentu, maka hasil tes akan
memberikan gambaran dimana posisinya jika dibandingkan dengan orang lain yang
mengikuti tes tersebut. Adapun acuan kriteria dipergunakan untuk menentukan
kelulusan seseorang dengan membandingkan hasil yang dicapai dengan kriteria
yang telah ditetapkan terlebih dahulu. Acuan ini biasanya digunakan untuk
menentukan kelulusan seseorang. Seseorang yang dikatakan telah lulus berarti bisa
melakukan apa yang terdapat dalam kriteria yang telah ditetapkan dan sebaliknya.
Acuan kriteria, ini biasanya dipergunakan untuk ujian-ujian praktek. Dengan
adanya acuan norma atau kriteria, hasil yang sama yang didapat dari pengukuran
ataupun penilaian akan dapat diinterpretasikan berbeda sesuai dengan acuan yang
digunakan.
Penilaian dan evaluasi memiliki persamaan dan perbedaan. Persamaannya
adalah keduanya memiliki pengertian menilai atau menentukan nilai sesuatu.
Sedangkan perbedaannya terletak pada ruang lingkup daan pelaksanaannya. Ruang
lingkup penilaian lebih sempit dan biasanya hanya terbatas pada satu komponen
atau aspek saja, seperti prestasi belajar peserta didik. Pelaksanaan penilaian
biasanya dilakukan dalam konteks internal, yakni orang-orang yang menjadi bagian
atau terlibat dalam proses pembelajaran yang bersangkutan. Misalnya guru menilai
prestasi belajar peserta didik. Sedangkan ruang lingkup evaluasi lebih luas,
mencakup semua komponen dalam suatu system (system pendidikan, system
kuriklum, sistem pembelajaran) dan dapat dilakukan tidak hanya pihak internal
tetapi juga piak eksternal, seperti konsultan mengevaluasi suatu program atau
kurikulum.
Evaluasi dan penilaian lebih bersifat komprehensif yang meliputi
pengukuran. Pengukuran lebih membatasi pada gambaran yang bersifat kuantitatif
(angka-angka) tentang kemajuan peserta didik (learning progress), sedangkan
evaluasi dan penilaian lebih bersifat kualitatif. Di samping itu, evaluasi dan
penilaian pada hakikatnya merupakan suatu proses membuat keputusan tentang
nilai suatu objek yang didasarkan pada hasil pengukuran. Untuk lebih jelasnya,
gambaran hubungan antar evaluasi, penilaian, dan pengukuran adalah sebagai
berikut
Evaluasi
Penilaian
Pengukuran
Gambar 2.2 Hubungan Evaluasi, Penilaian, dan Pengukuran
3.2 Langkah Evaluasi dan Penilaian Sebagai Bentuk Pengukuran

Evaluasi program dilaksanakan melalui beberapa langkah pokok. Menurut
Mukhadis (2013:62) terdapat empat langkah pokok yang perlu
dilaksanakan..Adapun tahapan dalam pelaksanaan evaluasi adalah sebagai berikut.
Langkah Pertama
Pertama, yaitu penetapan kriteria atau standar yang digunakan untuk
mempertimbangkan kualitas, keefektifan, efisiensi, relevansi, kemenarikan, dan
produktivitas dari dimensi, aspek, atau ranah yang dijadikan objek evaluasi. Standar
yang digunakan dapat bersifat relatif, mutlak, atau ipsatif (Marzano, Pickering, dan
McTighe dalam Mukadis, 2013:63). Standar yang digunakan dapat dikatakan relatif
apabila dalam melihat atau menetapkan tolok ukur tingkat keefektifan, efisiensi,
relevansi, kemenarikan, dan produktifitas hasil suatu program yang dijadikan objek
evaluasi tolok ukur keberadaan program atau kelompok atau kelas lain yang
memiliki karakteristik dan tujuan yang relatif sama. Dalam konteks ini, program
yang dijadikan sebagai kriteria selain memiliki karakteristik dan tujuan yang
relative sama, program yang dimaksud juga sudah berlangsung dan memenuhi
syarat sebagai suat dtandar, patok duga atau bechmarking program. Apabila dalam
konteks mikro (level kelas) dalam pembelajaran standar yang bersifat lazim disebut
dengan penilaian acuan norma (PAN) atau norm reference test (NRT) (Dick &
Carey, dalam Mukhadis 2013:63).
Wujud konkret dari aplikasi standar tersebut, misalnya dalam menentukan
hasil belajar dalam suatu kelas dengan mengacu pad norma pencapaian skor rerata
kelompok dalam kelas. Hal ini akan menunjukkan hasil belajar dalam wujud skor
rerata kelompok kelas yang berbeda karena banyak factor yang mempengaruhi.
Potensi perbedaan hasil skor rerata ini, yang menyebabkan makna secara kuantitatif
hasil belajar dengan skor yang sama, pada kelas yang berbeda. Indikator yang
digunakan sebagai dasar untuk mengelompokkan standar yang bersifat relative atau
penilaian acuan norma. Dalam konteks digunakan sebagai standar penetapan hasil
belajar atau hasil pelatihan, acuan ini pada akhir kegiatan akan diadakan evaluasi
tentang hasilnya, akan selalu ada peserta didik yang lulus/memenuhi syarat.
Keadaan ini yang menjadi pembeda pada pelaksanaan evaluasi hasil belajar dengan
penerapan kriteria yang bersifat mutlak, atau penilaian acuan patokan (PAP) atau
criterion reference tes (CRT).
Selain itu, program tersebut sudah berlangsung dan memenuhi syarat
sebagai suatu standar atau patokan. Sedangkan standar yang digunakan dapat
dikatakan mutlak (absolute) apabila tolok ukur dalam penetapan pencapaian tingkat
keefektifan, efisiensi, relevansi, kemenarikan, dan produktifitas hasil dari suatu
program yang dijadikan objek evaluasi dilihat dari target minimal pencapaian
tujuan yang telah ditetapkan.
Selanjutnya standar yang digunakan akan bersifat ipsatif apabila tolok ukur
dalam menetapkan pencapaian tingkat keefektifan, efisiensi, relevansi,
kemenarikan, dan produktifitas hasil dari suatu program yang dijadikan objek
evaluasi dilihat dari suatu bentuk kontinum dari pencapaian suatu tujuan program.
Langkah Kedua
Tahapan kedua dari pelaksanaan evaluasi yaitu pemilihan dan penetapan
jenis dan bentuk instrument (alat ukur) yang akan digunakan dalam pengumpulan
data yang diperlukan. Hal yang menjadi pertimbangan dalam memilih dan
menetapkan jenis dan bentuk instrument yang sesuai adalah unsur kesesuaiannya
dengan dengan beberapa hal sebagai berikut yaitu: (1) sifat dan substansi program
yang akan dijadikan objek evaluasi, (2) jenis dan macam informasi yang diinginkan,
(3) keberadaan sumberdaya manusia yang ada dan terlibat dalam pelaksanaan
evaluasi, (4) keberadaan sumberdaya perangkat keras yang tersedia sebelum,
selama, dan setelah evaluasi, (5) ketersediaan waktu, tenaga, dan biaya yang
dialokasikan untuk kegiatan evaluasi, dan (6) karakteristik sasaran tau responden
yang akan menjadi sumber data dalam pelaksanaan evaluasi. Setelah instrumen
yang akan digunakan diidentifikasi berdasarkan pertimbangan diatas, maka akan
dipilih instrumen yang sesuai dan selanjutnya ditetapkan untuk selanjutkan
dikembangkan sebagai alat pengumpul data.
Penetapan instrument evaluasi meliputi: (1) bentuk instrumen (tes/nontes)
,dapat berupa tes objektif, tes subjektif, tes campuran (objektif dan subjektif),
angket/kuisioner, pedoman observasi, pedoman wawancara, dsb., (2) jumlah
pertanyaan/ aspek yang dijabarkan dalam instrument, (3) validasi instrument, dan
tampilan instrument. Menurut Nunnaly (dalam Mukhadis 2013:67) tentang
validitas instrument berdasarkan jenisnya dapat dipilah berupa validitas isi,
validitas konstruk, validitas empirik. Sedangkan strategi pengembangan dalam
mengukur validitas suatu instrument dapat dilakukan dengan tiga pendekatan, yaitu:
(1) pendekatan yang mengacu pada kriteria eksternal, untuk validitas empiric, (2)
pendekatan yang mengacu pada representasi domain isi, untuk validitas isi, dan (3)
pendekatan yang mengacu pada representasi konstruk, untuk validasi konstruk
berikut adalah gambaran hubungan antara pendekatan dan jenis validitas yang
dimaksud.
Koreksi dengan Predictive Empiric statistic
kriteria tertentu validity (pre, concurrent, past)
PENDEKATAN
INSTRUMEN
VAKIDITAS
Isi penting dalam Content Cakupan isi, relevansi,

domain validity butir representatif
Isi penting dalam Construct Factorial

konstruks validity validity
Gambar 2.3. Pendekatan Validitas Instrumen

(sumber: Mukhadis, 2013:67)
Langkah Ketiga
Langkah yang ketiga yaitu pengumpulan data. Pelaksanaan pengumpulan
data diharapkan dapat memenuhi standar minimal dalam kegiatan evaluasi ini perlu
memperhatikan bebrapa hal, yaitu: (1) karakteristik subjek yang dijadikan sumber
data, (2) jenis instrument yang digunakan, baik tes maupun non tes, (3) strategi
pelaksanaan yang dilaksanakan, baik secara langsung maupun tidak langsung, (4)
waktu pengumpulan data, (5) kiat atau pendekatan yang digunakan dalam
berinteraksi dengan sumber data.
Langkah Keempat
Langkah terahir dari kegiatan evaluasi yaitu analisis informasi dan
penetapan standar untuk acuan dalam membuat interpretasi terhadap hasil evaluasi.
Analisis informasi ini dimulai dari pengecekan kelengkapan data berdasarkan
instrument yang terkumpul, identifikasi dan pengolahan data, penetapan analisis
dan melakukan analisis informasi dengan standar yang telah ditetapkan. Standar
yang digunakan dalam membuat justifikasi dapat berupa absolute, relative, atau
ipsatif yang pemilihannya bergantung pada sifat, tujuan, dan implikasi dari kegiatan
evaluasi yang dilakukan. Kegiatan yang terakhir ini biasanya disebut sebagai
tahapan interpretasi hasil evaluasi. Dengan representasi interpretaasi ini, maka
diugunakan acuan dalam membuat suatu keputusan atas hasil program yang
dijadikan objek evaluasi.
3.3 Objek dan Subjek Evaluasi

3.3.1 Objek Evaluasi
Yang dimaksud objek atau sasaran evaluasi adalah hal-hal yang menjadi
pusat perhatian untuk di evaluasi. Apa pun yang ditentukan oleh evaluator atau
penilai untuk evaluasi, itulah yang disebut dengan objek evaluasi. Mukhadis
(2013:263) menyatakan bahwa secara umum ranah yang dijadikan objek
sasaran evaluasi program, bila dipilah dengan mengacu pada pola piker berpikir
system dapat diidentifikasi menjadi ranah masukan (input), ranah proses
(process), dan ranah keluaran (output).
a. Input
Keberadaan ranah ini sebagai wujud dari komponen suatu program
merupakan segala sesuatu yang menjadi masukan bagi program yang
dirancang untuk mencapai suatu tujuan. Masukan ini meliputi baik
sumberdaya (manusia dan non manusia), peserta program, maupun
maskan software. Kelompok input yang diolah dalam suatu program
meliputi masukan mentah (raw input) yang berupa target sasaran (peserta)
program. Sedangkan kelompok input pengolahnya meliputi masukan
sumberdaya dan masukan software yaitu kurikulum atau pemerian
program, tenaga peaksana program (manajer, staf ahli, pelaksana, staf
administrasi, dan staf keamanan), dukungan dana, dukungan sarana dan
prasarana, dan keberadaan system reguasi pelaksanaan suatu program
b. Proses
Proses merupakan representasi segala peristiwa atau proses, baik
langsung maupun tidak langsung yang diperlukan, atau bahkan menjadi
prasyarat yang mengarah pada upaya upaa pencapaian tujuan program yang
telah ditetapkan. Dalam hal ini juga proses dapat dikatakan sebagai
peristiwa berubahnya suatu masukan/input menjadi sesuatu dalam bentuk
lain.dengan kata lain, proses sebagai komponen suatu program merupakan
peristiwa berlangsungnya interaksi antara komponen input (suberdaya
sarana prasarana, sumberdaya pelaksanaan program, dan sumberdaya
software) yang berlangsung dan difasilitasi oleh ranah konteks yang dapat
mempertinggi tingkat optimalisasi berlangsungnya proses dan arah
pencapaian suatu hasil yang telah ditetapkan
c. Output
Output merupakan segala representasi efek yang terjadi dari proses
interaksi antar input yang difasilitasi oleh ranah konteks yang mengarah
pada akumulasi hasil tertentu sebagai representasi tingkat efektifitas dan
efisiensi pencapaian keseluruhan lingkup bagian tujuan program yang telah
ditetapkan dalam interval waktu tertentu.
1) Objek evaluasi dalam konteks hasil pembelajaran dapat dipilah menjadi
tiga ranah, yaitu :
a) Ranah kognitif
 Mengenal (recognition)
Dalam pengenalan siswa diminta untuk memilih satu dari dua
atau lebih jawaban.
 Pemahaman (comprehension)
Dengan pemahaman, siswa diminta untuk membuktikan bahwa
ia memahami hubungan yang sederhana diantara fakta-fakta
atau konsep.
 Penerapan atau aplikasi (aplication)
Untuk penerapan atau aplikasi ini siswa dituntut memiliki
kemampuan untuk menyeleksi atau memilih suatu abstrasi
tertentu (konsep, hukum, dalil, aturan, gagasan, cara) secara
tepat untuk diterapkan dalam suatu situasi baru dan
menerapkannya secara benar.
 Analisis (analysis)
Dalam tugas ini analisis ini siswa diminta untuk menganalisis
suatu hubungan atau situasi yang kompleks atas konsep-konsep
dasar.
 Sintesis (synthesis)
Apabila penyusun soal tes bermaksud meminta siswa
melakukan sintesis maka pertanyaan-pertanyaan disusun
sedemikian rupa sehingga meminta siswa untuk
menggabungkan atau menyusun kembali (reorganize) hal-hal
yang spesifik agar dapat mengembangkan suatu struktur baru.
Dengan singkat dapat dikatakan bahwa dengan soal sintesis ini
siswa diminta untuk melakukan generelisasi.
b) Ranah efektif
 Pandangan atau pendapat (opinion)
Apabila guru mau mengukur aspek efektif yang berhubungan
dengan pandangan siswa maka pertanyaan yang disusun
menghendaki respon yang melibatkan ekspresi, perasaan atau
pendapat pribadi siswa terhadap hal-hal yang relatif sederhana
tetapi bukan fakta.
 Sikap atau nilai (attitude, value)
Dalam penilaian efektif tentang sikap ini, siswa ditanya
mengenai responsnya yang melibatkan sikap atau nilai telah
mendalam di sanubarnya, dan guru meminta dia untuk
mempertahankan pendapatnya.
a. Ranah psikomotor
Perkataan psikomotor berhubungan dengan kata “motor,
sensory-motor, perseptual-motor”. Jadi, ranah psikomotor
berhubungan erat dengan kerja otot sehingga menyebabkan
geraknya tubuh atau bagian-bagiannya. Yang termasuk dalam
klasifikasi gerak di sini mulai dari gerak yang paling sederhana
yaitu melipat kertas sampai dengan marakit suku cadang televisi
serta komputer. Secara mendasar perlu dibedakan antara dua hal,
yaitu keterampilan (skills) dan kemampuan (abilities).
3.3.2 Subjek Evaluasi

Subjek evaluasi adalah orang yang melakukan pekerjaan
evaluasi. Subyek evaluasi pendidikan itu akan sangat bergantung pada,
atau ditentukan oleh suatu aturan yang menetapkan pembagian tugas
untuk melakukan evaluasi tersebut. Jadi subyek evaluasi pendidikan itu
dapat berbeda-beda orangnya. Siapa yang dapat disebut sebagai subjek
evaluasi untuk setiap tes, ditentukan oleh suatu aturan pembagian tugas
atau ketentuan yang berlaku.
Dalam kegiatan evaluasi pendidikan dimana sasaran evalusinya
adalah prestasi belajar siswa, maka subyek evaluasinya adalah guru atau
dosen yang mengasuh mata pelajaran tertentu. jika evaluasi yang
dilakukan itu sasarannya adalah sikap peserta didik, maka subyek
evaluasinya adalah guru atau petugas yang sebelum melaksanakan
evaluasi tentang sikap itu, terlebih dahulu telah memperoleh pendidikan
atau latihan (training) mengenai cara-cara menilai sikap seseorang.
Adapun apabila sasaran yang di evaluasi adalah kepribadian peserta
didik, dimana pengukuran tentang kepribadian itu dilakukan dengan
menggunakan instrument berupa test yang sifatnya baku. Maka subyek
evaluasinya tidak bisa lain kecuali seorang psikolog.
3.4 Bentuk Evaluasi Dan Penilaian Dalam Kegiatan Pengukuran

Dilihat dari bentuknya, evaluasi dibagi menjadi tiga, yaitu evaluasi
sumatif , evaluasi formatif, dan evaluasi produk.
Evaluasi Sumatif
Menurut Popham dan Herman (dalam Mukhadis, 2013:153) evaluasi
sumatif pemilahanan pelaksanaan evaluasi program yang dijadikan objek
sasaran pada lingkup keseluruhan program. Evaluasi sumatif lebih menekankan
pada aspek kualitas, aspek relevansi, aspek efektifitas, aspek efisiensi, dan
aspek kemenarikan produk dari suatu program yang telah dikembangkan dan
dilaksanakan untuk mencapai tujuan program yang telah ditetapkan. Jenis
evaluasi sumatif ini biasanya dilakukan pada tahapan akhir pelaksanaan suatu
program sebagai wahana untuk mengukur, menganalisa, membuat interpretasi,
sesuai acuan tertentu dan membuat justifikasi terhadap tingkat efektifitas,
tingkat efisiensi, dan tingkat kemenarikan dalam pencapaian tujuan program
yang telah ditetapkan.
Implikasi dari pelaksanaan evaluasi sumatif adalah dapat digunakan
sebagai dasar acuan pengambilan keputusan terhadap tingkat keberhasilan dan
memilih alternative tindak lanjut dari suatu program yang dijadikan sasaran
evaluasi yang dilaksanakan. Representasi keputusan yang diambil dalam
konteks ini adalah berupa pemeria tingkat optimalisasi dari setiap dimensi atau
aspek dalam pencapaian tujuan dari suatu program yang telah ditetapkan.
Representasi tingkatan pemerian optimalisasi pencapaian tujuan program dapat
bersifat kualitatif, kuantitatif, atau hibrida.
Dalam konteks pembelajarannya wujud alternatif proposisi tindak lanjut
suatu program yang dijadikan sasaran objek evaluasi tersebut berupa tiga
alternatif utama yaitu: sosok program dapat terus dilaksanakan tanpa perlu
adanya kegiatan revisi atau modivikasi pada semua dimensi, aspek atau
komponen; sosok program dapat terus dilaksanakan dengan perlu diadakan
tradisi atau modivikasi pada satu atau beberapa dimensi, aspek atau komponen
program tertentu; atau sosok program tidak dapat diteruskan
operasionalisasinya sebagai alat pencapaian tujuan yang telah ditetapkan.
Apabila alternatif proposisi tindak lanjut suatu program, termasuk pada kategori
yang ketiga, maka dapat dikatakan bahwa program pada prinsipnya tidak dapat
dilanjutkan atau lebih baik program tersebut diberhentikan.
Evaluasi Formatif
Menurut Popham dan Herman (dalam Mukhadis, 2013:153) evaluasi
formatif pemilahanan pelaksanaan evaluasi program yang objek sasaran
cakupannya lebih berkonsentrasi pada bagian atau beberapa bagian, pada
komponen atau beberapa komponen program. Misalnya, hanya pada komponen
atau bagian analisis kebutuhan, pada bagian atau komponen perencanaan, pada
bagian atau komponen input, pada bagian atau komponen proses, atau pada
bagian atau komponen hasil, atau gabungan dari komponen tersebut. Orientasi
kecenderungan dlam melihat pencapaian tujuan program pada pemilahan
evaluasi formatif lebih pada aspek atau pada dimensi kualitas proses, pada aspek
atau pada dimensi relevansi, dan pada aspek atau pada dimensi kemenarikan
proses dan berfungsinya setiap bagian atau komponen pelaksanaan program
dalam upaya mengarah pada pencapaian tujuan yang telah ditetapkan.
Tujuan evaluasi formatif lebih mengarah pada upaya pengumpuln data
atau informasi terkait dengan tingkt keterlaksanaan dan berfungsinya serta
kendala-kendala dari setiap komponen, beberapa komponen program yng secara
sinergis mengarah pada upaya pencapaian tujuan program esuai dengan
prosedur operasional baku (POB) yang telah ditetapkan. Representative
keputusan yang diambil dalam konteks ini adalah pemerian tingkat
keterlaksanaan atau fungsi dan/atau kendala-kendala dari setiap komponen
dalam upaya pencapaian tujuan program yang telah ditetapkan.
Dalam konteks pembelajarannya adalah pemberian tingkat
keterlaksanaan atau fungsi dan atau kendala-kendala dari setiap dimensi atau
setiap komponen dalam upaya pencapaian tujuan program yang telah
ditetapkan. Misalnya, pemberian tingkat keterlaksanaan atau fungsi dan
kendala-kendala suatu komponen program secara kualitatif dari dimensi atau
aspek kualitas proses dalam pencapaian tujuan program dapat berupa: pada
tingkatan atau kategori keterlaksanaan dan proses yang sangat berkualitas, pada
tingkatan atau karegori keterlaksanaan dan proses yang berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang cukup berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang kurang berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang tidak berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang sangat tidak berkualitas.
Sedangkan pemberian tingkat kendala-kendala dalam keterlaksanaan setiap
atau beberapa komponen sesuai dengan peran dan fungsinya merupakan
kebalikan dari interpretasi yang terkait dengan pemberian kualitas proses
keterlaksanaan dalam upaya mencapai tujuan program yang telah ditetapkan.
Daftar Rujukan

Pertemuan ke-4 : Topik Diskusi Prinsip Pengukuran, dan Macam Alat
Pengukuran serta Prosedur Penggunannya dalam Evaluasi dan Penilaian
Hasil Belajar
4.1 Prinsip-prinsip dari pengukuran dalam evaluasi pembelajaran
Kegiatan pengukuran (measurement) adalah suatu aktivitas untuk

memperoleh data atau informasi dari sekelompok subjek atau objek kajian yang
diperlukan dalam upaya memecahkan masalah melalui penelitian atau evaluasi.
Data atau informasi yang diperlukan ini secara umum dapat diperoleh melalui
dua cara, yaitu dengan cara perhitungan dan pengukuran (Nunnally,1978).
Sifat-sifat pengukuran antara lain :
1. Langsung
2. Tidak Langsung
3. Validitas
Validitas alat pengukur berhubungan dengan ketepatan dan kesesuaian alat
untuk menggambarkan keadaan yang diukur sesuai dengan keadaan yang
sebenarnya. Ketepatan berhubungan dengan pemberian informasi persis
(akurat) seperti keadaannya. Atau dengan perkataan lain disebut sahih.
Sedang kesesuaian berhubungan dengan efektivitas alat untuk memerankan
fungsinya sesuai dengan yang dimaksud dari alat pengukur tersebut.
4. Reliabilitas
Realiabilitas alat pengukur berhubungan dengan kestabilan, kekostanan,
atau ketepatan test. Suatu test akan dinyatakan reliabel apabila test tersebut
dikenakan kepada sekelompok subyek yang sama, tetap memberikan hasil
yang sama pula, walaupun saat pemberian testnya berbeda. Tinggi
rendahnya reliabilitas alat pengukur alat pengukur dapat diketahui dengan
menggunakan teknik statistik. Yaitu dengan mengklasifikasikan antara hasil
pengukuran pertama dan hasil pengukuran kedua dari bahan test yang sama,
atau test yang lain yang dianggap sama (ekuivalen).
5. Objektivitas
Objektivitas dalam pengertian sehari-hari berarti tidak mengandung unsur
pribadi. Kebalikanya adalah subyektivitas, yang berarti terdapat unsur
pribadi. Jadi, sebah tes dikatakan objektif apabila tes itu dilaksanakan
dengan tidak ada faktor pribadi yang mempengaruhi, terutama pada sistem
scoring.
6. Praktikabilitas
Sebuah tes dikatakan memiliki praktikabilitas yang tinggi apabila tes
tersebut bersifat praktis. Artinya, tes itu mudah dilaksanakan, mudah
pemeriksaanya, dan di lengkapi petunjuk yang jelas sehingga dapat
diberikan atau diawali oleh orang lain dan juga mudah dalam membuat
administrasinya.
7. Ekonomis
Tes memiliki sebutan ekonomis apabila pelaksanaan tes itu tidak
membutuhkan ongkos atau biaya yang mahal, tenaga yang banyak, dan
waktu yang lama.
Pengukuran sangat penting keberadaannya bila dikaitkan dengan

kegiatan penelitian atau evaluasi. Hal ini disebabkan oleh karena tingkat
kualitas hasil kegiatan penelitian (simpulan) atau evaluasi (keputusan) yang
sangat bergantung oleh batasan faktor atau fenomena yang dijadikan objek
pengukuran, kualitas alat ukur, proses dan hasil kegiatan pengukuran yang
dilakukan. Indikator batasan factor atau fenomena yang dijadikan objek
pengukuran adalah adanya batasan substansi fenomena yang dijadikan objek
pengukuran secara operasional, sehingga jelas rincian dari dimensi-dimensi
dan indikator atau deskriptornya.
Indikator kualitas alat pengukuran atau lebih dikenal dengan sebutan
instrument pengukuran adalah dapat dilihat dari aspek tingkat validitas dan
realibilitas instrument. Tingkat validitas suatu instrumen dapat dilihaat dari sisi
validitas isi (content validity), dan validitas empirik (Empirical validity).
Tingkat validitas isi suatu instrumen penelitian atau evaluasi ditentukan
berdasarkan hasil penilaian kelompok ahli yang relevan (expert judgement)
(Gronlund, 1990). Sedangkan tingkat validitas empirik suatu instrumen
penelitian atau evaluasi ditentukan berdasarkan hasil dari analisis data hasil uji
coba pada responden yang relevan dengan teknik dan rumus statistic tertentu.
Indikator kualitas proses pengukuran adalah sebagai representasi tingkat
konsistensi yang perlu dijaga untuk menghindari kesalahan dalam melakukan
penetapan instrument dan proses pengukuran (Crounbach, 1984). Indikator
utama dari kualitas dari hasil pengukuran yang dilakukan dalam suatu
penelitian atau evaluasi adalah tingkat representiveness data atau informasi
yang diperoleh yang biasanya disebut dengan derajat kebenaran atau keabsahan
data.
4.2 Macam-macam alat pengukuran dalam evaluasi pembelajaran
Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan

untuk mempermudah seseorang dalam melaksanakan tugas atau mencapai
tujuan secara lebih efektif dan efisien. Kata ”alat” biasa juga disebut dengan
istilah instrumen”. Dengan demikian maka alat evaluasi juga dikenal dengan
instrumen evaluasi. Dengan pengertian tersebut maka alat evaluasi dikatakan
baik apabila mampu mengevaluasi sesuatu yang dievaluasi dengan hasil seperti
keadaan yang dievaluasi.
Pada kegiatan penelitian atau evaluasi aktivitas pengukuran merupakan
suatu proses memberikan atau proses pengkuantifikasian atas sifat dari suatu
atribut fenomena (bisa berupa benda, peristiwa atau waktu). Dalam upaya
pengkuantifikasian suatu atribut fenomena ini dapat digunakan berbagai
lambing atau simbol-simbol. Lambang atau symbol-simbol yang paling lazim
digunakan dalam menggambarkan dari sifat atribut fenomena secara kuantitatif
dapat berupa angka atau huruf sebagai lambang atau simbol. Berdasarkan hasil
berbagai kajian literature yang ditulis oleh para pakar dalam bidang
pengukuran dapat disimpulkan bahwa lambang atau symbol yang paling luwes
(flexibel) atau paling lazim digunakan adalah angka (Cronbach, 1984; dan
Nunnally, 1978).
Dengan demikian dapat dikatakan bahwa pengukuran adalah suatu
proses penerapan atau proses pemberlakuan atas aturan–aturan dalam
pengguanaan symbol angka untuk mempresentasikan jumlah kuantitatif atribut
suatu fenomena atau suatu yang dijadikan objek pengukuran. Baik jumlah
kuantitatif atribut suatu fenomena atau objek yang bersifat konkret maupun
jumlah kuantitatif atribut suatu fenomena atau objek yang bersifat abstrak.
Secara garis besar, alat evaluasi yang biasa digunakan dapat
digolongkan menjadi dua macam, yaitu bukan tes (non test) dan tes. Selanjutnya
bukan tes (non test) dan tes ini juga disebut sebagai teknik evaluasi.
1. Bukan tes (non test).
Yang tergolong dalam alat ukur non test adalah:
a) Skala bertingkat (rating scale).
b) Kuesioner (questionair).
c) Daftar cocok (check list).
d) Wawancara (interview).
e) Pengamatan (observation).
f) Riwayat hidup.
Berikut keterangan dari setiap alat pengukur tersebut :
a) Skala bertingkat (rating scale).
Skala menggambarkan suatu nilai yang berbentuk angka terhadap sesuatu
hasil pertimbangan. Seperti Oppenheim mengatakan: Rating gives a
numerical value to some kind of judgement, maka suatu skala selalu
disajikan dalam bentuk angka. Kita dapat menilai hampir segala
sesuatunya dengan skala. Dengan maksud agar pencatatannya dapat
objektif maka penilaian terhadap penampilan atau penggambaran
kepribadian seseorang disajikan dalam bentuk skala.
b) Kuesioner (questionair).
Kuesioer sering juga dikenal sebagai angket. Pada dasarnya kuesioner
adalah sebuah daftar pertanyaan yang harus diisi orang yang akan diukur
(responden). Dengan kuesioner ini orang dapat diketahui tentang
keadaan/data diri, pengalaman, pengetahuan sikap atau pendapatnya, dan
lain-lain.
c) Daftar cocok (ceck list).
Yang dimaksud dengan daftar cocok adalah deretan pertanyaan (yang
biasanya singkat-singkat), dimana responden yang dievaluasi tinggal
membubuhkan tanda cocok di tempat yang sudah disediakan.
d) Wawancara (interview).
Wawancara adalah suatu metode atau cara yang digunakan untuk
mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak.
Dikatakan sepihak karena dalam wawancara ini responden tidak diberi
kesempatan sama sekali untuk mengajukan pertanyaan. Pertanyaan
hanya diajukan oleh subjek evaluasi.
e) Pengamatan (observation).
Pengamatan adalah suatu teknik yang dilakukan dengan cara
mengadakan pengamatan secara teliti serta pencatatan secara sistematis.
Ada 2 macam observasi:
 Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat,
tetapi dalam pada itu pengamat memasuki dan mengikuti kegiatan
kelompok yang sedang diamati.
 Observasi sistematik, yaitu observasi dimana faktor-faktor yang
diamati sudah didaftar secara sistematis dan sudah diatur menurut
kategorinya. Berbeda dengan observasi partisipan, maka dalam
observasi sistematik ini pengamat berada diluar kelompok.
f) Riwayat hidup.
Riwayat hidup adalah gambaran tentang keadaan seseorang selama
dalam masa kehidupannya. Dengan mempelajari riwayat hidup, maka
subjek evaluasi akan dapat menarik suatu kesimpulan tentang
kepribadian, keabiasaan, dan sikap dari objek yang dinilai.
2. Tes
Dalam kenyataannya ada bermacam-macam rumusan berkaitan
dengan tes. Di dalam bukunya yang berjudul Evaluasi Pendidikan, Drs.
Amir Daien Indrakusuma mengatakan demikian: ”Tes asalah suatu alat atau
prosedur yang sistematis dan objektif untuk memperoleh data-data atau
keterangan-keterangan yang diinginkan tentang seseorang, dengan cara
yang boleh dikatakan tepat dan cepat”.
Selanjutnya, di dalam bukunya; Teknik-teknik Evaluasi, Muchtar Bukhori
mengatakan: ”Tes adalah suatu percobaan yang diadakan untuk mengetahui
ada atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid atau
kelompok murid”.
Yang kurang lebih artinya sebagai berikut: Tes adalah serentetan pertanyaan
atau latihan atau alat lain yang digunakan untuk mengukur ketrampilan,
pengetahuan, inteligensi, kemampuan atau bakat yang dimiliki oleh individu
atau kelompok. Dari beberapa kutipan dan uraian diatas dapat disimpulkan
bahwa tes merupakan suatu alat pengumpul informasi tetap jika
dibandingkan dengan alat-alat yang lain, tes ini bersifat lebih resmi karena
penuh dengan batasan-batasan. Ditinjau dari segi kegunaan untuk mengukur
siswa, maka dibedakan atas adanya 3 macam tes, yaitu:
1. Tes diagnostik.
2. Tes formatif.
3. Tes sumatif.
Dalam evaluasi belajar mengajar dikenal dua tes yaitu tes objektif dan tes
subjektif.
Kedua tes ini mempunyai perbedaan yang cukup signifikan.
1. Pengertian tes objektif
Tes objektif adalah tes yang dilakukan dengan menggunakan ukuran-ukuran
yang sudah ditentukan. Contohnya multiple choice (pilihan ganda).
Dalam tes objektif ini siswa tinggal memilih beberapa opsi sesuai dengan
pertanyaan yang disediakan. Dari opsi tersebut ada jawaban breaker, satu
jawaban yang mirip dengan jawaban yang benar.
2. Pengertian tes subjektif
Tes subjektif adalah tes yang dilakukan dengan ukuran-ukuran berdasarkan
kategori. Contohnya tes essay atau uraian.
Tes uraian menuntut siswa untuk menjawab soal dengan kemampuan yang
ia miliki. Tidak masalah apakah ia menjawab panjang atau pendek.
Penilaian tes subjektif dilakukan berdasarkan kategori yang ditentukan oleh
pembuat soal. Walaupun jawabannya panjang tapi tidak sesuai dengan
kategori yang ditentukan pembuat soal, maka skornya belum tentu tinggi.
Ada pula kelebihan dan kekurangan dari tes objektiv dan tes subjektif,
sebagai berikut :
 TES OBJEKTIF
Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara
objektif. Hal ini dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes
bentuk essai. Contohnya multiple choice (pilihan ganda).
a. Kelebihan Test Objektif yaitu:
1. Untuk menjawab test objektif tidak banyak memakai waktu.

2. Reabilitasnya lebih tinggi kalau di bandingkan dengan test Essay, karena
penilainnya bersifat objektif.
3. Pemberian nilai dan cara menilai test objektif lebih cepat dan mudah karena
tidak menuntut keahlian khusus dari pada si pemberi nilai.
4. Lebih mudah dan cepat cara memeriksanya karena dapat menggunakan
kunci tes bahkan alat-alat hasil kemajuan teknologi.
5. Untuk menjawab test objektif tidak banyak memakai waktu
6. Pemeriksaanya dapat diserahkan orang lain.
7. Tes Objektif tidak memperdulikan penguasaan bahasa, sehingga mudah
dilaksanakan.
b. Kelemahan Test Objektif yaitu :
1. Murid sering menerka-nerka dalam memberikan jawaban, karena mereka

belum menguasai bahan pelajaran tersebut.
2. Memang test sampling yang diajukan kepada murid- murid cukup banyak,
dan hanya membutuhkan waktu yang relative singkat untuk menjawabnya
3. Tidak biasa mengajak murid untuk berpikir taraf tinggi.
4. Banyak memakan biaya, karena lembaran item- item test harus sebanyak
jumlah pengikut test.
5. Kerjasama antar peserta didik pada waktu mengerjakan soal tes lebih
terbuka.
 Tes obyektif ini terdiri dariberbagai macam bentuk, antara lain ;

1. Salah- Benar atau True- False (T- F)
Bentuk tes benar salah memiliki soal yang berupa statemen. Statemen tersebut
dapat disusun sedemikian rupa, ada yang benar dan ada yang salah.
a. Kelebihan S - B yaitu :
1. Soal ini baik untuk hasil- hasil, dimana hanya ada dua alternative jawaban.
2. Tuntutan kurang ditekankan pada kemampuan baca.
3. Tidak begitu sulit menentukan jawaban pengecoh.
4. Pembuatan soal relative lebih mudah karena hanya mengarah pada 2
option jawaban.
5. Tidak perlu membuat jawaban pengecoh
b. Kelemahan S - B yaitu
1. Sulit menuliskan soal diluar tingkat pengetahuan yang bebas dari maksud
ganda.
2. Jawaban soal tidak memberikan bukti bahwa siswa mengetahui dengan
baik.
3. Tidak bisa untuk mengukur kemampuan analisa.
4. Kurang cocok untuk soal hitungan
5. Soal kurang bervariasi.
6. Tidak ada informasi diagnostic dari jawaban yang salah.
7. Memungkinkan dan mendorong siswa untuk menerka-nerka.
2. Pilihan Berganda atau Multiple Choise ( M- Ch)

Tes pilihan ganda merupakan tes yang menggunakan pengertian/
pernyataan yang belum lengkap dan untuk melengkapinya maka kita harus
memilih satu dari beberapa kemungkinan jawaban benar yang telah disiapkan.
Tes pilihan ganda adalah bentuk test yang mempunyai satu jawaban yang benar
atau paling tepat.
a. Kelebihan Pilihan Berganda yaitu:
1. Hasil belajar yang sederhana sampai yang komplek dapat diukur.
2. Terstruktur dan petunjuknya jelas.
3. Alternatif jawaban yang salah dapat memberikan informasi diagnostik.
4. Tidak dimungkinkan untuk menerka jawaban.
5. Dapat diaplikasikan dengan komputer baik penampilan soal dan
perhitungan nilainya, interaktif
b. Kelemahan Pilihan Berganda yaitu:
1. Menyusunnya membutuhkan waktu yang lama.
2. Sulit menemukan pengacau
3. Kurang efektif mengukur beberapa tipe pemecahan masalah, kemampuan
untuk mengorganisir dan mengekspresikan ide.
4. Kurang menggambarkan sebuah proses
5. Tingkat kemampuan yang terukur sangat terbatas
6. Jumlah soal harus banyak agar dapat mewakili semua materi yang telah
dipelajari
7. Nilai dapat dipengaruhi dengan kemampuan baca.
3. Isian atau Completion

Tes isian terdiri dari kalimat yang dihilangkan (diberi titik-titik). Bagian yang
dihilangkan ini yang diisi oleh peserta tes merupakan pengertian yang diminta
agar pernyataan yang dibuat menjadi pernyataan yang benar.
a. Kelebihan Isian atau Completion yaitu :
1. Sangat mudah dalam penyusunannyaLebih menghemat tempat (
menghemat kertas).
2. Persyaratan komprehensif dapat dipenuhi oleh test model ini.
3. Digunakan untuk mengukur berbagai taraf kompetensi dan tidak sekedar
mengungkap taraf pengenalan atau hafalan saja.
b. Kelemahan Isian atau Completion yaitu :
1. Lebih cenderung mengungkap daya ingat atau aspek hafalan saja.
2. Butir- butir item dari test model ini kurang relevan untuk diajukan.
3. Tester kurang berhati-hati dalam menyusun kalimat dalam soal.
4. Jawaban Singkat atau Short Answer

Bentuk tes jawaban singkat ini menghendaki jawaban dengan kalimat dan
atau angka-angka yang hanya dapat dinilai benar atau salah. Soal bentuk
jawaban singkat biasanya dekemukakan dalam bentuk pertanyaan. Dengan
kata lain, item tersebut berupa suatu kelimat bertanya yang dapat dijawab
dengan singkat.
a. Kelebihan Jawaban Singkat yaitu :
1. Mudah dalam perbuatan
2. Kemungknan menebak jawaban sangat sulit
3. Cocok untuk soal- soal hitungan
4. Hasil- hasil pengetahuan dapat diukur secara luas
b. Kelemahan Jawaban Singkat yaitu:
1. Sulit menyusun kata- kata yang jawabannya hanya satu.
2. Tidak cocok untuk mengukur hasil- hasil belajar yang komplek.
3. Penilaian menjemukan da memerlukan waktu banyak.
5. Menjodohkan atau Matching

Soal menjodohkan sebenarnya masih merupakan pilihan ganda. Perbedaanya
adalah pilihan ganda terdiri atas item dan option, kemudian testi tinggal
memilih salah satu option yang diberikan. Sedangkan bentuk menjodohkan
terdiri atas kumpulan soal dan kumpulan jawaban yang keduanya
dikumpulkan pada dua kolom yang berbeda. Kolom sebelah kiri menunjukan
kumpulan soal, dan kolom sebelah kanan menunjukan kumpulan jawaban.
Jumlah alternatif jawaban harus dibuat lebih banyak daripada soal.
a. Kelebihan Menjodohkan yaitu:
1. suatu bentuk yang efisien diberikan dimana sekelompok respon sama
menyesuaikan dengan rangkaian isi soal.
2. Waktu membaca dan merespon relative singkat.
3. Mudah untuk dibuat.
4. Mudah dalam pengoreksian.
5. Memudahkan siswa menjawab soal karena jawaban sudah tersedia.
6. Penilaian mudah, objektif dan dapat dipercaya
b. Kelemahan Menjodohkan yaitu:
1. Materi soal dibatasi oleh faktor ingatan/ pengetahuan yang sederhana dan
kurang dapat dipakai untuk mengukur penguasaan yang bersifat pengertian
dan kemampuan membuat tafsiran.
2. Sulit menyusun soal yang mengandung sejumlah respon yang homogen.
3. Terlalu banyak jawaban yang harus dipilih.
4. Sulit mencari pasangan-pasangan yang relevan dengan soal.
5. Hanya mengukur materi yang bersifat hapalan/recall.
6. Bila yang belum terjawab tinggal sedikit dapat ditebak.
 TES SUBJEKTIF
Pada umumnya test subjektif berbentuk tes esai (uraian). Ciri-ciri pertanyaanya
didahului dengan kata-kata seperti, uraikan, jelaskan, mengapa, bagaimana,
bandingkan, simpulkan dan sebagainya.
a. Kelebihan Test Subjektif yaitu:
1. Mudah dipersiapkan dan disusun.
2. Tidak memberi banyak kesempatan untuk berspekulasi.
3. Mendorong peserta didik untuk berani mengemukakan pendapat serta
menysun dalam bentuk kalimat yang bagus.
4. Memberi kesempatan kepada peserta didik untuk mengutarakan maksudnya
dengan gaya bahasa dan carannya sendiri.
5. Dapat mengetahui sejauhmana peserta didik mendalami suatu masalah yang
diujikan/dites.
b. Kelemahan Test Subjektif yaitu:
1. Terbatasnya lingkup bahan pelajaran yang dinilai dan sulitnya mengoreksi
jawaban dengan objektif.
2. Kadar validitas dan realibilitas rendah karena sukar diketahui segi-mana dai
pengetahuan siswa yang betul-betul telah dikuasai.
3. Kurang representatif dalam hal mewakili seluruh scope bahan pelajaran yang
akan dites karena soalnya hanya beberapa saja (terbatas).
4. Cara pemeriksaannya banyak dipengaruhi oelh unsur-unsur subjektif.
5. Pemeriksaaannya lebih sulit sebab membutuhkan pertimbangan individual
lebih banyak dari penilai.
6. Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada orang lain.
• Bentuk-bentuk Tes Subjektif:

1. Test Essay
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa
menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa
sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam
menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri.
a. Kelebihan Test Essay yaitu :
1. Peserta didik dapat mengorganisasikan jawaban dengan pendapatnya
sendiri.
2. Murid tidak dapat menerka- nerka jawaban soal.
3. Test ini sangat cocok untuk mengukur dan mengevaluasi hasil suatu
proses belajar yang kompleks yang sukar diukur dengan
mempergunakan test objektif.
4. Derajad ketepatan dan kebenaran murid dapat dilihat dari kalimat-
kalimatnya.
5. Jawaban diungkapakan dalam kata- kata dan kalimat sendiri, sehingga
test ini dapat digunakan untuk melatih penyusunan kalimat dengan
bahasa yang baik, benar, dan cepat.
6. Test ini digunakan dapat melatih peserta didik untuk memilih fakta yang
relevan dengan persoalan, dan Sukar dinilai secara tepat
mengorganisasikannya sehingga dapat mengungkapkan satu hasil
pemikiran yang terintegrasi secara utuh.
b. Kelemahan Test Essay yaitu:
1. Sukar dinilai secara tepat.
2. Bahan yang diukur terlalu sedikit, sehingga agak sulit untuk mengukur
penguasaan siswa terhadap keseluruhan kurikulum.
3. Sulit mendapatkan soal yang memiliki standar nasional maupun
internasional.
4. Membutuhkan waktu memeriksa hasilnya.
2. Test Lisan
Tes lisan adalah tes yang pelaksanaannya dilakukan dengan mengadakan tanya
jawab secara langsung antara pendidik dan peserta didik. tes ini termasuk kelompok
tes verbal, yaitu tes soal dan jawabannya menggunakan bahasa lisan.
a. Kelebihan tes lisan :
1. Dapat menilai kemampuan dan tingkat pengetahuan yang dimiliki peserta
didik, sikap, serta kepribadiannya karena dilakukan secara berhadapan
langsung.
2. Bagi peserta didik yang kemampuan berpikirnya relatif lambat sehingga
sering mengalami kesukaran dalam memahami pernyataan soal, tes bentuk
ini dapat menolong sebab peserta didik dapat menanyakan langsung
kejelasan pertanyaan yang dimaksud.
3. Hasil tes dapat langsung diketahui peserta didik.
b. Kelemahan tes lisan :
1. Subjektivitas pendidik sering mencemari hasil tes,
2. Waktu pelaksanaan yang diperlukan.
4.3 Prosedur pengukuran dalam evaluasi pembelajaran
Tujuan utama kegiatan pengukuran dalam evaluasi pembelajaran adalah

untuk mengetahui apakah kompetensi dasar yang seharusnya dicapai dalam
serangkaian pembelajaran sudah dikuasai siswa atau belum. Sebagai konsekuensi
dari sifat atribut fenomena (yang bersifat konkret atau abstrak) , pada upaya
penggunaan simbul atribut kuantitas dengan angka dalam suatu aktifitas
pengukuran yang perlu dibuat kesepakatan terhadap dua makna sifat kuantitatif.
1. Penggunaan berbagai simbul atau lambang angka dalam aktivitas
pengukuran yang memiliki makna kuantitatif dimaknai sebagai suatu yang
mutlak absolut yang hanya berlaku pada objek yang terkandung pada angka
atau bilangan bulat yang bersifat deskrit. contoh : dari karakteristik hasil
data atau informasi dalam konteks ini dapat diberikan yaitu keberadaan
jumlah penduduk suatu wilayah tertentu (desa, kelurahan, kecamatan,
kabupaten, propinsi, atau Negara). Begitu juga dikatakan dalam bentuk
angka atau bilangan bulat dan bersifat deskrit karena dalam konteks ini
tidak mengandung unsur bilangan pecah (0,3; 0,5; 0,6 dan seterusnya).
2. Simbul atau lambang angka dalam aktivitas pengukuran yang tidak
memiliki makna kuantitatif dan lebih bermakna sebagai penunjuk yang
bersifat kategorial. Misalnya, dalam pemerian suatu data macam pemeluk
agama di suatu wilayah masyarakat tertentu. Penggunaan angka 1, 2, atau
3 dalam konteks ini lebih bermakna kategorial. Misalnya angka 1 diberikan
makna kelompok penduduk yang beragama islam, angka 2 diberikan makna
kelompok penduduk yang beragama Kristen, angka 3 diberikan makna
kelompok penduduk yang beragama hindu, dan seterusnya.
Untuk menentukan ketepatan aspek yang hendak diukur untuk suatu

kompetensi perlu disusun prosedur penilaian yang biasanya dituangkan dalam
kisi-kisi pengukuran, seperti:
a) Menetapkan aspek yang hendak diukur.
b) Alat penilaian, seperti tes prestasi belajar, dan pengumpulan dokumen.
c) Menentukan teknik pengukurannya, seperti tes tertulis, lisan, dan
perbuatan.
d) Menentukan bentuk soal atau tugas dengan pedoman penyekorannya.
Disamping itu, masih diperlukan upaya memenuhi persyaratan tuntutan
yang lain yaitu validitas, kualitas butir, konsistensi, dan realibilitas dari
kumpulan pernyataan atau pertanyaan dalam wujud instrumen pengukuran.
Daftar Pustaka
Arifin, Zaenal. 2010. Evaluasi Pembelajaran. PT Remaja Rosdakarya : Bandung.

Aunurrahman. 2010. Belajar dan Pembelajaran.CV Alfabeta : Bandung.
Dimyati & Mudjiono. 2006. Belajar dan Pembelajaran. PT Rineka Cipta : Jakarta.
Hamalik, Oemar. 2008. Kurikulum dan Pembelajaran. PT Bumi Aksara : Jakarta.
Mukhadis, A. 2013. Evaluasi Program Pembelajarn Bidang Teknologi. Malang:
Bayu Media Publishing.
Sukardi, M. 2008. Evaluasi Pendidikan Prinsip dan Operasionalnya. Jakarta: Bumi
Aksara.
Arikunto, Suharsimi (1995). Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi
Aksara
Nurkancana, Wayan dan Sumartana, PPN (1986). Evaluasi Pendidikan. Surabaya :

Usaha Nasional
Soedijarto (1993). Menuju Pendidikan Nasional yang Relevan dan Bermutu. Jakarta
: Balai Pustaka
Subino. (1987). Konstruksi dan Analisis Tes : Suatu Pengantar Kepada Teori Tes
dan Pengukuran. Jakarta : Ditjen Dikti Debdikbud
Pertemuan ke-5: Topik Diskusi Langkah-langkah Perencanaan dan
Pengembangan Alat Evaluasi dan Penilaian Pembelajaran (test non test)
5.1 Langkah-langkah pengembangan alat evaluasi dan penilaian

pembelajaran
Menurut (Joni, 1984) pengembangan adalah suatu upaya atau suatu proses
sistematik untuk menghasilkan suatu produk (bisa berwujud sistem, model,
peralatan, atau prosedur operasional) sebagai representasi wahana dalam
pemecahan masalah berdasarkan prinsip-prinsip tertentu pada ranah masalah yang
dipecahkan. Keberhasilan suatu kegiatan evaluasi akan dipengaruhi pula oleh
keberhasilan evaluator dalam melaksanakan prosedur evaluasi. Prosedur yang
dimaksud adalah langkah-langkah pokok yang harus ditempuh dalam kegiatan
evaluasi. Prosdur atau langakah pengembangan alat evaluasi dan penilaian
pembelajaran di uaraikan sebagai berikut:
1. Identifikasi Informasi Awal yang Relevan
Sebagai langkah awal dalam kegiatan pengembangan alat evaluasi yaitu

melakukan idntifikasi terhadap isu-isu penting yang dijadikan sebagai informasi
awal yang berkaitan dngan pokok kajian atau konteks ranah yang akan dijadikan
sebagai objek sasaran evaluasi. Menurut Prof. Dr. A. Mukhadis (2013:263)
Prosedur atau langkah yang ditempuh dalam upaya mengungkap, mengidentifikasi,
dan pada akhirnya memerikan isu-isu penting sebagai informasi awal dalam
pengembangan suatu alat evaluasi diuraikan berikut ini.
1.1.Ranah sebagai objek evaluasi
Secara umum ranah yang dijadikan objek sasaran evaluasi program, bila
dipilah dengan mengacu pada pola berpikir sistem dapat diidentifikasi menjadi
ranah masukan (input), ranah proses (process), dan ranah keluaran (output). Pola
pikir ini menjadi syarat bagi terwujudnya suatu program. Secara lengkap ranah yang
dijadikan objek sasaran evaluasi program menurut Stufflebeam yang telah
disempurnakan oleh generasi penerusnya yaitu bernama Kaufman dan Thomas,
mencakup Contex, Input, Process, Product, Output dan Outcome (CIPPOO).
1.2.Identifikasi, Pemilihan dan Penetapan tujuan evaluasi
Terdapat 2 jenis penetapan tujuan evaluasi, yaitu formatif dan sumatif.
Apabila kegiatan evaluasi mengarah pada upaya pengumpulan data atau informasi
yang dapat digunakan untuk menentukan langkah-langkah perbaikan pada suatu
ranah proses, baik pada satu atau beberapa ranah yang dijadikan sasaran evaluasi,
maka tujuan kegiatan evaluasi ini dikategorikan dalam tujuan evaluasi program
yang bersifat formatif (Bellanca,vdkk. 1997; Kufaman dan Thomas, 1980; dan Piere
dan Lorber, 1977). Namun, apabila kegiatan evaluasi program yang dilakukan
mengarah pada upaya pengumpulan data atau informasi yang dapat digunakan
untuk menentukan langkah-langkah peningkatan kualitas hasil (misalnya, tingkat
efektivitas, efisiensi, kemenarikan, relevansi dan produktivitas) dari suatu program,
maka tujuan kegiatan evaluasi semacam ini dikategorikan ke dalam tujuan evaluasi
yang bersifat sumatif (Bellanca,vdkk. 1997; Kufaman dan Thomas, 1980; dan Piere
dan Lorber, 1977).
1.3.Menentukan jenis dan sumber informasi
Sesuatu hal yang esensi dalam suatu kegiatan evaluasi program adalah
adanya upaya sistematik dalam mengumpulkan berbagai jenis informasi atau data
yang relevan dengan ranah konteks yang dijadikan objek sasarana evaluasi dan
tujuan dilakukannya kegiatan evaluasi. Jenis, jumlah, kualitas dan relevansi
informasi atau data yang diperoleh kemudian diolah, dan dianalisis dengan teknik
dan rumus statistik tertentu ini menjadi faktor yang sangat menentukan terhadap
ketepatan dan kualitas interpretasi sebagai representasi dari simpulan hasil evaluasi.
Penentuan terhadap jenis data atau informasi yang perlu dipertimbangkan
dalam hal ini, dapat dipandu dengan suatu pertanyaan. Selain itu, pertimbangan lain
yang terkait dengan upaya peningkatan ketepatan data atau informasi yang
dibutuhkan dalam kegiatan evaluasi adalah dari sisi relevansi, kualitas, dan
kuantitas dari informasi yang diperlukan.
1.4.Memilih dan mentapkan jenis dan bentuk instrumen
Kegiatan memilih dan menetapkan jenis serta bentuk instrumen ini
dilakukan setelah konteks ranah yang dijadikan objek sasaran evaluasi, tujuan
evaluasi, dan jenis dan sumber informasi sebagai responden telah selesai ditetapkan.
Dengan kata lain, pemilihan dan penetapan jenis dan bentuk instrumen yang akan
digunakan dalam kegiatan evaluasi keberadaannya sangat tergantung pada
karakteristik konteks ranah yang dijadikan objek sasaran evaluasi, tujuan evaluasi,
dan jenis serta sumber informasi sebagai responden telah ditetapkan dalam kegiatan
evaluasi.
1.5.Strategi pengumpulan dan analisis data
Pentingnya melakukan pertimbangan secara cermat terhadap alternatif
strategi pengumpulan dan analisis data yang dibutuhkan dalam pelaksanaan
pengembangan alat ukur atau instrumen evaluasi. Hal ini berdasarkan pada
pertimbangan bahwa dalam penggunaan strategi pengumpulan data atau informasi
yang berbeda pada suatu konteks ranah yang dijadikan objek sasaran evaluasi yang
sama kemungkinan besar akan diperlukan jenis dan bentuk instrumen yang berbeda.
1.6.Mengidentifikasi ktersediaan instrumen evaluasi baku
Sebagai upaya untuk meningkatkan besaran tingkat efektivitas dan efesiensi
dalam melakukan pengembangan instrumen evaluasi perlu juga
mempertimbangkan keberadaan instrumen baku pada konteks ranah yang akan
dijadikan sasaran evaluasi. Keberadaan instrumen baku yang dimaksud adalah jenis
dan bentuk instrumennya memiliki karakteristik yang sama dan juga yang
diperuntukkan untuk pengumpulan data pada konteks ranah suatu program yang
sama. Tingkat kebakuan (standar) instrumn ini ditunjukkan dengan dengan
keberadaan penjaminan dari sisi kualitas, relevansi dan kepraktisan dalam
penerapannya.
2. Langkah-langkah Pengembangan Instrumen Evaluasi

Menurut Prof. Dr. A. Mukhadis (2013:286) Secara umum instrumen
evaluasi program dapat dipilah ke dalam dua kategori. Kedua kategori yang
dimaksud adalah katgori nstrumen jenis tes dan katgori instrumen jenis nontes.
Pembeda utama diantara kedua kelompok instrumen evaluasi ini adalah dari
karakteristik respon jawaban daro responden yang dijadikan sasaran pengukuran.
2.1.Langkah-langkah pengembangan instrumen bentuk nontes
Langkah-langkah atau prosedur alam upaya mengembangkan instrumen
evaluasi yang termasuk kelompok nontes dapat diperikan sebagai berikut. Pertama,
melakukan identifikasi, memilih dan pada akhirnya menetapkan ranah, fenomena,
faktor atau variabel yang dapat berupa konsep atau konstruk yang akan dijadikan
sebagai objek sasaran pengukuran. Kedua, memberikan batasan konseptual dan atau
batasan operasional terhadap ranah, fenomena, faktor atau variabel yang akan
dijadikan sebagai objek sasaran pengukuran. Ketiga, mengkaji akan keberadaan dan
representativeness cakupan jabaran isi dimensi dari setiap ranah, fenomena, faktor
atau variabel yang akan dijadikan sebagai objek sasaran pengukuran.
Keempat, melakukan penjabaran sampling isi esensial dari setiap dimensi
ranah isi yang relevan dan reprsentatif le dalam bentuk deskriptor-deskriptor.
Kelima, mengkaji keberadaan dan representativeness cakupan jabaran isi deskriptor
setiap dimensi dari setiap ranah, fenomena, faktor atau variabel yang akan dijadikan
objek sasaran pengukuran. Keenam, melakukan penjabaran isi deskriptor-
deskriptor dari stiap dimensi yang relevan dan representatif ke dalam bentuk
pertanyaan atau pertanyaan sebagai representatif butir instrumen. Ketujuh,
mengkaji keberadaan dan representativeness cakupan jabaran isi butir-butir
pertanyaan setiap deskriptor.
Jenis Instrumen Evaulasi Non-Tes
Ranah/Domain Objek yang Dievaluasi
Sub-Ranah/Domain Objek Sub-Ranah/Domain Objek

yang Dievaluasi yang Dievaluasi
Sampel Isi Sampel Isi Sampel Isi Sampel Isi

Esensial Esensial Esensial Esensial
Deskripto Deskripto Deskripto Deskripto Deskripto Deskripto

r r r r r r
B B B B B B B B B B B B
P P P P P P P P P P P P
BP = Butir Pertanyaan
Gambar . Model Pengembangan Instrumen Evaluasi Non-Tes
Langkah-langkah dalam kerangka model pengembangan instrumen evaluasi jenis

non-tes dapat dijelaskan sebagai berikut. Pertama, mengambil keputusan dalam penentuan
ranah atau domain yang dijadikan sebagai objek sasaran evaluasi. Kedua, menjabarkan
ranah atau domain terpilih kedalam bentuk yang lebih rinci yaitu dalam wujud pemerian
beberapa sub-ranah atau sub-domain yang dijadikan sebagai objek sasaran evaluasi. Ketiga,
memilih dan menetapkan skala prioritas dari sampel isi esensial setiap pemerian sub-ranah
atau domainyang dijadikan sebagai objek sasaran evaluasi. Keempat, melakukan
penjabaran setiap sampel isi esensial kedalam bentuk yang lebih rinci yaitu menjadi
beberapa deskriptor yang dijadikan sebagai objek sasaran evaluasi. Kelima, memilih,
merancang, dan mengkonstruksi bentuk pertanyaan atau butir pertanyaan dan opsi alternatif
jawaban yang mengacu pada setiap pemerian deskriptor yang dijadikan sebagai wahana
stimulus bagi responden.
2.2.Langkah-langkah pengembangan instrumen bentuk tes

Langkah-langkah atau prosedur yang perlu ditempuh dalam
mengembangkan instrumen evaluasi kelompok tes dapat diperikan meliputi hal-hal
sebagai berikut. Pertama, melakukan telaah standar kompetensi, kompetensi dasar
(subkompetensi) yang akan dijadikan objek sasaran pengukuran. Kedua, hasil
telaah standar kompetensi dan kompetensi dasar atau subkompetensi serta batasan
operasionalnya, kemudian dijabarkan lagi menjadi bagian yang lebih rinci ke dalam
indikator-indikator penguasaan kompetensi yang dituangkan ke dalam rancangan
pengembangan tes dalam bentuk kisi-kisi. Ketiga, melakukan telaah kisi-kisi secara
silang oleh ahli bidang studi yang relevan yang bukan sebagai penulis kisi-kisi.
Keempat, apabila memungkinkan dikembangkan spesifikasi butir pertanyaan yang
dapat memberi gambaran konkret terjemahan dan tau contoh butir untuk setiap
indikator diujikan, dengan maksud untuk memudahkan nantinya dalam proses
pembuatan tes paralel. Kelima, penulisan butir pertanyaan, sebaiknya dalam
menuliskan butir pertanyaan sebagai wujud penjabaran indikator esensial terpilih
dimulai dengan menuliskan konsep pokok material uji, agar dapat dikembangkan
situasi atau kondisi yang mungkin dijumpai peserta (testee) dalam kehidupan
sehari-hari. Keenam, malkukan telaah butir pertanyaan secara silang oleh ahli
bidang studi yang relevan dan yang bukan sebagai penulis butir pertanyaan.ketujuh,
melakukan kompilasi butir-butir tes (pertanyaan) sesuai dengan kelompok
subkompetensi dan indikator serta dilengkapi dengan petunjuk teknis pengerjaan,
kunci jawaban, dan rubik yang diperlukan. Kedelapan, mencermati naskah tes agar
terbebas dari kesalahan terhadap unsur pengetikan, penggunaan bahasa Indonesia,
pemakaian tanda baca, simbol atau lambang, dan berbagai kesalahan lain yang tidak
perlu. Terakhir, apabila dipandang perlu hasil pengembangan instrumen tes ini
dilakukan uji coba empirik pada sampel testee yang memiliki karakteristik relatif
sama dengan karakteristik target sasaran.
Jenis Instrumen Evaulasi Tes
Kompetensi Objek yang Dievaluasi
Sub-Ranah/Domain Kompetensi Sub-Ranah/Domain Kompetensi

Objek yang Dievaluasi Objek yang Dievaluasi
Sampel Isi Sampel Isi Sampel Isi Sampel Isi

Esensial Esensial Esensial Esensial
Indikator Indikator Indikator Indikator Indikator Indikator
B B B B B B B B B B B B
P P P P P P P P P P P P
BP = Butir Pertanyaan
Gambar . Model pengembangan instrumen evaluasi jenis tes.
Langkah-langkah dalam kerangka model pengembangan instrumen evaluasi

jenis tes dapat dijelaskan sebagai berikut. Pertama, mengambil keputusan dalam
penentuan ranah kompetensi yang dijadikan sebagai objek sasaran evaluasi. Kedua,
menjabarkan ranah kompetensi terpilih tersebut ke dalam bentuk yang lebih rinci
yaitu dalam wujub pemerian beberapa sub-ranah kompetensi. Ketiga, memilih dan
menetapkan skala prioritas dari sampel isi esensial setiap pemerian sub-ranah
kompetensi. Keempat, melakukan penjabaran setiap sampel isi esensial ke dalam
bentuk yang lebih rinci yaitu menjadi beberapa indikator. Kelima, memilih,
merancang, dan mengkonstruksi bentuk pertanyaan atau butir pertanyaan dan opsi
alternatif jawaban yang mengacu pada setiap pemerian indikator sebagai stimulus
bagi testee.
Daftar Rujukan
Bellanca,vdkk. 1997; Kufaman dan Thomas, 1980; dan Piere dan Lorber, 1977
Joni.1984.tentang pengembangan.
Mukhadis, A. 2013. Evaluasi Program Pembelajaran Bidang Teknologi
(Terminologi,Prosedur Pengembangan Program dan Instrumen). Malang:
Media Nusa Creative.
Newman ,William H.2004. Administrative Active Techniques of Organization and
Management.
Pertemuan ke-6: Topik Diskusi Evaluasi Kritis Terhadap Alat Evaluasi dan
Penilaian di Latar Pendidikan Saat Ini
6.1 Validalitas Intrumen Evaluasi

Salah satu karakteristik keefektifan intrumen evaluasi yang paling penting
yang dapat digunakan sebagai bentuk jaminan terhadap kualitas instrumen yang
digunakan sebagai alat ukur dalam pengumpulan data atau informasi adalah
ditunjukkan dengan tingkat validalitas instrumen. Tingkat validalitas suatu
instrumen evaluasi dapat ditunjukkan dengan representasi kualitatif dan atau
kuantitatif. Indikator validitas instrumen evaluasi yang ditunjukkan dengan bentuk
kualitatif berupa pernyataan atau pendapat dari beberapa ahli yang relevan di bidang
yang dijadikan objek sasaran suatu pengukur. Sedangkan indikator validitas
instrumen evaluasi yang ditunjukkan dengan bentuk kuantitatif dapat berupa
besaran skor kuantitatif yang diperoleh dari hasil pengumpulan, pengolahan dan
analisis data hasil ujicoba secara empirik di lapangan dalam jumlah yang memadai
dengan teknik dan rumus statistik tertentu serta memenuhi kriteria tertentu yang
digunakan sebagai acuan.
Reprentasi indikator keefektifan suatu instrumen evaluasi, baik yang
ditunjukkan secara kualitatif maupun secara kuantitatif dapat diperoleh dan
ditentukan dari aktivitas yang disebut dengan pelaksanaan validasi instrumen.
Aktivitas sebagai upaya dalam pelaksanaan validasi suatu instrumen evaluasi dapat
dilakukan dengan beberapa pendekatan yang relevan. Indikator relevansi dari
pemilihan dan yang pada akhirnya menentukan pendekatan yang digunakan dalam
upaya melakukan validasi suatu instrumen antara lain tergantung pada variasi jenis
dan bentuk dari instrumen yang akan divalidasi.
Validasi Isi
Validitas isi merupakan indikator karakteristik keefektifan instrumen
evaluasi yang paling penting. Mengapa dikatakan demikian? Sebab secara umum
keberadaan indikator validitas isi ini dapat dijadikan sebagai petunjuk penting yang
terkait dengna aspek keterwakilan (representativeness) setiap atau sekelompok
dimensi atau isi-isi sampel penting dari sosok keterampilan, pengetahuan, atau
sikap yang dijadikan suatu objek sasaran pengukkuran (Marzano, Pickering dan
McTighe, 1994).
Upaya untuk menilai atau mengukur tingkat validitas isi suatu instrumen
evaluasi dalam suatu aktivitas pengembangan instrumen evaluasi dapat ditempuh
dengan beberapa prosedur tertentu. Langkah-langkah atau prosedur dalam
mengembangkan instrumen dan mengukur tingkat validitas isi suatu instrumen
evaluasi minimal dapat diklasifikasikan menjadi enam tahapan.
1. Pertama, mengidentifikasi, memilih dan yang pada akhirny amenetapkan
ranah, dimensi, fenomena, atau konsep yang akan dijadikan sebagai objek
sasaran pengukuran.
2. Kedua, memberikan batasan operasional terhadap ranah, dimensi atau
fenomena yang akan dijadikan sebgai objek sasaran pengukkuran, sehingga
menjadi jelas sosok dari setiap ranah, dimensi, atau fenomena yang
dijadikan objek sasaran pengukuran. Dengan memberikan batasan pada
ranah yang dijadikan objek sasaran evaluasi secara operasional ini,
diharapkan dapat menjadi petunjuk yang tepat dan sesuai dalam upaya
melakukan dapat menjadi petunjuk yang tepat dan sesuai dalam upaya
melakukan penjabaran ranah yang dijadikan objek sasaran evaluasi ke
dalam bentuk dimensi, dan atau indikator.
3. Ketiga, menjabarkan kandungan isi ranah, dimensi, fenomena, atau konsep
berdasarkan batasan operasional yang telah disepakati atas objek yang akan
dijadikan sebagai objek sasaran pengukuran sesuai domain, atau ranah
tertentu.
4. Keempat, melakukan kajian terhadap keberadaan cakupan jabaran isi ranah,
dimensi, fenomena, atau konsep, dan relevansi serta representatif isi yang
telah dijabarkan. Hasil kajian terhadap jabaran isi ranah atau dimensi
kedalam isi-isi sampel esensial dapat dijadikan indikator untuk melakukan
penggolongan ke dalam kategori sangat representatif, cukup representasti
dan kurang representatif, dan tidak representatif.
5. Kelima, melakukan penjabaran ranah atau domain isi yang relevan dan
representatif ke dalam bentuk indikator-indikator atau deskriptor-
deskriptor. Perian indikator atau deskriptor yang representatif ini yang
dijadikan sebagai terkait dengan upaya pengembangan instrumen jenis tes.
6. Terakhir, berdasarkan pada kegiatan yang telah ditempuh yaitu mulai
langkah pertama sampai dengan langkah keenam tersebut, lalu diikuti
dengan aktivitas pengembangan indikator atau deskriptor-deskriptor dari
setiap ranah atau dimensi ke dalam butir-butir pernyataan. Pada hasil uji
coba instrumen (melalui uji ahli atau uj empirik) yaitu Intepresentasi
kemungkina pertama, haasil analisis sesuai dengan tuntutan kriteria yang
telah ditetapkan. Misal, pemenuhan persyartan terhadap hasil analisis butir,
taraf kesukaran, tingkat daya beda, konsistensi internal, validitas atau
rehabilitas dapat terpenuhi. Kemungkinan kedua, yaitu terdapat beberapa
hasil analisis data ujicoba yang belum atau bahkan tidak memenuhi kriteria
minimal yang telah ditetapkan. Misal, dalam hal analisi butir terhadap
validitas atau mengkin juga terhadap konsistensi internal banyak yang tidak
memenuhi persyaratan ari kriteria yang telah ditetapkan.
Validitas Konstruk
Indikator tingkat keefektifan intrumen evaluasi, selain dapat ditentukan
dengan terpenuhinya tuntutan persyaratan minimal dari tingkat validitas isi, juga
dpat dilihat dari terpenuhinya tuntutan persyaratan minimal dari tingkat validitas
konstruknya. Representasi suatu konstruk yang dijadikan objek sasaran pengukuran
ini biasanya merupakan konsep dari suatu variabel yang bersifat abstrak (misalnya
variabel persepsi, variabel sikap atau kapabilitas) terhadap suatu fenomena yang
akan dilakukan pengukuran dengan instrumen evaluasi. Dikarenakan sifat dari
suatu konsep abstrak ini, maka agar dapat diukur dan dikuantifikasikan dengan
sistem dan aturan tertentu perlu dilakukan upaya pembatasan lingkup dan
pendefinisian (pemberian batasan) yang secara jelas dan operasional.
Contoh dari suatu konstruk sebagai objek yang dijadikan sasaran
pengukuran dapat diberikan sebagai berikut. Konstruk tentang persepsi individu
atau kelompok individu tertentu terhadap latar atau lingkungan, atau terhadap
peristiwa tertentu yang dijadikan suatu fenomena stimulus dalam interval waktu
tertentu. Keberadaan persepsi individu atau kelompok individu terhadap
lingkungan tertentu sebagai suatu fenomena adalah bersifat abstrak. Begitu juga,
konstruk tentang sikap individu atau kelompok individu terhadap perilaku atasan,
terhadap perilaku supervisor, terhadap perilaku bawahan, atau terhadap perilaku
kolega dalam suatu fenomena lingkungan sistem atau lembaga tertentu dalam
interval waktu tertentu.
Adapun prosedur atau langkah-langkah yang ditempuh dalam melakukan
kegiatan pengembangan dan penilain terhadap tingkat validitas konstruk suatu
instrumen evaluasi dapat ditempuh dengan hal-hal sebagai berikut.
1. Pertama, memberikan batasan (konseptual dan operasional) terhadap semua
bagian dalam suatu konstruk yang dijadikan objek sasaran pengukuran.
2. Kedua, mengidentifikasi, memilih dan pada akhirnya menetapkan inti dari
dimesi-dimensi suatu konstruk yang dijadikan objek sasaran pengukuran
sesuai dengan batasan operasional yang telah ditetapkan.
3. Ketiga, memilih dan pada akhirnya menetapkan isi-isi sampel esensial dari
setiap dimensi dari hasil pemerian dimensi-dimensi suatu konstruuk yang
dijadikan objek sasaran pengukuran.kualitas dari isi-isi sampel esensial
dimensi ini ditunjukkan dengan beberapa indikator tingkat keterwakilan
(representativeness) sampel dimensi terhadap pemerian dimensi suatu
konstruk yang dijadikan objek sasaran pengukuran.
4. Keempat, melakukan penjabarab sampel esensial dimensi suatu konstruk
yang dijadikan objek sasaran pengukuran ke dalam pemerian-pemerian
beberapa deskriptor dari isi sampel esensial suatu dimensi
5. Kelima, melakukan klasifikasi dari buti pertanyaan atau pernyataan sebagai
representasi dari suatu instrumen evaluasi pada setiap dimensi konstruk atau
pada keseluruhan konstruk sesuai dengna faktor-faktor tertentu.
6. Keenam, berdasarkan klasifikasi faktor-faktor yang ada (berupa butir-butir
pertanyaan dan pernyataan) disinergikan atau disintesiskan ke dalam suatu
bentuk faktor yang bersifat umum sebagai representasi bentuk pengukuran
suatu konstruk tertentu.
Validitas Konkuren
Karakteristik keefektifsn intrumen evaluasi salain dapat dilihat dari tingkat
validitas isi dan validitas konstruk juga dapat dilihat dari validitas konkuren.
Apabila pada penilain validitas isi dan validitas konstruk di atas dilakukan melalui
data atau informasi subjektif atau kualitatif yang diperoleh dari pertimbangan ahli
(expert judgement) pada bidang yang relevan. Target sasaran yang dijadikan ,
dipilih yang memenuhi persyaratan dari aspek karakteristik psikologis.
Tingkat validitas konkuren sebagai salah satu indikator karakteristik
keefektifan suatu instrumen evaluasi adalah sebagai suatu representasi kesesuaian
hasil secara kuantitatif antara dua jenis intrumen yang digunakan untuk mengukur
suatu karakteristik objek sasaran pengukuran tertentu (kognitif, psikomotor, atau
afektif) pada interval waktu tertentu yang relatif sama. Kedua jenis instrumen
evaluasi yang dimaksud adlah satu instrumen sebagai hasil aktivitas pengembangan
instrumen (instrumen baru) yang akan dinilai tingkat validitasnya, sedangkan atu
instrumen lain digunakan sebagai instrumen standart (baku) yang dijadikan sebagai
acuan atau kriteria dalam menguji validitas konkuren (instrumen standar).
Upaya melakukan penelitian tingkat validitas konkuren suatu instrumen
evaluasi dapat dilakukan dengan dua cara. Caraa pertama, dengan menggunakan
dua macam intrumen evaluasi untuk melakukan pengukuran satu fenomena, atau
faktor, atau satu variabel yang dilakukan dalam waktu bersamaan (konkuren).
Kedua instrumen dalam cara pengukuran tingkat validitas konkuren ini adalah satu
instrumen diperankan sebgai instrumen baru (yang dikembangkan dan akan diuji
tingkat validitasnya), dan satu instrumen yang lain berperan sebagai instrumen
kriteria.
Validitas Peramal
Karakteristik keefektifan intrumen evaluasi dengan kriteria eksternal selain
dapat dilakukan dengan cara menilai tingkat validitas secara konkuren juga dapat
dilakukan penilaian dengan validitas peramal (predictive validity) (Cronbach, 1994;
dan Nunnally, 1978). Apabila pada penlaian validitas konkuren suatu instrumen
evaluasi lebih didasarkan pada data empirik yang berasal dari target sasaran yang
akan dikenai alat pengukuran dan lebih berorientasi pada jumlah fenomena, faktor,
atau variabel yang dijadikan objek pengukuran. Kriteria dalam penilaian
keefektifan instrumen dengan vaaliditas peramal dapat dipilah menjadi dua, yaitu
kriteria masa lampau (post predictive validity), dan kriteria masa mendatang (pre-
predictive validity). Untuk melakukan penilaian terhadap tingkat keefektifan suatu
instrumen evaluasi melalui validitas peramal berdasarkan pada data empirik yang
dikumpulkan, diolah dan dianalisis dengan teknik statistik dan rumus tertentu
dengan lebih menekankan pada faktor kriteria yang mengacu baik kriteria pada
masa lalu (post predictive validity) maupun pada masa yang akan datang (pre-
predictive validity).
Tingfkat validitas peramal sebagai salah satu indikator karakteristik
keefektifan suatu instrumen evaluasi adalah merupakan representasi kesesuaian
hasil secara kuantitatif yang diramalkan dalam mengukur suatu kerakteristik
fenomena tertentu (kognitif, psikomotor, dan afektif) pada interval waktu tertentu
sebagai acuan kriteria pada masa lalu atau padaa masa mendatang. Validitas
peramal dengan mengacu kriteria pada masa lalu (post predictive validity) dari
instrumen evaluasi yang dimaksud adalah dengan menempatkan fenomena, faktor
atau variabel sekarang sebagi alat uji atau sebagai alat bukti.
Representasi tingkat validitas instrumen evaluasi dan juga sebagai upaya
untuk menungkatkan tingkat validitas instrumen evaluasi, terutama dalam validitas
empirik disarankan oleh Philips (1991) perlu memperhatikan hal-hal berikut.
Pertama, perlu memperhatikan kejelasan yang terkait dengan ranah (domain),
dimensi dari ranah atau domain, indikator atau deskriptor dari sesuatu yang
dijadikan objek suatu pengukuran. Kedua, dengan memperbanyak jumlah butir
pertanyaan atau deskriptor yang mengacu pada keberadaan sampel esensial dari
setiap dimensi dari ranah yang dijadikan objek pengukuran.
Ketiga, pemilihan diksi, redaksi, baik yang terkait substansi, petunjuk
maupun tampilan instrumen evaluasi diupayakan sekecil mungkin sebgai penyebab
terjadinya suatu respon yang potensial bias. Keempat, pengelolaan dalam
melakukan tahapan persiapan, pelaksaan, dan pengadimistrasian waktu melakukan
uji coba instrumen secara objektif dan sistematik. Kalima, mengenali berbagai
kelemahan kaitan antara sikap dan tingkah laku utamanya dari pihak responden dan
pihak aktor pendukungnya dalam pelksanaan uji coba.
6.2 Reliabilitas Instrumen Evaluasi
Suatu instrumen evaluasi dikatakan memiliki karakteristik reliabilitas yang
memenuhi persyaratan minimal (dalam hal ini efektif), apabila digunakan dalam
kegiatan pengukuran terhadap suatu fenomena, suatu faktor, atau suatu variabel
dalam interval waktu pelaksanaan pengukuran atau pada kelompok yang dijadikan
objek sasaran pengukuran yang relatif sama dan atau relatif berbeda, tetapi
menunjukkan hasil pengukuran yang relatif konsisten (ajeg). Instrumen evaluasi
memiliki karakteristik reliabilitas yang baik (memenuhi persyaratan minimal yang
ditetapkan), apabila memiliki tingkat keajegan hasil pengukuran yang relatif sama
pada waktu pengukuran yang berbeda fenomena, faktor, atau variabel yang sama
atau yang berbeda yang memiliki sifat-sifat yang relatif sama.
Ancaman Reablitas Instrumen

Beberapa hal yang potensial dapat berpengaruh negatif pada keberadaan
tingkat rehabbilitas suatu instrumen dapat diperikan sebagai berikut. Pertama,
adanya fenomena terjadinya fluktuasi kesiapan mental dari individu atau kelompok
individu partisipan yang dijadikan sebagai responden ini adalah merupakan
representasi kondisi psikologis (internal individu) yang ada pada saat sebelum, pada
saat selama, dan pada saat setelah memberikan respon terhadap berbagai butir
pertanyaan atau pernyataan yang dijadikan sebagai stimulus dalam proses
pengukuran yang dilakukan.
Kedua, adanya variasi kondisi yang terjadi dalam pelaksanaan pengukuran
dengan suatu instrumen evaluasi tertentu. Variasi kondisi yang terjadi dalam proses
pelaksanaan pengukuran ini lebih merupakan representasi kondisi laatar (yang
bersifat eksternal) yang ada baik sebelum, selama, maupun setelah responden
memberikan respon terhadap berbagai butir instrumen evaluasi yang dijadikan
sebagai stimulus.
Ketiga, adanya perbedaan dalam persepsi dan acuan kegiatan dalam
menginterpresentasikan suatu hasil pengukuran sebagai representasi respon dari
pihak responden terhadap butir-butir instrumen evaluasi sebagai bentuk stimuulus.
Beberapa perbedaan hasil pengukuran adalah bentuk respon alternatif yang
diharapkan (misal terstruktur, semi struktur, atau open endeed), strategi
pengadmisnistrasian dan proses pengolahan hasil pengukuran (sistem koreksi,
peranan respon kunci yang benar, pengidentifikasian, pemilahan, dan pengolahan
data atau informasi pengukuran), penggunaan kriteria dan interpretasi tehadap hasil
pengukuran (acuan yang digunakan apah bersifat relatif, acuan absolut, bersifat
kualitatif atau kuantitatif).
Keempat, adanya pengaruh “random” yang disebabkan oleh tingkat
motivasi partisipan yang berperan sebagai responden dalam pelaksaan pengukuran.
Mengingat dalam pelaksanaan pengukuran dengan jenis intrumen tertentu (jenis tes
atau nontes) yang dikenakan terhadap sekelompok subjek sasaran tertentu, maka
akan menghadapi adanya variasi suasana psikologis (dalam hal ini motivasi) dari
individu atau kelompok subjek yang menjadi sasaran.
Kelima, adanya instrumen yang menyajikan terlalu banyak butir pertanyaan
atau butir pernyataan yang diperankan sebagai stimulus bagi partisipan
sebagairesponden. Jmlah butir pertanyaan atau butir pernyataan dalam instrumen
evaluasi harus dirancang secara proporsional, baik dari sisi representativeness
substansi isi yang dijadikan objek pengukuran, alokasi waktu yang disediakan bagi
partisipan sebagai responden, tujuan dari pelaksanaan pengukuran suatu fenomena,
faktor, atau variabel yang dijadikan sebagai objek pengukuran, maupun jenis data
atau informasi yang diperlukan melalui kegiatan pengukuran
Fenomena Kesalahan dalam Pengukuran

Fenomena terjadinya kesalahan interpreteasi hasil pengukuran sebagai
representasi respon partisipan ini oleh Nunally (1978) dapat dipilah menjadi
kesalahan sampel dan kesalahan sistematik. Kesalahan sampel potensial terjadi
apabila kesalah hasil pengukuran yang disebabkan oleh adanya variasi respon dari
setiap individu atau keloompok responden sebagai akibat dari ketidakjelasan
(adanya multi tafsir) dari keberadaan butir-butir pertanyaan dan butir-butir
pernyataan yang berfungsi sebagai stimulus yang kemungkinan terjadi pada setiap
individu atau kelompok responden. Kesalahan pengukuran yang termasuk dalam
kategori sampel ini akan menghasilkan data yang tidak valid dan realiabel (data
bias), sehingga akan menyebabkan simpulan akhir dari hasil pengukuran yang bias
atau simpulan hasil akhir dari hasil pengukuran yang sesat.
Fenomena terjadinya kesalahan interpretasi hasil pengukruan yang
termasuk kedalam kesalahan sistematik akan terjadi, apabila kesalahan hasil
pengukuran yang disebabkan oleh adanya variasi respon dari setiap individu atau
kelompok responden sebagai akibat penafsiran butir-butir pertanyaan atau butir
pernyataan yang berfungsi sebagai stimulus itu, terjadi pada setiap individu atau
kelompok responden yang bersifat konsisten. Kesalahan pengukuran yang termasuk
dalam kategori kesalahan sistematik, potensial akan menghasilkan data yang atau
informasi yang valid dan realiabel (tidak bias), sehingga tak menyebabkan
simpulan hasil akhir pengukuran yang bias atau tidak akan menghasilkan simpulan
akhir dari hasil pengukuran yang “sesat”.
Kiat Menentukan Reliabilitas Instrumen

Ada empat cara yang dapat ditempuh dalam melakukan penilaian terhadap
tingkat reliabilitas instrumen evaluasi. Berikut diantarnya :
Pertama, penilaian terhadap tingkat realiabilitas instrumen evaluasi dengan cara tes
ulang (test re-test) atau pengukuran ulang. Cara ini dilakukan dengan mengadakan
tes atau pengukuran terhadap kelompok sasaran yang sama, tetapi pada waktu yang
berbeda. Hasil data dari kedua waktu pelaksanaan pengukuran ini dianalisis dengan
teknik dan rumus statistik tertentu untuk menentukan besaran koefisien korelasinya
dari kedua hasil pengukuran tersebut.
Kedua, penilaian terhadap tingkat reliabilitas instrumen evaluasi dengan cara
bentuk berselang. Cara ini dilakukan dengan dikembangkannya dua macam
instrumen yang sama digunakan untuk melakukan pengukuran pada individu atau
kelompok yang dijadikan target sasaran tertentu pada waktu pengukuran yang sama.
Hasil data dari kedua waktu pelaksanaan pengukuran dan instrumen pengukuran ini
diolah dan dianalisis dengan teknik dan rumus statistik korelasi serta mengacu pada
kriteria tertentu untuk menentukan besaran koefisien korelasinya,
Ketiga, penilaian terhadap tingkat reliabilitas instrumen evaluasi dengan cara belah
dua. Cara ini dilakukan dengan melaksanakan tes atau pengukuran terhadap satu
kelompok subjek yang dijadikan responden, dengan satu macam instrumen
evaluasi.
Keempat, penilaian terhadap tingkat eliabilitas instrumen evaluasi dengan cara
korelasi inter-butir. Cara ini ditempuh dengan melakukan tes atau pengukuran
terhadap satu kelompok subjek yang diposisikan sebagai responden, dengan satu
macam instrumen evaluasi. Metode penilaian terhadap reliabilitas suatu instrumen
ini lebih menekankan pada besaran koefisien korelasi antar skor setiap butir
instrumen dengan skor kelompok atau skor keseluruhan butir.
Upaya mempertinggi reliabilitas instrument agar instrumen dapat berjalan dengan
optimal sebagai alat dalam pelaksanaan pengukuran dalam suatu fenomena, faktor
atau variabel juga perlu memperhatikan hal-hal berikut:
Pertama, instrumen evaluasi sebagai alat pengukuran diupayakan mudah
untuk digunakan. Persyaratan ini menuntut adanya unsur kepraktisan pelaksanaan,
baik bagi responden maupun bagi pelaksana yang melakukan proses pengukuran.
Kedua, instrumen evaluasi itu harus sederhana dan jelas. Sederhana dalam
bentuk tampilan serta tuntutan respon bagi responden. Jelas artinya dari petunjuk,
substansi, dan piranti lain tidak menimbulkan multi tafsir bagi reponden
Ketiga, instrumen evaluasi haruslah memiliki nilai ekonomis yang tinggi.
Persyaratan ini menuntut adanya unsur efisiensi dalam pelaksanaannya di lapangan,
baik bagi responden maupun bagi pelaksana pengukuran.
Keempat, instrumen evaluasi harus memenuhi unsur kelengkapan dari sisi
sarana pendukung yang diperlukan, baik dalam pelaksanaan maupun
keadministrasian.
Daftar Rujukan
Mukhadis, A. 2013.Evaluasi program pembelajaranbidangteknologi.Malang
:Media nusa creative.
Pertemuan ke-7: Topik Diskusi Prosedur pelaksanaan evaluasi dan penilaian
pembelajaran (perencanaan pelaporan)
7.1 Batasan Konseptual

Evaluasi adalah suatu kegiatan atau tindakan yang sistematik dalam upaya
menjaring dan menganalisis informasi atau data yang relevan dengan teknik tertentu
untuk membuat keputusan yang terkait dengan tingkat efektifitas, efisiensi, dan
kemenarikan suatu program yang dikembangkan untuk mencapai tujuan
(Mukhadis, 2013). Wujud progam dalam evaluasi berupa progam pembelajaran,
progam pelatihan, progam suatu proyek, progam pendidikan, progam pengentasan
kemiskinan, progam pemberdayaan masyarakat dan sebagainya. Bila dipandang
dari sudut sistem sebagai konteks pengembangan suatu progam, kegiatan evaluasi
dapat dikenakan pada pusat sistem (tidak harus nasional) sampai tingkat lesson
(operasional dari setiap dimensi sistem). Sedangkan dari sisi komponen-komponen
progam yang dijadikan sasaran evaluasi dapat pada lingkup tahapan perencanaan,
tahapan pelaksanaan, tahapan evaluasi, dan tahapan hasil program dengan
seperangkat dimensi dan indikatornya (Mukhadis, 2013).
Penilaian merupakan upaya melakukan konfirmasi antara data atau informasi
yang diperoleh (profil hasil belajar, dalam konteks ini) dan standar atau acuan yang
telah ditetapkan untuk sebagai dasar dalam membuat suatu interpretasi suatu
bentuk justifikasi kualitatif berdasarkan perian profil hasil belajar dan standar
minimal yang telah ditetapkan (Mukhadis, 2013). Permendiknas Nomor 27 Tahun
2007 dan Nomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan ditemukan
pengertian penilaian pendidikan adalah proses pengumpulan dan pengolahan
informasi untuk menentukan pencapaian hasil belajar peserta didik yang dilakukan
secara sistematis dan berkesinambungan sehingga menjadi informasi yang
bermakna. Penilaian merupakan bagian integral dari proses pembelajaran, sehingga
tujuan penilaian harus sejalan dengan tujuan pembelajaran: sebagai upaya untuk
mengumpulkan berbagai informasi dengan berbagai teknik; sebagai bahan
pertimbangan penentuan tingkat keberhasilan proses dan hasil pembelajaran; oleh
karenanya penilaian hendaknya dilakukan dengan perencanaan yang cermat (Majid,
2015).
Pembelajaran ialah membelajarkan siswa menggunakan asas pendidikan
maupun teori belajar merupakan penentu utama keberhasilan pendidikan.
Pembelajaran merupakan proses komunikasi dua arah, mengajar dilakukan oleh
pihak guru sebagai pendidik, sedangkan belajar dilakukan oleh peserta didik atau
murid. Hal ini menunjukkan bahwa proses pembelajaran merupakan proses yang
mendasar dalam aktivitas pendidikan di sekolah. Pembelajaran mempunyai dua
karakteristik yaitu (1) Dalam proses pembelajaran melibatkan proses mental sisa
secara maksimal, bukan hanya menuntut siswa sekedar mendengar, mencatat, akan
tetapi menghendaki aktivitaqs siswa dlam proses berfikir: (2) Dalam pembelajaran
membangun suasana dialogis dan proses tanya jawab terus menerus yang diarahkan
untuk memperbaiki dan meningkatkan kemampuan berfikir siswa, yang pada
gilirannya kemampuan berfikir itu dapat membantu siswa untuk memperoleh
pengetahuan yang mereka konstruksi sendiri (Sagala, 2003).
7.2 Prosedur Pelaksanaan

Keberhasilan suatu kegiatan evaluasi akan dipengaruhi oleh keberhasilan
evaluator dalam melaksanakan prosedur evaluasi. Prosedur yang dimaksud adalah
langkah-langkah pokok yang harus ditempuh pada kegiatan evaluasi. Prosedurnya
terdiri atas: (1) perencanaan evaluasi, yang meliputi analisis kebutuhan,
merumuskan tujuan evaluasi, menyusun kisi-kisi, mengembangkan draf instrumen,
uji coba dan analisis, merevisi dan menyusun instrumen final, (2) pelaksanaan
evaluasi, (3) monitoring pelaksanaan evaluasi, (4) pengolahan data dan analisis, (5)
pelaporan hasil evaluasi, dan (6) pemanfaatan hasil evaluasi (Arifin, 2016). Di
samping itu baik buruknya evaluasi ada di tangan evaluator karena tanggung jawab
dapat ditunjukkan dengan melaksanakan prosedur evaluasi yang baik, dapat
dipertanggungjawabkan dan bermakna bagi semua pihak.
Prosedur dalam pelaksanaan evaluasi dan penilaian pembelajaran akan
diuraikan sebagai berikut:
1. Perencanaan Evaluasi
Dalam melaksanakan suatu kegiatan tentunya harus sesuai dengan apa yang
diencanakan. Hal ini di maksudkan agar hasil yang diperoleh dapat lebih maksimal.
Namun, banyak juga orang melaksanakan suatu kegiatan tanpa perencanaan yang
jelas sehingga hasilnya pun kurang maksimal oleh sebab itu, seorang evaluator
harus dapat membuat perencanaan evaluasi dengan baik. Yang perlu dilakukan
dalam kegiatan evaluasi adalah membuat perencanaan. Perencanaan ini penting
karena akan mempengaruhi langkah-langkah selanjutnya, bahkan mempengaruhi
keefektifan prosedur evaluasi secara menyeluruh. Implikasinya adalah perencanaan
evaluasi harus di rumuskan secara jelas dan spesifik, terurai dan komprehensif
sehingga perencanaan tersebut bermakna dalam menentukan langkah-langkah
selanjutnya.
Langkah-langkah tersebut pada dasarnya merupakan analisis kebutuhan
yaitu bagian integral dari sistem pembelajaran secara keseluruhan. Melalui analisis
kebutuhan, evaluator akan memperoleh kejelasan masalah dalam pembelajaran
sehingga dapat memberikan rekomendasi kepada pembuat atau penentu kebijakan.
Sehubungan hal tersebut, evaluator harus memahami dengan tepat apa, mengapa,
bagaimana, kapan, dimana, dan siapa yang melakukan analisis kebutuhan. Dalam
program pembelajaran, kebutuhan yang dimaksud merupakan suatu kondisi
kesenjangan antara kondisi yang diharapkan dengan kondisi nyata. Kebutuhan
tersebut dapat terjadi pada diri peserta didik dan guru, baik secara perseorangan
maupun kelompok atau juga pada institusi. Posisi pada analisis kebutuhan berada
ditengah-tengah sesudah tujuan dan materi serta sebelum pendekatan dan strategi,
seperti diuraikan dengan tabel dibawah ini:
Untuk apa Mengapa materi Bagaimana

pembelajaran dan apa tersebut penting mengajarkannya?
yang akan diajarkan? untuk diajarakan?
Tujuan dan materi Analisis kebutuhan Pendekatan dan strategi
Tabel. Posisi analisis kebutuhan dalam program pembelajaran (Arifin, 2016)
Pendekatan yang dilakukan setelah pada proses analisis kebutuhan

ada dua jika ditinjau dari perencanaan pembelajaran yaitu (1) Pendekatan
program pembelajaran (Input, proses, output) dan (2) Pendekatan hasil belajar
(domain hasil belajar, proses dan hasil belajar, dan kompetensi) (Arifin,
2016). Hal penting yang harus dipahami evaluator adalah ketika melakukan
analisis kebutuhan dalam pembelajaran hendaknya dimulai dari peserta didik,
kemudian komponen-komponen yang terkait dengannya. Menurut Zainal
Arifin dalam buku Evaluasi Pembelajaran (2016) mengenai perencanaan
evaluasi dan penilaian meliputi:
a. Menentukan tujuan penilaian
Tujuan penilaian ini harus dirumuskan secara jelas dan tegas serta
ditentukan sejak awal, karena menjadi dasar untuk menentukan ,arah,ruang
lingkup materi, jenis/model, dan karakter alat penilaian. Tujuan penilaian
jangan terlalu umum sehingga tidak menuntun guru dalam menyusun soal.
Dalam penilaian hasil belajar, ada empat kemungkinan tujuan penilaian yaitu:
1) Untuk memperbaiki kinerja atau proses pembelajaran (formatif).
2) Untuk menentukan keberhasilan peserta didik (sumatif).
3) Untuk mengidentifikasi kesulitan belajar peserta didik dalam proses
pembelajaran (diagnostik).
4) Untuk menempatkan posisi peserta didik sesuai dengan kemampuannya
(penempatan)
b. Mengidentifikasi kompetensi dan hasil belajar
Kompetensi adalah pengetahuan, keterampilan, sikap,dan nilai-nilai
yang direfleksikan dalam kebiasaan berfikir dan bertindak. Peserta didik di
anggap kompeten apabila dia memiliki pengetahuan, keterampilan, sikap dan
nilai-nilai untuk melakukan sesuatu setelah mengikuti proses pembelajaan.
Dalam kurikulum berbasis kompetensi, semua jenis kompetensi dan hasil
belajar sudah dirumuskan oleh tim pengembang kurikulum, seperti standar
kompetensi,kompetensi dasar, hasil belajar dan indikator. Jadi guru tinggal
mengidentifikasi kompetensi mana yang akan di nilai.
c. Menyusun kisi-kisi
Penyusunan kisi-kisi dimaksudkan agar materi penilaian betul-betul
representatif dan relevan dengan materi pelajaran yang sudah di berikan oleh
guru kepada peserta didik. Jika materi penilaian tidak relevan dengan materi
pelajaran yang telah diberikan,maka akan berakibat hasil penilaian itu kurang
baik. Begitu juga materi penilaian terlalu banyak dibandingkan dengn materi
pelajaran, maka akan berakibat sama. Untuk itu guru harus menyusun kisi-
kisi.
Kisi-kisi adalah format pemetaan soal yang menggambarkan distribusi
item untuk berbagai topik atau pokok bahasan berdasarkan jenjang
kemampuan tertentu. Fungsi kisi-kisi adalah pedoman untuk menulis soal
atau merakit soal menjadi perangkat tes. Sebenarnya format kisi-kisi tidak ada
yang baku, karena itu banyak model format yang dikembangkan para pakar
evaluasi. Format kisi-kisi soal dibagi dua komponen pokok, yaitu komponen
identitas dan komponen matriks.
1) Komponen identitas,
a. Di tulis di bagian atas matriks
b. Meliputi jenis/ jenjang sekolah, jurusan/ program studi, bidang studi/
mata pelajaran, tahun ajaran dan semester, kurikulum acuan, alokasi
waktu, jumlah soal keseluruhan, dan bentuk soal.
2) Komponen matriks.
a. Dibuat dalam bentuk kolom yang sesuai
b. Terdiri dari kompetensi dasar, materi, jumlah soal, jenjang kemampuan,
indikator dan nomor urut soal.
Salah satu unsur penting dalam komponen matriks adalah indikator.
Indikator adalah rumusan pernyataan sebagai ukuran spesifik yang
menunjukkan ketercapaiaan kompetensi dengan menggunakan kata kerja
operasional (KKO). Manfaatnya ialah guru dapat memilih materi, metode dan
sumber belajar yang tepat sesuai dangan kompetensi yang telah di tetapkan.
d. Mengembangkan draft instrument
Mengembangkan draft instumen penilaian merupakan salah satu
langkah penting dalam prosedur penilaian. Instrumen penilaian dapat disusun
dalam bentuk tes maupun non tes. Dalam bentuk tes berarti guru harus
membuat soal. Sedangkan dalam bentuk non tes, guru dapat membuat angket,
pedoman observasi, pedoman wawancara, studi dokumentasi, skala sikap,
penilaian bakat,minat,dsb.
e. Uji coba dan analisis soal
Jika semua soal sudah di susun dengan baik, maka perlu diuji cobakan
terlebih dahulu di lapangan. Tujuannya untuk mengetahui soal-soal mana
yang perlu di ubah, diperbaiki, bahkan dibuang sama sekali, serta soal-soal
mana yang baik untuk dipergunakan selanjutnya. Dalam melaksanakan uji
coba soal, ada beberapa hal yang harus diperhatikan, antara lain:
1) Ruangan tempatnya hendaknya diusahakan seterang mungkin, jika perlu
dibuat papan pengumuman diluar agar orang lain tahu bahwa ada tes
sedang berlangsung.
2) Perlu disusun tata tertib pelaksanaan tes, baik yang berkenaan dengan
peserta didik,guru,pengawas maupun teknis pelaksanaan tes.
3) Para pengawas harus mengotrol pelaksanaan tes dengan ketat, teetapi
tidak menganggu suasana tes.
4) Waktu yang digunakan harus sesuai dengan banyaknya soal yang
diberikan.
5) Peserta didik harus benar-benar patuh dengan semua petunjuk dan
perintah dari penguji.
6) Hasil uji coba hendaknya diolah, dianalisis, dan di administrasikan
dengan baik
f. Revisi dan merakit soal (instumen baru)
Setelah diuji coba dan dianalisis, kemudian di revisi sesuai dengan
proporsi tingkat kesukaran soal dan daya pembeda. Berdasarkan hasil revisi
soal, barulah dilakukan perakitan soal menjadi suatu instrumen yang terpadu.
Untuk itu, semua hal yang dapat mempengaruhi validitas skor tes,seperti
nomor urut soal, pengelompokan bentuk soal, penataan soal, dan sebagainya.
2. Pelaksanaan Evaluasi
Pelaksanaan evaluasi artinya bagaimana cara melaksanakan evaluasi
sesuai dengan perencanaan evaluasi. Dalam perencanaan evaluasi telah di
singgung semua hal yang berkaitan dengan evaluasi. Pelaksanaan evaluasi
sangat bergantung pada jenis evaluasi yang digunakan. Dalam pelaksanaan
tes maupun nontes tersebut akan berbeda satu dangan lainnya, sesuai dengan
tujuan dan fungsinya masing-masing. Dalam pelaksanaan tes lisan , misalnya
guru harus memperhatikan tempat tes diadakan. Tempatnya harus tenang,
enak dipandang dan tidak menyeramkan, sehingga peserta didik tidak takut
dan gugup. Guru harus dapat menciptakan suasana yang kondusif dan
komunikatif, tetapi bukan berarti menciptakan suasana tes lisan menjadi
suasana diskusi, debat atau ngobrol santai. Dan informasi keseluruhan aspek
kepribadian dan prestasi belajar peserta didik yang meliputi :
a. Data pribadi (personal) peserta didik, seperti nama, tempat dan tanggal
lahir, jenis kelamin, golongan darah, alamat dan lain-lain.
b. Data tentang kesehatan peseeta didik, seperti pengihatan, pendengaran,
penyakit yang sering diderita dan kondisi fisik.
c. Data tentang prestasi belajar (achievement) peserta didik di sekolah.
d. Data tentang sikap (attitude) peserta didik, seperti sikap terhadap teman
sebaya, sikap terhadap kegiatan pembelajaran, sikap terhadap guru dan
kepala sekolah, serta sikap terhadap lingkungan sosial.
e. Data tentang bakat (aptitude) peserta didik seperti ada tidaknya bakat di
bidang olah raga, keterampilan mekanis, manajemen kesenian dan
keguruan.
f. Persoalan penyesuaian(adjustment), seperti kegiatan anak dalam
organisasi di sekolah, forum ilmiah, olah raga dan kepanduan.
g. Data tentang minat (interest) peserta didik.
h. Data tentang rencana masa depan perserta didik yang dibantu oleh guru
dan orang tua sesuai dengan kesanggupan anak.
i. Data tentang latar belakang keluarga peserta didik, seperti perkerjaan
orang tua, penghasilan tetap tiap bulan, kondisi lingkungan serta
hubungan peserta didik dengan orang tua dan saudara-saudaranya.
Tujuan untuk melaksanakan evaluasi adalah untuk mengumpulkan data.
Ada beberapa hal yang memungkinkan timbulnya kesalahan-kesalahan dalam
pengumpulan data yaitu sebagai berikut :
a. Kesalahan-kesalahan yang mungkin ditimbulkan karena kurang
sempurnanya instrumen evaluasi.
b. Kesalahan-kesalahan yang mungkin ditimbulkan oleh kurang
sempurnanya prosedur pelaksanaan evaluasi yang dilakukan.
c. Kesalahan yang mungkin ditimbulkannya oleh kurang sempurnanya cara
pencatatan hasil evaluasi.
3. Monitoring Pelaksanaan evaluasi

Langkah ini dilakukan untuk melihat apakah pelaksanaan evaluasi
pembelajaran telah sesuai dengan perancanaan evaluasi yang telah ditetapkan
atau belum. Tujuannya untuk mencegah hal-hal yang negatif dan
meningkatkan efisiensi pelaksanaan evaluasi. Monitoring mempunyai dua
fungsi. Pertama, untuk melihat elevansi pelaksanaan evaluasi dengan
perencanaan evaluasi. Kedua, untuk melihat hal-hal apa yang terjadi selama
pelaksanaan evaluasi. Jika dalam pelaksanaan evaluasi terjadi hal-hal yang
tidak diinginkan, maka evaluator harus mencatat, melaporkan, dan
menganalisis faktor-faktor penyebabnya. Dalam pelaksanaan penilaian hasil
belajar sering terjadi peserta didik menyontek jawaban dari temannya, peserta
didik mendapat bocoran soal, ada juga peserta didik yang tiba-tiba sakit ketika
mengerjakan soal. Dan sebagainya. Di sinilah pentingnya monitoring
pelaksanaan evaluasi.
4. Pengolahan Data
Langkah pengolahan data dilakukan untuk memberikan “makna”
terhadap data yang ada pada kita. Macam-macam jenis pengolahan yang
dapat dilihat bahwa ada beberapa macam jenis pengolahan yang dapat
dilakukan terhadap sekumpulan data. Pengolahan yang kita hadapi sekarang
sebagai seorang evaluator adalah menentukan pengolahan mana sajakah yang
harus kita lakukan terhadap sekumpulan data pada sat tertentu. Fungsi
pengolahan data dalam proses evaluasi yang perlu disadari bahwa untuk
memperoleh gambaran yang lengkap tentang diri seorang yang sedang di
evaluasi adalah langkah pengolahan data.
Ada dua jenis penafsiran data, yaitu:
a. Penafsiran kelompok, adalah penafsiran yang dilakukan untuk
mengetahui karakteristik kelompok berdasarkan data hasil evaluasi,
seperti prestasi kelompok, rata-rata kelompok, sikap kelompok terhadap
guru dan materi pelajaran yang di berikan serta distribusi nilai kelompok.
Tujuan utamanya adalah sebagai persiapan utuk melaksanakan
penafsiran kelompok, untuk mengetahui sikap sikap tertentu pada
kelompok dan untuk mengadakan pertandingan antar kelompok.
b. Penafsiran individual adalah penafsiran yang hanya dilakukan secara
perorangan. Misalnya dalam kegiatan bimbingan dan penyuluhan atau
situasi klinis lainnya. Tujuan utamanya adalah untuk melihat tingkat
kesiapan peserta didik (readiness), pertumbuhan fisik, kemajuan belajar,
dan kesulitan-kesulitan yang di hadapinya.
Berdasarkan penafsiran ini dapat diputuskan bahwa peserta didik mencapai
taraf kesiapan yang memadai atau tidak, ada kemajuan yang berarti atau tidak,
ada kesulitan atau tidak.
5. Pelaporan Hasil Evaluasi

Laporan merupakan bukti sejauh mana tujuan pendidikan yang
diharapkan oleh anggota masyarakat, khususnya orang tua peserta didik dapat
tercapai. Pada akhir penggal waktu proses pembelajaran, antara lain akhir
catur wulan, akhir semester, akhir tahun ajaran, akhir jenjang persekolahan
diperlukan suatu laporan kemajuan peserta didik, yang selanjutnya
merupakan laporan kemajuan sekolah. Laporan ini akan menjadikan sarana
komunikasi dan memberikan bukti sejauh mana tujuan pendidikan yang
diharapkan oleh anggota masyarakat khususnya orang tua peserta didik dapat
tercapai. Laporan terbagi atas:
a. Laporan kemajuan umum
Berbentuk fisik, dapat dilaksanakan melalui berbagai kegiatan seperti
pameran dan pertandingan pameran diisi dengan:
1) Menunjukan karya ilmiah, misalnya : laporan kunjungan tempat, laporan
pekerjaan laboratorium, laporan penemuan baru.
2) Menunjukan karya seni, seni lukis, seni tari, seni drama, seni hasil karya
bengkel.
3) Berbentuk media, laporan dalam bentuk media cetak maupun media
elektronika.
b. Laporan kemajuan khusus
Bersifat pribadi. laporan ditunjukan khusus untuk orang tua peserta didik.
Laporan disampaikan melalui:
1) Pertemuan dengan orangtua peserta didik
2) Dengan adanya pertemuan tatap muka, kedua belah pihak akan membagi
informasi tenteng peserta didik.Sehingga masalah yang dihadapi di
sekolah maupun dirumah bias dicari jalan keluarnya demi keberhasilan
peserta didik.
3) Buku laporan kemajuan atau buku rapor
Dalam buku rapor mencakup hasil kegiatan individu yang menyangkut
penembangan kognitif (proses berpikir), psikomotorik (ketrampilan), dan
afektif (apresiasi, kreatifitas, ketelitian, kerjasama, kecermatan, dan
sebagainya). Selain bentuk laporan dokumen dokumen juga harus di
administrasikan dengan kiat-kiat tertentu yaitu sistem koreksi, pengolahan
hasil, analisis hasil, kriteria yang digunakan dan interpretasi hasil.
6. Penggunaan hasil Evaluasi

Salah satu penggunaan hasil evaluasi adalah laporan. Laporan yang
dimaksudkan untuk memberikan feedback atau umpan balik kepada semua
pihak yang terlibat dalam pembelajaran, baik secara langsung maupun tidak
langsung. Pihak-pihak yang dimaksud, antara lain adalah peserta didik, guru,
kepala sekolah, orang tua atau wali murid, dan pemakai lulusan. Secara umum
terdapat lima penggunaan hasil evaluasi untuk keperluan berikut:
a. Laporan Pertanggungjawaban, dengan asumsi banyak pihak yang
berkepentingan terhadap hasil evaluasi, oleh karena itu laporan ke
berbagai pihak sebagai bentuk akuntabilitas publik.
b. Seleksi, dengan asumsi setiap awal dan akhir tahun terdapat peserta didik
yang masuk sekolah dan menamatkan sekolah pada jenjang pendidikan
tertentu dimana hasil evaluasi dapat digunakan untuk menyeleksi baik
ketika masuk sekolah/jenjang atau jenis pendidikan tertentu, selama
mengikuti program pendidikan, pada saat mau menyelesaikan jenjang
pendidikan, maupun ketika masuk dunia kerja.
c. Promosi, dengan asumsi prestasi yang diperoleh akan diberikan ijazah
atau sertifikat sebagai bukti fisik setelah dilakukan kegiatan evaluasi
dengan kriteria tertentu baik aspek ketercapaian komptensi dasar,
perilaku dan kinerja peserta didik.
d. Diagnosis, dengan asumsi hasil evaluasi menunjukkan ada peserta didik
yang kurang mampu menguasai kompetensi sesuai dengan kriteria yang
yang telah ditetapkan maka perlu dilakukan diagnosis untuk mencari
faktor-faktor penyebab bagi peserta didik yang kurang mampu dalam
menguasai komptensi tertentu sehingga diberikan bimbingan atau
pembelajaran remedial. Bagi yang telah menguasai kompetensi lebih
cepat dari peserta didik yang lain, mereka juga berhak mendapatkan
pelayanan tindak lanjut untuk mengoptimalkan laju perkembangan
mereka.
e. Memprediksi Masa Depan Peserta Didik, tujuannya adalah untuk
mengetahui sikap, bakat, minat dan aspek-aspek kepribadian lainnya dari
peserta didik, serta dalam hal apa peserta didik diangap paling menonjol
sesuai dengan indikator keunggulan, agar dapat dianalisis dan dijadikan
dasar untuk pengembangan peserta didik dalam memilih jenjang
pendidikan atau karier pada masa yang akan datang.
Dalam penggunaan hasil evaluasi semuanya harus transparan yaitu harus
bersifat fair, Evaluasi pembelajaran yang bersifat fair yaitu menagih ranah
yang dipelajari mengenai hal apa saja, memberikan kesempatan yang sama
terhadap semua laporan yang masuk, tagihan akhir yang jelas, bersifat
objektif, memfasilitasi sustainable self-learning.
Daftar Rujukan
Arifin, Zainal. 2016. Evaluasi Pembelajaran. Bandung: Remaja Rosdakarya

Arikunto, Suharsimi. 2012. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi
Aksara
Majid, Abdul. 2015. Penilaian Autentik Proses dan Hasil Belajar. Bandung:
Remaja Rosdakarya
Terminologi,Prosedur Pengembangan Program dan Instrrumen. Malang:
Bayu Media
Purwanto, Ngalim. 2013. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran.
Bandung: Remaja Rosdakarya
Sagala, Syaiful. 2009. Konsep dan Makna Pembelajaran. Bandung: Alfabeta
Pertemuan ke-8: Topik Diskusi Hambatan dalam pelaksanaan dan laporan
hasil evaluasi dan penilaian hambatan
8.1 Hambatan dalam Pelaksanaan Evaluasi
Bila dikaitkan dengan upaya pengembangan dan pelaksanaan suatu program,

tujuan kegiatan pelaksanaan ini lebih mengarah pada upaya pengumpulan data atau
informasi yang terkait dengan tingkat keterlaksanaan dan berfungsinya serta
kendala-kendala dari setiap komponen, beberapa komponen program yang secara
sinergis mengarah pada upaya pencapaian tujuan program sesuai dengan prosedur
opersional baku (POB) yang telah ditetapkan. Representasi keputusan yang diambil
dalam konteks ini adalah pemerian tingkat keterlaksanaan atau fungsi dan/atau
kendala-kendala dari setiap dimensi atau setiap komponen dalam upaya pencapaian
tujuan program yang telah ditetapkan. Misalnya, pemerian tingkat keterlaksanaan
atau fungsi dan kendala-kendala suatu komponen program secara kualitatif dari
dimensi atau aspek kualitas proses dalam pencapaian tujuan program dapat berupa:
pada tingkatan atau kategori keterlaksanaan dan proses yang sangat berkualitas,
pada tingkatan atau kategori keterlaksanaan dan proses yang berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang cukup berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang kurang berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang tidak berkualitas, pada
tingkatan atau kategori keterlaksanaan dan proses yang sangat tidak berkualitas.
Sedangkan pemerian tingkat kendala-kendala dalam keterlaksanaan setiap atau
beberapa komponen sesuai dengan peran dan fungsinya merupakan kebalikan dari
interpretasi yang terkait dengan pemerian kualitas proses keterlaksanaan dalam
upaya mencapai tujuan program yang telah ditetapkan.
Apabila pemerian tingkat keterlaksanaan dari komponen atau beberapa
komponen dalam kategori sangat berkualitas, dapat dikatakan bahwa peran dan
fungsi komponen atau beberapa komponen suatu program tidak ada kendalayang
beraffi terkait dengan upaya pencapaian tujuan program yang telah ditetapkan.
Namun, apabila perian tingkat keterlaksanaan dari komponen atau beberapa
komponen dalam kategori sangat tidak berknalitas, dapat dikatakan bahwa peran
dan fungsi komponen atau beberapa komponen suatu program mengalami banyak
kendala terkait dengan upaya pencapaian tujuan program yang telah ditetapkan.
Analogi dengan pola berpikir ini, juga dapat dilakukan sebagai acuan dalam
menyusun proposisi interpretasi pada komponen atau beberapa komponen program
yang terkait dengan tingkat relevansi, dan tingkat kemenarikan suatu komponen
program. Bertolak dari interpretasi pemerian tingkat keterlaksanaan peran atau
fungsi dan kendala-kendala dari komponen atau beberapa komponen dalam
pelaksanaan program yang mengarah pada pencapaian tujuan yang telah
ditetapkan, maka dapat dilakukan upaya perbaikan, penyempurnaan atau
kegiatan revisi, bahkan mungkin dilakukan modifikasi dari suatu komponen atau
beberapa komponen dalam suatu program yang dijadikan sasaran objek evaluasi.
8.2 Hambatan dalam Pelaporan Evaluasi

Analisis data pada suatu konteks ranah dalam kegiatan pelaporan hasil
evaluasi program dipilih dan ditetapkan berdasarkan pertimbangan cara
pengumpul data, keberadaan interval waktu yang tersedia, jumlah dan
karakteristik sasaran responden, lokasi geografis dan level program, ketersediaan
sarana pendukung, dan konteks ranah program yang dijadikan objek sasaran
evaluasi. Pertama, cara pelaksanaan pengumpulan data, yaitu dapat dilakukan
secara langsung atau secara tidak langsung, secara tertulis, secara lisan, atau
secara campuran (tulis dan lisan), secara tes atau secara nontes. Kedua, interval
waktu pelaksanaan pengumpulan data, yaitu dalam satuan alokasi waktu minggu,
satuan alokasi waktu bulan, satuan alokasi waktu triwulan, satuan alokasi waktu
semester, atau satuan alokasi waktu tahunan. Ketiga, sasaran responden, yaitu
dapat dipilah berdasarkan jumlah dan sifat karakteristik dari sasaran yang
dijadikan responden. Pengelompokan berdasarkan jumlah responden yang
dijadikan sasaran evaluasi meliputi dalam jumlah yang tergolong sangat banyak,
banyak, cukup, atau sedikit. Sedangkan pengelompokan berdasarkan sifat
karakteristik responden yang dijadikan sasaran evaluasi sasaran meliputi
karaktersitik sasaran yang bersifat homogen, heterogen, latar belakang sosial-
budaya, dan usia kronologis.
Keempat, lokasi geografis dan level konteks ranah program. Lokasi
geografis dalam hal ini dapat dikelompokkan menjadi jauh, dekat, tersebar,
terpencar, jauh terpencil dan terpencar, dekat terpencil dan terpencar, tersebar,
terpencil dan terpencar. Sedangakan level tingkat program meliputi kelompok
program tingkat lokal, program tingkat regional, program tingkat nasional, atau
program tingkat internasional. Kelima, ketersediaan sarana pendukung dalam
kegiatan evaluasi dapat dikelompokkan ke dalam kategori memadai, kurang
memadai, tidak memadai. Keenam, konteks ranah program yang dievaluasi
terdiri atas satu lingkup bagian komponen program, beberapa lingkup bagian
komponen program, atau keseluruhan lingkup bagian komponen program.
Terakhir, dari unsur pelaksana evaluasi (evaluator) yang terdiri atas evaluator
secara perorangan, evaluator secara kelompok atau tim kecil, atau evaluator
secara kelompok tim besar.
Alternatif strategi pelaksanaan analisis data atau informasi pada suatu
konteks ranah dalam kegiatan evaluasi program dipilih dan ditetapkan
berdasarkan pertimbangan dari cara yang akan ditempuh, sifat data, sarana
pendukung, alokasi waktu, jenis dan bentuk data, dan sumberdaya tim evaluator.
Pertama, cara yang ditempuh sebagai alternatif dalam melakukan analisis data,
dalam hal ini dapat dilakukan secara manual atau berbatuan program aplikasi
analisis data. Pemilihan alternatif ini tentunya sangat bergantung pada latar
dimana evaluasi itu dilakukan, besar-kecilnya data yang dinalisis, dan
ketersediaan perangkat teknologi dan kesiapan keterampilan sumberdaya
pendukung. Kedua, sifat dari data yang dianalisis yang meliputi unsur besar atau
kecilnya jumlah data, jenis data kuantitatif atau jenis data kualitatif, heterogenitas
sumber data dan ragam atau variasi data. Ketiga, sarana pendukung analisis data
yang meliputi tempat atau ruang, jumlah sarana komputer yang tersedia,
kemampuan dan kecanggihan aplikasi program komputer yang ada, dan
keberadaan listrik sebagai energi dalam pemanfaatan perangkat komputer dan
program aplikasi, dan dukungan tenaga terampil untuk melakukan operasional
perangkat analisis.
Keempat, besaran alokasi waktu yang tersdia untuk melakukan kegiatan
anlisis data yaitu dalam kategori waktu yang tersedia relatif singkat, cukup, dan
banyak waktu yang tersedia. Artinya, alokasi waktu yang tersedia untuk
melakukan analisis tergolong mendesak atau masih longgar bila dikaitkan dengan
pelaksanaan evaluasi program yang terancang. Kelima, jenis dan jumlah data
yang dianalisis. Jenis data yang dianalisis apakah bersifat kuantitatif, kualitatif,
atau campuran kuantitatif dan kualitatif (biasa disebut kuantilatif)? Atau,
bagimana sifat kuantitatif dari data yang dianalisis, dapat dikelompokkan dalam
jumlah besar, dalam jumlah sedang, atau dalam jumlah kecil? Keenam,
sumberdaya evaluator yang tersedia, bila dikaitkan dengan kebutuhan
pelaksanaan analisis data. Apakah jumlah dan kompetensi dari sumberdaya
manusia yang tersedia untuk melakukan strategi analisis data dilakukan dengan
aplikasi program tertentu atau harus dilakukan dengan cara manual. Kesemua
alternatif yang dijadikan pertimbangan dalam melakukan pengumpulan dan
analisis data ini perlu diperhatikan dalam memilih dan menetapkan jenis dan
bentuk serta alternatif penggunaan instrumen dalam pelaksanaan evaluasi.
Daftar Rujukan
Arifin, Zainal. 2016. Evaluasi Pembelajaran, Prinsip, Teknik, dan Prosedur.

Bandung: Remaja Rosdakarya.
Terminologi, Prosedur Pengembangan Program dan Instrumen. Malang: Bayu
Media Publishing.
Wiyono, B. B., Sunarni. 2009. Evaluasi Program Pendidikan dan Pembelajaran.
Malang: Fakultas Ilmu Pendidikan Universitas Negeri Malang.

Kapita Selekta

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Kapita Selekta

Diunggah oleh

Hak Cipta:

Format Tersedia

Pertemuan ke-1 : Topik Diskusi Karakteristik Evaluasi, Penelitian,

Pengembangan, Assesmen Dalam Pembelajaran

1.5 Perbedaan Evaluasi dan Penelitian

1.6 Perbedaan Evaluasi, Penelitian, dan Pengembangan

1.7 Perbedaan Asesmen dan Evaluasi

1.9 Perbedaan Asesmen dan Penilaian

1.10 Perbedaan Penelitian, Evaluasi, Pengembangan, dan Asesmen

2.1 Hubungan Evaluasi, Testing, Pengukuran dalam Evaluasi dan Penilaian

Jika hubungan antara evaluasi, testing, pengukuran, dan penilaian

Batasan Proses Hasil

Sudjana,N. 2009. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT

Sajekti, R. 1988.Tes dan Pengukuran dalam Pendidikan. Jakarta: Departemen

Majid, A. 2015.Penilaian Autentik Proses dan Hasil belajar. Bandung: Remaja

Mukhadis, A. 2017. Evaluasi Program Pembelajaran Bidang Teknologi. Malang:

3.1 Pengertian Evaluasi, Penilaian, dan Pengukuran

PENGGUNAAN PROSES ATURAN PENGGUNAAN

Gambar 2.1. Pelaksanaan Pengukuran Atribut Fenomena

Berdasarkan uraian gambar diatas, maka dapat dikatakan bahwa dalam

Gambar 2.2 Hubungan Evaluasi, Penilaian, dan Pengukuran

3.2 Langkah Evaluasi dan Penilaian Sebagai Bentuk Pengukuran

Isi penting dalam Content Cakupan isi, relevansi,

Isi penting dalam Construct Factorial

Gambar 2.3. Pendekatan Validitas Instrumen

3.3 Objek dan Subjek Evaluasi

3.3.2 Subjek Evaluasi

3.4 Bentuk Evaluasi Dan Penilaian Dalam Kegiatan Pengukuran

Mukhadis, A. 2013. Evaluasi Program Pembelajaran Bidang Teknologi.

4.1 Prinsip-prinsip dari pengukuran dalam evaluasi pembelajaran

Kegiatan pengukuran (measurement) adalah suatu aktivitas untuk

Pengukuran sangat penting keberadaannya bila dikaitkan dengan

4.2 Macam-macam alat pengukuran dalam evaluasi pembelajaran

Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan

1. Untuk menjawab test objektif tidak banyak memakai waktu.

1. Murid sering menerka-nerka dalam memberikan jawaban, karena mereka

 Tes obyektif ini terdiri dariberbagai macam bentuk, antara lain ;

2. Pilihan Berganda atau Multiple Choise ( M- Ch)

3. Isian atau Completion

4. Jawaban Singkat atau Short Answer

5. Menjodohkan atau Matching

• Bentuk-bentuk Tes Subjektif:

4.3 Prosedur pengukuran dalam evaluasi pembelajaran

Tujuan utama kegiatan pengukuran dalam evaluasi pembelajaran adalah

Untuk menentukan ketepatan aspek yang hendak diukur untuk suatu

Arifin, Zaenal. 2010. Evaluasi Pembelajaran. PT Remaja Rosdakarya : Bandung.

Nurkancana, Wayan dan Sumartana, PPN (1986). Evaluasi Pendidikan. Surabaya :

5.1 Langkah-langkah pengembangan alat evaluasi dan penilaian

Sebagai langkah awal dalam kegiatan pengembangan alat evaluasi yaitu

2. Langkah-langkah Pengembangan Instrumen Evaluasi

Jenis Instrumen Evaulasi Non-Tes

Ranah/Domain Objek yang Dievaluasi

Sub-Ranah/Domain Objek Sub-Ranah/Domain Objek

Sampel Isi Sampel Isi Sampel Isi Sampel Isi

Deskripto Deskripto Deskripto Deskripto Deskripto Deskripto

Gambar . Model Pengembangan Instrumen Evaluasi Non-Tes

Langkah-langkah dalam kerangka model pengembangan instrumen evaluasi jenis

2.2.Langkah-langkah pengembangan instrumen bentuk tes

Jenis Instrumen Evaulasi Tes

Kompetensi Objek yang Dievaluasi

Sub-Ranah/Domain Kompetensi Sub-Ranah/Domain Kompetensi

Sampel Isi Sampel Isi Sampel Isi Sampel Isi

Indikator Indikator Indikator Indikator Indikator Indikator

Gambar . Model pengembangan instrumen evaluasi jenis tes.

Langkah-langkah dalam kerangka model pengembangan instrumen evaluasi